JAVA - 随心笔记

一级二级缓存设计

为什么需要多级缓存在互联网系统中，随着业务规模不断增长，数据库往往会成为系统的性能瓶颈。大量请求如果直接访问数据库，不仅会带来高延迟，还会导致数据库压力过大，甚至出现连接耗尽、查询变慢等问题。因此，几乎所有高并发系统都会引入缓存（Cache）来提升系统性能。最常见的缓存方式是使用 Redis 作为统一缓存层。客户端请求首先访问 Redis，如果缓存命中，就直接返回数据；如果缓存未命中，再访问数据库并将结果写入缓存。这种方式已经能够显著降低数据库压力。但随着系统规模继续扩大，仅仅依赖 Redis 仍然可能出现新的问题。例如在高 QPS 场景下，大量请求同时访问 Redis，会产生网络开销和 Redis CPU 压力。同时，某些热点数据可能会被频繁读取，每次都经过网络访问 Redis，也会带来额外延迟。为了解决这些问题，很多大型系统会引入多级缓存架构（Multi-Level Cache），其中最常见的一种模式就是一级缓存 + 二级缓存设计。

微服务架构设计

为什么会出现微服务架构在早期的软件系统中，大多数应用都采用单体架构（Monolithic Architecture）。所有功能模块都运行在同一个应用进程中，例如用户系统、订单系统、支付系统、库存系统等，都被打包在一个工程中统一部署。这种架构在系统规模较小时非常简单直接，开发效率也较高。但随着业务不断增长，单体架构的问题逐渐显现出来。系统代码越来越庞大，一个项目可能包含几十万甚至上百万行代码，任何一次修改都需要重新构建和部署整个系统。同时，不同功能模块之间耦合严重，一个模块出现问题很可能影响整个系统运行。当访问量增长时，系统也无法只对某个热点模块进行扩展，只能整体扩容，资源利用效率很低。在这种背景下，微服务架构逐渐成为大型系统的主流设计方式。微服务的核心思想是将一个庞大的系统拆分为多个独立服务，每个服务负责一个明确的业务能力，并可以独立开发、部署和扩展。这样不仅可以降低系统复杂度，还可以提升系统的可维护性和扩展能力。微服务架构的核心设计思想微服务架构并不仅仅是把系统拆分成很多小服务，更重要的是围绕业务能力（Business Capability）进

PolarDB 存算分离

背景随着互联网业务规模不断扩大，传统关系型数据库架构逐渐暴露出一些瓶颈，例如扩展能力不足、存储成本高、读写压力集中等问题。为了应对这些挑战，云厂商开始设计一种新的数据库架构模式：存算分离（Storage-Compute Decoupling）。 PolarDB 是阿里云推出的一款云原生数据库，其核心设计理念之一就是计算层与存储层解耦。这种架构使数据库具备更强的弹性扩展能力和更高的资源利用率。 () 本文将从架构角度分析 PolarDB 的存算分离设计，并与 AWS Aurora 以及传统 MySQL 架构进行对比。传统 MySQL 架构的问题在传统 MySQL 架构中，数据库通常运行在单个服务器上： MySQL Server ├── CPU ├── Memory └── Local Disk 计算和存储都在同一台机器上。这种架构在早期互联网时代已经足够，但随着业务规模扩大，会出现几个明显问题： 1 存储扩展困难数据库数据通常存储在本地磁盘中，当数据量增长时，只能通过： * 升级磁盘 * 更换更大的机器这种方式扩

ETCD 探索

在分布式系统中，经常会遇到这样的问题： * 服务节点需要共享配置 * 系统需要做服务发现 * 分布式锁需要一个协调中心 * 集群需要一个一致性的状态存储这些问题，本质上都需要一个可靠的分布式协调系统。而在现代云原生体系中，最常用的组件就是 etcd。例如： * Kubernetes * CoreDNS * service mesh * 分布式配置中心这些系统的底层都依赖 etcd。 etcd 是什么简单来说： etcd 就是一个高可靠的分布式 Key-Value 数据库。但它和普通数据库最大的区别是：它是为“分布式协调”而设计的。它的主要特点有： * 强一致（Strong Consistency） * 支持分布式集群 * 提供 Watch 监听机制 * 支持事务 * 提供租约（Lease）机制很多分布式系统都会用 etcd 做： * 服务注册中心 * 配置中心 * 分布式锁 * Leader

Redis分布式锁

很多人在刚接触分布式系统的时候，都会遇到一个问题：多个服务实例同时处理同一件事情，如何避免数据被重复处理？例如： * 用户抢优惠券 * 定时任务执行 * 库存扣减 * 订单状态更新如果系统只有一个进程，其实很简单，用本地锁（mutex）就能解决。但在微服务架构或者集群部署之后，问题就变了。系统可能有： * 10个服务实例 * 100个Worker * 甚至多个数据中心这时候，本地锁就完全失效了，因为不同进程之间根本不知道彼此的锁状态。于是就出现了一个概念：分布式锁（Distributed Lock）分布式锁的目标很简单：在分布式环境下，保证某一时刻只有一个节点能执行某段逻辑。为什么 Redis 可以做分布式锁？在实现分布式锁的时候，很多人第一反应是数据库。例如： select ... for update 但数据库锁的问题是： * 性能差 * 锁粒度大 * 并发高时压力很大于是大家开始寻找一个更适合做锁的系统。 Redis就非常合适。原因很简单：

Netty 深入学习

在分布式系统、微服务架构中，网络通信是最基础也是最重要的一部分。很多高性能框架（如 Dubbo、gRPC、RocketMQ、Elasticsearch 等）底层都依赖 Netty 来完成网络通信。理解 Netty，首先要理解它背后的 NIO 网络模型设计思想。传统网络编程的问题在早期 Java 网络编程中，大多数程序使用的是 BIO（Blocking IO）模型。例如：服务器每接入一个客户端连接，就创建一个线程。一个连接 = 一个线程如果连接很多，比如： 1万连接 = 1万个线程这会带来几个严重问题：线程资源消耗巨大线程本身需要内存和调度成本。线程上下文切换开销大 CPU需要频繁在不同线程之间切换。系统扩展性差连接数量一多，系统就容易崩溃。因此，传统 BIO 并不适合高并发网络服务。 NIO

阿里云实时数仓

前言使用阿里云现有的产品生态体系，可以解决企业自建集群复杂，难维护，部署成本高的问题。基于这些情况我们可以使用目前阿里云已有的产品进行开通，来满足企业业务需求。目前面临痛点 1、底层数据库无法承载海量数据，根据后续企业发展，10T，100T，以及PB，EB数据量无法承载，以及无法支撑快速查询响应，数据分析以及数据挖掘等工作。 2、实时计算性能存在一定不足，需要通过可靠计算引擎进行毫秒级实时计算，并且数据质量可靠，可控，可遥测。 3、数据模型调整效率不够快速，不能够非常灵活的调整数据模型结构，快速的提供业务场景报表需求。应用场景 * 基于Flink和规则引擎的实时风控解决方案 * 基于实时计算（Flink）与高斯模型构建实时异常检测系统 * 基于实时计算（Flink）打造一个简单的实时推荐系统实时数仓总体数据开发流程数据拉取->数据缓冲->实时计算->下沉落库组件选型 Flink 阿里云实时计算 Flink 版阿里云基于Apache Flink构建的企业级、高性能实时大数据处理系统，由Apache Fl

Canal 组件

前言 Canal 是阿里巴巴开源的一款基于 MySQL Binlog 的数据实时订阅与消费组件，常用于实现数据库变更数据捕获（CDC，Change Data Capture）。在实际业务场景中，数据库中的数据变更往往不仅仅用于业务读写，还可能需要同步到其他系统，例如： * 实时数据同步（数据库 → 数据仓库） * 数据变更推送到 MQ（Kafka / RocketMQ） * 构建实时数据分析或监控系统 * 搜索引擎数据同步（如 Elasticsearch）为了实现这些能力，Canal 通过模拟 MySQL Slave 的方式订阅 Binlog 日志，解析出数据库的增删改操作，并将这些变更数据实时推送给下游消费系统，从而实现数据的准实时同步。目前市面上常见的 CDC 组件主要包括： * Canal * Debezium * Flink CDC Canal 目前只支持MySQL数据库。5.x

架构设计原则

在进行系统架构设计时，通常需要从多个维度综合考虑系统能力。一个优秀的系统架构不仅要满足当前业务需求，还需要能够适应未来的业务增长和技术演进。常见需要重点关注的设计原则包括以下几个方面。可扩展性系统设计应该具备良好的可扩展能力，能够支持未来业务增长和需求变化。架构在设计时通常需要采用模块化、分层架构等方式，使系统可以在不影响整体稳定性的情况下方便地增加新功能、扩展数据规模或支持更多用户。可靠性系统设计需要具备较高的可靠性，能够保证系统在长期运行中的稳定性和可用性。架构设计通常需要考虑故障恢复机制、容错机制以及数据备份策略，以确保在系统出现异常时能够快速恢复业务。一个高可靠系统通常需要具备以下能力： * 自动侦测故障 * 自动修复问题 * 自动切换（Failover）通过这些机制可以最大程度减少系统故障对业务造成的影响。极致性能系统架构还需要关注性能设计，确保系统能够快速响应用户请求，并处理大量并发操作。常见的性能优化手段包括： * 合理的数据结构与算法设计 * 缓存机制 * 负载均衡 * 并发控制在实际系统中，性能通常通过 TP

防重复提交

使用Token令牌机制可以有效地防止CSRF攻击和重复提交。在提交表单时，服务器会生成一个Token令牌，并将其存储在Redis中。然后，将这个Token令牌作为表单的一个隐藏字段或URL参数传递给客户端。客户端提交表单时，将这个Token令牌一并提交给服务器。服务器在处理表单时，会检查这个Token令牌是否正确，并在处理完表单后删除这个Token令牌。这种方式可以有效地防止重复提交和CSRF攻击，但是需要注意保护Token令牌的安全性，否则可能会被攻击者利用。 Token令牌机制是一种常用的Web应用程序防止重复提交和CSRF攻击的方法。它的基本思想是在每次提交表单时，服务器会生成一个Token令牌，并将其存储在Redis中。然后，将这个Token令牌作为表单的一个隐藏字段或URL参数传递给客户端。客户端提交表单时，将这个Token令牌一并提交给服务器。服务器在处理表单时，会检查这个Token令牌是否正确，并在处理完表单后删除这个Token令牌。 Token令牌机制的实现步骤如下：在服务器端生成一个Token令牌，并将其存储在Redis中。Token令牌可以使用随机数、UUI

数据结构：栈

栈(Stack)是一种先进后出(LIFO)的数据结构，它只允许在栈顶进行插入和删除操作。栈可以用数组或链表来实现。在栈中，插入和删除操作通常称为入栈(push)和出栈(pop)。当插入一个元素时，它被放置在栈顶，当删除一个元素时，它是从栈顶删除的。栈顶是栈中最新添加的元素，栈底是栈中最早添加的元素。栈的应用非常广泛，例如，计算机中的函数调用和递归调用都是通过栈来实现的。当一个函数被调用时，它的参数、返回地址和局部变量等信息被压入栈中，当函数返回时，这些信息又从栈中弹出。以下是栈的基本操作： push(element)：将一个元素压入栈顶。 pop()：从栈顶弹出一个元素。 top()：返回栈顶元素，但不对栈进行修改。 isEmpty()：判断栈是否为空。 size()：返回栈中元素的个数。栈的时间复杂度为O(1)，因为所有操作都是在栈顶进行的。但是，栈的空间复杂度为O(n)，因为需要存储所有元素。在计算机中，栈(Stack)被广泛应用于函数调用、

Idea 默认快捷键

记录一下Idea默认的快捷键，更方便提高开发效率。

线程池核心线程数-计算方式

线程池的工况一般分为三种场景：计算密集型需要大量的计算，对 CPU 高占用率，CPU Loading 90-100%，除开 CPU需要读/写I/O(硬盘/内存)，但这些 I/O 只需要很短的时间就可以完成，更多的是 CPU 需要进行很多数据运算，数学运算，CPU Loading 很高的场景。例如数据分析，数据流处理，此类程序运行的过程中，CPU占用率一般都很高。假如在单核CPU情况下，线程池有6个线程，但是由于是单核CPU，所以同一时间只能运行一个线程，考虑到线程之间还有上下文切换的时间消耗，还不如单个线程执行高效。所以，单核 CPU 处理计算密集型程序，就不要使用多线程了。假如是6个核心的CPU，设置6个线程数，理论上运行速度可以提升6倍（但实际上达不到，多线程之间有并发以及需要优化的地方）。每个线程都有 CPU 来运行，并不会发生等待

JVM 线程池扩容机制

在 HotSpot VM 的线程模型中，Java 线程与操作系统线程是一对一映射关系（JDK19 之后虽然引入了虚拟线程，但传统线程仍然是这种模型）。也就是说，一个 Java 线程会对应一个操作系统内核线程（KLT / LWP）。当 Java 创建线程时，需要调用操作系统内核 API 创建对应的内核线程，操作系统需要为其分配栈空间、调度信息等资源；当 Java 线程结束时，对应的内核线程也会被回收。因此： * 线程创建和销毁成本较高 * 线程数量不能无限增加当线程数量过多时： 1. 线程创建会带来较高的系统开销 2. CPU 在多个线程之间频繁进行上下文切换（Context Switch） 3. 大量线程可能导致系统性能下降甚至 OOM 因此，在实际开发中通常使用线程池（ThreadPoolExecutor）来统一管理线程生命周期。 ThreadPoolExecutor 核心参数

HTTP 协议发展史

HTTP 是浏览器与服务端之间最主要的通信协议，HTTP 是应用层协议（7层），应用层产生的数据会通过传输层协议作为载体来传输到互联网上的其他主机中，而其中的载体就是 TCP 协议（3.0使用UDP），基于 TCP 协议进行连接，然后传输对应内容信息。 20 世纪 60 年代，美国国防部高等研究计划署（ARPA）建立了 ARPA 网，这被认为是互联网的起源。70 年代，研究人员基于对 ARPA 网的实践和思考，发明出了著名的 TCP/IP 协议。该协议具有良好的分层结构和稳定的性能，并在 80 年代中期进入了 UNIX 系统内核，促使更多的计算机接入了网络。 1989 年，蒂姆伯纳斯-李博士发表了一篇论文，提出了在互联网上构建超链接文档系统的构想。在篇文章中他确立了三项关键技术：URI、HTML、HTTP。基于这三项技术，

布隆过滤器详解

背景介绍布隆过滤器（Bloom Filter）是1970年由布隆提出的，它实际上是由一个很长的二进制向量和一系列随意映射函数组成。布隆过滤器使用场景一般是防止redis缓存穿透，使用布隆过滤器可以更好的节省空间，并且快速定位元素是否存在。布隆过滤器通过 hash key 来定位位图（Bitmap，其实就是bit数组）中对应的下标，并且在这个数组中每一个位置只有0和1两种状态，每个位置只占用1个字节，其中0表示没有元素存在，1表示有元素存在。注意：两个不同的key哈希出来所对应的下标位可能存在部分重复，这样可以减少内存的占用，但也有概率会出现哈希碰撞，原本不存在的key哈希之后位图中都为1的情况。所以通过上面的现象，我们从布隆过滤器的角度可以得出布隆过滤器主要有2大特点： 1、如果布隆过滤器判断一个元素存在，那么这个元素可能存在。 2、如果布隆过滤器判断一个元素不存在，那么这个元素一定不存在。因为布隆过滤器中总是会存在误判率，因为哈希碰撞是不可能百分百避免的。布隆过滤器对这种误判率称之为假阳性概率，即：False Positive Probability，简称为

隐藏性能杀手之 '伪共享'

随着CPU工艺的发展，目前的高端CPU已经存在几十核心百多个线程，并为CPU设计出了一二三级缓存。CPU的核心有了这些缓存就可以加快数据的处理，从而减少访问内存的频率，这样CPU的计算性能可以进一步得到提高。 CPU的缓存结构以及内存硬盘：众所周知CPU去访问一次内存所需要的开销是非常之大的，想要获取一次磁盘上的数据更是需要等待较长的时间，虽然目前已经有很多解决方案如 mmap 技术来缓解这样的情况，但总体来说CPU的计算性能是整个计算机结构中的天花板，其他硬件从数据传输速度层面对比起来就显得拖后腿，那么我们来看一下具体CPU访问每个硬件的延迟：存储器存储介质介质成本（美元）随机访问延迟 L1 cache SRAM 7 1ns L2 cache SRAM 7 4ns Memory DRAM 0.015 100ns Disk SSD(NAND) 0.0004 150us Disk HHD 0.00004 10ms 可以得出外部存储设备容量越大成本越小，存储数据更多，但访问速度更慢，访问速度越快的设备造价更高，

分布式事务之 Seata

前言在企业应用程序开发中，随着分布式框架发展，我们生产环境会有会很多数据库的实例，特别是在微服务领域中，我们会设计每个业务Service模块都会对应一个自身业务模块的DB存储节点。然后再对这个DB存储节点做高可用部署。事务问题那么我们在编写Service中的业务逻辑时，肯定会遇到一个业务操作会远程调用到其他不同的业务模块，那么对应的产生数据就会落盘到不同的存储节点中，为了保障多个数据库实例之间的事物ACID特性，就遇到了分布式事务的问题。分布式事务 1、如果整个业务调用链路均成功，那么整个调用链路对应的数据库做事物提交。 2、如果调用链路中抛出了异常，那么整个调用链路对应的数据库做回滚操作。 Seata 在Seata分布式事务解决方案中，一般有以下这些角色： RM (Resource Manager) 管理分支事务处理的资源，与TC交谈以注册分支事务和报告分支事务的状态，并驱动分支事务提交或回滚。 TC (Transaction Coordinator) - 事务协调者 TM (Transaction Manager) - 事务管理器，AP上

Fiddler 安装并抓取HTTPS请求

众所周知 Fiddler 是一个非常实用的抓包工具（主要是对于Http请求）而且有很多的扩展功能可以去官网下载，我们在开发中，难免需要抓包工具来查看接口数据或者测试接口的安全性, 如未签名而进行值的修改，下面将介绍它的安装以及配置证书来抓取Https加密信息。 Fiddler 官方网址： Fiddler | Web Debugging Proxy and Troubleshooting SolutionsExplore the Fiddler family of web debugging proxy tools and troubleshooting solutions. Easily debug, mock, capture, and modify web and network traffic.Telerik.com [https://www.telerik.com/fiddler]

IDEA 常用插件以及开发工具

1、静态代码质量管理工具部署平台 Code Quality and Code Security | SonarQube [https://www.sonarqube.org/] 2、代码质量检查插件 FindBugs 可以直接以插件安装在IDEA IDE中 FindBugs™ - Find Bugs in Java Programs (sourceforge.net) [https://findbugs.sourceforge.net/] 3、翻译插件（英语不好者必备） Translation 可以在代码开发试图中直接翻译 4、代码编码格式约束插件 CheckStyle-IDEA 通过检查对代码编码格式，命名约定，Javadoc，类设计等方面进行代码规范和风格的检查，从而有效约束开发人员更好地遵循代码编写规范 5、Java Meven 包冲突检测工具 Maven Helper 可以检测整个项目pom.