技术博客

quarkus使用/迁移经验

2026-04-16T02:00:00+00:00

quarkus

introduce and make notes about the issues found during using quarkus

build加速

quarkus.native.builder-image=quay.io/quarkus/ubi9-quarkus-mandrel-builder-image:jdk-21
quarkus.native.container-build=true
quarkus.native.builder-image.pull=missing

在application.properties 中指定image并且不要每次去pullimage 加快编译。

docker build ubi8 vs ubi9

从 quarkus 3.19, 默认使用UBI9 作为native镜像，对 vm里面的cpu有要求，可能会报错：(参考：url)

Fatal glibc error: CPU does not support x86-64-v2

所以，使用ubi8：

# uib9
quarkus.native.builder-image=quay.io/quarkus/ubi9-quarkus-mandrel-builder-image:jdk-21

# ubi8
quarkus.native.builder-image=quay.io/quarkus/ubi-quarkus-mandrel-builder-image:jdk-21

Dockerfile修改：

# ubi9
FROM registry.access.redhat.com/ubi9/ubi9-minimal:9.6

# ubi8
FROM registry.access.redhat.com/ubi8-minimal:8.10

docker 自定义镜像

可以在native基础上加上自己的软件方便调查问题：

FROM registry.access.redhat.com/ubi9/ubi-minimal:9.3

# 设置非交互模式并安装工具
# --releasever=9: 解决某些环境下无法识别版本的问题
# --nodocs: 不安装文档，显著减小体积
# clean all: 清理元数据缓存
RUN microdnf update -y --releasever=9 && \
    microdnf install -y --releasever=9 --nodocs \
        procps-ng \
        net-tools \
        wget \
        vim-minimal && \
    microdnf clean all -y --releasever=9 && \
    rm -rf /var/cache/yum

grpc

常见配置：

quarkus.http.port=8077
quarkus.grpc.server.port=9097
quarkus.grpc.server.host=0.0.0.0
# Reflection (grpc.reflection.v1 / v1alpha) for grpcurl, Postman, etc. Dev mode enables it automatically;
# in prod it is off unless you set GRPC_SERVER_ENABLE_REFLECTION=true (reflection exposes service/schema info).
quarkus.grpc.server.enable-reflection-service=true
quarkus.grpc.server.use-separate-server=true

# Index external JARs so Jandex sees gRPC ImplBase  BindableService; without this,
# prod/native finds zero bindable services and Quarkus skips starting the gRPC server
# (dev mode still wires server support, which hides the issue locally).
quarkus.index-dependency.business-protocol.group-id=cn.sichuancredit.datasource.business
quarkus.index-dependency.business-protocol.artifact-id=business-protocol

# Logging gRPC client (@GrpcClient("logging")) — set LOGGING_GRPC_HOST, LOGGING_GRPC_PORT
quarkus.grpc.clients.logging.host=${LOGGING_GRPC_HOST:192.168.102.224}
quarkus.grpc.clients.logging.port=${LOGGING_GRPC_PORT:6391}
quarkus.grpc.clients.logging.plain-text=true

注意：
（1）如果你实现了某个grpc服务，quarkus-index-dependency 这个需要设置，里面的内容就是你的服务所在的maven group 和 artifcat。 这个只在native模式有影响，不设置的话服务不会正常启动。
（2）打开：quarkus.grpc.server.enable-reflection-service=true 方便的你grpc 客户端可以通过reflection自动获取相关的定义。

移除grpc依赖避免log4j 引入

移除log4j的依赖避免native失败:

问题：

Caused by: com.oracle.graal.pointsto.constraints.UnsupportedFeatureException: Discovered unresolved type during parsing: io.grpc.netty.shaded.io.netty.util.internal.logging.Log4J2Logger. This error is reported at image build time because class io.grpc.netty.shaded.io.netty.util.internal.logging.Log4J2LoggerFactory is registered for linking at image build time by command line and command line. Error encountered while parsing io.grpc.netty.shaded.io.netty.util.internal.logging.InternalLoggerFactory.newDefaultFactory(InternalLoggerFactory.java:42)

解决：

java {
xxxxxx
}

configurations.all {
    exclude group: 'io.grpc', module: 'grpc-netty-shaded'
}

repositories {
yyyyyy
}

db

redis

自定义key：

实现一个这样的CacheKeyGenerator即可：

// 这个是忽略了参数中的第一个参数来组成cachekey：
@RegisterForReflection
public class CacheKeyGeneratorSkipFirstParam implements CacheKeyGenerator {

    public CacheKeyGeneratorSkipFirstParam() {

    }

    @Override
    public Object generate(Method method, Object... methodParams) {
        StringBuilder sb = new StringBuilder();
        sb.append(method.getName()).append('-');
        for (int i = 1; i < methodParams.length; i++) {
            sb.append(methodParams[i]).append('-');
        }
        return sb.toString();
    }
}

注意必须有空的构造函数和注解：@RegisterForReflection 然后就可以：

    /**
     * Cache key matches legacy Spring {@code @Cacheable} (method + idCard + personName semantics via two keys only).
     */
    @CacheResult(cacheName = "zzdtec", keyGenerator = CacheKeyGeneratorSkipFirstParam.class)
    public FetchResult load(AccessLogContext accessLogContext, String idCard, String personName) {
        return httpExecutor.fetch(accessLogContext, idCard, personName);
    }

得到的缓存key就是：cache:zzdtec:load-341224xxxxx-涛yyyy-

配置

# 配置密码相关
quarkus.redis.hosts=${REDIS_HOSTS:redis://192.168.102.221:36379/13}
quarkus.redis.password=${REDIS_PASSWORD:xxxxx}

quarkus.cache.type=redis
# 配置TTL
quarkus.cache.redis.zzdtec.expire-after-write=${REDIS_CACHE_EXPIRE:30d}
# 还需要配置你的缓存的object 不然会失败。 同样的该类需要有相关注解：@RegisterForReflection
quarkus.cache.redis.zzdtec.value-type=cn.sichuancredit.zzdtec.server.api.FetchResult

参考链接

Cursor中的excel & word mcp使用和配置

2026-03-26T02:00:00+00:00

excel mcp

安装excel-mcp

pip install excel-mcp

配置

在.cursor/mcp.json中配置：

{
    "mcpServers": {
  
      "excel-mcp": {
        "command": "python", 
        "args": ["-m", "excel_mcp", "stdio"],
        "env": {
          "EXCEL_FILES_PATH": "D:\\code\\xxx\\quanfeng-end\\analysis\\"
        },
        "transport": "stdio"
      }
    }
  }
  

通过环境变量EXCEL_FILES_PATH配置对应的excel文件路径

word mcp

安装uv

从这里下载： uv windows 然后解压后配置环境变量：

PATH里面加上：D:\softs\uv\
额外添加：
UV_DEFAULT_INDEX=https://pypi.tuna.tsinghua.edu.cn/simple

然后手动安装相关依赖：

D:\softs\uv\uvx.exe --from office-word-mcp-server word_mcp_server

cursor 里面配置

    "word-document-server": {
      "command": "D:\\softs\\uv\\uvx.exe",
      "args": ["--from", "office-word-mcp-server", "word_mcp_server"]
    }

参考链接

cursor项目级mcp配置和excel mcp

2026-03-06T02:00:00+00:00

什么是 DBHub？

DBHub 支持 PostgreSQL、MySQL、SQL Server、MariaDB 和 SQLite 等多种数据库，主要特性包括：

核心 MCP 工具：

execute_sql：执行 SQL 查询，支持事务和安全控制
search_objects：搜索和浏览数据库 schema、表、列、索引和存储过程

一、Docker 部署 DBHub

1. 使用 Docker Run

连接 mysql示例：

docker run -d --restart always --init \
  --name dbhub \
  --publish 7080:7080 \
  bytebase/dbhub \
  --transport http \
  --port 7080 \
  --dsn "mysql://readonly_admin:your_strong_password@192.168.102.207:3307/yourdb"

创建mysql使用的只读用户：

-- 1. 创建用户（替换 your_password）
CREATE USER 'readonly_admin'@'%' IDENTIFIED BY 'your_strong_password';

-- 2. 授予全局 SELECT 权限（所有库、所有表可查）
GRANT SELECT ON *.* TO 'readonly_admin'@'%';

-- 3. 授予元数据查看权限（关键！）
GRANT
    SHOW DATABASES,
        SHOW VIEW,
        PROCESS,          -- 查看当前运行的查询（用于 performance_schema）
        REPLICATION CLIENT -- 查看 binlog 位置（可选）
        ON *.* TO 'readonly_admin'@'%';

-- 4. （可选）允许执行存储过程（但不能修改）
GRANT EXECUTE ON *.* TO 'readonly_admin'@'%';

-- 5. 刷新权限
FLUSH PRIVILEGES;

部署成功后，DBHub 会在 http://localhost:7080 提供：

工作台：http://localhost:7080/
MCP 端点：http://localhost:7080/mcp

二、Cursor 中的 MCP 配置

Cursor 支持两种连接方式：stdio（本地）和 HTTP（远程/共享）。

方式一：HTTP 连接（推荐，配合 Docker）

当 DBHub 以 HTTP 方式运行（如 Docker 部署）时，在 Cursor 中配置：

Windows - 编辑 %USERPROFILE%\.cursor\mcp.json：

macOS/Linux - 编辑 ~/.cursor/mcp.json：

{
  "mcpServers": {
    "dbhub": {
      "url": "http://localhost:7080/mcp"
    }
  }
}

三、验证与使用

保存 mcp.json 后，重启 Cursor 或重新加载窗口
在 Cursor 设置 → Tools & MCP 中确认 DBHub 已加载
在对话中可尝试：
- 「数据库里有哪些 schema？」
- 「public schema 下有哪些表？」
- 「查询薪资最高的 5 名员工」

AI 会通过 DBHub 的 MCP 工具访问数据库并执行查询。

四、参考链接

【翻译】我用 PostgreSQL 替换了 Redis（而且更快）

2026-01-26T08:53:49+00:00

引言

本文很好的介绍了使用pg替换redis，虽然单个操作变慢了，但是结合常用业务的整体操作却变快了，是个路子。

原文

我用 PostgreSQL 替换了 Redis（而且更快）

我有一个典型的 Web 应用技术栈：

PostgreSQL 用于持久化数据
Redis 用于缓存、发布/订阅和后台任务

两个数据库。两套东西要管理。两个故障点。

然后我意识到：PostgreSQL 可以做 Redis 做的所有事情。

我完全移除了 Redis。以下是发生的事情。

设置：我之前用 Redis 做什么

在改变之前，Redis 处理三件事：

1. 缓存（70% 的使用量）

# 缓存 API 响应
redis-cli SET "user:${id}" '{"id":123,"name":"John"}' EX 3600

2. 发布/订阅（20% 的使用量）

# 实时通知
redis-cli PUBLISH notifications '{"userId":123,"message":"Hello"}'

3. 后台任务队列（10% 的使用量）

# 使用 Bull/BullMQ（这里展示 Redis CLI 的基础操作）
redis-cli LPUSH queue:send-email '{"to":"user@example.com","subject":"Hi"}'

痛点：

两个数据库要备份
Redis 使用内存（大规模时很昂贵）
Redis 持久化…很复杂
Postgres 和 Redis 之间的网络跳转

为什么我考虑替换 Redis

原因 #1：成本

我的 Redis 设置：

AWS ElastiCache：$45/月（2GB）
增长到 5GB 将花费 $110/月

PostgreSQL：

已经为 RDS 付费：$50/月（20GB 存储）
增加 5GB 数据：$0.50/月

潜在节省： 约 $100/月

原因 #2：运维复杂性

使用 Redis：

Postgres 备份 ✅
Redis 备份 ❓（RDB？AOF？两者都要？）
Postgres 监控 ✅
Redis 监控 ❓
Postgres 故障转移 ✅
Redis Sentinel/Cluster ❓

不使用 Redis：

Postgres 备份 ✅
Postgres 监控 ✅
Postgres 故障转移 ✅

少一个移动部件。

原因 #3：数据一致性

经典问题：

# 更新数据库
psql -c "UPDATE users SET name = 'John' WHERE id = 123;"

# 使缓存失效
redis-cli DEL "user:123"

# ⚠️ 如果 Redis 宕机了怎么办？
# ⚠️ 如果这个操作失败了怎么办？
# 现在缓存和数据库不同步了

使用 Postgres 处理一切：事务解决了这个问题。

PostgreSQL 功能 #1：使用 UNLOGGED 表进行缓存

Redis：

redis-cli SET "session:abc123" '{"userId":123,"role":"admin"}' EX 3600

PostgreSQL：

CREATE UNLOGGED TABLE cache (
  key TEXT PRIMARY KEY,
  value JSONB NOT NULL,
  expires_at TIMESTAMPTZ NOT NULL
);

CREATE INDEX idx_cache_expires ON cache(expires_at);

插入：

INSERT INTO cache (key, value, expires_at)
VALUES ('user:123', '{"id":123,"name":"John"}'::jsonb, NOW() + INTERVAL '1 hour')
ON CONFLICT (key) DO UPDATE
  SET value = EXCLUDED.value,
      expires_at = EXCLUDED.expires_at;

读取：

SELECT value FROM cache
WHERE key = 'user:123' AND expires_at > NOW();

清理（定期运行）：

DELETE FROM cache WHERE expires_at < NOW();

什么是 UNLOGGED？

UNLOGGED 表：

跳过预写日志（WAL）
写入速度更快
崩溃后不保留（非常适合缓存！）

性能：

Redis SET: 0.05ms
Postgres UNLOGGED INSERT: 0.08ms

对于缓存来说足够接近。

PostgreSQL 功能 #2：使用 LISTEN/NOTIFY 进行发布/订阅

这里变得有趣了。

PostgreSQL 有原生发布/订阅功能，大多数开发者都不知道。

Redis 发布/订阅

# 发布者
redis-cli PUBLISH notifications '{"userId":123,"msg":"Hello"}'

# 订阅者（在另一个终端）
redis-cli SUBSCRIBE notifications

PostgreSQL 发布/订阅

-- 发布者
NOTIFY notifications, '{"userId": 123, "msg": "Hello"}';

// 订阅者（Java with PostgreSQL JDBC）
import org.postgresql.PGConnection;
import org.postgresql.PGNotification;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.Statement;
import java.util.Properties;
import com.fasterxml.jackson.databind.ObjectMapper;

// 建立连接
String url = System.getenv("DATABASE_URL");
Properties props = new Properties();
Connection conn = DriverManager.getConnection(url, props);
Statement stmt = conn.createStatement();
stmt.execute("LISTEN notifications");
stmt.close();

// 获取 PGConnection 以接收通知
PGConnection pgConn = conn.unwrap(PGConnection.class);
org.postgresql.PGNotification[] notifications = pgConn.getNotifications();

// 在单独的线程中监听通知
new Thread(() -> {
    while (true) {
        try {
            PGNotification[] notifications = pgConn.getNotifications();
            if (notifications != null) {
                for (PGNotification notification : notifications) {
                    String payload = notification.getParameter();
                    ObjectMapper mapper = new ObjectMapper();
                    Map data = mapper.readValue(payload, Map.class);
                    System.out.println(data);
                }
            }
            Thread.sleep(500);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}).start();

性能比较：

Redis pub/sub 延迟：1-2ms
Postgres NOTIFY 延迟：2-5ms

稍慢一些，但是：

无需额外基础设施
可以在事务中使用
可以与查询结合使用

真实世界示例：实时日志流

在我的日志管理应用中，我需要实时日志流。

使用 Redis：

# 当新日志到达时
psql -c "INSERT INTO logs ..."
redis-cli PUBLISH logs:new '{"id":123,"message":"..."}'

# 前端监听
redis-cli SUBSCRIBE logs:new

问题： 两个操作。如果发布失败怎么办？

使用 PostgreSQL：

CREATE FUNCTION notify_new_log() RETURNS TRIGGER AS $$
BEGIN
  PERFORM pg_notify('logs_new', row_to_json(NEW)::text);
  RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER log_inserted
AFTER INSERT ON logs
FOR EACH ROW EXECUTE FUNCTION notify_new_log();

现在是原子性的。插入和通知一起发生，或者都不发生。

// 前端（通过 SSE）- Spring Boot 示例
import org.springframework.http.MediaType;
import org.springframework.web.servlet.mvc.method.annotation.SseEmitter;
import org.postgresql.PGConnection;
import org.postgresql.PGNotification;
import java.sql.Connection;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

@GetMapping(value = "/logs/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public SseEmitter streamLogs() {
    SseEmitter emitter = new SseEmitter(Long.MAX_VALUE);
    ExecutorService executor = Executors.newSingleThreadExecutor();
    
    executor.execute(() -> {
        try {
            Connection conn = dataSource.getConnection();
            Statement stmt = conn.createStatement();
            stmt.execute("LISTEN logs_new");
            stmt.close();
            
            PGConnection pgConn = conn.unwrap(PGConnection.class);
            
            while (true) {
                PGNotification[] notifications = pgConn.getNotifications();
                if (notifications != null) {
                    for (PGNotification notification : notifications) {
                        String payload = notification.getParameter();
                        emitter.send(SseEmitter.event()
                            .data("data: " + payload + "\n\n"));
                    }
                }
                Thread.sleep(100);
            }
        } catch (Exception e) {
            emitter.completeWithError(e);
        }
    });
    
    return emitter;
}

结果： 零 Redis 的实时日志流。

PostgreSQL 功能 #3：使用 SKIP LOCKED 的任务队列

Redis（使用 Bull/BullMQ）：

# 入队
redis-cli LPUSH queue:send-email '{"to":"user@example.com","subject":"Hi"}'

# 出队（使用阻塞操作）
redis-cli BRPOP queue:send-email 5

PostgreSQL：

CREATE TABLE jobs (
  id BIGSERIAL PRIMARY KEY,
  queue TEXT NOT NULL,
  payload JSONB NOT NULL,
  attempts INT DEFAULT 0,
  max_attempts INT DEFAULT 3,
  scheduled_at TIMESTAMPTZ DEFAULT NOW(),
  created_at TIMESTAMPTZ DEFAULT NOW()
);

CREATE INDEX idx_jobs_queue ON jobs(queue, scheduled_at) 
WHERE attempts < max_attempts;

入队：

INSERT INTO jobs (queue, payload)
VALUES ('send-email', '{"to": "user@example.com", "subject": "Hi"}'::jsonb);

工作进程（出队）：

WITH next_job AS (
  SELECT id FROM jobs
  WHERE queue = 'send-email'
    AND attempts < max_attempts
    AND scheduled_at <= NOW()
  ORDER BY scheduled_at
  LIMIT 1
  FOR UPDATE SKIP LOCKED
)
UPDATE jobs
SET attempts = attempts + 1
FROM next_job
WHERE jobs.id = next_job.id
RETURNING *;

魔法：FOR UPDATE SKIP LOCKED

这使得 PostgreSQL 成为一个无锁队列：

多个工作进程可以并发拉取任务
没有任务被处理两次
如果工作进程崩溃，任务会再次变为可用

性能：

Redis BRPOP: 0.1ms
Postgres SKIP LOCKED: 0.3ms

对于大多数工作负载来说差异可忽略。
【译注】：下面的例子可能更简单：

BEGIN;

-- 取出 1 个 pending 状态的任务，加锁并跳过已锁定的
UPDATE tasks 
SET status = 'processing'
WHERE id = (
    SELECT id 
    FROM tasks 
    WHERE status = 'pending'
    ORDER BY id
    LIMIT 1  --- 可以LIMIT 10来达到批量拉取的效果
    FOR UPDATE SKIP LOCKED  -- 👈 核心在这里
)
RETURNING *;

COMMIT;

--- 需要考虑对僵尸任务的释放
-- 任务处理超时 5 分钟，自动释放
UPDATE tasks 
SET status = 'pending'
WHERE status = 'processing'
AND updated_at < NOW() - INTERVAL '5 minutes';

PostgreSQL 功能 #4：速率限制

Redis（经典速率限制器）：

# 检查并增加计数
redis-cli INCR "ratelimit:${userId}"
redis-cli EXPIRE "ratelimit:${userId}" 60

# 检查是否超过限制
redis-cli GET "ratelimit:${userId}"

PostgreSQL：

CREATE TABLE rate_limits (
  user_id INT PRIMARY KEY,
  request_count INT DEFAULT 0,
  window_start TIMESTAMPTZ DEFAULT NOW()
);

-- 检查并增加
WITH current AS (
  SELECT 
    request_count,
    CASE 
      WHEN window_start < NOW() - INTERVAL '1 minute'
      THEN 1  -- 重置计数器
      ELSE request_count + 1
    END AS new_count
  FROM rate_limits
  WHERE user_id = 123
  FOR UPDATE
)
UPDATE rate_limits
SET 
  request_count = (SELECT new_count FROM current),
  window_start = CASE
    WHEN window_start < NOW() - INTERVAL '1 minute'
    THEN NOW()
    ELSE window_start
  END
WHERE user_id = 123
RETURNING request_count;

或者使用窗口函数更简单：

CREATE TABLE api_requests (
  user_id INT NOT NULL,
  created_at TIMESTAMPTZ DEFAULT NOW()
);

-- 检查速率限制
SELECT COUNT(*) FROM api_requests
WHERE user_id = 123
  AND created_at > NOW() - INTERVAL '1 minute';

-- 如果在限制内，插入
INSERT INTO api_requests (user_id) VALUES (123);

-- 定期清理旧请求
DELETE FROM api_requests WHERE created_at < NOW() - INTERVAL '5 minutes';

Postgres 更好的时候：

需要基于复杂逻辑进行速率限制（不仅仅是计数）
希望速率限制数据与业务逻辑在同一事务中

Redis 更好的时候：

需要亚毫秒级速率限制
极高的吞吐量（每秒数百万请求）

PostgreSQL 功能 #5：使用 JSONB 的会话

Redis：

redis-cli SET "session:${sessionId}" '{"userId":123,"role":"admin"}' EX 86400

PostgreSQL：

CREATE TABLE sessions (
  id TEXT PRIMARY KEY,
  data JSONB NOT NULL,
  expires_at TIMESTAMPTZ NOT NULL
);

CREATE INDEX idx_sessions_expires ON sessions(expires_at);

-- 插入/更新
INSERT INTO sessions (id, data, expires_at)
VALUES ('abc123', '{"userId":123,"role":"admin"}'::jsonb, NOW() + INTERVAL '24 hours')
ON CONFLICT (id) DO UPDATE
  SET data = EXCLUDED.data,
      expires_at = EXCLUDED.expires_at;

-- 读取
SELECT data FROM sessions
WHERE id = 'abc123' AND expires_at > NOW();

奖励：JSONB 操作符

你可以查询会话内部：

-- 查找特定用户的所有会话
SELECT * FROM sessions
WHERE data->>'userId' = '123';

-- 查找具有特定角色的会话
SELECT * FROM sessions
WHERE data->'user'->>'role' = 'admin';

使用 Redis 无法做到这一点！

真实世界基准测试

我在生产数据集上运行了基准测试：

测试设置

硬件： AWS RDS db.t3.medium（2 vCPU，4GB RAM）
数据集： 100 万缓存条目，1 万会话
工具： pgbench（自定义脚本）

结果

操作	Redis	PostgreSQL	差异
缓存 SET	0.05ms	0.08ms	+60% 更慢
缓存 GET	0.04ms	0.06ms	+50% 更慢
发布/订阅	1.2ms	3.1ms	+158% 更慢
队列推送	0.08ms	0.15ms	+87% 更慢
队列弹出	0.12ms	0.31ms	+158% 更慢

PostgreSQL 更慢…但是：

所有操作仍然在 1ms 以下
消除了到 Redis 的网络跳转
减少了基础设施复杂性

组合操作（真正的优势）

场景： 插入数据 + 使缓存失效 + 通知订阅者

使用 Redis：

psql -c "INSERT INTO posts ..."                    # 2ms
redis-cli DEL "posts:latest"                        # 1ms（网络跳转）
redis-cli PUBLISH posts:new '{"id":123}'            # 1ms（网络跳转）
# 总计：~4ms

使用 PostgreSQL：

BEGIN;
INSERT INTO posts ...;                              -- 2ms
DELETE FROM cache WHERE key = 'posts:latest';      -- 0.1ms（同一连接）
NOTIFY posts_new, '...';                            -- 0.1ms（同一连接）
COMMIT;
-- 总计：~2.2ms

当操作组合时，PostgreSQL 更快。

何时保留 Redis

如果以下情况，不要替换 Redis：

1. 你需要极致性能

Redis: 100,000+ 操作/秒（单实例）
Postgres: 10,000-50,000 操作/秒

如果你每秒进行数百万次缓存读取，保留 Redis。

2. 你使用 Redis 特定的数据结构

Redis 有：

有序集合（排行榜）
HyperLogLog（唯一计数估计）
地理空间索引
流（高级发布/订阅）

Postgres 等价物存在但更笨拙：

-- Postgres 中的排行榜（更慢）
SELECT user_id, score
FROM leaderboard
ORDER BY score DESC
LIMIT 10;

-- vs Redis
redis-cli ZREVRANGE leaderboard 0 9 WITHSCORES

3. 你有独立的缓存层要求

如果你的架构要求独立的缓存层（例如微服务），保留 Redis。

迁移策略

不要一夜之间移除 Redis。 以下是我的做法：

阶段 1：并行运行（第 1 周）

// 写入两者
jedis.set(key, value);
jdbcTemplate.update("INSERT INTO cache ...", key, value);

// 从 Redis 读取（仍然是主要的）
String data = jedis.get(key);

监控： 比较命中率、延迟。

阶段 2：从 Postgres 读取（第 2 周）

// 先尝试 Postgres
String data = jdbcTemplate.queryForObject(
    "SELECT value FROM cache WHERE key = ? AND expires_at > NOW()",
    String.class, key);

// 回退到 Redis
if (data == null || data.isEmpty()) {
    data = jedis.get(key);
}

监控： 错误率、性能。

阶段 3：只写入 Postgres（第 3 周）

// 只写入 Postgres
jdbcTemplate.update("INSERT INTO cache (key, value, expires_at) VALUES (?, ?, ?)",
    key, value, LocalDateTime.now().plusHours(1));

监控： 一切仍然正常工作？

阶段 4：移除 Redis（第 4 周）

# 关闭 Redis
# 观察错误
# 没有破坏？成功！

代码示例：完整实现

缓存模块（PostgreSQL）

// PostgresCache.java
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;
import java.time.LocalDateTime;
import java.util.Map;

@Component
public class PostgresCache {
    private final JdbcTemplate jdbcTemplate;
    
    public PostgresCache(JdbcTemplate jdbcTemplate) {
        this.jdbcTemplate = jdbcTemplate;
    }
    
    public String get(String key) {
        return jdbcTemplate.queryForObject(
            "SELECT value FROM cache WHERE key = ? AND expires_at > NOW()",
            String.class, key);
    }
    
    public void set(String key, String value, int ttlSeconds) {
        jdbcTemplate.update(
            "INSERT INTO cache (key, value, expires_at) " +
            "VALUES (?, ?::jsonb, NOW() + INTERVAL ? || ' seconds') " +
            "ON CONFLICT (key) DO UPDATE " +
            "SET value = EXCLUDED.value, expires_at = EXCLUDED.expires_at",
            key, value, ttlSeconds);
    }
    
    public void set(String key, String value) {
        set(key, value, 3600);
    }
    
    public void delete(String key) {
        jdbcTemplate.update("DELETE FROM cache WHERE key = ?", key);
    }
    
    public void cleanup() {
        jdbcTemplate.update("DELETE FROM cache WHERE expires_at < NOW()");
    }
}

发布/订阅模块

// PostgresPubSub.java
import org.postgresql.PGConnection;
import org.postgresql.PGNotification;
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;
import com.fasterxml.jackson.databind.ObjectMapper;
import java.sql.Connection;
import java.sql.Statement;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.function.Consumer;

@Component
public class PostgresPubSub {
    private final JdbcTemplate jdbcTemplate;
    private final ObjectMapper objectMapper;
    private final Map listeners = new ConcurrentHashMap<>();
    private final ExecutorService executor = Executors.newCachedThreadPool();
    
    public PostgresPubSub(JdbcTemplate jdbcTemplate) {
        this.jdbcTemplate = jdbcTemplate;
        this.objectMapper = new ObjectMapper();
    }
    
    public void publish(String channel, Object message) throws Exception {
        String payload = objectMapper.writeValueAsString(message);
        jdbcTemplate.update("SELECT pg_notify(?, ?)", channel, payload);
    }
    
    public void subscribe(String channel, Consumer> callback) {
        executor.execute(() -> {
            try {
                Connection conn = jdbcTemplate.getDataSource().getConnection();
                Statement stmt = conn.createStatement();
                stmt.execute("LISTEN " + channel);
                stmt.close();
                
                listeners.put(channel, conn);
                
                PGConnection pgConn = conn.unwrap(PGConnection.class);
                while (listeners.containsKey(channel)) {
                    PGNotification[] notifications = pgConn.getNotifications();
                    if (notifications != null) {
                        for (PGNotification notification : notifications) {
                            if (notification.getName().equals(channel)) {
                                Map data = objectMapper.readValue(
                                    notification.getParameter(), Map.class);
                                callback.accept(data);
                            }
                        }
                    }
                    Thread.sleep(100);
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        });
    }
    
    public void unsubscribe(String channel) {
        Connection conn = listeners.remove(channel);
        if (conn != null) {
            try {
                Statement stmt = conn.createStatement();
                stmt.execute("UNLISTEN " + channel);
                stmt.close();
                conn.close();
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
}

任务队列模块

// PostgresQueue.java
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.jdbc.core.RowMapper;
import org.springframework.stereotype.Component;
import com.fasterxml.jackson.databind.ObjectMapper;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.time.LocalDateTime;
import java.util.Map;

@Component
public class PostgresQueue {
    private final JdbcTemplate jdbcTemplate;
    private final ObjectMapper objectMapper;
    
    public PostgresQueue(JdbcTemplate jdbcTemplate) {
        this.jdbcTemplate = jdbcTemplate;
        this.objectMapper = new ObjectMapper();
    }
    
    public void enqueue(String queue, Map payload, LocalDateTime scheduledAt) {
        try {
            String payloadJson = objectMapper.writeValueAsString(payload);
            jdbcTemplate.update(
                "INSERT INTO jobs (queue, payload, scheduled_at) VALUES (?, ?::jsonb, ?)",
                queue, payloadJson, scheduledAt);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }
    
    public void enqueue(String queue, Map payload) {
        enqueue(queue, payload, LocalDateTime.now());
    }
    
    public Job dequeue(String queue) {
        String sql = "WITH next_job AS (" +
            "  SELECT id FROM jobs " +
            "  WHERE queue = ? " +
            "    AND attempts < max_attempts " +
            "    AND scheduled_at <= NOW() " +
            "  ORDER BY scheduled_at " +
            "  LIMIT 1 " +
            "  FOR UPDATE SKIP LOCKED " +
            ") " +
            "UPDATE jobs " +
            "SET attempts = attempts + 1 " +
            "FROM next_job " +
            "WHERE jobs.id = next_job.id " +
            "RETURNING jobs.*";
        
        return jdbcTemplate.queryForObject(sql, new JobRowMapper(), queue);
    }
    
    public void complete(Long jobId) {
        jdbcTemplate.update("DELETE FROM jobs WHERE id = ?", jobId);
    }
    
    public void fail(Long jobId, Exception error) {
        try {
            String errorJson = objectMapper.writeValueAsString(Map.of("error", error.getMessage()));
            jdbcTemplate.update(
                "UPDATE jobs " +
                "SET attempts = max_attempts, " +
                "    payload = payload || ?::jsonb " +
                "WHERE id = ?",
                errorJson, jobId);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }
    
    private static class JobRowMapper implements RowMapper {
        @Override
        public Job mapRow(ResultSet rs, int rowNum) throws SQLException {
            Job job = new Job();
            job.setId(rs.getLong("id"));
            job.setQueue(rs.getString("queue"));
            job.setPayload(rs.getString("payload"));
            job.setAttempts(rs.getInt("attempts"));
            job.setMaxAttempts(rs.getInt("max_attempts"));
            job.setScheduledAt(rs.getTimestamp("scheduled_at").toLocalDateTime());
            job.setCreatedAt(rs.getTimestamp("created_at").toLocalDateTime());
            return job;
        }
    }
    
    public static class Job {
        private Long id;
        private String queue;
        private String payload;
        private Integer attempts;
        private Integer maxAttempts;
        private LocalDateTime scheduledAt;
        private LocalDateTime createdAt;
        
        // Getters and Setters
        public Long getId() { return id; }
        public void setId(Long id) { this.id = id; }
        public String getQueue() { return queue; }
        public void setQueue(String queue) { this.queue = queue; }
        public String getPayload() { return payload; }
        public void setPayload(String payload) { this.payload = payload; }
        public Integer getAttempts() { return attempts; }
        public void setAttempts(Integer attempts) { this.attempts = attempts; }
        public Integer getMaxAttempts() { return maxAttempts; }
        public void setMaxAttempts(Integer maxAttempts) { this.maxAttempts = maxAttempts; }
        public LocalDateTime getScheduledAt() { return scheduledAt; }
        public void setScheduledAt(LocalDateTime scheduledAt) { this.scheduledAt = scheduledAt; }
        public LocalDateTime getCreatedAt() { return createdAt; }
        public void setCreatedAt(LocalDateTime createdAt) { this.createdAt = createdAt; }
    }
}

性能调优技巧

1. 使用连接池

// Spring Boot 配置（application.yml）
spring:
  datasource:
    url: jdbc:postgresql://localhost:5432/mydb
    username: user
    password: password
    hikari:
      maximum-pool-size: 20  # 最大连接数
      minimum-idle: 5        # 最小空闲连接数
      connection-timeout: 2000  # 连接超时（毫秒）
      idle-timeout: 30000    # 空闲超时（毫秒）
      max-lifetime: 1800000  # 连接最大生命周期（毫秒）

// 或者使用 Java 配置
@Configuration
public class DataSourceConfig {
    @Bean
    public DataSource dataSource() {
        HikariConfig config = new HikariConfig();
        config.setJdbcUrl("jdbc:postgresql://localhost:5432/mydb");
        config.setUsername("user");
        config.setPassword("password");
        config.setMaximumPoolSize(20);
        config.setMinimumIdle(5);
        config.setConnectionTimeout(2000);
        config.setIdleTimeout(30000);
        return new HikariDataSource(config);
    }
}

2. 添加适当的索引

CREATE INDEX CONCURRENTLY idx_cache_key ON cache(key) WHERE expires_at > NOW();
CREATE INDEX CONCURRENTLY idx_jobs_pending ON jobs(queue, scheduled_at) 
  WHERE attempts < max_attempts;

3. 调整 PostgreSQL 配置

# postgresql.conf
shared_buffers = 2GB           # RAM 的 25%
effective_cache_size = 6GB     # RAM 的 75%
work_mem = 50MB                # 用于复杂查询
maintenance_work_mem = 512MB   # 用于 VACUUM

4. 定期维护

-- 每天运行
VACUUM ANALYZE cache;
VACUUM ANALYZE jobs;

-- 或启用 autovacuum（推荐）
ALTER TABLE cache SET (autovacuum_vacuum_scale_factor = 0.1);

结果：3 个月后

我节省了什么：

✅ $100/月（不再需要 ElastiCache）
✅ 备份复杂性减少 50%
✅ 少一个服务要监控
✅ 更简单的部署（少一个依赖）

我失去了什么：

❌ 缓存操作约 0.5ms 延迟
❌ Redis 的异域数据结构（我不需要它们）

我会再做一次吗？ 是的，对于这个用例。

我会普遍推荐吗？ 不会。

决策矩阵

用 Postgres 替换 Redis，如果：

✅ 你使用 Redis 进行简单缓存/会话
✅ 缓存命中率 < 95%（大量写入）
✅ 你想要事务一致性
✅ 你可以接受 0.1-1ms 更慢的操作
✅ 你是一个小团队，运维资源有限

保留 Redis，如果：

❌ 你需要 100k+ 操作/秒
❌ 你使用 Redis 数据结构（有序集合等）
❌ 你有专门的运维团队
❌ 亚毫秒延迟至关重要
❌ 你正在进行地理复制

资源

PostgreSQL 功能：

工具：

pgBouncer - 连接池
pg_stat_statements - 查询性能

替代解决方案：

Graphile Worker - 基于 Postgres 的任务队列
pg-boss - 另一个 Postgres 队列

TL;DR

我用 PostgreSQL 替换了 Redis，用于：

缓存 → UNLOGGED 表
发布/订阅 → LISTEN/NOTIFY
任务队列 → SKIP LOCKED
会话 → JSONB 表

结果：

节省 $100/月
减少运维复杂性
稍慢（0.1-1ms）但可接受
保证事务一致性

何时这样做：

小型到中型应用
简单的缓存需求
想要减少移动部件

何时不这样做：

高性能要求（100k+ 操作/秒）
使用 Redis 特定功能
有专门的运维团队

你用 Postgres 替换了 Redis（或反之）吗？ 你的经验是什么？在评论中分享你的基准测试！👇

P.S. - 想要后续的”PostgreSQL 隐藏功能”或”何时 Redis 实际上更好”吗？告诉我！

《高性能mysql》读书笔记

2026-01-20T07:27:01+00:00

文章目录

第三章监控
- 关于存储过程的监控：
第七章高性能索引
第10章备份与恢复

第三章监控

关于存储过程的监控：

示例存储过程：

DELIMITER $$

CREATE PROCEDURE SimpleSelectOne()
BEGIN
    SELECT 1 AS result;
    END$$

DELIMITER ;

只能看到某个存储过程中执行的sql查询，但是看不到是哪个存储过程：

select * from performance_schema.events_statements_history where EVENT_NAME like 'statement/sp%' \G;

查看存储过程：

SELECT 
    EVENT_ID AS call_event_id,
    OBJECT_SCHEMA AS proc_schema,
    OBJECT_NAME AS proc_name,
    SQL_TEXT
FROM performance_schema.events_statements_history
WHERE SQL_TEXT LIKE 'CALL%';

注意这里call_event_id和上面的nesting_event_id 可以串联/结合起来查看。

第七章高性能索引

关于前缀索引和基数

1、选择性=基数/总记录数，基数（表列不同值的个数）越接近表总数选择性越高，索引越快。
2、可以通过列前缀索引在索引大小和查询速度上进行折中。选择有一定区分度的列前缀即可。

select count(distinct left(city, 3)) /  count(*) as sel3,
count(distinct left(city, 4)) /  count(*) as sel4,
count(distinct left(city, 5)) /  count(*) as sel5
from city

观察不同长度的前缀的选择性，选择合适的。建索引。

alter table city add key (city(7))

explain的输出

type:

ref：用了索引或者索引的前缀部分列
all 全表扫描
index 全索引扫描

Extra:

Using where：额外过滤
Using index：用了覆盖索引，要查询的列都在索引里面
Using filesort
Use temporary

对于where的实现：

性能从高到底：

在索引中使用where条件过滤记录【存储层完成】
覆盖索引中（Extra列显示using index），读取索引记录后在服务器端中过滤【服务器层完成】
从表中返回记录（Extra列显示using where），在服务器层过滤。最慢的.

索引不被使用的情况：

1、索引未被使用：

检查 name 条件是否使用了函数或类型转换，如 WHERE LOWER(name) = 'xxx' 或 WHERE name = 123（当 name 是字符串类型时）
检查是否使用了 !=、NOT IN 等无法使用索引的操作符

2、索引选择性太低：

如果 name 的值非常集中（如90%的行都有相同的 name 值），优化器可能认为全表扫描比索引扫描更高效

3、统计信息不准确：

MySQL 的优化器依赖统计信息做决策，如果统计信息过时，可能导致错误选择执行计划

4、索引字段类型不一致，比如一个是int 但是查询时候用的string

5、查询覆盖了太多数据：

如果满足 name = xxx 条件的行数超过表的约30%，优化器可能选择全表扫描

第10章备份与恢复

常见和推荐的工具：

基于物理文件的备份和恢复：xtrackbackup
基于逻辑的备份和恢复：mydumper

在生产环境中，安全、可靠、可验证的备份恢复方案是数据库运维的生命线。mydumper（逻辑备份）和 xtrabackup（物理备份）是 MySQL 生态中最主流的两种工具，各有适用场景：

mydumper：适合中小库、跨版本迁移、部分表恢复
xtrabackup：适合大库、秒级恢复、PITR（时间点恢复）

下面分别给出 生产级安全备份与恢复示例，包含权限控制、加密、校验、监控等关键要素。

🔒 一、`mydumper` —— 安全逻辑备份（适用于 ≤ 500GB 库）

✅ 备份策略

每日全量 + 增量 binlog
压缩 + 加密
保留 7 天
专用备份账号（最小权限）

🛠 1. 创建备份专用账号（主库执行）

-- 最小权限原则
CREATE USER 'backup'@'%' IDENTIFIED BY 'StrongPass!2026';
GRANT SELECT, RELOAD, SHOW DATABASES, LOCK TABLES, PROCESS ON *.* TO 'backup'@'%';
FLUSH PRIVILEGES;

⚠️ 禁止授予 SUPER 权限！

📦 2. 安全备份脚本（`/opt/scripts/mydumper_backup.sh`）

#!/bin/bash
# 安全 mydumper 备份脚本 - 生产环境

set -euo pipefail

BACKUP_DIR="/backup/mysql/mydumper"
DATE=$(date +%Y%m%d_%H%M)
LOG_FILE="/var/log/mydumper_backup.log"
MYSQL_HOST="127.0.0.1"
MYSQL_USER="backup"
MYSQL_PASS="StrongPass!2026"
ENCRYPTION_KEY="/etc/mysql/backup.key"  # AES-256 密钥文件

# 创建目录
mkdir -p ${BACKUP_DIR}/${DATE}

# 记录开始时间
echo "[$(date)] Starting mydumper backup..." >> $LOG_FILE

# 执行备份（压缩 + 加密 + 并行）
mydumper \
  --host=${MYSQL_HOST} \
  --user=${MYSQL_USER} \
  --password=${MYSQL_PASS} \
  --outputdir=${BACKUP_DIR}/${DATE} \
  --compress=gzip \          # 压缩节省空间
  --encrypt=AES256 \         # 加密备份文件
  --encrypt-key-file=${ENCRYPTION_KEY} \
  --threads=8 \              # 根据 CPU 调整
  --trx-consistency-only \   # 仅保证事务一致性（不锁表）
  --verbose=3 \
  >> $LOG_FILE 2>&1

# 验证备份完整性（检查 metadata 文件）
if [ ! -f "${BACKUP_DIR}/${DATE}/metadata" ]; then
  echo "[$(date)] ERROR: Backup failed - metadata missing!" >> $LOG_FILE
  exit 1
fi

# 清理 7 天前备份
find ${BACKUP_DIR} -maxdepth 1 -type d -mtime +7 -exec rm -rf {} \;

echo "[$(date)] Backup completed successfully." >> $LOG_FILE

🔑 加密密钥管理：

# 生成 256 位 AES 密钥（仅 root 可读）
openssl rand -base64 32 > /etc/mysql/backup.key
chmod 600 /etc/mysql/backup.key
chown root:root /etc/mysql/backup.key

🔁 3. 安全恢复示例（到新实例）

# 解密并恢复
myloader \
  --host=127.0.0.1 \
  --user=restore_user \
  --password='RestorePass!2026' \
  --directory=/backup/mysql/mydumper/20260122_1400 \
  --decrypt=AES256 \
  --decrypt-key-file=/etc/mysql/backup.key \
  --threads=8 \
  --overwrite-tables \
  --verbose=3

✅ 恢复前必做：

在隔离环境测试恢复

检查 SHOW TABLES; 和 SELECT COUNT(*) 验证数据量

不要直接恢复到生产主库！

🔒 二、`xtrabackup` —— 安全物理备份（适用于 ≥ 100GB 库）

✅ 备份策略

每周日全量 + 每日增量
流式压缩 + 加密
保留 4 周
支持 PITR（基于 binlog）

🛠 1. 创建备份账号（主库执行）

CREATE USER 'xtrabackup'@'localhost' IDENTIFIED BY 'XbkPass!2026';
GRANT RELOAD, PROCESS, LOCK TABLES, REPLICATION CLIENT, SHOW DATABASES ON *.* TO 'xtrabackup'@'localhost';
FLUSH PRIVILEGES;

📦 2. 安全全量备份脚本（`/opt/scripts/xtrabackup_full.sh`）

#!/bin/bash
# xtrabackup 全量备份 - 生产安全版

set -euo pipefail

BACKUP_BASE="/backup/mysql/xtrabackup"
DATE=$(date +%Y%m%d)
FULL_BACKUP_DIR="${BACKUP_BASE}/full_${DATE}"
LOG_FILE="/var/log/xtrabackup_full.log"
ENCRYPTION_KEY="/etc/mysql/xbk.key"

mkdir -p $FULL_BACKUP_DIR

# 流式备份到 xbstream + 压缩 + 加密
xtrabackup \
  --user=xtrabackup \
  --password=XbkPass!2026 \
  --backup \
  --target-dir=$FULL_BACKUP_DIR \
  --stream=xbstream \
  --compress=zstd \          # zstd 比 gzip 更快
  --compress-threads=4 \
  --encrypt=AES256 \
  --encrypt-key-file=$ENCRYPTION_KEY \
  --encrypt-threads=4 \
  | ssh backup-server "cat > ${FULL_BACKUP_DIR}/full.xbstream.zst.enc"

# 记录 binlog 位置（用于 PITR）
ssh backup-server "xtrabackup --decrypt=AES256 --encrypt-key-file=$ENCRYPTION_KEY --target-dir=$FULL_BACKUP_DIR && xtrabackup --decompress --target-dir=$FULL_BACKUP_DIR && xtrabackup --prepare --target-dir=$FULL_BACKUP_DIR"

echo "Full backup completed: $DATE" >> $LOG_FILE

💡 为什么用 --stream？
避免本地磁盘写满，直接流到备份服务器。

➕ 3. 增量备份脚本（每日）

# 基于上周日全量做增量
xtrabackup \
  --user=xtrabackup \
  --password=XbkPass!2026 \
  --backup \
  --target-dir=/tmp/inc_$(date +%Y%m%d) \
  --incremental-basedir=/backup/mysql/xtrabackup/full_20260119 \
  --stream=xbstream \
  --compress=zstd \
  --encrypt=AES256 \
  --encrypt-key-file=/etc/mysql/xbk.key \
  | ssh backup-server "cat > /backup/mysql/xtrabackup/inc_$(date +%Y%m%d).xbstream.zst.enc"

🔁 4. 安全恢复流程（到新服务器）

步骤 1：传输并解密全量

scp backup-server:/backup/mysql/xtrabackup/full_20260119.xbstream.zst.enc /restore/
xtrabackup --decrypt=AES256 --encrypt-key-file=/etc/mysql/xbk.key --target-dir=/restore/full
xtrabackup --decompress --target-dir=/restore/full

步骤 2：应用增量（如有）

xtrabackup --decrypt=... --decompress=... --target-dir=/restore/inc_20260120
xtrabackup --prepare --apply-log-only --target-dir=/restore/full
xtrabackup --prepare --target-dir=/restore/full --incremental-dir=/restore/inc_20260120

步骤 3：最终 prepare + 启动

xtrabackup --prepare --target-dir=/restore/full
rsync -avrP /restore/full/ /var/lib/mysql/
chown -R mysql:mysql /var/lib/mysql
systemctl start mysqld

步骤 4：PITR（如果需要）

-- 查看备份的 binlog 位置
cat /restore/full/xtrabackup_binlog_info

-- 用 mysqlbinlog 恢复到指定时间点
mysqlbinlog --start-position=12345 --stop-datetime="2026-01-22 14:00:00" binlog.000001 | mysql -u root -p

🛡 三、生产环境安全加固清单

项目	mydumper	xtrabackup
最小权限账号	✅	✅
传输加密	SSH / TLS	SSH / TLS
存储加密	AES256	AES256
完整性校验	`metadata` 文件	`xtrabackup_checkpoints`
恢复演练	每月一次	每季度一次
监控告警	备份大小突降、失败日志	同左 + prepare 失败
保留策略	7天全量	4周（全量+增量）

📊 四、如何选择？

场景	推荐工具
库 500GB，要求 RTO < 30min	✅ xtrabackup
需恢复单表	✅ mydumper（`.sql` 文件可编辑）
需 PITR（时间点恢复）	✅ xtrabackup + binlog
云环境（RDS）	❌ 两者均不可用 → 用云厂商快照

✅ 总结

mydumper：逻辑备份，灵活但慢，适合中小库
xtrabackup：物理备份，极速恢复，适合大库
共同原则：
🔐 加密（传输+存储）
👮 最小权限
✅ 定期恢复演练
📉 监控备份大小/耗时异常

💡 终极建议：
同时使用两者——

xtrabackup 做主力（快速恢复）

mydumper 做辅助（单表恢复、跨环境迁移）

mysql federatedengine 使用

2026-01-19T08:53:27+00:00

abstract

在：记录某大型风控系统调研中踩坑提到了采用了mysql的federated engine来实现贴源层相关数据的导入。最近就发现了 mysql时不时因为oom kill被杀掉了，在16g的内存机器上使用15G左右：

sudo dmesg -T | grep -i "killed process"

-- query time
show status

-- MySQL 运行状态与内存概览
SELECT 
  -- Uptime
  CONCAT(
    FLOOR(VARIABLE_VALUE / 86400), 'd ',
    FLOOR((VARIABLE_VALUE % 86400) / 3600), 'h ',
    FLOOR((VARIABLE_VALUE % 3600) / 60), 'm'
  ) AS uptime,
  
  -- 内存配置
  FORMAT(@@innodb_buffer_pool_size / 1024 / 1024, 2) AS ibp_mb,
  FORMAT(@@key_buffer_size / 1024 / 1024, 2) AS key_buffer_mb,
  
  -- 连接数
  @@max_connections AS max_conn,
  VARIABLE_VALUE AS current_conn,
  
  -- 估算峰值内存 (MB)
  FORMAT((
    @@innodb_buffer_pool_size + 
    @@key_buffer_size + 
    (@@sort_buffer_size + @@read_buffer_size + @@join_buffer_size) * @@max_connections
  ) / 1024 / 1024, 2) AS est_peak_memory_mb

FROM information_schema.GLOBAL_STATUS 
WHERE VARIABLE_NAME IN ('Uptime', 'Threads_connected')
LIMIT 1;

调查过程

查看日志

查看日志发现是在执行存储过程当中会失败，然后查看存储过程会生成类似的sql代码：

INSERT INTO t_dp_i_import_collection_plan(xxx)   --- 隐藏了
SELECT xxx   --- 隐藏了
FROM import_collection_plan as t
where report_date = '2025-01-31'

查看表大小：【估算】

SELECT
    TABLE_NAME AS `Table`,
    ENGINE AS `Engine`,
    ROUND((DATA_LENGTH + INDEX_LENGTH) / 1024 / 1024, 2) AS `Size_MB`,
    ROUND(DATA_LENGTH / 1024 / 1024, 2) AS `Data_MB`,
    ROUND(INDEX_LENGTH / 1024 / 1024, 2) AS `Index_MB`,
    TABLE_ROWS AS `Est_Row_Count`
FROM
    information_schema.TABLES
WHERE
    TABLE_SCHEMA = 'xxx'  -- 👈 替换为你的数据库名
ORDER BY TABLE_ROWS DESC

然后发现：import_collection_plan 大概800w行，定义使用了federatedengine怀疑是这个导致的。

mysql的联邦表

mysql官方文档

有一段关键的描述：

A FEDERATED table does not support indexes in the usual sense; because access to the table data is handled remotely, it is actually the remote table that makes use of indexes. This means that, for a query that cannot use any indexes and so requires a full table scan, the server fetches all rows from the remote table and filters them locally. This occurs regardless of any WHERE or LIMIT used with this SELECT statement; these clauses are applied locally to the returned rows.
Queries that fail to use indexes can thus cause poor performance and network overload. In addition, since returned rows must be stored in memory, such a query can also lead to the local server swapping, or even hanging.

可以看到他并不会进行索引或者条件的下推。这个对于大表是非常危险的，而且会占用很大的内存进行本地的排序过滤。

我的测试

我自行在mac和win组成的局域网进行了测试，mac上存原始数据，数据500W，在win上创建的mysql服务器上创建联邦表:

CREATE TABLE `import_collection_plan` (
                                          `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
                                          `process_time` char(19) COLLATE utf8_bin DEFAULT NULL COMMENT '程序执行时间',
                                          `serial_no` varchar(32) COLLATE utf8_bin DEFAULT NULL COMMENT '序号',
                                          `enterprise_name` varchar(50) COLLATE utf8_bin DEFAULT NULL COMMENT '填表企业',
                                          `project_no` varchar(100) COLLATE utf8_bin DEFAULT NULL COMMENT '项目编号',
                                          `receipt_no` varchar(50) COLLATE utf8_bin DEFAULT NULL COMMENT '借据编号',
                                          `repayment_period_no` varchar(32) COLLATE utf8_bin DEFAULT NULL COMMENT '还款期次',
                                          `plan_repayment_date` char(10) COLLATE utf8_bin DEFAULT NULL COMMENT '计划还款日期',
                                          `plan_repayment_principal_amt` decimal(18,2) DEFAULT NULL COMMENT '计划还款本金',
                                          `plan_repayment_interest_amt` decimal(18,2) DEFAULT NULL COMMENT '计划还款利息',
                                          `plan_repayment_other_amt` decimal(18,2) DEFAULT NULL COMMENT '计划还款其他金额',
                                          `repayment_status_name` varchar(50) COLLATE utf8_bin DEFAULT NULL COMMENT '还款状态',
                                          `last_recover_date` char(10) COLLATE utf8_bin DEFAULT NULL COMMENT '最后回收时间',
                                          `last_recover_name` varchar(50) COLLATE utf8_bin DEFAULT NULL COMMENT '最后回收人',
                                          `report_date` char(10) COLLATE utf8_bin DEFAULT NULL COMMENT '报送时间',
                                          PRIMARY KEY (`id`),
                                          KEY `enterprise_name` (`enterprise_name`,`report_date`,`process_time`)
) ENGINE=FEDERATED DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='导入收款计划表' CONNECTION='mysql://root:root@192.168.110.164:3106/xxx/import_collection_plan';

后测试sql:

create table d select * from import_collection_plan
where report_date = '2023-02-21';

在mac端，该表在report_date上有索引。 mac上执行上面语句约：0.6秒完成。
win上执行10分钟，且mysql内存从150M涨到1.6G，网络跑满：

查询验证

打开源端的genral log:

set global general_log = ON

-- 输出到文件（默认）
SET GLOBAL log_output = 'FILE';

-- 或输出到 mysql.general_log 表（方便 SQL 查询）
SET GLOBAL log_output = 'TABLE';

在本地执行查询：

INSERT INTO d select * from import_collection_plan
where report_date = '2023-02-18';

在源端查看general log: 可以看到where条件并没有被下推：

怎么解决

方案1 源端服务器创建视图

-- 在 192.168.110.164 上执行
CREATE TABLE import_collection_plan_20230221 AS
SELECT * FROM import_collection_plan 
WHERE report_date = '2023-02-21';

如果该时间有变（我们场景，需要考虑周期性cron创建）

方案2 应用层同步

应用层查询数据后同步而不依赖federated engine.

方案3 CDC捕获关注表同步到本地后查询

总结

本文对mysql federated engine 做了很多测试和研究，结论如下：
1，对生成发给源端的sql取决于：本地表定义。
2，对发给源端的sql在源端执行时，取决于源端自身的优化器和执行器。
3，建议2个表有同样的索引来激活where下推和索引下推。如果源表没有索引，源表会全表扫描。如果本地表没有索引，发送给源表的就是一个不带where语句的查询，然后在本地进行过滤，会导致全表数据的网络发送和本地内存的大量使用。
4, 注意在源表无索引，但是本地表有索引的情况，可能出现 read超时，因为对端全表扫描还没准备好数据。（但是：如果两边都没有索引的情况反而不会超时。因为一直有数据发送。这个情况比较有意思。）

虎嗅24小时屏蔽机器人评论的油猴脚本

2026-01-15T02:19:16+00:00

自用：

// ==UserScript==
// @name         虎嗅评论过滤 - 屏蔽评论数超过100页的用户
// @namespace    http://tampermonkey.net/
// @version      1.0.1
// @description  自动检测并屏蔽评论数超过100页的用户评论
// @author       You
// @match        https://www.huxiu.com/moment/*
// @exclude      https://www.huxiu.com/member/*
// @grant        GM_xmlhttpRequest
// @connect      api-web-account.huxiu.com
// ==/UserScript==

(function() {
    'use strict';

    // 配置
    const MAX_PAGES = 100; // 最大允许的评论页数
    const API_URL = 'https://api-web-account.huxiu.com/web/comment/commentList';
    const CHECK_INTERVAL = 2000; // 检查新评论的间隔（毫秒）

    // 存储正在检查中的用户ID，避免重复请求
    const pendingChecks = new Set();

    /**
     * 从评论元素中提取用户ID
     */
    function extractUserId(commentElement) {
        // 尝试多种方式提取用户ID
        // 方式1: 从虎嗅会员链接中提取（最常见，格式：/member/2374684.html）
        const userLinks = commentElement.querySelectorAll('a[href*="/member/"]');
        for (const link of userLinks) {
            const href = link.getAttribute('href');
            // 匹配 /member/123456.html 或 /member/123456 格式
            let match = href.match(/\/member\/(\d+)(?:\.html)?/);
            if (match) return match[1];
        }

        // 方式2: 从其他用户链接格式中提取
        const otherLinks = commentElement.querySelectorAll('a[href*="/user/"], a[href*="uid="]');
        for (const link of otherLinks) {
            const href = link.getAttribute('href');
            // 匹配 /user/123456 格式
            let match = href.match(/\/user\/(\d+)/);
            if (match) return match[1];
            // 匹配 ?uid=123456 格式
            match = href.match(/[?&]uid=(\d+)/);
            if (match) return match[1];
        }

        // 方式2: 从data属性中提取
        let element = commentElement;
        for (let i = 0; i < 10 && element; i++) {
            const dataUid = element.getAttribute('data-uid') || 
                           element.getAttribute('data-user-id') ||
                           element.getAttribute('uid');
            if (dataUid && /^\d+$/.test(dataUid)) {
                return dataUid;
            }
            element = element.parentElement;
        }

        // 方式3: 从class或id中提取
        element = commentElement;
        for (let i = 0; i < 5 && element; i++) {
            const uidMatch = element.className?.match(/uid[_-]?(\d+)|user[_-]?(\d+)/i) ||
                            element.id?.match(/uid[_-]?(\d+)|user[_-]?(\d+)/i);
            if (uidMatch) {
                return uidMatch[1] || uidMatch[2];
            }
            element = element.parentElement;
        }

        // 方式4: 从图片src或其他属性中提取
        const img = commentElement.querySelector('img[src*="user"], img[src*="avatar"]');
        if (img) {
            const src = img.getAttribute('src');
            const match = src?.match(/user[\/_-]?(\d+)/i);
            if (match) return match[1];
        }

        // 调试：输出元素信息
        console.warn('无法提取用户ID，元素信息:', {
            className: commentElement.className,
            id: commentElement.id,
            innerHTML: commentElement.innerHTML.substring(0, 200)
        });

        return null;
    }

    /**
     * 获取用户评论总数
     */
    function getUserCommentPages(uid) {
        return new Promise((resolve, reject) => {
            // 如果正在检查中，等待
            if (pendingChecks.has(uid)) {
                setTimeout(() => {
                    getUserCommentPages(uid).then(resolve).catch(reject);
                }, 500);
                return;
            }

            pendingChecks.add(uid);

            GM_xmlhttpRequest({
                method: 'POST',
                url: API_URL,
                headers: {
                    'Content-Type': 'application/x-www-form-urlencoded',
                    'Accept': 'application/json',
                    'Referer': 'https://www.huxiu.com/',
                    'Origin': 'https://www.huxiu.com'
                },
                data: `platform=www&page=1&uid=${uid}`,
                onload: function(response) {
                    pendingChecks.delete(uid);
                    try {
                        const data = JSON.parse(response.responseText);
                        
                        // 调试：输出API响应结构
                        console.log(`[API] 用户 ${uid} 的API响应:`, JSON.stringify(data, null, 2));
                        
                        // 尝试多种可能的响应格式
                        let totalPages = 0;
                        
                        if (data && data.data) {
                            // 格式1: 虎嗅API标准格式 { data: { total_page: xxx } }
                            if (data.data.total_page !== undefined && data.data.total_page !== null) {
                                totalPages = parseInt(data.data.total_page);
                                console.log(`[API] 从 data.data.total_page 获取页数: ${totalPages}`);
                            } else {
                                console.warn(`[API] 用户 ${uid} 的响应中未找到 total_page 字段，data.data 内容:`, data.data);
                            }
                        } else {
                            console.warn(`[API] 用户 ${uid} 的响应格式异常，data 或 data.data 不存在:`, data);
                        }
                        
                        if (totalPages === 0) {
                            console.warn(`[API] 用户 ${uid} 的页数解析为0，可能解析失败`);
                        }

                        resolve(totalPages);
                    } catch (e) {
                        console.error('解析API响应失败:', e, response.responseText);
                        reject(e);
                    }
                },
                onerror: function(error) {
                    pendingChecks.delete(uid);
                    console.error('API请求失败:', error);
                    reject(error);
                }
            });
        });
    }

    /**
     * 隐藏评论元素
     * @param {HTMLElement} commentElement - 评论元素（单个评论项）
     * @param {string} uid - 用户ID
     * @param {number} totalPages - 总评论页数
     */
    function hideComment(commentElement, uid, totalPages) {
        // 确保只隐藏单个评论项，而不是整个列表
        // 检查是否是评论列表容器
        if (commentElement.classList.contains('moment-comment__list')) {
            console.warn(`警告：尝试隐藏评论列表容器，跳过。用户ID: ${uid}`);
            return;
        }
        
        // 只隐藏单个评论项
        commentElement.style.display = 'none';
        commentElement.setAttribute('data-filtered', 'true');
        
        // 在控制台输出屏蔽信息
        console.log(`🚫 已屏蔽用户评论 | 用户ID: ${uid} | 总评论页数: ${totalPages}页`);
        
        // 添加一个简单的提示标记，显示评论已被隐藏
        const marker = document.createElement('div');
        marker.style.cssText = 'padding: 8px 12px; background: #f5f5f5; color: #999; font-size: 12px; margin-bottom: 10px; border-left: 3px solid #ddd; border-radius: 2px;';
        marker.textContent = '该评论已隐藏';
        marker.setAttribute('data-filter-marker', 'true');
        
        // 插入到评论项的父容器中，替换被隐藏的评论项位置
        if (commentElement.parentNode) {
            commentElement.parentNode.insertBefore(marker, commentElement);
        }
    }

    /**
     * 检查并过滤单个评论
     */
    async function checkAndFilterComment(commentElement) {
        // 如果已经处理过，跳过
        if (commentElement.getAttribute('data-checked') === 'true' ||
            commentElement.getAttribute('data-filtered') === 'true') {
            return;
        }

        // 安全检查：确保是单个评论项，而不是评论列表容器
        if (commentElement.classList.contains('moment-comment__list')) {
            console.warn('跳过评论列表容器，只处理单个评论项');
            return;
        }

        const uid = extractUserId(commentElement);
        if (!uid) {
            console.warn('无法提取用户ID:', commentElement);
            return;
        }

        // 标记为已检查
        commentElement.setAttribute('data-checked', 'true');

        try {
            const totalPages = await getUserCommentPages(uid);
            console.log(`用户 ${uid} 的评论页数: ${totalPages}`);

            if (totalPages > MAX_PAGES) {
                hideComment(commentElement, uid, totalPages);
            }
        } catch (error) {
            console.error(`检查用户 ${uid} 失败:`, error);
            // 出错时不隐藏，避免误杀
        }
    }

    /**
     * 查找页面上的所有评论元素
     */
    function findAllComments() {
        // 根据虎嗅网站的实际结构，只选择单个评论项
        // 优先使用最精确的选择器，避免选择到评论列表容器
        const selectors = [
            '.comment-item', // 虎嗅单个评论项的标准选择器
            '[data-comment-id]', // 通过data-comment-id属性的单个评论项
        ];

        const comments = new Set();
        
        for (const selector of selectors) {
            try {
                const elements = document.querySelectorAll(selector);
                elements.forEach(el => {
                    // 确保不是已经过滤的元素，且有实际内容
                    // 排除评论列表容器（.moment-comment__list）
                    if (el.getAttribute('data-filtered') !== 'true' &&
                        !el.classList.contains('moment-comment__list') && // 排除列表容器
                        el.offsetHeight > 0 && // 确保元素可见
                        el.textContent.trim().length > 0) { // 确保有内容
                        comments.add(el);
                    }
                });
            } catch (e) {
                // 忽略无效选择器
            }
        }

        // 去重：如果元素A包含元素B，只保留最内层的元素（单个评论项）
        const filtered = Array.from(comments).filter(comment => {
            // 如果这个元素包含其他评论元素，说明它是容器，应该排除
            const hasChildComment = Array.from(comments).some(other => 
                other !== comment && comment.contains(other)
            );
            // 如果这个元素被其他评论元素包含，保留它（它是单个评论项）
            const isChildOfComment = Array.from(comments).some(other => 
                other !== comment && other.contains(comment)
            );
            // 保留：要么是单个评论项（被其他元素包含），要么是独立的评论项（不包含其他评论）
            return !hasChildComment || isChildOfComment;
        });

        return filtered;
    }

    /**
     * 批量检查评论
     */
    async function checkAllComments() {
        const comments = findAllComments();
        console.log(`找到 ${comments.length} 条评论，开始检查...`);

        // 批量处理，避免同时发起太多请求
        const batchSize = 5;
        for (let i = 0; i < comments.length; i += batchSize) {
            const batch = comments.slice(i, i + batchSize);
            await Promise.all(batch.map(comment => checkAndFilterComment(comment)));
            
            // 批次之间稍作延迟
            if (i + batchSize < comments.length) {
                await new Promise(resolve => setTimeout(resolve, 500));
            }
        }
    }

    /**
     * 监听DOM变化，处理动态加载的评论
     */
    function setupMutationObserver() {
        const observer = new MutationObserver((mutations) => {
            let shouldCheck = false;
            
            mutations.forEach((mutation) => {
                mutation.addedNodes.forEach((node) => {
                    if (node.nodeType === 1) { // Element node
                        // 检查是否是评论相关的元素
                        if (node.classList && (
                            node.classList.toString().includes('comment') ||
                            node.querySelector && node.querySelector('[class*="comment"]')
                        )) {
                            shouldCheck = true;
                        }
                    }
                });
            });

            if (shouldCheck) {
                // 延迟检查，等待DOM完全渲染
                setTimeout(() => {
                    checkAllComments();
                }, 1000);
            }
        });

        observer.observe(document.body, {
            childList: true,
            subtree: true
        });
    }

    /**
     * 初始化
     */
    function init() {
        // 排除个人中心页面
        if (window.location.pathname.match(/^\/member\//)) {
            console.log('虎嗅评论过滤插件：跳过个人中心页面');
            return;
        }

        console.log('虎嗅评论过滤插件已启动（无缓存模式）');
        
        // 等待页面加载完成
        if (document.readyState === 'loading') {
            document.addEventListener('DOMContentLoaded', () => {
                setTimeout(checkAllComments, 2000);
                setupMutationObserver();
            });
        } else {
            setTimeout(checkAllComments, 2000);
            setupMutationObserver();
        }

        // 定期检查新评论
        setInterval(checkAllComments, CHECK_INTERVAL);
    }

    // 启动
    init();
})();

效果：

Mydumper一致性数据dump

2026-01-09T07:41:56+00:00

背景

我司购买了一个超大数据库：

SELECT
    table_schema AS database_name,
    table_name,
    table_rows AS approx_rows
FROM information_schema.tables
WHERE table_schema = 'xx'   -- 替换为你的数据库名
  AND engine = 'InnoDB'            -- 可选：只查 InnoDB 表
ORDER BY table_rows DESC;

为了能够顺利将mysql 数据dump到clickhouse中进行分析，我计划按照如下的步骤去进行:
（1）调查mysql 到clickhouse的方式。
（2）导入数据到clickhouse。
（3）增量数据导入。

mysql到clickhouse的方式

方式1 clickhouse mysql engine

在 https://clickhouse.com/docs/engines/database-engines/mysql 这里可以通过如下语句：

CREATE DATABASE mysql_db ENGINE = MySQL('localhost:3306', 'test', 'my_user', 'user_password') SETTINGS read_write_timeout=10000, connect_timeout=100;

但是这个本质还是将所有读写发到远端执行。无法达到快速分析和你用CLICKHOUSE完整OLAP能力的要求。只支持UPDATE和SELECT。

方式2 clickhouse materialized view

之前clickhouse在22版本的时候有通过MaterializedMySQL来讲数据直接复制到clickhouse中：参考链接但是在新版本中被移除了PR：

22版可以用如下方式：

set allow_experimental_database_materialized_mysql = 1;
CREATE DATABASE tableXXX on cluster 'all-nodes' ENGINE = MaterializedMySQL(
'mysql:3306', 'dbxxxx', 'username', 'pass')
settings 
materialized_mysql_tables_list = 'interface_access_log,enterprise_info'
TABLE OVERRIDE interface_access_log (
    PARTITION BY  toYYYYMM(gmt_create)
    ORDER BY (gmt_create, id)
)

该方式依赖每个表必须有明确主键。

方式3 将数据导出后恢复到clickhouse并增量同步

本文计划采用的方式。在调查mysql全量导出的过程中，我也看过相关的导出工具发现，mysqldump还是太慢了且文件太大，对于上面的数据量。mysqldump的示例：

mysqldump \
  --single-transaction \
  --master-data=2 \
  --routines \
  --triggers \
  --events \
  --hex-blob \
  --default-character-set=utf8mb4 \
  --host=127.0.0.1 \
  --port=3306 \
  --user=backup_user \
  --password='your_password' \
  your_database_name \
  > /backup/your_database_$(date +%Y%m%d).sql

--single-transaction保证备份期间视图一致性，且不阻塞正常的CRUD，但是会阻塞DDL（alter table 之类的）。--master-data=2记录dump是的binlog和pos。
这个缺点就是太慢了，且生成文件巨大没法简单分析和导入，所以调查了下mydumper这个工具。

mydumper

mydumper项目地址：https://github.com/mydumper/mydumper。我主要关注他如何高性能且一致性的导出备份。所以查看了相关实现，发现他主要通过如下方式实现一致性：
mydumper 在 FTWRL 下保证一致性的典型流程（核心机制）

主控制连接获取全局读锁（FTWRL）
    让所有表进入“读锁”状态：阻止新的写入，并等待正在进行的写入结束（达到一个全库静止点）。
    这一刻可以认为数据库处于一个确定的、可描述的时间点。

记录复制/增量所需的位置点（metadata）
在读锁还持有时，mydumper 会读取并写出 metadata（常见包含）：
    binlog file/position（以及可能的 GTID） 这保证“这份 dump 对应主库的哪个位置点”是准确的。

所有 worker 线程在屏障(barrier)下建立“同一时间点快照”
    每个线程通常用独立连接去读各自负责的表/分片。
    在 FTWRL 仍然持有时，mydumper 会让这些连接几乎同时执行一致性读相关设置并开启事务快照（典型是 REPEATABLE READ + 一致性快照 语义）。
    因为此时写入被阻塞，所以这些事务拿到的 read view 等价于同一个时间点。

释放 FTWRL，全库恢复可写；dump 线程继续并发读取
    锁释放后，业务写入可以继续。
    但每个线程都在自己的事务快照里读数据：
    InnoDB 的 MVCC 保证它们看到的仍是“锁释放那一刻”的版本（后续提交的新版本对这些事务不可见）。

java伪代码：

Java 伪代码：FTWRL + 多线程一致性快照（barrier 同步）

// Pseudo-code (Java-like), illustrating mydumper's idea:
// 1) Hold FTWRL briefly to freeze writes
// 2) Record binlog/gtid position under lock
// 3) Let all worker connections START consistent snapshots at the same point
// 4) Release FTWRL, workers dump concurrently using their own snapshot
 
class DumpCoordinator {
 
  String host;
  int port;
  String user;
  String password;
  String database;
  int threads;
  long chunkSizeBytes;
 
  void runDump() throws Exception {
    Connection ctrl = openConnection();   // control connection
    ctrl.setAutoCommit(true);
 
    // Barrier to ensure all workers have created snapshot before unlocking
    CyclicBarrier snapshotBarrier = new CyclicBarrier(threads + 1);
 
    ExecutorService pool = Executors.newFixedThreadPool(threads);
    List tasks = planTableAndChunkTasks(database, chunkSizeBytes);
 
    // Start workers first (they will wait until coordinator says "snapshot now")
    for (int i = 0; i < threads; i++) {
      pool.submit(new DumpWorker(i, snapshotBarrier, tasks));
    }
 
    // 1) Acquire global read lock (FTWRL)
    exec(ctrl, "FLUSH TABLES WITH READ LOCK");
 
    // 2) Read metadata (binlog pos / gtid) while lock is held
    BinlogPoint p = readBinlogPoint(ctrl);     // e.g. SHOW MASTER STATUS / SHOW BINARY LOG STATUS
    writeMetadataFile(p);
 
    // 3) Tell workers to create consistent snapshot NOW (while FTWRL is still held)
    // coordinator arrives at barrier; workers also arrive after START TRANSACTION WITH CONSISTENT SNAPSHOT
    snapshotBarrier.await(); // releases only when all workers + coordinator reach it
 
    // 4) Release lock quickly so production can continue
    exec(ctrl, "UNLOCK TABLES");
 
    pool.shutdown();
    pool.awaitTermination(24, TimeUnit.HOURS);
    ctrl.close();
  }
 
  Connection openConnection() { /* DriverManager.getConnection(...) */ return null; }
 
  void exec(Connection c, String sql) { /* execute sql */ }
 
  BinlogPoint readBinlogPoint(Connection c) { /* query master status */ return null; }
 
  void writeMetadataFile(BinlogPoint p) { /* write metadata */ }
 
  List planTableAndChunkTasks(String db, long chunkBytes) {
    // Inspect table sizes / PK ranges, split into chunks:
    // - small tables: one task
    // - large tables: multiple chunk tasks (pk ranges)
    return new ArrayList<>();
  }
}
 
class DumpWorker implements Runnable {
  int workerId;
  CyclicBarrier snapshotBarrier;
  List sharedTasks;
 
  DumpWorker(int workerId, CyclicBarrier barrier, List tasks) {
    this.workerId = workerId;
    this.snapshotBarrier = barrier;
    this.sharedTasks = tasks;
  }
 
  @Override
  public void run() {
    Connection conn = openConnection();
    conn.setAutoCommit(false);
 
    // Ensure snapshot semantics (InnoDB MVCC)
    exec(conn, "SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ");
 
    // Create a consistent snapshot while FTWRL is held
    exec(conn, "START TRANSACTION WITH CONSISTENT SNAPSHOT");
 
    // Signal "snapshot ready"
    await(snapshotBarrier);
 
    // After this point coordinator may UNLOCK TABLES;
    // this worker keeps reading the SAME snapshot via MVCC.
    while (true) {
      TableTask task = pollNextTask(sharedTasks);
      if (task == null) break;
 
      dumpTableOrChunk(conn, task);
    }
 
    exec(conn, "COMMIT");
    closeQuietly(conn);
  }
 
  Connection openConnection() { return null; }
 
  void exec(Connection c, String sql) { /* execute sql */ }
 
  void await(CyclicBarrier b) { /* b.await() */ }
 
  TableTask pollNextTask(List tasks) {
    // synchronized(tasks) { pop next }
    return null;
  }
 
  void dumpTableOrChunk(Connection conn, TableTask task) {
    // Example chunk query:
    // SELECT * FROM db.table WHERE pk >= ? AND pk < ? ORDER BY pk;
    // Stream rows -> write file part
  }
 
  void closeQuietly(Connection c) {}
}
 
class TableTask {
  String table;
  boolean isChunk;
  long pkStartInclusive;
  long pkEndExclusive;
}
 
class BinlogPoint {
  String binlogFile;
  long binlogPos;
  String gtidSet; // optional
}

设计还是非常巧妙的，总结起来就是：结合了MVCC + 任务窃取 + Cyclicbarrier 提前连接降低持有锁时长。

这是使用的示例命令：

--compress 可以压缩生成zst文件
mydumper --sync-thread-lock-mode=FTWRL --port=3306 --host=192.168.102. --user=root --password='xx' --database=xx --outputdir=/root/testdump --threads=8 --chunk-filesize=128 --verbose=3

生成的文件中：metadata记录了相关表的文件名—》数据文件的映射和相关binlog信息：

# Started dump at: 2026-01-09 14:17:57
[config]
quote-character = BACKTICK

[myloader_session_variables]
SQL_MODE='NO_AUTO_VALUE_ON_ZERO,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION' /*!40101

[source]
# Channel_Name = '' # It can be use to setup replication FOR CHANNEL
# executed_gtid_set = "0-1099-53297657"
# SOURCE_LOG_FILE = "master-bin.000080"
# SOURCE_LOG_POS = 761443754

[`dbxxx`.`admin_punish_credit`]
real_table_name=admin_punish_credit
rows = 26

[`dbxxx`.`admin_punish`]
real_table_name=admin_punish
rows = 23
....

[`dbxxx`.`mydumper_7`]
real_table_name=费用信息
rows = 10000
[config]
max-statement-size = 999998
num-sequences = 0
# Finished dump at: 2026-01-09 14:18:05

下一步

下一步就是：解析生成相关的Clickhouse table 和基于Canal的增量复制。

PostgreSQL 完全迁移指南：从 MySQL 到 PostgreSQL 的详细教程

2025-09-22T04:15:03+00:00

专为熟悉 MySQL 但 PostgreSQL 经验有限的高级后端程序员设计的全面迁移指南

PostgreSQL 基础概念
核心架构差异详解
MVCC 机制深度解析
安装与基础配置
数据类型对比与转换
SQL 语法差异详解
性能优化完整指南
索引策略与优化
常见陷阱与解决方案
扩展生态系统详解
监控与诊断完整方案
备份与恢复策略
高可用与集群配置
迁移策略与工具
故障排除指南

PostgreSQL 基础概念

什么是 PostgreSQL？

PostgreSQL 是一个功能强大的开源对象关系数据库系统，具有超过 35 年的开发历史。与 MySQL 相比，PostgreSQL 提供了更丰富的功能集和更强的标准兼容性。

核心术语对比

概念	MySQL	PostgreSQL	说明
数据库实例	Instance	Cluster	PostgreSQL 中一个实例可以包含多个数据库
数据库	Database	Database	概念相似，但 PostgreSQL 支持更多高级特性
表空间	Tablespace	Tablespace	功能更强大，支持跨数据库使用
存储引擎	InnoDB/MyISAM	统一存储引擎	PostgreSQL 使用统一的存储引擎
事务隔离	4 个级别	4 个级别	实现方式不同，PostgreSQL 更严格

PostgreSQL 的核心优势

标准兼容性：严格遵循 SQL 标准
扩展性：支持 1200+ 扩展
数据类型丰富：支持 JSON、数组、范围类型等
并发控制：基于 MVCC 的无锁并发
ACID 完整性：完全支持 ACID 特性

核心架构差异详解

1. 多版本并发控制 (MVCC) 的根本差异

MySQL vs PostgreSQL MVCC 对比

MySQL InnoDB MVCC：

使用 增量存储：只记录变更的字段
版本链：newest-to-oldest (N2O)
回滚段：存储在系统表空间中
索引：存储逻辑标识符

PostgreSQL MVCC：

使用 追加式存储：复制整行数据
版本链：oldest-to-newest (O2N)
版本存储：与数据混合存储在同一页面
索引：存储物理地址

具体示例对比

-- 假设有一个用户表，包含 50 个字段
CREATE TABLE users (
    id INT PRIMARY KEY,
    username VARCHAR(50),
    email VARCHAR(100),
    -- ... 其他 47 个字段
    last_login TIMESTAMP
);

-- 只更新一个字段
UPDATE users SET last_login = NOW() WHERE id = 1;

MySQL 行为：

在回滚段中只存储 last_login 的旧值
主表只更新 last_login 字段
索引不需要更新（如果 last_login 没有索引）

PostgreSQL 行为：

复制整行数据（50 个字段）到新位置
更新所有相关索引指向新位置
原行标记为”死元组”

性能影响分析

-- 监控表膨胀情况
SELECT 
    schemaname,
    tablename,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as total_size,
    pg_size_pretty(pg_relation_size(schemaname||'.'||tablename)) as table_size,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename) - pg_relation_size(schemaname||'.'||tablename)) as index_size,
    n_dead_tup,
    n_live_tup,
    round(n_dead_tup * 100.0 / (n_live_tup + n_dead_tup), 2) as dead_ratio
FROM pg_stat_user_tables 
WHERE n_dead_tup > 0
ORDER BY dead_ratio DESC;

2. 存储引擎架构差异

MySQL 存储引擎架构

-- MySQL 支持多种存储引擎
CREATE TABLE table1 (id INT) ENGINE=InnoDB;    -- 事务支持
CREATE TABLE table2 (id INT) ENGINE=MyISAM;    -- 非事务
CREATE TABLE table3 (id INT) ENGINE=Memory;    -- 内存表

PostgreSQL 统一架构

-- PostgreSQL 只有一种存储引擎，但支持多种访问方法
CREATE TABLE table1 (id INT);  -- 默认堆表
CREATE TABLE table2 (id INT) USING heap;  -- 显式指定堆表

-- 支持自定义访问方法（通过扩展）
CREATE EXTENSION zheap;  -- 实验性的新存储引擎
CREATE TABLE table3 (id INT) USING zheap;

存储引擎对比表

特性	MySQL InnoDB	PostgreSQL Heap	PostgreSQL zheap
事务支持	✅	✅	✅
外键约束	✅	✅	✅
行级锁定	✅	✅	✅
崩溃恢复	✅	✅	✅
版本存储	增量	整行复制	增量（实验性）
表膨胀	较少	较多	较少
索引维护	逻辑ID	物理地址	逻辑ID

3. 数据类型系统差异

MySQL 数据类型特点

-- MySQL 相对简单的数据类型
CREATE TABLE mysql_example (
    id INT AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(255),
    email VARCHAR(255),
    age TINYINT,
    salary DECIMAL(10,2),
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    data JSON
);

PostgreSQL 丰富的数据类型

-- PostgreSQL 支持更丰富的数据类型
CREATE TABLE postgres_example (
    id SERIAL PRIMARY KEY,  -- 自增序列
    name VARCHAR(255),
    email VARCHAR(255),
    age SMALLINT,  -- 更精确的整数类型
    salary NUMERIC(10,2),  -- 精确数值
    created_at TIMESTAMPTZ DEFAULT NOW(),  -- 带时区的时间戳
    data JSONB,  -- 二进制JSON，支持索引
    tags TEXT[],  -- 数组类型
    status user_status,  -- 枚举类型
    location POINT,  -- 几何类型
    search_vector TSVECTOR,  -- 全文搜索向量
    valid_period DATERANGE  -- 范围类型
);

-- 创建枚举类型
CREATE TYPE user_status AS ENUM ('active', 'inactive', 'pending');

数据类型映射表

MySQL 类型	PostgreSQL 类型	说明
`INT AUTO_INCREMENT`	`SERIAL` 或 `BIGSERIAL`	自增主键
`VARCHAR(n)`	`VARCHAR(n)` 或 `TEXT`	字符串类型
`TINYINT`	`SMALLINT`	小整数
`DECIMAL(p,s)`	`NUMERIC(p,s)`	精确数值
`TIMESTAMP`	`TIMESTAMPTZ`	带时区时间戳
`JSON`	`JSONB`	二进制JSON
`ENUM`	`ENUM` 或 `CHECK`	枚举值
-	`ARRAY`	数组类型（MySQL 不支持）
-	`RANGE`	范围类型（MySQL 不支持）
-	`UUID`	UUID 类型（MySQL 不支持）

MVCC 机制深度解析

什么是 MVCC？

多版本并发控制（MVCC）是一种数据库并发控制方法，允许多个事务同时读取和写入数据库，而不会相互阻塞。PostgreSQL 的 MVCC 实现与 MySQL 有根本性差异。

PostgreSQL MVCC 工作原理

1. 版本存储机制

-- 创建测试表
CREATE TABLE test_mvcc (
    id SERIAL PRIMARY KEY,
    name VARCHAR(50),
    value INTEGER
);

-- 插入初始数据
INSERT INTO test_mvcc (name, value) VALUES ('test', 100);

-- 查看元组信息
SELECT ctid, xmin, xmax, * FROM test_mvcc;
-- ctid: 物理位置 (页面号, 行号)
-- xmin: 创建此版本的事务ID
-- xmax: 删除此版本的事务ID (0表示未删除)

2. 更新操作详解

-- 开始事务
BEGIN;

-- 更新操作
UPDATE test_mvcc SET value = 200 WHERE id = 1;

-- 在另一个会话中查看
SELECT ctid, xmin, xmax, * FROM test_mvcc;
-- 会看到新的 ctid，说明数据被复制到新位置

COMMIT;

3. 版本链遍历

-- 模拟多次更新
BEGIN;
UPDATE test_mvcc SET value = 300 WHERE id = 1;
UPDATE test_mvcc SET value = 400 WHERE id = 1;
COMMIT;

-- 查看版本链（需要特殊工具或扩展）
-- 正常情况下只能看到最新版本

PostgreSQL MVCC 的四大问题

1. 版本复制开销

问题描述：
PostgreSQL 在更新时复制整行数据，即使只修改一个字段。

具体示例：

-- 创建一个包含很多字段的表
CREATE TABLE large_table (
    id SERIAL PRIMARY KEY,
    field1 VARCHAR(100),
    field2 VARCHAR(100),
    field3 VARCHAR(100),
    -- ... 假设有 100 个字段
    field100 VARCHAR(100),
    status VARCHAR(20)
);

-- 只更新一个字段
UPDATE large_table SET status = 'active' WHERE id = 1;
-- PostgreSQL 会复制所有 100 个字段到新位置

性能影响：

-- 监控表大小变化
SELECT 
    schemaname,
    tablename,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as size,
    n_tup_ins as inserts,
    n_tup_upd as updates,
    n_tup_del as deletes
FROM pg_stat_user_tables 
WHERE tablename = 'large_table';

解决方案：

使用 zheap 扩展（实验性）：

-- 安装 zheap 扩展（需要编译支持）
CREATE EXTENSION zheap;

-- 使用 zheap 存储引擎
CREATE TABLE optimized_table (
    id SERIAL PRIMARY KEY,
    data TEXT,
    status VARCHAR(20)
) USING zheap;

表结构优化：

-- 避免过宽的表，考虑垂直分表
CREATE TABLE user_basic_info (
    id SERIAL PRIMARY KEY,
    username VARCHAR(50),
    email VARCHAR(100)
);

CREATE TABLE user_extended_info (
    user_id INTEGER REFERENCES user_basic_info(id),
    profile_data JSONB,
    preferences JSONB
);

使用 pg_repack 定期重组：

# 安装 pg_repack
# Ubuntu/Debian
sudo apt-get install postgresql-15-repack

# 重组表
pg_repack -d your_database -t your_table

2. 表膨胀问题

问题描述：
死元组（dead tuples）占用存储空间，影响查询性能。

监控表膨胀：

-- 创建监控视图
CREATE OR REPLACE VIEW table_bloat_monitor AS
SELECT 
    schemaname,
    tablename,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as total_size,
    pg_size_pretty(pg_relation_size(schemaname||'.'||tablename)) as table_size,
    n_live_tup as live_tuples,
    n_dead_tup as dead_tuples,
    CASE 
        WHEN n_live_tup + n_dead_tup > 0 
        THEN round(n_dead_tup * 100.0 / (n_live_tup + n_dead_tup), 2)
        ELSE 0 
    END as dead_ratio,
    last_vacuum,
    last_autovacuum,
    last_analyze,
    last_autoanalyze
FROM pg_stat_user_tables 
WHERE n_dead_tup > 0
ORDER BY dead_ratio DESC;

-- 使用监控视图
SELECT * FROM table_bloat_monitor WHERE dead_ratio > 10;

Autovacuum 配置优化：

-- 全局配置
ALTER SYSTEM SET autovacuum = on;
ALTER SYSTEM SET autovacuum_max_workers = 3;
ALTER SYSTEM SET autovacuum_naptime = '1min';
ALTER SYSTEM SET autovacuum_vacuum_threshold = 50;
ALTER SYSTEM SET autovacuum_analyze_threshold = 50;
ALTER SYSTEM SET autovacuum_vacuum_scale_factor = 0.1;  -- 降低到10%
ALTER SYSTEM SET autovacuum_analyze_scale_factor = 0.05;  -- 降低到5%

-- 表级配置（针对大表）
ALTER TABLE large_table SET (
    autovacuum_vacuum_scale_factor = 0.05,  -- 5% 触发
    autovacuum_analyze_scale_factor = 0.02,  -- 2% 触发
    autovacuum_vacuum_cost_delay = 10,  -- 降低延迟
    autovacuum_vacuum_cost_limit = 1000  -- 增加限制
);

-- 重载配置
SELECT pg_reload_conf();

手动 Vacuum 操作：

-- 普通 vacuum（不阻塞读写）
VACUUM ANALYZE your_table;

-- 完整 vacuum（阻塞写入，回收空间）
VACUUM FULL your_table;

-- 使用 pg_repack（在线重组，不阻塞）
-- pg_repack -d your_database -t your_table

3. 索引维护开销

问题描述：
每次更新都需要更新所有相关索引。

HOT 更新优化：

-- 创建支持 HOT 的表结构
CREATE TABLE hot_optimized (
    id SERIAL PRIMARY KEY,
    name VARCHAR(50),
    email VARCHAR(100),
    status VARCHAR(20),
    created_at TIMESTAMPTZ DEFAULT NOW()
);

-- 创建索引（只对需要查询的字段）
CREATE INDEX idx_hot_optimized_name ON hot_optimized(name);
CREATE INDEX idx_hot_optimized_status ON hot_optimized(status);

-- 更新不涉及索引字段的列（HOT 更新）
UPDATE hot_optimized SET email = 'new@example.com' WHERE id = 1;
-- 这个更新可能使用 HOT，因为 email 字段没有索引

监控 HOT 更新：

-- 查看 HOT 更新统计
SELECT 
    schemaname,
    tablename,
    n_tup_hot_upd as hot_updates,
    n_tup_upd as total_updates,
    CASE 
        WHEN n_tup_upd > 0 
        THEN round(n_tup_hot_upd * 100.0 / n_tup_upd, 2)
        ELSE 0 
    END as hot_ratio
FROM pg_stat_user_tables 
WHERE n_tup_upd > 0
ORDER BY hot_ratio DESC;

索引设计优化：

-- 避免在频繁更新的字段上创建索引
-- 错误示例：在状态字段上创建索引，但状态经常变化
CREATE INDEX idx_bad_status ON orders(status);  -- 避免

-- 正确示例：在相对稳定的字段上创建索引
CREATE INDEX idx_good_customer ON orders(customer_id);  -- 推荐

-- 使用部分索引
CREATE INDEX idx_active_orders ON orders(customer_id) 
WHERE status = 'active';

4. Vacuum 管理复杂性

监控 Vacuum 状态：

-- 创建 Vacuum 监控视图
CREATE OR REPLACE VIEW vacuum_monitor AS
SELECT 
    schemaname,
    tablename,
    last_vacuum,
    last_autovacuum,
    last_analyze,
    last_autoanalyze,
    vacuum_count,
    autovacuum_count,
    analyze_count,
    autoanalyze_count,
    CASE 
        WHEN last_autovacuum IS NULL THEN 'Never'
        WHEN last_autovacuum < NOW() - INTERVAL '1 day' THEN 'Stale'
        ELSE 'Recent'
    END as vacuum_status
FROM pg_stat_user_tables
ORDER BY last_autovacuum NULLS FIRST;

-- 使用监控视图
SELECT * FROM vacuum_monitor WHERE vacuum_status IN ('Never', 'Stale');

Vacuum 阻塞问题：

-- 查看长时间运行的事务
SELECT 
    pid,
    usename,
    application_name,
    client_addr,
    state,
    query_start,
    now() - query_start as duration,
    query
FROM pg_stat_activity 
WHERE state IN ('active', 'idle in transaction')
  AND now() - query_start > INTERVAL '1 hour'
ORDER BY duration DESC;

-- 查看 Vacuum 进程
SELECT 
    pid,
    usename,
    application_name,
    state,
    query_start,
    query
FROM pg_stat_activity 
WHERE query LIKE '%VACUUM%' OR query LIKE '%ANALYZE%';

Vacuum 调优策略：

-- 针对不同表设置不同的 Vacuum 策略
-- 大表：更频繁的 Vacuum
ALTER TABLE large_frequently_updated_table SET (
    autovacuum_vacuum_scale_factor = 0.02,  -- 2%
    autovacuum_analyze_scale_factor = 0.01,  -- 1%
    autovacuum_vacuum_cost_delay = 5,  -- 更积极的 Vacuum
    autovacuum_vacuum_cost_limit = 2000
);

-- 小表：标准设置
ALTER TABLE small_stable_table SET (
    autovacuum_vacuum_scale_factor = 0.2,  -- 20%
    autovacuum_analyze_scale_factor = 0.1   -- 10%
);

-- 只读表：禁用 Autovacuum
ALTER TABLE read_only_table SET (
    autovacuum_enabled = false
);

安装与基础配置

PostgreSQL 安装

Ubuntu/Debian 安装

# 添加 PostgreSQL 官方仓库
sudo apt update
sudo apt install -y wget ca-certificates
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | sudo apt-key add -
echo "deb http://apt.postgresql.org/pub/repos/apt/ $(lsb_release -cs)-pgdg main" | sudo tee /etc/apt/sources.list.d/pgdg.list

# 安装 PostgreSQL 15
sudo apt update
sudo apt install -y postgresql-15 postgresql-client-15 postgresql-contrib-15

# 启动服务
sudo systemctl start postgresql
sudo systemctl enable postgresql

CentOS/RHEL 安装

# 安装 PostgreSQL 官方仓库
sudo yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.noarch.rpm

# 安装 PostgreSQL 15
sudo yum install -y postgresql15-server postgresql15 postgresql15-contrib

# 初始化数据库
sudo /usr/pgsql-15/bin/postgresql-15-setup initdb

# 启动服务
sudo systemctl start postgresql-15
sudo systemctl enable postgresql-15

Docker 安装

# 使用 Docker 运行 PostgreSQL
docker run --name postgres-15 \
  -e POSTGRES_PASSWORD=your_password \
  -e POSTGRES_DB=your_database \
  -p 5432:5432 \
  -v postgres_data:/var/lib/postgresql/data \
  -d postgres:15

# 连接到容器
docker exec -it postgres-15 psql -U postgres

基础配置

1. 连接配置

# 编辑 postgresql.conf
sudo nano /etc/postgresql/15/main/postgresql.conf

# 关键配置项
listen_addresses = '*'          # 允许外部连接
port = 5432                     # 端口号
max_connections = 100           # 最大连接数
shared_buffers = 256MB          # 共享缓冲区
effective_cache_size = 1GB      # 有效缓存大小
work_mem = 4MB                  # 工作内存
maintenance_work_mem = 64MB     # 维护工作内存

2. 认证配置

# 编辑 pg_hba.conf
sudo nano /etc/postgresql/15/main/pg_hba.conf

# 添加连接规则
# TYPE  DATABASE        USER            ADDRESS                 METHOD
local   all             postgres                                peer
local   all             all                                     md5
host    all             all             127.0.0.1/32            md5
host    all             all             ::1/128                 md5
host    all             all             0.0.0.0/0               md5

3. 重启服务

# 重启 PostgreSQL 服务
sudo systemctl restart postgresql

# 检查服务状态
sudo systemctl status postgresql

# 查看日志
sudo journalctl -u postgresql -f

用户和权限管理

创建用户和数据库

-- 连接到 PostgreSQL
sudo -u postgres psql

-- 创建用户
CREATE USER app_user WITH PASSWORD 'secure_password';

-- 创建数据库
CREATE DATABASE app_database OWNER app_user;

-- 授予权限
GRANT ALL PRIVILEGES ON DATABASE app_database TO app_user;

-- 连接到新数据库
\c app_database

-- 授予模式权限
GRANT ALL ON SCHEMA public TO app_user;
GRANT ALL PRIVILEGES ON ALL TABLES IN SCHEMA public TO app_user;
GRANT ALL PRIVILEGES ON ALL SEQUENCES IN SCHEMA public TO app_user;

-- 设置默认权限
ALTER DEFAULT PRIVILEGES IN SCHEMA public GRANT ALL ON TABLES TO app_user;
ALTER DEFAULT PRIVILEGES IN SCHEMA public GRANT ALL ON SEQUENCES TO app_user;

角色管理

-- 创建角色
CREATE ROLE readonly_role;
CREATE ROLE write_role;

-- 授予权限
GRANT CONNECT ON DATABASE app_database TO readonly_role;
GRANT USAGE ON SCHEMA public TO readonly_role;
GRANT SELECT ON ALL TABLES IN SCHEMA public TO readonly_role;

GRANT CONNECT ON DATABASE app_database TO write_role;
GRANT USAGE ON SCHEMA public TO write_role;
GRANT SELECT, INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA public TO write_role;

-- 将用户添加到角色
GRANT readonly_role TO app_user;
GRANT write_role TO app_user;

数据类型对比与转换

数值类型

MySQL vs PostgreSQL 数值类型

MySQL 类型	PostgreSQL 类型	说明	示例
`TINYINT`	`SMALLINT`	小整数	`SMALLINT`
`SMALLINT`	`SMALLINT`	小整数	`SMALLINT`
`MEDIUMINT`	`INTEGER`	中等整数	`INTEGER`
`INT`	`INTEGER`	整数	`INTEGER`
`BIGINT`	`BIGINT`	大整数	`BIGINT`
`DECIMAL(p,s)`	`NUMERIC(p,s)`	精确数值	`NUMERIC(10,2)`
`FLOAT`	`REAL`	单精度浮点	`REAL`
`DOUBLE`	`DOUBLE PRECISION`	双精度浮点	`DOUBLE PRECISION`

数值类型示例

-- MySQL 表结构
CREATE TABLE mysql_numeric (
    id TINYINT AUTO_INCREMENT PRIMARY KEY,
    small_num SMALLINT,
    medium_num MEDIUMINT,
    normal_num INT,
    big_num BIGINT,
    decimal_num DECIMAL(10,2),
    float_num FLOAT,
    double_num DOUBLE
);

-- PostgreSQL 对应表结构
CREATE TABLE postgres_numeric (
    id SMALLSERIAL PRIMARY KEY,  -- 自增小整数
    small_num SMALLINT,
    medium_num INTEGER,          -- MEDIUMINT 映射到 INTEGER
    normal_num INTEGER,
    big_num BIGINT,
    decimal_num NUMERIC(10,2),   -- DECIMAL 改为 NUMERIC
    float_num REAL,              -- FLOAT 改为 REAL
    double_num DOUBLE PRECISION  -- DOUBLE 改为 DOUBLE PRECISION
);

字符串类型

字符串类型对比

MySQL 类型	PostgreSQL 类型	说明	示例
`CHAR(n)`	`CHAR(n)`	固定长度字符串	`CHAR(10)`
`VARCHAR(n)`	`VARCHAR(n)`	可变长度字符串	`VARCHAR(255)`
`TEXT`	`TEXT`	长文本	`TEXT`
`TINYTEXT`	`TEXT`	短文本	`TEXT`
`MEDIUMTEXT`	`TEXT`	中等文本	`TEXT`
`LONGTEXT`	`TEXT`	长文本	`TEXT`
`ENUM`	`ENUM` 或 `CHECK`	枚举类型	`ENUM('a','b','c')`

字符串类型示例

-- MySQL 字符串表
CREATE TABLE mysql_strings (
    id INT AUTO_INCREMENT PRIMARY KEY,
    fixed_char CHAR(10),
    variable_char VARCHAR(255),
    long_text LONGTEXT,
    status ENUM('active', 'inactive', 'pending')
);

-- PostgreSQL 对应表结构
CREATE TYPE user_status AS ENUM ('active', 'inactive', 'pending');

CREATE TABLE postgres_strings (
    id SERIAL PRIMARY KEY,
    fixed_char CHAR(10),
    variable_char VARCHAR(255),
    long_text TEXT,                    -- 所有文本类型统一为 TEXT
    status user_status                 -- 使用自定义枚举类型
);

-- 或者使用 CHECK 约束
CREATE TABLE postgres_strings_check (
    id SERIAL PRIMARY KEY,
    fixed_char CHAR(10),
    variable_char VARCHAR(255),
    long_text TEXT,
    status VARCHAR(20) CHECK (status IN ('active', 'inactive', 'pending'))
);

日期时间类型

日期时间类型对比

MySQL 类型	PostgreSQL 类型	说明	示例
`DATE`	`DATE`	日期	`DATE`
`TIME`	`TIME`	时间	`TIME`
`DATETIME`	`TIMESTAMP`	日期时间	`TIMESTAMP`
`TIMESTAMP`	`TIMESTAMPTZ`	带时区时间戳	`TIMESTAMPTZ`
`YEAR`	`SMALLINT`	年份	`SMALLINT`

日期时间类型示例

-- MySQL 日期时间表
CREATE TABLE mysql_datetime (
    id INT AUTO_INCREMENT PRIMARY KEY,
    birth_date DATE,
    work_time TIME,
    created_at DATETIME,
    updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    birth_year YEAR
);

-- PostgreSQL 对应表结构
CREATE TABLE postgres_datetime (
    id SERIAL PRIMARY KEY,
    birth_date DATE,
    work_time TIME,
    created_at TIMESTAMP,                    -- DATETIME 改为 TIMESTAMP
    updated_at TIMESTAMPTZ DEFAULT NOW(),   -- 带时区的时间戳
    birth_year SMALLINT                     -- YEAR 改为 SMALLINT
);

-- 创建自动更新触发器
CREATE OR REPLACE FUNCTION update_updated_at_column()
RETURNS TRIGGER AS $$
BEGIN
    NEW.updated_at = NOW();
    RETURN NEW;
END;
$$ language 'plpgsql';

CREATE TRIGGER update_postgres_datetime_updated_at 
    BEFORE UPDATE ON postgres_datetime 
    FOR EACH ROW EXECUTE FUNCTION update_updated_at_column();

JSON 类型

JSON 类型对比

MySQL 类型	PostgreSQL 类型	说明	优势
`JSON`	`JSONB`	二进制 JSON	支持索引，查询更快

JSON 类型示例

-- MySQL JSON 表
CREATE TABLE mysql_json (
    id INT AUTO_INCREMENT PRIMARY KEY,
    user_data JSON,
    settings JSON
);

-- PostgreSQL JSONB 表
CREATE TABLE postgres_jsonb (
    id SERIAL PRIMARY KEY,
    user_data JSONB,    -- 使用 JSONB 而不是 JSON
    settings JSONB
);

-- 创建 GIN 索引支持 JSON 查询
CREATE INDEX idx_user_data_gin ON postgres_jsonb USING gin (user_data);
CREATE INDEX idx_settings_gin ON postgres_jsonb USING gin (settings);

-- JSON 查询示例
-- MySQL 查询
SELECT * FROM mysql_json WHERE JSON_EXTRACT(user_data, '$.name') = 'John';

-- PostgreSQL 查询
SELECT * FROM postgres_jsonb WHERE user_data->>'name' = 'John';
SELECT * FROM postgres_jsonb WHERE user_data @> '{"status": "active"}';
SELECT * FROM postgres_jsonb WHERE user_data ? 'email';

数组类型

PostgreSQL 独有的数组类型

-- PostgreSQL 支持数组类型（MySQL 不支持）
CREATE TABLE postgres_arrays (
    id SERIAL PRIMARY KEY,
    tags TEXT[],                    -- 文本数组
    scores INTEGER[],               -- 整数数组
    coordinates FLOAT[][],          -- 二维浮点数组
    metadata JSONB[]                -- JSONB 数组
);

-- 插入数组数据
INSERT INTO postgres_arrays (tags, scores, coordinates, metadata) VALUES (
    ARRAY['tag1', 'tag2', 'tag3'],
    ARRAY[85, 92, 78],
    ARRAY[[1.0, 2.0], [3.0, 4.0]],
    ARRAY['{"key": "value1"}', '{"key": "value2"}']
);

-- 数组查询
SELECT * FROM postgres_arrays WHERE 'tag1' = ANY(tags);
SELECT * FROM postgres_arrays WHERE array_length(scores, 1) > 2;
SELECT * FROM postgres_arrays WHERE tags @> ARRAY['tag1'];

-- 创建数组索引
CREATE INDEX idx_tags_gin ON postgres_arrays USING gin (tags);

范围类型

PostgreSQL 独有的范围类型

-- PostgreSQL 支持范围类型（MySQL 不支持）
CREATE TABLE postgres_ranges (
    id SERIAL PRIMARY KEY,
    price_range NUMRANGE,           -- 数值范围
    date_range DATERANGE,           -- 日期范围
    time_range TSRANGE,             -- 时间戳范围
    text_range INTRANGE             -- 整数范围
);

-- 插入范围数据
INSERT INTO postgres_ranges (price_range, date_range, time_range, text_range) VALUES (
    '[100, 500)',                   -- 100 到 500（不包含 500）
    '[2023-01-01, 2023-12-31]',    -- 2023 年全年
    '[2023-01-01 00:00:00, 2023-01-01 23:59:59]',
    '[1, 10]'                       -- 1 到 10
);

-- 范围查询
SELECT * FROM postgres_ranges WHERE price_range @> 250;  -- 包含 250
SELECT * FROM postgres_ranges WHERE date_range && '[2023-06-01, 2023-06-30]';  -- 重叠
SELECT * FROM postgres_ranges WHERE price_range <@ '[0, 1000]';  -- 被包含

-- 创建范围索引
CREATE INDEX idx_price_range ON postgres_ranges USING gist (price_range);

性能优化关键点

1. 内存配置优化

work_mem 配置详解

work_mem 配置公式：

-- 推荐公式
work_mem = (总内存 * 0.8 - shared_buffers) / 活跃连接数

-- 示例：16GB 内存，100 个连接
work_mem = (16GB * 0.8 - 4GB) / 100 = 96MB

work_mem 影响的操作：

排序操作（ORDER BY）
哈希连接（Hash Join）
哈希聚合（Hash Aggregate）
位图操作（Bitmap operations）

监控 work_mem 使用：

-- 查看临时文件使用情况
SELECT 
    datname,
    temp_files,
    temp_bytes,
    pg_size_pretty(temp_bytes) as temp_size
FROM pg_stat_database 
WHERE temp_files > 0
ORDER BY temp_bytes DESC;

-- 查看当前排序操作
SELECT 
    pid,
    usename,
    application_name,
    query,
    state
FROM pg_stat_activity 
WHERE query LIKE '%ORDER BY%' 
   OR query LIKE '%GROUP BY%'
   OR query LIKE '%DISTINCT%';

关键参数对比

参数	MySQL 对应	PostgreSQL 建议	说明
work_mem	sort_buffer_size	64MB-256MB	排序/哈希操作内存
shared_buffers	innodb_buffer_pool_size	25% 总内存	共享缓存
effective_cache_size	-	75% 总内存	查询规划器参考
maintenance_work_mem	-	256MB-1GB	维护操作内存
temp_buffers	-	8MB	临时表缓冲区

内存配置示例

-- 针对不同规模系统的配置建议

-- 小型系统 (4GB 内存)
shared_buffers = 1GB
effective_cache_size = 3GB
work_mem = 4MB
maintenance_work_mem = 64MB
temp_buffers = 8MB

-- 中型系统 (16GB 内存)
shared_buffers = 4GB
effective_cache_size = 12GB
work_mem = 16MB
maintenance_work_mem = 256MB
temp_buffers = 8MB

-- 大型系统 (64GB 内存)
shared_buffers = 16GB
effective_cache_size = 48GB
work_mem = 64MB
maintenance_work_mem = 1GB
temp_buffers = 8MB

2. 连接管理优化

连接池配置

pgbouncer 配置示例：

# /etc/pgbouncer/pgbouncer.ini
[databases]
app_db = host=127.0.0.1 port=5432 dbname=app_database pool_size=100

[pgbouncer]
listen_addr = 127.0.0.1
listen_port = 6432
auth_type = md5
auth_file = /etc/pgbouncer/userlist.txt
pool_mode = transaction
max_client_conn = 1000
default_pool_size = 100
reserve_pool_size = 10
reserve_pool_timeout = 5
log_connections = 1
log_disconnections = 1
log_pooler_errors = 1

连接池模式对比：

模式	连接复用	事务隔离	适用场景
Session	低	完整	需要会话状态的应用
Transaction	高	事务级	无状态应用
Statement	最高	语句级	简单查询应用

连接监控

-- 查看当前连接
SELECT 
    datname,
    usename,
    application_name,
    client_addr,
    state,
    query_start,
    now() - query_start as duration,
    query
FROM pg_stat_activity 
WHERE state != 'idle'
ORDER BY query_start;

-- 查看连接统计
SELECT 
    datname,
    numbackends as current_connections,
    max_connections,
    round(numbackends * 100.0 / max_connections, 2) as connection_usage
FROM pg_stat_database 
JOIN pg_database ON pg_stat_database.datname = pg_database.datname;

2. 查询优化策略

CTE vs 子查询性能：

-- 可能较慢的 CTE 写法
WITH user_stats AS (
    SELECT user_id, COUNT(*) as order_count
    FROM orders GROUP BY user_id
)
SELECT u.name, us.order_count
FROM users u JOIN user_stats us ON u.id = us.user_id;

-- 通常更快的子查询写法
SELECT u.name, us.order_count
FROM users u JOIN (
    SELECT user_id, COUNT(*) as order_count
    FROM orders GROUP BY user_id
) us ON u.id = us.user_id;

索引策略差异：

-- PostgreSQL 不会自动为外键创建索引
-- 需要手动创建
CREATE INDEX CONCURRENTLY idx_orders_user_id ON orders(user_id);

-- 复合索引顺序很重要
CREATE INDEX idx_orders_status_created ON orders(status, created_at);
-- 支持 (status), (status, created_at) 查询

3. 连接管理

连接池配置：

# pgbouncer 配置
[databases]
mydb = host=127.0.0.1 port=5432 pool_size=100

[pgbouncer]
pool_mode = transaction  # 事务级连接池
max_client_conn = 1000

常见陷阱与解决方案

1. 函数和存储过程滥用

问题： 将过多业务逻辑放入数据库函数

-- 避免：复杂的嵌套函数
CREATE OR REPLACE FUNCTION complex_business_logic()
RETURNS TABLE(...) AS $$
BEGIN
    -- 大量内存操作和递归调用
    -- 影响数据库性能
END;
$$ LANGUAGE plpgsql;

解决方案：

保持函数简单，标记为 IMMUTABLE 或 STABLE
复杂逻辑移回应用层
使用触发器时限制数量

2. 触发器性能问题

最佳实践：

-- 每个表最多一个 BEFORE 和一个 AFTER 触发器
CREATE OR REPLACE FUNCTION before_orders()
RETURNS TRIGGER AS $$
BEGIN
    -- 所有逻辑集中在一个函数中
    IF TG_OP = 'INSERT' THEN
        -- 插入逻辑
    ELSIF TG_OP = 'UPDATE' THEN
        -- 更新逻辑
    END IF;
    RETURN COALESCE(NEW, OLD);
END;
$$ LANGUAGE plpgsql;

3. NOTIFY 机制限制

问题： 大量 NOTIFY 事件影响性能

-- 替代方案：事件队列表
CREATE TABLE event_queue (
    id uuid PRIMARY KEY DEFAULT gen_random_uuid(),
    user_id uuid NOT NULL,
    type text NOT NULL,
    data jsonb NOT NULL,
    created_at timestamptz NOT NULL DEFAULT now(),
    acquired_at timestamptz
);

-- 批量处理事件
UPDATE event_queue 
SET acquired_at = now() 
WHERE id IN (
    SELECT id FROM event_queue 
    WHERE acquired_at IS NULL 
    ORDER BY created_at 
    FOR UPDATE SKIP LOCKED 
    LIMIT 1000
) RETURNING *;

4. NULL 值处理差异

问题： IS NOT DISTINCT FROM 不使用索引

-- 避免：不使用索引
SELECT * FROM users WHERE email IS NOT DISTINCT FROM 'test@example.com';

-- 推荐：显式 NULL 检查
SELECT * FROM users 
WHERE (email IS NULL AND 'test@example.com' IS NULL) 
   OR email = 'test@example.com';

扩展生态系统

核心扩展推荐

1. 性能监控扩展

-- 安装关键监控扩展
CREATE EXTENSION IF NOT EXISTS pg_stat_statements;
CREATE EXTENSION IF NOT EXISTS pg_qualstats;
CREATE EXTENSION IF NOT EXISTS pg_wait_sampling;

-- 查看慢查询
SELECT query, total_time, calls, mean_time
FROM pg_stat_statements 
ORDER BY total_time DESC 
LIMIT 10;

2. 数据模型扩展

-- JSONB 文档存储
CREATE TABLE products (
    id serial PRIMARY KEY,
    metadata jsonb,
    created_at timestamptz DEFAULT now()
);

-- 创建 GIN 索引支持复杂查询
CREATE INDEX idx_products_metadata ON products USING gin (metadata);

-- 查询示例
SELECT * FROM products 
WHERE metadata @> '{"category": "electronics", "price": {"$gt": 500}}';

3. 时序数据扩展

-- TimescaleDB 超表
SELECT create_hypertable('sensor_data', 'timestamp');

-- 自动分区和压缩
ALTER TABLE sensor_data SET (
    timescaledb.compress,
    timescaledb.compress_orderby = 'timestamp DESC'
);

外部数据包装器 (FDW)

-- 连接其他 PostgreSQL 实例
CREATE EXTENSION postgres_fdw;

CREATE SERVER remote_server 
FOREIGN DATA WRAPPER postgres_fdw 
OPTIONS (host 'remote-host', port '5432', dbname 'remote_db');

-- 联邦查询
SELECT l.name, r.amount 
FROM local_customers l 
JOIN remote_orders r ON l.id = r.customer_id;

监控与诊断

1. 关键监控指标

-- 数据库健康检查
SELECT 
    datname,
    numbackends as connections,
    xact_commit + xact_rollback as transactions,
    blks_read + blks_hit as total_blocks,
    round(blks_hit * 100.0 / (blks_hit + blks_read), 2) as cache_hit_ratio
FROM pg_stat_database 
WHERE datname = current_database();

2. 表膨胀监控

-- 监控表膨胀
SELECT 
    schemaname,
    tablename,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as size,
    n_dead_tup,
    n_live_tup,
    round(n_dead_tup * 100.0 / (n_live_tup + n_dead_tup), 2) as dead_ratio
FROM pg_stat_user_tables 
WHERE n_dead_tup > 0
ORDER BY dead_ratio DESC;

3. 索引使用情况

-- 检查未使用的索引
SELECT 
    schemaname,
    tablename,
    indexname,
    idx_tup_read,
    idx_tup_fetch
FROM pg_stat_user_indexes 
WHERE idx_tup_read = 0 
  AND idx_tup_fetch = 0;

迁移策略建议

1. 分阶段迁移计划

阶段一：基础设施准备

设置 PostgreSQL 集群
配置监控和备份
建立开发/测试环境

阶段二：数据迁移

使用 pgloader 或自定义脚本
验证数据完整性
性能基准测试

阶段三：应用适配

修改 SQL 查询语法
调整连接池配置
更新监控指标

2. 关键迁移工具

# 使用 pgloader 迁移
pgloader mysql://user:pass@mysql-host/dbname \
         postgresql://user:pass@pg-host/dbname

# 使用 ora2pg 从 Oracle 迁移（也可用于 MySQL）
ora2pg -c config/ora2pg.conf

3. 性能验证

-- 创建测试环境
CREATE DATABASE test_migration;

-- 运行性能基准
\timing on
EXPLAIN ANALYZE SELECT * FROM large_table WHERE indexed_column = 'value';

-- 对比迁移前后的性能指标

总结与建议

核心要点

MVCC 差异：PostgreSQL 的追加式 MVCC 需要更仔细的监控和管理
扩展生态：充分利用 PostgreSQL 的扩展机制，避免多数据库架构
性能调优：重点关注 work_mem、shared_buffers 和 autovacuum 配置
监控先行：建立完善的监控体系，特别是表膨胀和索引使用情况

迁移检查清单

配置合适的 work_mem 和 shared_buffers
设置 autovacuum 参数
为外键创建索引
安装关键监控扩展
建立表膨胀监控
配置连接池
设置备份和恢复策略
建立性能基准测试

长期维护建议

定期监控：每周检查表膨胀和索引使用情况
性能调优：根据实际负载调整参数
扩展评估：定期评估新的扩展和功能
团队培训：确保团队了解 PostgreSQL 特有的概念和最佳实践

故障排除指南

常见问题与解决方案

1. 连接问题

问题：无法连接到 PostgreSQL

# 检查服务状态
sudo systemctl status postgresql

# 检查端口是否监听
sudo netstat -tlnp | grep 5432

# 检查配置文件
sudo nano /etc/postgresql/15/main/postgresql.conf
# 确保 listen_addresses = '*'

# 检查认证配置
sudo nano /etc/postgresql/15/main/pg_hba.conf
# 确保有正确的连接规则

# 重启服务
sudo systemctl restart postgresql

问题：认证失败

-- 检查用户是否存在
SELECT usename FROM pg_user WHERE usename = 'your_username';

-- 重置密码
ALTER USER your_username WITH PASSWORD 'new_password';

-- 检查用户权限
\du your_username

2. 性能问题

问题：查询缓慢

-- 启用查询统计
CREATE EXTENSION IF NOT EXISTS pg_stat_statements;

-- 查看慢查询
SELECT 
    query,
    calls,
    total_time,
    mean_time,
    rows,
    100.0 * shared_blks_hit / nullif(shared_blks_hit + shared_blks_read, 0) AS hit_percent
FROM pg_stat_statements 
ORDER BY mean_time DESC 
LIMIT 10;

-- 分析查询计划
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM your_table WHERE condition;

问题：表膨胀严重

-- 检查表膨胀
SELECT 
    schemaname,
    tablename,
    n_dead_tup,
    n_live_tup,
    round(n_dead_tup * 100.0 / (n_live_tup + n_dead_tup), 2) as dead_ratio
FROM pg_stat_user_tables 
WHERE n_dead_tup > 0
ORDER BY dead_ratio DESC;

-- 手动执行 vacuum
VACUUM ANALYZE your_table;

-- 如果膨胀严重，使用 pg_repack
-- pg_repack -d your_database -t your_table

3. 锁问题

问题：查询被阻塞

-- 查看当前锁
SELECT 
    blocked_locks.pid AS blocked_pid,
    blocked_activity.usename AS blocked_user,
    blocking_locks.pid AS blocking_pid,
    blocking_activity.usename AS blocking_user,
    blocked_activity.query AS blocked_statement,
    blocking_activity.query AS current_statement_in_blocking_process
FROM pg_catalog.pg_locks blocked_locks
JOIN pg_catalog.pg_stat_activity blocked_activity ON blocked_activity.pid = blocked_locks.pid
JOIN pg_catalog.pg_locks blocking_locks ON blocking_locks.locktype = blocked_locks.locktype
    AND blocking_locks.database IS NOT DISTINCT FROM blocked_locks.database
    AND blocking_locks.relation IS NOT DISTINCT FROM blocked_locks.relation
    AND blocking_locks.page IS NOT DISTINCT FROM blocked_locks.page
    AND blocking_locks.tuple IS NOT DISTINCT FROM blocked_locks.tuple
    AND blocking_locks.virtualxid IS NOT DISTINCT FROM blocked_locks.virtualxid
    AND blocking_locks.transactionid IS NOT DISTINCT FROM blocked_locks.transactionid
    AND blocking_locks.classid IS NOT DISTINCT FROM blocked_locks.classid
    AND blocking_locks.objid IS NOT DISTINCT FROM blocked_locks.objid
    AND blocking_locks.objsubid IS NOT DISTINCT FROM blocked_locks.objsubid
    AND blocking_locks.pid != blocked_locks.pid
JOIN pg_catalog.pg_stat_activity blocking_activity ON blocking_activity.pid = blocking_locks.pid
WHERE NOT blocked_locks.granted;

-- 终止阻塞的查询
SELECT pg_terminate_backend(blocked_pid);

4. 磁盘空间问题

问题：磁盘空间不足

-- 检查数据库大小
SELECT 
    datname,
    pg_size_pretty(pg_database_size(datname)) as size
FROM pg_database
ORDER BY pg_database_size(datname) DESC;

-- 检查表大小
SELECT 
    schemaname,
    tablename,
    pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as size
FROM pg_stat_user_tables
ORDER BY pg_total_relation_size(schemaname||'.'||tablename) DESC;

-- 清理 WAL 日志（谨慎操作）
-- 首先检查 WAL 日志大小
SELECT pg_size_pretty(pg_wal_lsn_diff(pg_current_wal_lsn(), '0/0'));

-- 手动切换 WAL 日志
SELECT pg_switch_wal();

5. 配置问题

问题：参数配置错误

-- 查看当前配置
SELECT name, setting, unit, context, short_desc 
FROM pg_settings 
WHERE name IN ('shared_buffers', 'work_mem', 'effective_cache_size');

-- 修改配置
ALTER SYSTEM SET shared_buffers = '256MB';
SELECT pg_reload_conf();

-- 查看配置是否生效
SHOW shared_buffers;

监控脚本

系统健康检查脚本

#!/bin/bash
# postgres_health_check.sh

echo "=== PostgreSQL Health Check ==="
echo "Date: $(date)"
echo

# 检查服务状态
echo "1. Service Status:"
systemctl is-active postgresql

# 检查连接数
echo -e "\n2. Connection Status:"
psql -U postgres -c "
SELECT 
    datname,
    numbackends as current_connections,
    max_connections,
    round(numbackends * 100.0 / max_connections, 2) as usage_percent
FROM pg_stat_database 
JOIN pg_database ON pg_stat_database.datname = pg_database.datname
WHERE datname NOT IN ('template0', 'template1', 'postgres');
"

# 检查表膨胀
echo -e "\n3. Table Bloat Check:"
psql -U postgres -c "
SELECT 
    schemaname,
    tablename,
    n_dead_tup,
    n_live_tup,
    round(n_dead_tup * 100.0 / (n_live_tup + n_dead_tup), 2) as dead_ratio
FROM pg_stat_user_tables 
WHERE n_dead_tup > 0 AND n_live_tup + n_dead_tup > 1000
ORDER BY dead_ratio DESC
LIMIT 10;
"

# 检查慢查询
echo -e "\n4. Slow Queries:"
psql -U postgres -c "
SELECT 
    query,
    calls,
    mean_time,
    total_time
FROM pg_stat_statements 
ORDER BY mean_time DESC 
LIMIT 5;
"

# 检查锁
echo -e "\n5. Lock Status:"
psql -U postgres -c "
SELECT 
    mode,
    count(*) as lock_count
FROM pg_locks 
GROUP BY mode
ORDER BY lock_count DESC;
"

echo -e "\n=== Health Check Complete ==="

性能监控脚本

#!/bin/bash
# postgres_performance_monitor.sh

LOG_FILE="/var/log/postgres_performance.log"
DATE=$(date '+%Y-%m-%d %H:%M:%S')

echo "[$DATE] Performance Check" >> $LOG_FILE

# 检查缓存命中率
CACHE_HIT=$(psql -U postgres -t -c "
SELECT round(100.0 * sum(blks_hit) / (sum(blks_hit) + sum(blks_read)), 2)
FROM pg_stat_database 
WHERE datname NOT IN ('template0', 'template1', 'postgres');
")

echo "[$DATE] Cache Hit Ratio: $CACHE_HIT%" >> $LOG_FILE

# 检查活跃连接
ACTIVE_CONNECTIONS=$(psql -U postgres -t -c "
SELECT count(*) FROM pg_stat_activity WHERE state = 'active';
")

echo "[$DATE] Active Connections: $ACTIVE_CONNECTIONS" >> $LOG_FILE

# 检查数据库大小
DB_SIZE=$(psql -U postgres -t -c "
SELECT pg_size_pretty(sum(pg_database_size(datname)))
FROM pg_database 
WHERE datname NOT IN ('template0', 'template1', 'postgres');
")

echo "[$DATE] Total Database Size: $DB_SIZE" >> $LOG_FILE

# 检查 WAL 日志大小
WAL_SIZE=$(psql -U postgres -t -c "
SELECT pg_size_pretty(pg_wal_lsn_diff(pg_current_wal_lsn(), '0/0'));
")

echo "[$DATE] WAL Size: $WAL_SIZE" >> $LOG_FILE

echo "[$DATE] Performance Check Complete" >> $LOG_FILE
echo "---" >> $LOG_FILE

紧急恢复程序

数据库恢复

# 1. 停止 PostgreSQL 服务
sudo systemctl stop postgresql

# 2. 备份当前数据目录
sudo cp -r /var/lib/postgresql/15/main /var/lib/postgresql/15/main.backup.$(date +%Y%m%d_%H%M%S)

# 3. 从备份恢复
sudo -u postgres pg_restore -d your_database /path/to/backup.dump

# 4. 启动服务
sudo systemctl start postgresql

# 5. 验证数据
psql -U postgres -d your_database -c "SELECT count(*) FROM your_table;"

配置恢复

# 恢复配置文件
sudo cp /etc/postgresql/15/main/postgresql.conf.backup /etc/postgresql/15/main/postgresql.conf
sudo cp /etc/postgresql/15/main/pg_hba.conf.backup /etc/postgresql/15/main/pg_hba.conf

# 重启服务
sudo systemctl restart postgresql

总结与最佳实践

迁移检查清单

迁移前准备

评估现有 MySQL 数据库结构和数据量
选择合适的 PostgreSQL 版本
准备测试环境
制定回滚计划
培训团队成员

迁移过程

安装和配置 PostgreSQL
创建用户和权限
迁移表结构
迁移数据
迁移存储过程和函数
更新应用程序连接配置
执行功能测试
执行性能测试

迁移后优化

配置监控系统
优化查询性能
调整配置参数
建立备份策略
制定维护计划

关键成功因素

充分测试：在迁移前进行全面的功能测试和性能测试
渐进迁移：考虑分阶段迁移，降低风险
监控先行：建立完善的监控体系
团队培训：确保团队了解 PostgreSQL 的特性和最佳实践
文档维护：保持配置和流程文档的更新

长期维护建议

定期监控：每周检查系统健康状态
性能调优：根据实际负载调整配置参数
版本升级：制定 PostgreSQL 版本升级计划
扩展评估：定期评估新的扩展和功能
安全审计：定期进行安全配置审计

通过遵循本指南，高级后端开发人员可以更顺利地完成从 MySQL 到 PostgreSQL 的迁移，并充分发挥 PostgreSQL 的强大功能。记住，迁移是一个持续的过程，需要不断的监控、优化和改进。

[metabase]高级使用技巧1 geojson导入和图表，动态sql执行，动态过滤，动态分组，动态列

2025-09-22T02:19:40+00:00

本文

本文是metbase的高级技巧分享，主要包括：geojson导入和图表，动态sql执行，动态过滤，动态分组，动态列

metabase中使用geojson

为了呈现下图中的按地区归属的用户数信息：

操作步骤

1，加入metabase geo json地址：

点击右上角admin settings-》settings -> Maps –> Add a map:

这里需要一个url，我们可以从安利云的datav里面获取：
访问： https://datav.aliyun.com/portal/school/atlas/area_selector
选择合适的地理位置（比如我只关心四川省的）

拷贝这里的geojson的url即可：

https://geo.datav.aliyun.com/areas_v3/bound/geojson?code=510000_full

2、创建相关的dashboard

假设我有一个user表：

create table user(
id int primary key,
province_id int,
city_id int,
name varchar
);

如下的查询统计用户地区及用户数：

select city_id, count(*) from user
where province_id = 510000 and city_id is not null
GROUP BY  city_id

选择visulation -》 maps，然后勾选region map为前面创建的即可

复杂SQL执行

在metabase中原生不支持多语句的sql执行gitub讨论，但是如果真的是较复杂的业务需要使用到sql编写的场景，则依赖手动修改实现。
本文描述了一种方法让metabase支持多行sql执行，并获取最后一个结果集作为最终结果集。

该方法修改了mysql底层的mariadb driver以支持多语句执行效果：github

主要代码在：ProxyedSqlComponent.java
然后
（1）替换metabase.jar 中的相关driver类即可：
已经构建好的镜像：（使用方式同：https://blog.csdn.net/scugxl/article/details/150004029）

docker pull edwardg/metabase:v0.54.9.1

示例的dockerfile：

FROM metabase/metabase:v0.54.9

# 安装zip工具
USER root
RUN apk update && apk add --no-cache zip

# 创建临时工作目录
WORKDIR /tmp

COPY mariadb-java-client-2.7.10.jar mariadb-java-client-2.7.10.jar

# 使用单层RUN命令进行所有操作
RUN unzip /app/metabase.jar -d metabase-extracted && \
    unzip /tmp/mariadb-java-client-2.7.10.jar -d mariadb-extracted && \
    cp -r mariadb-extracted/org/mariadb/jdbc/Driver* metabase-extracted/org/mariadb/jdbc/ && \
    cp -r mariadb-extracted/org/mariadb/jdbc/ProxyedSqlComponent* metabase-extracted/org/mariadb/jdbc/ && \
    cd metabase-extracted && \
    zip -r /app/metabase.jar ./* && \
    rm -rf /tmp/metabase-extracted /tmp/mariadb-extracted /tmp/mariadb-java-client-2.7.10.jar

# 恢复工作目录
WORKDIR /app

（2）在database configuration中加入 allowMultiQueries=true

复杂sql测试

假设我添加了1个filter，指定不同的group by，然后按group by auth status 的话就有 auth status, count(id) 2列，如果group by org_id 的话就有province_id, city_id, count(id) 3列， 注意到我们这里实现了一个不同的groupby有不同列的效果，都是动态的，那么sql如下：

-- 动态排序（添加ORDER BY clause）
SET @group_by_field = ;

-- 拼接动态SQL（包含过滤和排序）
SET @sql = CONCAT(
        'SELECT ',
        CASE @group_by_field
            WHEN 'org_id' THEN '`province_id` AS `省`, `city_id` AS `市`, count(*) AS `count`'
            WHEN 'auth_status' THEN '`auth_status` AS `认证状态`,  count(*) AS `count`'
            END,
        ' FROM `user` ',
    -- 动态过滤
    -- 动态分组
        'GROUP BY ',
        CASE @group_by_field
            WHEN 'org_id' THEN '1,2'
            WHEN 'auth_status' THEN '1'
            END
    );

-- 预处理SQL（将@sql转换为可执行的语句）
PREPARE stmt FROM @sql;

-- 执行预处理语句
EXECUTE stmt

那么效果如下：

通过这样的效果，你可以实现任意复杂的sql统计和filter的关联组合。

总结

在本文我们介绍了geojson和分享了多语句sql在metabase中的一种hack方式。这里是metabase系列文章的高级技巧部分。下个博客我们介绍如何分享dashboard.

技术博客

quarkus使用/迁移经验

quarkus

build加速

docker build ubi8 vs ubi9

docker 自定义镜像

grpc

移除grpc依赖避免log4j 引入

db

redis

自定义key：

配置

参考链接

Cursor中的excel & word mcp使用和配置

excel mcp

安装excel-mcp

配置

word mcp

安装uv

cursor 里面配置

参考链接

cursor项目级mcp配置和excel mcp

什么是 DBHub？

一、Docker 部署 DBHub

1. 使用 Docker Run

二、Cursor 中的 MCP 配置

方式一：HTTP 连接（推荐，配合 Docker）

三、验证与使用

四、参考链接

【翻译】我用 PostgreSQL 替换了 Redis（而且更快）

文章目录

引言

我用 PostgreSQL 替换了 Redis（而且更快）

设置：我之前用 Redis 做什么

1. 缓存（70% 的使用量）

2. 发布/订阅（20% 的使用量）

3. 后台任务队列（10% 的使用量）

为什么我考虑替换 Redis

原因 #1：成本

原因 #2：运维复杂性

原因 #3：数据一致性

PostgreSQL 功能 #1：使用 UNLOGGED 表进行缓存

什么是 UNLOGGED？

PostgreSQL 功能 #2：使用 LISTEN/NOTIFY 进行发布/订阅

Redis 发布/订阅

PostgreSQL 发布/订阅

真实世界示例：实时日志流

PostgreSQL 功能 #3：使用 SKIP LOCKED 的任务队列

PostgreSQL 功能 #4：速率限制

PostgreSQL 功能 #5：使用 JSONB 的会话

真实世界基准测试

测试设置

结果

组合操作（真正的优势）

何时保留 Redis

1. 你需要极致性能

2. 你使用 Redis 特定的数据结构

3. 你有独立的缓存层要求

迁移策略

阶段 1：并行运行（第 1 周）

阶段 2：从 Postgres 读取（第 2 周）

阶段 3：只写入 Postgres（第 3 周）

阶段 4：移除 Redis（第 4 周）

代码示例：完整实现

缓存模块（PostgreSQL）

发布/订阅模块

任务队列模块

性能调优技巧

1. 使用连接池

2. 添加适当的索引

3. 调整 PostgreSQL 配置

4. 定期维护

结果：3 个月后

决策矩阵

资源

TL;DR

《高性能mysql》读书笔记

文章目录

第三章 监控

关于存储过程的监控：

第三章监控

第七章高性能索引

🔒 一、`mydumper` —— 安全逻辑备份（适用于 ≤ 500GB 库）

📦 2. 安全备份脚本（`/opt/scripts/mydumper_backup.sh`）

🔒 二、`xtrabackup` —— 安全物理备份（适用于 ≥ 100GB 库）

📦 2. 安全全量备份脚本（`/opt/scripts/xtrabackup_full.sh`）

方案3 CDC捕获关注表同步到本地后查询

方式3 将数据导出后恢复到clickhouse并增量同步