如何快速搭建自用 AI 中转站

你有没有想过,每一次调用大模型,如果经过第三方中转站,你的完整提示词都可能被记录下来?如果会话中包含了敏感信息,一旦被有心人利用,后果不堪设想。

你可能会问:即使不用中转站,最终的模型提供商不也能获取这些信息吗?有必要自己折腾搭建吗?

像 OpenAI 这样的官方大厂也能看到请求内容,但他们的核心盈利模式是提供可靠的 AI 服务,且每天处理海量请求,特意去关注或滥用你个人数据的可能性微乎其微。相比之下,市面上一些非官方中转站价格低廉、用户基数小,为了谋取额外利润,更有可能在数据隐私上动歪心思。

搭建自用中转站不仅能从源头规避隐私泄漏风险,并且作为完全属于你自己的平台,它可以根据个人需求随时定制调整,使用体验更佳。除此之外,你可以将一些免费甚至低价的资源接入中转站,大幅降低使用成本。

废话不多说,我们直接进入正题。

中转站系统怎么选

提到中转站,很多人第一时间会想到 NewAPI

它的功能非常强大,支持各种支付系统,是搭建商业化中转站的不二之选。但对于“自用”这一场景来说,它显得过于沉重了。

CLIProxyAPI

我目前正在使用的方案是:CLIProxyAPI(以下简称 CPA)。

CLIProxyAPI 是一个为 CLI(命令行界面)提供 OpenAI、Gemini、Claude、Codex、Grok 兼容 API 接口的代理服务器。

您可以通过本地或多账户的 CLI 方式,使用任何兼容上述模型接口的客户端或 SDK 进行访问。

核心亮点

CPA 的功能十分丰富,完整的特性列表可以参考 官方文档

对我个人而言,最实用的功能包括:

  • 提供完全兼容 OpenAI / Gemini / Claude 等主流模型的 API 端点
  • 原生支持 OpenAI Codex(GPT 系列)的 OAuth 授权登录
  • 完美支持多模态输入(文本、图片等)
  • 支持多账户池与轮询负载均衡,轻松管理海量账号
  • 极简的 CLI 身份验证流程

极简部署

部署 CPA 非常简单,只需要简单三步:

第一步、准备配置文件 config.yaml(关键项是 remote-management.secret-key

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# 端口号,CLIProxyAPI运行了个HTTP服务器,需要端口号来进行访问
port: 8317

# 远程管理配置,配合EasyCLI或者WebUI来使用
remote-management:
# 启用远程管理的开关,如果你部署在服务器上
# 那么需要设置为true,才能使用EasyCLI或者WebUI连接到CLIProxyAPI进行管理
# 如果只是本地使用API进行管理的,可以保持false不动
allow-remote: false

# 如果想使用EasyCLI或者WebUI通过API对CLIProxyAPI进行管理,必须设置Key
# 如果不设置,视同关闭了API管理功能,就无法使用EasyCLI或者WebUI进行连接了
# 如果你不需要使用EasyCLI或者WebUI进行管理,可以留空
secret-key: ""

# 是否集成WebUI的开关
# 设置为false,可以通过http://YOUR_SERVER_IP:8317/management.html打开WebUI
disable-control-panel: false

# 认证文件存放目录,用于存放 Gemini CLI、Gemini Web、Claude Code、Codex 的认证文件
auth-dir: "~/.cli-proxy-api"

第二步、一键启动服务(建议通过 Docker 方式部署)

1
docker run --rm -p 8317:8317 -v ./config.yaml:/CLIProxyAPI/config.yaml -v ./auth-dir:/root/.cli-proxy-api eceasy/cli-proxy-api:latest

第三步、访问管理 UI 继续配置

启动成功后,浏览器访问 http://localhost:8317/management.html,输入配置文件中的连接密钥,即可进入管理后台,开启你的自用中转站之旅。

CPA 管理页

进阶使用:数据统计与监控

需要注意的是,自 v6.10.0 版本起,CPA 移除了内置的数据统计功能,以保持核心程序的轻量化。如果你需要统计调用请求和成本预估,可以使用周边的扩展项目。

我目前搭配使用的是 CPA-Manager

这是面向 CLIProxyAPI 的完整管理中心,提供请求级监控和费用预估。它可以按账号、模型、渠道、延迟、状态和 token 用量追踪请求记录;支持自定义模型价格与同步 LiteLLM 价格估算费用;提供面向 Codex 账号池的批量巡检、配额识别、异常账号定位及清理功能,非常适合多账号池的日常运维。

构建 Codex 号池

尽管百模大战如火如荼,但目前综合实力最能打的依然是 OpenAI。

CPA 的一大杀器是支持 Codex OAuth 登录,它可以自动获取并保存认证文件,从而无缝代理 GPT 模型请求。更妙的是,即便是免费的 Codex 账号,也拥有一定的高级模型调用额度(如:GPT-5.5、GPT-IMAGE-2)。

粗略估算,大约 10 个免费 Codex 账号的日常调用限额,就足以媲美一个 Plus 订阅号。如果你每天准备几个免费号,组建一个 50 账号规模的号池,完全能够满足绝大多数非重度使用场景。

注:我曾尝试批量注册几百个账号,但大部分被官方风控封禁了。如果你只是为了自用搭建号池,建议低频手动注册少量免费号,或购买少量 Plus 号即可,贵在稳定。

注册方式

注册 OpenAI 账号可以先使用邮箱,等提示了再补手机号;或者一开始就用手机号注册,然后再绑定邮箱。由于风控严重,一个号想要用得久,邮箱和海外手机号基本上都少不了。

邮箱准备

如果你有自己的域名,最优雅的方式是通过 Cloudflare 设置域名邮箱路由。或者花很少的成本在网上购买一些能正常收信的成品 Gmail / Outlook 邮箱,每个邮箱的成本通常在 1 毛钱以内。

接码平台

市面上的接码平台多如牛毛,经过长期测试,我认为比较靠谱且性价比不错的是 HeroSMS

能否成功收到 OpenAI 的验证码,一方面取决于所选地区的号码(通常价格越高的地区成功率越高),另一方面也比较看运气。

其它“免费”资源

除了薅 OpenAI 羊毛之外,也经常有一些厂商会推出免费 Token 活动,比如小米的百万亿 Token 活动,商汤的免费公测等,以及大降价(四舍五入等于不要钱)的 DeepSeek。

通过 CPA 都可以很方便地接入这些厂商,然后根据不同的使用场景选用合适的模型,进一步降低使用成本。