05. 国产大模型简介
本章帮助国内教师在 Claude Code 难以直接访问时,选择合适的国产大模型作为替代或补充。
关于"国产大模型"
在 Claude Code 之前,国内已经有不少优秀的大模型产品。没有"谁最强",只有"谁最适合你的场景"。下面 6 款是当下(2026)国内真实可用的主流产品(其中 4 款明确支持 Claude Code 兼容 API,1 款是 AI 搜索,1 款见下方说明)。
一个澄清
有人可能听过把"某 AI 平台"与 Qwen / DeepSeek / Kimi / GLM 并列作为"国产大模型选项"。这不是一个我能在公开资料中验证其产品形态与 API 接入方式的真实大模型产品。本教程不收录"某 AI 平台"作为推荐项,只列实际可用的。
如果你确实想了解该平台,请直接访问其官网确认它是否提供 Claude Code 兼容的 API 端点。
横向对比一览
| 模型 | 公司 | 官网 | 编程能力 | 长上下文 | 中文 | API 价格 | 适合什么 |
|---|---|---|---|---|---|---|---|
| Qwen 3.7 | 阿里云 | https://tongyi.aliyun.com | ⭐⭐⭐⭐⭐ | 128K | ⭐⭐⭐⭐⭐ | 中低 | 综合首选,生态最全 |
| DeepSeek V4 | 深度求索 | https://www.deepseek.com | ⭐⭐⭐⭐⭐ | 64K-128K | ⭐⭐⭐⭐ | 极低 | 性价比之王,适合大量调用 |
| Kimi 2.7 | 月之暗面 | https://kimi.com | ⭐⭐⭐⭐ | 128K-200K | ⭐⭐⭐⭐⭐ | 中 | 长文档分析,中文写作 |
| GLM 5.1 | 智谱 AI | https://www.zhipuai.cn | ⭐⭐⭐⭐ | 128K | ⭐⭐⭐⭐⭐ | 中 | 学术、政府项目首选 |
| MiniMax M3 | MiniMax | https://MiniMax.io | ⭐⭐⭐⭐ | 待官方公布 | ⭐⭐⭐⭐⭐ | 待官方公布 | 综合能力强,API 接入方式见下方说明 |
| 秘塔 Metaso | 秘塔科技 | https://metaso.cn | — | — | ⭐⭐⭐⭐⭐ | — | AI 搜索,非通用 LLM |
编程能力 ⭐ 数仅为经验性主观评价,实际表现取决于具体子模型(Qwen-Coder、DeepSeek-Coder、GLM-Code 等专门的代码模型在编程上更突出)。V3 时代的模型多已迁移到新版本,旧版本 API 计划在 2026/07 前后下线(以各厂商公告为准)。
1. 通义千问 Qwen(阿里云)
官网:https://tongyi.aliyun.com
开源仓库:https://github.com/QwenLM/Qwen
API 控制台(百炼):https://bailian.console.aliyun.com/
一句话:生态最全,模型系列最广,从手机端到企业级 API 一站式。
主要模型:
- Qwen3.7-Plus / Max(通用,2026 当前主力)
- Qwen3.7-Coder(代码专用,接续 Qwen2.5-Coder 的位置)
- Qwen3-VL(多模态)
API 特点:
- 兼容 OpenAI 格式
- 阿里云百炼平台免费额度较大
- 国内访问速度快
适合:
- 想要"一个模型干所有事"
- 已经在用阿里云其他服务
- 教师/学生有免费额度需求
2. DeepSeek(深度求索)
官网:https://www.deepseek.com
API 文档:https://api-docs.deepseek.com/
一句话:开源、价格屠夫、推理能力强。
主要模型:
- DeepSeek-V4-Pro(通用,主力)
- DeepSeek-V4-Flash(轻量,适合高并发)
- DeepSeek-R 系列(推理专用,带思考过程,沿用至 V4 时代)
- DeepSeek-Coder(代码,接续 Coder-V2)
API 特点:
- 兼容 OpenAI 格式
- 输入 ¥1-2/百万 token,输出 ¥2-8/百万 token(业界最低)
- 服务器在国内,速度快
适合:
- 预算敏感的个人/小团队
- 想要跑大模型推理任务
- 想要"思考过程"可见(R1 模型)
3. Kimi(月之暗面 Moonshot AI)
官网:https://kimi.com
API 平台:https://platform.moonshot.cn/
一句话:长上下文之王,中文写作优雅。
主要模型:
- kimi-2.7(2026 主力)
- moonshot-v1 系列(8K/32K/128K,作为兼容性版本继续提供)
API 特点:
- 兼容 OpenAI 格式
- 长上下文是其强项(200K tokens)
- 中文写作流畅
适合:
- 读超长论文(整本 PDF 喂进去)
- 中文润色、写作辅助
- 学术文献综述
4. GLM 智谱(智谱 AI)
官网:https://www.zhipuai.cn
API 平台(大模型开放平台):https://bigmodel.cn/
一句话:清华系出身,学术资源多,政企项目常用。
主要模型:
- GLM-5.1 / GLM-5.1-Plus(通用,2026 主力)
- GLM-5.1-Code(代码)
- CogVideoX(视频生成,接续前代)
API 特点:
- 兼容 OpenAI 格式
- 通过 bigmodel.cn 申请 API Key
- 学术界口碑好
适合:
- 在清华、北大等高校场景对接
- 需要中文语义特别精准的任务
- 政府/国企项目
5. MiniMax M3(MiniMax)
官网:https://MiniMax.io
API 文档:见官网 Console 入口(官方持续更新中)
一句话:综合能力强,中文与多语言理解俱佳,2026 春季新版本。
主要模型:
- MiniMax-M3(通用主力,本文编写时是 MiniMax 当前主推的版本)
- 各厂商常以"X.X"小版本号迭代,具体子模型(轻量/长上下文/代码等)以官方控制台为准
API 特点:
- 是否提供 Claude Code 兼容的 Anthropic 格式端点(可配
ANTHROPIC_BASE_URL直接接入),请以官方最新公告为准 - 在没确认兼容端点前,接入 Claude Code 的稳妥做法仍是上一章的 ccswitch,或用通用 OpenAI 兼容模式
适合:
- 综合任务(写作、问答、翻译、代码),尤其是中英双语
- 想要一个"中文友好"的主力模型
- 关注国产新一代大模型能力的教师/科研用户
关于文档开头的"澄清"段:之前版本里有一句关于"某 AI 平台"的存疑,本文无法确认那段具体指哪个平台。但 MiniMax-M3 与"某 AI 平台"无关——它是有官网(https://MiniMax.io)、有控制台、有可查证产品形态的真实大模型,所以被纳入本对比表。不过**它的 Claude Code 兼容性**需要你在接入前到官网确认最新状态——文档跟不上厂商迭代速度很正常。
6. 秘塔 Metaso(秘塔科技)
重要说明:秘塔是 AI 搜索引擎,不是通用大语言模型。它背后调用其他大模型(可能是自研或第三方),但没有公开的通用 LLM API。
特点:
- 搜索 + AI 总结
- 中文搜索质量很好
- 适合做文献调研、资料查找
不能做什么:
- 不能像 Qwen/DeepSeek 那样直接被 Claude Code 调用
- 没有 OpenAI 兼容的 chat API
适合:
- 教师日常查资料、调研
- 与 Claude Code 互补:用秘塔搜索 → 整理到本地 → 用 Claude Code 处理
7. 怎么选?(决策树)
你是哪类用户?
├─ 个人学习/小项目,预算有限
│ └─ 推荐:DeepSeek V4(价格) 或 Qwen 3.7(免费额度)
├─ 高校教学,要给学生演示
│ └─ 推荐:Qwen 3.7(阿里云学生认证有优惠) 或 GLM 5.1(学术合作)
├─ 科研(长论文/大量文档)
│ └─ 推荐:Kimi 2.7(长上下文)
├─ 中英双语综合任务 / 想试新一代
│ └─ 推荐:MiniMax M3(确认 API 兼容性后)
├─ 已经在用某个云服务
│ └─ 用同一个生态(阿里云→Qwen,清华系→GLM)
└─ 大量批改/批量任务
└─ 推荐:DeepSeek V4(成本最低)
8. 申请 API Key 的通用步骤
每个平台的流程大同小异:
- 访问控制台(各平台链接见上)
- 注册/登录账号(通常需手机号实名)
- 充值(大部分有免费额度,可先试用)
- 创建 API Key
- 保存好 Key,不要提交到 Git
9. 怎么接入 Claude Code?
光有 API Key 还不够。Claude Code 默认只认 Anthropic 的 API。怎么把国产模型接到 Claude Code 里?
主流做法:
| 方案 | 难度 | 适合 |
|---|---|---|
| ccswitch(下一章) | ⭐ | 想要"一键切换"Claude Code 后端 |
直接配 ANTHROPIC_BASE_URL 环境变量 | ⭐⭐ | 用支持 Anthropic 格式的代理服务 |
| claude-code-router 等开源工具 | ⭐⭐⭐ | 想自己搭代理,完全控制 |
下一章讲 ccswitch,适合不想折腾基础设施的教师。
10. 一个完整的"国产化"教学方案
场景:某教师用 Windows,想让学生用 Claude Code 辅助编程课。
方案:
1. 机房/学生机统一装 Node.js
2. 老师/学生注册一个 DeepSeek 账号(便宜)
3. 装 ccswitch,把后端切到 DeepSeek
4. 学生在 PowerShell 里直接用 `claude` 命令
5. 老师统一在配置文件里限制能调用的模型
详细配置见下一章。
11. 注意事项
- API Key 安全:不要提交到 Git,不要分享给学生
- 成本控制:给每个学生用自己的 Key,避免一人刷爆全班的额度
- 服务条款:部分平台禁止用 API 做商业用途,教学通常没问题
- 断网备选:建议本地保留 1-2 个开源模型(Qwen3、DeepSeek-V4 都有可本地跑的蒸馏版)以备无网时使用
- 版本号迭代快:本文版本号截至 2026 年春季。各厂商每年 2-4 次大版本更新,接入前请到官网确认当前主流版本,以及旧版本的下线时间表(例如 DeepSeek V3 系列计划 2026/07/24 下线)
下一步
- 想用 ccswitch 切换后端 → 06. ccswitch 配置国产大模型
- 想知道 Claude Code 路由原理 → 06. ccswitch 配置国产大模型 第一部分