05. 国产大模型简介

本章帮助国内教师在 Claude Code 难以直接访问时,选择合适的国产大模型作为替代或补充。

关于"国产大模型"

在 Claude Code 之前,国内已经有不少优秀的大模型产品。没有"谁最强",只有"谁最适合你的场景"。下面 6 款是当下(2026)国内真实可用的主流产品(其中 4 款明确支持 Claude Code 兼容 API,1 款是 AI 搜索,1 款见下方说明)。

一个澄清

有人可能听过把"某 AI 平台"与 Qwen / DeepSeek / Kimi / GLM 并列作为"国产大模型选项"。这不是一个我能在公开资料中验证其产品形态与 API 接入方式的真实大模型产品。本教程不收录"某 AI 平台"作为推荐项,只列实际可用的。

如果你确实想了解该平台,请直接访问其官网确认它是否提供 Claude Code 兼容的 API 端点。

横向对比一览

模型公司官网编程能力长上下文中文API 价格适合什么
Qwen 3.7阿里云https://tongyi.aliyun.com⭐⭐⭐⭐⭐128K⭐⭐⭐⭐⭐中低综合首选,生态最全
DeepSeek V4深度求索https://www.deepseek.com⭐⭐⭐⭐⭐64K-128K⭐⭐⭐⭐极低性价比之王,适合大量调用
Kimi 2.7月之暗面https://kimi.com⭐⭐⭐⭐128K-200K⭐⭐⭐⭐⭐长文档分析,中文写作
GLM 5.1智谱 AIhttps://www.zhipuai.cn⭐⭐⭐⭐128K⭐⭐⭐⭐⭐学术、政府项目首选
MiniMax M3MiniMaxhttps://MiniMax.io⭐⭐⭐⭐待官方公布⭐⭐⭐⭐⭐待官方公布综合能力强,API 接入方式见下方说明
秘塔 Metaso秘塔科技https://metaso.cn⭐⭐⭐⭐⭐AI 搜索,非通用 LLM

编程能力 ⭐ 数仅为经验性主观评价,实际表现取决于具体子模型(Qwen-Coder、DeepSeek-Coder、GLM-Code 等专门的代码模型在编程上更突出)。V3 时代的模型多已迁移到新版本,旧版本 API 计划在 2026/07 前后下线(以各厂商公告为准)。

1. 通义千问 Qwen(阿里云)

官网:https://tongyi.aliyun.com
开源仓库:https://github.com/QwenLM/Qwen
API 控制台(百炼):https://bailian.console.aliyun.com/

一句话:生态最全,模型系列最广,从手机端到企业级 API 一站式。

主要模型:

  • Qwen3.7-Plus / Max(通用,2026 当前主力)
  • Qwen3.7-Coder(代码专用,接续 Qwen2.5-Coder 的位置)
  • Qwen3-VL(多模态)

API 特点:

  • 兼容 OpenAI 格式
  • 阿里云百炼平台免费额度较大
  • 国内访问速度快

适合:

  • 想要"一个模型干所有事"
  • 已经在用阿里云其他服务
  • 教师/学生有免费额度需求

2. DeepSeek(深度求索)

官网:https://www.deepseek.com
API 文档:https://api-docs.deepseek.com/

一句话:开源、价格屠夫、推理能力强。

主要模型:

  • DeepSeek-V4-Pro(通用,主力)
  • DeepSeek-V4-Flash(轻量,适合高并发)
  • DeepSeek-R 系列(推理专用,带思考过程,沿用至 V4 时代)
  • DeepSeek-Coder(代码,接续 Coder-V2)

API 特点:

  • 兼容 OpenAI 格式
  • 输入 ¥1-2/百万 token,输出 ¥2-8/百万 token(业界最低)
  • 服务器在国内,速度快

适合:

  • 预算敏感的个人/小团队
  • 想要跑大模型推理任务
  • 想要"思考过程"可见(R1 模型)

3. Kimi(月之暗面 Moonshot AI)

官网:https://kimi.com
API 平台:https://platform.moonshot.cn/

一句话:长上下文之王,中文写作优雅。

主要模型:

  • kimi-2.7(2026 主力)
  • moonshot-v1 系列(8K/32K/128K,作为兼容性版本继续提供)

API 特点:

  • 兼容 OpenAI 格式
  • 长上下文是其强项(200K tokens)
  • 中文写作流畅

适合:

  • 读超长论文(整本 PDF 喂进去)
  • 中文润色、写作辅助
  • 学术文献综述

4. GLM 智谱(智谱 AI)

官网:https://www.zhipuai.cn
API 平台(大模型开放平台):https://bigmodel.cn/

一句话:清华系出身,学术资源多,政企项目常用。

主要模型:

  • GLM-5.1 / GLM-5.1-Plus(通用,2026 主力)
  • GLM-5.1-Code(代码)
  • CogVideoX(视频生成,接续前代)

API 特点:

  • 兼容 OpenAI 格式
  • 通过 bigmodel.cn 申请 API Key
  • 学术界口碑好

适合:

  • 在清华、北大等高校场景对接
  • 需要中文语义特别精准的任务
  • 政府/国企项目

5. MiniMax M3(MiniMax)

官网:https://MiniMax.io
API 文档:见官网 Console 入口(官方持续更新中)

一句话:综合能力强,中文与多语言理解俱佳,2026 春季新版本。

主要模型:

  • MiniMax-M3(通用主力,本文编写时是 MiniMax 当前主推的版本)
  • 各厂商常以"X.X"小版本号迭代,具体子模型(轻量/长上下文/代码等)以官方控制台为准

API 特点:

  • 是否提供 Claude Code 兼容的 Anthropic 格式端点(可配 ANTHROPIC_BASE_URL 直接接入),请以官方最新公告为准
  • 在没确认兼容端点前,接入 Claude Code 的稳妥做法仍是上一章的 ccswitch,或用通用 OpenAI 兼容模式

适合:

  • 综合任务(写作、问答、翻译、代码),尤其是中英双语
  • 想要一个"中文友好"的主力模型
  • 关注国产新一代大模型能力的教师/科研用户

关于文档开头的"澄清"段:之前版本里有一句关于"某 AI 平台"的存疑,本文无法确认那段具体指哪个平台。但 MiniMax-M3 与"某 AI 平台"无关——它是有官网(https://MiniMax.io)、有控制台、有可查证产品形态的真实大模型,所以被纳入本对比表。不过**它的 Claude Code 兼容性**需要你在接入前到官网确认最新状态——文档跟不上厂商迭代速度很正常。

6. 秘塔 Metaso(秘塔科技)

官网:https://metaso.cn

重要说明:秘塔是 AI 搜索引擎,不是通用大语言模型。它背后调用其他大模型(可能是自研或第三方),但没有公开的通用 LLM API

特点:

  • 搜索 + AI 总结
  • 中文搜索质量很好
  • 适合做文献调研、资料查找

不能做什么:

  • 不能像 Qwen/DeepSeek 那样直接被 Claude Code 调用
  • 没有 OpenAI 兼容的 chat API

适合:

  • 教师日常查资料、调研
  • 与 Claude Code 互补:用秘塔搜索 → 整理到本地 → 用 Claude Code 处理

7. 怎么选?(决策树)

你是哪类用户?
├─ 个人学习/小项目,预算有限
│   └─ 推荐:DeepSeek V4(价格) 或 Qwen 3.7(免费额度)
├─ 高校教学,要给学生演示
│   └─ 推荐:Qwen 3.7(阿里云学生认证有优惠) 或 GLM 5.1(学术合作)
├─ 科研(长论文/大量文档)
│   └─ 推荐:Kimi 2.7(长上下文)
├─ 中英双语综合任务 / 想试新一代
│   └─ 推荐:MiniMax M3(确认 API 兼容性后)
├─ 已经在用某个云服务
│   └─ 用同一个生态(阿里云→Qwen,清华系→GLM)
└─ 大量批改/批量任务
    └─ 推荐:DeepSeek V4(成本最低)

8. 申请 API Key 的通用步骤

每个平台的流程大同小异:

  1. 访问控制台(各平台链接见上)
  2. 注册/登录账号(通常需手机号实名)
  3. 充值(大部分有免费额度,可先试用)
  4. 创建 API Key
  5. 保存好 Key,不要提交到 Git

9. 怎么接入 Claude Code?

光有 API Key 还不够。Claude Code 默认只认 Anthropic 的 API。怎么把国产模型接到 Claude Code 里?

主流做法:

方案难度适合
ccswitch(下一章)想要"一键切换"Claude Code 后端
直接配 ANTHROPIC_BASE_URL 环境变量⭐⭐用支持 Anthropic 格式的代理服务
claude-code-router 等开源工具⭐⭐⭐想自己搭代理,完全控制

下一章讲 ccswitch,适合不想折腾基础设施的教师。

10. 一个完整的"国产化"教学方案

场景:某教师用 Windows,想让学生用 Claude Code 辅助编程课。

方案:
1. 机房/学生机统一装 Node.js
2. 老师/学生注册一个 DeepSeek 账号(便宜)
3. 装 ccswitch,把后端切到 DeepSeek
4. 学生在 PowerShell 里直接用 `claude` 命令
5. 老师统一在配置文件里限制能调用的模型

详细配置见下一章。

11. 注意事项

  • API Key 安全:不要提交到 Git,不要分享给学生
  • 成本控制:给每个学生用自己的 Key,避免一人刷爆全班的额度
  • 服务条款:部分平台禁止用 API 做商业用途,教学通常没问题
  • 断网备选:建议本地保留 1-2 个开源模型(Qwen3、DeepSeek-V4 都有可本地跑的蒸馏版)以备无网时使用
  • 版本号迭代快:本文版本号截至 2026 年春季。各厂商每年 2-4 次大版本更新,接入前请到官网确认当前主流版本,以及旧版本的下线时间表(例如 DeepSeek V3 系列计划 2026/07/24 下线)

下一步