14. 科研辅助
本章场景
Claude Code 在科研工作中能大幅提升效率,但不能替代科研判断。本章聚焦实操场景:读论文、跑实验、写论文、整理数据。
1. 读论文与文献调研
单篇论文精读
> 读一下论文 /papers/attention.pdf,
> 给我一份结构化笔记:
> 1. 一句话总结(他们做了什么)
> 2. 解决什么问题
> 3. 核心方法(配公式)
> 4. 实验设置
> 5. 主要结论
> 6. 我的研究方向可以借鉴的地方
> 7. 我没看懂的地方
批量调研主题
> 我在调研"强化学习在大模型对齐中的应用"。
> 帮我:
> 1. 列出这个领域的 5 个核心子方向
> 2. 每个子方向派一个 agent 调研 3 篇代表论文
> 3. 汇总成一份调研报告,5000 字以内,
> 末尾给我 3 个可能的研究空白
对比多篇论文
> papers/ 目录下有 5 篇关于 X 的论文。
> 请用一个表格对比:方法、数据集、主要结果、可复现性、关键限制。
追踪某个方法的后续工作
> 我读了 Transformer 原始论文,
> 帮我列出 2018-2024 这篇论文被引最高的 3 篇后续工作,
> 分别说它们做了什么改进
2. 代码复现
读开源仓库
> 复现 https://github.com/xxx/paper-code 仓库的实验。
> 1. 给我项目结构导览
> 2. 解释主要模块的作用
> 3. 列出跑通实验需要的环境配置
> 4. 估计需要多少 GPU 时长
处理依赖冲突
> 我按 README 装依赖,但 import 时报错。
> 报错信息是:...
> 帮我看是版本冲突还是环境问题,如何最小化修复。
数据预处理
> raw_data/ 目录下是 100 个 CSV,每个 10 万行。
> 我需要:
> 1. 合并所有文件
> 2. 去掉重复行
> 3. 用 pandas 写一个清洗 pipeline(去空值、标准化日期)
> 4. 输出一份清洗前后的统计对比
3. 实验管理
设计实验
> 我想验证假设:"学习率越大收敛越快但精度越低"。
> 帮我设计 5 组对照实验,跑 MNIST,
> 自动产出 loss 曲线和最终精度对比表。
> 用 PyTorch,代码放到 experiments/lr_sweep/
自动跑实验 + 记录
> 把 experiments/ 下所有 .py 脚本按顺序跑一遍,
> 每跑完一个,把:
> - 开始时间
> - 结束时间
> - exit code
> - stdout 末尾 50 行
> 记录到 experiments_log.md
实验结果分析
> results/ 下是 10 个实验的结果 JSON。
> 帮我:
> 1. 合并成一张表
> 2. 找出最佳超参数组合
> 3. 画一张 loss 曲线对比图(matplotlib)
> 4. 写一段 300 字的实验小结
4. 论文写作
大纲生成
> 我要写一篇关于 [主题] 的会议论文。
> 主题陈述:[一句话]
> 目标会议:[NeurIPS]
> 请帮我设计论文大纲,8 页限制:
> - Abstract 结构
> - Introduction 3 段安排
> - Method 怎么组织
> - Experiments 表格规划
> - Related work 怎么放
改写润色
> 这是我 Introduction 的草稿:
> [贴文本]
> 请:
> 1. 改得更学术化(目标会议 NeurIPS 风格)
> 2. 指出逻辑跳跃的地方
> 3. 列出可能审稿人会问的问题
> **不要**改我的核心论点和实验设计
检查引用一致性
> 全文里我引用了 [1] 到 [27],
> 但有些引用正文里说 "我们采用 XX 的方法" 但括号里的数字不是 [3]。
> 帮我对照 references.bib 和正文,找出不一致的地方。
生成响应审稿人模板
> 审稿人问:"作者没有解释为什么选择 X 而不是 Y"
> 我论文里的相关段落是:[贴文本]
> 帮我写一段 200 字的回复,先感谢审稿人,
> 然后解释原因,引用论文相关部分,最后总结。
> 语气专业但不卑不亢。
5. 数据可视化
学术图表
> 用 matplotlib 画一张柱状图:
> - 数据:不同模型在 GLUE 上的得分
> - 样式:适合论文用,清晰可读
> - 输出:figure.pdf(矢量图)
> - 字体:Times New Roman,字号 10
可交互探索
> 用 plotly 做一个交互式散点图,
> 鼠标悬停显示每个点的详细信息。
> 数据在 results.csv。
6. 学术诚信与边界
✅ 合适的用法
- 加速样板代码生成
- 调研文献、整理笔记
- 检查语法、改写语句
- 自动化跑实验、整理结果
⚠️ 谨慎使用
- 写关键论证段落(必须有自己思考)
- 设计实验(AI 建议可以,决定权在研究者)
- 选择方法(AI 可能推荐过时的方法)
❌ 不要用 AI 替代
- 同行评审(必须人工)
- 实验数据"清洗"出期望的结果(科研不端)
- 引用 AI 生成的虚假文献
7. 团队协作
给合作者准备材料
> 我刚和合作者开完会,笔记在 notes.md。
> 帮我整理:
> 1. 我们达成共识的 3 件事
> 2. 还需讨论的 2 个问题
> 3. 下周各自的任务(分配到人)
> 4. 下次会议时间
写项目 README
> 我们组做了一个新工具,代码在当前目录。
> 帮我写一份 README,包含:
> - 项目简介(用一段话说清做什么)
> - 安装步骤
> - 快速开始示例
> - API 概览
> - 如何贡献
> - 引用我们工作的 BibTeX
8. 一个完整的研究 Workflow 示例
需求:做一个关于"小样本学习"的小实验,并写一份 4 页的简短报告。
// 阶段 1:调研(便宜模型)
phase('调研')
const papers = await agent(
`调研近 2 年 few-shot learning 的 5 篇代表论文`,
{ model: 'haiku' }
)
// 阶段 2:实现 baseline(主力模型)
phase('实现')
const baseline = await agent(
`基于 papers/omniglot.pdf 实现一个 Prototypical Network baseline,
在 Omniglot 5-way 1-shot 上跑通`,
{ model: 'sonnet' }
)
// 阶段 3:跑实验
phase('跑实验')
const results = await agent(
`跑 baseline,记录训练 loss 和最终准确率到 results/`,
{ model: 'haiku' }
)
// 阶段 4:分析(主力模型)
phase('分析')
const analysis = await agent(
`基于 results 分析实验,给出 300 字的结论`,
{ model: 'sonnet' }
)
// 阶段 5:写报告
phase('写报告')
const report = await agent(
`基于以上所有结果,生成一份 4 页的报告(IEEE 双栏格式),
包含:摘要、简介、方法、实验、结论`,
{ model: 'sonnet' }
)
return report
下一步
- 想用在课程设计上 → 15. 课程设计与作业批改
- 想培养学生 AI 协作能力 → 16. 学生能力培养