14. 科研辅助

本章场景

Claude Code 在科研工作中能大幅提升效率,但不能替代科研判断。本章聚焦实操场景:读论文、跑实验、写论文、整理数据。

1. 读论文与文献调研

单篇论文精读

> 读一下论文 /papers/attention.pdf,
> 给我一份结构化笔记:
> 1. 一句话总结(他们做了什么)
> 2. 解决什么问题
> 3. 核心方法(配公式)
> 4. 实验设置
> 5. 主要结论
> 6. 我的研究方向可以借鉴的地方
> 7. 我没看懂的地方

批量调研主题

> 我在调研"强化学习在大模型对齐中的应用"。
> 帮我:
> 1. 列出这个领域的 5 个核心子方向
> 2. 每个子方向派一个 agent 调研 3 篇代表论文
> 3. 汇总成一份调研报告,5000 字以内,
>    末尾给我 3 个可能的研究空白

对比多篇论文

> papers/ 目录下有 5 篇关于 X 的论文。
> 请用一个表格对比:方法、数据集、主要结果、可复现性、关键限制。

追踪某个方法的后续工作

> 我读了 Transformer 原始论文,
> 帮我列出 2018-2024 这篇论文被引最高的 3 篇后续工作,
> 分别说它们做了什么改进

2. 代码复现

读开源仓库

> 复现 https://github.com/xxx/paper-code 仓库的实验。
> 1. 给我项目结构导览
> 2. 解释主要模块的作用
> 3. 列出跑通实验需要的环境配置
> 4. 估计需要多少 GPU 时长

处理依赖冲突

> 我按 README 装依赖,但 import 时报错。
> 报错信息是:...
> 帮我看是版本冲突还是环境问题,如何最小化修复。

数据预处理

> raw_data/ 目录下是 100 个 CSV,每个 10 万行。
> 我需要:
> 1. 合并所有文件
> 2. 去掉重复行
> 3. 用 pandas 写一个清洗 pipeline(去空值、标准化日期)
> 4. 输出一份清洗前后的统计对比

3. 实验管理

设计实验

> 我想验证假设:"学习率越大收敛越快但精度越低"。
> 帮我设计 5 组对照实验,跑 MNIST,
> 自动产出 loss 曲线和最终精度对比表。
> 用 PyTorch,代码放到 experiments/lr_sweep/

自动跑实验 + 记录

> 把 experiments/ 下所有 .py 脚本按顺序跑一遍,
> 每跑完一个,把:
> - 开始时间
> - 结束时间
> - exit code
> - stdout 末尾 50 行
> 记录到 experiments_log.md

实验结果分析

> results/ 下是 10 个实验的结果 JSON。
> 帮我:
> 1. 合并成一张表
> 2. 找出最佳超参数组合
> 3. 画一张 loss 曲线对比图(matplotlib)
> 4. 写一段 300 字的实验小结

4. 论文写作

大纲生成

> 我要写一篇关于 [主题] 的会议论文。
> 主题陈述:[一句话]
> 目标会议:[NeurIPS]
> 请帮我设计论文大纲,8 页限制:
> - Abstract 结构
> - Introduction 3 段安排
> - Method 怎么组织
> - Experiments 表格规划
> - Related work 怎么放

改写润色

> 这是我 Introduction 的草稿:
> [贴文本]
> 请:
> 1. 改得更学术化(目标会议 NeurIPS 风格)
> 2. 指出逻辑跳跃的地方
> 3. 列出可能审稿人会问的问题
> **不要**改我的核心论点和实验设计

检查引用一致性

> 全文里我引用了 [1] 到 [27],
> 但有些引用正文里说 "我们采用 XX 的方法" 但括号里的数字不是 [3]。
> 帮我对照 references.bib 和正文,找出不一致的地方。

生成响应审稿人模板

> 审稿人问:"作者没有解释为什么选择 X 而不是 Y"
> 我论文里的相关段落是:[贴文本]
> 帮我写一段 200 字的回复,先感谢审稿人,
> 然后解释原因,引用论文相关部分,最后总结。
> 语气专业但不卑不亢。

5. 数据可视化

学术图表

> 用 matplotlib 画一张柱状图:
> - 数据:不同模型在 GLUE 上的得分
> - 样式:适合论文用,清晰可读
> - 输出:figure.pdf(矢量图)
> - 字体:Times New Roman,字号 10

可交互探索

> 用 plotly 做一个交互式散点图,
> 鼠标悬停显示每个点的详细信息。
> 数据在 results.csv。

6. 学术诚信与边界

✅ 合适的用法

  • 加速样板代码生成
  • 调研文献、整理笔记
  • 检查语法、改写语句
  • 自动化跑实验、整理结果

⚠️ 谨慎使用

  • 写关键论证段落(必须有自己思考)
  • 设计实验(AI 建议可以,决定权在研究者)
  • 选择方法(AI 可能推荐过时的方法)

❌ 不要用 AI 替代

  • 同行评审(必须人工)
  • 实验数据"清洗"出期望的结果(科研不端)
  • 引用 AI 生成的虚假文献

7. 团队协作

给合作者准备材料

> 我刚和合作者开完会,笔记在 notes.md。
> 帮我整理:
> 1. 我们达成共识的 3 件事
> 2. 还需讨论的 2 个问题
> 3. 下周各自的任务(分配到人)
> 4. 下次会议时间

写项目 README

> 我们组做了一个新工具,代码在当前目录。
> 帮我写一份 README,包含:
> - 项目简介(用一段话说清做什么)
> - 安装步骤
> - 快速开始示例
> - API 概览
> - 如何贡献
> - 引用我们工作的 BibTeX

8. 一个完整的研究 Workflow 示例

需求:做一个关于"小样本学习"的小实验,并写一份 4 页的简短报告。

// 阶段 1:调研(便宜模型)
phase('调研')
const papers = await agent(
  `调研近 2 年 few-shot learning 的 5 篇代表论文`,
  { model: 'haiku' }
)

// 阶段 2:实现 baseline(主力模型)
phase('实现')
const baseline = await agent(
  `基于 papers/omniglot.pdf 实现一个 Prototypical Network baseline,
   在 Omniglot 5-way 1-shot 上跑通`,
  { model: 'sonnet' }
)

// 阶段 3:跑实验
phase('跑实验')
const results = await agent(
  `跑 baseline,记录训练 loss 和最终准确率到 results/`,
  { model: 'haiku' }
)

// 阶段 4:分析(主力模型)
phase('分析')
const analysis = await agent(
  `基于 results 分析实验,给出 300 字的结论`,
  { model: 'sonnet' }
)

// 阶段 5:写报告
phase('写报告')
const report = await agent(
  `基于以上所有结果,生成一份 4 页的报告(IEEE 双栏格式),
   包含:摘要、简介、方法、实验、结论`,
  { model: 'sonnet' }
)

return report

下一步