你的同学可能已经用 Agent 读完了这个领域五年的文献，而你还在 Ctrl+F

两周 vs. 4 小时。

这是我认识的一个社科方向硕士生——姑且叫她小林——在同一个任务上花掉的时间对比。她的开题报告需要梳理"数字平台治理"这个交叉领域近五年的核心文献，横跨传播学、法学、计算机科学三个方向，大约 80 篇论文。

她用了两周：下载 PDF、建 Excel 表格、手动摘抄摘要、在 Zotero 里打标签、最后写出一份 3000 字的综述初稿。

我帮她搭了一套 Agent 工作流之后，同样的任务，4 小时出了初稿框架，覆盖文献数量超过 120 篇。

差距不是来自"AI 更聪明"，而是来自任务执行方式的本质不同。这篇文章，我想把这套方法完整拆给你看。

---

第一章：学界为什么还没反应过来？

大多数研究者对 AI 的使用，还停留在两个场景：润色英文摘要，以及问 ChatGPT 解释一个概念。

这不是他们的问题——这是信息差的问题。

2024 年一项针对学术研究者的调查显示，超过 60% 的受访者表示他们在文献综述阶段"感到严重的信息过载"，但同期使用 AI 工具辅助文献管理的比例不超过 15%。这个剪刀差，就是机会所在。

Semantic Scholar 目前收录了超过 2 亿篇学术论文，每天新增数以万计。没有任何人类研究者能靠人工追踪一个领域的全貌。但很多人的解决方案，依然是"多订几个 RSS"或者"加几个学术群"。

Agent 提供的不是"更快地做同一件事"，而是一种完全不同的信息处理架构。

---

第二章：Agent 和"问 GPT"到底差在哪里？

这是理解后续所有内容的基础，我多花一点篇幅讲清楚。

单轮问答：你问一句，它答一句

你打开 ChatGPT，粘贴一段摘要，问"这篇论文的核心观点是什么"——它回答你。这是单轮问答，本质是一个很强的文本处理器。

问题在于：它没有记忆，没有主动性，不会自己去找下一篇相关文献，不会把你上一个问题的答案和这一个做交叉比对。你关掉对话框，一切清零。

Agent：三层结构，自主执行多步骤任务

Agent 的核心在于三个能力的组合：

工具调用：它可以调用外部工具——搜索引擎、学术数据库 API、PDF 解析器、笔记软件接口
记忆：它能把中间结果存下来，作为下一步的输入
规划：给定一个目标，它能自己拆解成多个子任务并依次执行

用一个类比：单轮 GPT 是一个很聪明的图书馆员，你问什么它答什么。Agent 是一个会主动帮你制定阅读计划、去书架上取书、做读书笔记、最后交给你一份综合报告的研究助理。

手动流程：
你 → 搜索 → 下载 → 阅读 → 摘录 → 分类 → 写综述
（每一步都是你在执行）

Agent 流程：
你 → 给出目标 → Agent（搜索 + 下载 + 阅读 + 摘录 + 分类）→ 你审核 → 写综述
（你只在起点和关键节点介入）

这就是为什么小林的任务可以从两周压缩到 4 小时——她把执行层交给了 Agent，把判断层留给了自己。

---

第三章：文献综述完整流程（可落地版）

我们分四步走，每步给出具体的 Prompt 模板和工具选择。

Step 1：选题关键词拆解

在开始检索之前，最容易犯的错误是关键词太宽泛。"数字平台治理"这五个字，丢进 Google Scholar 会返回几十万条结果，没有意义。

Prompt 模板 A：关键词拆解

你是一个学术研究助手。我的研究方向是：[填入你的研究主题]。

请帮我完成以下任务：
1. 将这个主题拆解为 3-5 个核心子议题
2. 为每个子议题列出 3-5 个英文检索关键词（包括同义词和近义词）
3. 标注每个关键词在以下数据库中的适用性：Google Scholar / Semantic Scholar / Web of Science
4. 建议一个关键词组合的检索式（使用 AND/OR/NOT 逻辑）

输出格式：表格形式，包含"子议题 / 关键词 / 适用数据库 / 优先级"四列。

⚠️ 人工介入节点：检查 Agent 给出的关键词是否覆盖了你所在学科的特有术语。跨学科研究中，同一概念在不同领域可能有完全不同的表达方式。

Step 2：批量抓取摘要

关键词确定后，推荐使用以下工具组合：

如果你想跑通自建 Agent 方案，需要调用 OpenAI 或 Claude 的 API。国内直连的稳定方案可以用 [api.884819.xyz](https://api.884819.xyz)，支持主流模型，按量计费，新用户注册即送体验 token，对于偶尔跑一次文献综述的研究者来说，成本基本可以忽略不计。

进阶选项：用 Python 批量提取摘要

import requests

Semantic Scholar 开放 API，无需注册即可调用（有速率限制）
def fetch_abstracts(keywords, limit=50):
"""
批量抓取关键词相关论文的摘要
keywords: 检索关键词字符串
limit: 返回论文数量上限
"""
base_url = "https://api.semanticscholar.org/graph/v1/paper/search"

params = {
"query": keywords,
"limit": limit,
"fields": "title,abstract,year,authors,citationCount"
}

response = requests.get(base_url, params=params)
papers = response.json().get("data", [])

# 过滤掉没有摘要的论文
results = [p for p in papers if p.get("abstract")]

# 格式化输出，方便后续喂给 LLM
for paper in results:
print(f"标题：{paper['title']}")
print(f"年份：{paper['year']} | 引用数：{paper['citationCount']}")
print(f"摘要：{paper['abstract'][:200]}...")
print("---")

return results

使用示例
papers = fetch_abstracts("digital platform governance regulation", limit=30)

Step 3：Agent 分类归纳

把抓取到的摘要列表喂给 Agent，让它做初步分类。

Prompt 模板 B：文献分类归纳

以下是 [数量] 篇论文的标题和摘要列表。

[粘贴论文列表]

请完成以下任务：
1. 将这些文献归类为 4-6 个研究主题簇，并为每个簇命名
2. 识别每个主题簇的代表性论文（引用最多或观点最具代表性）
3. 标注不同主题簇之间的关联关系（哪些簇存在理论对话或方法借鉴）
4. 指出明显缺失的研究角度（根据现有文献判断哪些问题尚未被充分讨论）

输出格式：先给出分类结构，再逐一说明每个簇的核心论点。

Step 4：生成综述框架草稿

⚠️ 人工介入节点：这一步的输出只是框架，不是最终综述。Agent 给出的结构可能过于平铺，缺乏你自己的研究问题意识。你需要在这个框架上，注入你的研究视角。

Prompt 模板 C：综述框架生成

基于以上文献分类结果，请为我生成一份学术文献综述的框架草稿。

我的研究问题是：[填入你的核心研究问题]
目标读者：[填入，如"传播学领域的审稿人"]
综述篇幅要求：约 [字数] 字

请生成：
1. 综述的引言段落（指出该领域的研究现状和争论焦点）
2. 正文各节的标题和每节的核心论述方向（2-3 句话概括）
3. 每节引用的关键文献（从我提供的列表中选取）
4. 结语段落（指出研究空白，引出我的研究贡献）

注意：请保持学术写作的客观性，不要使用过于绝对的表述。

---

第四章：单篇论文深度拆解流程

文献综述处理的是"广度"，而读一篇核心论文，需要的是"深度"。面对一篇 40 页的顶会论文，很多人的策略是"先看摘要，有空再读全文"——结果就是永远没有"有空"的时候。

Agent 可以帮你建立一个四层拆解框架：

层一：结构速读

Prompt：
请阅读以下论文的摘要、引言和结论部分，提取：
1. 研究问题（一句话）
2. 核心贡献（列出 3 点）
3. 主要实验设置（数据集、评估指标）
4. 核心结论（量化结果 + 定性判断）

[粘贴对应章节文本]

层二：方法论深挖

Prompt：
基于以上速读结果，请深入分析这篇论文的研究方法：
1. 方法的理论假设是什么？这些假设是否被明确说明？
2. 与同类方法相比，这个方法的创新点在哪里？
3. 实验设计是否存在潜在的混淆变量？
4. 结论的可推广性如何？（适用范围的边界在哪里）

层三：局限性和反驳点提取

这一层是很多人忽略的，但对于写综述和做研究设计至关重要。

Prompt：
请站在批判性读者的角度，分析这篇论文：
1. 作者自己承认的局限性（论文中明确提及的）
2. 作者没有提及但你认为存在的潜在问题
3. 如果要反驳这篇论文的核心结论，最有力的论据是什么？
4. 这篇论文最适合被哪类后续研究引用？（指出它适合作为哪类论点的支撑）

层四：关联映射（与已读文献对比）

Prompt：
我已经读过以下论文：[列出已读文献标题]
请将这篇新论文与上述文献进行关联分析：
1. 与哪篇文献存在直接的理论对话？（支持或反驳）
2. 在研究方法上与哪篇文献最接近？差异在哪里？
3. 这篇论文如何填补或改变了我已有的文献地图？

输出格式：生成一张结构化笔记卡片，可以直接粘贴到 Notion/Obsidian。

小林用这套流程处理了她领域里最难啃的 8 篇核心论文，每篇平均花了 20 分钟（之前她需要 2-3 小时）。更重要的是，她第一次清楚地看到了这些论文之间的理论脉络——这是之前零散阅读时很难建立的全局感。

---

第五章：避坑指南——Agent 不是全能的

我必须在这里踩一脚刹车。

Agent 会犯错，而且犯的错有时候很隐蔽：

错误类型一：幻觉引用

Agent 可能会捏造一篇听起来很真实的论文——作者名、期刊名、年份都有，但这篇论文根本不存在。这在文献综述场景里是灾难性的。

硬性核查规则 1：所有 Agent 给出的参考文献，必须在 Google Scholar 或 Semantic Scholar 上逐一验证存在性。没有例外。 错误类型二：过度总结，丢失细节

Agent 擅长提炼主干，但会丢掉很多重要的细节——作者的限定语、数据的适用范围、方法的前提假设。这些细节在引用时至关重要。

硬性核查规则 2：任何你打算直接引用到论文中的观点，必须回到原文段落核对，不能只依赖 Agent 的摘要。 错误类型三：跨语言混合文献的理解偏差

如果你的文献库里有中英文混合的情况，Agent 在做交叉比对时可能会产生概念错位——同一个中文术语在英文文献中可能有多种对应词，Agent 不一定能准确识别。

硬性核查规则 3：跨语言文献的对比分析，需要人工确认核心概念的对应关系。 目前不适合 Agent 独立完成的任务：

需要访问付费数据库全文（JSTOR、Web of Science 全文）的任务
需要深度理解学科隐性知识的任务（比如某个理论在学界的争议背景）
最终的综述写作——那是你的声音，不是 Agent 的

---

结语：Agent 帮你搬砖，你才是决定盖什么房子的人

文献综述从来不只是信息整理，它是你和一个学术共同体的对话。

你在综述里做的每一个分类决策，每一个"这个方向研究不足"的判断，每一处"这两篇论文其实在争论同一个问题"的洞察——这些都是你作为研究者的思维在起作用，Agent 替代不了。

Agent 能帮你做的，是把你从那些本不应该消耗你认知资源的重复性工作中解放出来：搜索、下载、摘录、初步分类。这些工作占据了研究者大量时间，但对研究本身的贡献几乎为零。

把这些交出去，把精力留给真正需要你判断的地方——这不是偷懒，这是升维思考的前提。

本文所有 Prompt 模板均在 GPT-5.1 和 Claude Sonnet 4.6 上测试通过，如果你需要 API 接入方式，可以访问 [api.884819.xyz](https://api.884819.xyz)，注册即送体验 token，国产模型（Deepseek/千问等）完全免费，没有月租，按量付费。

---