本文最后更新于 2026-04-06，文章内容可能已经过时。

告别手动复制！用 Gemini 3.1 Flash 一键提取百份 PDF，打工人的自动化救星

又到了月末报销、期末查文献、或者是季度复盘的时候了。

看着电脑桌面上新建文件夹里堆满的几十份 PDF（财报、行业研报、发票扫描件、全英文文献），你的第一反应是什么？是不是熟练地双击打开，然后开始机械地 Ctrl+C 和 Ctrl+V？

别再像个机器人一样干活了！在 AI 时代，手动处理结构化文档无异于在“数字血汗工厂”里拧螺丝。传统的 PDF 解析工具（比如各种老旧的 OCR 软件）不仅经常出现令人崩溃的乱码，而且遇到跨页表格和复杂排版时，直接原地罢工。

今天，我们要请出目前大模型领域的“效率与性价比之王”——Gemini 3.1 Flash。

凭借其原生多模态能力、超大上下文窗口以及快到飞起的推理速度，它能瞬间榨干成百上千份 PDF 的价值。看完这篇文章，无论是零代码基础的小白，还是懂点 Python 的进阶玩家，都能建立一套属于自己的“PDF 自动化处理流水线”。

---

小白福音：免写代码的“半自动”极速玩法

如果你不想碰任何代码，完全没问题。我们可以利用现成的 AI 客户端，直接体验效率飞升的爽感。

很多同学不知道，在 8848AI 平台的内置对话界面中，你可以直接把 PDF 文件拖拽进去喂给模型。Gemini 3.1 Flash 的超长上下文能力，让它能够轻松“吞”下整本几十页的报告，并在几秒钟内给出精准回答。

为了让你立刻上手，我总结了 3 个可以直接套用的“万能 Prompt（提示词）模板”：

1. 核心观点提炼（适用于长篇研报/学术论文）

Prompt:

"你现在是一位资深的行业分析师。请阅读这份附件中的 PDF 报告，并以结构化的方式输出以下内容：

1. 用 3 句话总结这篇报告的核心结论；

2. 列出报告中提到的 3 个最重要的数据指标及其含义；

3. 提取作者对未来趋势的预测。

请用通俗易懂的语言表达，不要遗漏关键信息。"

2. 跨文件对比分析（适用于对比两份财报/竞品手册）

Prompt:

"附件是 A 公司和 B 公司的最新季度财报。请作为财务专家，帮我对比这两份文件：

1. 找出两家公司在'主营业务收入'和'净利润'上的具体数据差异；

2. 分析两家公司在'研发投入'方向上的不同侧重点；

3. 最终输出一个 Markdown 格式的对比表格。"

3. 关键信息提取（适用于发票/简历/合同）

Prompt:

"附件是一份商业合同扫描件。请提取以下关键字段：

- 甲方名称

- 乙方名称

- 合同总金额（阿拉伯数字）

- 违约责任条款的简要概括

如果文件中没有某项信息，请严格回复'未找到'，不要自行编造。"

只要把文件一拖，把提示词一粘，原本需要半小时才能看完的文档，Gemini 3.1 Flash 在 10 秒内就能把精华喂到你嘴边。

---

进阶实战：Python 脚本实现 100 份 PDF 全自动批处理

“手动拖拽 5 份 PDF 还行，如果老板给了我 100 份文件，难道我要拖 100 次吗？”

问得好！真正的极客，绝不重复劳动。接下来是本文的硬核部分：我们将用几十行 Python 代码，实现“遍历本地文件夹 -> 批量喂给 Gemini 3.1 Flash -> 提取指定信息 -> 自动导出为 Excel/CSV 表格”的完整闭环。

痛点切入：如何搞定稳定且高速的 API？

众所周知，直接申请和调用海外官方 API 经常会遇到网络超时（Connection Timeout），或者因为没有海外信用卡无法绑卡升级额度，导致脚本跑一半就崩溃。

为了保证我们的批量脚本在国内网络下也能极速、稳定地跑完，强烈建议大家使用国内直连的 API 服务。老读者都知道，我一直在用 8848AI (api.884819.xyz)。

它对开发者极度友好：

1. 注册极简：只需用户名+密码即可注册，连邮箱验证都省了。

2. 完全兼容：完美兼容 OpenAI 的接口协议，原有的代码只需改一行 base_url 就能无缝切换。

3. 性价比极高：注册即送 5 元体验额度。没有任何月租和订阅套路，纯按量付费。而且，如果你想测试国产模型（如 Deepseek R1/V3、通义千问 Qwen3），在 8848AI 上是完全免费的！

Copy-Paste 级实战代码

确保你已经安装了必要的 Python 库（pip install openai pdfplumber tqdm）。获取到 8848AI 的 API Key 后，直接复制以下代码运行：

import os
import csv
import pdfplumber
from openai import OpenAI
from tqdm import tqdm

配置 8848AI 的 API 信息 (国内直连推荐配置)
client = OpenAI(
api_key="你的_8848AI_API_KEY",
base_url="https://api.884819.xyz/v1"
)

定义文件夹路径
PDF_DIR = "./my_pdfs"
OUTPUT_CSV = "extracted_data.csv"

def extract_text_from_pdf(pdf_path):
"""从 PDF 中提取文本"""
text = ""
try:
with pdfplumber.open(pdf_path) as pdf:
for page in pdf.pages:
text += page.extract_text() + "\n"
except Exception as e:
print(f"读取 {pdf_path} 失败: {e}")
return text[:20000] # 截取前两万字，避免单文件过大

def process_with_gemini(text):
"""调用 Gemini 3.1 Flash 提取信息"""
prompt = """
请从以下文本中提取关键信息，并严格按照以下格式返回（不要有任何多余的废话）：
公司名称 | 融资金额 | 核心业务

如果找不到，请填入 "未找到"。
文本内容如下：
""" + text

try:
response = client.chat.completions.create(
model="gemini-3.1-flash", # 指定使用速度最快的 Gemini 3.1 Flash
messages=[
{"role": "system", "content": "你是一个精准的数据提取机器人。"},
{"role": "user", "content": prompt}
],
temperature=0.1 # 降低温度，保证输出的稳定性
)
return response.choices[0].message.content.strip()
except Exception as e:
return f"API调用失败 | {e} | Error"

def main():
# 获取所有 PDF 文件
pdf_files = [f for f in os.listdir(PDF_DIR) if f.endswith('.pdf')]
if not pdf_files:
print("未找到 PDF 文件！")
return

# 准备写入 CSV
with open(OUTPUT_CSV, 'w', newline='', encoding='utf-8-sig') as f:
writer = csv.writer(f)
writer.writerow(["文件名", "公司名称", "融资金额", "核心业务"])

# 使用 tqdm 显示高大上的进度条
print(f"开始处理 {len(pdf_files)} 份 PDF 文件...")
for filename in tqdm(pdf_files):
file_path = os.path.join(PDF_DIR, filename)

# 1. 提取文本
pdf_text = extract_text_from_pdf(file_path)

if pdf_text.strip():
# 2. 喂给 Gemini 3.1 Flash
ai_result = process_with_gemini(pdf_text)
# 3. 解析结果并写入
result_parts = [part.strip() for part in ai_result.split('|')]
if len(result_parts) == 3:
writer.writerow([filename] + result_parts)
else:
writer.writerow([filename, "格式错误", "格式错误", ai_result])
else:
writer.writerow([filename, "文本为空", "文本为空", "文本为空"])

print(f"\n处理完成！数据已保存至 {OUTPUT_CSV}")

if __name__ == "__main__":
main()

当你运行这段代码时，你会看到终端里出现一个极具掌控感的进度条。仅仅去泡杯咖啡的功夫，100 份 PDF 的核心数据就已经被整整齐齐地提取到了 Excel 表格中。这，就是技术带来的生产力碾压。

---

高阶避坑：如何让 AI 乖乖听话？

在批量处理时，最怕的就是 AI 突然“加戏”或者产生幻觉。这里分享两个进阶小技巧：

1. 强制结构化输出 (JSON 格式)

如果你需要将提取的数据存入数据库，千万不要让 AI 输出纯文本。在提示词中明确要求：“请严格输出 JSON 格式，包含 company_name, amount, business 三个字段，不要包含任何 Markdown 标记或解释性文字。” 配合 Gemini 3.1 Flash 强大的指令遵循能力，你可以获得 100% 完美的机器可读数据。

2. 设定“拒绝回答”机制

为了防止 AI 产生幻觉（编造数据），一定要在 Prompt 中加上一句护城河指令：“如果文档中未提及该信息，请严格输出 NULL，绝对禁止根据你的常识进行推测。”

---

结语与预告

今天，我们利用 Gemini 3.1 Flash 的极致速度和 8848AI 平台的稳定接口，瞬间榨干了成百上千份 PDF 的价值，把原本需要熬夜一星期的枯燥工作压缩到了 5 分钟。

把无聊的工作交给 AI，把有限的生命留给美好的事物，这就是我们学习 AI 的终极意义。

但是，等等，这事还没完！

如果你平时根本不在电脑前，老板突然在微信上发给你一份 50 页的全英文商业计划书，让你“5分钟后给我个核心摘要”，你要怎么办？难道还要到处找电脑跑 Python 脚本吗？

下一期教程，我将教你如何把今天写好的 PDF 处理大脑，直接接入你的微信或飞书机器人！

实现的效果是：在手机上随手转发一个 PDF 文件给你的“专属文件小助手”，10 秒后，它就会自动在聊天框里回复你一份万字精华总结。

不想错过这个“移动端装 X 神器”的朋友，记得点赞关注，我们下期见！

---

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI教程 #Gemini #自动化办公 #8848AI #Python脚本 #Prompt技巧 #人工智能 #效率工具