本文最后更新于 2026-05-26，文章内容可能已经过时。

你上周跟AI聊的那份商业计划书，现在在谁的服务器上？

你有没有想过这个问题？

打开ChatGPT，把公司下季度的营收预测粘进去，让它帮你润色；用Claude分析一份竞争对手调研报告；让AI帮你起草一封涉及薪资谈判的邮件……

这些操作你可能每天都在做。但这些内容，全部上传到了别人的服务器。

我不是要制造恐慌。只是想提醒你：云端AI的便利背后，有一个你可能从没认真想过的问题——数据主权。

律师在用AI分析合同条款，客户的商业机密就这样进了第三方数据库；创业者把商业计划书喂给AI打磨，核心竞争策略就这样在某个数据中心留下了痕迹；甚至你在AI上倾诉的私人烦恼，也成了某个训练集的一部分。

好消息是：这个问题有解法，而且完全免费。

今天这篇文章，手把手带你用 Ollama + DeepSeek + AnythingLLM 三件套，在自己的电脑上搭建一个能读懂你文档、永不联网、订阅费为零的本地AI知识库。数据不出本机，隐私真正属于你。

---

一、先搞清楚这三个工具是谁、干什么的

在动手之前，先建立一个整体心智模型，避免"装了一堆东西不知道为什么"的迷茫感。

用餐厅来类比：

Ollama = 厨房。负责在你的电脑上运行AI模型，管理模型的下载、加载和推理计算。没有它，模型跑不起来。
DeepSeek模型 = 厨师。真正"思考"的那个角色，负责理解你的问题、阅读文档、生成回答。
AnythingLLM = 前台+点餐系统。提供漂亮的聊天界面，管理你上传的文档知识库，把你的问题传给厨房，再把答案端给你。

数据流向是这样的：

你的文档（PDF/Word/TXT）
↓
AnythingLLM（解析、切片、存入本地向量数据库）
↓
你提问 → AnythingLLM检索相关片段 → 拼接成Prompt
↓
Ollama（调用DeepSeek模型推理）
↓
回答返回给你

整个过程全部在本地完成，没有任何数据离开你的电脑。

---

二、硬件选型：先确认你的电脑能跑哪个版本

DeepSeek有不同参数规模的版本，对应不同的硬件需求。在安装之前，先对照下表确认你的配置：

💡 给大多数人的建议：8GB内存的普通笔记本，跑 deepseek-r1:7b 完全够用，处理日常合同、报告、读书笔记绰绰有余。有独立显卡的用户优先用显存跑，速度会快很多。

---

三、✅ 第一关：安装Ollama，把DeepSeek请进电脑

Windows用户

1. 访问 [ollama.com](https://ollama.com)，下载Windows安装包，双击安装，一路Next。

2. 安装完成后，打开命令提示符（CMD）或PowerShell，输入：

# 验证安装成功
ollama --version

拉取DeepSeek模型（7B版本，约4.7GB，需等待下载）
ollama pull deepseek-r1:7b

3. 下载完成后，测试模型是否正常工作：

# 直接在终端和DeepSeek对话
ollama run deepseek-r1:7b

看到 >>> Send a message 提示符，说明模型已经跑起来了。输入任意问题测试，确认有回复后按 Ctrl+D 退出。

macOS用户

# 方式一：官网下载Mac安装包（推荐，有图形界面）
访问 ollama.com 下载 .dmg 文件，拖入Applications

方式二：Homebrew安装
brew install ollama

启动Ollama服务
ollama serve

新开一个终端窗口，拉取模型
ollama pull deepseek-r1:7b

macOS用户如果是M系列芯片（M1/M2/M3/M4），恭喜你，统一内存架构让跑本地模型的体验极佳，16GB内存的MacBook Air跑7B模型非常流畅。

---

四、✅ 第二关：安装AnythingLLM，打造知识库界面

1. 访问 [anythingllm.com](https://anythingllm.com)，下载对应系统的桌面版安装包。

2. 安装完成后打开，首次进入会有引导设置。

关键步骤：连接本地Ollama

在设置界面中：

LLM Provider（大语言模型提供商）→ 选择 "Ollama"
Ollama Base URL → 填入：http://127.0.0.1:11434
Model → 选择 deepseek-r1:7b

⚠️ 注意：Ollama默认监听本地11434端口。如果AnythingLLM连接失败，先确认Ollama服务是否在后台运行（Windows任务栏应有Ollama图标，macOS菜单栏应有图标）。

配置Embedding模型

Embedding模型负责把你的文档转成向量，影响检索精度。推荐同样用Ollama本地跑：

# 拉取专门用于向量化的轻量模型
ollama pull nomic-embed-text

然后在AnythingLLM的 Embedding Provider 中选择Ollama，模型选 nomic-embed-text。

---

五、✅ 第三关：创建知识库，上传你的第一份文档

1. 在AnythingLLM主界面点击 "New Workspace"，创建一个工作区（比如命名为"合同文档库"）。

2. 点击工作区右侧的上传图标，支持直接拖入PDF、Word、TXT、Markdown等格式。

3. 文档上传后，AnythingLLM会自动解析和向量化，完成后状态变绿。

4. 在对话框输入问题，测试问答效果。

测试示例：上传一份租房合同PDF，然后问："合同中关于提前退租的违约金条款是什么？"——如果配置正确，AI会准确定位到对应条款并引用原文。

---

六、🔓 解锁隐藏技能：让本地AI从"能用"变成"好用"

技巧1：调整Chunk Size，让长文档不丢失上下文

Chunk Size决定了文档被切成多大的片段进行存储和检索。这个参数对效果影响显著：

在AnythingLLM的工作区设置中可以调整 Document Chunk Size，建议从1024开始，根据实际效果微调。

技巧2：用System Prompt给AI设定专业角色

在工作区设置中找到 System Prompt，填入以下模板，让AI保持专业角色：

📋 法律文档助手

你是一位专业的法律文档分析助手。你的任务是基于用户上传的合同和法律文件，准确提取关键条款、识别潜在风险点，并用清晰易懂的语言解释给用户。回答时必须引用文档原文，不得凭空推断。如果文档中没有相关信息，明确告知用户"文档中未找到相关内容"。

📋 财务报告分析助手

你是一位资深财务分析师助手。基于用户上传的财务报告和数据文件，帮助用户理解关键财务指标、分析业务趋势、识别异常数据。所有分析必须基于文档中的实际数据，给出的数字需注明来源页码。

📋 技术文档检索助手

你是一位技术文档专家。帮助用户在上传的技术手册、API文档、代码注释中快速找到所需信息。回答时提供具体的操作步骤或代码示例，并标注信息来源于文档的哪个章节。

---

七、常见报错速查表

---

八、诚实说：本地方案的天花板在哪里

搭完这套系统，你会发现它在日常场景下真的够用。但我不想让你对它抱有不切实际的期待——本地方案有它的边界：

消费级显卡跑不了最强版本：32B以上的参数需要专业级显卡或高内存服务器，普通用户无缘满血DeepSeek
多人协作不够流畅：这套方案是单机的，团队共享知识库需要额外搭建服务器环境
移动端访问不便：你的知识库关在电脑里，手机上无法直接访问
超长文档处理吃力：几百页的厚重报告，7B模型的理解深度和推理能力会遇到瓶颈

这时候，本地方案需要一个"云端备用引擎"来补位。

本地7B模型处理日常文档绰绰有余，但如果你需要处理超长合同、做复杂多步推理，或者想在手机上随时调用——满血版DeepSeek的API才是正解。

好消息是，API调用的成本比你想象的低得多。[api.884819.xyz](https://api.884819.xyz) 接入简单、计费透明，国产模型（DeepSeek/千问等）完全免费，没有月租没有订阅，按量付费。可以作为本地方案的"云端备用引擎"——本地够用就用本地，本地不够时无缝切换，两全其美。

AnythingLLM支持直接填入自定义API地址，把 http://127.0.0.1:11434 换成云端API地址，一行配置搞定切换，完全无缝。

---

结语：本地AI不是极客的玩具

搭完这套系统，你会有一种奇妙的掌控感——你的文档在你的电脑里，你的问题在你的电脑里处理，回答也在你的电脑里生成。没有任何数据离开你的视线。

本地AI不是极客的玩具，是每个重视数据主权的人的基础设施。

就像你不会把家里的钥匙交给陌生人保管，你也不必把公司的核心文档交给第三方服务器托管。这套方案的成本是零，门槛是一个下午，换来的是真正属于你的数据主权。

---

📎 资源汇总：本文所有System Prompt模板、报错速查表，以及如何用 [api.884819.xyz](https://api.884819.xyz) 的API密钥直接接入AnythingLLM的配置教程，都在 → [api.884819.xyz](https://api.884819.xyz)（新用户注册即送体验token，国产模型完全免费）

---

搭好了本地知识库，下一个问题自然浮现：为什么同样上传了一份PDF，有人问出金子、有人问出废话？

差距不在模型，在于RAG检索的底层逻辑——文档是怎么被切片的、向量是怎么被检索的、Prompt是怎么被拼接的。下篇我们会拆解RAG的核心原理，教你把"能用的知识库"调教成"真正好用的知识库"。关注专栏，不要错过。

---

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。

#AI教程 #DeepSeek #本地AI #隐私保护 #Ollama #知识库 #RAG #8848AI