本文最后更新于 2026-05-19，文章内容可能已经过时。

一个10人电商团队，如何把3天的选品报告压缩到4小时

周五下午5点，运营小李还在手动复制竞品价格到Excel。

这份报告周一要用，她已经做了两天了。

浏览器开着12个标签页——天猫、京东、1688、抖音小店、各个竞品店铺的后台截图——她一边翻页一边往表格里粘数据，眼睛酸，脑子里还要同时想"这个SKU的价格带对不对""这个类目最近是不是在涨"。

旁边的同事老王负责写分析结论，但他得等小李的数据整理完才能开始。通常要等到周六上午。

这就是一份"3天选品报告"的真实消耗方式。

---

第一章：3天是怎么被消耗掉的

这家团队10个人，做跨境和国内双线电商，主营家居品类。每周一次选品会，核心材料是一份竞品分析报告。

听起来很正常，但拆开看，这份报告的生产链路是这样的：

Day 1（周四）：数据采集阶段

小李负责从各平台手动拉取数据：目标类目的TOP50 SKU、近30天销量变化、价格区间分布、主要竞品的评分和评论数。没有任何自动化工具，全靠复制粘贴。光是这一步，她每周要花掉6-8小时。

数据格式不统一是最大的麻烦。天猫的销量显示"1万+"，京东显示具体数字，抖音小店根本没有公开销量——她要自己根据评论数和直播热度做估算。这些"翻译"工作没有人教过她标准做法，全靠经验。

Day 2（周五）：清洗与初步整理

数据拉回来之后，还要做清洗：去掉明显异常值、统一价格单位、补全缺失字段。这一步看起来机械，但实际上要做很多判断——比如某个SKU的销量突然暴涨，是真实需求还是刷单？她得交叉比对评价质量和复购率才能判断。

通常到周五下午，她才能把一张"可以给老王用"的数据表交出去。

Day 3（周六/周日）：分析与报告撰写

老王拿到数据之后，要输出选品建议：哪些品类值得跟进、哪些竞品的打法值得参考、下周上新的优先级排序。这部分完全依赖他的经验判断，没有任何模板，每次都是从空白文档开始写。

周日晚上报告出来，周一开会用。如果中间有一个环节出了问题——数据源挂了、老王临时有事——整个周期就会推迟，选品会只能靠"感觉"开。

这套流程运行了将近两年。团队不是不知道效率低，而是"一直这样，也不知道怎么改"。

直到他们找到我，我们开始认真拆解这个问题。

---

第二章：整体流程设计——先画图，再动手

在动手之前，我们做的第一件事不是找工具，而是把现有流程画出来，然后问一个问题：这里面哪些环节是"机器能做的"，哪些是"必须人来做的"？

改造后的整体链路如下：

graph LR
A[数据拉取\n自动化脚本] --> B[清洗标准化\n规则引擎]
B --> C[AI分析\nPrompt驱动]
C --> D[报告生成\n模板渲染]
D --> E[人工审核\n最终决策]

style A fill:#e8f4f8
style B fill:#e8f4f8
style C fill:#fff3e0
style D fill:#e8f4f8
style E fill:#fce4ec

五个节点，颜色代表不同属性：

蓝色节点：高度可自动化，规则明确，机器做更快更准
橙色节点：半自动化，AI参与但需要精心设计
红色节点：必须保留人工，这是决策责任所在

⚠️ 一个常见误区：很多人想把整个链路都交给AI，结果发现AI在数据采集上并不可靠，在最终决策上又不该完全信任。正确的做法是：让AI做判断，让人做决策。

这两件事听起来像，但本质不同。AI的判断是"根据数据，这个品类有增长信号"；人的决策是"考虑到我们的供应链和资金周转，我们要不要跟"。后者涉及大量AI拿不到的上下文信息。

---

第三章：逐环节拆解——最难的不是代码，是Prompt

环节一：数据拉取

我们用Python写了一套爬虫脚本，结合公开API（部分平台有官方数据接口）和结构化抓取，把原来8小时的手动采集压缩到30分钟自动运行。

这部分技术上没有太多难点，现成的库（requests、BeautifulSoup、selenium）都能搞定。踩坑点只有一个：平台反爬机制。我们最后的方案是加入随机延迟 + IP轮换，稳定性明显提升。

环节二：清洗标准化

写了一套规则引擎，处理以下几类问题：

销量格式统一（"1万+" → 10000+的数值区间）
价格离群值检测（超过均值3倍标准差的自动标记）
缺失字段填充逻辑（按品类历史均值补全）

这部分花了大概一周调试，但上线后基本不用维护。

环节三：AI分析——这才是真正的卡点

数据清洗完，进入AI分析环节。表面上看，"把数据扔给AI，让它分析"很简单。但实际上，这一步的Prompt设计决定了整套流程的价值上限。

我们踩过的最大坑：第一版Prompt让AI输出的是"通用商业分析"，满篇都是"该品类市场潜力较大，建议关注"这类废话。对选品决策没有任何帮助。

经过大概两周的迭代，我们最终定型的Prompt结构如下：

你是一位有5年经验的电商选品分析师，专注于家居品类。
你的任务是基于以下结构化数据，输出一份选品分析报告。

【数据输入】
{json_data}

【分析维度】（按优先级排序）
1. 增速信号：近30天销量环比变化 > 20%的SKU，标记为"高增速"
2. 价格带机会：当前TOP10均价与市场中位数的偏差，判断是否存在价格洼地
3. 竞争密度：SKU数量 vs 头部集中度（CR5），判断赛道拥挤程度
4. 差评信号：评分 < 4.2 且评论数 > 500 的SKU，提取高频差评关键词

【输出格式】
本周选品建议（必须包含以下部分）

1. 高优先级跟进品（1-3个）
品名：
推荐理由：（必须引用具体数据）
风险提示：
建议切入价格带：

2. 观察池（3-5个）
品名 + 一句话理由

3. 本周不建议跟进的类目
类目名 + 原因（必须基于数据，不能只说"竞争激烈"）

【约束条件】
每个推荐必须有具体数据支撑，禁止使用模糊表述
如果数据不足以支撑判断，直接说"数据不足，建议人工核查"
报告总字数控制在800字以内

这个Prompt的核心设计逻辑有三点：

1. 角色设定要具体：不是"你是一个AI助手"，而是"有5年经验、专注家居品类的选品分析师"——这会让模型的输出更聚焦

2. 分析维度要量化：每个维度都给了明确的数值阈值，而不是让AI自己决定什么叫"增速快"

3. 输出格式要强约束：模板越具体，AI的废话越少，人工审核的成本越低

核心代码片段

import json
import httpx

API_BASE = "https://api.884819.xyz/v1"
API_KEY = "your_api_key_here"

def analyze_products(product_data: list[dict], model: str = "deepseek-r1") -> str:
"""
批量分析选品数据，返回结构化报告
"""
# 将数据序列化为JSON字符串
data_str = json.dumps(product_data, ensure_ascii=False, indent=2)

# 读取Prompt模板
with open("prompt_template.txt", "r", encoding="utf-8") as f:
prompt_template = f.read()

# 填充数据
final_prompt = prompt_template.replace("{json_data}", data_str)

# 调用API
with httpx.Client(timeout=60.0) as client:
response = client.post(
f"{API_BASE}/chat/completions",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
},
json={
"model": model,
"messages": [
{"role": "user", "content": final_prompt}
],
"temperature": 0.3,  # 分析任务用低temperature，减少随机性
"max_tokens": 2000
}
)

result = response.json()
return result["choices"][0]["message"]["content"]


批量处理：每次处理一个类目的数据
if __name__ == "__main__":
categories = ["收纳", "床品", "厨具"]

for category in categories:
with open(f"data/{category}_cleaned.json") as f:
data = json.load(f)

report = analyze_products(data)

with open(f"reports/{category}_report.md", "w", encoding="utf-8") as f:
f.write(report)

print(f"✅ {category} 分析完成")

💡 文中的API调用基于标准OpenAI兼容接口格式。如果你的团队想低成本试跑这套流程，可以先用聚合接口测试不同模型的分析效果——我们用的是 [api.884819.xyz](https://api.884819.xyz)，支持Deepseek、GPT、Claude等多模型切换，适合在正式部署前做模型选型对比。国产模型（如Deepseek R1）完全免费，新用户注册即送体验token，没有月租。

环节四：报告生成

用Jinja2模板把AI输出渲染成标准格式的Markdown文档，再用pandoc转成PDF或Word。这步没有任何难点，10行代码搞定。

环节五：人工审核

这一步我们刻意没有简化。老王每周花约1小时审核AI输出的报告，主要做两件事：

1. 验证AI引用的数据是否准确（偶尔会有幻觉）

2. 加入AI拿不到的信息：供应链库存、近期展会见闻、老客户反馈

这1小时的人工投入，是整套流程的"质量保险"。

---

第四章：上线后的真实数据与意外收获

流程跑了大约6周之后，我们做了一次复盘。

时间对比（同类型报告）： | 环节 | 改造前 | 改造后 | | 数据采集 | 6-8小时 | 30分钟（自动） | | 清洗标准化 | 3-4小时 | 15分钟（自动） | | AI分析 | — | 5分钟/类目 | | 报告撰写 | 4-6小时 | 30分钟（模板渲染） | | 人工审核 | 混在撰写中 | 1小时（独立） | | 合计 | 约72小时 | 约4小时 |

报告产出量从每周1份增加到每周5份（覆盖5个细分类目），选品会的决策质量也有明显提升——因为每个类目都有数据支撑，而不是靠感觉。

一个意外发现：

AI在识别"小众高增速品类"上，表现比人工更稳定。

原因很简单：人工分析时，注意力会自然集中在销量大的头部SKU上，小类目容易被忽视。但AI会平等处理所有数据，不会因为某个品"感觉没前途"就跳过它。在过去6周里，AI识别出了2个人工分析时被忽略的高增速小品类，其中一个后来成了当季的爆款。

诚实说局限：

AI漏掉了几乎所有"社媒趋势信号"。

小红书上某个博主带火了某款产品，抖音上某个挑战赛让某个品类搜索量暴涨——这些非结构化信号，我们的流程完全捕捉不到。老王在审核阶段要手动补这块，但这依赖他个人的信息获取习惯，并不稳定。

这是这套流程目前最大的短板。

---

第五章：给想复刻的人，一个清醒的建议

不是所有团队都值得搭这套流程。在动手之前，先用这三个维度自测：

自测清单：

重复频率：这个任务是否每周/每月固定发生？如果是偶发性需求，搭流程的ROI很低
数据量级：每次处理的SKU数量是否超过100个？数量太少，人工处理反而更快
人工耗时：目前这个任务每次消耗的人工时间是否超过4小时？低于这个阈值，自动化的收益不明显

如果三个问题都是"是"，那值得认真考虑。

关于成本：

以我们的使用规模为例，每份报告（约50个SKU，3个类目）的API调用消耗大约在2000-5000 token之间（使用Deepseek R1）。在8848AI平台上，国产模型完全免费，GPT/Claude等模型按量计费，整体成本极低。

最后想说的：

搭完这套流程之后，我问老王：你现在最大的感受是什么？

他说："以前我花70%的时间在整理数据，30%在思考。现在反过来了。"

这才是自动化的真正价值——不是让人变得多余，而是让人把时间花在机器做不好的事情上。

工具是死的。判断哪个环节值得自动化，才是核心能力。

---

这次案例里有一个环节我们最终没有自动化——竞品的社媒舆情信号。不是技术上做不到，而是做了之后准确率反而下降了。下一篇我会专门聊聊：AI在非结构化数据上的边界在哪里，以及我们后来用了什么折中方案。如果你也在为这个问题头疼，记得关注更新。

---

本文由8848AI原创，转载请注明出处。关注8848AI，带你从零开始学AI。 新用户注册即送体验token。 访问 [api.884819.xyz](https://api.884819.xyz) 即可注册，用户名+密码直接开始，无需邮箱验证，国产模型完全免费，没有月租。

#AI自动化 #电商运营 #AI API #Prompt技巧 #DeepSeek #效率工具 #8848AI #AI实战案例