小米豪掷600亿押注AI:雷军的野心有多大?

2024年的科技圈,热闹是属于大模型的,但焦虑是属于所有人的。

当OpenAI还在为GPT-5.4的发布日期秘而不宣,硅谷的科技巨头们正为算力卡打得不可开交时,在大洋彼岸的中国北京,一家以“性价比”起家、刚刚造车成功的厂商,悄悄在内部启动了一个代号为“龙虾”的AI项目。

随后的发布会上,雷军站在那个略显笨拙却代表着未来的具身智能机器人CyberOne旁边,气定神闲地宣布了一个数字:未来五年,小米研发投入将超过600亿元,全线All in AI。

台下掌声雷动,但质疑声也如影随形。

“一个卖手机和组装家电的,凭什么做大模型?”
“600亿,够烧几天?特斯拉和Google的投入可是这个数字的N倍。”
“小米的AI,到底是真技术,还是营销噱头?”

这些质疑不无道理。毕竟,在公众认知里,小米擅长的是整合供应链和极致营销,而非硬核底层技术。但如果你还用旧眼光看小米,恐怕会错过中国AI产业下半场最精彩的一出戏。

我的观点是:小米的600亿AI豪赌,绝不是一家手机厂商的被动转型,而是一场从底层芯片到操作系统,从超级App到具身智能机器人的全栈生态战。读懂了今天的小米,你就读懂了中国AI产业未来五年的竞争核心——不再是单纯的比拼模型参数,而是比拼场景落地和软硬件一体化生态。

拆解600亿:雷军的钱,都花在哪儿了?

600亿是个天文数字,但对于AI这个无底洞来说,如果不打在靶心上,可能连个响声都没有。雷军是个精明的商人,他的钱,花在了三条极其清晰的主线上,构成了一个稳固的“金字塔”架构。

1. 塔基:MiLM自研大模型(基座能力)

没有自己的核心大模型,就像建房子没有地基。小米在内部组建了超千人的大模型团队,全力研发MiLM系列大模型

与百度文心一言、阿里通义千问等通用大模型不同,小米MiLM从出生起就带有强烈的“端侧”基因。雷军很清楚,在云端算力上跟互联网巨头硬碰硬是不智的,小米的优势在设备端。

技术数据说话:

根据最新的Benchmark测评,小米MiLM在轻量化参数模型(如6B-13B版本)表现优异,在C-Eval和CMMLU等中文权威榜单中,同参数级别下甚至超越了通义千问 Qwen3-7BGLM-5-9B的部分指标。其核心优势在于极高的压缩比和卓越的端侧推理速度,目标是让大模型在不牺牲太多智能的前提下,塞进手机和汽车的芯片里。

2. 塔身:AI Agent“龙虾”框架(连接枢纽)

这是小米AI战略中最性感、也是最关键的一环。大模型只是“大脑”,但大脑需要“手和脚”才能干活。AI Agent(智能体)就是那个能听懂人话、拆解任务、并自动调用工具去执行的“超级管家”。

小米内部代号“龙虾”的Agent框架,正是为了打通手机(HyperOS)、汽车(SU7)和庞大的IoT智能家居而生的。关于它的细节,我们会在下一章深度拆解。

3. 塔尖:具身智能与人形机器人(终极形态)

这是最烧钱、最遥远,但也最具想象力的赌注。从CyberDog到CyberOne,小米在机器人领域的投入从未停止。雷军的逻辑是:AI的终极形态不是屏幕里的对话框,而是能物理交互的实体。 机器人是验证AI Agent在复杂物理世界决策能力的最佳场域。

AI Agent“龙虾”到底是什么?为什么它才是小米的“杀手锏”?

如果说大模型是让小米汽车和手机有了“灵魂”,那么“龙虾”Agent框架则是给这个灵魂配上了“机械臂”和“万能钥匙”。

在很多人的印象里,Siri或者小爱同学只是一个“听话做动作”的语音助手。“帮我设个7点的闹钟”——这叫语音控制。

而AI Agent的逻辑是完全不同的。比如你对它说:“我明晚要在上海请一个重要的客户吃饭,喜欢吃本帮菜,人均500左右,环境要安静,订好位置后帮我打车过去,并把行程加到日历里。”

这是一个极其复杂的任务链:

1. 多模态感知: 理解你的意图(请客、本帮菜、高档、安静)。

2. 任务拆解: 拆解为搜索餐厅、对比评价、预定、打车、记日历等子任务。

3. 工具调用: 自动打开大众点评API筛选餐厅,调用美团API订座,调用高德API打车。

4. 跨设备/App协同: 在手机上完成操作,可能还要把打车信息同步到汽车车机上。

5. 反思与反馈: 如果餐厅满座,自动寻找备选方案。

这就是“龙虾”框架让工程师兴奋的原因。它不再是一个个孤立的App,而是一个能调动整个HyperOS生态资源的超级大脑。

进阶技术视角:小米“龙虾” vs. 其他 Agent

相比于开源社区的AutoGPT(往往陷入死循环)或Google Gemini Agent(强于云端全家桶),小米“龙虾”的核心优势在于“软硬一体化的原生控制权”

💡 开发者视角:

>

传统的App之间是存在壁垒的。但小米拥有HyperOS操作系统底层权限。这意味着“龙虾”Agent不需要通过模拟点击来操作App,而是可以通过系统底层的IPC(进程间通信)机制,极其高效、安全地调用各个App开放的“意图(Intent)”和数据。
# 示例:概念性代码,理解小米Agent如何串联生态(仅作原理展示)

import mi_hyper_agent as mha

初始化Agent,不仅连接模型,还连接用户的设备生态

agent = mha.AgentClient(

model="MiLM-pro-end", # 使用端侧优化的MiLM模型

device_scope=["phone", "car", "smart_home"]

)

用户一句人话任务

user_input = "下班路上有点堵,帮我把家里空调提前打开,热水器烧好水,我要泡澡。"

Agent内部执行逻辑(简化版)

1. 理解意图:回家场景,需要调节环境

2. 调用API获取车辆位置和预估剩余时间(ETA)

car_eta = agent.car.get_location_context()["eta_home"] # 剩余30分钟

if car_eta < 60: # 如果小于一小时,开始准备

# 3. 跨设备调度智能家居

agent.smart_home.ac.turn_on(mode="heating", target_temp=23)

agent.smart_home.water_heater.start_heating(target_temp=45)

# 4. 反馈用户

agent.phone.tts("好的,已为您开启空调和热水器,预计您到家时环境已舒适。")

这种跨越手机、汽车、家电的无缝调度能力,是除了小米之外,连华为也很难在短时间内做到极致的(因为小米的IoT设备品类更全、协议更统一)。

具身智能:最烧钱、最性感、也最危险的赌注

讲完“龙虾”Agent,我们必须看看它最硬核的载体——人形机器人

具身智能(Embodied AI)是目前AI圈最火的词。简单来说,就是有身体的AI。它不仅要有强大的大脑(大模型),还要有敏锐的感知(视觉、触觉)和精准的执行(电机、液压)。

这是典型的“铁三角”挑战,任何一环弱了都不行。

| 核心维度 | 技术挑战 | 小米 CyberOne 现状 (估算) | 特斯拉 Optimus Gen2 现状 (公开) | | :--- | :--- | :--- | :--- | | 感知 | 3D视觉SLAM、力反馈 | 较强,依托汽车自动驾驶技术 | 极强,纯视觉方案+端到端神经网络 | | 决策 | 复杂环境下的任务规划 | 处于实验阶段,尝试接入MiLM | 较强,利用FSD打下的基础 | | 执行 | 高功率密度电机、灵巧手 | 关节自由度较高,但灵巧手是短板 | 灵巧手极其惊艳,能拿鸡蛋 | | 成本 | 商业化落地的关键 | 极高,单台或超百万人民币 | 目标控制在2万美元以内 |

客观评估,在具身智能赛道上,小米处于“第一梯队尾部,第二梯队头部”的位置。特斯拉Optimus凭借着FSD的数百万辆车的数据喂养和极强的供应链整合能力,目前处于领跑地位。Figure AI、宇树科技等初创公司在特定动作和成本控制上也各有千秋。

小米的风险在于:具身智能是一个比造车更烧钱、周期更长的无底洞。 澎湃芯片当年的教训历历在目——自研固然好,但如果商业化落地太慢,巨额的研发费用会拖垮现金流。机器人如果只能在发布会上走秀,而不能进入工厂拧螺丝或进入家庭做家务,那它就是一个昂贵的玩具。

雷军的终局想象:小米生态的AI飞轮能转起来吗?

雷军豪赌600亿,绝不是为了赢取技术赞誉,他的目标永远是商业闭环

小米做AI,最大的底气不是技术积累,而是它那令人绝望的IoT设备护城河

核心数据:
截至2023年底,小米IoT平台已连接设备数(不含手机和笔记本)高达8亿+台;HyperOS月活用户数破6亿

这是一个纯互联网公司(如OpenAI、百度)梦寐以求,纯硬件公司(如三星、戴尔)望尘莫及的数据金矿。

小米的AI终极想象,是一个完美的“AI飞轮”:

1. 硬件铺路: 卖出更多的手机、汽车、手环、空调、扫地机(HyperOS设备)。

2. 数据喂养: 8亿设备产生海量的用户真实生活场景数据(脱敏后)。

3. 模型进化: 这些数据让MiLM大模型和“龙虾”Agent更懂中国用户习惯。

4. 体验提升: AI Agent让智能家居不再“人工智障”,变得真正好用。

5. 反哺硬件: 极致的AI体验吸引更多用户购买小米全家桶,飞轮完成闭环。

但是,这个飞轮转起来的前提是:小米必须解决算力依赖、人才竞争和商业化落地这三座大山。 600亿,真的只是个入场券。

写在最后

600亿能买来多少个五年?雷军自己也不知道答案。

在这个激荡的AI时代,不进则退。小米如果不All in AI,它的手机将沦为纯粹的硬件载体,它的智能家居将被更聪明的Agent生态降维打击,它的汽车将失去智能化下半场的入场券。

这是一场关乎小米生死的防守反击战。

但有一件事是确定的:AI的下半场,拼的不是谁的模型参数最大,而是谁能让普通人在日常生活中真正用上AI,用得爽,用得离不开。 论把高大上的技术“包饺子”卖给普通消费者,小米比任何人都更有动机,也更有经验去做成。

你,愿意做第一批吃“龙虾”的人吗?

---

📌 下期预告

小米押注AI Agent,但“Agent”这个词,不同公司的理解差异大得惊人。

下一篇,我们来做一件更有意思的事,不看PPT,只看实测:

《2024年中国AI Agent大横评:小米“龙虾” vs. 百度文心Agent vs. 阿里通义 vs. 字节豆包——谁才是真正能用的那个?》

我们会用同一套极其刁钻的任务清单,逐一测试这四个平台的Agent完成率、响应速度和出错方式。

关注8848AI,带你从零开始学AI。下周见。

---

本文由8848AI原创,转载请注明出处。

#小米 #雷军 #大模型 #AIAgent #具身智能 #人形机器人 #小米SU7 #HyperOS #8848AI