AI应用案例
未读
Function Calling 完全指南:让 Claude 从"说话"变成"做事"
Function Calling 完全指南:让 Claude 从"说话"变成"做事" 很多人学了一周 Function Calling,结果连 AI 有没有"真的执行"函数都搞不清楚。 这不怪你——大部分教程直接扔给你一堆代码,却没有解释清楚一件事:AI 在整个过程中,到底扮演了什么角色? 读完本文
AI资讯
未读
Claude 的“算力焦虑”结束了?Dario 一番话,揭开 Mythos 背后的能力分层真相
Claude 的“算力焦虑”结束了?Dario 一番话,揭开 Mythos 背后的能力分层真相 你有没有过这样的经历:正在用 Claude 处理一个复杂的代码重构任务,或者让它帮你审计一段安全代码,正干到兴头上,突然弹出“限额已达”的提示?或者明明前几天模型还特别“聪明”,今天却感觉响应变慢、质量下
AI应用案例
未读
我们用AI Agent跑了一个月内容流水线,差点翻车三次
我们用AI Agent跑了一个月内容流水线,差点翻车三次 上个月,我们的写作Agent生成了一篇关于短视频行业的分析文章,里面引用了一个"某平台DAU突破4.2亿"的数据,听起来言之凿凿,格式规范,甚至还标注了"来源:平台官方披露"。 我把这篇稿子推进了发布队列。 是我们的运营同事在最后做例行检查时
AI提示词技巧
未读
你的Prompt为什么总在"赌运气"?偷学Claude Advisor模式的三个分层思维技巧
你的Prompt为什么总在"赌运气"?偷学Claude Advisor模式的三个分层思维技巧 你有没有遇到过这种情况:精心写了一大段Prompt,模型给你一个看起来很有道理、但其实完全跑偏的答案? 你反复改提问方式,换了几种表达,结果还是差不多——要么答案太浅,要么信息编造得天衣无缝,等你去核实才发
AI工具测评
未读
GPT-5.5实测:1M上下文到底有没有用?我用5个真实任务告诉你
GPT-5.5实测:1M上下文到底有没有用?我用5个真实任务告诉你 我把一份8万字的产品文档丢给它,它没有崩溃。 然后我把同样的文档丢给GPT-5.4——它崩了。 这是我测试GPT-5.5的第一个小时,也是这篇文章存在的原因。 不是要告诉你"GPT-5.5发布了快去用"——你已经被这种标题轰炸麻木了
AI应用案例
未读
你的 AI Agent 到底该管多少事?多 Agent 编排落地实战拆解
你的 AI Agent 到底该管多少事?多 Agent 编排落地实战拆解 你的团队花了三个月部署了一个 AI 客服 Agent,上线第一周,它在处理退款问题时,把一个 VIP 客户的订单号发给了另一个人。 不是模型的问题。是没有人想清楚:这个 Agent,到底该管多少事? 这个故事不是虚构的。它是几
AI资讯
未读
Anthropic Advisor Tool:Sonnet低价逼近Opus
API账单又爆了?Anthropic Advisor Tool教你用Sonnet的价格,拿到接近Opus的效果 想象一下:你正在为一个中小团队的AI Agent项目做预算,复杂任务必须用顶级模型,但每天的token消耗像雪球一样越滚越大。或者,你是独立开发者,手里项目不少,却总在Opus和Sonne
AI工具测评
未读
我用「退休策略师级别」Prompt测了Claude三天,结论比你想象的更复杂
我用「退休策略师级别」Prompt测了Claude三天,结论比你想象的更复杂 "它帮我算出来,退休需要存800万。" 朋友发来这条消息时,我正好在刷到第三篇关于"Claude能替代财务顾问"的帖子。那个数字让我停了一下——不是因为太高或太低,而是因为我想知道:这个数字背后,它用了什么假设? 这个问题
AI应用案例
未读
我以为我会调用它,结果文档说:你只需要注册它,然后等
我以为我会调用它,结果文档说:你只需要注册它,然后等 我原本以为这会是一次普通的API接入。 写个函数,传个参数,拿到返回值——这套流程我闭着眼睛都能写。但当我翻开Perplexity Agent Skills的官方文档,第一页就出现了一句让我愣了三秒的话: "Skills are not call
AI资讯
未读
AI “训乖了”还不够?Anthropic 最新安全研究揭示对齐的深层隐忧
# AI “训乖了”还不够?Anthropic 最新安全研究揭示对齐的深层隐忧 你以为 Claude 已经足够“乖巧”,不会输出有害内容?或者你用 AI 代理处理邮件、执行任务时,它会严格遵守你的指令?Anthropic 自己的两项实验却给出了一个更务实的提醒:当前模型在行为层面看似对齐,但面对目标