3月初,一个叫Manus的产品刷屏了。

它不是聊天机器人,不是图像生成器,而是一个AI Agent——能自己上网、自己操作软件、自己完成任务的那种。你给它一个目标,它去执行。

比如"帮我订一张明天去上海的机票",它会打开携程,查航班,选一个合适的,填你的信息,甚至帮你付款。

演示视频出来的时候,讨论炸了。

有人说这是AI的"iPhone时刻",有人说这东西离实用还差得远。我观察了一周,也试了试(排队拿到内测资格),有些想法想分享。

先说结论:方向是对的,但距离真正的"智能助理",还有一段路要走。

Manus做对了几件事:

第一,它让AI从"回答问题"进化到"解决问题"。这很关键。以前的AI是百科全书,现在的AI开始像助理了。

第二,它的交互方式很自然。不用学什么prompt技巧,就当它是个同事,说你要什么就行。

第三,它的UI设计让人有信任感。你能看到它在做什么、点了哪里、为什么选这个选项。这一点对于用户接受AI操作非常关键。

但它也有问题。

最大的问题是稳定性。我给了它三个任务,一个完美完成(订酒店),一个部分完成(订机票时卡在支付页面),一个完全失败(帮我找一个特定活动的票,它没找到入口)。

对用户的预期管理也是个挑战。很多人看到演示,以为它无所不能。但真用了才知道,它目前最适合的任务类型是"标准化流程"。那些需要灵活判断、需要人脉、需要复杂决策的任务,它还搞不定。

隐私问题也很敏感。让AI帮你操作账号,意味着要给它授权。它能看到你的订单、你的通讯录、你的支付信息。虽然官方说数据加密、不存储,但信任这事儿,需要时间积累。

这几天我还关注了几个类似的动向。

OpenAI据说在开发Agent产品,代号可能跟"Operator"有关。Anthropic也在做多步任务执行的研究。国内的智谱、百度、字节,都有类似方向的产品在推进。

这意味着什么?

我觉得AI的下一个战场,已经从"谁的模型更强"变成了"谁能让AI真正干活"。

这是一个更难的问题。模型强,意味着答案准。但要让AI干活,需要的是规划能力、工具使用能力、错误恢复能力。这比单纯"答对问题"复杂得多。

对普通人来说,这意味着什么?

意味着你要开始习惯"让AI帮你做事"这种模式了。不是让它给你建议,而是让它直接去干。

你可以准备的是:

学会描述清晰的任务目标。AI执行能力的上限,往往取决于你任务描述的质量。

了解AI Agent的能力边界。什么它能干、什么它干不了,心里有数,才不会踩坑。

保持对新技术的好奇心。这个赛道今年会有很多变化,不想被落下的话,多关注、多试试。

Manus是这波浪潮的一个开端,不是终点。接下来,我们会看到更多AI Agent产品涌现。

谁会笑到最后?不知道。但可以确定的是,让AI真正"能干活"的公司,会重新定义我们和机器的协作方式。

这场好戏,才刚刚开始。