Manus团队不避讳“套壳”争议,它为什么引爆了行业热点?

Manus团队不避讳“套壳”争议,它为什么引爆了行业热点?

彻底脱轨 2025-03-07 财经报 10 次浏览 0个评论

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

爆红的运气终于轮到了大模型应用层公司。

3月5日晚,一款叫做“Manus”的Agent(智能体)产品发布。24小时内,它成为国内AI大模型领域讨论度最高的产品。

由于产品处于内测阶段,仅以邀请码形式开放使用,Manus的体验资格迅速供不应求。其邀请码在二手电商平台一度被炒至数万元之高。

有关Manus的舆论迅速分化为三派,推崇和质疑是两极,还有一拨声音在中间强调客观理智看待。

为何会有这样的奇特景象?因为有大量报道将其描述为“AI Agent产品的DeekSeek时刻”,“瞥见了AGI”,且运用了大量“国运级创新”等曾经被用来形容DeepSeek的词汇。一时间,对于这类评判的纷争反而吸引了更多注意力。

Manus团队不避讳“套壳”争议,它为什么引爆了行业热点?

但回到产品本身,面对其爆火出圈,Manus AI团队产品负责人张涛(HideCloud),同时也是Monica.im产品合伙人,在朋友圈发文表示,过去的十几个小时对于团队来说无异于一场充满了各种意外的冒险。

团队低估了大家的热情。这本是一个产品探索过程中的阶段性收获分享,因此服务器资源是对标demo水平来准备,不曾想过会引起巨大波澜。

那么Manus到底是一个什么样的产品?如果它不是Agent的DeepSeek时刻,那么它让我们来到了什么样的节点?

一个基本可以替代人的通用AI Agent

Manus对自己的定位是“通用AI Agent”。不同于传统针对单个任务、具有严格规则和流程的Agent,Manus是一个多模型、多智能体产品,拥有“独立思考”能力,能够对复杂的通用任务进行多步骤拆解并执行。 

简单而言,用户提出“一句话任务”,一段时间之后,便可以得到一个质量颇高的成品交付。

正如产品视频中演示的三类任务。以简历筛选为例,一个任务经历了解压文件,逐页浏览每份简历,记录重要信息(期间还可以继续上传更多简历)等步骤。

随后,它反馈出了排名建议、候选人简介以及评估标准。如果用户想要更直观的结果,告诉它,它就会立刻生成一份表格。并且Manus具备记忆功能,在下次生成类似任务结果时也会优先输出表格形式。

整个过程在云端异步完成,这意味着用户可以随时关闭电脑,等待结果生产。

第二个房产调研任务显示了Manus做研究的能力。这个任务最首要的是拆解出用户对于房产需求的不同维度,以to-do-list形式推进信息搜索,包括安全、教育等等,并编写了一个Python程序来核对其预算,据此过滤房地产网站上的所有房屋选项,最终输出一份详细的调研报告。 

第三个任务是股票分析,这里涉及的是专业数据的准确获取,编写程序以进行股票间相关性的可视化数据分析,以及根据新的需求(建立网站)在线部署一个全新网站。 

针对Manus的争议之一是“套壳”,即没有自研底层大模型的能力。Manus的模型能力来自Anthropic的Claude。但需要指出的是,根据参加过沟通会的行业人士表述,Manus并不讳言自己是一个“套壳”产品。

除此以外,据01Founder分析,其技术架构可能还包含专用RL小模型(基于通义千问Qwen)和自研工具包生态。

该人士认为,专用RL小模型负责系统中最关键的决策环节:意图识别、任务规划和工具调用。整个工作流程设计以一份todo.md文件为核心,它兼顾记忆和指挥,解决了AI Agent长期面临的上下文管理难题,并且能够保持执行反馈与todo.md之间的动态联系。

在一众测评中,很多获得邀请码的用户尝试了比演示视频更复杂有趣的任务。有人用它写了一个谷歌CEO模拟器,从车库出发直到再次成为科技巨头;有人用它整理混乱的发票并填写报销单;有人用它做出一个国家的极简编年史,并配以漫画图表……

这些任务无一例外都成功了,并且成品大都让人感到意外。只不过还是存在一些问题,例如个别任务会因为用户权限请求接管,比如网盘资源下载等,以及不止一位科技博主反馈Manus的审美水平还需得到提升,当然更本质的还是服务器稳定性问题。

在前述张涛的朋友圈回应中,Manus方面也明确了服务器容量有限,团队正在全力输出。

总而言之,在已有的实测体验中,Manus近乎于DeepResearch、Computer Use以及Cursor等众多AI应用的集合体。一名获得实测资格的用户对界面新闻记者表示,他的体验基本都很顺畅,必须承认,这当中没有太多新技术,但整合得很完美,“完全就是产品经理的魅力时刻”。 

目前,在GAIA(General AI Assistants,通用AI助手)基准测试的评分上,Manus已经超过了OpenAI的DeepResearch成为第一。

技术门槛没那么高,靠产品理念和工程能力取胜 

在Manus获得如此热度之后,就如同好奇DeepSeek团队成员一样,外界也开始关心这家应用层公司团队的来历。 

目前代表Manus对外的主要是产品负责人张涛和首席科学家季逸超。据了解,张涛曾在字节跳动负责国际化产品,随后在光年之外担任产品负责人。季逸超是前Magitech Labs创始人,开发的iOS浏览器“猛犸”曾获MacWorld特等奖。

另外,创始团队还包括曾经创办过夜莺科技的肖弘。此前,肖弘还联合张涛创办过Monica,这是一款集成主流大模型的All-in-One产品,提供对话、翻译、文案处理等多种功能。

一个很明确的事实是,Manus诞生的必要前提是基座模型的性能提升,但这是过去两年来整个行业有目共睹的趋势,为什么率先让Agent获得注意力的会是Manus?

“Less structure, more inteligence(更少的结构,更多的智能)”是Manus团队的核心理念,他们认为应该给予AI更多自主权以决定如何使用工具和完成任务,而不是让其恪守规则和程序,这也是团队在Manus身上所体现出来的产品特性。

此外,一位AI大模型行业人士对界面新闻记者分析称,Manus团队的产品理念和工程能力很好,但这的确不是一个新概念,技术门槛也没那么高。大概两年前,Auto-GPT就代表过类似产品想法的兴起。

从传播路径上来看,Manus与DeepSeek-R1一样。它之所以会爆火,是因为成功打出了用户体验上的低门槛和时间差。大批用户在R1之前没有使用过价格昂贵的o1,因此更容易被R1惊艳。同样,DeepResearch也只有200美元/月的ChatGPT Pro用户才能够使用,因而Manus更容易在体验上形成冲击。

因此,我们可以看清它的优势——OpenAI曾为AGI画过一张类比自动驾驶L1-L5级别的路线图,分别是对话、推理、自主、创新、组织,有科技博主认为Manus或许带领我们迈向了自主阶段,也即Autonomous AGI。但与此同时也不宜将它捧得过高,要知道它尚未形成自己的数据飞轮,草率站在巨头的轨迹上会略显单薄。

关于商业模式,不同受访者持不同看法,有人认为2美元单次任务的成本还是过高,但也有人认为Manus在保证质量与服务稳定,可以开启规模化后,还是将尝试付费模式。届时,它或将基于AHPU(Agentic Hours Per User)这一新指标打造出独属于AI的商业模式。 

否则在烧钱状态下,Manus很难完成规模化。前述受访者根据自己的使用经验认为,目前2美元单次任务的成本可能只是一个平均数或中位数,许多动辄两小时的任务生成,其消耗成本应该不止于此。

针对Manus的下一步发展,一名关注AI领域的投资人认为它将专注于完善体验,并且在短期内严格控制产品放量。因为一旦放开,资源限制可能会导致体验急剧下降,进而导致口碑崩塌。这一定程度上也是在管理用户体验。

事实上团队也已声明,当前的Manus距离正式版想交付给大家的体验还差很远。“像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间。” 

前述投资人还推断,2025年会出现更多的自主AI Agent,Manus AI团队的下一步也许需要开启融资计划。 

可以预判的是,这会是部分大模型公司迅速跟进的产品方向,例如打造了AutoGLM的智谱,大概率不会错过通用AI Agent的机会,另外就是字节跳动、阿里巴巴、腾讯等互联网大厂。

Manus团队在沟通会上就已直面过这类问题。团队认为自己把握了3个月的战略窗口期,这取决于创业公司的快速迭代能力,而大厂决策周期难以跟上AI领域变化。

2025年Agent的爆发已经成为行业共识,眼下,行业静待的是第二个“Manus”究竟能做到何种水平。

转载请注明来自小白菜,本文标题:《Manus团队不避讳“套壳”争议,它为什么引爆了行业热点?》

每一天,每一秒,你所做的决定都会改变你的人生!