居然:解构manus ai:这是通用agent革命,还是精巧缝合怪

\u003cdiv class=\"rich_media_content\"\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 16px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e腾讯科技《ai未来指北》特约作者 郝博阳\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 16px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e编辑 郑可君\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e昨天, \u003c!--vertical_card_begin_0--\u003emanus\u003c!--vertical_card_end_0--\u003e至少在中文媒体里刷屏了。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e自媒体的反应堪称狂热:\u0026#34;通用agent终于实现了!\u0026#34;\u0026#34;这是继\u003c!--vertical_card_begin_1--\u003edeepseek\u003c!--vertical_card_end_1--\u003e之后的又一技术革命!\u0026#34;这样夸张的赞誉随处可见。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e从benchmark来看,它的表现确实非常亮眼,在gaia测试中超越了之前的各种agent以及openai的deepresearch。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.3; margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_0--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.3; margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003egaia测试非常权威。它是由数个来自meta、huggingface和autogpt的大佬共同完成,模拟了真实世界的复杂问题,要求ai展现推理、多模态处理、网页浏览和工具使用等多维能力。之前,gpt-4 工具调用在这个测试中仅获得了15%的成绩。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c!--mid_ad_0--\u003e\u003c!--eop_0--\u003e\u003c/p\u003e\u003c!--mid_article_ad_0--\u003e\u003c!--paragraph_0--\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e然而,技术世界的真相往往藏在热闹喧嚣之下。想要真正评估manus的进步意义,我们需要审视一下它在已有的技术土壤上究竟播种了什么新芽。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003ch2 style=\"margin-bottom: 0pt; margin-left: 0pt; margin-top: 0pt; text-align: justify\"\u003e\u003c!--hpos_0--\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 21px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e\u003c!--aipos_0--\u003emanus之前,agent离临门一脚还有多远?\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/h2\u003e\u003cp style=\"margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e当前的agent已经发展到什么水平了?\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e借用openai前应用研究主管lilian weng的经典定义,一个合格的agent需要三大核心能力作为其\u0026#34;大脑\u0026#34;中枢:\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e1. \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003eplanning(规划)\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:如同一位棋手,能将复杂局面分解为一系列精妙的子步骤\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e2. \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003etool use(工具使用)\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:宛如工匠,懂得从工具箱中选取最合适的工具并熟练使用\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e3. \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003ememory(记忆)\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:既有短期记忆存储即时信息,又有长期记忆沉淀持久知识\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_1--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e而过去这半年中,agent领域虽然看起来没什么火爆的产品,但技术底层能力却在大幅跃进。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e尤其在planning(规划)和tool use(工具使用)两个方向上进步快速。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003ememory(记忆)领域虽略显滞后,\u003c/span\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e但deepseek的nsa(原生稀疏注意力机制)\u003c/span\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e,google和微软也在发力突破这一瓶颈。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e我们今天重点聊planning(规划)和tool use(工具使用)两个方向。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003ch3 style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\"\u003e\u003c!--hpos_1--\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 19px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e\u003c!--aipos_1--\u003eplanning的进化:推理之翼展开\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/h3\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003eplanning(规划)是最先有进步的。\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e从gpt-o1开始的测试时计算(test-time compute)拓展模型,也就是我们常说的推理模型,让单个大模型的planning能力大幅提升。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这里就需要展开说说基础模型和推理模型的区别。相比基础模型,推理模型在四种关键认知能力上有很大提升:\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e验证\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:如同一位细心的校对者,不放过任何错误\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e回溯\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:当发现道路不通,敢于放弃并寻找新路径\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e子目标设定\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:将庞大山峰分解为可攀登的阶梯\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e逆向思考\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:从终点回望起点,寻找最优路径\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e也就是说,基础模型需要四个模型完成的事情,推理模型用一个就够了。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e\u003c!--secure_link_begin_0--\u003e斯坦福大学\u003c!--secure_link_end_0--\u003e最近的一篇论文正在试图破解推理模型为什么这么厉害。研究者在qwen-2.5-3b和llama-3.2-3b上施加相同训练后发现,qwen如同开了挂一般迅速进步,而llama则进展缓慢。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e深入探究后发现,qwen天生就具备验证和回溯等思维习惯,而llama则缺乏这些\u0026#34;思维良习\u0026#34;。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_2--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e当研究者用含有这些思维模式的\u0026#34;示范\u0026#34;来引导llama时,即使示范中的答案是错的,llama也能迅速提升。\u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这揭示出,要想让ai在有更多思考时间时真正变聪明,它必须先掌握上面提出的四种基本思维方法。\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e此外,推理模型带来的另一个好处是灵活性。过去由workflow构建的模型往往只能解决特定问题。而推理模型因为其本身的泛化能力可以处理更通用的事物。这也是manus能更“通用”的基础。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e当前,agent工作流系统中的主要核心节点功能在很大程度上就是在模拟这些思维模式。这四种能力齐全的推理模型本身已经是一个天然的planning agent系统了。这就是今天我们想重点探讨的。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e在manus出现前,在agent中使用推理模型最成功的实践是2月2日\u003c!--secure_link_begin_1--\u003eopenai\u003c!--secure_link_end_1--\u003e的deepresearch及其类似产品,如grok 3的deepsearch。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e在红杉对openai deepresearch产品团队的访谈中,团队在解释其能力时就提到,“deepresearch是 o3 模型的一个微调版本,o3 是一个非常智能和强大的模型。很多分析能力也是来自底层的 o3 模型训练。”\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c!--mid_ad_1--\u003e\u003c!--eop_1--\u003e\u003c/p\u003e\u003c!--mid_article_ad_1--\u003e\u003c!--paragraph_1--\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003edeepresearch是直接通过端到端的训练,而非搭建工作流的方式来运作。在这里,推理模型本身就成了agent。\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_3--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e而deepresearch,根据尝试进行复现的jina ai(ai搜索产品)的分析,主要也就是搜索、阅读和分析三者间的循环工作。只不过推理需要能判别内容是否充足、搜索到的资料是否对应,再去要求下一轮搜索。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_4--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e而同样是在昨天发布、在外网获得满堂彩的qwen团队推出的qwq-32b模型,在其说明中特别提到了,它在推理模型中集成了与 agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这都是为了已经有能力agent化的大模型在打基础,做拓展。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e而作为一款通用的ai代理,manus毫无疑问的使用了推理模型带来的新能力。我们看到其搜索路径规划与deepresearch非常相似,但在网页浏览中使用到了后面工具使用章节中的浏览器控制能力。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这确实很聪明,因为可以更好地阅读如网页pdf类直接读取页面难以完整呈现的内容。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_5--\u003e\u003c/p\u003e\u003ch3 style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\"\u003e\u003c!--hpos_2--\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 19px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e\u003c!--aipos_2--\u003etool use的进化:从工具到环境的征服\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/h3\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e而(\u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003etool use)\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e工具使用能力的进化则开始得更早。这里有几个关键里程碑标记着这一进程:\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e2023年7月9日\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:code interpreter问世,ai开始能执行代码,这是工具使用的第一步。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e2024年6月20日\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:claude artifacts登场,ai能够在对话中动态创建和修改各类“人工制品(各种小型工具和虚拟机)”,生成从代码到图表,从文档到交互式组件的直观内容。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_6--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 15px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e2024年10月22日\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:claude的computer use功能横空出世,ai不再局限于专用工具,而是能像人类一样“看见”屏幕并操作计算机,移动光标、点击按钮、输入文本,真正模拟人类与计算机的自然互动。这一能力的上线,使得claude 3.5 sonnet的agentic工具使用评分整体来看,平均提升了一半以上。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_7--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 15px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e2024年11月25日\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:anthropic开源了划时代的“模型上下文协议”(mcp),这是一把打开数据世界的万能钥匙,让ai能直接连接各类数据源而无需繁琐的定制开发。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left msonormal\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e●\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 15px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e2025年1月23日\u003c/span\u003e\u003c/strong\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e:openai推出operator,主打网页浏览能力的计算机使用代理。能力上和claude的computer use非常相近,但在网页ui上更有加成。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e这种工具使用的能力,目前在manus的演示中和artifact水平相似,只是多加了网页浏览能力,至于和计算机的其他交互,限于虚拟机的限制并不能达成。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e特别值得一提的是,在所有这些尝试中,mcp的出现堪称革命性。因为对于ai工具使用来讲,最大的问题是数据获取和功能获取。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e过去常用的数据和功能的调用方式function call(函数调用),最大的问题就是用api的时候,需要为每个功能进行额外开发。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e每个功能分别进行开发,工具的拓展速度就会很慢。但mcp直接高灵活、高复用,很多工具和数据都可以直接通过协议调用,不用再进行单独开发了。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e它优雅地统一了本地资源和远程api的访问方式。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003c!--img_8--\u003e\u003cspan style=\"font-size: 12px\"\u003e\u003cspan style=\"color: rgb(153, 153, 153)\"\u003e(图片来自知乎作者dukee)\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e正如aigclink发起人所言:“mcp相当于一个万能的数据插头,打通了agent构建的最后一公里。”更重要的是,它解决了隐私安全和知识产权问题,“工作流完全可以在本地运行,没有商业授权问题。”\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这意味着,中间件平台如coze、dify等产品的空间被大大压缩,模型方和应用方的分工将更加清晰。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e因为在过去agent工作流里,另一个核心功能就是工具调用。这都是中间件平台用function call手搭的,一般开发者不想自己写,就得用开发agent工作流的中间件平台。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e可以说,agent原来的中间件平台的两大作用——工具调用和节点式步骤规划,到这步就都被新的技术进化取代掉了。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003ch2 style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\"\u003e\u003c!--hpos_3--\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 21px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(26, 26, 26)\"\u003emanus的真相:是创新革命还是组装?\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/h2\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e让我们回到\u003c/span\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003emanus本身,看看它的能力范围有没有超出前两点呢?\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e从演示来看,它确实是\u003c/span\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e有效整合了deepresearch、artifacts和operator三大现有能力。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e据媒体引用但未出现在manus比特币交易平台排名官网上的官方资料称,manus ai 使用一套名为“multiple agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c!--mid_ad_2--\u003e\u003c!--eop_2--\u003e\u003c/p\u003e\u003c!--mid_article_ad_2--\u003e\u003c!--paragraph_2--\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过 api 或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务,同时支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c!--mid_ad_3--\u003e\u003c!--eop_3--\u003e\u003c/p\u003e\u003c!--mid_article_ad_3--\u003e\u003c!--paragraph_3--\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e我们可以大胆地从当前manus可以执行的操作和其技术描述去重构其能力:它很有可能是三个相关功能的串联,由一个主脑做步骤调配。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e当然也有可能根本不需要主脑,以规划代理同时承担工作协调的能力。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: center\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_9--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-justify\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e这也是zengyi qin(mit博士)认为它在本质上还是一个预先设定的“工作流”的原因。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_10--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-justify\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e只不过这个工作流当前各个节点的能力大幅增强了,而其负责规划的主脑也进化成了可以分布拆解和发起任务的推理模型。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e而其代理层及模型层架构中与deepresearch和artifact能力的重叠基本是100%的(图像浏览用了一些operator能力)。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_11--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-justify\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e在manus的解释中,除了浏览网页用到了computer use(计算机使用)之外,它在虚拟机中的计算机应用并不多。\u003c/span\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e\u003cspan style=\"background-color: rgb(255, 255, 255)\"\u003e这也是 zengyi qin 认为它在无边界操作系统级环境(open-ended os level environment)中未取得突破的原因。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c!--mid_ad_4--\u003e\u003c!--eop_4--\u003e\u003c/p\u003e\u003c!--mid_article_ad_4--\u003e\u003c!--paragraph_4--\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-justify\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e因此比特币交易平台排名官网上介绍的智能研究、高级数据分析、任务自动化三大功能其实也就是manus的极限了。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003ch2 style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 0pt; text-align: justify\"\u003e\u003c!--hpos_4--\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 21px\"\u003e\u003cstrong\u003e\u003cspan style=\"color: rgb(26, 26, 26)\"\u003eless structure, more hype?\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/span\u003e\u003c/h2\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e相较于deepresearch这类尝试用推理模型赋能agent的前沿工作,或claude的mcp协议对工具使用领域的革新,manus的技术突破相对有限。它的主要创新点是借助推理模型实现了简化结构,同时增强智能处理能力的设计。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e这也就是杨远骋koji发布的据说来自manus团队内部的“less structure, more intelligence”理念。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_12--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(51, 51, 51)\"\u003e当然,这个理念openai的产品团队在红杉的访谈中也提到了类似的说法。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"text-align: center\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_13--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e尽管如此,manus作为一款产品,也展示了monica公司在整合功能、优化用户体验方面的专长。它提供了简洁而强大的工作流升级,将当前最先进的ai能力整合到一个流畅的用户体验中。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e在它之前,领先模型公司中唯一做过这个尝试的是谷歌。在2024年12月12日,谷歌推出gemini的同时,也推出了一个agent系统project mariner。可以同时完成获取表单、找到公司比特币交易平台排名官网、比特币交易平台排名的联系方式等多步骤任务,agent会自动执行在谷歌搜索中查找电子邮件的过程,且这一过程中用户可以随时点击暂停和停止。同时,用户可以看到agent每一步行动的推理步骤和计划。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" data-exeditor-arbitrary-box=\"image-box\"\u003e\u003c!--img_14--\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e在计算机使用层面上,它比manus还激进。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e但谷歌的这个产品还只是个饼,并没上线。因此,manus代表了当前ai技术整合的一个优秀案例。而且整体性,而非技术创新上甚至超越了最先进的基础模型公司。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75; margin-bottom: 24px; margin-left: 0pt; margin-top: 3pt; text-align: justify\" class=\"paragraph text-align-type-left\"\u003e\u003cspan style=\"letter-spacing: 0pt\"\u003e\u003cspan style=\"font-size: 18px\"\u003e\u003cspan style=\"color: rgb(0, 0, 0)\"\u003e但无论如何,把它和deepseek的突破相比,也许并不合适。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cdiv powered-by=\"qqnews_ex-editor\"\u003e\u003c/div\u003e\u003cstyle\u003e.rich_media_content{--news-tabel-th-night-color: #444444;--news-font-day-color: #333;--news-font-night-color: #d9d9d9;--news-bottom-distance: 22px}.rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.rich_media_content{color:var(--news-font-day-color);font-size:18px}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content{color:var(--news-font-night-color)}}.data_color_scheme_dark .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.data_color_scheme_dark .rich_media_content{color:var(--news-font-night-color)}.data_color_scheme_dark .rich_media_content{font-size:18px}.rich_media_content p[data-exeditor-arbitrary-box=image-box]{margin-bottom:11px}.rich_media_content\u003ediv:not(.qnt-video),.rich_media_content\u003esection{margin-bottom:var(--news-bottom-distance)}.rich_media_content hr{margin-bottom:var(--news-bottom-distance)}.rich_media_content .link_list{margin:0;margin-top:20px;min-height:0!important}.rich_media_content blockquote{background:#f9f9f9;border-left:6px solid #ccc;margin:1.5em 10px;padding:.5em 10px}.rich_media_content blockquote p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content blockquote{background:#323232}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content blockquote{background:#323232}}.rich_media_content ol[data-ex-list]{--ol-start: 1;--ol-list-style-type: decimal;list-style-type:none;counter-reset:olcounter calc(var(--ol-start,1) - 1);position:relative}.rich_media_content ol[data-ex-list]\u003eli\u003e:first-child::before{content:counter(olcounter,var(--ol-list-style-type)) '. ';counter-increment:olcounter;font-variant-numeric:tabular-nums;display:inline-block}.rich_media_content ul[data-ex-list]{--ul-list-style-type: circle;list-style-type:none;position:relative}.rich_media_content ul[data-ex-list].nonunicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.5)}.rich_media_content ul[data-ex-list].unicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.8)}.rich_media_content ol:not([data-ex-list]){padding-left:revert}.rich_media_content ul:not([data-ex-list]){padding-left:revert}.rich_media_content table{display:table;border-collapse:collapse;margin-bottom:var(--news-bottom-distance)}.rich_media_content table th,.rich_media_content table td{word-wrap:break-word;border:1px solid #ddd;white-space:nowrap;padding:2px 5px}.rich_media_content table th{font-weight:700;background-color:#f0f0f0;text-align:left}.rich_media_content table p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content table th{background:var(--news-tabel-th-night-color)}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content table th{background:var(--news-tabel-th-night-color)}}.rich_media_content .qqnews_image_desc,.rich_media_content p[type=om-image-desc]{line-height:20px!important;text-align:center!important;font-size:14px!important;color:#666!important}.rich_media_content div[data-exeditor-arbitrary-box=wrap]:not([data-exeditor-arbitrary-box-special-style]){max-width:100%}.rich_media_content .qqnews-content{--wmfont: 0;--wmcolor: transparent;font-size:var(--wmfont);color:var(--wmcolor);line-height:var(--wmfont)!important;margin-bottom:var(--wmfont)!important}.rich_media_content .qqnews_sign_emphasis{background:#f7f7f7}.rich_media_content .qqnews_sign_emphasis ol{word-wrap:break-word;border:none;color:#5c5c5c;line-height:28px;list-style:none;margin:14px 0 6px;padding:16px 15px 4px}.rich_media_content .qqnews_sign_emphasis p{margin-bottom:12px!important}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{padding-left:30px}.rich_media_content .qqnews_sign_emphasis ol\u003eli{list-style:none}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep:first-child::before{margin-left:-30px;content:counter(olcounter,decimal) ''!important;counter-increment:olcounter!important;font-variant-numeric:tabular-nums!important;background:#37f;border-radius:2px;color:#fff;font-size:15px;font-style:normal;text-align:center;line-height:18px;width:18px;height:18px;margin-right:12px;position:relative;top:-1px}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis{background:#262626}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis{background:#262626}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}}.rich_media_content h1,.rich_media_content h2,.rich_media_content h3,.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{margin-bottom:var(--news-bottom-distance);font-weight:700}.rich_media_content h1{font-size:20px}.rich_media_content h2,.rich_media_content h3{font-size:19px}.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{font-size:18px}.rich_media_content li:empty{display:none}.rich_media_content ul,.rich_media_content ol{margin-bottom:var(--news-bottom-distance)}.rich_media_content div\u003ep:only-child{margin-bottom:0!important}.rich_media_content .cms-cke-widget-title-wrap p{margin-bottom:0!important}\u003c/style\u003e\u003c/div\u003e
分享让更多人看到
客户端下载
热门排行
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 评论
- 关注