从 Manus 和 MCP 聊起:AI Agent 的 Web3 跨界探索

2025-03-27 18:59:02

撰文:pignard.eth,ZAN Team

3 月 6 日,一款由中国的创业公司 Monica 发布的全球首款通用 AI Agent 产品 Manus 在国内科技媒体和社交网络刷屏,上线第一天邀请码就全网一码难求,甚至闲鱼上一个邀请码都要 5 万,不过还是有不少行业 KOL 提前拿到了邀请码,铺天盖地的体验解读文章接踵而来。

Manus 作为通用 AI Agent 产品,具备从规划到执行全流程自主完成任务的能力,如撰写报告、制作表格等。它不仅生成想法,更能独立思考并采取行动。 以其强大的独立思考、规划并执行复杂任务的能力,直接交付完整成果,展现了前所未有的通用性和执行能力。

Manus 的爆火不仅带来了行业内的关注,也为各类 AI Agent 开发提供了宝贵的产品思路与设计灵感。随着 AI 技术的飞速发展,AI Agent 作为人工智能领域的重要分支,正逐渐从概念走向现实,并在各行各业展现出巨大的应用潜力,当然也包括 Web3 行业。

背景知识

AI Agent,即人工智能代理,是一种能够根据环境、输入和预定义目标自主做出决策并执行任务的计算机程序。AI Agent 的核心组成部分包括大语言模型(LLM)作为其「大脑」,使其能够处理信息、从交互中学习、做出决策并执行行动;观察和感知机制,使它能够感知环境;推理思考过程,涉及分析观察结果和记忆内容并考虑可能的行动;行动执行,作为对思考和观察的显式响应;以及记忆和检索,存储过去的经验以供学习使用。

AI Agent 的设计模式从 ReAct 出发,有两条发展路线:一条更偏重 AI Agent 的规划能力,包括 REWOO、Plan & Execute、LLM Compiler。另一条更偏重反思能力,包括 Basic Reflection、Reflexion、Self Discover、LATS。

其中 ReAct 模式是最早出现的 AI Agent 设计模式,目前也是应用最广泛的,因此这里主要介绍 ReAct 的概念。ReAct 是指通过结合语言模型中的推理(Reasoning)和行动(Acting)来解决多样化的语言推理和决策任务。它的典型流程如下图所示,可以用一个有趣的循环来描述:思考(Thought)→ 行动(Action)→ 观察(Observation),简称 TAO 循环。

  • 思考:面对一个问题,我们需要进行深入的思考。这个思考过程是关于如何定义问题、确定解决问题所需的关键信息和推理步骤。

  • 行动:确定了思考的方向后,接下来就是行动的时刻。根据我们的思考,采取相应的措施或执行特定的任务,以期望推动问题向解决的方向发展。

  • #p#分页标题#e#
  • 观察:行动之后,我们必须仔细观察结果。这一步是检验我们的行动是否有效,是否接近了问题的答案。

  • 循环迭代

AI Agent 又可以根据智能体的数量分为 Single Agent 和 Multi Agent,Single Agent 的核心在于 LLM 与工具的配合,并且在完成任务的过程中,Agent 可能与用户有多轮交互。Multi Agent 则会为不同的 Agent 赋予不同的角色定位,通过 Agent 之间的协同合作来完成复杂的任务,但是在完成任务的过程中,相比于 Single Agent 来说,与用户的交互会少一些。目前大多数框架都聚焦于 Single Agent 的场景。

Model Context Protocol (MCP) 是由 Anthropic 公司于 2024 年 11 月 25 日推出的一项开源协议,旨在解决 LLM 与外部数据源之间的连接和交互问题。可以把 LLM 类比成操作系统,MCP 类比成 USB 接口,支持将外部数据和工具灵活插入,然后用户可以读取使用这些外部数据和工具。

MCP 提供了三种能力对 LLM 进行扩展:Resources(知识扩展)、Tools(执行函数,调用外部系统)、Prompts(预编写提示词模板)。MCP 协议采用 Client-Server 架构,底层传输使用的是 JSON-RPC 协议。任何人进行开发和托管 MCP Server,并且可以随时下线停止服务。

Web3 的 AI Agent 现状

在 Web3 行业中 AI Agent 的声浪自今年一月份到达高峰后大幅下降,整体市值更是缩水 90% 以上,目前声浪和市值较大的仍然是围绕 AI Agent 框架做 W

声明:投资有风险,入市须谨慎。本资讯不作为投资建议。
本文链接: - 链补手