昨晚 Manus 这个有点类似 DeepResearch 也有点类似 Devin 的 AI 产品发布了,我隐约觉得,这类通用 Agent 是大厂必做。从创业公司的角度看,做产品该不该从这个点切入? 我主要希望你分析大厂是不是必然会席卷这个方向,创业公司应该如何切入。
好的,我将分析大厂是否必然会进军通用 AI Agent 领域,以及创业公司在这一趋势下如何找到合适的切入点。
我会从以下几个方面展开:
- 大厂(如 OpenAI、Google、Meta、Amazon 等)在 AI Agent 领域的布局与趋势。
- 通用 AI Agent 的技术挑战、商业价值以及可能的市场格局。
- 结合 Manus、DeepResearch 和 Devin 等现有案例,分析创业公司如何与大厂竞争或找到差异化切入点。
- 可能的细分市场或创新模式,帮助创业公司找到适合的产品方向。
我会尽快整理研究结果与你分享。
大厂争相布局通用 AI Agent
大厂在 AI Agent 领域的布局与战略
各大科技公司正积极投入通用 AI Agent(自主智能体)领域,视其为下一代重要技术。主要玩家的动向如下:
OpenAI(及微软):OpenAI在ChatGPT上推出了自主代理功能,如“Deep Research”研究助手,能使用新版模型 o3 自动执行多步网页调研并生成分析报告。该代理面向高端专业用户(需 $200/月订阅),可在数分钟内浏览数百来源并输出带引文的详尽报告。OpenAI还上线了可代办日常事务的“Operator”代理,用于自动规划行程、订购杂物等网络任务。微软则借助与OpenAI的合作,将Copilot类助手嵌入Windows、Office等产品,并提供Copilot Studio等平台,方便企业定制和部署专属ChatGPT助手到CRM、ERP等业务系统。总体来看,OpenAI/微软正双管齐下,一边增强ChatGPT的自治代理能力,一边提供生态让第三方构建专属Agent。
Google:谷歌正将通用AI代理融入现有产品。2023年已发布Assistant with Bard,将其Bard大语言模型与手机助手结合,实现更智能的个人助理。升级后的Assistant能理解上下文,通过语音、文本或图像与用户交互,并可直接替用户执行操作(如发送短信、在照片上生成社交帖子等) (Google Assistant with Bard: New generative AI features)。在开发者层面,Google推出了 Vertex AI Agent Builder 等工具,支持借助 Gemini 等最新模型快速搭建代理流程。Google高管预测下一代 Llama 4 模型(Meta提供开源)也将用于代理,具备更强的推理和工具使用能力。可见谷歌战略是将通用代理作为其搜索、助手服务的升级,并提供云平台让开发者构建垂直Agent。
Meta:Meta在开源大模型基础上发力AI Agent。首席产品官Chris Cox透露即将推出的 Llama 4 模型将赋能各种AI智能体,具备更强的推理、多步骤任务执行和工具调用能力。Meta计划在2025年Q2发布独立的Meta AI应用,让用户直接使用其通用代理。Meta早前的研究项目如CICERO(在外交策略游戏中达到类人水平)证明了多模态推理与对话结合的潜力。可以预见,Meta会将开源模型与社交平台相结合,推出能浏览网页、自动填写表单等功能的个人AI助手,与OpenAI、谷歌正面竞争。
Amazon:亚马逊将Alexa语音助理全面升级为 Alexa+ 服务,引入自研的大语言模型和生成式AI。新版Alexa能够记住用户偏好,支持多轮对话,并执行复杂任务。例如,用户可让Alexa根据家庭成员饮食偏好推荐餐厅并直接预约,或请它阅读并总结家庭合同文件要点。Alexa+与亚马逊电商生态深度整合(可连接门铃摄像头、查快递等),面向Prime会员免费提供,非会员月费$19.99。显然,亚马逊希望借助通用Agent增强Alexa的黏性和价值,让其成为用户日常事务管家,并进一步带动电商和服务消费。
小结:大厂布局表明 通用AI Agent已是兵家必争之地。OpenAI/Microsoft引领代理框架和生态,Google/Meta主打模型能力与产品融合,Amazon侧重家庭助手场景。各家战略虽侧重不同,但都在赋予AI系统自主规划、多步执行的能力,预期这些智能体将深度嵌入操作系统、搜索、助手和云服务,成为下一代通用计算平台的一部分 (AI智能体创业必读,详解AI Agent市场格局、技术路径与未来市场__财经头条)。对于创业者而言,大厂的进入几乎是必然趋势,也是必须直面的竞争背景。
通用 AI Agent 的技术挑战与市场前景
通用AI Agent虽然前景诱人,但在技术上仍有多重挑战,需要在可行性和可靠性方面取得突破:
可扩展性与效率:目前大模型驱动的智能体执行复杂任务时非常耗时耗资。一项深度调研任务可能需要Agent自主搜索、阅读海量资料,再逐步汇总,这往往耗费数十分钟甚至更长。例如,OpenAI的Deep Research每次查询可能需5~30分钟并消耗大量算力。如何优化推理链路、减少不必要步骤、提高并行度,是让Agent大规模应用的关键。否则,昂贵的API费用和漫长等待会阻碍用户接受。
上下文理解与记忆:通用Agent需要长程记忆和理解上下文的能力,以便在多轮交互和长任务中不丢失关键信息。这涉及引入向量数据库、长上下文模型等来实现短期/长期记忆。尽管有了记忆模块,代理仍可能在长任务中“遗忘”之前的指令或偏离用户意图,这会导致逻辑错误。保证Agent在复杂对话和任务链中的一致性和上下文衔接是技术难点,需要在架构上精心设计记忆检索与调用机制。
自主决策与安全:真正的AI智能体要能在无人干预下自主决定并执行操作,这对安全性提出很高要求。当前,无论是工具使用还是行动规划阶段,缺乏有效的监控机制。Agent可能调用外部接口执行错误指令,甚至造成损失。OpenAI等已增加行为监视,但跨平台、多工具的全面监控尚未成熟。另外,智能体可能为了完成目标而采取意料之外的步骤,如何为其决策设定边界和伦理约束也是挑战。因此,在大规模部署前,必须解决Agent决策的可控性、可解释性问题,建立可靠的监测和急停机制,以防范失控或滥用。
准确性与幻觉:大模型驱动的Agent难免产生幻觉(hallucination),即生成不真实或不相关的信息。这在自治代理中尤为严峻,因为错误信息可能被当作后续行动依据。OpenAI警告其Deep Research代理有时会幻觉,需要用户核实后再采用。尽管引入工具查询和多轮自检可缓解这一问题,但彻底杜绝幻觉仍无解。对于要求精准的场景(如财务分析、医疗建议),Agent必须结合可靠的数据源和验证步骤,提升回答的真实性。
尽管困难重重,通用AI Agent的市场前景被普遍看好。多份研究预测未来几年该市场将呈指数级增长:
市场规模:2019年全球自主智能体市场仅3.45亿美元,但预计2024年将达近30亿美元,年均增速高达54% (AI智能体创业必读,详解AI Agent市场格局、技术路径与未来市场__财经头条)。另有机构估计,2023年该市场收入约48亿美元,2028年将飙升至285亿美元,五年复合年增长率约43%。可见一旦技术成熟,市场容量将以每年数倍的速度扩张。
增长动力:自动化需求和成本效益是核心驱动因素。企业希望借助智能体提高运营敏捷性和效率,降低人力成本,同时增强客户体验。并行算力资源日益丰富、大模型算法改进,也为Agent性能提升提供了基础。此外,在自动驾驶、医疗等复杂领域的成功实践,增加了各行业对自主AI代理的信心。
应用场景:短期内,AI Agent最有可能以数字助手的形态普及。当前的Alexa、Siri、Google Assistant等语音助手本质上是受限的Agent,正逐步升级为更自主的智能体。Bill Gates指出,未来Agent可帮助人们处理几乎所有活动,从工作事务到日常琐事,对软件业和整个社会带来深远影响 (AI智能体创业必读,详解AI Agent市场格局、技术路径与未来市场__财经头条)。可以想见,不久的将来,我们会将繁杂的日程安排、邮件总结、网购比价等交给个人AI助理打理。而在企业领域,智能体可充当虚拟员工,执行客服应答、报表分析、业务监控等任务。最初这些应用会出现在逻辑相对简单、对出错容忍度高的场景,随后逐步扩展到任务复杂、要求高可靠的场景 (AI智能体概念爆发 汉得信息、中亦科技等涨停)。办公自动化、财务分析、市场营销等通用领域,以及能源、金融、教育等垂直行业,都被视为AI Agent大展身手的舞台 (AI智能体概念爆发 汉得信息、中亦科技等涨停)。总体而言,通用AI Agent有望像智能手机一样从消费级助手起步,进而渗透进各行各业,形成个人用户—企业—行业全覆盖的庞大生态。
创业公司的机会点与差异化策略
面对巨头环伺,创业公司在AI Agent领域仍有可为之处。当前一些先锋产品展现了差异化路线:
Manus(通用执行型 Agent):由中国创业团队Monica推出的 Manus 被称为“全球第一款通用Agent”,近期内测引发刷屏关注 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)。不同于传统聊天助手,Manus注重自主行动能力:可在自己的沙盒环境中独立思考、规划步骤并调用工具执行任务,直接产出最终成果 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)。它能够编写并运行代码、智能浏览网页、操作各类在线应用,实现从想法到行动的一条龙。例如用户提出“整理行业调研报告”这样复杂需求,Manus能自主检索数据、汇总分析并输出报告,而不仅是给建议。 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)官方展示的40个案例涵盖个性化旅行规划、股票分析、课程开发、保险方案比较、供应商采购等广泛领域 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网),显示出通用执行的雏形。更引人瞩目的是,Manus在通用Agent评测基准 GAIA 上创下新纪录,性能远超OpenAI类似产品,证明了技术领先性 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)。Manus的成功点在于广度+深度:任务覆盖面广,同时执行质量据称优于竞品 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)。它背后的Monica公司先通过实用工具(如ChatGPT for Google浏览器插件)积累了上千万用户,再迭代出通用Agent (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)。局限:尽管号称通用,Manus离真正的人工通用智能仍有距离。业内评价认为,它相当于自动驾驶从L2提升到L3的阶段,尚未解决模型能力提升、自主学习、任务迁移泛化等难题 (这个中国 AI 产品一夜刷屏,全网都在要邀请码,可能是 DeepSeek 后最大惊喜)。目前Manus仍在内测,真实环境下能否保持可靠执行有待验证。
OpenAI DeepResearch(专业知识型 Agent):OpenAI在ChatGPT中上线的“Deep Research”代理侧重知识分析场景。用户给定主题或问题后,它会自主在网上搜索、阅读海量资料,并在几十分钟内产出详细报告。目标用户是金融、科研、政策等领域需要深度资料调研的人士。DeepResearch采用OpenAI新模型o3,结合内部的多步Agentic框架,驱动LLM像人类研究员一样先列计划、再逐步找资料、整理归纳。其输出包含清晰的来源引注,方便核查。在GAIA综合智能助理评测中,DeepResearch单步回答正确率达67%,多步骤复杂问题也有近48%的解答率,明显优于以往模型。局限:高性能的代价是高门槛和高成本。DeepResearch目前仅向每月$200的专业订阅用户开放,每位用户每月限100次此类查询。每次完整报告可能执行数百次检索调用,耗时长且计算费用昂贵。这意味着在商业价值上,它适合高价值低频的调研任务。即便如此,OpenAI也警告DeepResearch可能出现信息幻觉或引文格式错误,建议用户对结果进行核实。因此在可靠性和普适性上,它还有改进空间,暂不适合作为日常的全面智能助理。
Devin(垂直编程代理):美国初创公司Cognition推出的 Devin 是全球首个定位为“AI程序员”的Agent。Devin主攻软件开发领域:通过Slack对话接口接收开发任务,在云端自动启动自己的IDE环境(带浏览器、终端等),自主完成编码、调试、部署等一系列工作。例如团队成员在Slack里分配一个bug修复或小功能开发任务,Devin就会生成解决方案计划,经确认后自动修改代码、运行测试并提交Pull Request。它具备自主学习未知框架、端到端构建应用、自动改Bug的能力;甚至还能微调自身的大模型来提升特定任务表现。Devin在程序员圈引起轰动:据称已经通过了一家AI公司的工程师面试,并能在自由职业平台上独立接单完成项目。“会写代码、能上岗”的AI让开发者既兴奋又忧虑,有评论称“AI Agent的时代已经开始”。局限:Devin目前仍是面向团队的高端产品,其订阅价高达每月$500(约3600元人民币)。如此昂贵的定价被认为不适合个人或小团队,只对资金充裕、追求前沿效率的大型开发团队有吸引力。另外,Devin采用Slack作为主要交互界面,有用户反馈这种工作流不够直观,可能扰乱现有开发流程。在代码质量上,测试者也指出Devin有时会引入不必要的依赖,生成的代码需要工程师二次审核。因此,Devin虽然证明了AI在特定垂直的可行性,但短期内更适合作为“人类程序员的加速器”而非完全替代者。
创业机会与差异化切入:从上述案例可以看出,创业公司在AI Agent领域找到了不同于大厂的切入点和优势:
聚焦垂直场景,深耕专业领域:与其试图打造无所不能的通用Agent,不如选择一个高价值垂直场景切入,提供定制化的解决方案。垂直Agent可以结合领域知识和专有数据进行微调,往往在性能和成本上胜过通用大模型。例如Devin专注编程领域,理解软件开发流程,因此在代码处理上效果优于汎用助手;又如一些创业公司正在开发法律助理、医学顾问等专业Agent,通过内置行业知识库提高准确率。垂直切入能让创业团队避开与大厂在通用认知能力上的直接竞争,用专业深度建立壁垒。
打造差异化的用户体验:大厂Agent往往面向普罗大众,功能广而接口通用,这给了创业者在用户体验和场景整合上创新的空间。创业公司可以针对特定人群的工作流做深度优化,例如将Agent无缝嵌入某些专业软件中,提供“一键式”的智能助手体验。Embra、Dust等初创产品就主打个人生产力提升,把Agent融入笔记应用、IDE等,提高了易用性。又如Devin选择Slack作为切入点,就是为了贴近开发团队日常协作环境。未来创业者可以探索更多样的交互形态(比如浏览器插件、手机虚拟形象、VR助手等),以场景化体验争取用户青睐。
善用开源和低成本方案:大厂的优势在于顶尖的大模型,但其服务往往价格高、封闭黑箱。创业团队可以利用开源模型和自主可控的框架,提供成本更低、隐私友好的Agent方案。例如,采用本地部署的大语言模型为企业打造内部Agent,既避免数据外泄,又节省API开支。这类“开源+私有部署”的模式对有合规要求的客户很有吸引力,是创业公司可抓住的机会点。此外,围绕开源社区构建生态也有助于与大厂抗衡。通过开源核心代码吸引开发者参与,再提供企业级增值服务,创业公司能以较小投入获得社区贡献和口碑传播。
创新商业模式与服务定位:在通用Agent尚未成熟的阶段,创业者可以**“小切口切入,大市场拓展”。前期以服务/咨询形式切入,为企业定制智能体解决具体问题,在实践中打磨产品。当技术和数据积累到一定程度,再模块化封装为标准产品。这样的路线可以规避纯软件订阅模式在早期的不确定性。同时,可以探索Agent商城或任务经济**等新模式:搭建一个平台,让用户按需调用预训练的智能体完成任务并付费(类似AI任务版的自由职业市场)。这种模式下,创业公司充当平台方,聚合各种专长的Agent,抽取佣金,既降低了研发单一全能Agent的难度,又能随着应用丰富水涨船高。
总之,创业公司应充分发挥“小船好调头”的优势,在大厂未深耕或不敏捷的细分领域做出特色。正如业内所言,病毒式传播和利基用例是赢得通用Agent竞赛的关键。通过满足特定用户群体的强需求并打造口碑,创业项目有望在巨头林立的Agent时代占据一席之地。
结论与建议:创业公司的定位策略
综上所述,通用 AI Agent 将是未来科技版图的重要组成部分,大厂几乎必然会深度参与这一领域并塑造主要格局。对于创业公司而言,直接与大厂比拼开发“万能智能体”并不明智。更可行的策略是扬长避短,选择切入点巧妙布局:
以垂直突破带动横向扩展:建议优先从某个垂直领域或具体功能切入,做深做透。先成为该领域的专家级Agent,解决用户痛点,建立数据和用户基础。例如,把AI Agent定位为“最懂医疗诊断的助手”或“最会做财务报表的AI会计”。当垂直领域站稳脚跟后,再逐步拓展Agent的技能树,向通用领域演进。这种路径既能靠专精取得短期收益,也为长期朝通用智能迈进做好了准备。
避开正面冲突,寻求差异价值:与其在模型参数规模上拼不过巨头,不如在价值链的其他环节寻找突破。可以定位为大厂AI Agent的增益配套:比如专注提供Agent监控、安全管控工具,成为通用Agent生态中的“安全卫士”;或者专做Agent应用的集成平台,方便企业将各种智能体接入自己的业务系统。这样既绕开了直接竞争,又能借势大厂教育市场之东风,迅速找到客户。换言之,创业公司可以成为“大厂通用Agent生态中的专业供应商”,提供巨头未覆盖的功能。
强调定制化与本地化:大厂的通用Agent往往针对全球通用需求,创业者则可主打定制服务。针对特定行业、特定语言文化、特定企业的要求,对Agent进行个性化调优,使其表现和体验超出通用版本。比如面向国内用户,在支持本地语言、多模态输入输出、本土工具插件方面下功夫,打造更接地气的智能体。又或者为企业用户提供从部署、培训到维护的一站式方案,充当“AI智能体顾问”。这种深度定制与贴身服务是大厂规模化产品难以提供的,从而形成差异化优势。
审慎评估直接开发通用Agent的可行性:创业团队若资源有限,不建议贸然挑战通用AI Agent的全覆盖。与其野心勃勃却可能四处受限,不如务实聚焦在能力圈内。除非在推理算法、强化学习等底层有重大创新,能够在“小模型大能力”上实现突破,否则硬碰硬做通用Agent,容易陷入和巨头拼算力、拼数据的消耗战。在当前阶段,更适合的思路是在**“小通用、大垂直”**之间找平衡——即Agent具有一定通用框架,但在几个关键场景上有深度打磨的能力。这样既保留扩展余地,又确保现阶段产品的实用性。
结语:通用 AI Agent 代表着人机交互与自动化的新范式,大厂的进入虽提高了竞争门槛,但也预示着广阔的市场蓝海。对创业公司来说,关键在于找准定位,以敏捷创新填补大厂未顾及的空白。从垂直领域切入、打造差异化优势,既能顺势而为借助大厂培育的市场认知,又能避实击虚地建立自身护城河。在这个跑道上,小团队只要策略得当、专注执行,同样有机会跑出自己的精彩——或许不会去正面迎击巨头的通用Agent,但完全可以成为细分场景下不可或缺的智能体专家。正如一位行业专家预测,在未来十年内,将涌现多家由自主智能体驱动运营的数十亿美元级公司。下一个独角兽,未必不可以诞生于今天勇敢拥抱AI Agent浪潮的创业者之中。
参考文献:
- OpenAI 发布“Deep Research”代理的新闻报道
- PCMag 对 OpenAI Deep Research 的介绍与性能说明
- 新浪科技对中国通用Agent产品 Manus 的报道 (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网) (全球第一款通用Agent!中国AI产品Manus一夜刷屏|AI_新浪科技_新浪网)
- NBC 新闻对 Meta 即将推出 Llama 4 驱动 AI Agent 的报道
- Reuters 对亚马逊 Alexa+ (生成式AI升级) 的报道
- AIbase 对 Devin AI 程序员商业化的新闻摘要
- 虎嗅等媒体对 Devin 技术能力和背景的报道
- 王吉伟《AI智能体创业必读》对AI Agent市场的分析 (AI智能体创业必读,详解AI Agent市场格局、技术路径与未来市场__财经头条)
- 王吉伟《AI智能体创业必读》对Agent分层架构及竞争要素的解读
- Lilian Weng (OpenAI) 对 LLM Agent 关键组件的阐述
- Shanxi Securities 对AI Agent应用领域演进的研判 (AI智能体概念爆发 汉得信息、中亦科技等涨停)
- Bill Gates 关于 Agent 将影响各领域的观点引述 (AI智能体创业必读,详解AI Agent市场格局、技术路径与未来市场__财经头条)
- HuggingFace 博客对 GAIA 基准和开源 DeepResearch 框架的说明
- 其他参考资料等。