人工智能并不神奇,也不是“只需建立一个人工智能程序,然后看着利润滚滚而来”那么简单。现实是,大多数人并没有真正理解人工智能是什么。
少数这样做的人(不到 5%)经常尝试构建自己的解决方案,但最终以失败告终。代理可能会产生幻觉、忘记任务进度或在错误的时间错误地触发工具。虽然演示可能完美运行,但在生产中一切都会崩溃。
我花了一年多的时间来部署人工智能程序。我的职业生涯始于 Meta,但六个月前,我离开并创办了一家专注于为企业部署生产级人工智能代理的公司。我们的年度经常性收入已达到 300 万美元,并且仍在持续增长。这并不是因为我们更聪明,而是反复试验、犯错、无数次失败、最终破解成功公式的结果。
以下是我学到的有关构建实际工作代理的知识。无论您的经验水平如何(初学者、专家或介于两者之间),这些见解都适合您。
第一课:上下文就是一切
这听起来似乎很明显,而且您可能以前听说过。但它的重要性怎么强调也不为过。许多人认为构建代理意味着将一些工具串在一起:选择一个模型,开放数据库访问,然后让它运行。由于以下几个原因,这种方法会立即失败:
代理不了解优先事项。他们忘记了几步前发生的事情,只看到现在,然后猜测接下来会发生什么(通常是错误的),将结果留给机会。
背景是百万美元代理和毫无价值的代理之间的真正区别。重点优化这些领域:
代理记忆:不仅仅是当前任务,还有导致该任务的完整历史记录。例如,在处理发票异常时,代理商需要知道异常是如何发生的、谁提交了发票、适用哪些政策以及以前与供应商的问题是如何解决的。如果没有这个,代理就只是猜测——比根本没有代理更糟糕。人类可能已经解决了这个问题。这就是为什么人们抱怨“人工智能太难用了。”
信息流:通过多个代理或多步骤流程,信息必须在各个阶段之间准确传输,不会丢失、损坏或误解。对请求进行分类的代理必须向解决问题的代理提供干净、结构化的上下文。如果切换不精确,下游的一切都会崩溃。这意味着每一步都需要可验证的结构化输入和输出。例如,Claude Code 的 /compact 功能在 LLM 会话之间传递上下文。
领域专业知识:审查法律合同的代理人需要了解哪些条款重要、如何评估风险以及公司的实际政策。你不能只是转储文件并期望代理能够解决问题——那是你的工作。您必须以结构化的方式提供资源,以便代理真正获得领域知识。
糟糕的上下文管理看起来像这样:代理重复调用相同的工具,因为他们忘记了答案,由于错误的信息而调用错误的工具,做出与先前步骤相矛盾的决策,或者将每项任务视为全新的,忽略了过去类似任务的清晰模式。
良好的上下文管理可以让代理像经验丰富的业务专家一样操作——无需明确的指示即可连接信息。
上下文是将“仅演示”代理与实际在生产中交付的代理区分开来的因素。
第二课:AI 代理乘以输出
错误的想法:“有了这个,我们就不需要雇用了。”
正确的想法:“有了这个,三个人就可以完成以前需要十五个人完成的事情。”
代理最终将取代一些体力工作——否认这是一厢情愿的想法。好处是:代理不会取代人类判断,但会消除围绕它的摩擦 - 搜索数据、收集信息、交叉检查、格式化、分配任务、发送提醒等等。
以财务团队为例:他们仍然对异常情况做出决策,但对于代理来说,他们不会在最后一周花费 70% 的时间来寻找丢失的文件。这 70% 用于实际解决问题。代理人负责基础工作;人类进行最终审查。在我的客户工作中,公司并没有裁员。员工从繁琐的体力工作转向更高价值的任务——至少目前是这样。从长远来看,随着人工智能的发展,这种情况可能会改变。
真正受益的公司不是那些试图裁员的公司,而是那些意识到大多数员工时间都花在“设置工作”而不是创造价值的公司。
设计代理时要考虑到这一点,准确率不再是一个痴迷:代理做他们擅长的事情;人们做他们最擅长的事情。
这可以让您更快地部署。代理不需要处理每种边缘情况 - 只需涵盖常见场景并将复杂的异常交给具有足够上下文的人员以快速解决。就目前而言,这是正确的方法。
第三课:内存和状态管理
代理如何在任务内和跨任务保留信息决定了可扩展性。
三种常见模式:
独立代理:管理整个工作流程的开始到结束。最容易构建,因为所有上下文都是集中的。但随着工作流程的增长,状态管理变得困难——代理必须记住第三步中的决策并在第十步中应用它们。如果上下文窗口已满或内存结构关闭,则后期决策缺乏早期上下文,从而导致错误。
并行代理:同时处理问题的不同部分。速度更快,但会带来协调挑战——如何合并结果?如果代理人不同意怎么办?您需要明确的协议来整合信息并解决冲突,通常需要有“裁判”(人类或法学硕士)来处理争议或竞争条件。
协作代理:按顺序传递任务。代理 A 分类,B 研究,C 执行。适合阶段明确的工作流程,但交接是弱点——A 的见解必须以可用的格式转移到 B。
常见错误:将这些视为“实施计划”。它们实际上是定义代理功能的架构选择。
例如,建立销售合同审批代理意味着要做出决定:应该由一个代理完成所有工作,还是应该由路由代理委托专家进行定价、法律和执行审核?只有您知道您的实际业务流程,并且您需要将其传授给您的代理。
如何选择?取决于每个阶段的复杂性、必须传递多少上下文以及您是否需要实时协作或顺序执行。
选择错误的架构,您将花费数月的时间来调试不是错误的东西 - 它们是您的设计、问题和解决方案之间的不匹配。
第四课:主动拦截异常 - 不要只是报告
许多人在构建人工智能系统时的第一直觉是创建一个仪表板来显示正在发生的事情。请停止构建仪表板。
仪表板没有帮助。
您的财务团队已经知道收据丢失的情况,销售人员也已经知道哪些合同陷入法律困境。
代理应在问题发生时拦截问题,将其直接交给正确的人员,并提供所有相关信息以便立即解决。
发票缺少文件?不要只是记录它。立即标记它,识别缺失的内容,并将问题连同上下文(供应商、数量、政策、细节)发送给责任方。阻止交易直至解决。这一步很关键;否则,问题会泄漏到整个组织,而你要解决它们就来不及了。
合同审批停滞24小时?不要等待每周例会。自动升级交易详细信息,以便审批者可以快速做出决策,无需深入研究系统。制造紧迫感。
供应商错过了一个里程碑?不要等到有人注意到。在任何人意识到出现问题之前自动触发紧急协议。
您的代理的工作是让问题变得不容忽视且易于解决。
直接暴露问题,而不仅仅是通过仪表板。
这与大多数公司使用人工智能的方式相反:他们用它来“看到”问题,但你应该用它来“强制”快速解决方案。当您的解决率接近 100% 时,请考虑使用仪表板。
第五课:AI 代理与通用 SaaS — 经济学
公司不断购买无人使用的 SaaS 工具是有原因的。
SaaS 很容易购买:演示、报价、需求列表上的复选框。有人认可它并认为已经取得了进展——尽管这种情况很少是真的。
AI SaaS 的最大问题:它就在那里。它不与真实的工作流程集成,而是成为另一种登录方式。您被迫迁移数据,一个月后,您就需要管理另一个供应商。一年后,它被放弃了,但转换成本让它继续存在——创造了“技术债务”。
基于当前系统构建的自定义代理可以避免这些问题。
它们在您现有的工具中运行,不引入新平台,并帮助您更快地工作。代理做工作;人类审查结果。
真正的成本比较不是“开发费用与许可费用”——它要简单得多:
SaaS 会产生技术债务:每一个新工具都意味着需要维护更多的集成、另一个即将过时的系统以及可能被收购、转向或关闭的供应商。
构建您自己的代理可以增强能力:每一项改进都使系统变得更加智能,每一个新的工作流程都扩展了可能性。投资会复利,不会贬值。
我已经说过一年了:通用 AI SaaS 没有未来。行业数据支持了这一点——大多数公司在六个月内放弃了 AI SaaS,并且生产率增长为零。真正的人工智能价值来自定制代理,无论是内部构建还是第三方构建。
这就是代理的早期采用者获得长期结构性优势的原因——他们正在构建越来越强大的基础设施。其他人只是租用他们必须更换的工具。在每月都会发生变化的领域中,即使浪费一周的时间也会对您的路线图和业务造成重大挫折。
第六课:快速部署
如果你的人工智能代理项目需要一年的时间才能启动,那么你就已经失败了。
计划跟不上变化。您的工作流程设计可能与现实不符,而您错过的边缘情况将是最重要的。一年后,人工智能可能会变得面目全非——你的项目可能会过时。
投入生产,最长三个月。
在当今信息饱和的世界中,真正的能力是知道如何有效地使用信息并与之协作。把事情做好:处理真实的任务,做出真实的决定,留下可审计的线索。
我看到的最常见问题:内部团队将三个月的人工智能项目估计为六到十二个月。或者更糟糕——承诺三个月,然后以“意想不到的理由”无休止地拖延。这并不全是他们的错;人工智能确实很复杂。
这就是为什么您需要真正了解人工智能的工程师 - 他们知道如何扩展它,已经看到了现实世界的问题,并了解它的优势和局限性。有太多“半生不熟”的开发人员认为人工智能可以做任何事情——这与事实相去甚远。如果你是一个瞄准企业AI的开发者,你必须掌握它的实际边界。
摘要
以下是可用代理的重要因素:
上下文就是一切:如果没有强大的上下文,代理就只是一个昂贵的随机数生成器。钉钉信息流、持久内存和领域知识嵌入。 “即时工程”是个老笑话,现在“情境工程”是 2.0 版。
设计是为了增强,而不是替代:人们应该做他们最擅长的事情;特工应该为焦点扫清道路。
架构胜过模型选择:在独立、并行或协作代理之间做出选择比选择模型更重要。获得正确的架构。
拦截并解决,而不仅仅是报告和审查:仪表板是问题墓地。构建强制快速解决问题的系统。
快速部署,不断迭代:最好的代理已经在运行和改进,而不是停留在设计上。 (并注意你的截止日期。)
其他一切都是细节。
技术已经准备好了,但你可能还没有。
了解这一点,您就可以将业务扩展 100 倍。
