智能体架构的真相:90%是软件工程,10%是AI
过去两年,AI智能体(AI Agent)成为AI落地的热门方向。从 ChatGPT 的对话助手,到自动化办公、代码助手,再到多智能体协作平台,智能体被视为未来人机交互的核心形态。然而在实际落地中,很多企业会发现一个残酷现实:构建一个真正可用的智能体,90% 的工作是软件工程,只有 10% 才是 AI。这一观点最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出,并在业内引发了
·
过去两年,AI智能体(AI Agent)成为AI落地的热门方向。从 ChatGPT 的对话助手,到自动化办公、代码助手,再到多智能体协作平台,智能体被视为未来人机交互的核心形态。
然而在实际落地中,很多企业会发现一个残酷现实:
构建一个真正可用的智能体,90% 的工作是软件工程,只有 10% 才是 AI。
这一观点最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出,并在业内引发了广泛共鸣。本文将深入解析这背后的逻辑。

图 Gohel(linkedin)
一、为什么智能体是 90% 软件工程、10% AI?
表面上,智能体看起来只是一个能理解自然语言、会自动生成结果的“大模型应用”。但真正的企业级智能体落地,远不止一个 LLM:
- AI 模型只解决“脑子”的问题
- 理解任务、规划步骤、生成内容或结果
- 这一部分就是“10% AI”
- 软件工程支撑智能体的整个“身体和神经系统”
- 用户交互、权限控制、任务编排、数据流转、工具调用、日志监控、异常回滚
- 这些工作是“90% 软件工程”,没有它们,智能体无法稳定运行
用一句话概括:
AI 决定智能体“懂不懂”,软件工程决定它“能不能干活”。
二、AI智能体的冰山模型
为了直观说明这 90/10 的关系,我们可以用冰山模型来理解智能体架构:
1. 水面上的 10%:用户可见的 AI
- 内容:自然语言交互、意图理解、文本/代码/报表生成
- 典型体验:
- C端:ChatGPT、文心一言、通义千问、Cursor
- B端:智能工单助手、报销自动审核、代码自动补全
- 核心能力:
- 大模型(LLM)语义理解与生成
- 基础任务规划与工具选择
用户看到的“智能”部分,其实只是冰山一角。
2. 水面下的 90%:支撑智能体运行的软件工程
这部分是企业真正的建设难点,主要包括:
- 前端与交互层
- Web端、移动端、企业IM(钉钉/飞书)入口
- 对话UI、任务面板、状态可视化
- 记忆与上下文管理
- 长短期对话记忆、任务链状态、文档缓存
- 典型实现:向量数据库(Milvus)、Redis/ES
- 身份认证与权限控制
- 企业级 SSO、AD/LDAP、API网关鉴权
- 确保智能体任务执行可控、可审计
- 工具与执行层
- RPA、OCR、知识库、企业系统API
- 智能体的“手脚”,完成具体任务
- 智能体编排与调度(Orchestration)
- 多智能体协作、任务拆解、工具路由
- 只有少部分是AI推理,大部分是工程逻辑和任务管理
- 可观测与日志追溯
- 任务状态监控、错误处理、操作日志
- B端智能体必须“看得见它在干活”,否则无法信任
- 数据与基础设施
- ETL、数据库、向量库、云原生容器、GPU/CPU集群
- 保障性能、可扩展性和低成本运行
总结:水面下的 90% 负责让智能体“落地、稳定、可控、可追溯”,而非展示“聪明”。
三、为什么这个比例对企业落地很重要
- 防止高估AI能力
- 只关注模型而忽视工程建设,智能体很快失效或不可控
- 指导架构设计
- 把智能体当作软件系统,而不是单个模型
- 先规划好 Workflow、权限、数据、日志、工具集成
- 明确团队建设方向
- 90% 的工作需要软件工程、架构、运维人才
- 只有 10% 是 Prompt、模型微调或推理优化
- 解释为什么B端落地难、C端快
- C端重体验,轻工程,冰山顶部就能跑 MVP
- B端重交付,必须把冰山底部的 90% 建完整
更多推荐

所有评论(0)