智能体架构的真相：90%是软件工程，10%是AI

过去两年，AI智能体（AI Agent）成为AI落地的热门方向。从 ChatGPT 的对话助手，到自动化办公、代码助手，再到多智能体协作平台，智能体被视为未来人机交互的核心形态。然而在实际落地中，很多企业会发现一个残酷现实：构建一个真正可用的智能体，90% 的工作是软件工程，只有 10% 才是 AI。这一观点最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出，并在业内引发了

MrJson-架构师

467人浏览 · 2025-08-26 13:48:42

MrJson-架构师 · 2025-08-26 13:48:42 发布

过去两年，AI智能体（AI Agent）成为AI落地的热门方向。从 ChatGPT 的对话助手，到自动化办公、代码助手，再到多智能体协作平台，智能体被视为未来人机交互的核心形态。

然而在实际落地中，很多企业会发现一个残酷现实：

构建一个真正可用的智能体，90% 的工作是软件工程，只有 10% 才是 AI。

这一观点最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出，并在业内引发了广泛共鸣。本文将深入解析这背后的逻辑。

图 Gohel（linkedin）

一、为什么智能体是 90% 软件工程、10% AI？

表面上，智能体看起来只是一个能理解自然语言、会自动生成结果的“大模型应用”。但真正的企业级智能体落地，远不止一个 LLM：

AI 模型只解决“脑子”的问题

理解任务、规划步骤、生成内容或结果
这一部分就是“10% AI”
软件工程支撑智能体的整个“身体和神经系统”
用户交互、权限控制、任务编排、数据流转、工具调用、日志监控、异常回滚
这些工作是“90% 软件工程”，没有它们，智能体无法稳定运行

用一句话概括：

AI 决定智能体“懂不懂”，软件工程决定它“能不能干活”。

二、AI智能体的冰山模型

为了直观说明这 90/10 的关系，我们可以用冰山模型来理解智能体架构：

1. 水面上的 10%：用户可见的 AI

内容：自然语言交互、意图理解、文本/代码/报表生成
典型体验：
- C端：ChatGPT、文心一言、通义千问、Cursor
- B端：智能工单助手、报销自动审核、代码自动补全
核心能力：
- 大模型（LLM）语义理解与生成
- 基础任务规划与工具选择

用户看到的“智能”部分，其实只是冰山一角。

2. 水面下的 90%：支撑智能体运行的软件工程

这部分是企业真正的建设难点，主要包括：

前端与交互层

Web端、移动端、企业IM（钉钉/飞书）入口
对话UI、任务面板、状态可视化
记忆与上下文管理
长短期对话记忆、任务链状态、文档缓存
典型实现：向量数据库（Milvus）、Redis/ES
身份认证与权限控制
企业级 SSO、AD/LDAP、API网关鉴权
确保智能体任务执行可控、可审计
工具与执行层
RPA、OCR、知识库、企业系统API
智能体的“手脚”，完成具体任务
智能体编排与调度（Orchestration）
多智能体协作、任务拆解、工具路由
只有少部分是AI推理，大部分是工程逻辑和任务管理
可观测与日志追溯
任务状态监控、错误处理、操作日志
B端智能体必须“看得见它在干活”，否则无法信任
数据与基础设施
ETL、数据库、向量库、云原生容器、GPU/CPU集群
保障性能、可扩展性和低成本运行

总结：水面下的 90% 负责让智能体“落地、稳定、可控、可追溯”，而非展示“聪明”。

三、为什么这个比例对企业落地很重要

防止高估AI能力

只关注模型而忽视工程建设，智能体很快失效或不可控
指导架构设计
把智能体当作软件系统，而不是单个模型
先规划好 Workflow、权限、数据、日志、工具集成
明确团队建设方向
90% 的工作需要软件工程、架构、运维人才
只有 10% 是 Prompt、模型微调或推理优化
解释为什么B端落地难、C端快
C端重体验，轻工程，冰山顶部就能跑 MVP
B端重交付，必须把冰山底部的 90% 建完整

ModelEngine社区

更多推荐

从零到一：AutoAgent多语言支持实现全球化AI应用的完整指南

你是否正在为AI应用的全球化部署而烦恼？当你的智能体（Agent）只能理解单一语言时，如何突破地域限制触达全球用户？本文将通过三个关键步骤，带你掌握AutoAgent的多语言支持能力，让你的AI应用无缝适配不同语言环境，轻松实现全球化布局。读完本文，你将获得：多语言架构设计思路、自动化翻译工作流搭建方法，以及本地化测试的完整流程。## 多语言支持的商业价值在全球化背景下，语言支持能力直接影

ModelEngine社区

从崩溃到自愈：Temporal+MCP-Agent构建永不中断的AI工作流

你是否遇到过AI工作流执行到90%突然崩溃的绝望？训练了数小时的模型因服务器重启前功尽弃？团队协作时因某人未及时审批导致整个流程停滞？本文将展示如何通过Temporal与MCP-Agent的深度集成，彻底解决这些痛点，构建真正企业级的可靠AI工作流系统。读完本文你将掌握：- 3行代码实现工作流故障自愈- 零停机升级正在运行的AI任务- 跨团队协作的工作流信号机制- 从本地开发到生产集群

ModelEngine社区

智慧农业新范式：AutoAgent零代码构建作物生长决策系统

你还在为农业数据分散难以整合而烦恼？还在为复杂的灌溉决策模型编写代码耗费数周时间？AutoAgent农业自动化决策系统让你用自然语言描述需求，即可构建专业级作物管理解决方案。本文将展示如何在15分钟内搭建智能灌溉决策系统，无需编写任何代码，让农业专家专注于业务逻辑而非技术实现。读完本文你将获得：- 3步零代码构建农业决策流程的具体操作- 多传感器数据自动整合的实现方案- 基于历史数据的产