ChatDev：AI驱动的多智能体软件开发框架

韦元歌Fedora

758人浏览 · 2025-09-02 13:07:25

韦元歌Fedora · 2025-09-02 13:07:25 发布

ChatDev：AI驱动的多智能体软件开发框架

【免费下载链接】ChatDev 该项目利用由大型语言模型（LLM）驱动的多智能体协作技术，以自然语言概念为输入，实现定制化软件的开发过程。项目地址: https://gitcode.com/GitHub_Trending/ch/ChatDev

你是否还在为软件项目从需求文档到最终部署的繁琐流程感到困扰？是否希望有一种方式能将重复的编码、测试、文档工作交给AI团队自动完成？ChatDev作为基于大型语言模型（LLM）的多智能体协作框架，通过模拟虚拟软件公司的组织结构，实现了从自然语言需求到可执行软件的全流程自动化。本文将详细介绍ChatDev的核心架构、使用方法及高级功能，帮助你快速掌握这一革命性开发工具。读完本文后，你将能够：搭建专属AI开发团队、自定义开发流程、生成完整软件产品，并通过可视化工具监控开发全过程。

ChatDev核心架构：虚拟软件公司的智能协作

ChatDev的本质是一个模拟真实软件开发公司的多智能体系统，其核心在于通过精心设计的角色分工和协作流程，将复杂的软件开发任务分解为可并行执行的子任务。系统架构主要包含三个层级：智能体角色层、开发流程层和工具支持层，三者协同工作实现全流程自动化。

多智能体角色分工

ChatDev定义了多种专业化智能体角色，每个角色承担特定职责并通过自然语言交互协作。核心角色包括：

执行长（CEO）：负责需求分析和决策制定，对应配置文件RoleConfig.json中的"Executive Officer"定义
技术总监（CTO）：决定技术栈和架构设计，如PhaseConfig.json中"LanguageChoose"阶段的技术选型
程序员（Programmer）：负责代码编写与实现，在chatdev/phase.py的CodingPhase类中定义其工作流程
测试工程师（Tester）：执行自动化测试并生成报告，对应TestPhase中的测试用例生成逻辑

这些角色通过预定义的提示词模板进行交互，例如CTO在选择编程语言时会参考需求描述和技术可行性，其决策逻辑在phase.py的LanguageChoose类中实现：

class LanguageChoose(Phase):
    def update_chat_env(self, chat_env) -> ChatEnv:
        if len(self.seminar_conclusion) > 0 and "<INFO>" in self.seminar_conclusion:
            chat_env.env_dict['language'] = self.seminar_conclusion.split("<INFO>")[-1].lower().replace(".", "").strip()
        elif len(self.seminar_conclusion) > 0:
            chat_env.env_dict['language'] = self.seminar_conclusion
        else:
            chat_env.env_dict['language'] = "Python"
        return chat_env

角色间的协作通过"研讨会"机制实现，每个开发阶段会触发特定角色组合的讨论，例如需求分析阶段由CEO和CTO主导，而代码审查阶段则由程序员和测试工程师参与。这种专业化分工确保了每个任务都由最适合的智能体完成，提高了整体开发质量。

ChatChain开发流程引擎

ChatDev的开发流程由ChatChain（聊天链）定义，它是一系列有序执行的开发阶段（Phase）的集合。默认配置下的开发流程如图所示：

该流程包含八个关键阶段，按顺序执行：

需求分析（Demand Analysis）：确定软件形态和核心功能
语言选择（Language Choose）：根据需求确定编程语言
编码（Coding）：生成初始代码框架
代码补全（CodeCompleteAll）：完善函数和类定义
代码审查（CodeReview）：自动检查并修复代码问题
测试（Test）：运行软件并根据测试报告修改代码
环境文档（EnvironmentDoc）：生成依赖配置文件
用户手册（Manual）：创建软件使用文档

每个阶段的执行逻辑在chatdev/phase.py和chatdev/composed_phase.py中实现，例如测试阶段会循环执行测试用例生成、代码运行和错误修复，直至所有测试通过。流程定义文件ChatChainConfig.json控制阶段的执行顺序和循环次数，通过修改此文件可自定义开发流程。

核心技术模块

ChatDev包含多个关键技术模块，提供开发过程所需的各项支持功能：

Camel组件：camel/目录下实现了智能体角色扮演和对话管理功能，基于Camel框架开发
经验学习模块：ecl/（Experiential Co-Learning）实现智能体经验积累和复用，通过MemoryCards.json存储可复用开发经验
可视化工具：visualizer/目录提供基于Flask的Web界面，支持实时监控开发过程和回放历史记录
配置系统：CompanyConfig/目录下的JSON文件定义了公司组织结构、开发流程和角色行为，是定制ChatDev的核心

这些模块协同工作，为智能体提供开发所需的知识、工具和环境支持，确保开发过程顺利进行。

快速上手：从安装到生成第一个软件

ChatDev提供简洁的命令行接口，使普通用户也能快速搭建AI开发团队并生成软件。整个过程只需三个步骤：环境准备、执行命令、运行结果，无需编写任何代码即可完成软件生成。

环境搭建

ChatDev基于Python开发，支持3.9及以上版本。推荐使用conda创建独立环境以避免依赖冲突：

# 克隆仓库
git clone https://link.gitcode.com/i/d1a028b4b984638d66040b62664f5e8e
cd ChatDev

# 创建并激活虚拟环境
conda create -n ChatDev_conda_env python=3.9 -y
conda activate ChatDev_conda_env

# 安装依赖
pip3 install -r requirements.txt

环境配置完成后，需设置OpenAI API密钥作为环境变量（需拥有OpenAI账号和可用API额度）：

Unix/Linux系统：export OPENAI_API_KEY="你的API密钥"
Windows系统：$env:OPENAI_API_KEY="你的API密钥"

对于无法访问OpenAI服务的用户，可修改model_backend.py适配其他LLM服务，但可能需要调整提示词模板以获得最佳效果。

生成软件的基本命令

使用ChatDev生成软件只需一行命令，系统会自动处理从需求分析到代码生成的全过程。基本命令格式如下：

python3 run.py --task "软件需求描述" --name "项目名称" [可选参数]

例如，生成一个简单的待办事项应用：

python3 run.py --task "创建一个具有添加、删除和标记完成功能的命令行待办事项应用" --name "TodoApp"

执行命令后，ChatDev会启动虚拟开发团队，开始分析需求、设计架构、编写代码、测试和文档生成。整个过程通常需要5-15分钟（取决于需求复杂度和网络速度），所有中间结果和最终产物会保存在WareHouse/目录下，生成类似2048_THUNLP_20230822144615的项目文件夹。

生成结果结构解析

软件生成完成后，WareHouse目录下会创建以"项目名称_组织名称_时间戳"命名的文件夹，包含完整的软件产物和开发记录。以TodoApp为例，生成的目录结构如下：

TodoApp_DefaultOrganization_20231025184031/
├── 20231025184031.log          # 开发过程完整日志
├── ChatChainConfig.json        # 使用的流程配置
├── PhaseConfig.json            # 阶段配置
├── RoleConfig.json             # 角色配置
├── TodoApp.prompt              # 用户需求
├── meta.txt                    # 项目元信息
├── main.py                     # 主程序
├── todo_app.py                 # 应用核心代码
├── task.py                     # 任务管理模块
├── requirements.txt            # 依赖列表
└── manual.md                   # 用户手册

使用生成的软件非常简单，只需进入项目目录并运行主程序：

cd WareHouse/TodoApp_DefaultOrganization_20231025184031
pip3 install -r requirements.txt  # 安装依赖
python3 main.py                   # 运行软件

ChatDev支持多种项目类型，包括命令行工具、GUI应用、游戏和实用程序等。仓库WareHouse/目录下提供了多个示例项目，如2048游戏、BMI计算器和贪吃蛇游戏，展示了系统的多样化生成能力。

可视化开发过程

ChatDev提供了直观的Web可视化工具，可实时监控AI团队的开发过程和对话内容。启动可视化服务的命令如下：

python3 visualizer/app.py

服务启动后，访问http://127.0.0.1:8000即可打开可视化界面。主要功能包括：

实时日志：显示智能体对话和系统状态变化，如文件创建、代码修改等
流程可视化：展示当前执行阶段和剩余任务，如图所示：
历史回放：上传日志文件（如项目目录中的timestamp.log）可重现开发过程
角色监控：查看各智能体的工作内容和贡献

可视化工具对于理解AI团队的协作方式、调试自定义配置和教学演示非常有用。特别是在复杂项目中，实时监控可帮助用户及时发现并纠正开发方向偏差。

高级功能：定制化与扩展

ChatDev的强大之处在于其高度的可定制性，用户可根据需求调整组织结构、开发流程和智能体行为，实现个性化的AI开发团队。系统提供多层级的定制选项，从简单的参数调整到复杂的代码修改，满足不同用户的需求。

公司配置定制

ChatDev将开发团队的组织结构和工作方式抽象为"公司配置"（CompanyConfig），通过修改配置文件可快速调整系统行为。默认配置位于CompanyConfig/Default/，包含三个核心文件：

ChatChainConfig.json：定义开发流程，即阶段的执行顺序和参数
PhaseConfig.json：配置各阶段的提示词和参与角色
RoleConfig.json：定义智能体角色的背景和行为模式

系统提供多种预设配置，可通过--config参数选择：

Default：标准开发流程，适合大多数软件项目
Art：添加美术设计阶段，支持生成图像资源，配置文件位于CompanyConfig/Art/
Human：支持人类参与代码审查，实现人机协作开发，如图所示：

例如，使用Art配置生成带图像的软件：

python3 run.py --task "创建一个带有背景图片的2048游戏" --name "Art2048" --config "Art"

自定义配置只需创建新的配置目录并修改相应JSON文件，无需编写代码。对于需要频繁使用特定配置的场景，这种方式既简单又高效。

开发流程定制

对于高级用户，ChatDev支持通过代码修改实现更深度的定制，主要包括自定义阶段（Phase）和复合阶段（ComposedPhase）。自定义开发流程通常需要两个步骤：实现阶段类和配置阶段参数。

自定义简单阶段

简单阶段（SimplePhase）是开发流程的基本单元，表示一个独立的开发活动。创建自定义阶段需继承phase.py中的Phase类并实现关键方法：

class CustomPhase(Phase):
    def update_phase_env(self, chat_env):
        # 从全局环境提取当前阶段所需信息
        self.phase_env.update({
            "task": chat_env.env_dict['task_prompt'],
            "current_code": chat_env.env_dict['code']
        })
    
    def update_chat_env(self, chat_env):
        # 将阶段成果更新到全局环境
        chat_env.env_dict['custom_result'] = self.seminar_conclusion
        return chat_env

然后在PhaseConfig.json中添加配置：

"CustomPhase": {
  "assistant_role_name": "自定义角色",
  "user_role_name": "CEO",
  "phase_prompt": [
    "根据任务: {task}",
    "当前代码: {current_code}",
    "执行自定义处理并返回结果"
  ]
}

最后在ChatChainConfig.json中添加阶段到开发流程：

{
  "phase": "CustomPhase",
  "phaseType": "SimplePhase",
  "max_turn_step": 5,
  "need_reflect": true
}

这种方式适合添加简单的自定义处理步骤，如特殊的代码优化或文档生成。

复合阶段与循环控制

对于复杂的迭代过程，如代码审查和测试，ChatDev提供复合阶段（ComposedPhase）支持，可将多个简单阶段组合成循环执行的复杂流程。复合阶段的实现位于composed_phase.py，典型示例是Test阶段：

class Test(ComposedPhase):
    def break_cycle(self, phase_env) -> bool:
        # 检查是否满足退出条件
        if not phase_env['exist_bugs_flag']:
            log_visualize("**[Test Info]**\n\nAI User: Test Pass!\n")
            return True
        else:
            return False

复合阶段在ChatChainConfig.json中的配置示例：

{
  "phase": "CodeReview",
  "phaseType": "ComposedPhase",
  "cycleNum": 2,
  "Composition": [
    {
      "phase": "CodeReviewComment",
      "phaseType": "SimplePhase",
      "max_turn_step": -1,
      "need_reflect": "False"
    },
    {
      "phase": "CodeReviewModification",
      "phaseType": "SimplePhase",
      "max_turn_step": -1,
      "need_reflect": "False"
    }
  ]
}

上述配置定义了一个包含"评论"和"修改"两个子阶段的代码审查流程，循环执行2次或直到满足退出条件。通过组合简单阶段和控制循环条件，可实现复杂的开发流程逻辑。

经验学习与Git集成

ChatDev引入了经验学习机制，使智能体能够积累并复用开发经验，提高开发效率和质量。同时支持Git版本控制，便于跟踪代码变更和协作开发。

经验学习模块

经验学习（Experiential Co-Learning）功能由ecl/目录下的代码实现，主要包括三个过程：

Co-Tracking：在开发过程中记录关键决策和解决方案
Co-Memorizing：提取经验并存储到MemoryCards.json
Co-Reasoning：在新开发任务中应用过往经验

启用经验学习的命令示例：

# 生成带经验记录的软件
python3 run.py --task "生成一个文本编辑器" --name "TextEditor"

# 提取经验到记忆库
python3 ecl/ecl.py "WareHouse/TextEditor_DefaultOrganization_timestamp" -d

# 使用经验库开发新软件
python3 run.py --task "生成一个Markdown编辑器" --name "MarkdownEditor"

经验学习特别适合相似项目的批量开发，可显著减少重复劳动和错误。系统还提供经验过滤工具ecl/post_process/memory_filter.py，可优化记忆库质量：

python3 ecl/post_process/memory_filter.py 0.9 "ecl/memory/MemoryCards.json" "ecl/memory/MemoryCards_filtered.json"

Git版本控制

ChatDev支持集成Git进行代码版本管理，自动记录开发过程中的代码变更。启用Git模式需修改ChatChainConfig.json：

{
  "git_management": true,
  ...
}

启用后，系统会在生成的软件目录中创建Git仓库，并在关键开发节点自动提交，如：

"Finish Coding"：编码阶段完成后
"Review #1 Finished"：代码审查后
"Test Passed"：测试通过后
"Final Version"：所有阶段完成后

提交历史可通过可视化工具查看，如图所示：。Git集成不仅提供了代码追溯能力，还支持用户在开发过程中手动干预，如修改代码后提交，AI团队会基于最新代码继续开发。

Docker容器化部署

为确保生成软件的可移植性和安全性，ChatDev支持使用Docker容器化部署。Docker镜像包含完整的运行环境，可避免依赖冲突和系统差异问题。构建和使用Docker镜像的步骤如下：

# 构建镜像
docker build -t chatdev:latest .

# 运行容器（需替换API密钥和IP地址）
docker run -it -p 8000:8000 -e OPENAI_API_KEY="你的密钥" -e DISPLAY=你的IP:0 chatdev:latest

# 在容器内生成软件
python3 run.py --task "创建一个计算器应用" --name "DockerCalculator"

# 从容器复制结果到主机
docker cp 容器ID:/app/WareHouse/Calculator_DefaultOrganization_timestamp /本地路径

Docker配置特别适合在服务器环境或共享计算资源上使用ChatDev，也便于将生成的软件分发给其他用户。对于GUI应用，容器需配置显示转发，如在macOS上需安装XQuartz并运行socat命令：

实际应用案例与最佳实践

ChatDev已被广泛应用于各类软件项目开发，从简单工具到复杂应用，展示了其强大的适应性和可靠性。通过分析实际案例和用户反馈，我们总结出一系列最佳实践，帮助你充分发挥ChatDev的潜力，提高软件开发效率和质量。

典型应用场景

ChatDev在多种开发场景中表现出色，以下是几个典型应用案例：

快速原型开发

对于创业团队或独立开发者，ChatDev可快速将创意转化为可演示原型。例如，生成一个简单的BMI计算器只需：

python3 run.py --task "创建一个BMI计算器，输入身高和体重，计算并显示BMI值和健康建议" --name "BMI_Calculator"

系统会自动完成需求分析、代码编写、测试和文档生成，整个过程约5分钟。生成的代码结构清晰，包含核心计算逻辑：

def calculate_bmi(height, weight):
    """Calculate BMI (Body Mass Index)"""
    height_m = height / 100  # convert cm to meters
    bmi = weight / (height_m ** 2)
    return round(bmi, 1)

def get_health_advice(bmi):
    """Provide health advice based on BMI value"""
    if bmi < 18.5:
        return "偏瘦：建议增加营养摄入，适当运动增强体质。"
    elif 18.5 <= bmi < 24:
        return "正常：继续保持健康的生活方式和饮食习惯。"
    elif 24 <= bmi < 28:
        return "超重：建议控制饮食，增加运动量。"
    else:
        return "肥胖：建议咨询医生，制定科学的减重计划。"

生成的项目文件位于WareHouse/BMI_Calculator_DefaultOrganization_timestamp/，包含完整的可执行代码和使用手册。

教育与学习工具

ChatDev是学习软件开发的理想工具，通过观察AI团队的开发过程，初学者可了解专业的开发流程和最佳实践。例如，生成一个Tic-Tac-Toe游戏并研究其代码：

python3 run.py --task "创建一个井字棋游戏，支持双人对战和简单AI" --name "TicTacToe" --config "Art"

Art配置会生成游戏所需的图像资源，最终产品包含：

完整的游戏逻辑代码
图形界面
详细的代码注释
安装和使用说明

通过分析生成的代码和开发日志，学习者可掌握游戏开发的基本概念，如状态管理、用户交互和AI算法。ChatDev甚至可生成教学性质的注释，解释关键代码段的工作原理。

企业级应用开发

对于企业用户，ChatDev可作为辅助开发工具，处理重复性编码任务和文档工作。例如，生成一个员工管理系统的后端API：

python3 run.py --task "创建一个员工管理系统的RESTful API，支持增删改查操作，使用Flask和SQLite" --name "EmployeeAPI" --config "Default"

系统会生成完整的后端服务，包括：

数据库模型定义
API路由实现
请求验证和错误处理
单元测试
API文档

开发团队可基于此基础继续完善，将精力集中在业务逻辑和系统架构上，而非重复的CRUD操作编码。经验表明，ChatDev可减少约40%的基础开发工作量，显著提高团队效率。

提示词工程最佳实践

要获得高质量的生成结果，精心设计需求描述（prompt）至关重要。基于大量用户反馈，我们总结出以下提示词设计原则：

需求描述清晰具体

ChatDev对需求的理解直接影响最终产品质量，描述应包含：

功能列表：明确软件应具备的功能
使用场景：说明软件的使用环境和用户
技术偏好：指定编程语言或框架（可选）
输出格式：要求特定的文件结构或界面风格

好的示例："创建一个命令行天气查询工具，支持通过城市名称查询实时天气和5天预报，使用Python语言和requests库，输出应包含温度、湿度和天气状况图标，代码需有详细注释。"

差的示例："做一个天气应用"（过于模糊，缺乏必要信息）

分阶段开发策略

对于复杂项目，建议采用分阶段开发策略，先构建核心功能，再逐步扩展：

# 第一阶段：核心功能
python3 run.py --task "开发一个博客系统的用户认证模块，包括注册、登录和密码重置" --name "BlogAuth"

# 第二阶段：扩展功能（基于已有代码）
python3 run.py --config "incremental" --path "WareHouse/BlogAuth_DefaultOrganization_timestamp" --task "添加文章发布和评论功能" --name "BlogSystem"

增量开发（--config "incremental"）使AI团队能基于现有代码继续开发，避免重复劳动，也便于用户在每个阶段验证和调整方向。

参数调优

ChatDev提供多个命令行参数可优化生成结果：

--model：选择LLM模型，如"GPT_4"（质量更高）或"GPT_3_5_TURBO"（速度更快）
--org：指定组织名称，用于区分不同项目
--max_turn_step：调整智能体对话轮次，复杂任务可增加

例如，使用GPT-4生成高质量代码：

python3 run.py --task "开发一个机器学习模型训练助手" --name "MLTrainer" --model "GPT_4"

常见问题与解决方案

尽管ChatDev设计初衷是简化软件开发，但在实际使用中仍可能遇到问题。以下是常见问题及解决方法：

生成代码无法运行

这是最常见的问题，通常有以下原因：

依赖缺失：检查requirements.txt是否完整，运行pip3 install -r requirements.txt
路径问题：生成的代码可能假设特定文件结构，确保在项目目录中运行
API限制：某些功能需要外部API密钥，如天气查询需天气API密钥
环境差异：使用Docker容器化运行可解决大多数环境问题

开发过程陷入循环

有时AI团队会在某个阶段反复迭代而无法前进，解决方法包括：

增加最大对话轮次：修改ChatChainConfig.json中的max_turn_step参数
简化需求：拆分复杂任务为多个简单任务
手动干预：使用Human配置参与开发，直接提供解决方案
调整模型：尝试使用更强大的模型如GPT-4

生成结果不符合预期

若软件功能或质量未达预期，可：

提供更详细的需求：补充功能细节和示例
指定参考项目：在需求中提及类似软件作为参考
修改配置文件：调整PhaseConfig.json中的提示词模板
使用经验库：提供相关项目的MemoryCards.json引导开发方向

通过这些方法，大多数问题都能得到有效解决。对于持续存在的问题，建议在项目目录中查看详细日志文件，分析智能体对话过程，定位问题根源。

总结与展望

ChatDev作为基于LLM的多智能体协作框架，通过模拟虚拟软件公司的组织结构和开发流程，实现了从自然语言需求到可执行软件的全流程自动化。本文详细介绍了ChatDev的核心架构、使用方法和高级功能，包括：

多智能体协作：通过CEO、CTO、程序员等角色分工，实现专业化开发
全流程自动化：从需求分析到测试部署的完整开发周期支持
高度可定制：通过配置文件和代码修改，适应不同开发需求
可视化监控：实时查看开发过程和智能体对话

ChatDev的应用显著降低了软件开发门槛，使非专业人士也能创建实用软件，同时为专业开发者提供了高效的辅助工具。随着LLM技术的不断进步，我们可以期待ChatDev在以下方向进一步发展：

多模态输入输出：支持图像、语音等非文本需求和结果展示
更强的错误修复能力：提高复杂bug的自动修复率
领域专精模型：针对特定行业如金融、医疗的定制化智能体
实时协作功能：支持多人同时与AI团队交互，共同开发软件

无论你是希望快速原型化创意的创业者、需要提高效率的开发人员，还是想学习编程的初学者，ChatDev都能为你提供强大的支持。立即尝试安装ChatDev，体验AI驱动的未来软件开发方式！

行动号召：点赞收藏本文，关注项目更新，下期将介绍"如何使用ChatDev定制行业专用AI开发团队"。如有特定需求或问题，欢迎在评论区留言讨论。

ModelEngine社区

更多推荐

从崩溃到自愈：Temporal+MCP-Agent构建永不中断的AI工作流

你是否遇到过AI工作流执行到90%突然崩溃的绝望？训练了数小时的模型因服务器重启前功尽弃？团队协作时因某人未及时审批导致整个流程停滞？本文将展示如何通过Temporal与MCP-Agent的深度集成，彻底解决这些痛点，构建真正企业级的可靠AI工作流系统。读完本文你将掌握：- 3行代码实现工作流故障自愈- 零停机升级正在运行的AI任务- 跨团队协作的工作流信号机制- 从本地开发到生产集群