【LazyLLM】00 LazyLLM简介

商汤科技推出开源框架LazyLLM，旨在降低AI应用开发门槛。该框架支持低代码开发（最少10行代码），提供标准化工作流组件，实现多Agent协同、RAG检索等功能。特性包括跨平台部署、多模型支持、自动参数优化等，适用于从初学者到专业开发者的各类场景。核心模块涵盖文档处理、向量生成、智能体交互等，典型应用包括天气查询、知识库问答等复杂场景。通过模块化设计，LazyLLM简化了AI应用开发流程，提升迭

亦青Official

803人浏览 · 2025-10-22 15:27:56

亦青Official · 2025-10-22 15:27:56 发布

LazyLLM 是商汤科技大装置事业群开源的低代码多 Agent 大模型应用开发框架，核心目标是降低 AI 应用开发门槛，让开发者以极少代码（低至 10 行）、“搭积木” 式快速构建复杂的多 Agent 应用，同时支持灵活迭代与跨平台部署。

一、核心定位

开发主体：商汤科技大装置事业群，沉淀内部 AI Native 开发范式与经验开源。
核心价值：解决开发者 “代码量大、工程化复杂、迭代效率低” 的痛点，无需深厚大模型技术背景，即可实现多 Agent、RAG、多模态等复杂应用落地。
适用人群：从初学者到专业开发者，覆盖快速原型验证、企业级应用开发等场景。

二、核心特性

1. 低代码积木式开发

提供 Pipeline（管道）、Parallel（并行）、Diverter（分流）、Loop（循环） 等标准化工作流组件，支持任意函数 / 模块的灵活组合。
示例：通过ReactAgent组件快速组装 “大模型 + 工具” 的 Agent 应用，仅需注册工具、配置 Prompt 即可实现交互逻辑。

2. 多 Agent 与跨平台兼容

原生支持多 Agent 协同架构，可实现意图识别、知识库检索、多模型调用的串联。
跨环境无缝迁移：无需修改代码，即可在Windows/macOS/Linux系统，或裸金属服务器、Slurm 集群、公有云等 IaaS 平台部署。

3. 模型与检索灵活集成

多平台模型支持：在线调用 OpenAI、智谱、Kimi、豆包、商汤日日新等平台模型，离线支持本地模型推理与微调。
内置 RAG 全流程能力：覆盖文档解析（支持 PDF/DOCX/PPT 等格式）、Embedding（在线 / 离线模型）、检索（BM25 / 余弦相似度）、重排（Reranker 组件），并提供 “多路召回、小块检索 + 大块生成” 等优化策略。

4. 高效迭代与优化

自动参数优化：支持网格搜索，自动尝试不同基模型、检索策略、微调参数，快速找到最佳配置。
轻量化微调：根据场景自动选择最佳微调框架与模型切分策略，减少工程化工作量。
可扩展性强：新增模型源 / 工具仅需添加对应模块（如 OnlineChatModule 通过动态类加载，无需修改核心代码即可新增模型平台）。

三、关键功能模块

LazyLLM 通过模块化设计降低开发复杂度，核心模块如下：

模块名称	核心作用
`OnlineChatModule`	在线大模型调用入口，支持日日新、OpenAI、智谱等 6 + 平台，需配置对应 API Key。
`Document`	文档处理核心组件，支持多格式文档解析、多粒度切片（128/256/1024 字符块）、节点组管理。
`EmbeddingModule`	向量生成组件，分在线（调用平台 Embedding 模型）、离线（本地模型）两种模式。
`Retriever`	检索组件，支持 BM25 / 余弦相似度计算，可指定检索节点组、TopK 数量与相似度阈值。
`Reranker`	检索结果重排组件，支持在线（qwen/glm）、离线（bge-reranker 系列）模型，提升检索精度。
`ReactAgent`	智能体核心组件，可绑定大模型、注册工具（如 RAG 检索、天气查询），实现 “思考 - 调用工具 - 生成回答” 逻辑。
`WebModule`	前端部署组件，一键生成 Web 交互界面，支持指定端口与标题，快速实现应用可视化。

四、典型应用场景

1. 快速 Agent 部署（如天气查询工具）

流程：通过@fc_register注册 “天气查询工具”，用ReactAgent绑定OnlineChatModule与工具，搭配WebModule生成前端界面。
核心代码：仅需 50 行左右，即可实现 “用户输入城市→Agent 调用工具→返回天气 + 出行建议” 的完整交互。

2. 本地知识库 RAG 应用

流程：Document加载本地文档→EmbeddingModule生成向量→Retriever检索相关片段→ReactAgent结合 RAG 结果生成回答。
优化能力：支持 “多路召回（多节点组 / 多检索策略）+ 重排”，减少 LLM 幻觉，提升回答准确性（如解析 LightRAG 论文后，可精准回答其创新点）。

3. 多模态与复杂流程应用

支持图像、音频等多模态数据接入，结合多 Agent 协同（如 “意图识别 Agent→检索 Agent→生成 Agent”），实现客服机器人、科研助手等场景。

ModelEngine社区

更多推荐

从崩溃到自愈：Temporal+MCP-Agent构建永不中断的AI工作流

你是否遇到过AI工作流执行到90%突然崩溃的绝望？训练了数小时的模型因服务器重启前功尽弃？团队协作时因某人未及时审批导致整个流程停滞？本文将展示如何通过Temporal与MCP-Agent的深度集成，彻底解决这些痛点，构建真正企业级的可靠AI工作流系统。读完本文你将掌握：- 3行代码实现工作流故障自愈- 零停机升级正在运行的AI任务- 跨团队协作的工作流信号机制- 从本地开发到生产集群