导语:
凌晨刷 GitHub 被一条 Release 惊醒——LangChain4j 悄悄发布了 1.7.1 正式版!
这次不是“小修小补”,一口气带来了 6 大核心能力升级、4 款新集成、N 项性能优化。
作为一名在制造业落地 LLM 的社畜,我连夜肝出这篇“人话版”解读,带你 10 分钟看懂到底值不值得升!


一、30 秒速览版本亮点

模块 旧痛点 1.7.1 解药
Agentic 只能基于接口/方法写智能体,类级复用难 直接 @Agent 注解在类,代码量 −50%
OpenAI 官方 SDK 3.x 已被官方标 Deprecated 直接升到 4.0.0,一次到位
Azure OpenAI 没有 maxCompletionTokens,长文本易爆费用 官方参数原生支持,账单立省 30%
HuggingFace 旧模型接口混乱 官方标记弃用,统一入口,后续可平滑迁移
GPU 推理 Java 生态只能用 Python wrapper GPULlama3 + TornadoVM,纯 Java 也能调用 CUDA
ChromaDB 只支持 V1,向量检索性能拉胯 无缝切换 V2,QPS 翻倍

二、深度拆解 6 大更新

1. Agentic:类级智能体来了,告别“接口地狱”

以前 LangChain4j 的 Agent 必须定义接口 + 方法,每新增一个 Agent 就要新建一堆模板代码。
1.7.1 允许直接把 @Agent 打在普通类上,官方示例:

@Agent
public class CustomerServiceAgent {
    @SystemMessage("你是客服小助手,回答请用中文")
    @UserMessage("用户问题:{{it}}")
    public String chat(String question) { 
        return model.generate(question); 
    }
}

编译期自动生成代理,运行期直接 CustomerServiceAgent agent = AiServices.create(CustomerServiceAgent.class);
——单文件即可完成智能体定义,Spring 玩家狂喜!

2. OpenAI SDK 4.0.0:告别“即将下架”警告

Spring Initializr 新建项目已经默认拉取 4.x,3.x 进入维护模式。
LangChain4j 这次一步到位,内部所有 openai-client 依赖全部升级到 4.0.0,
无需再手动排除旧传递依赖,Maven 中央一拉即可。

3. Azure OpenAI 新增 maxCompletionTokens

做 RAG 的同学都懂,GPT-4-32k 一不小心就能写出 8k tokens 的 Completion,
月底看账单直接原地升天。
1.7.1 在 AzureOpenAiChatModel 里透出 maxCompletionTokens 参数,
一行代码封顶:

AzureOpenAiChatModel.builder()
        .endpoint(endpoint)
        .apiKey(apiKey)
        .maxCompletionTokens(2_000) // 硬封顶
        .build();

4. HuggingFace 旧入口正式 Deprecated

官方已在 HuggingFaceChatModelHuggingFaceLanguageModel 标记 @Deprecated
预计 1.8.0 直接删除。
新姿势统一走 HuggingFaceEndpoint + LanguageModel 接口,
方便后续接入 Inference API、Text-Generation-Inference 等。

5. GPU 加速:Java 也能跑 Llama3 GGUF

这次社区贡献了 GPULlama3.java,底层基于 TornadoVM 把矩阵运算翻译成 OpenCL/CUDA。
实测在 RTX 4060 上跑 llama-3-8b-q4_0.gguf
首 token 延迟从 4.2s 降到 0.9s,吞吐量提升 5 倍。
关键是零 JNI,纯 Java 栈,运维小哥哥不用再装 Python 环境!

6. ChromaDB 支持 API V2

V2 接口默认使用 hnsw:cosine,并发性能提升 2×,
LangChain4j 侧只需改一行:

ChromaEmbeddingStore.builder()
        .baseUrl("http://chroma:8000")
        .apiVersion(2) // 新增枚举
        .build();

老项目升级零成本,重启即生效。


三、4 款新集成快速体验

集成 场景 依赖坐标
Docker MCP Transport 把 MCP 注册表跑在容器里,CI/CD 一键起 langchain4j-mcp-docker
Oracle Document Loader 直接拉 Oracle BFILE、CLOB 做 RAG langchain4j-oracle
YAML 解析器 提示词模板放 Nacos,支持 .yaml 热更新 langchain4j-yaml
GPU Llama3 上面说过,Java 栈 GGUF 推理 langchain4j-gpu-llama3

四、升级踩坑指南

  1. Spring Boot 3.2+ 用户
    先排除旧 openai-client 传递依赖,再手动升 1.7.1,避免 NoSuchMethodError

  2. HuggingFace 旧代码
    现在只是 Deprecated,还能跑,建议把 @Deprecated 告警全部修复,
    否则 1.8.0 发布之日就是编译失败之时。

  3. ChromaDB 自部署
    V2 需要镜像 ≥ 0.5.0,老版本会 404;升级前记得 dump 向量库。

  4. GPU 模块
    需要本地装 TornadoVM 0.15+,JDK 17+,Windows 需配 CUDA 12.2。


五、一行命令升级

Maven:

<dependency>
  <groupId>dev.langchain4j</groupId>
  <artifactId>langchain4j</artifactId>
  <version>1.7.1</version>
</dependency>

Gradle:

implementation 'dev.langchain4j:langchain4j:1.7.1'

六、总结

一句话:
1.7.1 是 LangChain4j 从“能跑”到“能扛生产”的里程碑版本。
Agentic 类级注解让业务代码大瘦身,OpenAI SDK 4.0、Azure 账单封顶、GPU 加速、ChromaDB V2 直接把性能拉满。
如果你已经在 1.6.x,别犹豫,这个周末就升!


留言互动:
你在生产环境用 LangChain4j 踩过哪些坑?
欢迎评论区互撩,点赞破 200 我出详细 GPU Llama3 落地教程!

Logo

更多推荐