mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-06-02 00:57:41 +08:00
feat: release 2.0.9
This commit is contained in:
@@ -5,7 +5,7 @@ description: CowAgent 版本更新历史
|
||||
|
||||
| 版本 | 日期 | 说明 |
|
||||
| --- | --- | --- |
|
||||
| [2.0.9](/releases/v2.0.9) | 2026.05.21 | MCP 工具生态接入、模型管理页重构(厂商凭据共享 + 多能力统一调度)、语音系统升级、浏览器持久登录 |
|
||||
| [2.0.9](/releases/v2.0.9) | 2026.05.22 | 新增模型管理、MCP 协议支持、浏览器登录态持久化、新模型接入(gpt-5.5、gemini-3.5-flash、qwen3.7-max 等)、部署安全加固 |
|
||||
| [2.0.8](/releases/v2.0.8) | 2026.05.06 | 飞书渠道全面升级(语音、流式输出和Markdown、扫码一键接入)、DeepSeek V4和百度模型新增、定时任务工具增强 |
|
||||
| [2.0.7](/releases/v2.0.7) | 2026.04.22 | 图像生成技能(六厂商自动路由)、新模型支持(Kimi K2.6、Claude Opus 4.7、GLM 5.1)、知识库增强、Web 控制台优化 |
|
||||
| [2.0.6](/releases/v2.0.6) | 2026.04.14 | 项目更名、知识库系统、梦境记忆蒸馏、上下文智能压缩、Web 控制台多会话及多项优化 |
|
||||
|
||||
@@ -1,92 +1,65 @@
|
||||
---
|
||||
title: v2.0.9
|
||||
description: CowAgent 2.0.9 - MCP 工具生态接入、模型管理页重构、语音系统升级、浏览器持久登录
|
||||
description: CowAgent 2.0.9 - 新增模型管理、MCP 协议支持、浏览器登录态持久化、新模型接入
|
||||
---
|
||||
|
||||
## 🧩 MCP 工具生态接入
|
||||
## 🖥️ 新增模型管理
|
||||
|
||||
新增 **MCP(Model Context Protocol)** 工具集成,CowAgent 从固定工具集扩展为开放可插拔的工具生态。任何兼容 MCP 协议的服务(高德地图、Chrome DevTools、Filesystem、Playwright 等)都可作为工具直接接入 Agent。
|
||||
Web 控制台新增「模型」页面,按 **模型厂商 + 模型能力** 进行管理,支持对话、图像、语音、向量模型和搜索能力的配置:
|
||||
|
||||
- **零额外依赖**:原生 JSON-RPC 实现,同时支持 `stdio`(本地进程)和 `sse`(远程 URL)两种传输
|
||||
- **兼容主流配置**:兼容 Claude Desktop / Cursor 风格的 `mcpServers` 配置,优先读取 `~/cow/mcp.json`,未配置则回退 `config.json`
|
||||
- **异步启动**:MCP 服务在后台线程启动,不阻塞 Agent 初始化;单个服务失败不影响整体
|
||||
- **多厂商配置**:所有厂商的 API Key / API Base 在顶部统一维护,下方所有能力立即生效,无需重复填写
|
||||
- **图像模型**:图像理解与图像生成均可独立选择厂商和模型,未指定时跟随主模型自动选择
|
||||
- **语音模型**:语音识别和合成可独立配置,新增千问、智谱 ASR/TTS 模型
|
||||
- **向量模型**:支持配置 Embedding 模型(用于记忆及知识库检索),新增支持 OpenAI、通义、豆包、智谱等;切换模型后需执行 `/memory rebuild-index` 在线重建索引
|
||||
- **搜索能力**:联网搜索能力升级,支持博查、百度、智谱等多个厂商,自动模式下 Agent 可综合多来源搜索结果进行深度研究
|
||||
|
||||
相关文档:[MCP 工具](https://docs.cowagent.ai/tools/mcp) · 社区贡献 #2801 Thanks @yangluxin613
|
||||
相关文档:[模型概览](https://docs.cowagent.ai/models)
|
||||
|
||||
## 🖥️ 模型管理页面重构
|
||||
<img width="720" alt="20260522113305" src="https://cdn.link-ai.tech/doc/20260522113305.png" />
|
||||
|
||||
「模型」页面整体重新设计,从原来按 LLM 厂商堆叠的列表,重构为 **厂商凭据 + 能力调度** 两层结构:一处配置厂商凭据,对话、图像、语音、向量、搜索等多个能力共享。
|
||||
|
||||
- **厂商凭据集中管理**:所有支持厂商(OpenAI / Claude / Gemini / DeepSeek / Qwen / 豆包 / Kimi / 智谱 / MiniMax / 千帆 / LinkAI / Custom 等)的 API Key / API Base 在顶部统一维护,编辑后下方所有能力立即生效
|
||||
- **能力卡片**:按主模型、图像理解、图像生成、语音识别、语音合成、向量、联网搜索分卡,每个能力可独立选择厂商和模型,未配置时自动跟随主模型或按默认顺序回退
|
||||
## 🧩 MCP 协议支持
|
||||
|
||||
### 多厂商联网搜索
|
||||
支持 **MCP(Model Context Protocol)** 协议,从固定工具集扩展为开放可插拔的工具生态,任何兼容 MCP 协议的服务均可作为工具直接接入 Agent。
|
||||
|
||||
联网搜索升级为多厂商架构,**输出格式统一**:
|
||||
- 原生 JSON-RPC 实现,零额外依赖,同时支持 `stdio` 和 `sse` 两种传输
|
||||
- 兼容 Claude Desktop / Cursor 等主流风格的 `mcpServers` 配置,优先读取 `~/cow/mcp.json`
|
||||
|
||||
- 四家可选:博查(bocha)、百度千帆(qianfan)、智谱(zhipu)、LinkAI
|
||||
- 两种调度策略:`auto`(按 bocha > qianfan > zhipu > linkai 顺序自动选第一个已配置的厂商)/ `fixed`(固定指定厂商)
|
||||
- 配置 ≥2 家且为 `auto` 时,Agent 可在单次调用中临时指定 `provider` 切换搜索源
|
||||
相关文档:[MCP 工具](https://docs.cowagent.ai/tools/mcp)。Thanks @yangluxin613 (#2801)
|
||||
|
||||
### 向量厂商热切换
|
||||
## 🌐 浏览器登录态持久化
|
||||
|
||||
向量(Embedding)支持多厂商,告别对 OpenAI 的单一依赖:
|
||||
针对需要登录、有反爬机制的网站,浏览器工具支持登录一次后长期复用登录态,并允许接入用户自己的真实 Chrome 以通过指纹检测:
|
||||
|
||||
- 原生支持 `openai` / `dashscope` / `doubao` / `zhipu` / `linkai`
|
||||
- **在线重建索引**:切换厂商后执行 `/memory rebuild-index`,无需重启、不会中断当前对话
|
||||
- 梦境日记默认排除在向量索引之外,避免反复出现在检索结果中干扰对话
|
||||
- **持久化用户配置(默认)**:默认使用 `~/.cow/browser_profile` 作为浏览器用户目录,登录一次后下次自动复用登录态
|
||||
- **CDP 模式**:通过 `tools.browser.cdp_endpoint` 接管真实 Chrome 浏览器,享有完整浏览器权限
|
||||
|
||||
## 🎙️ 语音系统升级
|
||||
相关文档:[浏览器工具](https://docs.cowagent.ai/tools/browser)。Thanks @leafmove (#2809)
|
||||
|
||||
- **TTS 适配更多通道**:个人微信(ilink)、钉钉、企微智能机器人现已原生支持语音回复,开关沿用 `always_reply_voice` / `voice_reply_voice`;触发 TTS 时先发文本气泡再发语音消息,方便对照阅读
|
||||
- **新增 ASR 厂商**:百炼(DashScope)、智谱
|
||||
- **TTS 多厂商重构**:MiniMax / LinkAI / DashScope / 智谱 TTS 在流式合成、长文本切分、错误回退上更稳
|
||||
- **网页麦克风输入**:Web 控制台聊天框新增麦克风按钮,可直接录音发送,自动走 ASR 转文本
|
||||
## 🤖 模型新增与优化
|
||||
|
||||
## 🌐 浏览器工具
|
||||
|
||||
浏览器工具支持三种启动模式,告别"每次开会话都得重新登录":
|
||||
|
||||
- **持久化用户配置(默认)**:复用 `~/.cow/browser_profile`,登录一次后下次自动复用登录态
|
||||
- **CDP 模式**:通过 `cdp_endpoint` 附加到手动启动的真实 Chrome,享有完整指纹,适合反爬严格的站点
|
||||
- **Fresh 模式**:每次清空环境,适合做隔离任务
|
||||
|
||||
此外,浏览器被用户中途关闭后下次调用会自动重新拉起,CDP 模式下不会误杀用户的 Chrome 进程。相关文档:[浏览器工具](https://docs.cowagent.ai/tools/browser) #2809
|
||||
|
||||
## 🤖 新模型与模型增强
|
||||
|
||||
- **百度 ERNIE 5.1**:新增 `ernie-5.1` 模型
|
||||
- **DeepSeek V4 reasoning_effort**:DeepSeek V4 系列支持 `reasoning_effort` 配置思考深度
|
||||
- **OpenRouter / Vercel AI Gateway 归因**:调用这两个平台时自动注入归因 Header,平台可正确识别 CowAgent 用量
|
||||
- 修复 MiMo 等思考模型在多轮对话中 `reasoning_content` 丢失的问题
|
||||
|
||||
## 🚀 启动与运行体验
|
||||
|
||||
来自社区的多项体验改进 Thanks @yangluxin613
|
||||
|
||||
- **自动选端口 + 自动开浏览器**:默认端口被占用时自动切换,启动成功后默认打开控制台
|
||||
- **Ctrl+C 干净退出**:不再打印一长串堆栈
|
||||
- **日志面板**:差异化级别配色、多行日志继承级别、新增级别筛选 Checkbox
|
||||
- **模型新增**:`gpt-5.5`、`gemini-3.5-flash`、`qwen3.7-max`、`ernie-5.1`
|
||||
- **模型优化**:DeepSeek V4 支持 `reasoning_effort` 思考深度参数;修复 MiMo 等思考模型通过 OpenAI 兼容协议接入的问题
|
||||
|
||||
## 🔒 部署与安全
|
||||
|
||||
- **默认仅本机访问**:Web 控制台 `web_host` 默认 `127.0.0.1`,避免无密码情况下被外网直接访问;显式 `0.0.0.0` 且未设密码时给出提示
|
||||
- **前端资源完全本地化**:第三方 CSS / JS 全部本地分发,离线 / 内网环境也能正常加载控制台 #2816 Thanks @TryToMakeUsBetter
|
||||
- **支持文件夹上传**:上传区支持整目录一次性上传,路径校验适配 Windows #2815 Thanks @TryToMakeUsBetter
|
||||
- **默认本机访问**:Web 控制台 `web_host` 配置默认绑定 `127.0.0.1`,服务器部署时可手动设置为 `0.0.0.0` 并设置密码。Thanks @August829、@yidaozhongqing、@YLChen-007、@icysun
|
||||
- **前端资源完全本地化**:第三方 CSS / JS 全部本地分发,离线 / 内网环境也能正常加载控制台。Thanks @gitlayzer (#2816)
|
||||
|
||||
## 🛠 其他改进与修复
|
||||
## 🛠 体验优化与修复
|
||||
|
||||
- **定时任务防重复执行**:调度器初始化做幂等处理
|
||||
- **工具失败状态持久化**:刷新页面或重载历史时失败的工具调用正确显示失败状态 #2822 Thanks @a1094174619
|
||||
- **企微机器人非法字符**:修复消息中包含非法控制字符导致投递失败的问题 #2810 Thanks @Jacques-Zhao
|
||||
- **飞书文件消息**:飞书通道支持文件消息接收
|
||||
- **工具配置合并**:修复用户自定义工具配置(如 `tools.browser`)被工作区默认值整体覆盖的问题,现按字段合并
|
||||
- 修复单文件上传偶发 TypeError、切换语言后 JS 动态视图未重渲染等问题
|
||||
- **TTS 适配更多通道**:Web对话、个人微信、飞书、钉钉、企微智能机器人均已支持回复语音,详情查看 [通道概览](https://docs.cowagent.ai/channels)
|
||||
- **日志面板增强**:根据日志等级差异化高亮展示、支持根据等级筛选。Thanks @yangluxin613 (#2807)
|
||||
- **Web 控制台自动启动**:程序启动后自动打开 Web 控制台。Thanks @yangluxin613 (#2804)
|
||||
- **Ctrl+C 干净退出**:不再打印一长串 `KeyboardInterrupt` 堆栈。Thanks @yangluxin613 (#2806)
|
||||
- **文件夹上传**:Web 端支持目录上传,路径校验适配 Windows。Thanks @TryToMakeUsBetter (#2814)
|
||||
- 修复定时任务在某些情况下重复执行的问题。Thanks @CNXudiandian (#2820)
|
||||
- 修复定时任务带时区时单次任务不触发的问题。Thanks @AethericSpace
|
||||
- 修复执行失败的工具调用在页面刷新后不显示的问题。Thanks @a1094174619 (#2822)
|
||||
- 修复企微机器人消息中包含非法控制字符导致投递失败的问题。Thanks @Jacques-Zhao (#2810)
|
||||
|
||||
## 📦 升级方式
|
||||
|
||||
源码部署可执行 `cow update` 或 `./run.sh update` 一键升级,或手动拉取代码后重启。详见 [更新升级文档](https://docs.cowagent.ai/guide/upgrade)。
|
||||
源码部署可执行 `cow update` 一键升级,或手动拉取代码后重启。详见 [更新升级文档](https://docs.cowagent.ai/guide/upgrade)。
|
||||
|
||||
> ⚠️ 切换向量厂商后,建议执行一次 `/memory rebuild-index`,让历史记忆按新的向量维度重新入库。
|
||||
|
||||
**发布日期**:2026.05.21 | [Full Changelog](https://github.com/zhayujie/CowAgent/compare/2.0.8...2.0.9)
|
||||
**发布日期**:2026.05.22 | [Full Changelog](https://github.com/zhayujie/CowAgent/compare/2.0.8...2.0.9)
|
||||
|
||||
Reference in New Issue
Block a user