docs: update models and channels doc

This commit is contained in:
zhayujie
2026-05-22 10:10:07 +08:00
parent 90773ab69f
commit 36b913124b
23 changed files with 783 additions and 262 deletions

View File

@@ -5,6 +5,7 @@ description: CowAgent 版本更新历史
| 版本 | 日期 | 说明 |
| --- | --- | --- |
| [2.0.9](/releases/v2.0.9) | 2026.05.21 | MCP 工具生态接入、模型管理页重构(厂商凭据共享 + 多能力统一调度)、语音系统升级、浏览器持久登录 |
| [2.0.8](/releases/v2.0.8) | 2026.05.06 | 飞书渠道全面升级语音、流式输出和Markdown、扫码一键接入、DeepSeek V4和百度模型新增、定时任务工具增强 |
| [2.0.7](/releases/v2.0.7) | 2026.04.22 | 图像生成技能六厂商自动路由、新模型支持Kimi K2.6、Claude Opus 4.7、GLM 5.1、知识库增强、Web 控制台优化 |
| [2.0.6](/releases/v2.0.6) | 2026.04.14 | 项目更名、知识库系统、梦境记忆蒸馏、上下文智能压缩、Web 控制台多会话及多项优化 |

92
docs/releases/v2.0.9.mdx Normal file
View File

@@ -0,0 +1,92 @@
---
title: v2.0.9
description: CowAgent 2.0.9 - MCP 工具生态接入、模型管理页重构、语音系统升级、浏览器持久登录
---
## 🧩 MCP 工具生态接入
新增 **MCPModel Context Protocol** 工具集成CowAgent 从固定工具集扩展为开放可插拔的工具生态。任何兼容 MCP 协议的服务高德地图、Chrome DevTools、Filesystem、Playwright 等)都可作为工具直接接入 Agent。
- **零额外依赖**:原生 JSON-RPC 实现,同时支持 `stdio`(本地进程)和 `sse`(远程 URL两种传输
- **兼容主流配置**:兼容 Claude Desktop / Cursor 风格的 `mcpServers` 配置,优先读取 `~/cow/mcp.json`,未配置则回退 `config.json`
- **异步启动**MCP 服务在后台线程启动,不阻塞 Agent 初始化;单个服务失败不影响整体
相关文档:[MCP 工具](https://docs.cowagent.ai/tools/mcp) · 社区贡献 #2801 Thanks @yangluxin613
## 🖥️ 模型管理页面重构
「模型」页面整体重新设计,从原来按 LLM 厂商堆叠的列表,重构为 **厂商凭据 + 能力调度** 两层结构:一处配置厂商凭据,对话、图像、语音、向量、搜索等多个能力共享。
- **厂商凭据集中管理**所有支持厂商OpenAI / Claude / Gemini / DeepSeek / Qwen / 豆包 / Kimi / 智谱 / MiniMax / 千帆 / LinkAI / Custom 等)的 API Key / API Base 在顶部统一维护,编辑后下方所有能力立即生效
- **能力卡片**:按主模型、图像理解、图像生成、语音识别、语音合成、向量、联网搜索分卡,每个能力可独立选择厂商和模型,未配置时自动跟随主模型或按默认顺序回退
### 多厂商联网搜索
联网搜索升级为多厂商架构,**输出格式统一**
- 四家可选博查bocha、百度千帆qianfan、智谱zhipu、LinkAI
- 两种调度策略:`auto`(按 bocha > qianfan > zhipu > linkai 顺序自动选第一个已配置的厂商)/ `fixed`(固定指定厂商)
- 配置 ≥2 家且为 `auto` 时Agent 可在单次调用中临时指定 `provider` 切换搜索源
### 向量厂商热切换
向量Embedding支持多厂商告别对 OpenAI 的单一依赖:
- 原生支持 `openai` / `dashscope` / `doubao` / `zhipu` / `linkai`
- **在线重建索引**:切换厂商后执行 `/memory rebuild-index`,无需重启、不会中断当前对话
- 梦境日记默认排除在向量索引之外,避免反复出现在检索结果中干扰对话
## 🎙️ 语音系统升级
- **TTS 适配更多通道**个人微信ilink、钉钉、企微智能机器人现已原生支持语音回复开关沿用 `always_reply_voice` / `voice_reply_voice`;触发 TTS 时先发文本气泡再发语音消息,方便对照阅读
- **新增 ASR 厂商**百炼DashScope、智谱
- **TTS 多厂商重构**MiniMax / LinkAI / DashScope / 智谱 TTS 在流式合成、长文本切分、错误回退上更稳
- **网页麦克风输入**Web 控制台聊天框新增麦克风按钮,可直接录音发送,自动走 ASR 转文本
## 🌐 浏览器工具
浏览器工具支持三种启动模式,告别"每次开会话都得重新登录"
- **持久化用户配置(默认)**:复用 `~/.cow/browser_profile`,登录一次后下次自动复用登录态
- **CDP 模式**:通过 `cdp_endpoint` 附加到手动启动的真实 Chrome享有完整指纹适合反爬严格的站点
- **Fresh 模式**:每次清空环境,适合做隔离任务
此外浏览器被用户中途关闭后下次调用会自动重新拉起CDP 模式下不会误杀用户的 Chrome 进程。相关文档:[浏览器工具](https://docs.cowagent.ai/tools/browser) #2809
## 🤖 新模型与模型增强
- **百度 ERNIE 5.1**:新增 `ernie-5.1` 模型
- **DeepSeek V4 reasoning_effort**DeepSeek V4 系列支持 `reasoning_effort` 配置思考深度
- **OpenRouter / Vercel AI Gateway 归因**:调用这两个平台时自动注入归因 Header平台可正确识别 CowAgent 用量
- 修复 MiMo 等思考模型在多轮对话中 `reasoning_content` 丢失的问题
## 🚀 启动与运行体验
来自社区的多项体验改进 Thanks @yangluxin613
- **自动选端口 + 自动开浏览器**:默认端口被占用时自动切换,启动成功后默认打开控制台
- **Ctrl+C 干净退出**:不再打印一长串堆栈
- **日志面板**:差异化级别配色、多行日志继承级别、新增级别筛选 Checkbox
## 🔒 部署与安全
- **默认仅本机访问**Web 控制台 `web_host` 默认 `127.0.0.1`,避免无密码情况下被外网直接访问;显式 `0.0.0.0` 且未设密码时给出提示
- **前端资源完全本地化**:第三方 CSS / JS 全部本地分发,离线 / 内网环境也能正常加载控制台 #2816 Thanks @TryToMakeUsBetter
- **支持文件夹上传**:上传区支持整目录一次性上传,路径校验适配 Windows #2815 Thanks @TryToMakeUsBetter
## 🛠 其他改进与修复
- **定时任务防重复执行**:调度器初始化做幂等处理
- **工具失败状态持久化**:刷新页面或重载历史时失败的工具调用正确显示失败状态 #2822 Thanks @a1094174619
- **企微机器人非法字符**:修复消息中包含非法控制字符导致投递失败的问题 #2810 Thanks @Jacques-Zhao
- **飞书文件消息**:飞书通道支持文件消息接收
- **工具配置合并**:修复用户自定义工具配置(如 `tools.browser`)被工作区默认值整体覆盖的问题,现按字段合并
- 修复单文件上传偶发 TypeError、切换语言后 JS 动态视图未重渲染等问题
## 📦 升级方式
源码部署可执行 `cow update` 或 `./run.sh update` 一键升级,或手动拉取代码后重启。详见 [更新升级文档](https://docs.cowagent.ai/guide/upgrade)。
> ⚠️ 切换向量厂商后,建议执行一次 `/memory rebuild-index`,让历史记忆按新的向量维度重新入库。
**发布日期**2026.05.21 | [Full Changelog](https://github.com/zhayujie/CowAgent/compare/2.0.8...2.0.9)