mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-06-02 00:57:41 +08:00
137 lines
6.9 KiB
Plaintext
137 lines
6.9 KiB
Plaintext
---
|
||
title: 功能介绍
|
||
description: CowAgent 长期记忆、个人知识库、任务规划、技能系统、CLI 命令、浏览器工具详细说明
|
||
---
|
||
|
||
## 1. 长期记忆
|
||
|
||
> 记忆系统让 Agent 能够长期记住重要信息。Agent 会在用户分享偏好、决策、事实等重要信息时主动存储,也会在对话达到一定长度时自动提取摘要。记忆分为核心记忆、天级记忆,支持语义搜索和向量检索的混合检索模式。
|
||
|
||
第一次启动 Agent 时,Agent 会主动询问关键信息,并记录至工作空间(默认 `~/cow`)中的智能体设定、用户身份、记忆文件中。
|
||
|
||
在后续的长期对话中,Agent 会在需要时智能记录或检索记忆,并对自身设定、用户偏好、记忆文件等进行不断更新,总结和记录经验和教训,真正实现自主思考和不断成长。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260203000455.png" width="800" />
|
||
</Frame>
|
||
|
||
## 2. 个人知识库
|
||
|
||
> 知识库系统让 Agent 能够持续积累和组织结构化知识。与按时间线记录的记忆不同,知识库以主题为维度,将文章、对话洞察、学习材料等整理为互相关联的 Markdown 页面,形成持续增长的知识网络。
|
||
|
||
Agent 会在对话中自动将有价值的信息整理为知识页面,维护交叉引用和索引,通过 Web 控制台可浏览文档和查看知识图谱。知识库存储在工作空间的 `~/cow/knowledge/` 目录下。
|
||
|
||
- **自动整理**:Agent 在对话中自主提取和整理结构化知识,维护索引和交叉引用
|
||
- **知识图谱**:基于页面间的交叉引用自动构建知识图谱,Web 控制台提供可视化关系图浏览
|
||
- **对话联动**:Agent 回复中引用的知识文档链接可在 Web 控制台中直接点击跳转查看
|
||
- **CLI 管理**:通过 `/knowledge` 命令查看统计、浏览目录,通过 `/knowledge on|off` 开关功能
|
||
|
||
详细说明请参考 [个人知识库](/knowledge)。
|
||
|
||
## 3. 任务规划和工具调用
|
||
|
||
工具是 Agent 访问操作系统资源的核心,Agent 会根据任务需求智能选择和调用工具,完成文件读写、命令执行、定时任务等各类操作。内置工具的实现在项目的 `agent/tools/` 目录下。
|
||
|
||
**主要工具:** 文件读写编辑、Bash 终端、浏览器操作、文件发送、定时调度、记忆搜索、联网搜索、环境配置等。
|
||
|
||
### 3.1 终端和文件访问
|
||
|
||
针对操作系统的终端和文件的访问能力,是最基础和核心的工具,其他很多工具或技能都是基于此进行扩展。用户可通过手机端与 Agent 交互,操作个人电脑或服务器上的资源:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202181130.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.2 编程能力
|
||
|
||
基于编程能力和系统访问能力,Agent 可以实现从信息搜索、图片等素材生成、编码、测试、部署、Nginx 配置修改、发布的 **Vibecoding 全流程**,通过手机端简单的一句命令完成应用的快速 demo:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260203121008.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.3 定时任务
|
||
|
||
基于 `scheduler` 工具实现动态定时任务,支持**一次性任务、固定时间间隔、Cron 表达式**三种形式,任务触发可选择**固定消息发送**或 **Agent 动态任务**执行两种模式:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202195402.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.4 浏览器操作
|
||
|
||
内置 `browser` 工具,Agent 可控制浏览器访问网页、填写表单、点击元素、截图,支持动态 JS 渲染页面。运行 `cow install-browser` 一键安装,自动适配服务器(无头模式)和桌面环境:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260401115728.png" width="750" />
|
||
</Frame>
|
||
|
||
### 3.5 环境变量管理
|
||
|
||
技能所需的秘钥存储在环境变量文件中,由 `env_config` 工具进行管理,你可以通过对话的方式更新秘钥,工具内置安全保护和脱敏策略:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202234939.png" width="800" />
|
||
</Frame>
|
||
|
||
## 4. 技能系统
|
||
|
||
技能系统为 Agent 提供无限的扩展性,每个 Skill 由说明文件、运行脚本(可选)、资源(可选)组成,描述如何完成特定类型的任务。通过 Skill 可以让 Agent 遵循说明完成复杂流程、调用各类工具或对接第三方系统。
|
||
|
||
- **[Skill Hub](https://skills.cowagent.ai/):** 开放的技能广场,汇集官方推荐、社区贡献和第三方技能,支持一键安装。
|
||
- **内置技能:** 在项目的 `skills/` 目录下,包含技能创造器、图像识别、LinkAI 智能体、网页抓取等。内置 Skill 根据依赖条件(API Key、系统命令等)自动判断是否启用。
|
||
- **自定义技能:** 由用户通过对话创建,存放在工作空间中(`~/cow/skills/`),可实现任何复杂的业务流程和第三方系统对接。
|
||
|
||
安装技能:`/skill install <名称>` 或 `cow skill install <名称>`,支持从 Skill Hub、GitHub、ClawHub、URL 等来源安装。
|
||
|
||
### 4.1 创建技能
|
||
|
||
通过 `skill-creator` 技能可以通过对话的方式快速创建技能。你可以让 Agent 将某个工作流程固化为技能,或者把任意接口文档和示例发送给 Agent,让他直接完成对接:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202202247.png" width="800" />
|
||
</Frame>
|
||
|
||
### 4.2 搜索和图像识别
|
||
|
||
- **联网搜索:** 内置 `web_search` 工具,支持多种搜索引擎,配置 `BOCHA_API_KEY` 或 `LINKAI_API_KEY` 后启用。
|
||
- **图像识别:** 内置 `openai-image-vision` 技能,可使用 `gpt-4.1-mini`、`gpt-4.1` 等模型,依赖 `OPENAI_API_KEY`。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
|
||
</Frame>
|
||
|
||
### 4.3 技能广场
|
||
|
||
访问 [skills.cowagent.ai](https://skills.cowagent.ai/) 浏览所有可用技能,或在对话中执行:
|
||
|
||
```text
|
||
/skill list --remote # 浏览技能广场
|
||
/skill search <关键词> # 搜索技能
|
||
/skill install <名称> # 一键安装
|
||
```
|
||
|
||
同时还支持安装Github、ClawHub、LinkAI等第三方平台上的所有技能,详情查看 [技能安装](/skills/install)
|
||
|
||
<img src="https://cdn.link-ai.tech/doc/20260401110103.png" width="750" />
|
||
|
||
|
||
## 5. CLI 命令系统
|
||
|
||
CowAgent 提供两种命令交互方式,覆盖服务管理、技能安装、配置调整等日常运维操作:
|
||
|
||
- **终端 CLI:** 在系统终端执行 `cow <命令>`,支持 `start`、`stop`、`restart`、`update`、`status`、`logs`、`skill` 等
|
||
- **对话命令:** 在对话中输入 `/<命令>`,Web 控制台输入 `/` 可弹出指令菜单快速选择
|
||
|
||
```bash
|
||
cow start # 启动服务
|
||
cow stop # 停止服务
|
||
cow update # 更新并重启
|
||
cow skill install pptx # 安装技能
|
||
cow install-browser # 安装浏览器工具
|
||
```
|
||
|
||
详细命令参考 [命令总览](https://docs.cowagent.ai/cli)。
|
||
|
||
<img src="https://cdn.link-ai.tech/doc/20260401114549.png" width="750" />
|