mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-06-02 09:37:38 +08:00
140 lines
9.8 KiB
Plaintext
140 lines
9.8 KiB
Plaintext
---
|
||
title: 機能詳細
|
||
description: CowAgent の長期記憶、タスク計画、Skill システム、CLI コマンド、ブラウザツールの詳細
|
||
---
|
||
|
||
## 1. 長期記憶
|
||
|
||
記憶システムにより、Agent は重要な情報を長期にわたって記憶できます。三層記憶フローを採用:会話コンテキスト(短期)→ デイリーメモリ(中期)→ MEMORY.md(長期)、完全な記憶ライフサイクルを形成します。
|
||
|
||
初回起動時、Agent はユーザーに重要な情報を自発的に尋ね、ワークスペース(デフォルト `~/cow`)に記録します。これには Agent の設定、ユーザーの身元情報、記憶ファイルが含まれます。
|
||
|
||
その後の長期的な会話において、Agent は必要に応じてインテリジェントに記憶を保存・取得し、自身の設定やユーザーの好み、記憶ファイルを継続的に更新します。毎日 **Deep Dream(夢境蒸留)** が自動実行され、散在するデイリーメモリを精製された長期記憶に統合し、ナラティブスタイルの夢日記を生成します。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260203000455.png" width="800" />
|
||
</Frame>
|
||
|
||
詳細は [長期記憶](/ja/memory) と [Deep Dream](/ja/memory/deep-dream) を参照してください。
|
||
|
||
## 2. パーソナルナレッジベース
|
||
|
||
> ナレッジベースシステムにより、Agent は構造化された知識を継続的に蓄積・整理できます。時系列で記録されるメモリとは異なり、ナレッジベースはトピック別に整理され、記事、会話からの洞察、学習資料などを相互にリンクされた Markdown ページとして整理し、継続的に成長するナレッジネットワークを形成します。
|
||
|
||
Agent は会話中に価値ある情報を自動的にナレッジページとして整理し、相互参照とインデックスを維持します。Web コンソールではドキュメントの閲覧とナレッジグラフの可視化が可能です。ナレッジはワークスペースの `~/cow/knowledge/` ディレクトリに保存されます。
|
||
|
||
- **自動整理**:Agent が会話中に構造化された知識を自律的に抽出・整理し、インデックスと相互参照を維持
|
||
- **ナレッジグラフ**:ページ間の相互参照から自動的にナレッジグラフを構築し、Web コンソールでインタラクティブな関係図として可視化
|
||
- **チャット連携**:Agent の回答で参照されるナレッジドキュメントのリンクを Web コンソールで直接クリックして閲覧可能
|
||
- **CLI 管理**:`/knowledge` コマンドで統計表示、ディレクトリ閲覧、`/knowledge on|off` で機能の切り替えが可能
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260413105435.png" width="800" />
|
||
</Frame>
|
||
|
||
詳細は [パーソナルナレッジベース](/ja/knowledge) を参照してください。
|
||
|
||
## 3. タスク計画とツール活用
|
||
|
||
ツールは Agent がオペレーティングシステムのリソースにアクセスするための中核です。Agent はタスク要件に基づいてインテリジェントにツールを選択・呼び出し、ファイルの読み書き、コマンド実行、スケジュールタスクなどを実行します。組み込みツールはプロジェクトの `agent/tools/` ディレクトリに実装されています。
|
||
|
||
**主なツール:** ファイルの読み書き・編集、Bash ターミナル、ブラウザ操作、ファイル送信、スケジューラ、記憶検索、Web 検索、環境設定など。
|
||
|
||
### 3.1 ターミナルとファイルアクセス
|
||
|
||
OS のターミナルとファイルシステムへのアクセスは、最も基本的かつ中核的な機能です。多くの他のツールや Skill はこの機能の上に構築されています。ユーザーはモバイルデバイスから Agent とやり取りし、パソコンやサーバーのリソースを操作できます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202181130.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.2 プログラミング能力
|
||
|
||
プログラミングとシステムアクセスを組み合わせることで、Agent は完全な **Vibecoding ワークフロー** を実行できます。情報検索、アセット生成、コーディング、テスト、デプロイ、Nginx 設定、公開まで、すべてスマートフォンからの一つのコマンドで実行可能です:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260318211018.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.3 スケジュールタスク
|
||
|
||
`scheduler` ツールにより動的なスケジュールタスクが可能で、**ワンタイムタスク、固定間隔、Cron 式**をサポートしています。タスクは**固定メッセージ送信**または **Agent 動的タスク**実行としてトリガーできます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202195402.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.4 ブラウザ操作
|
||
|
||
組み込みの `browser` ツールにより、Agent は Chromium ブラウザを制御して Web ページへのアクセス、フォームの入力、要素のクリック、スクリーンショットの撮影が可能です。動的 JS レンダリングページにも対応しています。`cow install-browser` でワンコマンドインストール、サーバー(ヘッドレス)とデスクトップ環境に自動対応します:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260401110103.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.5 環境変数管理
|
||
|
||
Skill が必要とするシークレットキーは環境変数ファイルに保存され、`env_config` ツールによって管理されます。会話を通じてシークレットを更新でき、セキュリティ保護とマスキング機能が組み込まれています:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202234939.png" width="800" />
|
||
</Frame>
|
||
|
||
## 4. Skill システム
|
||
|
||
Skill システムは Agent に無限の拡張性を提供します。各 Skill は説明ファイル、実行スクリプト(任意)、リソース(任意)で構成され、特定のタイプのタスクを完了する方法を記述します。Skill により Agent は複雑なワークフローの指示に従い、ツールを呼び出し、サードパーティシステムと連携できます。
|
||
|
||
- **[Skill Hub](https://skills.cowagent.ai/):** オープンな Skill マーケットプレイス。公式推奨、コミュニティ、サードパーティの Skill を収録。ワンコマンドでインストール可能。
|
||
- **組み込み Skill:** プロジェクトの `skills/` ディレクトリにあり、Skill クリエイター、画像認識、LinkAI Agent、Web フェッチなどが含まれます。組み込み Skill は依存条件(API キー、システムコマンドなど)に基づいて自動的に有効化されます。
|
||
- **カスタム Skill:** ユーザーが会話を通じて作成し、ワークスペース(`~/cow/skills/`)に保存されます。あらゆる複雑なビジネスプロセスやサードパーティ連携を実装できます。
|
||
|
||
Skill のインストール:`/skill install <名前>` または `cow skill install <名前>`。Skill Hub、GitHub、ClawHub、URL などからインストール可能。
|
||
|
||
### 4.1 Skill の作成
|
||
|
||
`skill-creator` Skill により、会話を通じて Skill を素早く作成できます。ワークフローを Skill としてコード化するよう Agent に依頼したり、API ドキュメントやサンプルを送信して Agent に直接連携を完成させることができます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202202247.png" width="800" />
|
||
</Frame>
|
||
|
||
### 4.2 Web 検索と画像認識
|
||
|
||
- **Web 検索:** 組み込みの `web_search` ツールで、複数の検索エンジンをサポートします。`BOCHA_API_KEY` または `LINKAI_API_KEY` を設定して有効化してください。
|
||
- **画像認識:** 組み込みの `openai-image-vision` Skill で、`gpt-4.1-mini`、`gpt-4.1` などのモデルをサポートします。`OPENAI_API_KEY` が必要です。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
|
||
</Frame>
|
||
|
||
### 4.3 Skill Hub
|
||
|
||
[skills.cowagent.ai](https://skills.cowagent.ai/) で利用可能なすべての Skill を閲覧するか、会話内でコマンドを実行できます:
|
||
|
||
```text
|
||
/skill list --remote # Skill Hub を閲覧
|
||
/skill search <キーワード> # Skill を検索
|
||
/skill install <名前> # ワンコマンドでインストール
|
||
```
|
||
|
||
GitHub、ClawHub、LinkAI などサードパーティプラットフォームの Skill もインストール可能です。詳細は [Skill のインストール](/ja/skills/install) を参照してください。
|
||
|
||
<img src="https://cdn.link-ai.tech/doc/20260401110103.png" width="750" />
|
||
|
||
## 5. CLI コマンドシステム
|
||
|
||
CowAgent はサービス管理、Skill インストール、設定変更などをカバーする2つのコマンドインターフェースを提供します:
|
||
|
||
- **ターミナル CLI:** システムターミナルで `cow <コマンド>` を実行。`start`、`stop`、`restart`、`update`、`status`、`logs`、`skill` などをサポート。
|
||
- **チャットコマンド:** 会話内で `/<コマンド>` を入力。Web コンソールでは `/` を入力するとコマンドメニューが表示されます。
|
||
|
||
```bash
|
||
cow start # サービスを開始
|
||
cow stop # サービスを停止
|
||
cow update # 更新して再起動
|
||
cow skill install pptx # Skill をインストール
|
||
cow install-browser # ブラウザツールをインストール
|
||
```
|
||
|
||
詳細は [コマンド一覧](https://docs.cowagent.ai/ja/cli) を参照してください。
|