mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-06-02 00:57:41 +08:00
121 lines
8.1 KiB
Plaintext
121 lines
8.1 KiB
Plaintext
---
|
||
title: 機能詳細
|
||
description: CowAgent の長期記憶、タスク計画、Skill システム、CLI コマンド、ブラウザツールの詳細
|
||
---
|
||
|
||
## 1. 長期記憶
|
||
|
||
記憶システムにより、Agent は重要な情報を長期にわたって記憶できます。ユーザーが好みや決定、重要な事実を共有すると、Agent は自発的に情報を保存し、会話が一定の長さに達すると自動的に要約を抽出します。記憶はコアメモリとデイリーメモリに分かれており、キーワード検索とベクトル検索の両方をサポートするハイブリッド検索が可能です。
|
||
|
||
初回起動時、Agent はユーザーに重要な情報を自発的に尋ね、ワークスペース(デフォルト `~/cow`)に記録します。これには Agent の設定、ユーザーの身元情報、記憶ファイルが含まれます。
|
||
|
||
その後の長期的な会話において、Agent は必要に応じてインテリジェントに記憶を保存・取得し、自身の設定やユーザーの好み、記憶ファイルを継続的に更新し、経験と教訓を要約します。これにより、真に自律的な思考と継続的な成長を実現しています。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260203000455.png" width="800" />
|
||
</Frame>
|
||
|
||
## 2. タスク計画とツール活用
|
||
|
||
ツールは Agent がオペレーティングシステムのリソースにアクセスするための中核です。Agent はタスク要件に基づいてインテリジェントにツールを選択・呼び出し、ファイルの読み書き、コマンド実行、スケジュールタスクなどを実行します。組み込みツールはプロジェクトの `agent/tools/` ディレクトリに実装されています。
|
||
|
||
**主なツール:** ファイルの読み書き・編集、Bash ターミナル、ブラウザ操作、ファイル送信、スケジューラ、記憶検索、Web 検索、環境設定など。
|
||
|
||
### 2.1 ターミナルとファイルアクセス
|
||
|
||
OS のターミナルとファイルシステムへのアクセスは、最も基本的かつ中核的な機能です。多くの他のツールや Skill はこの機能の上に構築されています。ユーザーはモバイルデバイスから Agent とやり取りし、パソコンやサーバーのリソースを操作できます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202181130.png" width="800" />
|
||
</Frame>
|
||
|
||
### 2.2 プログラミング能力
|
||
|
||
プログラミングとシステムアクセスを組み合わせることで、Agent は完全な **Vibecoding ワークフロー** を実行できます。情報検索、アセット生成、コーディング、テスト、デプロイ、Nginx 設定、公開まで、すべてスマートフォンからの一つのコマンドで実行可能です:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260203121008.png" width="800" />
|
||
</Frame>
|
||
|
||
### 2.3 スケジュールタスク
|
||
|
||
`scheduler` ツールにより動的なスケジュールタスクが可能で、**ワンタイムタスク、固定間隔、Cron 式**をサポートしています。タスクは**固定メッセージ送信**または **Agent 動的タスク**実行としてトリガーできます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202195402.png" width="800" />
|
||
</Frame>
|
||
|
||
### 2.4 ブラウザ操作
|
||
|
||
組み込みの `browser` ツールにより、Agent は Chromium ブラウザを制御して Web ページへのアクセス、フォームの入力、要素のクリック、スクリーンショットの撮影が可能です。動的 JS レンダリングページにも対応しています。`cow install-browser` でワンコマンドインストール、サーバー(ヘッドレス)とデスクトップ環境に自動対応します:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260401110103.png" width="800" />
|
||
</Frame>
|
||
|
||
### 2.5 環境変数管理
|
||
|
||
Skill が必要とするシークレットキーは環境変数ファイルに保存され、`env_config` ツールによって管理されます。会話を通じてシークレットを更新でき、セキュリティ保護とマスキング機能が組み込まれています:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202234939.png" width="800" />
|
||
</Frame>
|
||
|
||
## 3. Skill システム
|
||
|
||
Skill システムは Agent に無限の拡張性を提供します。各 Skill は説明ファイル、実行スクリプト(任意)、リソース(任意)で構成され、特定のタイプのタスクを完了する方法を記述します。Skill により Agent は複雑なワークフローの指示に従い、ツールを呼び出し、サードパーティシステムと連携できます。
|
||
|
||
- **[Skill Hub](https://skills.cowagent.ai/):** オープンな Skill マーケットプレイス。公式推奨、コミュニティ、サードパーティの Skill を収録。ワンコマンドでインストール可能。
|
||
- **組み込み Skill:** プロジェクトの `skills/` ディレクトリにあり、Skill クリエイター、画像認識、LinkAI Agent、Web フェッチなどが含まれます。組み込み Skill は依存条件(API キー、システムコマンドなど)に基づいて自動的に有効化されます。
|
||
- **カスタム Skill:** ユーザーが会話を通じて作成し、ワークスペース(`~/cow/skills/`)に保存されます。あらゆる複雑なビジネスプロセスやサードパーティ連携を実装できます。
|
||
|
||
Skill のインストール:`/skill install <名前>` または `cow skill install <名前>`。Skill Hub、GitHub、ClawHub、URL などからインストール可能。
|
||
|
||
### 3.1 Skill の作成
|
||
|
||
`skill-creator` Skill により、会話を通じて Skill を素早く作成できます。ワークフローを Skill としてコード化するよう Agent に依頼したり、API ドキュメントやサンプルを送信して Agent に直接連携を完成させることができます:
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202202247.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.2 Web 検索と画像認識
|
||
|
||
- **Web 検索:** 組み込みの `web_search` ツールで、複数の検索エンジンをサポートします。`BOCHA_API_KEY` または `LINKAI_API_KEY` を設定して有効化してください。
|
||
- **画像認識:** 組み込みの `openai-image-vision` Skill で、`gpt-4.1-mini`、`gpt-4.1` などのモデルをサポートします。`OPENAI_API_KEY` が必要です。
|
||
|
||
<Frame>
|
||
<img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
|
||
</Frame>
|
||
|
||
### 3.3 Skill Hub
|
||
|
||
[skills.cowagent.ai](https://skills.cowagent.ai/) で利用可能なすべての Skill を閲覧するか、会話内でコマンドを実行できます:
|
||
|
||
```text
|
||
/skill list --remote # Skill Hub を閲覧
|
||
/skill search <キーワード> # Skill を検索
|
||
/skill install <名前> # ワンコマンドでインストール
|
||
```
|
||
|
||
GitHub、ClawHub、LinkAI などサードパーティプラットフォームの Skill もインストール可能です。詳細は [Skill のインストール](/ja/skills/install) を参照してください。
|
||
|
||
<img src="https://cdn.link-ai.tech/doc/20260401110103.png" width="750" />
|
||
|
||
## 4. CLI コマンドシステム
|
||
|
||
CowAgent はサービス管理、Skill インストール、設定変更などをカバーする2つのコマンドインターフェースを提供します:
|
||
|
||
- **ターミナル CLI:** システムターミナルで `cow <コマンド>` を実行。`start`、`stop`、`restart`、`update`、`status`、`logs`、`skill` などをサポート。
|
||
- **チャットコマンド:** 会話内で `/<コマンド>` を入力。Web コンソールでは `/` を入力するとコマンドメニューが表示されます。
|
||
|
||
```bash
|
||
cow start # サービスを開始
|
||
cow stop # サービスを停止
|
||
cow update # 更新して再起動
|
||
cow skill install pptx # Skill をインストール
|
||
cow install-browser # ブラウザツールをインストール
|
||
```
|
||
|
||
詳細は [コマンド一覧](https://docs.cowagent.ai/ja/commands) を参照してください。
|