18 KiB
CowAgent は、自律的にタスクを計画し、コンピュータや外部リソースを操作し、Skill を作成・実行し、パーソナルナレッジベースと長期記憶でユーザーとともに成長するオープンソースのスーパー AI アシスタントです。エンドツーエンドの Agent Harness のリファレンス実装の一つでもあります。
CowAgent は軽量でデプロイしやすく、拡張性に優れています。主要な LLM プロバイダーをそのまま組み込み、Web や主要な IM プラットフォーム上で動作。個人 PC やサーバー上で 24 時間 365 日稼働できます。
🌐 ウェブサイト · 📖 ドキュメント · 🚀 クイックスタート · 🧩 Skill Hub · ☁️ オンラインで試す
🌟 主な機能
| 機能 | 説明 |
|---|---|
| タスク計画 | 複雑なタスクを分解し、目標達成までツールを繰り返し呼び出して段階的に実行 |
| 長期記憶 | 三層構造(コンテキスト → デイリー → コア)、Deep Dream による自動蒸留、キーワードとベクトルのハイブリッド検索 |
| ナレッジベース | 構造化された知識を Markdown Wiki として自動整理し、進化し続けるナレッジグラフを可視化ブラウジング |
| Skill | Skill Hub、GitHub、ClawHub からワンクリックでインストール;対話によるカスタム Skill 作成にも対応 |
| ツール | ファイル I/O、ターミナル、ブラウザ、スケジューラ、記憶検索、Web 検索など 10+ の組み込みツール — MCP プロトコルに完全対応 |
| チャネル | 一つの Agent で Web、WeChat、Feishu、DingTalk、WeCom、QQ、公式アカウントを同時にサポート |
| マルチモーダル | テキスト・画像・音声・ファイルをフルサポート — 認識・生成・双方向送受信 |
| モデル | Claude、GPT、Gemini、DeepSeek、GLM、Qwen、Kimi、MiniMax、Doubao など、設定 1 行で切り替え可能 |
| デプロイ | ワンラインインストーラー、統合された Web コンソール、複数のデプロイモード(ローカル / Docker / サーバー) |
🏗️ アーキテクチャ
CowAgent は完全な Agent Harness です:メッセージは各種チャネルから流入し、Agent Core が記憶・知識・利用可能なツール/Skill を組み合わせてタスクを計画・判断、モデルが応答を生成し、結果は元のチャネルに返されます。各レイヤーは疎結合で、独立して拡張可能です。
詳細は アーキテクチャ を参照してください。
🚀 クイックスタート
依存関係のインストール、設定、起動を自動で行うワンラインインストーラーを提供しています:
Linux / macOS:
bash <(curl -fsSL https://cdn.link-ai.tech/code/cow/run.sh)
Windows (PowerShell):
irm https://cdn.link-ai.tech/code/cow/run.ps1 | iex
Docker:
curl -O https://cdn.link-ai.tech/code/cow/docker-compose.yml
docker compose up -d
起動後、http://localhost:9899 にアクセスして Web コンソールを開くと、モデル設定・チャネル接続・Skill インストールがすべてここで完結します。
サーバーデプロイでコンソールに公開アクセスする場合は、
config.jsonのweb_hostを0.0.0.0に設定してください(あわせてweb_passwordの設定も強く推奨)。その後http://<server-ip>:9899にアクセスし、ファイアウォール/セキュリティグループで9899ポートを開放することも忘れずに。
📖 詳細ガイド: クイックスタート · ソースからインストール · アップグレード
インストール後は、cow CLI でサービスを管理できます:
cow start | stop | restart # サービス制御
cow status | logs # ステータスとログ
cow update # 最新コード取得後に再起動
cow skill install <名前> # Skill のインストール
cow install-browser # ブラウザツールのインストール
🤖 モデル
CowAgent は主要な LLM プロバイダーすべてに対応しています。チャット、画像認識、画像生成、ASR/TTS、埋め込み(Embedding) の各機能はそれぞれ別のベンダーで設定可能です。
| プロバイダー | 代表的なモデル | チャット | 画像認識 | 画像生成 | ASR | TTS | Embedding |
|---|---|---|---|---|---|---|---|
| Claude | claude-opus-4-7 | ✅ | ✅ | ||||
| OpenAI | gpt-5.5、o シリーズ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Gemini | gemini-3.5-flash | ✅ | ✅ | ✅ | |||
| DeepSeek | deepseek-v4-flash / pro | ✅ | |||||
| Qwen | qwen3.7-max | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| GLM | glm-5.1、glm-5v-turbo | ✅ | ✅ | ✅ | ✅ | ||
| Doubao | doubao-seed-2.0 シリーズ | ✅ | ✅ | ✅ | ✅ | ||
| Kimi | kimi-k2.6 | ✅ | ✅ | ||||
| MiniMax | MiniMax-M2.7 | ✅ | ✅ | ✅ | ✅ | ||
| ERNIE | ernie-5.1 | ✅ | ✅ | ||||
| LinkAI | 100+ モデルを統一ゲートウェイで提供 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| カスタム | ローカルモデル / サードパーティプロキシ | ✅ |
Web コンソールでの設定が推奨されており、ファイルを手動編集する必要はありません。手動設定については各プロバイダーのドキュメントおよび モデル概要 を参照してください。
💬 チャネル
一つの Agent インスタンスで複数のチャネルを同時に提供できます。channel_type 設定で切り替えるか、複数のチャネルを並列実行できます。
| チャネル | テキスト | 画像 | ファイル | 音声 | グループ |
|---|---|---|---|---|---|
| Web コンソール(デフォルト) | ✅ | ✅ | ✅ | ✅ | |
| ✅ | ✅ | ✅ | ✅ | ||
| Feishu / Lark | ✅ | ✅ | ✅ | ✅ | ✅ |
| DingTalk | ✅ | ✅ | ✅ | ✅ | ✅ |
| WeCom Bot | ✅ | ✅ | ✅ | ✅ | ✅ |
| ✅ | ✅ | ✅ | ✅ | ||
| WeCom App | ✅ | ✅ | ✅ | ✅ | |
| WeChat 公式アカウント | ✅ | ✅ | ✅ |
Feishu と WeCom Bot は Web コンソール内で QR コードをスキャンするだけで接続できます — パブリック IP は不要です。詳細は チャネル概要 を参照してください。
Web コンソールはデフォルトのチャネルであると同時に、Agent の設定・管理を統一的に行う場でもあります。
🧠 記憶とナレッジベース
長期記憶は三層構造:会話コンテキスト(短期)→ デイリー記憶(中期)→ MEMORY.md(長期)。毎晩の Deep Dream が散在する記憶を洗練された長期記憶とナラティブな日記に蒸留します。詳細は 長期記憶 · Deep Dream を参照してください。
パーソナルナレッジベースは時系列の記憶とは異なり、構造化された知識をトピック単位で整理します。Agent が会話中に有用な情報を自動でキュレーションし、相互参照とインデックスを維持し、Web コンソールでナレッジグラフを可視化できます。詳細は パーソナルナレッジベース を参照してください。
長期記憶 · 三層構造 + Deep Dream |
ナレッジベース · 自動キュレーションされた Markdown Wiki |
🔧 ツールと Skill
ツール(Tools) は Agent がシステムリソースを操作するためのアトミックな機能です。Skill(Skills) はマニフェストファイルで定義される高レベルのワークフローで、複数のツールを組み合わせて複雑なタスクを完了します。
ツールシステム
組み込みツールには、ファイル I/O(read / write / edit / ls)、ターミナル(bash)、ファイル送信(send)、記憶検索(memory)、環境変数(env_config)、Web フェッチ(web_fetch)、スケジューラ(scheduler)、Web 検索(web_search)、画像認識(vision)、ブラウザ自動化(browser)などが含まれます。
MCP プロトコルは Model Context Protocol のオープンエコシステムを統合します。mcp.json を一度設定すれば即利用可能で、stdio / SSE トランスポート、ホットリロード、ノーコード統合をサポートします。
Skill システム
- Skill Hub — オープン Skill マーケットプレイス:閲覧、検索、ワンクリックインストール
- GitHub / ClawHub / URL など — 任意のソースからワンクリックでインストール
- 対話による作成 —
skill-creatorを使って対話でカスタム Skill を生成;ワークフローやサードパーティ API を再利用可能な Skill に変換
/skill list # インストール済み Skill の一覧
/skill search <キーワード> # マーケットプレイスで検索
/skill install <名前> # ワンクリックインストール
🏷 更新履歴
2026.05.22: v2.0.9 — モデル管理、MCP プロトコル対応、ブラウザセッション永続化、新モデル(gpt-5.5、gemini-3.5-flash、qwen3.7-max)、デプロイのセキュリティ強化。
2026.05.06: v2.0.8 — Feishu チャネル全面アップグレード(音声、ストリーミング、QR 接続)、DeepSeek V4 と Baidu Qianfan 対応、スケジューラツール強化。
2026.04.22: v2.0.7 — 組み込み画像生成(GPT Image 2、Nano Banana)、新モデル(Kimi K2.6、Claude Opus 4.7、GLM 5.1)、ナレッジベースと記憶の強化。
2026.04.14: v2.0.6 — ナレッジベース、Deep Dream 記憶蒸留、スマートコンテキスト圧縮、マルチセッション Web コンソール。
2026.04.01: v2.0.5 — Cow CLI、Skill Hub オープンソース化、ブラウザツール、WeCom Bot QR 接続。
2026.02.03: v2.0.0 — マルチステップタスク計画、長期記憶、Skill フレームワークを備えたスーパー Agent アシスタントへの全面アップグレード。
完全な履歴: リリースノート
🤝 コミュニティとサポート
GitHub で Issue を報告 するか、下記 QR コードをスキャンして WeChat コミュニティに参加してください:
🔗 関連プロジェクト
- Cow Skill Hub — AI エージェント向けのオープン Skill マーケットプレイス;CowAgent、OpenClaw、Claude Code などに対応
- bot-on-anything — 軽量な LLM アプリケーションフレームワーク;Slack、Telegram、Discord、Gmail などに対応
- AgentMesh — チーム協調による複雑な問題解決のためのオープンソースのマルチエージェントフレームワーク
🏢 エンタープライズサービス
LinkAI は企業や開発者向けのワンストップ AI Agent プラットフォームで、CowAgent にマネージドホスティングとエンタープライズグレードのサポートを提供します:
- 🚀 デプロイ不要のホスト型ランタイム — CowAgent オンラインアシスタント を 1 分以内に起動、サーバー不要
- 🧠 統合モデル & Skill マーケットプレイス — 主要 LLM への統一アクセスと公式 Skill マーケットプレイスで CowAgent の活用範囲を拡大
- 🏢 チーム & エンタープライズ機能 — ワークスペース、ロールベースのアクセス制御、監査ログ、本番運用向けプライベートデプロイ
エンタープライズに関するお問い合わせ:sales@simple-future.tech または QR コードをスキャン して WeChat でお問い合わせください。
🛠️ 開発とコントリビューション
新しいチャネルの追加を歓迎します — Feishu チャネル を参考にカスタムチャネルを実装できます。新しい Skill のコントリビューションも Skill Hub で受け付けています。
⭐ Star でプロジェクトの更新をフォローしてください。PR や Issue の提出も歓迎します。
🌟 コントリビューター
⚠️ 免責事項
- 本プロジェクトは MIT License に基づき、技術研究と学習を目的としています。利用者は所在地の法令・規制を遵守する必要があり、本プロジェクトの利用に起因するいかなる結果についてもメンテナーは責任を負いません。
- コストと安全性: Agent モードは通常のチャットよりトークン消費が大幅に多いため、品質とコストのバランスを考慮してモデルを選択してください。Agent はローカル OS にアクセスできるため、信頼できる環境にのみデプロイしてください。
- CowAgent は純粋なオープンソースプロジェクトであり、暗号通貨の発行・参加・承認は一切行いません。
📌 プロジェクト改名のお知らせ
本プロジェクトは旧名 chatgpt-on-wechat から、2026.04.13 に CowAgent へ正式に改名されました。元の GitHub URL は自動的にリダイレクトされます。既存ユーザーは git remote set-url origin https://github.com/zhayujie/CowAgent.git でローカルのリモートを更新できます。

