mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-06-03 19:17:10 +08:00
32 lines
908 B
Plaintext
32 lines
908 B
Plaintext
---
|
|
title: Image Vision
|
|
description: OpenAI の Vision モデルを使用して画像を認識
|
|
---
|
|
|
|
OpenAI の GPT-4 Vision API を使用して画像の内容を分析し、画像内のオブジェクト、テキスト、色などの要素を理解します。
|
|
|
|
## 依存関係
|
|
|
|
| 依存関係 | 説明 |
|
|
| --- | --- |
|
|
| `OPENAI_API_KEY` | OpenAI API キー |
|
|
| `curl`, `base64` | システムコマンド(通常プリインストール済み) |
|
|
|
|
設定方法:
|
|
|
|
- `env_config` Tool で `OPENAI_API_KEY` を設定
|
|
- または `config.json` で `open_ai_api_key` を設定
|
|
|
|
## 対応モデル
|
|
|
|
- `gpt-4.1-mini`(推奨、コストパフォーマンスに優れる)
|
|
- `gpt-4.1`
|
|
|
|
## 使い方
|
|
|
|
設定が完了したら、Agent に画像を送信すると自動的に画像認識がトリガーされます。
|
|
|
|
<Frame>
|
|
<img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
|
|
</Frame>
|