chatgpt-on-wechat/docs/ja/skills/image-vision.mdx

---
title: Image Vision
description: OpenAI の Vision モデルを使用して画像を認識
---

OpenAI の GPT-4 Vision API を使用して画像の内容を分析し、画像内のオブジェクト、テキスト、色などの要素を理解します。

## 依存関係

| 依存関係 | 説明 |
| --- | --- |
| `OPENAI_API_KEY` | OpenAI API キー |
| `curl`, `base64` | システムコマンド（通常プリインストール済み） |

設定方法：

- `env_config` Tool で `OPENAI_API_KEY` を設定
- または `config.json` で `open_ai_api_key` を設定

## 対応モデル

- `gpt-4.1-mini`（推奨、コストパフォーマンスに優れる）
- `gpt-4.1`

## 使い方

設定が完了したら、Agent に画像を送信すると自動的に画像認識がトリガーされます。

<Frame>
  <img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
</Frame>