--- title: Zhipu GLM description: Zhipu AI GLM モデル設定(テキスト / 画像理解 / 音声認識 / ベクトル) --- Zhipu AI はテキスト対話、画像理解、音声認識(ASR)、ベクトル(Embedding)をサポートしており、1 つの `zhipu_ai_api_key` ですべての機能を有効化できます。 Web コンソールの「モデル管理」ページから、以下のすべての機能をワンストップで設定でき、設定ファイルを手動で編集する必要はありません。 ## テキスト対話 ```json { "model": "glm-5.1", "zhipu_ai_api_key": "YOUR_API_KEY" } ``` | パラメータ | 説明 | | --- | --- | | `model` | `glm-5.1`、`glm-5-turbo`、`glm-5`、`glm-4.7`、`glm-4-plus`、`glm-4-flash`、`glm-4-air` などを指定可能。詳細は [モデルコード](https://bigmodel.cn/dev/api/normal-model/glm-4) を参照 | | `zhipu_ai_api_key` | [Zhipu AI コンソール](https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys) で作成 | | `zhipu_ai_api_base` | 任意。デフォルトは `https://open.bigmodel.cn/api/paas/v4` | ## 画像理解 Zhipu の chat 系モデル(`glm-5.1`、`glm-5-turbo` など)はビジョンに対応していないため、ビジョン呼び出しは `glm-5v-turbo` に統一的にルーティングされます。`zhipu_ai_api_key` を設定すると、Agent の Vision ツールは自動的にこのモデルを使用するため、設定ファイルで明示的に指定する必要はありません。 ## 音声認識 ```json { "voice_to_text": "zhipu", "voice_to_text_model": "glm-asr-2512" } ``` | パラメータ | 説明 | | --- | --- | | `voice_to_text` | `zhipu` に設定すると Zhipu ASR が有効になります | | `voice_to_text_model` | 任意。デフォルトは `glm-asr-2512` | 認証情報は `zhipu_ai_api_key` を自動的に再利用します。音声ファイルは 25MB 未満を推奨します。サイズが大きすぎるファイルはサーバ側で拒否される可能性があります。 ## ベクトル ```json { "embedding_provider": "zhipu", "embedding_model": "embedding-3" } ``` 選択可能なモデル:`embedding-3`、`embedding-2`。embedding を変更した後は `/memory rebuild-index` コマンドを実行してインデックスを再構築する必要があります。