このリポジトリは、Azure OpenAI Studioを使って短時間でAzure OpenAIをキャッチアップできるセルフペースドハンズオンの資料です。
Azure OpenAI Serviceでは、OpenAIの強力な言語モデルをREST APIとして利用できます。
Azure OpenAIは、OpenAIに比べ、以下の点が特徴です。
- Azure OpenAIはAzureのセキュリティに準拠している
- リージョンの可用性が担保される
- 責任あるAIコンテンツのフィルターが利用できる
- Azure仮想ネットワークをはじめAzureサービスと接続できる
詳しくは、公式ドキュメントをご参照ください。
種類 | モデル ファミリ | 説明 | モデルの例 |
---|---|---|---|
チャット(会話) | GPT-4 | GPT-3.5 を基に改善され、自然言語とコードを生成するだけでなく、理解できるモデルのセット | gpt-4-32k , gpt-4 |
チャット(会話) | ChatGPT(GPT-3.5) | 会話型インタフェース用に設計されたモデル | gpt-35-turbo |
入力候補 | GPT-3 | 自然言語を理解し、生成できるモデルのシリーズ。これには、新しい ChatGPT(GPT-3.5) モデルが含まれます) | text-davinci-003 , text-curie-001 , text-babbage-001 , text-ada-001 |
入力候補 | Codex | 自然言語のコードへの変換を含め、コードを理解し、生成できるモデルのシリーズ | code-davinci-002 , code-cushman-001 |
画像生成 | DALL-E | 自然言語からオリジナルの画像を生成できるモデルのシリーズ | 割愛 |
埋め込み | Embeddings | embeddings(埋め込み)を理解し、使用できるモデルのセット。embeddingsとは、機会学習モデルとアルゴリズムにおいて簡単に利用できる特殊な形式のデータ表現を指す。 | 割愛 |
モデルは、{capability}-{family}-{identifier}
という名前付け規則のもと定義されています。
要素 | 説明 |
---|---|
capability |
モデルを指す。GPT-3ならtext 、Codexならcode 、embeddingsならtext-embedding 、text-search 、text-similarity など |
family |
相対ファミリを指す。ada , baggage , curie , davinci など、アルファベット順に世代が示され、後ろであるほど能力が高い |
identifier |
モデルのバージョン識別子 |
※ embeddingsの場合、{capability}-{family}[-{input-type}]-{identifier}
という名前付け規則が適用されており、input-type
はdoc
、query
などが指定されます。
主要なAPIは、以下の通りです。
種類 | API |
---|---|
チャット(会話) | Chat completions |
入力候補 | Completions |
画像生成 | Image geenration |
埋め込み | Embeddings |
詳しくは、公式ドキュメントをご参照ください。
セルフペースド ハンズオンは、docs/self-paced-handson.mdにお進みください。