{"code": "InsufficientQuota", "message": "The specified capacity '60' of account deployment is bigger than available capacity '0' for UsageName 'Tokens Per Minute (thousands) - Text-Davinci-003'."}
Azure OpenAI Serviceのクォータ上限以上のキャパシティを要求した場合にこのエラーが出ます。
解決方法としては、以下が考えられます
- Quotaを圧迫している既存リソースのPurge(消去)
- Quota要求量を減らす
- 別のリージョンに作成する
- 既存のリソースのQuotaを下げる
同サブスクリプション・リージョン内の同じ種類のモデルのリソースを削除することでQuotaを開放することができます。ただし、Azure OpenAI Serviceのリソースを削除してから48時間以内の場合、論理削除状態でありQuotaも使われている状態である可能性があります。その場合、リソースのPurge(消去)することにより使用しているQuotaを下げることができます。
Bicepの場合は以下のように、sku
のcapacity
を指定することでQuota要求量を減らすことができます。
呼び出し側
deployments: [
{
name: gptDeploymentName
model: {
format: 'OpenAI'
name: gptModelName
version: '1'
}
sku: {
name: 'Standard'
capacity: aoaiCapacity
}
}
{
name: chatGptDeploymentName
model: {
format: 'OpenAI'
name: chatGptModelName
version: '0301'
}
sku: {
name: 'Standard'
capacity: aoaiCapacity
}
}
]
呼び出されるmodule側
resource deployment 'Microsoft.CognitiveServices/accounts/deployments@2023-05-01' = [for deployment in deployments: {
parent: account
name: deployment.name
sku: deployment.sku
properties: {
model: deployment.model
raiPolicyName: contains(deployment, 'raiPolicyName') ? deployment.raiPolicyName : null
}
}]
※accounts/deploymentsは必ず@2023-05-01を使うようにしてください
Quotaはサブスクリプション内のリージョン毎に設定されているため、他のリージョンに作成することで既存リソースに割り当てたQuotaの影響を受けずにデプロイすることが可能です。
既存リソースのQuotaを以下のような手順で下げることが可能です。
- Azure OpenAIアカウントを開く
- 「モデルとデプロイ」を選択(Azure OpenAI Studio画面が開きます)
- 「管理」>「クォータ」を選択
- デプロイされたモデルのリストからQuotaを変えたいモデルを選択
- 「デプロイの編集」>「詳細設定オプション」からQuotaを変更
- 「保存して終了」を選択
ERROR: deployment failed: failing invoking action 'provision', error deploying infrastructure: deploying to subscription:
Deployment Error Details:
InvalidTemplateDeployment: The template deployment 'openai' is not valid according to the validation procedure. The tracking id is 'xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx'. See inner errors for details.
DeploymentModelNotSupported: Creating account deployment is not supported by the model 'text-davinci-003'. This is usually because there are better models available for the similar functionality.
対象のAzure OpenAIモデルがデプロイできない。
別のモデルとバージョンを指定(例: text-davinci-003のversion=1からのgpt-35-turboのversion=0301)