count-tokens
エンドポイントを使用すると、メッセージを Claude に送信する前にメッセージ内のトークン数を特定できるため、プロンプトと使用方法について十分な情報に基づいて判断できます。
count-tokens
エンドポイントの使用に料金は発生しません。
サポートされている Claude モデル
次のモデルはカウント トークンをサポートしています。
- Claude 3.5 Sonnet v2:
claude-3-5-sonnet-v2@20241022
。 - Claude 3.5 Haiku:
claude-3-5-haiku@20241022
。 - Claude 3 Opus:
claude-3-opus@20240229
。 - Claude 3.5 Sonnet:
claude-3-5-sonnet@20240620
。 - Claude 3 Haiku:
claude-3-haiku@20240307
。
サポートされているリージョン
次のリージョンではカウント トークンがサポートされています。
us-east5
europe-west1
asia-southeast1
us-central1
europe-west4
基本メッセージ内のトークンをカウントする
トークンをカウントするには、count-tokens
エンドポイントに rawPredict
リクエストを送信します。リクエストの本文には、トークンをカウントするモデルのモデル ID を含める必要があります。
REST
リクエストのデータを使用する前に、次のように置き換えます。
- LOCATION: サポートされているリージョン。
- MODEL: トークンをカウントするモデル。
- ROLE: メッセージに関連付けられたロール。
user
またはassistant
を指定できます。最初のメッセージでは、user
ロールを使用する必要があります。Claude モデルはuser
とassistant
のターンを交互に操作します。最後のメッセージがassistant
ロールを使用する場合、そのメッセージの内容の直後に回答の内容が続きます。これを使用して、モデルの回答の一部を制限できます。 - CONTENT:
user
またはassistant
のメッセージの内容(テキストなど)。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict
リクエストの本文(JSON):
{ "model": "claude-3-haiku@20240307", "messages": [ { "role": "user", "content":"how many tokens are in this request?" } ], }
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
リクエスト本文を request.json
という名前のファイルに保存して、次のコマンドを実行します。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"
PowerShell
リクエスト本文を request.json
という名前のファイルに保存して、次のコマンドを実行します。
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content
次のような JSON レスポンスが返されます。
ツール、画像、PDF を含むメッセージでトークンをカウントする方法については、Anthropic のドキュメントをご覧ください。
割り当て
デフォルトでは、count-tokens
エンドポイントの割り当ては 1 分あたり 2, 000 リクエストです。