Claude モデルのトークンをカウントする

count-tokens エンドポイントを使用すると、メッセージを Claude に送信する前にメッセージ内のトークン数を特定できるため、プロンプトと使用方法について十分な情報に基づいて判断できます。

count-tokens エンドポイントの使用に料金は発生しません。

サポートされている Claude モデル

次のモデルはカウント トークンをサポートしています。

  • Claude 3.5 Sonnet v2: claude-3-5-sonnet-v2@20241022
  • Claude 3.5 Haiku: claude-3-5-haiku@20241022
  • Claude 3 Opus: claude-3-opus@20240229
  • Claude 3.5 Sonnet: claude-3-5-sonnet@20240620
  • Claude 3 Haiku: claude-3-haiku@20240307

サポートされているリージョン

次のリージョンではカウント トークンがサポートされています。

  • us-east5
  • europe-west1
  • asia-southeast1
  • us-central1
  • europe-west4

基本メッセージ内のトークンをカウントする

トークンをカウントするには、count-tokens エンドポイントに rawPredict リクエストを送信します。リクエストの本文には、トークンをカウントするモデルのモデル ID を含める必要があります。

REST

リクエストのデータを使用する前に、次のように置き換えます。

  • LOCATION: サポートされているリージョン
  • MODEL: トークンをカウントするモデル
  • ROLE: メッセージに関連付けられたロール。user または assistant を指定できます。最初のメッセージでは、user ロールを使用する必要があります。Claude モデルは userassistant のターンを交互に操作します。最後のメッセージが assistant ロールを使用する場合、そのメッセージの内容の直後に回答の内容が続きます。これを使用して、モデルの回答の一部を制限できます。
  • CONTENT: user または assistant のメッセージの内容(テキストなど)。

HTTP メソッドと URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict

リクエストの本文(JSON):

{
  "model": "claude-3-haiku@20240307",
  "messages": [
    {
      "role": "user",
      "content":"how many tokens are in this request?"
    }
  ],
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"

PowerShell

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

ツール、画像、PDF を含むメッセージでトークンをカウントする方法については、Anthropic のドキュメントをご覧ください。

割り当て

デフォルトでは、count-tokens エンドポイントの割り当ては 1 分あたり 2, 000 リクエストです。