このページは Cloud Translation API によって翻訳されました。

Claude モデルのトークンをカウントする

count-tokens エンドポイントを使用すると、メッセージを Claude に送信する前にメッセージ内のトークン数を特定できるため、プロンプトと使用方法について十分な情報に基づいて判断できます。

count-tokens エンドポイントの使用に料金は発生しません。

サポートされている Claude モデル

次のモデルはカウントトークンをサポートしています。

Claude 3.5 Sonnet v2: claude-3-5-sonnet-v2@20241022。
Claude 3.5 Haiku: claude-3-5-haiku@20241022。
Claude 3 Opus: claude-3-opus@20240229。
Claude 3.5 Sonnet: claude-3-5-sonnet@20240620。
Claude 3 Haiku: claude-3-haiku@20240307。

サポートされているリージョン

次のリージョンではカウントトークンがサポートされています。

us-east5
europe-west1
asia-southeast1
us-central1
europe-west4

基本メッセージ内のトークンをカウントする

トークンをカウントするには、count-tokens エンドポイントに rawPredict リクエストを送信します。リクエストの本文には、トークンをカウントするモデルのモデル ID を含める必要があります。

REST

リクエストのデータを使用する前に、次のように置き換えます。

LOCATION: サポートされているリージョン。
MODEL: トークンをカウントするモデル。
ROLE: メッセージに関連付けられたロール。user または assistant を指定できます。最初のメッセージでは、user ロールを使用する必要があります。Claude モデルは user と assistant のターンを交互に操作します。最後のメッセージが assistant ロールを使用する場合、そのメッセージの内容の直後に回答の内容が続きます。これを使用して、モデルの回答の一部を制限できます。
CONTENT: user または assistant のメッセージの内容（テキストなど）。

HTTP メソッドと URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict

リクエストの本文（JSON）:

{
  "model": "claude-3-haiku@20240307",
  "messages": [
    {
      "role": "user",
      "content":"how many tokens are in this request?"
    }
  ],
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"

PowerShell

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{ "input_tokens": 14 }

ツール、画像、PDF を含むメッセージでトークンをカウントする方法については、Anthropic のドキュメントをご覧ください。

割り当て

デフォルトでは、count-tokens エンドポイントの割り当ては 1 分あたり 2, 000 リクエストです。