O ponto final count-tokens
permite-lhe determinar o número de tokens numa mensagem antes de a enviar para o Claude, o que ajuda a tomar decisões informadas sobre os seus comandos e utilização.
Não existe qualquer custo para usar o ponto final count-tokens
.
Modelos Claude suportados
Os seguintes modelos suportam tokens de contagem:
- Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4
- Claude 3.7 Sonnet
- Claude 3.5 Sonnet v2
- Claude 3.5 Haiku
- Claude 3.5 Sonnet
- Claude 3 Opus
- Claude 3 Haiku
Regiões suportadas
As seguintes regiões suportam tokens de contagem:
us-east5
europe-west1
asia-east1
asia-southeast1
us-central1
europe-west4
Contagem de tokens em mensagens básicas
Para contabilizar tokens, envie um pedido rawPredict
para o ponto final count-tokens
. O corpo do pedido tem de conter o ID do modelo para o qual quer contabilizar os tokens.
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- LOCATION: Uma região que suporta os modelos Claude da Anthropic. Para usar o ponto final global, consulte a secção Especifique o ponto final global.
- MODEL: o modelo para contabilizar os tokens.
- ROLE: a função associada a uma mensagem. Pode especificar um
user
ou umassistant
. A primeira mensagem tem de usar a funçãouser
. Os modelos Claude funcionam com turnos alternadosuser
eassistant
. Se a mensagem final usar a funçãoassistant
, o conteúdo da resposta continua imediatamente a partir do conteúdo dessa mensagem. Pode usar isto para restringir parte da resposta do modelo. - CONTENT: O conteúdo, como texto, da mensagem
user
ouassistant
.
Método HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict
Corpo JSON do pedido:
{ "model": "MODEL", "messages": [ { "role": "user", "content":"how many tokens are in this request?" } ], }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte.
Para obter informações sobre como contar tokens em mensagens com ferramentas, imagens e PDFs, consulte a documentação da Anthropic.
Quotas
Por predefinição, a quota para o ponto final count-tokens
é de 2000 pedidos por minuto.