Descontinuações de modelo como serviço (MaaS)

Após um período, os modelos de MaaS são descontinuados e geralmente substituídos por versões mais recentes. Para que você tenha tempo para testar e migrar para modelos mais recentes, esta página lista todos os modelos descontinuados e a data de desativação deles.

Soneto Claude 3 da Anthropic

O Claude 3 Sonnet da Anthropic foi descontinuado em 21 de janeiro de 2025 e será desativado em 21 de julho de 2025. O Claude 3 Sonnet está disponível apenas para clientes atuais.

O Claude 3 Sonnet foi projetado para ser confiável para implantações de IA escalonadas em vários casos de uso. O Claude 3 Sonnet é otimizado para os seguintes casos de uso:

  • Processamento de dados, incluindo geração de recuperação aumentada (RAG, na sigla em inglês) e recuperação de pesquisa.

  • Tarefas de vendas, como recomendações de produtos, previsão e marketing direcionado.

  • Tarefas que economizam tempo, como geração de código, controle de qualidade e reconhecimento óptico de caracteres (OCR) em imagens.

  • Tarefas de visão, como processar imagens para retornar saídas de texto. Além disso, análise de tabelas, gráficos, diagramas técnicos, relatórios e outros conteúdos visuais.

A tabela a seguir mostra as cotas máximas e o comprimento de contexto aceito para o Claude 3 Sonnet em cada região.

Região Cotas Tamanho de contexto compatível
us-east5 (Ohio) Até 10 QPM, 30.000 TPM 200.000 tokens

Como usar o Claude 3 Sonnet

Para comandos do SDK e do curl, use claude-3-sonnet@20240229 como o nome do modelo.

Preços

Para os usuários atuais do Anthropic Claude 3 Sonnet, os preços não vão mudar. Para mais detalhes, consulte a página Preços.

Modelos de IA da Mistral

O Mistral Large (24.07) e o Codestral (24.05) foram descontinuados em 30 de janeiro de 2025 e serão desativados em 29 de julho de 2025. Esses dois modelos estão disponíveis apenas para clientes atuais.

O Mistral Large (24.07) (mistral-large@2407) é o principal modelo da Mistral AI para a geração de textos. Ele atinge capacidades de raciocínio de nível superior e pode ser usado para tarefas multilíngues complexas, incluindo compreensão de texto, transformação e geração de código.

O Codestral (24.05) (codestral@2405) é um modelo generativo projetado e otimizado especificamente para tarefas de geração de código, incluindo preenchimento automático e preenchimento de código. O Codestral (24.05) foi treinado em mais de 80 linguagens de programação, o que permitiu que ele tivesse um bom desempenho em linguagens comuns e menos comuns.

Regiões compatíveis

Mistral Large (24.07)

Região Cotas Tamanho de contexto compatível
us-central1 Até 60 QPM, 400.000 TPM 128.000 tokens
europe-west4 Até 60 QPM, 400.000 TPM 128.000 tokens

Codestral (24.05)

Região Cotas Tamanho de contexto compatível
us-central1 Até 60 QPM, 400.000 TPM 32.000 tokens
europe-west4 Até 60 QPM, 400.000 TPM 32.000 tokens

Preços

Para os usuários do Mistral Large (24.07) e do Codestral (24.05), os preços vão permanecer os mesmos. Para detalhes, consulte a página Preços.