Einführung in Sprachmodelle im Vertex AI SDK

Sie können das Vertex AI SDK für Python verwenden, um Lösungen mithilfe der Basis-Sprachmodelle von Vertex AI programmatisch zu erstellen. Das Vertex AI SDK enthält Klassen für Texterstellung, Textchat, Texteinbettung, Codegenerierung, Codechat und Codevervollständigungsmodelle.

Informationen zur Installation des Vertex AI SDK für Python finden Sie unter Vertex AI SDK für Python installieren. Informationen zum Abschnitt „Sprachmodell“ im Referenzhandbuch für Vertex AI SDK finden Sie unter Sprachmodelle für Pakete.

Die Sprachmodelle, die im Vertex AI SDK dargestellt werden, ergänzen die Klassen, mit denen Sie Vertex AI-Lösungen erstellen können, die nicht mit generativen KI- und Sprachmodellen zusammenhängen. Informationen zur Verwendung des Vertex AI SDK zur Automatisierung der Datenaufnahme, zum Trainieren von Modellen und zum Abrufen von Vorhersagen in Vertex AI finden Sie unter Einführung in Vertex AI SDK für Python.

Sprachmodellklasse – Übersicht

Das Vertex AI SDK enthält Sprachmodelle, mit denen Sie gängige generative KI-Aufgaben ausführen können. Im Folgenden finden Sie Modellklassen, die für die Arbeit mit den in Vertex AI verfügbaren Basismodellen verwendet werden:

  • ChatModel: Verwenden Sie diese Klasse, um mit dem Basismodell für Textchat zu arbeiten. Der Name der aktuellen stabilen Version dieses Modells ist chat-bison@002.
  • CodeChatModel: Verwenden Sie diese Klasse, um mit dem Code-Chat-Basismodell zu arbeiten. Der Name der aktuellen stabilen Version dieses Modells lautet codechat-bison@002.
  • CodeGenerationModel: Verwenden Sie diese Klasse, um mit den Basismodellen für die Codegenerierung und die Codevervollständigung zu arbeiten. Der Name der aktuellen stabilen Version des Codegenerierungsmodells lautet code-bison@002 und der Name der aktuellen stabilen Version des Codevervollständigungsmodells ist code-gecko@001.
  • TextEmbeddingModel: Verwenden Sie diese Klasse, um mit dem Basismodell für Texteinbettungen zu arbeiten. Der Name der aktuellen stabilen Version des Codegenerierungsmodells lautet textembedding-gecko@003.
  • TextGenerationModel — Mit dieser Klasse können Sie die Foundation Models zur Textgenerierung verwenden. Die Namen der aktuellen stabilen Versionen der Textgenerierungsmodelle lauten text-bison@002 und text-unicorn@001.

Basismodell laden

Wenn Sie das Vertex AI SDK für die Arbeit mit einem Basismodell verwenden möchten, laden Sie eine Instanz des Modells. Verwenden Sie zum Laden eines Modells die Methode from_pretrained für eine Sprachmodellklasse. Basismodelle werden auch als vortrainierte Modelle bezeichnet. Geben Sie beim Aufrufen von from_pretrained eine stabile Version oder die neueste Version des Modells an, mit dem Sie arbeiten möchten. Weitere Informationen zu den stabilen und neuesten Versionen und dazu, wie sie im Code angegeben werden, finden Sie unter Modellversionen und Lebenszyklus.

Die folgenden Beispielzeilen von Python-Code zeigen, wie Sie ein Basismodell laden.

  • Rufen Sie die Version 001 der stabilen Version des vortrainierten Modells für Code-Chats ab:

    from vertexai.language_models import ChatModel
    
    my_chat_model = ChatModel.from_pretrained("chat-bison@002")
    
  • Rufen Sie die neueste Version des Textgenerierungsmodells ab:

    from vertexai.language_models import TextGenerationModel
    
    my_text_generation_model = TextGenerationModel.from_pretrained("text-bison")
    

Nachdem Sie das Vertex AI SDK zum Laden eines Modells verwendet haben, können Sie das Modell zum Erstellen generativer KI-Lösungen verwenden. Einige der Aufgaben, die Sie mit Ihrem geladenen Modell ausführen können, sind das Erzeugen von Text- und Codeinhalten, das Streamen von Inhalten, das Erstellen einer Text- oder Code-Chatsitzung, das Abstimmen des Modells, das Abrufen von Einbettungen und das Erstellen von Batchvorhersagen. Welche spezifischen Aufgaben Sie ausführen können, hängt vom Typ des Modells ab, das Sie geladen haben.

Nächste Schritte