Llama-Modelle verwenden

Llama ist eine Sammlung offener Modelle, die von Meta entwickelt wurden und die Sie in Vertex AI optimieren und bereitstellen können. Llama bietet vortrainierte und anhand von Anleitungen abgestimmte generative Text- und multimodale Modelle für einen assistentenähnlichen Chat. Sie können Llama 3.2-, Llama 3.1-, Llama 3- und Llama 2-Modelle in Vertex AI bereitstellen.

Llama 3.2

Mit Llama 3.2 können Entwickler die neuesten generativen KI-Modelle und ‑Anwendungen erstellen und bereitstellen, die die Funktionen von Llama nutzen, um neue Ideen zu entwickeln, z. B. Bildreasoning. Llama 3.2 ist außerdem für On-Device-Anwendungen besser zugänglich. In der folgenden Liste sind die Funktionen von Llama 3.2 aufgeführt:

  • Bietet eine privatere und personalisiertere KI-Nutzung mit On-Device-Verarbeitung für kleinere Modelle.
  • Bietet Modelle, die effizienter sind, eine geringere Latenz haben und eine bessere Leistung bieten. Sie eignen sich daher für eine Vielzahl von Anwendungen.
  • Basiert auf dem Llama-Stack, der das Erstellen und Bereitstellen von Anwendungen vereinfacht. Llama Stack ist eine standardisierte Schnittstelle zum Erstellen kanonischer Toolchain-Komponenten und Agent-Anwendungen.
  • Unterstützt Aufgaben im Bereich Computer Vision mit einer neuen Modellarchitektur, die Bild-Encoder-Darstellungen in das Sprachmodell einbindet.

Die Modelle 1B und 3B sind schlanke Nur-Text-Modelle, die Anwendungsfälle auf dem Gerät unterstützen, z. B. die mehrsprachige Abfrage von lokalem Wissen, Zusammenfassungen und Umformulierungen.

Die Llama-Modelle 11B und 90B sind kleine und mittelgroße multimodale Modelle mit Bildreasoning. So können sie beispielsweise visuelle Daten aus Diagrammen analysieren, um genauere Antworten zu geben, und Details aus Bildern extrahieren, um Textbeschreibungen zu generieren.

Weitere Informationen finden Sie auf der Modellkarte Llama 3.2 in Model Garden.

Hinweise

Bei der Verwendung von 11B und 90B gibt es keine Einschränkungen beim Senden von Prompts, die nur aus Text bestehen. Wenn Sie jedoch ein Bild in Ihren Prompt aufnehmen, muss es sich am Anfang des Prompts befinden und Sie dürfen nur ein Bild hinzufügen. Sie können beispielsweise keinen Text und dann ein Bild einfügen.

Llama 3.1

Die Llama 3.1-Sammlung mehrsprachiger Large Language Models (LLMs) ist eine Sammlung vortrainierter und anweisungsorientierter generativer Modelle in den Größen 8B, 70B und 405B (Text-in/Text-Ausgang). Die Llama 3.1-Anweisungen abgestimmten Textmodelle (8B, 70B, 405B) sind für mehrsprachige Dialoganwendungsfälle optimiert und übertreffen viele der verfügbaren Open-Source- und geschlossenen Chatmodelle im Vergleich zu gängigen Branchen-Benchmarks.

Weitere Informationen finden Sie auf der Llama 3.1-Modellkarte in Model Garden.

Llama 3

Die anweisungsoptimierten Llama 3-Modelle sind eine Sammlung von LLMs, die für Dialoganwendungsfälle optimiert sind. Llama 3-Modelle schneiden bei gängigen Branchenbenchmarks besser ab als viele der verfügbaren Open-Source-Chatmodelle.

Weitere Informationen finden Sie auf der Llama 3-Modellkarte in Model Garden.

Llama 2

Die Llama 2-LLMs sind eine Sammlung vortrainierter und fein abgestimmter generativer Textmodelle mit einer Größe von 7 B bis 70 B Parametern.

Weitere Informationen finden Sie auf der Modellkarte Llama 2 in Model Garden.

Code Llama

Die Code Llama-Modelle von Meta sind für Codesynthese, -verständnis und -anweisungen konzipiert.

Weitere Informationen finden Sie auf der Modellkarte Code Lama in Model Garden.

Llama Guard 3

Llama Guard 3 baut auf den Funktionen von Llama Guard 2 auf und fügt drei neue Kategorien hinzu: Verleumdung, Wahlen und Missbrauch des Code Interpreters. Darüber hinaus ist dieses Modell mehrsprachig und hat ein Prompt-Format, das mit Llama 3- oder späteren Modellen übereinstimmt.

Weitere Informationen finden Sie auf der Modellkarte Llama Guard in Model Garden.

Ressourcen

Weitere Informationen zu Model Garden finden Sie unter KI-Modelle in Model Garden entdecken.