Présentation de Generative AI sur Vertex AI

L'IA générative sur Vertex AI vous permet de créer des applications prêtes pour la production, alimentées par des modèles d'IA générative de pointe hébergés sur l'infrastructure mondiale avancée de Google.

Commencer


Une solution adaptée aux entreprises

Une solution adaptée aux entreprises

Déployez vos applications d'IA générative à grande échelle avec une sécurité de niveau entreprise, une résidence des données, un accès transparent et une faible latence.

Fonctionnalités de pointe

Fonctionnalités de pointe

Développez les fonctionnalités de vos applications en utilisant la fenêtre de contexte de 2 000 000 jetons compatible avec Gemini 1.5 Pro.

Plate-forme ouverte

Plate-forme ouverte

Vertex AI vous donne accès à plus de 100 modèles d'entreprises d'IA tierces, y compris Anthropic Claude 3.5 Sonnet, Meta Llama 3 et Mistral AI Mixtral 8x7B.

Fonctionnalités de base

  • Traitement multimodal

    Traiter plusieurs types de contenus multimédias en même temps, tels que des images, des vidéos, des contenus audio et des documents

  • Génération d'embeddings

    Générez des embeddings pour effectuer des tâches telles que la recherche, la classification, le clustering et la détection d'anomalies.

  • Réglage de modèle

    Adapter les modèles pour effectuer des tâches spécifiques avec plus de justesse.

  • Appel de fonction

    Connectez des modèles à des API externes pour étendre les fonctionnalités du modèle.

  • Surface de référence

    Connectez les modèles à des sources de données externes pour réduire les hallucinations dans les réponses.

  • Génération d'images

    Générez et modifiez des images à l'aide de requêtes de texte en langage naturel.


Différences entre Vertex AI et Google AI

L'API Gemini dans Vertex AI et Google AI vous permettent d'intégrer les fonctionnalités des modèles Gemini dans vos applications. La plate-forme la plus adaptée dépend de vos objectifs, comme indiqué dans le tableau suivant.

API Conçue pour Fonctionnalités
API Gemini Vertex AI
  • Déploiements à l'échelle
  • Enterprise
  • Assistance technique
  • Tarifs basés sur les modalités
  • Protection contre les dommages et intérêts
  • Plus de 100 modèles dans Model Garden
API Google AI Gemini
  • Expérimentation
  • Prototypage
  • Simplicité d'utilisation
  • Version gratuite
  • Tarification basée sur les jetons

Migrer de l'IA de Google vers Vertex AI

Créer des applications à l'aide des SDK Vertex AI

Vertex AI fournit des SDK dans les langages suivants :

Python

from vertexai.generative_models import GenerativeModel
model = GenerativeModel(model_name="gemini-1.5-flash")
response = model.generate_content([Part.from_uri(IMAGE_URI, mime_type="image/jpeg"),"What is this?"])

Node.js

const vertexAI = new VertexAI({project: projectId, location: location});
const generativeVisionModel = vertexAI.getGenerativeModel({ model: "gemini-1.5-flash"});

const result = await model.generateContent([
  "What is this?",
  {inlineData: {data: imgDataInBase64, mimeType: 'image/png'}}
]);

Java

public static void main(String[] args) throws Exception {
  try (VertexAI vertexAi = new VertexAI(PROJECT_ID, LOCATION); ) {
    GenerativeModel model = new GenerativeModel("gemini-1.5-flash", vertexAI);
  List<Content> contents = new ArrayList<>();
  contents.add(ContentMaker
                .fromMultiModalData(
                    "What is this?",
                    PartMaker.fromMimeTypeAndData("image/jpeg", IMAGE_URI)));
  GenerateContentResponse response = model.generateContent(contents);
  }
}

Go

model := client.GenerativeModel("gemini-1.5-flash", "us-central1")
img := genai.ImageData("jpeg", image_bytes)
prompt := genai.Text("What is this?")
resp, err := model.GenerateContent(ctx, img, prompt)

C#

var predictionServiceClient = new PredictionServiceClientBuilder {
  Endpoint = $"{location}-aiplatform.googleapis.com"
}.Build();

var generateContentRequest = new GenerateContentRequest {
  Model = $"projects/{projectId}/locations/{location}/publishers/google/models/gemini-1.5-flash",
  Contents = {
    new Content {
      Role = "USER",
      Parts = {
        new Part {Text = "What's in this?"},
        new Part {FileData = new() {MimeType = "image/jpeg", FileUri = fileUri}}
      }
    }
  }
};

GenerateContentResponse response = await predictionServiceClient.GenerateContentAsync(generateContentRequest);

Premiers pas

Autres façons de se lancer