Testen Sie Gemini 1.5-Modelle, die neuesten multimodalen Modelle in Vertex AI, und sehen Sie selbst, was Sie mit einem Kontextfenster von bis zu 2 Mio. Tokens erstellen können.

KI-APIs für Google Cloud

Mit den KI- und ML-APIs von Google Cloud können Sie KI ganz einfach in Ihre Anwendungen einbinden. Neukunden erhalten ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Mann am Computer
AnwendungsfallAPIs Geeignet für
APIs für generative AI

Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe von Vertex AI auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr übernehmen.

  • Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen

  • Codevervollständigung und ‑erstellung mit Codey

  • Bilder mit Imagen generieren und anpassen

  • Universelle Sprachmodelle

Stellt eine Schritt-für-Schritt-Orchestrierung von Such- und Konversationsanwendungen für Unternehmen mit vordefinierten Workflows für allgemeine Aufgaben wie Onboarding, Datenaufnahme und Anpassung bereit.

  • Such-App in Google-Qualität mit eigenen Daten erstellen

  • Multimodale Anwendungen erstellen, die auf Text, Bilder und anderen Medien reagieren können

  • Zusammenfassungen auf Basis von generativer KI

APIs für Machine Learning

Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.

  • Benutzerdefiniertes ML-Training

  • ML-Modelle testen, überwachen und optimieren 

  • Bereitstellung von über 100 Modellen, einschließlich multimodaler und Foundation Models wie Gemini

Speech, Text und Language APIs

Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen

  • Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden

  • Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen

Mit einer API auf Grundlage der KI-Technologien von Google Gesprochenes treffsicher in Text umwandeln

  • Automatische Spracherkennung

  • Transkription in Echtzeit

  • Erweiterte Anrufmodelle in Google Contact Center AI

Mit einer KI-gestützten API von Google wandeln Sie Text in natürlich klingende Sprache um. 

  • Kundeninteraktionen verbessern 

  • Stimmliche Benutzeroberfläche in Geräten und Anwendungen

  • Personalisierte Kommunikation 

Stellen Sie Inhalte und Apps mit schneller, dynamischer maschineller Übersetzung mehrsprachig zur Verfügung.

  • Echtzeit-Übersetzung

  • Überzeugende Lokalisierung Ihrer Inhalte

  • Internationalisierung Ihrer Produkte

Bild- und Video-APIs

Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte. 

  • Bilder mit ML präzise vorhersagen und verstehen

  • Bilder schnell Millionen vordefinierter Kategorien zuordnen

Der Weg zur einfachen Ermittlung von Inhalten sowie zu relevanten Videos

  • Umfassende Metadaten auf Video-, Aufnahmen- oder Frameebene extrahieren

  • Videoanalyse zur Erkennung von über 20.000 Objekten, Orten und Aktionen in Videos

Dokument- und Daten-APIs

Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.

  • Daten aus Dokumenten extrahieren, klassifizieren und aufteilen 

  • Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren

  • Aus Dokumentdaten Erkenntnisse gewinnen

Integrierte, cloudbasierte Plattform zum Speichern, Suchen, Organisieren, Steuern und Analysieren von Dokumenten und deren strukturierten Metadaten. 

  • Detaillierte Zugriffssteuerung (Berechtigungen) auf Dokument- und Ordnerebene

  • Extrahierte und getaggte Metadaten verwalten

Dialogorientierte KI-APIs

Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.

  • Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen

  • Erweiterte Agents schnell erstellen und bereitstellen

  • Skalierbarkeit auf Unternehmensniveau

  • Chatbot basierend auf einer Website oder einer Sammlung von Dokumenten erstellen

Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe von Vertex AI auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr übernehmen.

  • Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen

  • Codevervollständigung und ‑erstellung mit Codey

  • Bilder mit Imagen generieren und anpassen

  • Universelle Sprachmodelle

Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.

  • Benutzerdefiniertes ML-Training

  • ML-Modelle testen, überwachen und optimieren 

  • Bereitstellung von über 100 Modellen, einschließlich multimodaler und Foundation Models wie Gemini

Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen

  • Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden

  • Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen

Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte. 

  • Bilder mit ML präzise vorhersagen und verstehen

  • Bilder schnell Millionen vordefinierter Kategorien zuordnen

Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.

  • Daten aus Dokumenten extrahieren, klassifizieren und aufteilen 

  • Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren

  • Aus Dokumentdaten Erkenntnisse gewinnen

Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.

  • Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen

  • Erweiterte Agents schnell erstellen und bereitstellen

  • Skalierbarkeit auf Unternehmensniveau

  • Chatbot basierend auf einer Website oder einer Sammlung von Dokumenten erstellen

Sind Sie bereit, mit KI zu arbeiten?

Mit Tools und Diensten jeder Kenntnisstufe das Potenzial von KI nutzen.
Hier erfahren Sie, wie generative KI in den allgemeinen Lebenszyklus der Softwareentwicklung passt.

KI-Produkte von Google Cloud entsprechen unseren SLA-Richtlinien. Sie bieten eventuell von anderen Google Cloud-Diensten abweichende Latenz- oder Verfügbarkeitsgarantien.

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“-Produkte kennenzulernen.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud