Testen Sie Gemini 3, unser bestes Modell für Schlussfolgerungen, Programmierung und multimodales Verstehen in der Gemini Enterprise Agent Platform.

KI-APIs für Google Cloud

Mit den KI- und ML-APIs von Google Cloud können Sie KI ganz einfach in Ihre Anwendungen einbinden. Neukunden erhalten ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Anwendungsfall	APIs	Geeignet für
APIs für generative AI	Grundlagenmodell-APIs Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe der Gemini Enterprise Agent Platform auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr verarbeiten.	Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen Bilder generieren und anpassen Universelle Sprachmodelle
APIs für generative AI	Gemini Enterprise Agent Platform Sie haben Zugriff auf eine Reihe von Funktionen zum Erkennen, Entwickeln und Bereitstellen von KI-Agenten. Dazu gehören Agent Garden, das Agent Development Kit (ADK) und die Agent Runtime.	Komplexe Multi-Agent-Systeme einfach erstellen Bidirektionales Audio- und Videostreaming Infrastrukturverwaltung, Skalierung, Sicherheit und Monitoring
APIs für maschinelles Lernen	Agent Platform API Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.	Benutzerdefiniertes ML-Training ML-Modelle testen, überwachen und optimieren Bereitstellung von über 200 Modellen, einschließlich multimodaler Modelle und Foundation Models wie Gemini
Speech, Text und Language APIs	Natural Language API Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen	Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen
	Speech‑to‑Text API Mit einer API auf Grundlage der KI-Technologien von Google Gesprochenes treffsicher in Text umwandeln	Automatische Spracherkennung Transkription in Echtzeit Erweiterte Anrufmodelle in Google Contact Center AI
	Text‑to‑Speech API Mit einer KI-gestützten API von Google wandeln Sie Text in natürlich klingende Sprache um.	Kundeninteraktionen verbessern Stimmliche Benutzeroberfläche in Geräten und Anwendungen Personalisierte Kommunikation
	Translation API Stellen Sie Inhalte und Apps mit schneller, dynamischer maschineller Übersetzung mehrsprachig zur Verfügung.	Echtzeit-Übersetzung Überzeugende Lokalisierung Ihrer Inhalte Internationalisierung Ihrer Produkte
Bild- und Video-APIs	Vision API Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte.	Bilder mit ML präzise vorhersagen und verstehen Bilder schnell Millionen vordefinierter Kategorien zuordnen
Bild- und Video-APIs	Video Intelligence API Der Weg zur einfachen Ermittlung von Inhalten sowie zu relevanten Videos	Umfassende Metadaten auf Video-, Aufnahmen- oder Frameebene extrahieren Videoanalyse, die über 20.000 Objekte, Orte und Aktionen in Videos erkennt
Dokument- und Daten-APIs	Document AI API Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.	Daten aus Dokumenten extrahieren, klassifizieren und aufteilen Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren Aus Dokumentdaten Erkenntnisse gewinnen
APIs für konversationelle KI	Customer Experience Agent Studio API Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.	Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen Erweiterte Agents schnell erstellen und bereitstellen Skalierbarkeit auf Unternehmensniveau Chatbot auf der Grundlage einer Website oder einer Sammlung von Dokumenten erstellen

APIs für generative AI

Grundlagenmodell-APIs

Vortrainierte große Multitasking-Modelle wie Gemini, die mithilfe der Gemini Enterprise Agent Platform auf bestimmte Aufgaben abgestimmt oder angepasst werden können. Diese multimodalen Modelle von Google können Vision, Dialog, Codegenerierung, Codevervollständigung und mehr verarbeiten.

Generierung von Textvervollständigungen, mehrstufigen Chats und Texteinbettungen
Bilder generieren und anpassen
Universelle Sprachmodelle

APIs für maschinelles Lernen

Agent Platform API

Hochwertige benutzerdefinierte Modelle für Machine Learning mit minimalem Aufwand und Fachwissen im Bereich des maschinellen Lernens trainieren.

Benutzerdefiniertes ML-Training
ML-Modelle testen, überwachen und optimieren
Bereitstellung von über 200 Modellen, einschließlich multimodaler Modelle und Foundation Models wie Gemini

Speech, Text und Language APIs

Natural Language API

Durch Machine Learning Informationen aus unstrukturiertem Text gewinnen

Natural Language Understanding auf Anwendungen mit der Natural Language API anwenden
Offene ML-Modelle zum Klassifizieren, Extrahieren und Erkennen von Stimmungen

Bild- und Video-APIs

Vision API

Integrieren Sie Funktionen zur visuellen Erkennung, einschließlich Bildbeschriftung, Gesichts- und Sehenswürdigkeiten-Erkennung, optische Zeichenerkennung (Optical Character Recognition, OCR) und das Tagging expliziter Inhalte.

Bilder mit ML präzise vorhersagen und verstehen
Bilder schnell Millionen vordefinierter Kategorien zuordnen

Dokument- und Daten-APIs

Document AI API

Vortrainierte Modelle für die Dokumentverarbeitung, einschließlich Basisextraktoren wie OCR und Formularparser, sowie spezielle Modelle für branchenspezifische Anwendungsfälle in den Bereichen Kreditvergabe, Verträge, Beschaffung und Identitätsdokumente.

Daten aus Dokumenten extrahieren, klassifizieren und aufteilen
Manuelle Dokumentverarbeitung und Einrichtungskosten reduzieren
Aus Dokumentdaten Erkenntnisse gewinnen

APIs für konversationelle KI

Customer Experience Agent Studio API

Konversationelle KI-Plattform mit absichtsbasierten und generativen KI-LLM-Funktionen zum Erstellen natürlicher, umfangreicher dialogorientierter Funktionen in mobilen Apps und Webanwendungen, Smart-Home-Geräten, Bots, interaktiven Sprachdialogsystemen, beliebten Messaging-Plattformen und mehr.

Natürliche Interaktionen für komplexe Unterhaltungen über mehrere Themen
Erweiterte Agents schnell erstellen und bereitstellen
Skalierbarkeit auf Unternehmensniveau
Chatbot auf der Grundlage einer Website oder einer Sammlung von Dokumenten erstellen

Sind Sie bereit, mit KI zu arbeiten?

Mit Tools und Diensten jeder Kenntnisstufe das Potenzial von KI nutzen.

Hier erfahren Sie, wie Generative AI in den allgemeinen Lebenszyklus der Softwareentwicklung passt.

Cloud AI-Produkte entsprechen unseren SLA-Richtlinien. Sie bieten eventuell von anderen Google Cloud-Diensten abweichende Latenz- oder Verfügbarkeitsgarantien.

Gleich loslegen

Profitieren Sie von einem Guthaben in Höhe von 300 $ und mehr als 20 immer kostenlose Produkten, um Google Cloud kennenzulernen.

Benötigen Sie Hilfe beim Einstieg?
Vertrieb kontaktieren
Mit einem zertifizierten Partnerunternehmen arbeiten
Partner finden
Mehr ansehen
Alle Produkte ansehen

KI-APIs für Google Cloud

APIs für generative AI

Grundlagenmodell-APIs

Gemini Enterprise Agent Platform

APIs für maschinelles Lernen

Agent Platform API

Speech, Text und Language APIs

Natural Language API

Speech‑to‑Text API

Text‑to‑Speech API

Translation API

Bild- und Video-APIs

Vision API

Video Intelligence API

Dokument- und Daten-APIs

Document AI API

APIs für konversationelle KI

Customer Experience Agent Studio API

APIs für generative AI

Grundlagenmodell-APIs

APIs für maschinelles Lernen

Agent Platform API

Speech, Text und Language APIs

Natural Language API

Bild- und Video-APIs

Vision API

Dokument- und Daten-APIs

Document AI API

APIs für konversationelle KI

Customer Experience Agent Studio API

Sind Sie bereit, mit KI zu arbeiten?

Gleich loslegen

Benötigen Sie Hilfe beim Einstieg?

Mit einem zertifizierten Partnerunternehmen arbeiten

Mehr ansehen