Vision AI
Mit AutoML Vision Informationen aus Bildern in der Cloud oder auf Edge-Geräten gewinnen oder mit vortrainierten Vision API-Modellen Emotionen, Texte und mehr erkennen

AES, ein weltweit tätiges Energieunternehmen, das zu den Fortune 500 gehört, nutzt Drohnen und AutoML Vision, um die Zukunft so schnell wie möglich sicherer und umweltfreundlicher zu gestalten.

Branchenführende Genauigkeit in puncto Bilderkennung
Google Cloud bietet zwei Produkte für das maschinelle Sehen an, die mithilfe von maschinellem Lernen die Bilderkennung mit branchenführender Vorhersagegenauigkeit erleichtern.
AutoML Vision
Das Training kundenspezifischer Modelle für maschinelles Lernen lässt sich automatisieren. Dazu können Sie einfach Bilder hochladen und mit der benutzerfreundlichen grafischen Benutzeroberfläche von AutoML Vision kundenspezifische Bildmodelle trainieren. Optimieren Sie so die Modelle auf Treffsicherheit, Latenz und Größe und exportieren Sie diese in Ihre Anwendung in der Cloud oder in eine Reihe von Edge-Geräten.
Vision API
Die Vision API von Google Cloud bietet über die REST API und die RPC API leistungsstarke, vorab trainierte Modelle für maschinelles Lernen. Damit können Sie Bildern Labels zuweisen und die Bilder in kurzer Zeit Millionen vordefinierter Kategorien zuordnen. Außerdem lassen sich Objekte und Gesichter erkennen, gedruckter und handgeschriebener Text lesen und der Bildkatalog um wertvolle Metadaten erweitern.
Vorteile

Automatische Objekterkennung
Mehrere Objekte sowie die jeweilige Objektposition im Bild können gleichzeitig erkannt und klassifiziert werden. Weitere Informationen zur Objekterkennung mit Vision API und AutoML Vision.

Erkenntnisse zu Bildern auf Edge-Geräten
Mit AutoML Vision Edge können Sie schnelle, hochpräzise Modelle erstellen und bereitstellen, um damit Bilder auf Edge-Geräten zu klassifizieren und Echtzeitaktionen auf der Basis lokaler Daten auszulösen. AutoML Vision Edge unterstützt eine Vielzahl von Edge-Geräten, bei denen die Ressourcen beschränkt sind und die Latenz von kritischer Bedeutung ist. Weitere Informationen

Reibungslosen Einkauf ermöglichen
Mit der Vision-Produktsuche der Vision API können Einzelhändler das Einkaufen per Mobilgerät attraktiver gestalten. Kunden können Artikelfotos hochladen und bekommen sofort eine Liste ähnlicher Artikel angezeigt, die im gleichen Shop erhältlich sind.

Texte erkennen und auf sie reagieren
Die Vision API nutzt OCR, um in Bildern Text in mehr als 50 Sprachen und verschiedenen Dateitypen zu erkennen. OCR ist außerdem Teil der Document Understanding AI, mit der Sie Millionen von Dokumenten schnell verarbeiten und Geschäftsworkflows automatisieren können.

Explizite Inhalte erkennen
Die Vision API kann Bilder mit Safe Search untersuchen und abschätzen, wie wahrscheinlich es ist, dass ein Bild Inhalte für Erwachsene, Gewalt usw. enthält.

Daten-Labeling-Dienst nutzen
Falls Sie Bilder zur Nutzung mit AutoML Vision haben, die noch nicht mit Labels versehen wurden, kann ein spezielles Team von Google Sie dabei unterstützen, Bilder, Videos und Text so mit Labels zu versehen, dass Sie qualitativ hochwertige Trainingsdaten erhalten. Weitere Informationen
Welches Vision-Produkt ist das richtige für mich?
Sie haben die Wahl, ob Sie nur mit einem der Produkte arbeiten oder von den Vorteilen beider Produkte profitieren möchten. Beispiel: Sie können mit der Vision API Inhalte mithilfe tausender vordefinierter Labels in kurzer Zeit kategorisieren und/oder Sie können mit AutoML Vision zusätzliche kundenspezifische Labels für Ihre speziellen Anforderungen erstellen.
AutoML Vision | Vision API | |
---|---|---|
Benutzeroberfläche | ||
APIs verwenden
REST API und RPC API verwenden.
|
|
|
Grafische UI verwenden
Grafische Benutzeroberfläche verwenden.
|
|
|
Vordefinierte oder benutzerdefinierte Labels | ||
Bilder mit benutzerdefinierten Labels klassifizieren
Mit vortrainierten Modellen auf umfangreiche Bibliotheken mit vordefinierten Labels zurückgreifen.
|
|
|
Bilder mit benutzerdefinierten Labels klassifizieren
Modelle trainieren, um Bilder anhand kundenspezifischer Labels zu klassifizieren.
|
|
|
Daten-Labeling-Dienst von Google nutzen
Unser Team kann Sie dabei unterstützen, Ihre Bilder, Videos und Texte mit Labels zu versehen.
|
|
|
Auf Edge-Geräten bereitstellen | ||
ML-Modelle auf Edge-Geräten bereitstellen
Modelle mit niedriger Latenz und hoher Treffsicherheit bereitstellen, die für Edge-Geräte optimiert wurden.
|
|
In ML Kit einbinden |
Zusätzliche Features | ||
Objekterkennung
Objekte, Objektposition im Bild und Objektanzahl erkennen.
|
|
|
Vision-Produktsuche aktivieren
Fotos mit Bildern im Produktkatalog vergleichen und eine Rangliste ähnlicher Artikel zurückgeben.
|
|
|
Gedruckten und handgeschriebenen Text erkennen
Sprache mit OCR automatisch erkennen.
|
|
|
Gesichter erkennen
Gesichter und Gesichtsmerkmale erfassen. (Gesichtserkennung wird nicht unterstützt.)
|
|
|
Beliebte Orte und Produktlogos erkennen
Bekannte Sehenswürdigkeiten und Produktlogos automatisch identifizieren.
|
|
|
Allgemeine Bildattribute zuweisen
Allgemeine Attribute und geeignete Zuschneidehinweise erfassen.
|
|
|
Webentitäten und -seiten erkennen
Ereignisse, Logos und ähnliche Bilder im Web finden.
|
|
|
Inhalte moderieren
|
|
|
Prominentenerkennung
Gesichter von Prominenten in Bildern erkennen (eingeschränkter Zugriff, siehe Dokumentation).
|
|
Kunden der Vision API


Kunden von AutoML Vision




Highlights von der Google Cloud Next '19
So gewinnen Unternehmenskunden mit KI-Produkten von Google Cloud wertvolle Informationen aus Bilddaten
Anwendungsfälle
Inspektion von Produktionsteilen
Verwenden Sie AutoML Vision Edge, um den Prozess zur Qualitätskontrolle in der Fertigung zu automatisieren, indem Sie es Edge-Geräten ermöglichen, Fehler zu erkennen.
Registrieren Sie sich hier für weitere Informationen über unsere Lösung für die Inspektion von Produktionsteilen.
Vision-Produktsuche
Suchen Sie mit der Vision API in Bildern nach bestimmten Produkten und durchsuchen Sie Produktkataloge.
Klassifizierung von Dokumenten
Greifen Sie effizient auf Informationen zu: Mit der Vision API und der Natural Language API können Sie Dokumente klassifizieren, extrahieren und anreichern. Weitere Informationen finden Sie unter Document AI.
Bildersuche
Verwenden Sie die Vision API und AutoML Vision, um Bilder anhand verschiedener Themen und Szenen einschließlich kundenspezifischer Kategorien auffindbar zu machen. Weitere Informationen zu dieser Lösung
Preise
Vision AI-Produkte | Preisübersicht |
---|---|
Vision API | Dokumentation |
Vision-Produktsuche | Dokumentation |
AutoML Vision | Dokumentation |
AutoML Vision Edge | Dokumentation |
Ressourcen
An Kursen und praxisorientierten Labs teilnehmen

Nächste Schritte
Maschinelles Sehen in Anwendungen einbinden
Legen Sie jetzt mit AutoML Vision, AutoML Vision Edge, Vision API oder Vision Product Search los.
Die auf dieser Seite erwähnten Produkte und Funktionen befinden sich in der Betaphase. Weitere Informationen zu unseren Markteinführungsphasen finden Sie hier.
Cloud AI-Produkte entsprechen den hier aufgeführten SLA-Richtlinien. Sie bieten eventuell von anderen Google Cloud-Diensten abweichende Latenz- oder Verfügbarkeitsgarantien.