Cloud Vision

Mit unseren leistungsstarken, vortrainierten API-Modellen Informationen aus Ihren Bildern gewinnen oder benutzerdefinierte Vision-Modelle mit AutoML Vision BETA trainieren

Kostenlos testen

Leistungsstarke Bildanalyse

Cloud Vision bietet die Flexibilität, sowohl vortrainierte Modelle über eine API zu nutzen als auch benutzerdefinierte Modelle mit AutoML Vision zu erstellen.

Mit der Cloud Vision API können Entwickler den Inhalt eines Bildes verstehen, indem sie über eine nutzerfreundliche REST API leistungsstarke Modelle für maschinelles Lernen verwenden. Die API ordnet Bilder Tausenden von Kategorien zu (z. B. "Segelboot"), erfasst einzelne Objekte und Gesichter und liest gedruckte Wörter in den Bildern. Sie können damit Metadaten zu Ihrem Bildkatalog erstellen, unangemessene Inhalte moderieren oder mithilfe der Sentimentanalyse für Bilder neue Marketingszenarien erschließen.

AutoML Vision Beta ermöglicht es Entwicklern mit geringen Kenntnissen über maschinelles Lernen, qualitativ hochwertige benutzerdefinierte Modelle zu trainieren. Nachdem die Bilder hochgeladen und mit Labels versehen wurden, trainiert AutoML ein Modell, das nach Bedarf angepasst werden kann. AutoML Vision bietet eine höhere Modellgenauigkeit und macht eine schnellere Erstellung eines produktionsreifen Modells möglich.

Leistungsstarke Bildanalyse

Informationen aus Ihren Bildern

Sie können in Ihren Bildern mühelos zahlreiche Objekte erkennen – von Blumen über Tiere bis zu Transportmitteln und Tausenden anderen Objektkategorien, die sich häufig in Bildern finden. Die Vision API wird im Laufe der Zeit kontinuierlich optimiert, indem neue Konzepte eingeführt werden und die Treffsicherheit verbessert wird. Mit AutoML Vision können Sie benutzerdefinierte Modelle erstellen, die bestimmte Konzepte in Ihren Bildern hervorheben. Hierdurch werden Anwendungsfälle von der Produktbildkategorisierung bis zur Krankheitsdiagnose ermöglicht.

Informationen aus Ihren Bildern

Text extrahieren

Mit der optischen Zeichenerkennung (Optical Character Recognition, OCR) können Sie neben der automatischen Spracherkennung in Ihren Bildern auch Text erfassen. Die Vision API unterstützt zahlreiche Sprachen.

Text extrahieren

Das Potenzial des gesamten Internets

Die Vision API nutzt das Potenzial der Google Bildersuche, um nach thematischen Entitäten wie Prominenten, Logos oder Ereignissen zu suchen. Es werden Millionen von Entitäten unterstützt, sodass Sie sicher sein können, dass die neuesten relevanten Bilder verfügbar sind. Dies können Sie mit der Suche nach optisch ähnlichen Bildern im Web verknüpfen.

Das Potenzial des gesamten Internets

Inhalte moderieren

Verwenden Sie die von Google bereitgestellte Funktion SafeSearch, um ganz einfach Inhalte in Ihren durch Crowdsourcing erhaltenen Bildern zu moderieren und unangemessene Inhalte zu erkennen. Mit der Vision API können Sie verschiedene Arten unangemessener Inhalte erkennen, z. B. nicht jugendfreie oder gewalttätige Inhalte.

Inhalte moderieren

Anwendungsfälle für Cloud Vision

Bildersuche

Verwenden Sie die Vision API und AutoML Vision, um Bilder anhand verschiedener Themen und Szenen, einschließlich benutzerdefinierter Kategorien, auffindbar zu machen. Weitere Informationen zu dieser Lösung

Bildersuche

Klassifizierung von Dokumenten

Greifen Sie effizient auf Informationen zu, indem Sie die Vision API und die Natural Language API verwenden, um Dokumente zu transkribieren und zu klassifizieren.

Klassifizierung von Dokumenten

Produktsuche

Suchen Sie mit der Cloud Vision API in Bildern nach bestimmten Produkten und durchsuchen Sie Produktkataloge.

Visuelle Produktsuche

Vorteile der Cloud Vision API

Mit unserer leistungsstarken Cloud Vision API Informationen aus Bildern gewinnen

Labelerkennung
Sie können in einem Bild zahlreiche Kategorien erkennen – von Verkehrsmitteln bis hin zu Tieren.
Weberkennung
Sie können im Internet nach ähnlichen Bildern suchen.
Optische Zeichenerkennung
Text in einem Bild kann erkannt und dann extrahiert werden. Diese Funktion unterstützt zahlreiche automatisch erkannte Sprachen. Sie können sowohl PDF- und TIFF-Dateien als auch Bilder wie PNG- und GIF-Dateien hochladen. Die vollständige Liste der unterstützten Dateien finden Sie hier.
Handschrifterkennungbeta
Mit der Vision API können Sie sowohl Handschrift als auch maschinell gedruckten Text erkennen.
Logoerkennung
Beliebte Produktlogos lassen sich in Bildern erkennen.
Objektlokalisiererbeta
Die Vision API kann nicht nur ein Objekt in einem Bild erkennen, sondern auch identifizieren, wo sich das Objekt im Bild befindet und wie viele Objekte dieses Typs sich im Bild befinden.
Integrierte REST API
Greifen Sie über die REST API auf die Cloud Vision API zu, um einen oder mehrere Anmerkungstypen pro Bild anzufordern. Bilder können in der Anfrage hochgeladen oder mit Google Cloud Storage verknüpft werden.
Erkennung von Sehenswürdigkeiten
Beliebte natürliche oder von Menschen erschaffene Strukturen können in Bildern erkannt werden.
Gesichtserkennung
Sie können in einem Bild mehrere Gesichter und wichtige Gesichtsmerkmale wie den Gesichtsausdruck oder das Tragen einer Kopfbedeckung erkennen. Die Zuordnung von Gesichtern zu bestimmten Personen wird nicht unterstützt.
Inhalte moderieren
Sie können in einem Bild unerwünschte Inhalte erkennen, beispielsweise nicht jugendfreies Material oder Darstellungen von Gewalt.
ML Kit integrieren
Integrieren Sie ML Kit, ein mobiles SDK, mit dem Sie die Technologie für das maschinelle Lernen von Google in einem leistungsstarken und dennoch nutzerfreundlichen Paket einfach auf Android- und iOS-Apps anwenden können.
Produktsuchebeta
Erkennen Sie Produkte aus Ihrem Katalog im Internet und in mobilen Fotos und implementieren Sie visuelle Suchfunktionen, mit denen Ihre Apps Produkte in Ihren Bildern erkennen können.
Bildattribute
Sie können allgemeine Attribute des Bildes erfassen, z. B. dominante Farben und Hinweise für geeignete Zuschnitte.

Wie funktioniert AutoML Visionbeta?

Wie funktioniert AutoML Vision

Vorteile von AutoML Visionbeta

Hochwertige, benutzerdefinierte Vision-Modelle mit AutoML Vision einfach trainieren

Benutzerdefinierte Modelle
Trainieren Sie benutzerdefinierte Modelle für maschinelles Lernen zur Bilderklassifizierung mit minimalem Aufwand und minimaler einschlägiger Erfahrung.
Hervorragende Leistung
Die Vorhersagegenauigkeit von AutoML-Modellen ist gegenüber Benchmarks, einschließlich ImageNet, branchenführend.
Labelerstellung durch Menschen einbeziehen
Kunden mit noch nicht gekennzeichneten Bildern bieten wir ein hausinternes Team von Mitarbeitern an, das die Bilder nach Ihren Anweisungen klassifiziert. So erhalten Sie Trainingsdaten in derselben Qualität und mit demselben Durchsatz wie Google selbst für seine eigenen Produkte. Ihre Daten bleiben dabei geschützt. Sie können diese von Menschen gekennzeichneten Daten direkt zum Trainieren eines benutzerdefinierten Modells verwenden.
Powered by AutoML und Lerntransfer von Google
Nutzen Sie die hochmoderne AutoML- und Lerntransfertechnologie von Google, um hochwertige Modelle zu erstellen.
Vollständig integriert
Cloud AutoML ist vollständig in andere Google Cloud-Dienste integriert. Dadurch haben Kunden eine einheitliche Zugriffsmethode für alle Google Cloud-Dienste. Ihre Trainingsdaten können Sie in Google Cloud Storage speichern. Schicken Sie einfach eine Abfrage an die AutoML REST API, um eine Vorhersage für Ihr trainiertes Modell zu erzeugen.

Preise für die Cloud Vision API

Ausführliche Preisinformationen finden Sie in der Preisübersicht.

  Preis pro 1.000 Einheiten nach Nutzung pro Monat
Funktion 1 bis 1.000 EINHEITEN/MONAT 1.001 bis 5.000.000 EINHEITEN/MONAT 5.000.001 bis 20.000.000 EINHEITEN/MONAT
Labelerkennung Kostenlos 1,50 $ 1,00 $
Texterkennung Kostenlos 1,50 $ 0,60 $
SafeSearch – Erkennung expliziter Inhalte Kostenlos Kostenlos mit Labelerkennung, sonst 1,50 $ Kostenlos mit Labelerkennung, sonst 0,60 $
Gesichtserkennung Kostenlos 1,50 $ 0,60 $
Erkennung von Sehenswürdigkeiten Kostenlos 1,50 $ 0,60 $
Logoerkennung Kostenlos 1,50 $ 0,60 $
Bildattribute Kostenlos 1,50 $ 0,60 $
Zuschneidehinweise Kostenlos Kostenlos mit Bildattributen, sonst 1,50 $ Kostenlos mit Bildattributen, sonst 0,60 $
Weberkennung Kostenlos 3,50 $ Für mehr Details Google kontaktieren
Erkennung von Dokumenttext Kostenlos 1,50 $ 0,60 $
Objektlokalisierer Kostenlos 2,25 $ 1,50 $

Vorhersage der Produktsuche

1 bis 100 Einheiten/Tag 100 Einheiten/Tag oder mehr
Kostenlos Kontakt

Speicher für die Produktsuche

0,10 $/1.000 Bilder

Beispiel: Wenn Sie die Gesichts- und die Labelerkennung auf dasselbe Bild anwenden, wird jede Funktion einzeln abgerechnet. Es würde gemäß Ihrem monatlichen Einheitenvolumen eine Einheit für Labelerkennung und eine Einheit für Gesichtserkennung abgerechnet werden.

Limits: Wenn Sie für Ihr Projekt voraussichtlich mehr als 20 Millionen Einheiten pro Monat brauchen, wenden Sie sich bitte an einen Vertriebsmitarbeiter, um über einen eventuellen Preisnachlass zu sprechen.

Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Preise für AutoML Visionbeta

Die Preise von AutoML Vision basieren auf Training und Vorhersage. Die Genauigkeit Ihres Modells hängt im Allgemeinen von der Dauer des durchgeführten Trainings und der Qualität des Trainings-Datasets ab. Sie zahlen nur für die genutzten Rechenstunden.

Training
Zum Training erhalten Sie für die ersten zehn Modelle pro Monat jeweils eine Stunde Gratistraining. Für weitere
Trainingsstunden fallen 20 $ pro Stunde an. Viele Kunden stellen fest, dass eine Stunde ausreichend ist, um ein experimentelles
Modell zu erstellen und nutzen zusätzliche Trainingsstunden, um die Genauigkeit bis auf Produktionsebene zu erhöhen.
Vorhersage
1 bis 1.000 Bilder Kostenlos
1.001 bis 5.000.000 Bilder* 3,00 $ pro 1.000 Bilder

* Wenn Sie Auskünfte zu Preisen für mehr als 5.000.000 Bilder benötigen, kontaktieren Sie uns.

Die auf dieser Seite erwähnten Produkte und Funktionen können sich in der Betaphase befinden. Weitere Informationen zu unseren Markteinführungsphasen finden Sie hier.

Feedback geben zu...

Cloud Vision API