Diese Seite wurde von der Cloud Translation API übersetzt.

MedLM API

Haftungsausschluss:MedLM in Vertex AI ist in den USA, Brasilien und Singapur für eine begrenzte Gruppe von Kunden allgemein verfügbar und außerhalb der USA für eine begrenzte Gruppe von Kunden in der Vorschau verfügbar. Bei dieser Version liegt der Schwerpunkt auf der Verwendung medizinischer Fragen und Antworten und medizinischer Zusammenfassungen. Wenn Sie die MedLM API verwenden, stimmen Sie der Richtlinie zur verbotenen Nutzung von generativer KI und den dienstspezifischen Nutzungsbedingungen der Google Cloud Platform zu. Sie erklären sich damit einverstanden, Google nach Treu und Glauben zu benachrichtigen und mit Google zusammenzuarbeiten, wenn es um rechtliche Fragen in Bezug auf die Verwendung von MedLM geht. Für dieses Produkt können personenbezogene Daten gemäß den Bedingungen zur Datenverarbeitung und Sicherheit verarbeitet werden, vorbehaltlich der in den Nutzungsbedingungen der Google Cloud Platform beschriebenen Einschränkungen. Weitere Informationen finden Sie unter den Beschreibungen der Startphase. Wenn Sie eine Geschäftspartner-Vereinbarung mit Google abgeschlossen haben, die Ihre Nutzung der Google Cloud Platform-Dienste abdeckt, kann die MedLM API verwendet werden, um geschützte Gesundheitsdaten gemäß dem Health Insurance Portability and Accountability Act (HIPAA) von 1996 und/oder Änderungen oder Vorschriften gemäß HIPAA zu verarbeiten.

Achtung:

Bevor die Produktionsnutzung für MedLM aktiviert wird, müssen sich Kunden an das Google-Produktteam wenden, um die Nutzung zu besprechen.
MedLM ist nicht zur Verwendung als Medizinprodukt gedacht. Jede Ausgabe sollte von einem Healthcare Professional (HCP) verifiziert werden und es dürfen nie direkte Diagnosen ausgesprochen werden.
Die generierte Ausgabe ist möglicherweise nicht immer zuverlässig. Aufgrund der Natur der LLMs und der generativen KI beinhalten Ausgaben möglicherweise falsche oder verzerrte Informationen (z. B. Stereotypen oder andere schädliche Inhalte). Sie sollten daher überprüft werden. Alle Zusammenfassungen oder Antworten sollten als Entwürfe betrachtet werden.
Wenn Vertex AI Inhalte erkennt, die gegen unsere Richtlinien verstoßen, einschließlich der Richtlinie zur zulässigen Verwendung der Google Cloud Platform und der Generative AI Richtlinie für verbotene Nutzung, wird keine Antwort zurückgegeben.
Wenn MedLM von Gesundheitsdienstleister für Fragen und Antworten verwendet wird, ist es nur als Bildungstool für medizinisches Training oder zur Verstärkung des vorherigen Trainings des Gesundheitsdienstleister vorgesehen.
Die LLM-Ausgabe entspricht möglicherweise nicht genau dem Format, das im Prompt angegeben wird. Beim Prompt-Design zum Extrahieren von Informationen aus den einzelnen Felder sollte berücksichtigt werden, dass das Format vom Original abweichen kann (z. B. Bindestriche in Feldnamen, genaue Großschreibung).

MedLM ist eine Familie von Foundation Models, die für die Gesundheitsbranche optimiert wurden. Med-PaLM 2 ist eines der von Google Research entwickelten textbasierten Modelle, die MedLM unterstützen. Es war das erste KI-System, das den Level menschlicher Experten in Sachen Antworten auf USMLE (US Medical Licensing Examination)-Fragen erreichte. Die Entwicklung dieser Modelle wurde durch bestimmte Kundenanforderungen bestimmt, darunter die Beantwortung medizinischer Fragen und das Erstellen von Zusammenfassungen.

MedLM-Modellkarte

Die MedLM-Modellkarte enthält die Modelldetails, z. B. die vorgesehene Verwendung von MedLM, eine Datenübersicht und Sicherheitsinformationen. Klicken Sie auf den folgenden Link, um eine PDF-Version der MedLM-Modellkarte herunterzuladen:

MedLM-Modellkarte herunterladen

Anwendungsfälle

Fragen beantworten: Hier können Sie als Reaktion auf medizinische Fragen eine Antwort in Textform entwerfen.
Zusammenfassung: Entwerfen Sie eine kürzere Version eines Dokuments (z. B. eine Zusammenfassung oder einen Verlauf der Visite und eine Notiz physischen Untersuchung), in der die relevanten Informationen aus dem Originaltext enthalten sind.

Weitere Informationen zum Entwerfen von Text-Prompts finden Sie unter Übersicht über Prompting-Strategien.

HTTP-Anfrage

MedLM-medium (medlm-medium):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large (medlm-large):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

Weitere Informationen finden Sie unter predict-Methode.

Modellversionen

MedLM bietet die folgenden Modelle:

MedLM-medium (medlm-medium)
MedLM-Large (medlm-large)

Die folgende Tabelle enthält die verfügbaren stabilen Modellversionen:

medlm-medium model	Veröffentlicht
`medlm-medium`	13. Dezember 2023

medlm-large model	Veröffentlicht
`medlm-large`	13. Dezember 2023

MedLM-medium und MedLM-large haben separate Endpunkte und bieten Kunden zusätzliche Flexibilität für ihre Anwendungsfälle. MedLM-medium bietet Kunden bessere Durchsätze und enthält neuere Daten. MedLM-large ist das gleiche Modell aus der Vorschauphase. Beide Modelle werden über den gesamten Produktlebenszyklus aktualisiert. Auf dieser Seite bezieht sich "MedLM" auf beide Modelle.

Weitere Informationen finden Sie unter Modellversionen und Lebenszyklus.

MedLM-Sicherheitsfilter und -Attribute

Über die MedLM API verarbeitete Inhalte werden anhand einer Liste von Sicherheitsattributen bewertet, einschließlich „schädlichen Kategorien“ und Themen, die als sensitiv eingestuft werden können. Wenn Sie eine Fallback-Antwort sehen, z. B. "Ich kann dir nicht helfen, da ich nur ein Sprachmodell bin", bedeutet das, dass entweder Prompt oder Antwort einen Sicherheitsfilter ausgelöst haben.

Sicherheitsgrenzwerte

Bei der Verwendung von Vertex AI Studio können Sie einen anpassbaren Schwellenwert für Sicherheitsfilter verwenden, um festzustellen, wie wahrscheinlich es ist, dass Sie Antworten sehen, die möglicherweise schädlich sind. Modellantworten werden auf der Grundlage der Wahrscheinlichkeit blockiert, dass sie Diskriminierung, gefährliche oder sexuell explizite Inhalte enthält. Die Sicherheitsfiltereinstellung befindet sich auf der rechten Seite des Prompt-Felds von Vertex AI Studio. Sie können zwischen drei Optionen wählen: block most, block some und block few.

Grafik: Console

Konfidenz- und Schweregradschwellenwerte testen

Sie können die Sicherheitsfilter von Google testen und für Ihr Unternehmen geeignete Konfidenzgrenzwerte definieren. Über diese Grenzwerte können Sie umfassende Maßnahmen ergreifen, um Inhalte zu erkennen, die gegen die Nutzungsrichtlinien oder Nutzungsbedingungen von Google verstoßen, und entsprechende Maßnahmen zu ergreifen.

Konfidenzwerte sind nur Vorhersagen. Sie sollten diese Werte nicht als absolut zuverlässig oder genau ansehen. Google ist nicht dafür verantwortlich, diese Werte für Geschäftsentscheidungen zu interpretieren oder zu verwenden.

Empfohlene Vorgehensweisen

Um diese Technologie sicher und verantwortungsvoll zu nutzen, ist es wichtig, neben den integrierten technischen Sicherheitsmaßnahmen weitere Risiken zu berücksichtigen, die für Anwendungsfall, Nutzer und Geschäftskontext spezifisch sind.

Wir empfehlen Folgendes:

Bewerten Sie die Sicherheitsrisiken Ihrer Anwendung.
Passen Sie Anpassungen an, um Sicherheitsrisiken zu minimieren.
Führen Sie für Ihren Anwendungsfall geeignete Sicherheitstests durch.
Holen Sie Nutzerfeedback ein und überwachen Sie Inhalte.

Weitere Informationen finden Sie in den Empfehlungen von Google zu verantwortungsbewusster KI.

Anfragetext

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

Verwenden Sie folgende Parameter für die Modelle medlm-medium und medlm-large. Weitere Informationen finden Sie unter Chat-Prompts erstellen.

Parameter	Beschreibung	Zulässige Werte
`content`	Texteingabe zum Generieren einer Modellantwort. Prompts können Fragen, Vorschläge, Anleitungen oder Beispiele enthalten.	Text
`temperature`	Die Temperatur wird für die Probenahme während der Antwortgenerierung verwendet. Dies passiert, wenn `topP` und `topK` angewendet werden. Die Temperatur bestimmt den Grad der Zufälligkeit bei der Tokenauswahl. Niedrigere Temperaturen eignen sich gut für Prompts, die eine weniger offene oder kreative Antwort erfordern, während höhere Temperaturen zu vielfältigeren oder kreativeren Ergebnissen führen können. Eine Temperatur von `0` bedeutet, dass immer die Tokens mit der höchsten Wahrscheinlichkeit ausgewählt werden. In diesem Fall sind die Antworten auf einen bestimmten Prompt größtenteils deterministisch, aber eine gewisse Variation ist dennoch möglich. Wenn das Modell eine zu allgemeine oder zu kurze Antwort zurückgibt, oder wenn das Modell eine Fallback-Antwort ausgibt, versuchen Sie, die Temperatur zu erhöhen.	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	Maximale Anzahl an Tokens, die in der Antwort generiert werden können. Ein Token besteht aus etwa vier Zeichen. 100 Tokens entsprechen etwa 60–80 Wörtern. Geben Sie kürzere Werte für kürzere Antworten und höhere Werte für potentiell längere Antworten an.	`1–8192` für medlm-medium `1–1024` für medlm-large
`topK`	Der Wert „Top-K“ ändert, wie das Modell Tokens für die Ausgabe auswählt. Ein „Top-K“ von `1` bedeutet, dass das nächste ausgewählte Token unter den Tokens im Modell-Vokabular (auch als gierige Decodierung bezeichnet) am wahrscheinlichsten ist, während ein „Top-K“ von `3` bedeutet, dass das nächste Token mithilfe der Temperatur aus den drei wahrscheinlichsten Tokens ausgewählt wird. Für jeden Tokenauswahlschritt werden die „Top-K“-Tokens mit den höchsten Wahrscheinlichkeiten abgetastet. Anschließend werden Tokens weiter auf der Grundlage von „Top-P“ gefiltert, wobei das endgültige Token mithilfe von Temperaturproben ausgewählt wird. Geben Sie einen niedrigeren Wert für weniger zufällige Antworten und einen höheren Wert für zufälligere Antworten an.	`1–40` `Default: 40`
`topP`	Der Wert „Top-P“ ändert, wie das Modell Tokens für die Ausgabe auswählt. Tokens werden vom wahrscheinlichsten bis zum am wenigsten wahrscheinlichen Token ausgewählt, bis die Summe ihrer Wahrscheinlichkeiten dem Wert von „Top-P“ entspricht. Beispiel: Wenn die Tokens A, B und C eine Wahrscheinlichkeit von 0,3, 0,2 und 0,1 haben und der „Top-P“-Wert `0.5` ist, wählt das Modell anhand der Temperatur entweder A oder B als das nächste Token und C als Kandidaten ausschließen. Geben Sie einen niedrigeren Wert für weniger zufällige Antworten und einen höheren Wert für zufälligere Antworten an.	`0.0–1.0` `Default: 0.8`

Beispielanfrage

Bei Verwendung der MedLM API ist es wichtig, das Prompt-Engineering zu implementieren. Wir empfehlen Ihnen dringend, zu Beginn jedes Prompts eine geeignete aufgabenspezifische Anleitung anzugeben. Weitere Informationen finden Sie unter Einführung in das Erstellen von Prompts.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Projekt-ID.
MEDLM_MODEL: Das MedLM-Modell, entweder medlm-medium oder medlm-large.

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud CLI anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json. Führen Sie folgenden Befehl im Terminal aus, um diese Datei im aktuellen Verzeichnis zu erstellen oder zu überschreiben:

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

Führen Sie dann folgenden Befehl aus, um Ihre REST-Anfrage zu senden:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.