Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
SZENE 1: Ein Einführungsbild ähnlich dem in Teil 1. Dargestellt sind Martha, Flip und Bit sowie Octavius in einzelnen Kreisen, umgeben von Symbolen, die ein neuronales Netzwerk darstellen.
TITEL: Über NEURONALE NETZWERKE lernen. Ein Onlinecomic von Google AI.
Bildtext/Pfeil: Mit MARTHA, die den Dreh raus hat.
Martha: Ich GLAUBE, ich weiß, was da läuft.
Bildtext: Mit FLIP
Bildtext: Und BIT
Bildtext: Und jetzt auch OCTAVIUS!
Octavius: Hallo!
SZENE 2: Martha schließt mit dem Schlüssel die Tür zum Land der neuronalen Netzwerke auf.
Bildtext: Zuvor bei Abenteuer des maschinellen Lernens…
Martha: Nächster Halt: Neuronale Netzwerke!
SZENE 3: Martha stößt die Tür auf und ruft erfreut.
Martha: HALLO WEL–
SZENE 4: Kameraschwenk – Martha von hinten, vor ihr ein unendliches Netz aus miteinander verbundenen Knoten, das durch die Tür extrem überwältigend wirkt. Durch die Tür strömt etwas, das wie Rauchschwaden aussieht. Martha ist als Silhouette dargestellt. Sie hält schützend beide Arme hoch.
Martha: … Ahh!
SZENE 5: Auf der Eingangsseite. Martha hat die Tür zugeschlagen. Ihre Augen sind weit aufgerissen und die Haare stehen ihr zu Berge. Flip und Bit betrachten sie gelassen.
Soundeffekt: BUMM
SZENE 6: Wie zuvor, nur dass Martha jetzt Flip und Bit anstarrt. Hinter der Tür ist eine Stimme zu hören.
Octavius (hinter der Tür): Tut mir leid! Ich war noch nicht so weit. Ihr könnt jetzt reinkommen.
SZENE 7: Martha, Flip und Bit blicken vorsichtig zur Tür hinaus.
SZENE 8: Octavius, ein süßer junger Oktopus, schwebt neben einem einfachen künstlichen Neuron.
Octavius: Hallo! Ich bin Octavius. Beginnen wir mit den GRUNDLAGEN, okay?
SZENE 9: Martha ist erleichtert. Sie wirft noch einmal einen prüfenden Blick auf das überwältigende Netzwerk. Flip und Bit begrüßen Octavius.
Martha: *Puh* Ja, bitte. Ich bin Martha.
Octavius: Hallo Martha! NEURONALE NETZWERKE bestehen aus einfachen Bausteinen. Der EINFACHSTE ist das "NEURON". Oh, hallo Flip! Hallo Bit!
Flip: Hi.
Bit: Hallo, Doc.
SZENE 10: Martha kniet neben zwei Darstellungen von biologischen und künstlichen Neuronen, während Octavius erklärt.
Octavius: Diese "Neuronen" akzeptieren wie ihre biologischen Namensvettern verschiedene EINGABEN und kombinieren diese zu AUSGABEN.
Martha: Was meinst du mit "Eingaben"?
SZENE 11: Octavius und Bit unterhalten sich. Darunter ist eine Tabelle mit Eigenschaften mit Spalten von Daten zu sehen.
Octavius: Fast ALLES, solange es sich in ZAHLEN ausdrücken lässt.
Bit: Eingaben sind wie Daten in einer Tabellenkalkulation.
SZENE 12: Flip stößt die Tabelle mit ihren Hinterpfoten um, während Bit gestikuliert.
Flip: … nur um 90 GRAD GEDREHT.
Bit: (Nicht unbedingt. Es sieht von links nach rechts gelesen einfach besser aus …)
SZENE 13: Octavius und Martha betrachten die jetzt horizontale Tabelle. Von jeder Datenspalte zeigt ein Pfeil zu einem runden Knoten (einer Eingabe).
Octavius: Das ist der Anfang – die erste EINGABESCHICHT.
SZENE 14: Octavius schwebt neben der anfänglichen Eingabeschicht und zeigt rechts auf eine einfache binäre Klassifikation: "Katze" oder "Hund". "Katze" ist hervorgehoben.
Octavius: Unser ZIEL ist, anhand der von der EINGABESCHICHT generierten Werte – ungeachtet der Komplexität – eine AUSGABESCHICHT mit einer netten einfachen ANTWORT zu erzeugen.
SZENE 15: Die ganze Crew ist vor einem weißen Hintergrund dargestellt. Octavius lächelt, Martha ist perplex.
Octavius: Das war's. Fragen?
Martha: …
SZENE 16: Wie zuvor, nur dass Flip und Bit jetzt kichern.
Bit (Soundeffekt): *Kicher*
SZENE 17: Wie zuvor, nur dass Martha jetzt verwirrt schreit. Die anderen prusten jetzt vor Lachen.
Martha: ABER — WAS IST DAZWISCHEN PASSIERT?!
Octavius: Genau!
SZENE 18: Octavius blickt auf ein kleines animiertes Klassifizierungssymbol, das sich durch die verborgenen Schichten eines herkömmlichen NN-Diagramms bewegt …
Octavius: In diesen dazwischen liegenden "verborgenen Schichten" wird anhand einer Reihe einfacher [Klassifizierungsaufgaben] eine komplexe Antwort erzeugt.
SZENE 19: Octavius weist auf ein einfaches Neuron mit beschrifteten Eingaben (X1, X2), die auf einem Knoten mit einem Sigma (Σ) zusammenlaufen. Flip kommentiert von unten.
Octavius: Der numerische Wert (X) jeder Eigenschaft wird im Neuron addiert.
Flip: Und diese Summe (∑) trägt zur Neigung der Linie bei.
SZENE 20: Wie zuvor, nur dass jetzt die Linien zwischen den Eingaben und dem Summenknoten mit W1 und W2 beschriftet und unterschiedlich dick sind.
Octavius: Manche Eigenschaften haben aber mehr GEWICHT als andere. Daher werden die Eingaben zuerst nach ihrer Stärke angepasst.
SZENE 21: Martha kommt dazu und zeigt auf die Linien. Diese haben jetzt auf "Niedrig" und "Hoch" eingestellte Drehknöpfe (wie bei der Erklärung in Teil 1).
Martha: Oh! Die Gewichtungen sind also unsere DREHKNÖPFE.
Octavius: Genau!
SZENE 22: Martha und Octavius betrachten neugierig das einfache Neuron. Dieses hat jetzt einen zusätzlichen Knoten "b", der von unten einen Wert beisteuert. Seine Linie hat ebenfalls eine Gewichtung.
Octavius: Außerdem gibt es die VERZERRUNG – ein Versatz zur Gesamtsumme, der ebenfalls durch Gewichtung anpassbar ist.
SZENE 23: Marthas Sprechblasen enthalten zwei animierte Grafiken. Sie zeigen als Endlosschleife, wie sich die Neigung und der Y-Schnittpunkt mit dem Gewicht und der Verzerrung ändern. Octavius und Flip kommentieren von unten.
Martha: Also … Mit der GEWICHTUNG ändert sich die NEIGUNG …
… und mit der VERZERRUNG ändert sich der Y-SCHNITTPUNKT?
Octavius: Richtig!
Flip: Hab dir ja gesagt, dass sie schnell kapiert.
SZENE 24: Auf dem Summenknoten des Neurons ist jetzt eine schräge Linie eingezeichnet. Octavius weist auf den nächsten Schritt hin: eine s-förmig geschwungene Linie. Sie kennzeichnet die Aktivierungsfunktion. Bit schwebt darunter mit einem Schild in der Hand.
Octavius: Wenn wir den linearen Klassifikator in eine NICHT LINEARE Form – etwa eine S-Funktion – bringen …
Bildtext (von Bit gehalten): Weitere Informationen!
SZENE 25: Octavius schwebt am Y-Schnittpunkt einer vergrößerten S-Kurve. Martha steht darunter und rahmt das Diagramm mit den Fingern ein.
Octavius: Die "AKTIVIERUNGSFUNKTION" ermöglicht nicht lineare Beziehungen …
… und reibungslosere Anpassungen im Lernprozess.
Martha: Hmm.
SZENE 26: Das komplette Neuron mit allen Labels ist dargestellt. Octavius und Martha betrachten es von unten. Es soll mit all den Komponenten ein bisschen überwältigend wirken.
Labels: Knoten, Gewichtung, Edge, Summe, Verzerrung, Aktivierungsfunktion und nicht lineare Funktion.
(z. B. Sigmoid, tanh, Softmax, Swish, ReLU, Leaky ReLU, Diet ReLU, ReLU mit Chips, ReLU und Spam)
Octavius: Hier ist es, vollständig entpackt.
Martha: Huch.
SZENE 27: Wir kehren zu unserem einfachen Neuron mit drei Knoten zurück: X1 und X2 für Eingaben und die S-Kurve für die Aktivierungsfunktion. Martha ist erleichtert, während Octavius erklärt, warum sie zu der einfachen Ansicht zurückkehren.
Octavius: Vereinen wir die Summe, Verzerrung und Aktivierungsfunktion der Einfachheit halber zu einem Knoten …
… und geben mit der Liniendicke die Gewichtung an.
Martha: *Puh* Ja, BITTE!
SZENE 28: Die Knoten des einzelnen Neurons sind jetzt durch animierte gewichtete Linien verbunden. Eine neue animierte Ausgabelinie weist nach rechts.
Octavius: Die AUSGABE dieses Knotens –
Martha: OH!
SZENE 29: Das erste Neuron hat sich mit einem zweiten Neuron verbunden. Die Ausgaben von N1 werden zu den Eingaben von N2. Die Linien zwischen den Neuronen sind weiterhin animiert und stellen den Informationsfluss zwischen den Knoten dar.
Martha: … kann die EINGABE eines anderen sein.
Octavius: Richtig!
SZENE 30: Das Netzwerk wächst. Es hat jetzt sechs Schichten von Neuronen, die durch animierte Linien miteinander verbunden sind, die den Informationsfluss darstellen.
Octavius: … und so weiter und so fort …
Martha: Wow.
SZENE 31: Unter Marthas Sprechblase sind zwei kleine animierte Kästchen dargestellt, die sich auf Teil 1 beziehen: ein in einer Kurve vor und zurück rollender Ball, der am untersten Punkt zur Ruhe kommt, sowie eine sich hin- und herneigende Linie, die sich auf der entsprechenden Klassifizierung für eine Sammlung von X und O einpendelt. Bit verweist mit einem Schild auf Teil 1.
Martha: Wenn wir also neuronale Netzwerke mit BACKPROPAGATION und dem GRADIENTENVERFAHREN* trainieren …
… werden die Gewichtungen und Verzerrungen ANGEPASST?
Octavius: Genau!
Fußnote (von Bit gehalten): * Siehe Teil 1.
SZENE 32: Ein einfaches Neuron mit drei Eingaben, deren animierte Drehknöpfe die Liniendicke und damit die Gewichtung ändern. Octavius schwebt darüber und erklärt, Bit streckt die Arme hoch, Martha hockt im Schneidersitz auf dem Boden und gestikuliert.
Octavius: Diese automatisierten Anpassungen bezeichnen wir als "MODELLTRAINING".
Bit: Guck, Martha! Freihändig!
Martha: Das ist toll. Aber was machen wir ENTWICKLER?
SZENE 33: Martha stupst mit dem Zeigefinger ein vor ihr schwebendes mehrschichtiges Netzwerk aus Knoten an. Flip sitzt auf ihrer Schulter und kommentiert. Bit schwebt darunter.
Flip: Oh, ALLES MÖGLICHE. Entwickler wählen die richtige Architektur aus oder legen die Anzahl der Schichten oder Knoten sowie die Aktivierungsfunktionen fest. Sie treffen zahlreiche Entscheidungen.
Martha: Hmm.
Bit: Wir nennen das "HYPERPARAMETER-ABSTIMMUNG".
SZENE 34: Martha und Octavius unterhalten sich vor einem diagrammartigen Rasterhintergrund.
Octavius: Informationen haben eine STRUKTUR. Ein gut trainiertes neuronales Netzwerk erleichtert die NAVIGATION in dieser Struktur.
SZENE 35: Martha und Octavius sehen über eine Wand zu, wie zwei kleine Marthas je eine Regressionslinie (eine Trendlinie durch eine Datenkarte) und eine Klassifizierungslinie (eine Trennlinie durch zwei Datengruppen) einzeichnen.
Octavius: Das machst du, wenn du die REGRESSIONS- und KLASSIFIZIERUNGSLINIEN einzeichnest…
Das ist MANUELL einfach, wenn du nur eine oder zwei Eigenschaften hast…
Martha: Ahh …
Das machen sie super!
SZENE 36: Wir kehren zu unserer um 90 Grad gedrehten Tabelle zurück, neben der eine Schicht von Eingabeknoten dargestellt ist. Martha und Octavius sehen sich die Darstellung an.
Octavius: Aber mehrere Eigenschaften führen zu mehreren EINGABEN. Das bedeutet –
SZENE 37: Martha, Octavius, Flip und Bit schweben plötzlich in einer sich drehenden und wendenden Datenwelt. Um sie herum fliegen Ströme von Ganzzahlen und Buchstaben. Martha ist erschrocken. Bit nimmt eine seltsam verzerrte Form an. Flip spaziert kopfüber durch einen escherartigen Zahlenstrang. Octavius ist unbeeindruckt.
Octavius: – mehrere zu durchlaufende DIMENSIONEN –
– wodurch es schier UNMÖGLICH erscheint, eine einfache gerade Trennlinie zwischen "A" und "B" zu ziehen.
Martha: W-W-WAS??
SZENE 38: Die mehrdimensionale Landschaft verschwindet nach oben. Bit wirkt entspannt und selbstbewusst, während Martha in der Ecke völlig verwirrt ist.
Octavius: Zum Glück betrachten unsere DIGITALEN Cousins andere Dimensionen MATHEMATISCH und können Wege DURCH diese Struktur finden.
Bit: Ja, das ist ganz einfach. Du musst nur die zugrundeliegende Topografie verändern.
SZENE 39: Bit deutet auf ein Diagramm, das zwei verwobene Datenspiralen zeigt. Flip kommentiert von rechts.
Bit: Man glaubt vielleicht, dass diese beiden Formen nicht durch eine gerade Linie trennbar sind. Aber in neuronalen Netzwerken geht das.
Flip: Hier kommen die "VERBORGENEN SCHICHTEN" ins Spiel …
SZENE 40: Bit löst die Datenspiralen mit den Händen in zwei Schnörkel auf, die sich einfach durch eine gerade Linie trennen lassen.
Bit: Darin werden Daten TRANSFORMIERT –
– Sie werden GESTRECKT und GESTAUCHT –
– aber nie ABGESCHNITTEN, ZERSTÜCKELT oder GEFALTET, um eine Antwort zu erhalten.
SZENE 41: Eine geneigte Weltkugel schwebt über Octavius. Die Antarktis ist mit einer gepunkteten Linie eingekreist. Daneben steht ein kleines Fragezeichen. Darunter zeichnet Octavius eine gerade Linie in eine Mercatorprojektion ein.
Octavius: Es ist, als ob du zwischen der ANTARKTIS und den anderen Kontinenten eine GERADE LINIE ziehen würdest …
was auf einem GLOBUS unmöglich erscheint …
… aber mit einem kleinen "PERSPEKTIVENWECHSEL" funktioniert!
SZENE 42: Es werden drei Knoten gezeigt. Die darin enthaltenen Datasets sind durch Linien getrennt. Die beiden ersten (in einer Schicht befindlichen) Knoten werden zusammengeführt. Dadurch ergibt sich im Ausgabeknoten eine gebogene Linie, die das Dataset auf die gewünschte Weise trennt. Bit hält ein Schild "Weitere Informationen" in der Hand, das zur Demo eines neuronalen Netzwerks führt.
Octavius: Wenn jedes Neuron eine andere lineare Funktion enthält, ergeben sich durch die ZUSAMMENFÜHRUNG KOMPLEXERE Formen für die DATENANPASSUNG.
Bildtext/Link (von Bit gehalten): WEITERE INFORMATIONEN.
SZENE 43: Martha starrt hämisch grinsend auf eine Wolke von Knoten, die zwischen ihren Händen schwebt. Octavius legt ihr besorgt eine Tentakel auf die Schulter.
Martha: Ooh! Mit AUSREICHEND Neuronen kann ich also JEDES Dataset zurechtbiegen, egal wie komplex es ist?
Ha-ha …
Octavius: Nicht so schnell! Bei ZU VIELEN Neuronen kann es zu einer ÜBERANPASSUNG kommen.
SZENE 44: Die gestrichelte, leicht abfallende Linie verlängert sich von links nach rechts, während sich Flip langsam in Bewegung setzt.
FLIP: … diese Ansammlung von Spitzen und Tälern, die wir "Fehlerfunktion" oder "Verlustfunktion" nennen …
… kann nur sichtbar gemacht werden –
SZENE 45: Martha, Bit, Octavius und Flip unterhalten sich vor einem weißen Hintergrund.
Martha: SOVIEL ZU … Warum HEISSEN sie eigentlich "VERBORGENE SCHICHTEN"?
Bit: Ach herrje. Gute Frage.
Octavius: Nun … Wir kennen die EINGABEN … und die AUSGABEN …
Flip: … und wir können sogar erklären, WIE verborgene Schichten funktionieren …
SZENE 46: Martha kniet am Boden und hört Flip zu. Beide sind als Silhouetten vor einem komplexen Knotennetz dargestellt.
Am rechten Rand hält Bit ein Schild "Weitere Informationen!" in der Hand, das auf Flips Sprechblase zeigt und zu Cassies Artikel führt.
Bit: Aber in einem VOLLSTÄNDIG VERBUNDENEN NEURONALEN NETZWERK werden auf jedem Knoten Ergebnisse von allen Knoten der vorherigen Schicht zusammengeführt. Wer bestimmt, welche "Eigenschaften" betrachtet werden?
Flip: Data Scientist Cassie Kozyrkov sagt, wir "AUTOMATISIEREN das UNBESCHREIBLICHE".
SZENE 47: Octavius erscheint rechts im Bild neben einem kleinen Schienenwagen. Er trägt eine Schaffnermütze. Die anderen bewegen sich auf ihn zu, um einzusteigen.
Octavius: Ein VOLLSTÄNDIG VERBUNDENES neuronales Netzwerk ist nur eine Art von Architektur …
Martha: Schöne Mütze.
Octavius: Danke!
SZENE 48: Octavius sitzt in dem Schienenwagen – hinter ihm ein Netzplan mit verschiedenen Haltestellen, die mit den Architektursymbolen des Netzwerks gekennzeichnet sind.
Octavius: Fahren wir zu einer WEITEREN beliebten Haltestelle im neuronalen Netzwerkplan.
SZENE 49: Die ganze Crew fährt im Wagen auf kurvigen Gleisen. Um sie herum schweben verschiedene Architektursymbole. Martha wirkt, als würde sie Achterbahn fahren, während Octavius munter erklärt.
Octavius: Dieses ganze Feld befindet sich im ständigen WANDEL – es wird kontinuierlich "umstrukturiert".
Manche der heute gängigsten Ziele waren vor 10 Jahren noch PROTOTYPEN.
SZENE 50: Der Wagen fährt in drei Phasen durch eine Gleisschleife, die einem Zifferblatt gleicht. Zahlen sind nicht erkennbar.
Octavius: RECURRENT NEURAL NETWORKS (wie LSTMs) werden wiederholt zu sich selbst zurückgeleitet –
– um Probleme mit dem ZEITLICHEN ELEMENT zu lösen –
— wie etwa bei der SPRACHERKENNUNG.
Bildtext/Link: Weitere Informationen!
SZENE 51: Der Wagen fährt durch eine Gleiskreuzung, von oben betrachtet. Verschiedene Optionen laufen zusammen oder weichen voneinander ab. Octavius stellt eine Weiche und erklärt dabei. Ein Link "Weitere Informationen" führt zu [was möchten wir hier verlinken?]
Octavius: Andere, wie etwa AUTOMATISCHE ENCODER, tragen zur Strukturierung unkontrollierter Daten bei –
– und reduzieren die DIMENSIONALITÄT überlaufender Big Data.
Bildtext/Link: Weitere Informationen!
SZENE 52: Unsere Crew saust im Vordergrund vorbei. In der Ferne sind weitere Gleise und Wagen zu sehen. Während sie vorbeisausen, unterbricht Martha Octavius, um nach den Passagieren in anderen Wagen zu fragen. Er hält den Blick weiter munter nach vorn gerichtet.
Octavius: Das Netzwerk, zu dem wir fahren, ist besonders für Analysen beliebt –
Martha: He, wer sind DIE?
Octavius: Oh, das ist die GAN-Linie. Keiner dieser Passagiere existiert.
Schau sie nicht an.
SZENE 53: Der Wagen hält an einem Bahnsteig mit einem Torbogen, über dem "CNNs" steht.
Neugierig steigen alle aus.
Octavius: Da sind wir. Haltestelle CONVOLUTIONAL NEURAL NETWORKS!
Martha: Aha, DAVON hab ich gehört.
Bit: Sie sind oft in den Medien.
SZENE 54: Die Crew betritt eine Galerie mit kunstvoll eingerahmten Bildern, auf denen aber jeweils nur ein Wirrwarr aus Einsen und Nullen dargestellt ist. Bit schaut entzückt auf eines der Bilder. Martha wirkt verwirrt.
Bit: Oh, ich LIEBE dieses hier. Sind die 11001101010 nicht herrlich getroffen?
Martha: Ähm …
Octavius: Bilder bestehen für ein CNN nur aus Zahlenrastern.
SZENE 55: Martha hält eins der Bilder hoch und schaut durch die Zahlen.
Octavius erklärt den Inhalt. Rechts unten hält Bit ein Mikrofon, unter ihm eine Schallwelle, um zu demonstrieren, wie CNNs visuell dargestellte Daten parsen können.
Martha: Ist das nicht bei ALLEN neuronalen Netzwerken so, die Bilder verarbeiten?
Octavius: Na klar! Aber CNNs bieten eine einzigartige Methode, um all die bildbasierten Daten zu parsen und abzurufen.
Bit: (Einschließlich aller Datentypen, die als Bilder DARGESTELLT werden können.)
SZENE 56: Die Crew betrachtet ein Graustufenfoto einer Katze mit 32 x 32 Pixel.
Octavius: Selbst ein NIEDRIG AUFGELÖSTES Bild wie dieses enthält eine Fülle von Informationen.
Jedes dieser 1024 PIXEL ist eine separate Eingabe – in der Tat sogar DREI, wenn man die roten, grünen und blauen Kanäle berücksichtigt.
Flip: Das ist Onkel Rufus!
SZENE 57: Octavius erklärt die Vielfalt der Farbbilder. Unter ihm sind eine mehrschichtige Eingabe mit den Kanälen Rot, Grün und Blau sowie die Gesamtzahl der Eingaben (3072) dargestellt. Rechts von ihm erstreckt sich eine breite Schicht von Eingaben.
Martha weicht erschrocken zurück.
Octavius: Soviel zu einer MEHRDIMENSIONALEN EINGABESCHICHT … und das ist nicht mal hochaufgelöst oder Video!
Martha: AAAH! Da kommen ERINNERUNGEN hoch.
SZENE 58: Octavius erklärt weiter – neben ihm sechs Bilder, auf denen Katzen in Nahaufnahme, aus unterschiedlichen Blickrichtungen, an unterschiedlichen Stellen usw. dargestellt sind. Links unten ist als Klassifizierungsknoten "KATZE: JA" angegeben.
Octavius: Wir möchten am Ende weiterhin ein einfaches, eindimensionales "JA" oder "NEIN". Aber es muss für JEDE Katze aus JEDER Blickrichtung und an jeder Stelle des Bildes funktionieren.
Martha: Wow. Ganz schön viel verlangt!
SZENE 59: Bit erscheint in einer Pixelmatrix. Jeder Block wird daneben noch einmal einzeln dargestellt.
Octavius: In der Tat. CNNs KÖNNEN das. Sie SCHLÜSSELN diese riesigen Matrizen mit Pixeldaten Schicht für Schicht in VERWALTBARE BLÖCKE auf.
SZENE 60: Octavius wirft Martha eine kleine Matrix mit Griffen (den Filter) zu.
Octavius: Erstellen wir in unserem Quellbild zuerst eine Karte mit KATZENMERKMALEN.
FANG!
Martha: Was ist das?
Octavius: Ein FILTER. Es ist anfangs eine Matrix mit zufälligen Gewichtungen, die im Lauf der Zeit durch den Algorithmus verfeinert wird.
SZENE 61: Martha geht auf Zehenspitzen oberhalb zweier animierter Matrizen, Octavius schwebt vor ihr her. In der Matrix bewegt sich der Filter Schritt für Schritt über die Eingabedaten. In der zweiten Matrix wird Block für Block die resultierende Karte mit Merkmalen generiert. [Beispiel hier.] Flip kommentiert von rechts unten.
Octavius: Bei einer "FALTUNG" wird dieser Filter in einem variablen Intervall bzw. "SCHRITT" über das gesamte Bild bewegt.
Martha: Oh! Dabei werden die QUELLDATEN mit der Matrix multipliziert.
Flip: Das Ergebnis wird als MERKMALSKARTE bezeichnet.
SZENE 62: Octavius, mit Schwimmreifen und Sonnenbrille ausgestattet, erklärt den Ablauf in CNNs. Nebeneinander dargestellt sind das Eingabebild, die mehreren durch Faltung erzeugten einfacheren Bilder, eine Aktivierungsfunktion und zuletzt die durch Pooling generierten kleineren Bilder. Darüber steht Martha und überblickt das Ganze.
Octavius: Diese Merkmalskarten durchlaufen ein POOLING, um ihre Verarbeitungsgröße weiter zu reduzieren.
Martha: Man kann sie also stapeln, um weitere Merkmale zu ermitteln.
SZENE 63: Octavius schwebt zu vier niedrig aufgelösten Filtern mit ungenauen Rändern (horizontal, vertikal, diagonal). Bit kommentiert darunter in einem Feld. Er berührt mit der Hand ein verdutzt blickendes Gehirn.
Octavius: Anfänglich erkennen Filter möglicherweise nur RÄNDER und die AUSRICHTUNG…*
Bit: *NEBENBEI BEMERKT: Der visuelle Kortex des Gehirns erkennt Dinge zuerst auch so… Daraus wurde in der Tat die Funktionsweise von CNNs abgeleitet.
Bildtext: Weitere Informationen
SZENE 64: Links sind drei Schichten mit Merkmalen in Rastern dargestellt: grobe Ränder, klarere Elemente und vollständige Objekte – einschließlich eines winzigen Octavius. Rechts daneben erklärt der echte Octavius.
Octavius: In jeder nachfolgenden Schicht kristallisieren sich immer GENAUERE Merkmale heraus.
Siehst du? Das bin ich!
SZENE 65: Martha und Octavius beäugen von oben einen leuchtenden Filter.
Martha: Zuerst sind es also LINIEN und WINKEL, dann TASTHAARE, PFOTEN und FELL und schließlich "KATZEN" oder "HUNDE"?
Octavius: Nun … *hm* JA, NEIN und JA! Welche Merkmale DAZWISCHEN erkannt werden, erfahren wir vielleicht nie
– dennoch können sie GEFUNDEN werden, egal, wo sie sich verstecken.
SZENE 66: Zurück in der Explosionsansicht der CNN-Stadien, denen am Ende eine Klassifizierungsschicht hinzugefügt wurde. Sie hat eine vollständige Knotenreihe, deren Verbindungslinien zu einer binären Ausgabe verlaufen. Flip erklärt von rechts kommend.
Flip: CNNs sind nicht wie in unserem ERSTEN Beispiel vollständig verbunden. Die endgültige Ausgabeschicht ist hingegen mit ALLEN Neuronen der vorherigen Schicht verbunden.
SZENE 67: Martha, Octavius, Bit und Flip vor einem weißen Hintergrund. Jeder ist eingerahmt. Darüber ist die entsprechende Vorhersage des Netzwerks angegeben. Martha ist zu 98 % ein Mensch, Octavius ist zu 94 % ein Oktopus, Flip ist zu 89 % eine Katze. Nur Bit ist zu 60 % ein Basketball.
Octavius: Diese KLASSIFIZIERUNGSSCHICHT liefert die genauen Antworten, die wir alle –
Bit: Äh … Jungs?
Beschriftungen:
98 % Mensch
99 % Oktopus
60 % Basketball
89 % Katze
SZENE 68: Martha beugt sich besorgt zu Bit. Alle Rahmen außer seinem sind verschwunden.
Octavius schwebt betroffen über ihm. Bit schmollt.
Martha: Oh-oh. Was ist das? Gab es in den Trainingsdaten keine FLIEGENDEN ROBOTER?
Octavius: Hm, es HÄTTEN welche drin sein sollen!
Beschriftung: 60 % Basketball
SZENE 69: Flip und Martha prüfen die auf dem Boden ausgebreiteten Trainings- und Testdaten. Im Hintergrund ist Bit in kämpferischer Haltung zu sehen.
Flip: NEGATIV! Nur die typische STICHPROBENVERZERRUNG zu Gunsten laufender Roboter.
Martha: Das ist unfair. Als ob alle Roboter zu Fuß unterwegs sind …
Bit: DAS LASS ICH MIR NICHT GEFALLEN!
Beschriftung: 60 % Basketball
SZENE 70: Bit und Flip verlassen links das Bild. Martha richtet sich auf.
Martha: Ich dachte immer, dass Daten UNVERZERRT sind – also einfach nur "Zahlen"…
Octavius: Datasets sind Produkte der Zeit und des Orts ihrer Zusammenstellung.
Beschriftung: 60 % Basketball
SZENE 71: Octavius trägt auf seinen Tentakeln verschiedene Handpuppen. Jede hat eine Sprechblase mit einem anderen Symbol.
Octavius: Selbst wenn man proaktiv versucht, "neutrale" Daten zu erstellen, können diejenigen, die die Daten kompilieren, EIGENE implizite Vorurteile haben.
SZENE 72: Martha sitzt zwischen den Datenbildern. Flip und Bit sind deprimiert.
Rechts im Bild durchblättert Octavius weitere Bilder.
Martha: Das ist komplizierter, als ich dachte.
Octavius: Hmmm … Es kann sich hier auch um eine LATENTE VERZERRUNG handeln …
Seht euch diese Basketballfotos an. Sie alle haben eines gemeinsam …
Beschriftung: 60 % Basketball
SZENE 73: Octavius zeigt Martha verschiedene Fotos. Darauf sind Arme und Hände zu sehen, die einen Basketball halten.
Octavius: Kommt dir da etwas BEKANNT vor?
Martha: Hm. Es sind einfach lauter Arme, die –
SZENE 74: Martha schaut wieder zu Bit in seinem Basketball-Rahmen. Ihr geht ein Licht auf.
Martha: OOOHHH.
Beschriftung: 60 % Basketball
SZENE 75: Martha und Octavius unterhalten sich.
Octavius: ENTWICKLER und ETHIKER versuchen noch immer herauszufinden, wie neuronale Netzwerke die Welt sehen
– und WOZU sie in den nächsten Jahren dienen werden.
SZENE 76: Martha, Octavius, Flip und Bit befinden sich auf einer spiegelnden Fläche und betrachten ihr Spiegelbild.
Octavius: Forscher haben einfach ein CNN auf den Kopf gestellt und mithilfe eines einzigartigen Bildklassifikators …
… GENERATIVE ADVERSARIAL NETWORKS bzw. GANs geschaffen …
… Diese können neben herrlich surrealen Bilder auch die berüchtigten "Deepfakes" erstellen.
Bildtext: Weitere Informationen!
SZENE 77: Martha wirkt entschlossen. Octavius ermutigt sie. Flip und Bit kommentieren von unten.
Martha: Ich will Teil der Lösung und nicht des Problems sein… Ich hoffe nur, dass ich auch den UNTERSCHIED erkenne.
Octavius: Für den ANFANG ist es schon super, wenn du weißt, wie das Ganze FUNKTIONIERT.
Flip und Bit (von außerhalb des Bildes): Wie weise!
SZENE 78: Martha blickt optimistisch in den Himmel, wird jedoch von ihrem Chef Mel unterbrochen.
Octavius ist empört.
Martha: Achtung da draußen! Denn ich bin zu 99 % sicher, dass ich –
Mel (von außerhalb des Bildes): HE, MARTHA!
SZENE 79: Mel schaut über die Wand der Fantasie-Erklärwelt, um eine Antwort zu erhalten. Die ganze Crew ist irritiert. Flip faucht.
Mel: Ooh! Wo bin ich? Was ist das? Wer sind DIE da?
Martha: Äh, das ist –
Mel: Ach, EGAL!
SZENE 80: Martha setzt sich entnervt mit dem Rücken zur Wand neben Bit und Octavius auf den Boden. Alle sehen deprimiert aus, während Mel weiter spricht.
Mel: Ich brauch' dich in etwa ZEHN MINUTEN für eine Präsentation vor den Aktionären.
Octavius: Ist der immer so?
Martha: Ja.
SZENE 81: Mel verschwindet hinter der Wand. Martha beginnt, sich aufzuraffen, während sich die anderen um sie versammeln.
Mel: OK, BIS GLEICH!
Octavius: Oje, das war gerade viel Input …
Flip: Ich sabotiere den Konferenzraum, damit wir Zeit gewinnen.
SZENE 82: Octavius blickt panisch in die Ferne. Martha unterbricht ihn mit einer Handbewegung.
Octavius: Ich wusste, dass das etwas viel auf einmal war! Ich werde das Gespött der Kopffüßer-Akademie sein!
Martha: NEIN.
SZENE 83: Nahaufnahme einer entschlossenen und aufgeregten Martha.
Martha: ICH KANN DAS.
Jetzt sind Sie an der Reihe.
Setzen Sie Ihre Reise in die
Welt des maschinellen Lernens fort …
SZENE 84: Martha hält eine Präsentation vor Führungskräften. Sie zeigt auf ein Whiteboard, auf dem NNs und andere Elemente dargestellt sind. Die Zuhörer sind begeistert. Den Abschluss bildet ein Call-to-Action an die Leser, um weitere Informationen zu erhalten.
… mit dem ML Crashkurs von Google oder mit Google Cloud AI !
Story, Design und Layout von Lucy Bellwood, Dylan Meconis, Scott McCloud
Lineart von Leila del Duca
Kolorierung von Jenn Manley Lee Japanische Lokalisierung von Kaz Sato, Mariko Ogawa Produziert von der Google Comics Factory (Allen Tsai, Alison Lentz, Michael Richardson)
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],[],[],[]]