シーン 1: ロゴと登場人物であるマーサ、フリップ、ビット、マーサの上司メルの顔が描かれたタイトルパネル。タイトル: 学習する機械学習 キャプション(矢印の形状): 主演マーサ、働きすぎのエンジニア!マーサ: これってお手当て付くの? ナレーター: そしてフリップと ナレーター: ...ビット! キャプション(矢印の形状): ...それに史上最悪の上司、メル。 メル: 私、なんにもわからない! ナレーター: Google AI のオンライン コミック

シーン 2: 30 代半ばのエンジニア、マーサがオフィスの自席で仕事をしている。そこに彼女の上司メルがパーティションの向こうから笑顔で話しかけてきた。ナレーター: エンジニア部門のどこかで...。 上司: マーサ!ちょっとお願いがあるのだけど。 マーサ: サラマンダーのエサやりはラヒームの順番でしょ。

シーン 3: 指で引用符を作りながら話すメルを怪訝そうに見るマーサ。上司: 部長がさ、機械学習について聞きかじって、「それを全部に入れろ」って言うんだ。引き受けてくれないかな?マーサ: 機械学習? 私、よくわかりませんよ...

シーン 4: マーサに断られる前に、メルはそそくさと消える。スマートフォンを握った手だけがパーティションから覗いている。上司: あ、電話に出なきゃ。じゃあがんばってね! マーサ: えーっ...

シーン 5: 困り果てたマーサは額に手を当てて独り言をつぶやきながら廊下を歩き回っている。背の高い男性の同僚が、すれ違いざまにマーサを怪訝な顔で見ている。女性の同僚が、スマートフォンを見ながらマーサの独り言に返事をする。マーサ: 困った。機械学習に詳しい人なんてここにいるのかしら。 誰かはいるはず...。 同僚: この会社に?(笑)

シーン 6: 思案に暮れながらも腹をくくったマーサは、大きな貼り紙が貼られたドアの前を通りかかる。マーサ: 10 冊くらい資料を読まなきゃ...。 ドアの貼り紙: 今朝はなかった謎のドア

シーン 7: マーサはその貼り紙に気づき、急に立ち止まる。 [貼り紙を二度見] マーサ: えっ、ちょっと待って!?

シーン 8: 暗い部屋の中。奥の方でマーサがドアを開けて中を覗いている。手前には、識別不能な何かが大きくぼんやりと見える。 マーサ: すみません。誰かいますかー?

シーン 9: 暗闇の中で機械の手が拍手して、マーサを驚かせる。 効果音: パチ!パチ!

シーン 10: 明るくなって 2 つの姿が現れる。向かって左側はビット。ソフトボールほどの大きさの、空中に浮かぶボール型ロボットで、柔軟に動く腕とカニのはさみのような手があり、頭には 1 本のアンテナが付いている。向かって右側はフリップ。タキシード模様のネコで、台が 3 つあるキャットタワーに座っている。手前のマーサは混乱している様子。 ビット: 驚かせてごめんね! フリップ: 人間は暗がりでは何も見えないんだったね。 マーサ: 私、頭でも打ったのかしら...?

シーン 11: ビットはマーサの頭上をぐるぐる飛び回り、フリップは彼女の肩に飛び乗る。マーサは、彼らと会話しようとする。ビット: これは現実だよ!いまの君は機械学習についていろいろ知りたいって、僕らのモデルが予測したんだ。ところで僕はビット。フリップ: 僕はフリップ。ねえ、君ってかわいそうなくらい能力が低そうだけど、ML(機械学習)って何だと思う?マーサ: わ、わたしはマーサ...。

シーン 12: マーサとビットとのやり取り。マーサが機械学習について思い浮かべた人工知能の分野を表すさまざまなアイコンが吹き出しに現れる。マーサ: 機械学習って人工知能の一分野でしょ?画像認識とか、言語処理とか、リコメンドとか、自律運転とか...。それと、シュワルツネッガーのタイムワープとか、キアヌリーブスみたいな?? ビット: そうそう、半分当たってる。

シーン 13: フリップが「人工知能」というラベルの付いた大きな楕円図の周囲を歩いている。その楕円図には AI の各分野が小さな楕円(サブセット)としてまとめられている。その中心に、ビットが「機械学習」と書き込んでいる。 ラベル: 人工知能、機械学習、画像認識、言語処理、リコメンシステム、ロボティクス、医療診断、自律運転。 フリップ: 機械学習は人工知能の一分野とも言えるけど...。でも、

シーン 14: 図はそのまま変わらず、各分野がそれぞれのシンボルだけで示されている。ビットが、先ほど書き込んだ「機械学習」を中心とする大きな円を描いている。その中には各分野が半分ずつ含まれていて、機械学習がほぼすべての分野を網羅していることを表している。ラベル: 人工知能、機械学習。 ビット: 人工知能の各分野に含まれる重要な部分でもあるんだ!

シーン 15: 考え込むマーサ。2 人がマーサに話しかける。 フリップ: 機械学習とは、ある問題を解く計算機が、プログラミングの代わりに経験から学ぶ仕組みのこと。ビット: つまり、計算機がついに新しい領域に足を踏み入れたんだ。マーサ: はあ。

シーン 16: 1950 年代後半から 2020 年代半ばまでのタイムラインの図(少し未来まで伸びている)。ビットは 50 年代後半でアーサー サミュエルの似顔絵を手にしている。マーサは現在あたりに座っており、フリップは走り回っている。コンピューティングの歴史におけるいくつかの出来事がその下に表示されている。ビット: アラン チューリングが「人工知能」について語りだした 2~3年後の 1959 年、IBM のアーサー サミュエルが「機械学習」という用語を生み出した。 マーサ: 待って。機械学習がそんな前からあるなら、なぜいま流行っているの?タイムラインのラベル: サミュエルが「機械学習」と命名、ARPANET、TCP/IP、MICROSOFT、APPLE、ウェブブラウザ、MOSAIC、GOOGLE、FACEBOOK、TWITTER、コールミー メイビー、シャークナド、月が爆発、テイラー スイフトを大統領に(最後のラベルは一部隠れている)

シーン 17: ビットは循環図を身ぶりで示しながら話している。循環図は電球(「ひらめき」)、GPU(「ハードウェア」)、2 進数(「データ」)で構成されている。マーサはその図を見ており、フリップはマーサを見ている。ビット: 新しい計算の方法と、たくさん集められたデータ、そしてハードウェアの進化が組み合わされて、機械学習がいま劇的に発展したんだ!フリップ: つまり、宇宙の終わりが来る前にはなんとか役に立ったってことさ。

シーン 18: マーサは納得がいかない様子。スクリプトが書かれた紙切れが左手の上に浮かんでいる。ビットとフリップが説明を続ける。 マーサ: それはいいけど、「プログラミングの代わりに」ってところが怪しいわ。計算機ってプログラムで動くものでしょう。私の書くプログラムと機械学習はどう違うの? フリップ: 機械学習は、プログラムの代わりにデータで動くんだ。見てて。ビット、ML メタファー モードだ! ビット: オーケー!

シーン 19: フォークを口にくわえたフリップがマーサから飛び降り、中央に現れた腰くらいの高さの台の上に飛び乗る。ビットが渦を巻いて上昇し、目が白くなって「メタファー モード」デモの準備が完了する。 フリップ: 分類の問題をやってみよう。まずはこの...、フォークだ! マーサ(小さい文字で): それどこに持ってたの...?

シーン 20: フリップは台の上に座り、どこにでもあるフォークを手にしている。ビットは自信ありげに答える。 フリップ: ねえビット、これはフォークだ。わかった? ビット: わかった!フォークだね。

シーン 21: フリップは今度は小さなおもちゃの車を持ち上げる。ビットは、同じく自信ありげにもう一度答える。フリップ: じゃあこれは何? ビット: さっき教えてもらったから、これは絶対、フォークだ!

シーン 22: 少しズームアウト。腕組みした怪訝な面持ちのマーサが現れる。 フリップは後ろに立つマーサを見ている。ビットはぼんやりと微笑んでいる。 マーサ: ...大したことないわね。

シーン 23: フリップはビットに視線を戻して訂正。ビットはそれを確認する。フリップ: ごめん、これはフォークじゃないんだ。 ビット: オーケー!これはフォークじゃない!

シーン 24: フリップが別の種類(木製)の 3 本歯のフォークを手にしている。ビットが答える。マーサはまた疑わしい表情をしている。 フリップ: じゃあこれは? ビット: うーん、フォークかな。80% くらいの確率で。 マーサ: まあそれは簡単よね。機械学習がなくても完璧に動くプログラムを書けるわ。

シーン 25: マーサが自信ありげにそのコード文字列を暗唱している。フリップはいたずらっぽい表情をしている。ビットは 2 人の横でふわふわ漂いながら、フォークとスプーンで楽しそうに遊んでいる。 マーサ(吹き出し内のコード): if ((thing.isStainlessSteel() OR thing.isWood()) AND (thing.hasFourTines() OR thing.hasThreeTines()) {isFork(); } else {isNotFork(); } フリップ: オーケー、わかった。

シーン 26: 巨大なフォークがマーサとフリップの間に突き刺さっている。マーサはフォークを動かそうと奮闘。ビットは相変わらずスプーンとフォークを手に、楽しそうに空中を漂っている。フリップ: じゃあ、世界中のあらゆるフォークを分類するプログラムを書いてみて。プラスティック フォーク、アンティークのフォーク、2 本歯のフォーク、5 本歯のフォーク、巨大なフォーク、ガラスのフォーク...。マーサ: だめ!フォークかどうかを決めるルールをすべて書かないと。「フォーク」っていったい何なの!?

シーン 27: 巨大なフォークが引き上げられ、ロープの端が下りてくる。フリップ: そのとおり!でもきちんと選んだデータと機械学習を使って、そして十分な学習とテストを行えば...。

シーン 28: フリップは自信ありげに貼り紙の付いたロープを引っ張る。多数の台所用品や調理器具(へら、ボウル、ブレンダー、コップ、カレンダー、コショウ入れ、マグカップ、オレンジ絞り器、泡立て器、トースター、スプーン、フォーク)が降ってくる。それぞれ「フォーク」または「フォークでない」というラベルが付いている。ビットは落ちてくる物に囲まれて楽しげである。マーサはびっくりしている。 貼り紙: 引くとラベル付きデータが出ます。 ビット: イェーイ!

シーン 29: フリップはビットに先割れスプーンを見せていて、マーサはその様子を見ている。ビットは集中して答える。フリップ: これは何だい? ビット: 93.4% の確率でフォークです。

シーン 30: 話している 3 人の図。フリップは台から飛び降りる。 マーサ: なるほどね。意味が分かってきたわ。 ビット: もちろん現実にはもっといろいろなモノがあるし、機械学習にできることは分類だけじゃない。フリップ: でもひとつ言えるのは、機械学習はデータ中心のアプローチ。実際の例から学び、データからパターンを見つけ、結果を推測できるんだ。

シーン 31: マーサはまた腕組みして鼻で笑っている。ビットがマーサに答え、フリップがビットにコメントしている。 マーサ: 面白いけど、計算機が「学ぶ」って具体的にどういうこと? ビット: じゃあ、例えばオレゴン州ポートランドの住宅価格を予測したいとして...。 マーサ: 待って。なぜポートランドに限定するの?いっつもポートランドの例ばかり。 フリップ: すべての家がポートランドにあるんじゃないの?

シーン 32: 10 軒のミニチュア ハウス(それぞれ高さ 30 cm 弱)が突然マーサの腕の中に降ってきて、マーサを驚かせる。何人かの小人も一緒に落ちている。フリップは逃げている小人を爪で引っかこうとしている。マーサ: うわ! ビット: じゃあ、とにかく 10 軒の家の大きさと価格だけ分かってるとしよう。そのデータを使って他の家の価格を予測するにはどうすればいい?

シーン 33: 冷静さを取り戻したマーサは、小さな家のアイコンを簡単な表に並べている。この表に対応する、価格と面積を表す簡単な XY グラフが中央に現れる。10 軒の家が 10 個の点で表されていて、トレンドラインが引かれている。マーサ: 私だったら、家の広さと価格を表計算に入れて、それぞれを X 軸と Y 軸とした点を打ち、そこを通る直線を引くわ。高校の数学でやったみたいに。ビット: その通り!ごく簡単な線形回帰だね。フリップ: じゃあ、家をもう 10 軒足してみよう!

シーン 34: もう 10 軒の家を表す点がグラフに追加される。マーサは、ラインが少しずれていることに気付く。ビットとフリップは期待のまなざしで見ている。マーサ: あれ?

シーン 35: マーサは追加したデータに合わせてトレンドラインを書き直す。 マーサ: ここを...こうして...ちょっと角度を変えて...

シーン 36: そしてその結果を満足気に確認する。 マーサ: うん、よくなった。 ビットとフリップ(声をそろえて): それだ!

シーン 37: フリップはマーサの胸に飛びつき、ビットはマーサに向かってまっしぐらに飛んでくる。どちらも言いたいことがわかってもらえて喜んでいる。マーサは彼らのあまりの喜びように驚きを隠せない。ビット: ほら見て!データから仮説を作って、新しいデータから分かった仮説の誤りの大きさをざっと測って、データに沿うように仮説を直したよ!フリップ: 人間も学べるんだね!奇跡だ!

シーン 38: マーサはまんざらでもない表情。彼らの大げさな反応をたしなめる。それでもビットとフリップはお構いなし。 マーサ: やめてよ!私はただ、間違ってるところを直しただけ。誰でもやることよ。ビット: 人間には簡単だけど、機械にはそうじゃない。人間みたいに「直感」でフォークとスプーンを見分けたり家賃を当てたりできないからね。フリップ: 機械学習では、間違いを一歩ずつ直していくんだ。

シーン 39: トレンドライン(回帰用)と決定境界(分類用)の両方を含む 8 つのグラフが表示されている。グラフの構成や正確さはまちまち。フリップは、エラーの大小を示す簡単な棒グラフの上に立っている。フリップ: 分類にせよ回帰にせよ、機械学習はまず仮説を決めることから始まる。エラーの小さな仮説もあれば、大きい仮説もある。

シーン 40: 今度はマーサも棒グラフの上に不安定に立っている。ただし、今回の棒グラフは巨大である。エラー率が大きく変化するところは険しくなっている(都会の高層ビルのよう)。マーサは高いところにいるので不安そう。ビットとフリップは、気にせず説明を続ける。ビット: 機械学習が仮説をちょっと修正すると、エラー率は上がったり下がったり、もしくはそのままだったりする。普通のエンジニアなら、もちろんエラーは...。マーサ: ええ、ここを降りて行くの?! フリップ: そう!

シーン 41: 棒グラフはすべて画面から消える。マーサはまだそこに立ったまま、降りる方法がわからずにパニックになっている。ビット: 機械学習モデルのエラー率が一番低い場所をめざして降りて行くんだ。そうすれば...。 マーサ: いやいや、私はもう本当に降りたいんだけど。 あ!なんで何も見えなくなったの?

シーン 42: ビットとフリップはいたずらっぽい表情で話し続ける。 ビット: ふふ。 フリップ: これで降りやすくなったでしょ?

シーン 43: マーサがひざまずいている。フリップが左からやや右下に歩くと、短い点線がその下に表示される。ビットは、今は見えていないだけで本当はまだそこにあるエラーを身振りで示す。 マーサ: さっきのビルみたいなエラーのかたち...、どこに行ったの? ビット: 僕たちの周りにまだあるよ! フリップ: でも、このエラーのかたちって、

シーン 44: フリップがゆっくり歩くと、点線は左から少し右下がりにさらに伸びる。フリップ: 機械学習ではエラー関数とか損失関数とか呼ばれていて、そのかたちを調べるには、

シーン 45: フリップがさらに歩を進めると、点線が伸びて右下がりの傾斜がよりはっきりと見えるようになる。マーサはフリップを目で追う。ビットはその様子を見降ろしている。 フリップ: そこをゆっくり降りてくしかない!このやり方を勾配降下法って言うんだ。

シーン 46: ビットは楽しそうに大工用の水平器を点線上に置き、傾きの角度を測っている。マーサがスマートフォンを取り出す。 ビット: 大工さんがこれまで 4 世紀にわたって使ってきた古き良き「水平器」のように、機械学習のモデルは傾きが最も急な角度を測るんだ。 マーサ: ねえ、私のスマートフォンにも傾きを測れるアプリがあった!

シーン 47: ビットは愛用の「水平器」がマーサのアプリにお株を奪われてがっかりしている。マーサはフリップを追って坂を下りながらコマの右に出ていく。ビット(最後の言葉は少し離して小さめの文字で): まあ、それでもいいね。 アプリね...。 マーサ: 待って!

シーン 48: フリップはこの点線の谷底と思われる場所に立っている。マーサは点線をつかみながら慎重にその後を追う。ビットは腕をだらんと垂らしてマーサの後ろで浮かんでいる。マーサ: つまり、勾配降下法って、エラーの坂を下って、正解の谷底に向かうハイキングみたいなものね?フリップ: そう!というか「かなり正解に近い谷底」かな。 機械学習はデータ サイエンスと統計の一分野だから、確率的な側面が色濃くあるんだ。

シーン 49: フリップはコマの上部に横たわっている。コマの下部には簡単なアニメーション図がある。左側は谷に向かってボールが転がる図(勾配降下)。右側は、それに動きを合わせたトレンドラインを示す。トレンドラインは最も正確な位置を表している。これには「回帰」というラベルが付いている。その 2 枚が裏返ると、同じようなアニメーション パネルが新たに表示されるが、今度は右側の図に「分類」というラベルが付いた決定境界がある。 フリップ: つまり、この坂を下ることが問題を解くことになるんだ。勾配降下法は、機械学習モデルの空間の中で、問題の解き方を学習で得るプロセスと言える。

シーン 50: 底だと思っていた場所に到達したマーサとフリップの引きの図。ビットは点線をさらに伸ばして、もっと下降できることを示している。フリップ: 機械学習は新しい分野。みんながそれを研究中で、難しい部分もまだまだあるんだ。...例えばこういうふうに、降下の途中で「局所解」と呼ばれるニセの谷底に捕まることもある。 ビット: 気をつけて!

シーン 51: 3 人が話し合っている。 ビット: 機械学習は動く標的とも言える。いまは定番になってるツールや手法も、将来もそうだとは限らない。フリップ: そのとおり!たとえば、エラーを最小にするにも、勾配降下法がいつまでもベストとは限らない。エラーを最小化するオプティマイザは他にもいろいろある。 マーサ: ふーむ。そういえば...。

シーン 52: マーサは 20 軒の住宅で作成した、単純な線形回帰図にもう一度戻り、それを身振りで示している。 マーサ: 水を差してわるいけど、属性(列)が 1 つで、合計 20 件の住宅データで家賃予測するのに、死ぬほどがっつり計算しなきゃならないの?ビット: いや。 フリップ: まさか!

シーン 53: 突然、延々と広がる巨大なスプレッドシートが出現。3 人ともその前の空中を漂っている。ビット: でも、200 属性ある住宅データが 2,000 万件の場合はどう? マーサ: うひゃー! フリップ(効果音): にゃー!!

シーン 54: マーサはスプレッドシートを調べている。フリップはマーサのブラウスにしがみついている。 マーサ: うん、たしかに。でも、これよく見ると、あんまり意味のない変数も多いじゃない。「庭にある妖精の人形数」って何よ。 ビット: そう!つまり、属性によっては重要さが低いってことだよね?

シーン 55: 各属性の横にツマミが表示され、マーサは楽しそうにツマミを触っている。フリップはマーサの肩越しにそれを見ている。ビットは近くの空中に浮かんでいる。 マーサ: よし、じゃあ...。おっと! すべての属性にツマミが付いた! よし、完璧!じゃあこの属性の重要度を低くして...、で、こっちを高くして、そして...?

シーン 56: ツマミが勝手に回転し始め、マーサは後ずさりして不安そうな顔をしている。ビットは平然としている。 マーサ: ねえ...。 何かの幻かしら??ツマミが勝手に動いているように見えるのは...。ビット: うーん、動いてるね!

シーン 57: マーサのアップ。驚いた表情をしている。他の 2 人は彼女の横で得意げである。フリップ: どうも我々のアルゴリズムは「エラーの坂」の下り方を自ら見つけたようだね。 ビット: 「かなり正しい谷底」に向けてね。 マーサ: おお~~。

シーン 58: コマの上半分: 左側には仮説(H)、右側には疑問符。その間には、疑問符を指す矢印。矢印の途中には、パラメータを表すダイヤルが付いている。コマの下半分: 矢印が消え、疑問符が勾配降下シンボルに変わっている。ビット: 機械学習では、仮説に基づいて推論を行い、トレーニング データを使ってパラメータを調節していくんだ。 推論の結果が現れて、それがどんなふうに、どのくらい間違っているかを知る。勾配降下シンボルからの吹き出し: ねえ、これくらい間違ってるよ。

シーン 59: コマの上半分: 矢印が戻る。ダイヤルを再調整する左向き矢印。コマの下半分: もう一度右向き矢印が出現。今回は新しい設定で、勾配降下シンボルは少し先に進んでいる(つまり、谷の底に近づいている)。 フリップ: その結果を逆向きに戻して、パラメータを再調整すると、次はもっとよい推論ができるはず。シンボルからの吹き出し: おお...、近づいてるね。

シーン 60: コマの上半分: 前後の流れを簡略化した表現。左側に H、右側に勾配降下シンボル、中央に簡略化したダイヤル。コマの下半分: 同じ図だが、「H」に戻る矢印だけが残っている(フリップがその上を右から左に歩いている)。ビット: この行ったり来たりが、ほとんどの機械学習のかなめになるリズムを作るんだ。 フリップ: ニューラル ネットワークでは、戻りの矢印で再調整する「学習」の部分をバックプロパゲーションと言うんだ。

シーン 61: 上半分: 戻る矢印とダイヤルのみ。下半分:(シーン 60 の上図の)簡略図。ただしダイヤルは「ブラックボックス」に隠れている。 ビット: このバックプロパゲーションがどのようにしてパラメータを調整するかは完璧にわかってるんだけど... フリップ: ...でも、今どきの複雑なデータセットで学習すると、結果で得られるパラメータの意味の解釈は難しいんだ。

シーン 62: マーサが笑いながら自分の頭を指さし、ビットとフリップが答えている。マーサ: なるほど。この機械の中でなにか起きてるか知るのは難しいのね。ビット: まあ、何かが動いてることは確かだけど。 フリップ: うん。きみの会社にいる人間たちより理解しやすいよ。 マーサ: あ、はい。

シーン 63: 3 人の左側には線形回帰図、右側には分類図。マーサは右手にラベル付きのミニチュア ハウス、左手にラベル付きのフォークを持っている。マーサ: つまり、フォークと家賃の例みたいな分類と回帰が機械学習のおもな用途なの?ビット: それだけじゃないよ。分類と回帰は機械学習のレシピでよく使われる材料ではあるけれど...。 フリップ: でも結局、いちばん重要なのはどの学習方法を選ぶかなんだ。

シーン 64: 3 人は 3 つの学習スタイルのカテゴリと、その名前、シンボルを眺めている。ビット: いまの機械学習では 3 種類の学習方法がよく使われるんだ。フリップ: データから何を取り出したいかによって、どれを使うかが決まるよ。

シーン 65: ビットがコマ中央に浮かんでいるモノ(温度計、家、ボール、フォーク、バナナ、スプーン、フォークリフト)を身ぶりで示している。それぞれの横にバツマークかチェックマークが付いている。マーサとフリップがそれを見ている。 ビット: 教師あり学習では、学習する対象それぞれの違いを示すラベルが付いたトレーニング データを使う。これが正しい答えになるんだ。マーサ: なるほど!じゃあ、これまで私たちが話してたのは...? フリップ: そう、どれも教師あり学習。いまの機械学習ではいちばんポピュラーなやり方だ。

シーン 66: 上半分: ビットは片方の手で 4 枚のハリネズミの写真、反対側の手で 4 枚のハリネズミではない写真を示している。下半分: マーサとフリップは、スマートフォンでハリネズミの写真を検索している歩行者の後ろを歩いている。ビット: 教師あり学習では、ラベル付きのトレーニング データで機械学習モデルのトレーニングをしてから、別に分けておいたテストデータでラベルを当ててみる、ってことを繰り返す。 フリップ: それが終わったら、実際の世の中のデータで試すんだ。スマートフォンを持った歩行者: なるほど!これがハリネズミね!

シーン 67: ネコが出演する映画の画像が並ぶ背景を見る 3 人。ビット: 教師なし学習では正しい答えが用意されていなくて、意味がありそうなグループに分けたり外れ値を探したりする。似たような映画が好きなユーザーのグループとか。 マーサとフリップ(異口同音に): わ!あれ好き! あれ見たの? いいよね!

シーン 68: 世界中の映画の膨大な数の画像と、それを見る群衆。ビットが、マーサとフリップを引っ張り上げている。ビット: 機械学習って膨大なデータや、ものすごく複雑なデータでも扱えるから、こういう作業にぴったりなんだ。群衆からの声: おー、あれ好き!

シーン 69: 昔のインベーダー ゲームのキャラクターのようになったビットが、迷路のゲームを進んでいる。 ビット: そして、強化学習は、目標に向けていちばん効率的な近道を探すプログラム。うまい進み方を見つけたら、ご褒美がもらえる。 失敗したら、やり直し。

シーン 70: ビットが迷路から出てくる。マーサは優勝トロフィーを持っており、フリップがそれを見ている。ビット: やった! フリップ: ある強化学習システムは昔のアーケード ゲームのプレイが得意で、何もコードを追加しなくても、知らないゲームをうまくプレイできるんだ。マーサ: それすごいね!

シーン 71: 3 人は 3 つの学習方法のシンボルに戻ってさらに議論している。ビット: この 3 つの方法がすべてってわけじゃないけど、だいたいはこれらでカバーできるんだ。マーサ: アーケード ゲームをうまくプレイしたりするのはすごいけど、もっと現実的な応用例ってないの?実際の世界ではどんなふうに役立つの?

シーン 72: 音波、警告、脳スキャン、チャートなどのサンプル画像。 フリップ(吹き出しと矢印): 教師あり学習は画像認識とか、 音声認識と言語処理、 医療診断、 不正検知などなど、いろんな用途に使われてる。

シーン 73: ネットワーク マップ、個人プロファイル、DNA 構造、ブラックホール シャドウなどのサンプル画像。ビット(吹き出しと矢印): 教師なし学習は、ネットワークの可視化に使われたり、 人と人のつながりを作ったり、 自然現象からパターンを見つけたりするのに応用されているよ。

シーン 74: ルートマップ、株価チャート、ロボットなどのサンプル画像。 ビット(吹き出しと矢印): そして強化学習は、 交通情報の管理や、 市場分析、 そしてロボットの制御(YouTube で見ばえがよさそうなやつ)に使われている。

シーン 75: フリップがマーサの肩に乗って説明している。 フリップ: どんなやり方であれ、機械学習は品質の高いデータから始まるんだ。 たとえば、教師あり学習で写真の分類をするとして、そうだな...、 ...ネコとか! まずはその対象を含むデータを集める。

シーン 76: 背景にネコの画像。 マーサ: つまり、大きさとか、解像度とか、縦横比とか、 クローズアップなのか引きの図なのか、 どんな角度から撮ったのか、 そのネコだけが写ってるか、なにか背景があるのか、 子ネコは含まれるのか、 トラは...? フリップ: そのとおり。「ネコらしさ」を表すさまざまな画像が必要になる。

シーン 77: 2 つのビットが拡大鏡でフリップの肖像画を調べている。マーサとフリップがそれを見ている。 フリップ: 人の手でひとつずつデータを選んで、ラベルを付けたりする。すでにラベルが付いてるデータでも、それが本当に正しいのか、予期しない偏りがないか、チェックするんだ。

シーン 78: マーサはフリップとビットから渡されたカードの山を調べ、データを 3 つの分厚いバインダーに整理している。フリップ: データの中身をきちんと整理して準備ができたら、それをトレーニング データ、テストデータ、検証データの 3 つに分けるんだ。これだけの量のデータを集めてラベルを付けるのは骨が折れるけど、これが機械学習の価値を生むんだ。キャプション(検証データへの矢印): 詳しくはパート 2 で。

シーン 79: マーサとフリップが間違ったラベルを付けられた画像を見ている。「フォーク」とラベル付けされた皿とフリップの画像。「ネコ」とラベル付けされた毛糸玉とフォークの画像。「グレープフルーツ」とラベル付けされたビットの画像。「パイプ」とラベル付けされたマグリットのパイプの絵(絵のタイトルは「これはパイプではない」)。 フリップ: もしデータに間違いが多かったり、似たようなデータばっかり並んでたり、ある種類のデータの件数がすごく少なかったりすると、実際に使うときにひどい結果になる。

シーン 80: 緑の点線は座っているネコのシルエットに完璧に沿っており、「√ ネコ」とラベル付けされている。赤い点線は緑の点線と同じ形状。前脚を毛づくろいしているネコのシルエットと一致しておらず、「√ ネコではない」とラベル付けされている。 ビット: それに、過学習にも気を付けないと。モデルがトレーニング データに固有のクセを学んでしまい、実世界では融通が利かなくなってしまう現象だよ。

シーン 81: ビットは雑多なモノを乗せたお盆を手に、誰にともなく話している。フリップは振り返って、マーサがいなくなったことに気づく。 ビット: でも、十分な量の正しいデータを用意できれば...。 フリップ: 待って!マーサはどこ?

シーン 82: マーサは空中のドアに続く階段を上っている。フリップとビットが、急いで後を追う。ドアには上から見た脳のような絵が描かれており、ネットワーク マークが付いている。マーサ: お~、あのドアってもしかして、あそこにつながっている? フリップ: 待って!気をつけて。

シーン 83: フリップとビットはマーサに追いつく。マーサはドアに向かっている。マーサ: ねえ、これって機械学習でいま一番流行っているニューラル ネットワークにつながるんでしょ!ビット: うん、そうだよ。これまで話した例も、多くがニューラル ネットで実現できるんだ...。 フリップ: でも、そこに入るのは簡単じゃないよ!

シーン 84: 彼らはマーサに落ち着くように促す。マーサはドアを開けようとするが、鍵がかかっている。ビット: 人工ニューラル ネットワークは強力な道具になるけど、時間とお金もかかるんだ。マーサ: うーん、カギがかかってる。 フリップ: 何をやるかによってはニュートラル ネットなんていらないこともあるよ! 効果音: カチャカチャ

シーン 85: マーサの目線から見たフリップとビット。他の方法もあることを伝えている。フリップの後ろには封筒があり、封筒からは矢印が出ている。ビットの後ろには、簡単な決定木の図。フリップ: 例えばメールを分類したいなら、ニューラル ネットよりも断然速くて計算も簡単なナイーブベイズがおすすめ。ビット: 採用の決定をしたいなら、決定木を使っている人も多いよ。 中の動きが理解しやすいんだ!

シーン 86: マーサはいらいらした様子で階段の最上段に座っている。そこにフリップが近づいてくる。ビットは、サポート ベクター マシンの絵をマーサに見せている。ビット: サポート ベクター マシンも強力な分類器だよ! フリップ: みんな余裕(マージン)のある方が好きでしょ? マーサ: でも...でも...

シーン 87: フリップとビットは心配そうにマーサ寄り添う。マーサは本心を打ち明ける。マーサ: やっぱりニューラル ネットを勉強したい。だって...。 ビット: かっこいいから? マーサ(小さな文字で。「うん...」の後に空白): うん...。かっこいいから。 フリップ: かっこいいよね!

シーン 88: マーサは自信に満ちたわくわくした様子で立っている。 マーサ: あのね、ニューラル ネットが必要になるかどうかは分からないけど、ひとつ確かなことはある。私はこのドアを開けて未来を見てみたい。 さあ、カギを開けよう!

シーン 89: ビットはマーサにカギを渡す。マーサはこちらを向く。フリップは最後のパネルの合図を出している。ビット: 結局カギを渡すって思ってたでしょ? マーサ: まあね...。そうじゃなかったら、話としておかしいでしょ! フリップ: 次のパネルへ!

シーン 90: 上部にフリップの顔と大きな吹き出し。中央には、カギを差し込んでドアを開けようとしているマーサの手のアップ。フリップ: 次回はニュートラル ネットワーク! ナレーター: めまぐるしく変化する機械学習の世界についてさらに詳しく学びましょう。パート 2: 「ディープ ラーニングにディープダイブ」をお楽しみに。

  • Script by Dylan Meconis, Scott McCloud, Syne Mitchell
  • Art by Dylan Meconis
  • Color by Jenn Manley Lee
  • Japanese localization by Kaz Sato, Mariko Ogawa
  • Produced by the Google Comics Factory (Allen Tsai, Alison Lentz, Michael Richardson)