컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
장면 1: 1부 패널과 유사한 소개 패널 각 원 안에 마사, 플립, 비트, 옥타비우스가 보이고 이들을 몇 개의 신경망 관련 아이콘이 둘러싸고 있습니다.
제목: 신경망 학습 Google AI의 온라인 만화
자막/화살표: 오늘의 주제를 학습할 마사
마사: 이제 뭔지 알 것 같아요.
자막: 플립
자막: 비트
자막: 새로운 친구, 옥타비우스
옥타비우스: 안녕하세요.
장면 2: 마사가 열쇠로 신경망 세계의 문을 엽니다.
자막: 이전의 머신러닝 탐구에서는…
마사: 이번에는 신경망에 대해 알아볼 차례입니다.
장면 3: 마사가 환한 얼굴로 소리를 지르며 문을 엽니다.
마사: 안녕하세요.
장면 4: 카메라가 마사 뒤로 이동하자 문 안쪽으로 서로 연결된 수많은 노드가 보입니다. 문으로 연기가 스며들었나 봅니다. 겁을 먹은 마사의 그림자가 보입니다.
마사: ...이크!
장면 5: 다시 문 반대편으로 돌아옵니다. 문을 닫은 마사는 머리가 헝클어진 채로 눈을 크게 뜨고 있습니다. 플립과 비트가 마사를 태연하게 바라봅니다.
사운드 특수효과: 쾅
장면 6: 이전 장면과 같지만 마사의 시선이 플립과 비트를 향합니다. 문 뒤쪽에서 소리가 들립니다.
옥타비우스(문 뒤에서): 미안, 미안해요! 아직 준비가 안 되었어요. 좋아요. 이제 들어오세요.
장면 7: 잠시 후 마사, 플립, 비트가 조심스레 문 뒤편을 쳐다봅니다.
장면 8: 귀여운 아기 문어, 옥타비우스가 단순한 기술 뉴런 옆을 떠다닙니다.
옥타비우스: 안녕하세요! 저는 옥타비우스에요. 기본적인 내용부터 둘러볼까요?
장면 9: 안심한 마사가 어깨 너머로 아까 봤던 압도적인 광경을 확인합니다. 플립과 비트가 옥타비우스에게 손을 흔듭니다.
마사: *휴* 부탁드려요. 저는 마사입니다.
옥타비우스: 안녕하세요. 마사! 신경망은 단순한 구성요소로 이루어지며 그 중에서도 가장 단순한 요소가 바로 '뉴런'입니다. 플립과 비트도 반가워요.
플립: 안녕하세요.
비트: 안녕하세요. 선생님.
장면 10: 옥타비우스의 설명이 이어지는 동안 마사가 생물학적 뉴런과 기술 뉴런이 나란히 표시된 두 설명 패널 옆에 무릎을 굽혀 앉습니다.
옥타비우스: 생물학적 뉴런과 마찬가지로 이 '뉴런'은 다수의 입력을 수용하며 이를 결합해 출력을 생성합니다.
마사: '입력'이라면…?
장면 11: 옥타비우스와 비트가 데이터 열이 포함된 특성 테이블 위에서 대화를 나눕니다.
옥타비우스: 숫자상으로 측정 가능한 거의 모든 것을 의미합니다.
비트: 입력을 스프레드시트의 속성이라고 생각해 보세요.
장면 12: 비트가 제스처를 취하는 동안 플립이 뒷다리로 테이블을 뒤엎습니다.
플립: ...그렇지만 가로 방향으로 돌려보면요.
비트: (굳이 그럴 필요는 없어요. 왼쪽에서 오른쪽으로 돌리면 보기에 더 좋을 뿐입니다.)
장면 13: 옥타비우스와 마사가 이제 가로 방향이 된 테이블을 바라봅니다. 각 데이터 열에서 일련의 둥근 노드(입력)로 향하는 화살표가 표시되어 있습니다.
옥타비우스: 바로 여기에서 첫 번째 입력 레이어가 시작됩니다.
장면 14: 옥타비우스가 이전의 입력 레이어 사이를 떠다니며 패널 오른쪽에 있는 단순한 이진 분류: Cat 또는 Dog를 가리킵니다. Cat이 강조표시되어 있습니다.
옥타비우스: 우리의 목표는 이 입력 레이어가 얼마나 복잡하든 상관없이 여기에서 생성된 값을 사용하여 반대쪽의 간단한 답변이 포함된 출력 레이어를 생성하는 것입니다.
장면 15: 화면이 축소되고 모두가 빈 공간에 서 있습니다. 옥타비우스는 웃고 있으나 마사는 당황한 모습입니다.
옥타비우스: 이상입니다. 질문 있나요?
마사: …
장면 16: 이전 장면과 같지만 플립과 비트가 키득거리며 웃고 있습니다.
비트(음성 특수효과): *흐흐*
장면 17: 이전 장면과 같지만 마사가 당황하여 소리칩니다. 플립과 비트가 이제 대놓고 웃습니다.
마사: 그런데 중간에 무슨 일이 일어난 거죠?
옥타비우스: 좋은 질문이군요.
장면 18: 옥타비우스가 표준 NN 다이어그램의 히든 레이어에서 움직이는 작은 애니메이션 분류 아이콘을 바라봅니다.
옥타비우스: 사이에 있는 이 '히든 레이어'에서 일련의 단순한 [분류] 태스크를 수행하여 복잡한 답변에 이릅니다.
장면 19: 옥타비우스가 X1, X2 라벨로 표시된 입력이 시그마(Σ)가 있는 노드로 모이는 간단한 뉴런을 쳐다봅니다. 플립이 아래쪽에서 끼어듭니다.
옥타비우스: 각 특징의 숫자 값(X)이 뉴런에 합산됩니다.
플립: 그리고 총합(∑)으로 선의 경사가 결정되지요.
장면 20: 이전 장면과 같지만 입력과 총합 노드 사이의 선에 두께가 다른 W1 및 W2 라벨이 붙어 있습니다.
옥타비우스: 하지만 가중치가 더 큰 특성이 있기 때문에 먼저 이러한 입력이 모두 위 또는 아래로 조정됩니다.
장면 21: 마사가 끼어들어 Low 및 High로 설정된 다이얼이 있는 선을 가리킵니다(1부의 설명 방식과 유사).
마사: 아! 그러면 가중치가 다이얼 중 하나군요.
옥타비우스: 맞아요.
장면 22: 마사와 옥타비우스가 단순한 뉴런을 살펴보는데 이번에는 아래의 총합을 입력하는 노드를 나타내는 'b' 라벨이 추가로 표시됩니다. 이번에도 선에 두께가 있습니다.
옥타비우스: 또 다른 다이얼은 편향입니다. 역시 가중치로 조정 가능한 총합의 오프셋이지요.
장면 23: 마사의 말풍선에 표시된 2개의 애니메이션 그래프에서 가중치와 편향이 계속 변경되면서 경사 및 y 절편의 변화를 보여줍니다. 옥타비우스와 플립이 아래에서 끼어듭니다.
마사: 그러면… 가중치를 조정하면 경사가 조정되고…
… 편향을 조정하면 Y-절편이 조정되나요?
옥타비우스: 그렇죠!
플립: 마사라면 금방 이해할 줄 알았어요.
장면 24: 뉴런의 총합 노드에 사선이 표시되며 옥타비우스가 다음 단계로 활성화 함수를 나타내는 찌그러진 선(S자형)을 보여줍니다. 비트가 표지판을 들고 아래에 떠다닙니다.
옥타비우스: 선형 분류 기준을 시그모이드 함수와 같은 비선형 형태로 찌그러뜨리면.…
자막(비트가 든 표지판): 자세히 알아보기
장면 25: 옥타비우스가 확대된 S자형 그래프의 y 절편에 떠 있으며 오른쪽 하단에서는 마사가 손가락으로 사진을 찍는 제스처를 취합니다.
옥타비우스: 이 '활성화 함수'를 통해 비선형 관계와…
…학습 프로세스의 원활한 조정이 가능합니다.
마사: 흠.
장면 26: 모든 라벨이 표시된 완전한 뉴런이 보이며 옥타비우스와 마사가 아래에서 관찰하고 있습니다. 작용하는 모든 구성요소가 표시되어 화면이 복잡해 보입니다.
라벨: 노드, 가중치, 에지, 총합, 편향, 활성화 함수, 비선형 함수
(예: 시그모이드, tanh, 소프트맥스, Swish, ReLU, Leaky ReLU, Diet ReLU, ReLU with Chips, ReLU, Spam, Spam, ReLU, Spam)
옥타비우스: 전부 펼쳐보면 이와 같습니다.
마사: 이크.
장면 27: 3개 노드로 구성된 간단한 뉴런으로 돌아갑니다. 입력을 의미하는 X1 및 X2와 활성화 함수의 시그모이드 곡선이 나와 있습니다. 옥타비우스가 간단한 표기로 돌아온 이유를 설명하자 마사는 안심하는 모습입니다.
옥타비우스: 하지만 쉽게 이해할 수 있도록 총합, 편향, 활성화 함수를 하나의 노드로 결합하고…
…선 두께를 사용해 가중치를 나타내 보겠습니다.
마사: *휴* 그렇게 해요.
장면 28: 한 뉴런에서 두께가 적용된 애니메이션 선이 노드와 연결되고 새로운 출력 선이 오른쪽으로 이동합니다.
옥타비우스: 이 노드의 출력은 이렇게 표현할 수 있지요.
마사: 오!
장면 29: 뉴런 1이 두 번째 뉴런과 결합되었습니다. N1의 출력이 N2의 입력이 됩니다. 뉴런 사이는 여전히 애니메이션 선으로 표시되어 노드 간 정보의 흐름을 보여줍니다.
마사: …다른 뉴런의 입력이 될 수 있군요!
옥타비우스: 바로 그거에요!
장면 30: 네트워크가 확장되어 서로 연결된 6개의 뉴런 레이어와 그 사이를 흐르는 애니메이션 선의 망이 표시됩니다.
옥타비우스: …그리고 계속 다른 뉴런이 연결되면…
마사: 우와.
장면 31: 마사의 대화 아래에 표시된 2개의 작은 애니메이션 사각형에서 1부: 곡선 바닥에서 멈출 때까지 앞뒤로 구르는 공과 X 및 O 집합의 적절한 분류 궤적에서 멈추기 위해 앞뒤로 회전하는 선을 볼 수 있습니다. 비트가 1부로 돌아가는 표지판을 들고 있습니다.
마사: 역전파와 경사하강법*을 사용해 신경망을 학습시키는 과정에서…
…가중치와 편향이 조정되나요?
옥타비우스: 맞아요.
각주(비트가 든 표지판): *1부 보기
장면 32: 3개의 입력이 포함된 간단한 뉴런에 가중치를 전달하여 선 두께를 조정하는 애니메이션 다이얼이 표시되어 있습니다. 옥타비우스가 위에서 설명하는 동안 비트는 양팔을 번쩍 들고 있으며 마사는 양반다리를 하고 바닥에 앉아 있습니다.
옥타비우스: 이러한 자동 조정을 '모델 학습'이라고 부릅니다.
비트: 나를 보세요! 손을 쓸 필요가 없어요.
마사: 멋지네요. 그러면 엔지니어는 무엇을 하죠?
장면 33: 마사는 자신의 앞에 떠 있는 여러 레이어로 된 노드 네트워크를 손가락으로 찔러보고 있으며 마사의 등에 올라탄 플립이 맞장구를 칩니다. 비트는 아래에 떠 있습니다.
플립: 오, 전체적으로 참여하지요! 엔지니어는 올바른 아키텍처를 선택하고 레이어 또는 노드 수를 수정하며 활성화 함수를 선택하는 모든 종류의 결정을 내려야 해요.
마사: 흠.
비트: 이러한 작업을 '초매개변수 미세 조정'이라고 불러요.
장면 34: 마사와 옥타비우스가 그래프 모양의 그리드를 배경으로 대화를 나눕니다.
옥타비우스: 정보에는 구조가 있어요. 제대로 학습된 신경망은 정보의 구조를 탐색하는 데 도움이 됩니다.
장면 35: 마사와 옥타비우스가 회귀(데이터 맵을 지나는 추세선 긋기)와 분류(두 데이터 그룹을 표현하는 선 긋기)를 수행하는 작은 마사 2명을 벽 위에서 내려다봅니다.
옥타비우스: 회귀선과 분류선을 그을 때는 이렇게 하면 됩니다.
특성이 한두 개 밖에 없다면 손으로도 쉽게 그릴 수 있지요.
마사: 우와…
저것 봐요!
장면 36: 교환 입력 노드 레이어가 포함된 스프레드시트가 옆에 나와 있습니다. 마사와 옥타비우스가 스프레드시트를 살펴봅니다.
옥타비우스: 하지만 특성이 많다면 입력도 다수가 존재하게 됩니다. 그러면 이렇게 표현할 수 있지요.
장면 37: 갑자기 마사, 옥타비우스, 플립, 비트가 뒤틀린 데이터 세계에 떠다닙니다. 정수와 문자의 스트림이 주위를 날아다니자 마사가 겁을 먹은 듯합니다. 비트는 이상하게 휘어진 모습을 하고 있고 플립은 초현실적인 숫자 가닥을 통과해 거꾸로 걸어 내려오고 있습니다. 옥타비우스는 당황하지 않은 기색입니다.
옥타비우스: 탐색해야 할 수많은 차원이 있지요. 이 때문에 'A'와 'B'의 경계를 단순한 직선으로 나누기가 불가능해 보입니다.
마사: 우와!
장면 38: 패널 위쪽부터 다차원 환경이 희미해집니다. 비트는 태평하고 안정되어 보이는 반면 구석에 있는 마사는 얼빠진 모습입니다.
옥타비우스: 다행히 우리 디지털 친구들은 다른 차원을 수학적으로 보기 때문에 이 구조를 통과할 길을 찾을 수 있어요.
비트: 물론이죠. 정말 간단해요. 밑에 있는 지형만 구부리면 되죠.
장면 39: 비트가 데이터를 나타내는 나선형 2개가 서로 얽힌 그래프를 가리킵니다. 플립이 오른쪽에서 끼어듭니다.
비트: 예를 들어 이 두 형태를 분리할 수 있는 직선은 존재하지 않을 것처럼 보이지만 신경망은 그 길을 찾아냅니다.
플립: 이때 '히든 레이어'가 작용하지요.
장면 40: 비트가 양손 사이로 나선형 데이터를 3단계에 걸쳐 비틀어 한 선으로 쉽게 나눌 수 있는 한 쌍의 구불구불한 선으로 만듭니다.
비트: 데이터를 변환합니다 —
— 공간을 늘리고 찌그러뜨리되 —
— 답을 찾기 위해 자르거나 부수거나 접지는 마세요.
장면 41: 옥타비우스 위쪽에 기울어진 지구가 떠 있고 남극을 둘러싼 점선 위로 작은 X자 기호가 표시되어 있습니다. 옥타비아누스는 아래에 나온 메르카토르 도법의 지도에 직선을 긋습니다.
옥타비우스: 남극과 다른 대륙을 잇는 직선을 그린다고 생각해 보세요.
지구본에서는 불가능해 보이겠지만…
… '관점을 조금만 바꾸면' 가능해집니다.
장면 42: 선으로 데이터세트를 나눈 노드 3개가 보입니다. (단일 레이어의) 처음 2개 노드가 결합되면서 출력 노드에 곡선이 형성되어 원하는 데이터세트를 성공적으로 분리해 냅니다. 비트는 신경망 플레이그라운드 데모로 연결되는 '자세히 알아보기' 표지판을 들고 있습니다.
옥타비우스: 각 뉴런에 다른 선형 함수가 포함된 경우 두 뉴런을 결합하면 데이터 적합에 해당하는 보다 복잡한 형태로 변형됩니다.
자막/링크(비트가 든 표지판): 자세히 알아보기
장면 43: 마사가 사악한 표정으로 양손 사이에 떠 있는 노드를 흐뭇하게 바라봅니다. 옥타비우스는 마사의 어깨에 다리를 올리고 걱정스럽게 쳐다봅니다.
마사: 오! 그렇다면 뉴런만 충분하면 아무리 복잡한 데이터세트라도 적합하도록 조정할 수 있겠네요?
하하하...
옥타비우스: 너무 서두르지 마세요. 뉴런이 너무 많으면 과적합이 발생할 수 있어요!
장면 44: 플립이 천천히 걷기 시작하자 점선이 왼쪽에서 오른쪽으로 약간 아래쪽을 향해 확장됩니다.
플립: 우리가 '오류 함수' 또는 '손실 함수'라고 부르는 등락의 배열은
오직…
장면 45: 마사, 비트, 옥타비우스, 플립이 빈 공간에서 대화를 나눕니다.
마사: 이 정도면 충분해요. 그런데 '히든 레이어'라고 부르는 이유는 무엇이죠?
비트: 이런. 좋은 질문입니다.
옥타비우스: 우리는 어떤 특성이 입력되고… 어떤 응답이 출력되는지 알고 있습니다.…
플립: … 그리고 히든 레이어가 어떻게 작용하는지도 설명할 수 있죠.
장면 46: 복잡한 노드 망을 배경으로 실루엣만 보이는 마사가 무릎을 꿇고 플립의 이야기를 듣고 있습니다.
오른쪽에는 비트가 차시의 연구로 연결되는 '자세히 알아보기' 표지판을 들고 플립의 말풍선을 가리키고 있습니다.
비트: 하지만 완전 연결형 신경망에서는 각 노드가 이전 레이어에 있는 모든 메모의 결과를 혼합합니다. 그러니 어떤 '특성'을 확인했는지 누가 알겠어요?
플립: 데이터 과학자인 차시 코지르코프가 말했듯이 '표현 불가능한 부분을 자동화'하고 있는 것입니다.
장면 47: 안내원 모자를 쓰고 작은 탄광 수레 옆에 선 옥타비우스가 패널 오른쪽에 보입니다. 다들 수레에 타기 위해 움직입니다.
옥타비우스: 완전 연결형 신경망은 아키텍처의 한 유형일 뿐입니다.
마사: 모자가 멋지네요.
옥타비우스: 고마워요!
장면 48: 탄광 수레에 앉아 있는 옥타비우스 뒤로 네트워크 아키텍처 기호에 따라 라벨이 지정된 여러 정류장이 표기된 지도가 있습니다.
옥타비우스: 신경망 지도에서 유명한 다른 정류장으로 이동할게요.
장면 49: 모두를 태운 수레가 다양한 아키텍처 아이콘이 주위에 떠 있는 구불구불한 선로를 지나갑니다. 이동하는 수레에서 마사는 겁을 먹고 있지만 옥타비우스는 쾌활하게 설명을 이어갑니다.
옥타비우스: 전체 영역이 유동적입니다. 영원히 '공사 중'인 셈이죠.
오늘날 가장 인기있는 목적지의 대부분이 10년 전에는 프로토타입이었죠!
장면 50: 시계 문자판을 닮은 원형 선로를 지나가는 수레의 모습이 3단계로 표현됩니다. 인물이 너무 작아 표정은 알 수 없습니다.
옥타비우스: (LSTM 등의) 반복 신경망은 자체적으로 되돌아가는 동작을 반복하며 —
— 음성 인식과 같은 —
— 시간 요소의 문제를 해결합니다.
자막/링크: 자세히 알아보기
장면 51: 교차 선로를 지나는 수레가 내려다 보입니다. 선로가 모이고 갈라지며 다양한 옵션이 펼쳐집니다. 옥타비우스가 설명하면서 교차 스위치를 조작합니다. '자세히 알아보기' 링크는 [링크를 걸 항목]에 연결됩니다.
옥타비우스: 자동 인코더 등이 비지도 데이터를 이해하도록 도와줘서 —
— 무수히 많은 빅데이터의 차원수가 줄어듭니다.
자막/링크: 자세히 알아보기
장면 52: 전경에 일행이 탄 수레가 돌진하는 모습이 보이고 멀리 있는 다른 선로에 여러 수레가 보입니다. 이동하는 중에 마사가 옥타비우스의 말에 끼어들어 다른 수레의 승객에 대해 질문합니다. 옥타비우스는 앞을 바라보며 계속 쾌활한 모습을 보입니다.
옥타비우스: 지금 가고 있는 네트워크는 특히 분석으로 유명합니다 —
마사: 저들은 누구인가요?
옥타비우스: 오, 생성적 적대 신경망이네요. 저 승객들은 존재하지 않아요!
눈을 마주치면 안 되요.
장면 53: 수레가 'CNNs'라는 라벨이 붙은 아치형 문이 있는 승강장에 섭니다.
조사를 위해 모두가 내립니다.
옥타비우스: 다 왔습니다. 컨볼루셔널 신경망에 대한 모든 것을 알 수 있는 곳이지요.
마사: 아, 들어본 적 있어요.
비트: 언론에 자주 나오죠.
장면 54: 화려한 액자가 걸린 미술관에 들어갑니다. 캔버스에는 1과 0만 가득합니다. 비트가 캔버스 중 하나를 황홀하게 쳐다봅니다. 마사는 혼란스러워 보입니다.
비트: 오, 이 작품이 마음에 들어요. 진짜로 11001101010을 캡처했네요. 그렇지 않나요?
마사: 어…
옥타비우스: 이 이미지는 모두 CNN을 이루는 숫자 그리드입니다.
장면 55: 마사가 캔버스 중 하나를 들어 숫자를 유심히 쳐다봅니다.
옥타비우스가 그 내용을 설명합니다. 비트는 오른쪽 하단의 음파 위에서 마이크를 잡고 CNN이 시각적으로 렌더링되는 데이터를 어떻게 파싱할 수 있는지 보여줍니다.
마사: 이미지를 처리하는 모든 신경망도 마찬가지 아닌가요?
옥타비우스: 물론입니다! 하지만 CNN에서는 모든 이미지 기반 데이터를 파싱하고 확보하는 고유의 방법을 제공합니다.
비트: (여기에는 이미지로 표현 가능한 모든 데이터 유형도 포함됩니다.)
장면 56: 모두가 32x32픽셀의 회색톤 고양이 사진을 바라봅니다.
옥타비우스: 이와 같은 저해상도 이미지에도 풍부한 정보가 담겨 있습니다.
1,024픽셀 하나하나가 별도의 입력이고 실제로는 3개입니다. 빨간색, 녹색, 파란색 채널로 구분되지요.
플립: 루퍼스 삼촌이에요!
장면 57: 옥타비우스가 패널 왼쪽에서 색상 이미지의 다중성에 대해 설명합니다. 옥타비우스 아래에는 빨간색, 녹색, 파란색 채널의 입력 집합이 겹쳐져 있으며 해당하는 총 입력 수(3,072)가 표시되어 있습니다. 수많은 입력 레이어가 오른쪽으로 뻗어나가고 있습니다.
겁에 질린 마사가 뒷걸음칩니다.
옥타비우스: 고해상도나 동영상이 아니더라도 다차원 입력 레이어라면 이런 식이 되겠죠.
마사: 아! 뭔가 떠오를 것 같아요.
장면 58: 옥타비우스가 6개의 고양이 관련 이미지 옆에서 설명을 계속합니다. 각기 다른 회전 위치에 있는 고양이를 확대한 이미지로 한 이미지 내에 다양한 슬롯이 있습니다. 왼쪽 하단의 분류 노드에는 Cat: YES라고 표시되어 있습니다.
옥타비우스: 완료했을 때 단순한 1차원의 'YES' 또는 'NO'를 원할 수 있습니다. 단, 고양이 유형, 각도, 이미지에 나타나는 부분에 상관없이 작용해야 합니다.
마사: 와우. 무리한 요구 같은데요.
장면 59: 비트가 픽셀 행렬에 나타나며 각 블록이 오른쪽에 있는 별도의 유닛 패널로 분해됩니다.
옥타비우스: 맞습니다. 이러한 주문에 맞추기 위해 CNN에서는 거대한 픽셀 데이터 행렬을 레이어별로 관리 가능한 규모로 분류합니다.
장면 60: 옥타비우스가 마사에게 손잡이가 달린 작은 행렬(필터)을 던집니다.
옥타비우스: 우선 소스 이미지의 고양이 관련 특성 지도를 빌드해 보겠습니다.
받아요!
마사: 이게 뭐죠?
옥타비우스: 필터입니다. 처음에는 무작위 가중치 행렬로 시작되지만 시간이 지나면 알고리즘에서 이를 조정합니다.
장면 61: 작은 마사와 옥타비우스가 발끝으로 걸어서 애니메이션 행렬 2개를 지나갑니다. 첫 번째 행렬에서는 필터가 입력 데이터에서 스트라이드 단위로 움직이고 두 번째 행렬에서는 그 결과로 생성되는 사각형별 특성 지도가 표현됩니다. [여기에서 예시 참조] 플립이 오른쪽 하단에서 나타나 끼어듭니다.
옥타비우스: '컨볼루션'이 전체 이미지에서 필터를 '스트라이드'라고 부르는 가변형 간격 단위로 움직이는 데 관여합니다.
마사: 오! 소스 데이터를 행렬과 곱하는군요!
플립: 그 결과를 특성 지도라고 부릅니다.
장면 62: 튜브와 선글라스를 장착한 옥타비우스가 CNN에서 진행되는 단계를 설명합니다. 입력 이미지, 다수의 이미지, 컨볼루션으로 생성된 단순한 이미지, 활성화 함수, 풀링으로 생성된 더 적은 이미지가 보입니다. 마사가 그 위에 서서 바라봅니다.
옥타비우스: 이 특성 지도는 풀링을 거쳐 연산 규모를 한층 더 줄입니다.
마사: 오, 특성을 더 찾아내기 위해 계속 쌓아나갈 수 있군요!
장면 63: 옥타비우스가 희미한 가장자리(가로, 세로, 좌측 경사, 우측 경사)를 보여주는 4개의 저해상도 필터로 이동합니다. 비트가 얼빠진 눈을 하고 있는 뇌를 가리키며 아래에 삽입된 패널에서 끼어듭니다.
옥타비우스: 초기 단계에서는 필터가 가장자리와 방향 정도만 감지할 수 있습니다*
비트: *흥미로운 사실: 뇌의 시각 피질에서도 이런 식으로 감지를 시작합니다. 실제로 CNN은 여기에서 초기 아이디어를 얻었습니다.
자막: 자세히 알아보기
장면 64: 왼쪽의 그리드에 개략적인 테두리, 좀 더 선명한 요소, 작은 옥타비우스를 포함한 완전한 캐릭터 또는 인물과 같은 3개의 특성 레이어가 표시되어 있습니다. 진짜 옥타비우스가 패널 오른쪽에서 설명합니다.
옥타비우스: 하지만 이후의 모든 레이어에서는 노이즈로부터 복합 특성을 얻기 시작합니다.
보이죠? 이게 저에요!
장면 65: 마사와 옥타비우스가 빛나는 필터를 위에서 바라봅니다.
마사: 선과 각도에서 수염, 발, 털을 거쳐 결국 '고양이' 또는 '개'로 진행되는 것인가요?
옥타비우스: 글쎄요… *허허* 예, 아니요, 예라고 답할 수 있겠네요! 그 과정에서 우리는 어떤 특성이 검토되는지 정확히 알 수 없습니다.
하지만 CNN은 어떤 특성이 어디에 숨어있든 찾아낼 수 있습니다.
장면 66: CNN 단계가 분해된 장면으로 돌아가는데 이번에는 끝에 분류 레이어가 추가되어 있습니다. 전체 노드에서 상호 연결된 선이 바이너리 출력으로 이동하는 것을 보여줍니다. 플립이 패널 오른쪽에서 나타나 설명합니다.
플립: CNN이 첫 번째 예에서처럼 솜씨 좋게 연결되었습니다. 하지만 최종 출력 레이어가 이전 레이어의 모든 뉴런과 연결됩니다.
장면 67: 마사, 옥타비우스, 비트, 플립이 빈 공간에 서 있고 네트워크의 예측에 해당하는 상자 속에 각각 들어가 있습니다. 마사는 98% 인간, 옥타비우스는 94% 문어, 플립은 89% 고양이지만 비트는 60% 농구공에 해당합니다.
옥타비우스: 이 분류 레이어는 우리 모두에 대한 정확한 응답을 제공하고 있습니다.
비트: 어… 잠시만요.
라벨:
98% 인간
99% 문어
60% 농구공
89% 고양이
장면 68: 마사가 걱정하며 몸을 숙입니다. 비트를 제외한 모두의 상자가 사라졌습니다.
옥타비우스가 걱정스러운 얼굴로 떠다닙니다. 비트는 풀이 죽은 모습입니다.
마사: 이런. 왜 이렇죠? 학습 데이터에 비행 로봇이 없었나요?
옥타비우스: 학습 데이터에 있어야 했는데!
라벨:
60% 농구공
장면 69: 플립과 마사가 바닥에 흩어진 학습 데이터와 테스트 데이터를 살펴봅니다. 배경에서 비트는 반항적이고 굳은 표정을 짓고 있습니다.
플립: 이러면 곤란해요! 걷기만 포함된 전형적인 표본 선택 편향이라고요.
마사: 공정하지 않네요. 모든 로봇이 걷는다고 예측하다니…
비트: 그 누구도 내게서 하늘을 뺏을 수는 없어요!
라벨:
60% 농구공
장면 70: 비트와 플립이 패널 왼쪽으로 향합니다. 마사가 일어나려고 합니다.
마사: 항상 데이터에는 편향이 없다고 생각했었어요. 그저 '숫자'일 뿐인데…
옥타비우스: 데이터세트는 데이터가 조합된 시간과 장소의 산물입니다.
라벨:
60% 농구공
장면 71: 옥타비우스가 다리에 여러 양말 인형을 끼우고 있습니다. 양말 인형마다 각기 다른 기호가 포함된 말풍선이 있습니다.
옥타비우스: 사전에 '중립적인' 데이터를 만들려고 해도 컴파일하는 사용자에게 자신만의 내재적 편향이 있을 수 있습니다.
장면 72: 마사가 데이터 이미지 위에 털썩 앉아 있습니다. 플립과 비트는 낙심한 표정입니다.
옥타비우스는 패널 오른쪽에서 더 많은 이미지를 훑어봅니다.
마사: 생각보다 훨씬 복잡하네요.
옥타비우스: 흠… 잠재 편향도 개입했을지 모르겠네요.
모든 농구공 사진을 보고 공통점을 찾아보세요.
라벨:
60% 농구공
장면 73: 옥타비우스가 마사에게 사진 몇 장을 펼쳐서 보여줍니다. 모든 사진에 농구공을 들고 있는 농구 선수의 팔과 손이 나와 있습니다.
옥타비우스: 익숙한 모습이 보이나요?
마사: 모르겠어요. 모두 농구공을 들고 있는 팔인 것 같은데—
장면 74: 마사가 농구공 상자에 들어가 있는 비트를 다시 보고는 깨달음을 얻습니다.
마사: 오.
라벨:
60% 농구공
장면 75: 마사와 옥타비우스가 토론합니다.
옥타비우스: 여전히 엔지니어와 윤리학자들은 신경망이 세상을 바라보는 관점을 이해하기 위해 애쓰고 있습니다.
이들은 향후 몇 년간은 이러한 작업을 계속해야 할 것입니다.
장면 76: 마사, 옥타비우스, 플립, 비트가 거울 같은 지면에 서서 반사된 자신의 모습을 내려다 봅니다.
옥타비우스: 연구자들은 CNN을 뒤집어 독보적인 이미지 분류자를 가져와…
…생성적 적대 신경망(G.A.N.)을 탄생시켰습니다.
… 덕분에 아름다운 초현실적 이미지를 생성할 수 있지만 동시에 '딥 페이크'와 같은 악용 사례도 생겨났습니다.
자막:
자세히 알아보기
장면 77: 마사는 비장한 표정이며 옥타비우스가 용기를 북돋우고 있습니다. 플립과 비트가 아래에서 끼어듭니다.
마사: 저는 문제가 아닌 해결에 일조하고 싶어요. 그때가 되면 제가 차이를 구별할 수 있기를 바랍니다.
옥타비우스: 작동 원리를 배우는 것만으로도 멋진 출발이에요.
플립과 비트(패널 밖에서): 맞아요! 맞아요!
장면 78: 마사가 하늘을 바라보며 낙관하지만 마사의 상사인 멜이 말을 끊습니다.
옥타비우스가 분해 합니다.
마사: 이봐요, 사람들! 내가 해낼 수 있다는 것을 99% 확신하기 때문에 —
멜(패널 밖에서): 이봐, 마사!
장면 79: 멜이 환상의 세계 경계로 다가와 혼자서 질문하고 답합니다. 모두 동요된 모습을 보이고 플립은 야유합니다.
멜: 오! 여기가 어디야? 저게 뭔가요? 이들은 누구인가요?
마사: 어, 이 친구들은 —
멜: 사실, 누구든 상관없어요.
장면 80: 마사가 벽에 기대어 비트와 옥타비우스 옆에 주저앉습니다. 멜의 말 때문에 모두가 실망한 기색입니다.
멜: 10분 내로 돌아와서 주주들에게 보고하세요.
옥타비우스: 항상 저런 식인가요?
마사: 그렇답니다.
장면 81: 멜이 손을 흔들며 사라집니다. 마사가 일어나는 사이 친구들이 주변으로 모입니다.
멜: 고마워요. 안녕!
옥타비우스: 지금까지 다룬 정보가 너무 많은데…
플립: 제가 회의실에 가서 방해를 해서 시간을 벌어 볼게요.
장면 82: 당황한 옥타비우스의 시선이 흔들리지만 마사가 한 손을 들며 옥타비우스를 진정시킵니다.
옥타비우스: 더 느리게 진행했어야 했어요! 사람들이 제가 졸업한 두족류 사범 학교를 비웃을 거에요!
마사: 아니에요.
장면 83: 화면을 채운 마사의 표정은 비장하면서도 흥분되어 있습니다.
마사: 전 해낼 수 있어요.
이제 여러분의 차례입니다.
머신러닝의 세상으로 떠나는
여정을 계속 이어가세요.
장면 84: 마사가 많은 간부들 앞에서 NN 및 다른 요소가 표시된 화이트보드를 가리키며 발표하고 있습니다. 모두 넋을 잃고 설명을 듣고 있습니다. 독자를 위한 자세히 알아보기 클릭 유도문안으로 끝을 맺습니다.
...Google의
ML 단기집중과정
에 참여하거나
Google Cloud AI 를 살펴보세요!
줄거리, 디자인, 레이아웃: 루시 벨우드, 딜런 메코니스, 스콧 매클라우드
라인아트: 레일라 델 듀카
색상: 젠 맨리 리 일본어 현지화: 카즈 사토, 마리코 오가와
제작: Google Comics Factory(앨런 츠사이, 앨리슨 렌츠, 마이클 리차드슨)
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],[],[],[]]