머신러닝(ML)이란 무엇인가요?

오늘날의 기업은 데이터가 넘칠 정도로 많은 상황이며, 데이터를 이해하면 비즈니스에서 더 나은 의사 결정을 내리는 데 큰 도움이 될 수 있습니다. 하지만 방대한 양에 복잡하기까지 해 기존 도구를 사용하여 데이터를 분석하기 어려운 경우가 많습니다. 데이터에서 패턴과 유용한 정보를 찾기 위한 분석 모델을 빌드, 테스트, 반복, 배포하면 확장성이 저하되면서 직원의 많은 시간이 소요됩니다. 머신러닝을 사용하면 데이터가 확장하는 동시에 조직에서 인사이트를 빠르게 도출할 수 있습니다.

신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Gemini Enterprise 에이전트 플랫폼 및 기타 Google Cloud 제품을 사용해 볼 수 있습니다.

7:07

Google Cloud의 머신러닝

머신러닝 정의

머신러닝은 인공지능의 하위 집합으로, 많은 양의 데이터를 제공하여 명시적으로 프로그래밍하지 않고 신경망과 딥 러닝을 사용하여 시스템이 자율적으로 학습하고 개선할 수 있게 해줍니다.

머신러닝을 통해 컴퓨터 시스템은 더 많은 '경험'을 쌓으면서 스스로 지속적으로 조정하고 향상시킬 수 있습니다. 따라서 처리할 더 크고 다양한 데이터 세트를 제공함으로써 이러한 시스템의 성능을 향상시킬 수 있습니다.

머신러닝의 중요성

데이터 생성 속도가 빨라지면서 그 어느 때보다 많은 데이터가 생성되고 있으며, 머신러닝은 이 방대한 양의 데이터를 분석하고 가치를 발견할 수 있도록 도와줍니다. 따라서 머신러닝은 인간이 컴퓨터 및 기타 기계로 할 수 있는 일의 완전히 새로운 영역을 열어가고 있습니다. 머신러닝은 사기 감지, 보안 위협 식별, 맞춤설정 및 추천, 챗봇을 통한 자동화된 고객 서비스, 스크립트 작성 및 번역, 데이터 분석 등과 같은 중요한 기능을 통해 비즈니스에 도움을 줍니다. 머신러닝은 자율 주행 차량, 드론, 비행기, 증강 현실 및 가상 현실, 로봇 공학과 같은 미래의 흥미로운 혁신을 주도하고 있습니다.

머신러닝, 인공지능, 딥 러닝의 차이점은 무엇인가요?

인공지능(AI)과 머신러닝(ML)은 동의어로 사용되는 경우가 많지만 서로 바꿔 사용할 수 있는 용어는 아닙니다.

인공지능은 인간의 지능과 유사한 방식으로 추론하고, 학습하고, 행동할 수 있는 컴퓨터 및 기계 또는 인간이 분석할 수 있는 규모를 넘어서는 데이터를 포함하는 시스템을 구축하는 것과 관련된 컴퓨터 과학의 한 영역입니다. 이 분야에는 데이터 분석, 통계, 하드웨어 및 소프트웨어 엔지니어링, 신경과학, 심지어 철학을 포함한 다양한 학문이 포함됩니다.

인공지능이 컴퓨터 공학의 광범위한 범주에 해당하는 반면, 머신러닝은 특별히 프로그래밍되지 않은 상태에서 특정 작업을 실행하도록 머신을 학습시키는 AI 응용 분야입니다. 머신러닝은 신경망, 지도 및 비지도 학습, 결정 트리, 선형 회귀와 같은 기술을 통해 데이터에서 지식을 추출하는 수단으로 보다 명시적으로 사용됩니다.

머신러닝이 인공지능의 하위 집합인 것처럼 딥 러닝도 머신러닝의 하위 집합입니다. 딥 러닝은 데이터 세트에 대해 신경망을 학습시키는 방식으로 작동합니다. 신경망은 데이터를 분류하고 분석하는 데 사용되는 계산 노드인 인공 뉴런 시스템을 사용하는 모델입니다. 데이터는 신경망의 첫 번째 레이어에 제공되며 각 노드에서 결정을 내린 후 이 정보를 다음 레이어의 여러 노드에 전달합니다. 레이어가 3개 넘게 있는 학습 모델을 '심층신경망' 또는 '딥 러닝'이라고 합니다. 일부 최신 신경망에는 레이어가 수백 또는 수천 개 있습니다.

머신러닝은 어떻게 작동되나요?

머신러닝은 패턴 식별 또는 객체 인식과 같은 예상 결과를 달성하기 위해 데이터 세트에 대한 알고리즘을 학습시키는 방식으로 작동합니다. 머신러닝은 모델을 최적화하여 학습 데이터 샘플을 기반으로 올바른 응답을 예측할 수 있도록 하는 프로세스입니다.

학습 데이터의 품질이 높다고 가정할 경우 머신러닝 알고리즘에서 더 많은 학습 샘플을 받을수록 모델의 정확도가 높아집니다. 알고리즘은 학습 중에 '접합 프로세스'라고 하는 과정에서 모델을 데이터에 맞춥니다. 이 프로세스에는 손실 함수를 사용하여 모델의 오류를 측정하고 경사하강법과 같은 최적화 기법을 사용하여 모델의 파라미터를 조정하고 이러한 오류를 최소화하는 작업이 포함됩니다. 결과가 예상과 맞지 않으면 정확한 응답을 출력할 때까지 알고리즘이 계속 재학습됩니다. 본질적으로 알고리즘은 데이터를 통해 학습하고 입력 및 응답이 줄, 클러스터 또는 기타 통계적 상관관계에 적합한지 여부에 따라 결과에 도달합니다.

머신러닝의 유형

다양한 유형의 머신러닝에 대해 이야기할 때는 실제로 사용되는 학습 모델에 대해 이야기하는 것입니다. 크게 네 가지 유형의 머신러닝 모델이 사용됩니다.

지도 학습은 라벨이 지정된 학습 데이터(구조화된 데이터)를 사용하여 특정 기능을 라벨에 매핑하는 머신러닝 모델입니다. 지도 학습에서는 출력이 알려져 있고(예: 사과 그림 인식) 모델은 알려진 출력 데이터로 학습됩니다. 간단히 말해 사과 사진을 인식하도록 알고리즘을 훈련시키려면 사과라는 라벨이 지정된 사진을 입력합니다. 오늘날 가장 일반적으로 사용되는 지도 학습 알고리즘은 다음과 같습니다.

선형 회귀
다항식 회귀
K-최근접 이웃
나이브 베이즈
결정 트리

비지도 학습은 라벨이 지정되지 않은 데이터(비정형 데이터)를 사용하여 패턴을 학습하는 머신러닝 모델입니다. 지도 학습과 달리 출력의 '정확성'은 사전에 알 수 없습니다. 오히려 알고리즘은 사람의 정보 입력 없이 데이터 로부터 학습하여(따라서 비지도 학습) 속성을 기반으로 한 그룹으로 분류합니다. 예를 들어 알고리즘에 사과와 바나나 사진이 주어지면 어떤 사진이 사과이고 어떤 사진이 바나나인지 스스로 분류합니다. 비지도 학습은 설명 모델링과 패턴 일치에 우수합니다. 오늘날 가장 일반적으로 사용되는 비지도 학습 알고리즘은 다음과 같습니다.

퍼지 의미
K-평균 클러스터링
계층적 군집화
부분 최소자승법

일부 데이터에만 라벨이 지정되는 준지도 학습이라는 머신러닝에 대한 혼합 접근방식도 있습니다. 준지도 학습에서 알고리즘은 알려진 결과를 얻기 위해 데이터를 구성하고 구조화하는 방법을 파악해야 합니다. 예를 들어 머신러닝 모델은 결과가 배라고 하지만 일부 학습 데이터에만 배로 라벨이 지정됩니다.

강화 학습은 일련의 시행착오 실험을 통해 '실습하여 학습'하는 것으로 설명할 수 있는 머신러닝 모델입니다. '에이전트'는 성능이 원하는 범위 내에 있을 때까지 피드백 루프를 통해 정의된 태스크를 수행하는 방법을 학습합니다. 에이전트는 작업을 잘 수행할 때 긍정적인 강화를 받고 제대로 수행하지 않을 때는 부정적인 강화를 받습니다. 강화 학습의 한 예는 Google 연구자들이 바둑 게임을 플레이하도록 강화 학습 알고리즘을 학습시킨 경우입니다. 이 모델은 바둑 규칙에 대한 사전 지식이 없었고 단순히 바둑돌을 무작위로 이동하며 가장 좋은 동작을 '학습'했습니다. 알고리즘은 머신러닝 모델이 게임에서 인간 플레이어를 이길 수 있을 정도로 긍정적인 강화 및 부정적인 강화를 통해 학습되었습니다.

머신러닝의 장점

패턴 인식

머신러닝 알고리즘이 소비하는 데이터가 많을수록 해당 데이터에서 추세와 패턴을 더 잘 찾을 수 있습니다. 예를 들어 전자상거래 웹사이트에서는 머신러닝을 사용하여 사람들이 사이트에서 쇼핑하는 방식을 파악하고 해당 정보를 사용하여 사용자에게 더 나은 추천을 제공하거나 새로운 제품 기회로 이어질 수 있는 트렌드 데이터를 찾을 수 있습니다.

자동화

머신러닝과 인공지능은 노동자의 반복되는 지루한 작업을 상당 부분 덜어줄 수 있습니다. 로봇 프로세스 자동화와 같은 유틸리티는 사람들이 더 의미 있는 작업을 수행하지 못하도록 방해하는 지루한 비즈니스 작업 중 일부를 수행할 수 있습니다. 컴퓨터 비전 및 객체 감지 알고리즘을 사용하면 로봇이 조립 라인에서 상품을 선택하고 포장하는 데 도움이 됩니다. 상시 작동하는 사기 감지 및 위협 평가 머신러닝은 보안 결함이 문제가 되기 전에 찾아낼 수 있습니다.

지속적 개선

적절한 데이터 종류가 제공되는 경우 머신러닝 알고리즘은 계속해서 더 빠르고 정확하게 개선될 것입니다. 이러한 개선은 새로운 데이터로 유지되고 사용자로부터 실제 피드백을 받는 등 몇 가지 주요 방식으로 이루어질 수 있습니다.

머신러닝의 잠재적 과제

잠재 편향

머신러닝의 성능은 입력되는 데이터에 좌우되는만큼 머신러닝 알고리즘에 편향된 데이터 세트를 입력하면 편향된 결과가 제공됩니다.

데이터 획득

머신러닝이 유용하게 사용되기 위해서는 많은 데이터가 필요할 수 있습니다. 많은 머신러닝 사용 사례가 지도 학습을 기반으로 하므로 정형 데이터를 획득하고 정리하여 알고리즘을 학습시키는 것은 중요한 첫 번째 단계이며, 이는 데이터가 조직 내에서 고립된 여러 위치에 있는 경우 어려울 수 있습니다.

필요한 기술 전문지식

머신러닝, 인공지능, 클라우드 공급업체는 머신러닝 알고리즘을 최대한 쉽게 설정하고 실행할 수 있도록 노력하고 있지만, 조직에서는 프로그래머와 데이터 과학자가 학습 알고리즘과 그 결과를 이해하고 활용해야 하는 경우가 많습니다.

리소스 집약적

머신러닝에는 많은 시간이 소요될 수 있으며 데이터 처리 시작부터 결과를 얻을 때까지 많은 컴퓨팅 리소스와 직원의 시간이 필요할 수 있습니다.

Google Cloud로 비즈니스 문제 해결

신규 고객에게는 Google Cloud에서 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

Google Cloud 영업 전문가와 고유한 문제에 대해 자세히 논의해 보세요.

머신러닝 용도

일반적인 머신러닝 사용 사례는 다음과 같습니다.

로보틱 처리 자동화(RPA)

머신러닝과 결합된 RPA는 주택담보대출 신청 처리와 같은 복잡한 작업을 자동화할 수 있는 지능형 자동화를 제공합니다. Google Cloud는 API 관리를 위한 Apigee, 로우 코드 개발을 위한 AppSheet, 머신러닝 워크플로를 위한 Agent Platform 등 RPA와 함께 사용할 수 있는 여러 제품을 제공합니다.

판매 최적화

고객 데이터는 고객 감정 분석, 판매 예측 분석, 고객 이탈 예측을 위한 머신러닝 알고리즘을 학습시킬 수 있습니다. 데이터 웨어하우징을 위한 BigQuery, 데이터 시각화를 위한 Looker, 머신러닝 모델 빌드 및 배포를 위한 Agent Platform과 같은 도구를 사용하면 영업 프로세스를 최적화하는 데 도움이 됩니다.

고객 서비스

머신러닝 어플리케이션에는 일상적인 고객 서비스 작업을 자동화하고 문제를 빠르게 해결하는 챗봇 및 자동화된 가상 어시스턴트가 포함되어 있습니다. Dialogflow는 웹사이트, 모바일 앱, 기기를 위한 대화형 인터페이스를 만들 수 있도록 지원합니다. Contact Center AI는 고객 서비스 운영을 개선하는 데에도 사용할 수 있습니다.

보안

머신러닝은 기업에서 위협 분석 기능과 사이버 공격, 해커, 멀웨어에 대응하는 방식을 개선하는 데 도움이 됩니다. Google Cloud Security Command Center(SCC)는 Google Cloud 리소스 전반의 보안 및 위험에 대한 통합된 뷰를 제공합니다. Google Cloud Armor는 위협으로부터 웹 애플리케이션을 보호하고 Chronicle SIEM은 위협 탐지 및 조사에 도움이 됩니다.

디지털 마케팅

마케팅 담당자는 머신러닝을 통해 신규 고객을 파악하고 적재적소에 적합한 마케팅 자료를 제공할 수 있습니다. BigQuery ML 및 Agent Platform과 같이 Google Ads 및 Google 애널리틱스 360과 통합되는 마케팅 분석 솔루션을 사용하면 맞춤형 마케팅을 위한 커스텀 머신러닝 모델을 빌드할 수 있습니다.

사기 예방

신용카드 회사 및 은행은 머신러닝의 도움을 받아 방대한 양의 트랜잭션 데이터를 검토하여 의심스러운 활동을 실시간으로 식별합니다. reCAPTCHA Enterprise는 허위 행위로부터 웹사이트와 모바일 앱을 보호합니다. 또한 Google Cloud는 Swift와 협력하여 고급 AI와 제휴 학습을 활용하는 사기 방지 기술을 개발하고 있습니다.