오늘날의 기업에는 데이터가 넘칠 정도로 많은 상황입니다. 더 나은 비즈니스 결정을 내리려면 이러한 데이터를 이해해야 합니다. 하지만 볼륨이 너무 복잡하면 기존 도구를 사용하여 데이터를 분석하기 어렵습니다. 데이터에서 패턴과 유용한 정보를 찾기 위한 분석 모델을 빌드, 테스트, 반복, 배포하면 확장성이 저하되면서 직원의 많은 시간이 소요됩니다. 머신러닝을 사용하면 조직에서 데이터가 확장됨에 따라 빠르게 유용한 정보를 도출할 수 있습니다.
신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Vertex AI 및 기타 Google Cloud 제품을 사용해 볼 수 있습니다.
머신러닝은 인공지능의 하위 집합으로, 많은 양의 데이터를 제공하여 명시적으로 프로그래밍하지 않고 신경망과 딥 러닝을 사용하여 시스템이 자율적으로 학습하고 개선할 수 있게 해줍니다.
머신러닝을 통해 컴퓨터 시스템은 더 많은 '경험'을 쌓으면서 스스로 지속적으로 조정하고 향상시킬 수 있습니다. 따라서 처리할 더 크고 다양한 데이터 세트를 제공함으로써 이러한 시스템의 성능을 향상시킬 수 있습니다.
머신러닝은 거의 모든 산업 및 비즈니스 활동에서 사용되고 있습니다. 머신러닝은 물류 업계에서 발송 및 배송 경로를 최적화하는 데 도움이 되고, 소매업계는 쇼핑 경험을 맞춤설정하고 재고를 관리하며, 제조업체에서는 공장을 자동화하고, 모든 곳에서 조직의 보안을 유지하는 데 도움을 줍니다. 사용자가 음성을 사용해 스마트폰이나 스피커에 쿼리하면 머신러닝이 요청을 이해하고 결과를 찾는 데 도움을 줍니다. 머신러닝의 사용 사례 범위는 방대하며 끊임없이 확장되고 있습니다.
데이터 생성 속도는 날로 빨라지고 있습니다. 전 세계는 그 어느 때보다 많은 데이터를 생성하고 있습니다. 머신러닝 없이는 이 모든 데이터를 분석하고 활용하는 것이 거의 불가능할 것입니다. 따라서 머신러닝은 인간이 컴퓨터 및 기타 기계로 할 수 있는 일의 완전히 새로운 영역을 열어가고 있습니다. 머신러닝은 사기 감지, 보안 위협 식별, 맞춤설정 및 추천, 챗봇을 통한 자동화된 고객 서비스, 스크립트 작성 및 번역, 데이터 분석 등과 같은 중요한 기능을 통해 비즈니스에 도움을 줍니다. 또한 머신러닝은 자율 주행 차량, 드론, 비행기, 증강 현실과 가상 현실, 로봇공학과 같은 미래의 흥미진진한 혁신을 주도하고 있습니다.
인공지능(AI)과 머신러닝(ML)은 동의어로 사용되는 경우가 많지만 서로 바꿔 사용할 수 있는 용어는 아닙니다.
인공지능은 인간의 지능과 유사한 방식으로 추론하고, 학습하고, 행동할 수 있는 컴퓨터 및 기계 또는 인간이 분석할 수 있는 규모를 넘어서는 데이터를 포함하는 시스템을 구축하는 것과 관련된 컴퓨터 과학의 한 영역입니다. 이 분야에는 데이터 분석, 통계, 하드웨어 및 소프트웨어 엔지니어링, 신경과학, 심지어 철학을 포함한 다양한 학문이 포함됩니다.
인공지능이 컴퓨터 공학의 광범위한 범주에 해당하는 반면, 머신러닝은 특별히 프로그래밍되지 않은 상태에서 특정 작업을 실행하도록 머신을 학습시키는 AI 응용 분야입니다. 머신러닝은 신경망, 지도 및 비지도 학습, 결정 트리, 선형 회귀와 같은 기술을 통해 데이터에서 지식을 추출하는 수단으로 보다 명시적으로 사용됩니다.
머신러닝이 인공지능의 하위 집합인 것처럼 딥 러닝도 머신러닝의 하위 집합입니다. 딥 러닝은 데이터 세트에 대해 신경망을 학습시키는 방식으로 작동합니다. 신경망은 데이터를 분류하고 분석하는 데 사용되는 계산 노드인 인공 뉴런 시스템을 사용하는 모델입니다. 데이터는 신경망의 첫 번째 레이어에 제공되며 각 노드에서 결정을 내린 후 이 정보를 다음 레이어의 여러 노드에 전달합니다. 레이어가 3개 넘게 있는 학습 모델을 '심층신경망' 또는 '딥 러닝'이라고 합니다. 일부 최신 신경망에는 레이어가 수백 또는 수천 개 있습니다.
머신러닝은 패턴 식별 또는 객체 인식과 같은 예상 결과를 달성하기 위해 데이터 세트에 대한 알고리즘을 학습시키는 방식으로 작동합니다. 머신러닝은 모델을 최적화하여 학습 데이터 샘플을 기반으로 올바른 응답을 예측할 수 있도록 하는 프로세스입니다.
학습 데이터의 품질이 높다고 가정할 경우 머신러닝 알고리즘에서 더 많은 학습 샘플을 받을수록 모델의 정확도가 높아집니다. 이 알고리즘은 학습 중에 '접합 프로세스'를 통해 모델을 데이터에 맞춥니다. 결과가 예상과 맞지 않으면 정확한 응답을 출력할 때까지 알고리즘이 계속 재학습됩니다. 본질적으로 알고리즘은 데이터를 통해 학습하고 입력 및 응답이 줄, 클러스터 또는 기타 통계적 상관관계에 적합한지 여부에 따라 결과에 도달합니다.
머신러닝에서 학습 데이터란 무엇인가요? 사용 중인 머신러닝 모델의 유형에 따라 다릅니다.
크게 세 가지 유형의 머신러닝 모델이 사용됩니다.
지도 학습은 라벨이 지정된 학습 데이터(구조화된 데이터)를 사용하여 특정 기능을 라벨에 매핑하는 머신러닝 모델입니다. 지도 학습에서는 출력이 알려져 있고(예: 사과 그림 인식) 모델은 알려진 출력 데이터로 학습됩니다. 간단히 말해 사과 사진을 인식하도록 알고리즘을 훈련시키려면 사과라는 라벨이 지정된 사진을 입력합니다.
오늘날 가장 일반적인 지도 학습 알고리즘은 다음과 같습니다.
비지도 학습은 라벨이 지정되지 않은 데이터(비정형 데이터)를 사용하여 패턴을 학습하는 머신러닝 모델입니다. 지도 학습과 달리 출력의 '정확성'은 미리 알 수 없습니다. 오히려 알고리즘은 사람의 정보 입력 없이 데이터 로부터 학습하여(따라서 비지도 학습) 속성을 기반으로 한 그룹으로 분류합니다. 예를 들어 알고리즘에 사과와 바나나 사진이 주어지면 어떤 사진이 사과이고 어떤 사진이 바나나인지 스스로 분류합니다. 비지도 학습은 설명 모델링과 패턴 일치에 우수합니다.
오늘날 가장 일반적인 비지도 학습 알고리즘은 다음과 같습니다.
일부 데이터에만 라벨을 지정하는 준지도 학습이라는 혼합된 머신러닝 접근 방식도 있습니다. 준지도 학습에서 알고리즘은 알려진 결과를 얻기 위해 데이터를 구성하고 구조화하는 방법을 파악해야 합니다. 예를 들어 머신러닝 모델은 결과가 배라고 하지만 일부 학습 데이터에만 배로 라벨이 지정됩니다.
강화 학습은 일련의 시행착오 실험을 통해 '실습하여 학습'하는 것으로 설명할 수 있는 머신러닝 모델입니다. '에이전트'는 성능이 원하는 범위 내에 있을 때까지 피드백 루프를 통해 정의된 태스크를 수행하는 방법을 학습합니다. 에이전트는 작업을 잘 수행할 때 긍정적인 강화를 받고 제대로 수행하지 않을 때는 부정적인 강화를 받습니다. 강화 학습의 한 예는 Google 연구자들이 바둑 게임을 플레이하도록 강화 학습 알고리즘을 학습시킨 경우입니다. 이 모델은 바둑 규칙에 대한 사전 지식이 없었고 단순히 바둑돌을 무작위로 이동하며 가장 좋은 동작을 '학습'했습니다. 알고리즘은 머신러닝 모델이 게임에서 인간 플레이어를 이길 수 있을 정도로 긍정적인 강화 및 부정적인 강화를 통해 학습되었습니다.
패턴 인식
머신러닝 알고리즘에서 사용하는 데이터가 많을수록 해당 데이터에서 트렌드와 패턴을 더 잘 찾을 수 있습니다. 예를 들어 전자상거래 웹사이트에서는 머신러닝을 사용하여 사람들이 사이트에서 쇼핑하는 방식을 파악하고 해당 정보를 사용하여 사용자에게 더 나은 추천을 제공하거나 새로운 제품 기회로 이어질 수 있는 트렌드 데이터를 찾을 수 있습니다.
자동화
머신러닝과 인공지능은 노동자의 반복되는 지루한 작업을 상당 부분 덜어줄 수 있습니다. 로봇 프로세스 자동화와 같은 유틸리티는 사람들이 더 의미 있는 작업을 수행하지 못하도록 방해하는 지루한 비즈니스 작업 중 일부를 수행할 수 있습니다. 컴퓨터 비전 및 객체 감지 알고리즘을 사용하면 로봇이 조립 라인에서 상품을 선택하고 포장하는 데 도움이 됩니다. 상시 사용되는 사기 감지 및 위협 평가 머신 러닝은 보안 결함이 문제가 되기 전에 찾아낼 수 있습니다.
지속적 개선
적절한 데이터 종류가 제공되는 경우 머신러닝 알고리즘은 계속해서 더 빠르고 정확하게 개선될 것입니다. 텍스트 생성 방식을 지속적으로 개선하는 GPT-3 데이터 세트가 좋은 예입니다.
잠재 편향
머신러닝은 입력되는 데이터의 품질에 달려있는 만큼 머신러닝 알고리즘에 편향된 데이터 세트를 입력하면 편향된 결과가 제공됩니다.
데이터 획득
머신러닝이 유용하게 사용되기 위해서는 많은 데이터가 필요할 수 있습니다. 많은 머신러닝 사용 사례가 지도 학습을 기반으로 하므로 정형 데이터를 획득하고 정리하여 알고리즘을 학습시키는 것은 중요한 첫 번째 단계이며, 이는 데이터가 조직 내에서 고립된 여러 위치에 있는 경우 어려울 수 있습니다.
필요한 기술 전문지식
머신러닝, 인공지능, 클라우드 공급업체는 머신러닝 알고리즘을 최대한 쉽게 설정하고 실행할 수 있도록 노력하고 있지만, 조직에서는 학습 알고리즘과 그 결과를 이해하고 활용하기 위해 프로그래머와 데이터 과학자가 필요한 경우가 많습니다.
리소스 집약적
머신러닝에는 많은 시간이 소요될 수 있으며 데이터 처리 시작부터 결과를 얻을 때까지 많은 컴퓨팅 리소스와 직원의 시간이 필요할 수 있습니다.
다음은 머신러닝이 사용되는 몇 가지 예입니다.
로보틱 처리 자동화
머신러닝을 활용하는 RPA는 주택담보대출 처리 애플리케이션과 같은 복잡한 작업을 자동화할 수 있는 지능형 자동화를 제공합니다.
판매 최적화
고객 데이터는 고객 감정 분석, 판매 예측 분석, 고객 이탈 예측을 위한 머신러닝 알고리즘을 학습시킬 수 있습니다.
고객 서비스
머신러닝 어플리케이션에는 일상적인 고객 서비스 작업을 자동화하고 문제를 빠르게 해결하는 챗봇 및 자동화된 가상 어시스턴트가 포함되어 있습니다.
보안
머신러닝은 기업에서 위협 분석 기능과 사이버 공격, 해커, 멀웨어에 대응하는 방식을 개선하는 데 도움이 됩니다.
디지털 마케팅
마케팅 담당자는 머신러닝을 통해 신규 고객을 파악하고 적재적소에 적합한 마케팅 자료를 제공할 수 있습니다.
사기 예방
신용카드 회사 및 은행은 머신러닝의 도움을 받아 방대한 양의 트랜잭션 데이터를 검토하여 의심스러운 활동을 실시간으로 식별합니다.