Google 머신러닝을 사용하여 비정형 텍스트에서 유용한 정보를 도출할 수 있습니다.
신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Google Cloud 제품을 사용해 볼 수 있습니다
텍스트를 추출, 분석, 저장하는 머신러닝으로 유용한 텍스트 분석을 수행할 수 있습니다.
AutoML을 사용하면 코드를 한 줄도 작성하지 않고도 고품질 머신러닝 커스텀 모델을 학습시킬 수 있습니다.
Natural Language API를 사용하여 앱에 자연어 이해(NLU)를 적용할 수 있습니다.
이점
항목 분석을 사용해 이메일, 채팅, 소셜 미디어와 같은 문서의 필드를 찾아 라벨을 지정한 후 감정 분석으로 고객 의견을 이해하여 제품 및 UX 인사이트를 파악할 수 있습니다.
Natural Language를 Speech-to-Text API와 함께 사용하면 오디오에서 유용한 정보를 추출할 수 있습니다. Vision API는 스캔한 문서에 대한 광학 문자 인식(OCR) 기능을 추가하며, Translation API를 사용하면 다국어로 작성된 감정을 이해할 수 있습니다.
Google의 최첨단 언어 기술을 사용하여 미디어 전반에서 콘텐츠를 분류함으로써 더 나은 콘텐츠 추천과 광고 타겟팅을 제공합니다.
데모
API 사용해 보기
주요 특징
Natural Language API의 강력한 선행 학습된 모델은 감정 분석, 항목 분석, 항목 감정 분석, 콘텐츠 분류 및 구문 분석 등의 기능을 통해 개발자가 애플리케이션에 자연어 이해(NLU)를 쉽게 적용할 수 있도록 지원합니다.
비정형 의료 텍스트에 저장된 정보를 실시간으로 분석할 수 있습니다. Healthcare Natural Language API를 사용하면 의료 문서에서 머신이 읽을 수 있는 유용한 의료 정보를 추출할 수 있으며, Healthcare용 AutoML Entity Extraction을 사용하면 코딩 기술이 없어도 의료 및 생명 과학 앱을 위한 커스텀 지식 추출 모델을 간편하게 빌드할 수 있습니다.
문서
이 실습에서는 API 키를 생성하고 Cloud Natural Language API를 사용하여 텍스트 스니펫에서 '항목'(예: 사람, 장소, 이벤트)을 추출하는 방법을 알아봅니다.
통합된 REST API
REST API를 통해 Natural Language를 사용할 수 있습니다. 텍스트를 요청으로 업로드하거나 Cloud Storage와 통합할 수 있습니다.
구문 분석
토큰과 문장을 추출하고 품사를 식별하며 각 문장의 의존성 파싱 트리를 만듭니다.
항목 분석
영수증, 인보이스, 계약서 등 문서 속 항목을 식별하고 날짜, 인물, 미디어 등의 유형에 따라 라벨을 지정합니다.
커스텀 항목 추출
문서 속 항목을 식별하고 분야별 키워드 또는 문구에 따라 라벨을 지정합니다.
감정 분석
텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도 감정을 파악합니다.
커스텀 감정 분석
분야별 감정 점수에 맞춰 텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도를 파악합니다.
콘텐츠 분류
700개 이상의 사전 정의된 카테고리로 문서를 분류합니다.
커스텀 콘텐츠 분류
자체 학습 데이터를 사용하여 고유한 사용 사례에 맞게 모델을 맞춤설정할 수 있는 라벨을 만듭니다.
다국어 지원
한국어, 독일어, 러시아어, 스페인어, 영어, 이탈리아어, 일본어, 중국어(간체 및 번체), 포르투갈어, 프랑스어로 작성된 텍스트를 분석합니다.
커스텀 모델
최소한의 수고와 머신러닝 지식만으로 커스텀 머신러닝 모델을 학습시킬 수 있습니다.
Google의 AutoML 모델로 구동
Google의 최첨단 AutoML 기술을 활용하여 고품질 모델을 생성합니다.
공간 구조에 대한 이해
PDF의 구조 및 레이아웃 정보를 사용하여 커스텀 항목 추출 성능을 개선합니다.
대규모 데이터 세트 지원
5,000개의 분류 라벨, 100만 개의 문서, 10MB의 문서 크기가 지원되므로 복잡한 사용 사례에 대응할 수 있습니다.
통합된 REST API
REST API를 통해 Natural Language를 사용할 수 있습니다. 텍스트를 요청으로 업로드하거나 Cloud Storage와 통합할 수 있습니다.
구문 분석
토큰과 문장을 추출하고 품사를 식별하며 각 문장의 의존성 파싱 트리를 만듭니다.
항목 분석
영수증, 인보이스, 계약서 등 문서 속 항목을 식별하고 날짜, 인물, 미디어 등의 유형에 따라 라벨을 지정합니다.
커스텀 항목 추출
문서 속 항목을 식별하고 분야별 키워드 또는 문구에 따라 라벨을 지정합니다.
감정 분석
텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도 감정을 파악합니다.
커스텀 감정 분석
분야별 감정 점수에 맞춰 텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도를 파악합니다.
콘텐츠 분류
700개 이상의 사전 정의된 카테고리로 문서를 분류합니다.
커스텀 콘텐츠 분류
자체 학습 데이터를 사용하여 고유한 사용 사례에 맞게 모델을 맞춤설정할 수 있는 라벨을 만듭니다.
다국어 지원
한국어, 독일어, 러시아어, 스페인어, 영어, 이탈리아어, 일본어, 중국어(간체 및 번체), 포르투갈어, 프랑스어로 작성된 텍스트를 분석합니다.
커스텀 모델
최소한의 수고와 머신러닝 지식만으로 커스텀 머신러닝 모델을 학습시킬 수 있습니다.
Google의 AutoML 모델로 구동
Google의 최첨단 AutoML 기술을 활용하여 고품질 모델을 생성합니다.
공간 구조에 대한 이해
PDF의 구조 및 레이아웃 정보를 사용하여 커스텀 항목 추출 성능을 개선합니다.
대규모 데이터 세트 지원
5,000개의 분류 라벨, 100만 개의 문서, 10MB의 문서 크기가 지원되므로 복잡한 사용 사례에 대응할 수 있습니다.
통합된 REST API
REST API를 통해 Natural Language를 사용할 수 있습니다. 텍스트를 요청으로 업로드하거나 Cloud Storage와 통합할 수 있습니다.
구문 분석
토큰과 문장을 추출하고 품사를 식별하며 각 문장의 의존성 파싱 트리를 만듭니다.
항목 분석
영수증, 인보이스, 계약서 등 문서 속 항목을 식별하고 날짜, 인물, 미디어 등의 유형에 따라 라벨을 지정합니다.
커스텀 항목 추출
문서 속 항목을 식별하고 분야별 키워드 또는 문구에 따라 라벨을 지정합니다.
감정 분석
텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도 감정을 파악합니다.
커스텀 감정 분석
분야별 감정 점수에 맞춰 텍스트 블록에 표현된 전반적인 의견, 느낌 또는 태도를 파악합니다.
콘텐츠 분류
700개 이상의 사전 정의된 카테고리로 문서를 분류합니다.
커스텀 콘텐츠 분류
자체 학습 데이터를 사용하여 고유한 사용 사례에 맞게 모델을 맞춤설정할 수 있는 라벨을 만듭니다.
다국어 지원
한국어, 독일어, 러시아어, 스페인어, 영어, 이탈리아어, 일본어, 중국어(간체 및 번체), 포르투갈어, 프랑스어로 작성된 텍스트를 분석합니다.
커스텀 모델
최소한의 수고와 머신러닝 지식만으로 커스텀 머신러닝 모델을 학습시킬 수 있습니다.
Google의 AutoML 모델로 구동
Google의 최첨단 AutoML 기술을 활용하여 고품질 모델을 생성합니다.
공간 구조에 대한 이해
PDF의 구조 및 레이아웃 정보를 사용하여 커스텀 항목 추출 성능을 개선합니다.
대규모 데이터 세트 지원
5,000개의 분류 라벨, 100만 개의 문서, 10MB의 문서 크기가 지원되므로 복잡한 사용 사례에 대응할 수 있습니다.