Pub/Sub 라이트는 저렴한 비용으로 설계된 실시간 메시징 서비스로 Pub/Sub에 비해 안정성이 낮습니다. Pub/Sub 라이트는 스토리지를 위한 영역 및 리전 주제를 제공합니다.
Pub/Sub 라이트 Spark 커넥터는 기본 마이크로 일괄 처리 및 실험용 지속적 처리 모드에서 Apache Spark Structured Streaming에 대한 입력 소스로 Pub/Sub 라이트를 지원합니다.
Dataproc에서 Pub/Sub 라이트 사용
자바
GitHub의 java-pubsublite-spark
저장소에 있는 samples
디렉터리에는 Dataproc과 함께 Pub/Sub 라이트를 사용하는 자바의 Spark 예시가 포함되어 있습니다. 예시를 실행하려면 Spark 예시의 지침을 따르세요.
- 시작하려면
java-pubsublite-spark
GitHub 저장소를 클론합니다.git clone https://github.com/googleapis/java-pubsublite-spark cd java-pubsublite-spark/samples
Python/Scala
커넥터는 Maven Central repository에서 사용할 수 있습니다.
spark-submit 명령어를 사용하는 경우 --packages
옵션을 통해 다운로드하여 제공하거나 spark.jars.packages 구성 속성을 통해 설정할 수 있습니다.
추가 정보
- Pub/Sub 라이트에서 데이터를 읽고 쓰기 위해 Dataproc 클러스터에서 Python 스크립트를 실행하는 빠른 시작인 Apache Spark로 Pub/Sub 라이트 사용을 참조하세요.
- 여기에서 Pub/Sub 라이트 Spark 커넥터 버전을 선택한 후 링크된 페이지에서 JAR을 다운로드합니다.