Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

Daten lesen

Für den Zugriff auf in Cloud Storage gespeicherte Genom-Daten können Sie die Google-Implementierung des htsget-Protokolls der Global Alliance for Genomics and Health verwenden.

Mit der htsget-Implementierung von Google können Sie auf Daten in Ihren eigenen Cloud-Projekten zugreifen und diese freigeben, ohne große Dateien von und auf Compute Engine-VMs kopieren zu müssen.

Sie können auch den htsget-Server verwenden und auf Daten aus öffentlichen Quellen, wie den von Google gehosteten Mirror des 1.000 Genome-Projekts, zugreifen.

Führen Sie in Cloud Shell die folgenden Befehle aus, um das Protokoll mit öffentlichen Daten auszuprobieren:

docker network create test
docker run -d --network=test --name=htsget gcr.io/genomics-tools/htsget

Dieser Befehl startet den laufenden htsget-Server und hängt ihn an ein lokales Docker-Container-Netzwerk namens "test" an. Sobald der Server gestartet wurde, können Sie mit jeder Software darauf zugreifen, die das GA4GH-Protokoll "htsget" verwendet.

Der folgende Befehl verwendet zum Beispiel "samtools", um Statistiken zu einem kleinen Bereich auf Chromosom 11 eines öffentlichen Genoms anzuzeigen:

docker run --network=test gcr.io/genomics-tools/samtools flagstat "http://htsget/reads/genomics-public-data/platinum-genomes/bam/NA12892_S1.bam?referenceName=chr11&end=1000"

In nur wenigen Sekunden sollten Sie feststellen, dass samtools etwas mehr als 1.500 Lesevorgänge verarbeitet hat, die aus der in Cloud Storage gespeicherten BAM-Datei gestreamt wurden:

1532 + 0 in total (QC-passed reads + QC-failed reads)
0 + 0 secondary
0 + 0 supplementary
5 + 0 duplicates
1526 + 0 mapped (99.61% : N/A)
1532 + 0 paired in sequencing
784 + 0 read1
748 + 0 read2
1510 + 0 properly paired (98.56% : N/A)
1520 + 0 with itself and mate mapped
6 + 0 singletons (0.39% : N/A)
10 + 0 with mate mapped to a different chr
1 + 0 with mate mapped to a different chr (mapQ>=5)

Weitere Informationen zum htsget-Server, einschließlich Informationen zum Zugriff auf private Daten und zur Einschränkung des Zugriffs auf Ihre Daten, finden Sie in der README-Datei zu htsget.