Intervall-JOINs mit BigQuery ausführen

Sie können BigQuery verwenden, um eine JOIN-Abfrage über Varianten mit Daten durchzuführen, die durch Intervalle in Genomregionen – sogenannte Überlappungen (Overlaps) – beschrieben werden. Auf dieser Seite wird gezeigt, wie Sie mithilfe einer komplexen JOIN-Abfrage anhand einer Liste mit Genbezeichnungen

  • Suchen Sie die seltenen SNPs, die die Gene überlappen.
  • 100.000 Basispaare auf beiden Seiten eines Gens für die gesamten Genombeispiele finden.

In dieser Anleitung werden Beispiele für drei Abfragen aufgeführt. Jede Abfrage zeigt, wie BigQuery für verschiedene Mengen von genomischen Daten eine Skalierung ausführt:

Die Daten stammen aus der Tabelle der Tune Genomics-Annotation (9 Milliarden Zeilen) und dem Illumina Platinum Genomes-Dataset. Weitere Informationen zu diesen Datasets finden Sie hier:

Inline-Tabelle abfragen

Im folgenden Beispiel wird die in der Abfrage definierte Intervalltabelle verwendet, die alsintervals . Außerdem erfahren Sie, wie SieJOIN Abfrage mit einer Tabelle, die Varianten aus Illumina Platinum Genomes:

  1. Rufen Sie in der Cloud Console die Seite "BigQuery" auf.

    Zur Seite "BigQuery"

  2. Klicken Sie auf Abfrage erstellen.

  3. Führen Sie im Feld Neue Abfrage die folgende Abfrage aus:

    #standardSQL
    WITH
      --
      -- Retrieve the variants in this cohort, flattening by alternate bases and
      -- counting affected alleles.
      variants AS (
      SELECT
        REPLACE(reference_name, 'chr', '') as reference_name,
        start_position,
        end_position,
        reference_bases,
        alternate_bases.alt AS alt,
        (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles,
        (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles
      FROM
        `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v,
        UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ),
      --
      -- Define an inline table that uses five rows
      -- selected from silver-wall-555.TuteTable.hg19.
      intervals AS (
        SELECT * FROM UNNEST ([
        STRUCT<Gene STRING, Chr STRING, gene_start INT64, gene_end INT64, region_start INT64, region_end INT64>
        ('PRCC', '1', 156736274, 156771607, 156636274, 156871607),
        ('NTRK1', '1', 156785541, 156852640, 156685541, 156952640),
        ('PAX8', '2', 113972574, 114037496, 113872574, 114137496),
        ('FHIT', '3', 59734036, 61238131, 59634036, 61338131),
        ('PPARG', '3', 12328349, 12476853, 12228349, 12576853)
      ])),
      --
      -- JOIN the variants with the genomic intervals overlapping
      -- the genes of interest.
      --
      -- The JOIN criteria is complicated because the task is to see if
      -- an SNP overlaps an interval.  With standard SQL you can use complex
      -- JOIN predicates, including arbitrary expressions.
      gene_variants AS (
      SELECT
        reference_name,
        start_position,
        reference_bases,
        alt,
        num_variant_alleles,
        total_num_alleles
      FROM
        variants
      INNER JOIN
        intervals ON
        variants.reference_name = intervals.Chr
        AND intervals.region_start <= variants.start_position
        AND intervals.region_end >= variants.end_position )
      --
      -- And finally JOIN the variants in the regions of interest
      -- with annotations for rare variants.
    SELECT DISTINCT
      Chr,
      annots.Start AS Start,
      Ref,
      annots.Alt,
      Func,
      Gene,
      PopFreqMax,
      ExonicFunc,
      num_variant_alleles,
      total_num_alleles
    FROM
      `silver-wall-555.TuteTable.hg19` AS annots
    INNER JOIN
      gene_variants AS vars
    ON
      vars.reference_name = annots.Chr
      AND vars.start_position = annots.Start
      AND vars.reference_bases = annots.Ref
      AND vars.alt = annots.Alt
    WHERE
      -- Retrieve annotations for rare variants only.
      PopFreqMax <= 0.01
    ORDER BY
      Chr,
      Start;
    
  4. Klicken Sie auf Abfrage ausführen. Die Abfrage dauert ungefähr zehn Sekunden und verarbeitet rund 334 GB an Daten. Die Abfrage liefert als Ergebnis seltene Varianten innerhalb der Kohorte, die mit den betrachteten Regionen überlappen.

    Erweitern Sie den folgenden Abschnitt, um die Ergebnisse der Abfrage anzuzeigen:

    Abfrageergebnisse

    Chris Start Ref Alt Func Gene PopFreqMax ExonicFunc Zahl_alles Gesamtwert_alles
    1 156699757 T C Dämonen RRAD1 0,002 2 4
    1 156705390 C T Dämonen RRAD1 8.0E-4 0 2
    1 156714207 T C Dämonen HDGF 0,003 0 6
    1 156714440 A C Dämonen HDGF 0,0068 0 12
    1 156723870 C T interkultur HDGF,PRC 0,006 1 2
    1 156724456 C T interkultur HDGF,PRC 0,002 2 4
    1 156733988 C T interkultur HDGF,PRC 0,001 1 2
    1 156742258 T G Dämonen PRC 0,001 2 4
    1 156744826 T G Dämonen PRC 0,002 0 8
    1 156779764 G A Dämonen SH2D2A 0,001 2 4
    1 156783454 A C Dämonen SH2D2A 0,0014 1 2
    1 156786144 C T Dämonen NTRK1,SH2D2A 0,0031 2 4
    1 156790510 A T Dämonen NTRK1 0,002 1 2
    1 156815332 A C Dämonen INRREN.NTRK1 0,003 0 2
    1 156830778 G A Exonic NTRK1 0,0067 Missense 2 4
    1 156842064 C T Dämonen NTRK1 0,0014 1 2
    1 156843438 C A Exonic NTRK1 0,0032 Missense 1 2
    1 156845773 C T Dämonen NTRK1 0,001 2 4
    1 156873318 T C Dämonen PEAR1 0,01 4 8
    1 156922740 G A Dämonen ARHEGE 0,007 1 2
    1 156930100 C T Dämonen ARHEGE 0,001 2 4
    2 113901230 G A interkultur IL1RN (PSD4) 0,0082 1 2
    2 113953418 C A Dämonen PSD4 0,001 2 4
    2 113967621 G C interkultur PSD4,PAX8 0,002 0 6
    2 113967624 T C interkultur PSD4,PAX8 0,002 0 2
    2 113980967 G A Dämonen PAX8 0,002 2 4
    2 113994010 A C nERNRA_exonic PAX8-AS1 0,001 0 4
    2 113997745 C A nERNRA_exonic PAX8-AS1 0,001 2 4
    2 114061327 T C interkultur PAX8,CBWD2 0,001 2 4
    2 114084018 A C interkultur PAX8,CBWD2 0.0045 0 4
    2 114099037 G A interkultur PAX8,CBWD2 0,0051 1 2
    2 114105670 A T interkultur PAX8,CBWD2 0,001 1 2
    2 114111325 G T interkultur PAX8,CBWD2 0,001 1 2
    3 12265797 C T interkultur SYN2 0,0089 2 4
    3 12277958 A G interkultur SYN2 0,002 1 2
    3 12296019 G A interkultur SYN2 0,002 2 4
    3 12316549 G C interkultur SYN2 0,002 1 2
    3 12335681 T G Dämonen PPARG 0,0092 2 4
    3 12348795 T C Dämonen PPARG 0,0014 1 2
    3 12353106 T C Dämonen PPARG 0,001 2 4
    3 12403825 G A Dämonen PPARG 0,0051 2 4
    3 12404394 G A Dämonen PPARG 0,001 1 2
    3 12410289 G A Dämonen PPARG 0,008 2 4
    3 12431381 C T Dämonen PPARG 0,0061 2 4
    3 12447267 G A Dämonen PPARG 0,0089 2 4
    3 12449379 C T Dämonen PPARG 0,0092 2 4
    3 12450848 C A Dämonen PPARG 0,0092 2 4
    3 12462847 T C Dämonen PPARG 0,002 1 2
    3 12492797 G A interkultur PPARD,TSEN2 0,01 1 2
    3 12503201 G A interkultur PPARD,TSEN2 0,0099 2 4
    3 12530460 A G Dämonen TSEN2 0,0092 2 4
    3 12531167 A G Dämonen TSEN2 0,0099 2 4
    3 12557737 A G Dämonen TSEN2 0,001 2 4
    3 59636143 A G interkultur C3orf67 0,003 3 6
    3 59645934 A C interkultur C3orf67,FHIT 0,004 1 2
    3 59646893 G A interkultur C3orf67 0,002 1 2
    3 59697024 A G interkultur C3orf67 0,0072 1 2
    3 59701013 G A interkultur C3orf67,FHIT 0,004 2 4
    3 59733945 A G interkultur C3orf67,FHIT 0,001 2 4
    3 59747482 C T Dämonen FANG 0,001 2 4
    3 59750635 A G Dämonen FANG 0,003 1 2
    3 59757776 C T Dämonen FANG 0,001 2 4
    3 59770612 G A Dämonen FANG 0,001 2 4
    3 59804444 G C Dämonen FANG 0,001 2 4
    3 59819769 T C Dämonen FANG 0,001 2 4
    3 59884396 C T Dämonen FANG 0,001 2 4
    3 59960728 A C Dämonen FANG 0,01 1 2
    3 59970345 G A Dämonen FANG 0,002 1 2
    3 59972417 T A Dämonen FANG 0,0072 0 2
    3 60104328 C A Dämonen FANG 0,01 2 4
    3 60139062 G A Dämonen FANG 0,01 0 2
    3 60158066 C T Dämonen FANG 0,001 1 2
    3 60169285 C T Dämonen FANG 0,005 1 2
    3 60216185 T C Dämonen FANG 0,002 1 2
    3 60226380 G A Dämonen FANG 0,007 2 4
    3 60234539 C A Dämonen FANG 0,002 1 2
    3 60247464 A C Dämonen FANG 0,004 2 4
    3 60269926 A G Dämonen FANG 0,007 2 4
    3 60271228 G T Dämonen FANG 0,007 2 4
    3 60286972 T C Dämonen FANG 0,001 2 4
    3 60301412 C G Dämonen FANG 0,001 1 2
    3 60312251 C T Dämonen FANG 0,0099 1 2
    3 60317682 A G Dämonen FANG 0,008 1 2
    3 60328557 C G Dämonen FANG 0,0043 2 4
    3 60342562 C T Dämonen FANG 0,006 1 2
    3 60400033 G A Dämonen FANG 0,004 2 4
    3 60435819 C T Dämonen FANG 0,006 2 4
    3 60435820 G T Dämonen FANG 0,004 1 2
    3 60441288 T C Dämonen FANG 0,006 2 4
    3 60444465 C A Dämonen FANG 0,01 1 2
    3 60444575 C T Dämonen FANG 0,001 1 2
    3 60450581 T C Dämonen FANG 0,01 1 2
    3 60456571 G A Dämonen FANG 0,001 2 4
    3 60473568 C G Dämonen FANG 0,001 1 2
    3 60487557 T C Dämonen FANG 0,001 1 2
    3 60559705 A G Dämonen FANG 0,002 2 4
    3 60570764 T C Dämonen FANG 0,008 2 4
    3 60582100 C T Dämonen FANG 0,001 1 2
    3 60587192 G A Dämonen FANG 0,004 1 2
    3 60599869 G A Dämonen FANG 0,0086 2 4
    3 60603091 C T Dämonen FANG 0,001 2 4
    3 60603250 A T Dämonen FANG 0,0099 1 2
    3 60609831 T G Dämonen FANG 0,001 2 4
    3 60619756 G T Dämonen FANG 0,0015 2 4
    3 60680758 C T Dämonen FANG 0,0089 2 4
    3 60702243 G C Dämonen FANG 0,001 2 4
    3 60702532 A G Dämonen FANG 0,001 1 2
    3 60714328 A T Dämonen FANG 0,004 1 2
    3 60725297 G A Dämonen FANG 0,001 1 2
    3 60726640 G A Dämonen FANG 0,01 2 4
    3 60795144 A G Dämonen FANG 0,001 2 4
    3 60807171 A G Dämonen FANG 0,001 1 2
    3 60813868 T C Dämonen FANG 0,001 1 2
    3 60826546 C G Dämonen FANG 0,0023 1 2
    3 60837392 C T Dämonen FANG 0,001 1 2
    3 60846310 A G Dämonen FANG 0,01 0 2
    3 60850985 C T Dämonen FANG 0,004 1 2
    3 60852559 T C Dämonen FANG 0,008 1 2
    3 60871759 T C Dämonen FANG 0,004 1 2
    3 60884396 C T Dämonen FANG 0,002 2 4
    3 60897092 C A Dämonen FANG 0,001 2 4
    3 60940759 C T Dämonen FANG 0,0089 1 2
    3 60982595 A G Dämonen FANG 0,003 2 4
    3 60999283 G A Dämonen FANG 0,001 1 2
    3 61042977 A G Dämonen FANG 0,001 2 4
    3 61043349 T C Dämonen FANG 0,001 2 4
    3 61044789 A C Dämonen FANG 0,001 2 4
    3 61141621 G A Dämonen FANG 0,003 1 2
    3 61148655 G C Dämonen FANG 0,001 2 4
    3 61170747 C T Dämonen FANG 0,003 1 2
    3 61189473 C G Dämonen FANG 0,0099 1 2
    3 61190425 C T Dämonen FANG 0,0023 2 4
    3 61193853 C T Dämonen FANG 0,0099 0 2
    3 61194793 C T Dämonen FANG 0,007 0 2
    3 61194840 A G Dämonen FANG 0,0099 0 2
    3 61194886 T A Dämonen FANG 0,0099 0 2
    3 61201777 C T Dämonen FANG 0,001 2 4
    3 61202292 T C Dämonen FANG 0,007 1 2
    3 61232806 G C Dämonen FANG 0,0099 1 2
    3 61232910 C T Dämonen FANG 0,0099 1 2
    3 61235824 A T Dämonen FANG 0,001 2 4
    3 61283810 A C interkultur FHIT,PTPRG 0,0089 1 2
    3 61293731 T A interkultur FHIT,PTPRG 0,0089 2 4
    3 61296730 C T interkultur FHIT,PTPRG 0,001 1 2
    3 61326341 C T interkultur FHIT,PTPRG 0,004 2 4
    3 61326620 T C interkultur FHIT,PTPRG 0,01 1 2
    3 61327649 G C interkultur FHIT,PTPRG 0,001 2 4
    3 61330545 G C interkultur FHIT,PTPRG 0,001 2 4
    3 61335803 G A interkultur FHIT,PTPRG 0,001 2 4

    Eine ähnliche Abfrage mit Daten aus 1000 Genomes Phase 3 dauert ca.90 Sekunden, wobei rund 3,38 TB an Daten verarbeitet werden.

Materialisierte Tabelle verwenden

Wenn Sie mit sehr großen Big-Data-Datasets arbeiten, können Sie eine Intervalltabelle materialisieren und eine JOIN-Abfrage über die neue Tabelle ausführen. Bevor Sie mit dem Rest dieses Abschnitts fortfahren, erstellen Sie mit den folgenden Schritten ein Dataset:

  1. Öffnen Sie in der Cloud Console die Seite „BigQuery“.

    Zur Seite "BigQuery"

  2. Wählen Sie im Bereich Explorer das Projekt aus, in dem Sie das Dataset erstellen möchten.

  3. Maximieren Sie die Option Aktionen und klicken Sie auf Dataset erstellen.

  4. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:

    1. Geben Sie unter Dataset-ID genomics ein.
    2. Lassen Sie die anderen Standardeinstellungen unverändert.
    3. Klicken Sie auf Dataset erstellen.

Materialisierte Tabellen mit bestimmten Genen abfragen

Im Folgenden wird gezeigt, wie Sie eine neue Intervalltabelle materialisieren, die eine Liste bestimmter Gene aus der Tabelle silver-wall-555:TuteTable.hg19 enthält.

  1. So erstellen Sie die Intervalltabelle:

    1. Öffnen Sie in der Cloud Console die Seite „BigQuery“.

      Zur Seite "BigQuery"

    2. Klicken Sie auf Abfrage erstellen.

    3. Führen Sie im Feld Neue Abfrage die folgende Abfrage aus. Die Abfrage fasst einen Teil der Tabelle "silver-wall-555:TuteTable.hg19" in der neuen Intervalltabelle genomics.myIntervalTable zusammen.

      #standardSQL
      CREATE TABLE `genomics.myIntervalTable` AS (
      SELECT
        Gene,
        Chr,
        MIN(Start) AS gene_start,
        MAX(`End`) AS gene_end,
        MIN(Start)-100000 AS region_start,
        MAX(`End`)+100000 AS region_end
      FROM
        `silver-wall-555.TuteTable.hg19`
      WHERE
        Gene IN ('APC', 'ATM', 'BMPR1A', 'BRCA1', 'BRCA2', 'CDK4',
        'CDKN2A', 'CREBBP', 'EGFR', 'EP300', 'ETV6', 'FHIT', 'FLT3',
        'HRAS', 'KIT', 'MET', 'MLH1', 'NTRK1', 'PAX8', 'PDGFRA',
        'PPARG', 'PRCC', 'PRKAR1A', 'PTEN', 'RET', 'STK11',
        'TFE3', 'TGFB1', 'TGFBR2', 'TP53', 'WWOX')
      GROUP BY
        Chr,
        Gene );
      
    4. Klicken Sie auf Abfrage ausführen. Die Abfrage gibt das folgende Ergebnis zurück:

    This statement created a new table named PROJECT_ID:genomics.myIntervalTable.
    
  2. Führen Sie im Feld Neue Abfrage die folgende Abfrage aus:

    #standardSQL
    WITH
      --
      -- Retrieve the variants in this cohort, flattening by alternate bases and
      -- counting affected alleles.
      variants AS (
      SELECT
        REPLACE(reference_name, 'chr', '') as reference_name,
        start_position,
        end_position,
        reference_bases,
        alternate_bases.alt AS alt,
        (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles,
        (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles
      FROM
        `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v,
        UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ),
      --
      -- JOIN the variants with the genomic intervals overlapping
      -- the genes of interest.
      --
      -- The JOIN criteria is complicated because the task is to see if
      -- an SNP overlaps an interval.  With standard SQL you can use complex
      -- JOIN predicates, including arbitrary expressions.
      gene_variants AS (
      SELECT
        reference_name,
        start_position,
        reference_bases,
        alt,
        num_variant_alleles,
        total_num_alleles
      FROM
        variants
      INNER JOIN
        `genomics.myIntervalTable` AS intervals ON
        variants.reference_name = intervals.Chr
        AND intervals.region_start <= variants.start_position
        AND intervals.region_end >= variants.end_position )
      --
      -- And finally JOIN the variants in the regions of interest
      -- with annotations for rare variants.
    SELECT DISTINCT
      Chr,
      annots.Start AS Start,
      Ref,
      annots.Alt,
      Func,
      Gene,
      PopFreqMax,
      ExonicFunc,
      num_variant_alleles,
      total_num_alleles
    FROM
      `silver-wall-555.TuteTable.hg19` AS annots
    INNER JOIN
      gene_variants AS vars
    ON
      vars.reference_name = annots.Chr
      AND vars.start_position = annots.Start
      AND vars.reference_bases = annots.Ref
      AND vars.alt = annots.Alt
    WHERE
      -- Retrieve annotations for rare variants only.
      PopFreqMax <= 0.01
    ORDER BY
      Chr,
      Start;
    
  3. Klicken Sie auf Abfrage ausführen. Die Abfrage dauert ungefähr zehn Sekunden und verarbeitet rund 334 GB an Daten. Die Abfrage liefert als Ergebnis seltene Varianten innerhalb der Kohorte, die mit den betrachteten Regionen überlappen.

    Erweitern Sie den folgenden Abschnitt, um die Ergebnisse der Abfrage anzuzeigen:

    Abfrageergebnisse

    Chris Start Ref Alt Func Gene PopFreqMax ExonicFunc Zahl_alles Gesamtwert_alles
    1 156699757 T C Dämonen RRAD1 0,002 2 4
    1 156705390 C T Dämonen RRAD1 8.0E-4 0 2
    1 156714207 T C Dämonen HDGF 0,003 0 6
    1 156714440 A C Dämonen HDGF 0,0068 0 12
    1 156723870 C T interkultur HDGF,PRC 0,006 1 2
    1 156724456 C T interkultur HDGF,PRC 0,002 2 4
    1 156733988 C T interkultur HDGF,PRC 0,001 1 2
    1 156742258 T G Dämonen PRC 0,001 2 4
    1 156744826 T G Dämonen PRC 0,002 0 8
    1 156779764 G A Dämonen SH2D2A 0,001 2 4
    1 156783454 A C Dämonen SH2D2A 0,0014 1 2
    1 156786144 C T Dämonen NTRK1,SH2D2A 0,0031 2 4
    1 156790510 A T Dämonen NTRK1 0,002 1 2
    1 156815332 A C Dämonen INRREN.NTRK1 0,003 0 2
    1 156830778 G A Exonic NTRK1 0,0067 Missense 2 4
    1 156842064 C T Dämonen NTRK1 0,0014 1 2
    1 156843438 C A Exonic NTRK1 0,0032 Missense 1 2
    1 156845773 C T Dämonen NTRK1 0,001 2 4
    1 156873318 T C Dämonen PEAR1 0,01 4 8
    1 156922740 G A Dämonen ARHEGE 0,007 1 2
    1 156930100 C T Dämonen ARHEGE 0,001 2 4
    2 113901230 G A interkultur IL1RN (PSD4) 0,0082 1 2
    2 113953418 C A Dämonen PSD4 0,001 2 4
    2 113967621 G C interkultur PSD4,PAX8 0,002 0 6
    2 113967624 T C interkultur PSD4,PAX8 0,002 0 2
    2 113980967 G A Dämonen PAX8 0,002 2 4
    2 113994010 A C nERNRA_exonic PAX8-AS1 0,001 0 4
    2 113997745 C A nERNRA_exonic PAX8-AS1 0,001 2 4
    2 114061327 T C interkultur PAX8,CBWD2 0,001 2 4
    2 114084018 A C interkultur PAX8,CBWD2 0.0045 0 4
    2 114099037 G A interkultur PAX8,CBWD2 0,0051 1 2
    2 114105670 A T interkultur PAX8,CBWD2 0,001 1 2
    2 114111325 G T interkultur PAX8,CBWD2 0,001 1 2
    3 12265797 C T interkultur SYN2 0,0089 2 4
    3 12277958 A G interkultur SYN2 0,002 1 2
    3 12296019 G A interkultur SYN2 0,002 2 4
    3 12316549 G C interkultur SYN2 0,002 1 2
    3 12335681 T G Dämonen PPARG 0,0092 2 4
    3 12348795 T C Dämonen PPARG 0,0014 1 2
    3 12353106 T C Dämonen PPARG 0,001 2 4
    3 12403825 G A Dämonen PPARG 0,0051 2 4
    3 12404394 G A Dämonen PPARG 0,001 1 2
    3 12410289 G A Dämonen PPARG 0,008 2 4
    3 12431381 C T Dämonen PPARG 0,0061 2 4
    3 12447267 G A Dämonen PPARG 0,0089 2 4
    3 12449379 C T Dämonen PPARG 0,0092 2 4
    3 12450848 C A Dämonen PPARG 0,0092 2 4
    3 12462847 T C Dämonen PPARG 0,002 1 2
    3 12492797 G A interkultur PPARD,TSEN2 0,01 1 2
    3 12503201 G A interkultur PPARD,TSEN2 0,0099 2 4
    3 12530460 A G Dämonen TSEN2 0,0092 2 4
    3 12531167 A G Dämonen TSEN2 0,0099 2 4
    3 12557737 A G Dämonen TSEN2 0,001 2 4
    3 59636143 A G interkultur C3orf67 0,003 3 6
    3 59645934 A C interkultur C3orf67,FHIT 0,004 1 2
    3 59646893 G A interkultur C3orf67 0,002 1 2
    3 59697024 A G interkultur C3orf67 0,0072 1 2
    3 59701013 G A interkultur C3orf67,FHIT 0,004 2 4
    3 59733945 A G interkultur C3orf67,FHIT 0,001 2 4
    3 59747482 C T Dämonen FANG 0,001 2 4
    3 59750635 A G Dämonen FANG 0,003 1 2
    3 59757776 C T Dämonen FANG 0,001 2 4
    3 59770612 G A Dämonen FANG 0,001 2 4
    3 59804444 G C Dämonen FANG 0,001 2 4
    3 59819769 T C Dämonen FANG 0,001 2 4
    3 59884396 C T Dämonen FANG 0,001 2 4
    3 59960728 A C Dämonen FANG 0,01 1 2
    3 59970345 G A Dämonen FANG 0,002 1 2
    3 59972417 T A Dämonen FANG 0,0072 0 2
    3 60104328 C A Dämonen FANG 0,01 2 4
    3 60139062 G A Dämonen FANG 0,01 0 2
    3 60158066 C T Dämonen FANG 0,001 1 2
    3 60169285 C T Dämonen FANG 0,005 1 2
    3 60216185 T C Dämonen FANG 0,002 1 2
    3 60226380 G A Dämonen FANG 0,007 2 4
    3 60234539 C A Dämonen FANG 0,002 1 2
    3 60247464 A C Dämonen FANG 0,004 2 4
    3 60269926 A G Dämonen FANG 0,007 2 4
    3 60271228 G T Dämonen FANG 0,007 2 4
    3 60286972 T C Dämonen FANG 0,001 2 4
    3 60301412 C G Dämonen FANG 0,001 1 2
    3 60312251 C T Dämonen FANG 0,0099 1 2
    3 60317682 A G Dämonen FANG 0,008 1 2
    3 60328557 C G Dämonen FANG 0,0043 2 4
    3 60342562 C T Dämonen FANG 0,006 1 2
    3 60400033 G A Dämonen FANG 0,004 2 4
    3 60435819 C T Dämonen FANG 0,006 2 4
    3 60435820 G T Dämonen FANG 0,004 1 2
    3 60441288 T C Dämonen FANG 0,006 2 4
    3 60444465 C A Dämonen FANG 0,01 1 2
    3 60444575 C T Dämonen FANG 0,001 1 2
    3 60450581 T C Dämonen FANG 0,01 1 2
    3 60456571 G A Dämonen FANG 0,001 2 4
    3 60473568 C G Dämonen FANG 0,001 1 2
    3 60487557 T C Dämonen FANG 0,001 1 2
    3 60559705 A G Dämonen FANG 0,002 2 4
    3 60570764 T C Dämonen FANG 0,008 2 4
    3 60582100 C T Dämonen FANG 0,001 1 2
    3 60587192 G A Dämonen FANG 0,004 1 2
    3 60599869 G A Dämonen FANG 0,0086 2 4
    3 60603091 C T Dämonen FANG 0,001 2 4
    3 60603250 A T Dämonen FANG 0,0099 1 2
    3 60609831 T G Dämonen FANG 0,001 2 4
    3 60619756 G T Dämonen FANG 0,0015 2 4
    3 60680758 C T Dämonen FANG 0,0089 2 4
    3 60702243 G C Dämonen FANG 0,001 2 4
    3 60702532 A G Dämonen FANG 0,001 1 2
    3 60714328 A T Dämonen FANG 0,004 1 2
    3 60725297 G A Dämonen FANG 0,001 1 2
    3 60726640 G A Dämonen FANG 0,01 2 4
    3 60795144 A G Dämonen FANG 0,001 2 4
    3 60807171 A G Dämonen FANG 0,001 1 2
    3 60813868 T C Dämonen FANG 0,001 1 2
    3 60826546 C G Dämonen FANG 0,0023 1 2
    3 60837392 C T Dämonen FANG 0,001 1 2
    3 60846310 A G Dämonen FANG 0,01 0 2
    3 60850985 C T Dämonen FANG 0,004 1 2
    3 60852559 T C Dämonen FANG 0,008 1 2
    3 60871759 T C Dämonen FANG 0,004 1 2
    3 60884396 C T Dämonen FANG 0,002 2 4
    3 60897092 C A Dämonen FANG 0,001 2 4
    3 60940759 C T Dämonen FANG 0,0089 1 2
    3 60982595 A G Dämonen FANG 0,003 2 4
    3 60999283 G A Dämonen FANG 0,001 1 2
    3 61042977 A G Dämonen FANG 0,001 2 4
    3 61043349 T C Dämonen FANG 0,001 2 4
    3 61044789 A C Dämonen FANG 0,001 2 4
    3 61141621 G A Dämonen FANG 0,003 1 2
    3 61148655 G C Dämonen FANG 0,001 2 4
    3 61170747 C T Dämonen FANG 0,003 1 2
    3 61189473 C G Dämonen FANG 0,0099 1 2
    3 61190425 C T Dämonen FANG 0,0023 2 4
    3 61193853 C T Dämonen FANG 0,0099 0 2
    3 61194793 C T Dämonen FANG 0,007 0 2
    3 61194840 A G Dämonen FANG 0,0099 0 2
    3 61194886 T A Dämonen FANG 0,0099 0 2
    3 61201777 C T Dämonen FANG 0,001 2 4
    3 61202292 T C Dämonen FANG 0,007 1 2
    3 61232806 G C Dämonen FANG 0,0099 1 2
    3 61232910 C T Dämonen FANG 0,0099 1 2
    3 61235824 A T Dämonen FANG 0,001 2 4
    3 61283810 A C interkultur FHIT,PTPRG 0,0089 1 2
    3 61293731 T A interkultur FHIT,PTPRG 0,0089 2 4
    3 61296730 C T interkultur FHIT,PTPRG 0,001 1 2
    3 61326341 C T interkultur FHIT,PTPRG 0,004 2 4
    3 61326620 T C interkultur FHIT,PTPRG 0,01 1 2
    3 61327649 G C interkultur FHIT,PTPRG 0,001 2 4
    3 61330545 G C interkultur FHIT,PTPRG 0,001 2 4
    3 61335803 G A interkultur FHIT,PTPRG 0,001 2 4

    Eine ähnliche Abfrage mit Daten aus 1000 Genomes Phase 3 dauert ca.90 Sekunden, wobei rund 3,38 TB an Daten verarbeitet werden.

Eine materialisierte Tabelle mit 250 zufälligen Genen abfragen

Im folgenden Beispiel wird ein Intervall-JOIN über eine materialisierte Tabelle ausgeführt, die 250 zufällig aus der Tabelle silver-wall-555:TuteTable.hg19 ausgewählte Gene enthält.

  1. So erstellen Sie die Intervalltabelle:

    1. Öffnen Sie in der Cloud Console die Seite „BigQuery“.

      Zur Seite "BigQuery"

    2. Klicken Sie auf Abfrage erstellen.

    3. Führen Sie im Feld Neue Abfrage die folgende Abfrage aus. Damit wird ein Ausschnitt der Tabelle "silver-wall-555:TuteTable.hg19" in der neuen Intervalltabelle genomics.randomGenesIntervalTable materialisiert.

      #standardSQL
      CREATE TABLE `genomics.randomGenesIntervalTable` AS (
      SELECT
        Gene,
        Chr,
        MIN(Start) AS gene_start,
        MAX(`End`) AS gene_end,
        MIN(Start) - 100000 AS region_start,
        MAX(`End`) + 100000 AS region_end
      FROM
        `silver-wall-555.TuteTable.hg19`
      WHERE
        Gene IN (SELECT Gene FROM `silver-wall-555.TuteTable.hg19` GROUP BY Gene LIMIT 250)
      GROUP BY
        Chr,
        Gene );
      
      1. Klicken Sie auf Abfrage ausführen. Die Abfrage gibt das folgende Ergebnis zurück:
      This statement created a new table named PROJECT_ID:genomics.randomGenesIntervalTable.
      
  2. Führen Sie im Feld Neue Abfrage die folgende Abfrage aus:

    #standardSQL
    WITH
      --
      -- Retrieve the variants in this cohort, flattening by alternate bases and
      -- counting affected alleles.
      variants AS (
      SELECT
        REPLACE(reference_name, 'chr', '') as reference_name,
        start_position,
        end_position,
        reference_bases,
        alternate_bases.alt AS alt,
        (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles,
        (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles
      FROM
        `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v,
        UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ),
      --
      -- JOIN the variants with the genomic intervals overlapping
      -- the genes of interest.
      --
      -- The JOIN criteria is complicated because the task is to see if
      -- an SNP overlaps an interval.  With standard SQL you can use complex
      -- JOIN predicates, including arbitrary expressions.
      gene_variants AS (
      SELECT
        reference_name,
        start_position,
        reference_bases,
        alt,
        num_variant_alleles,
        total_num_alleles
      FROM
        variants
      INNER JOIN
        `genomics.randomGenesIntervalTable` AS intervals ON
        variants.reference_name = intervals.Chr
        AND intervals.region_start <= variants.start_position
        AND intervals.region_end >= variants.end_position )
      --
      -- And finally JOIN the variants in the regions of interest
      -- with annotations for rare variants.
    SELECT DISTINCT
      Chr,
      annots.Start AS Start,
      Ref,
      annots.Alt,
      Func,
      Gene,
      PopFreqMax,
      ExonicFunc,
      num_variant_alleles,
      total_num_alleles
    FROM
      `silver-wall-555.TuteTable.hg19` AS annots
    INNER JOIN
      gene_variants AS vars
    ON
      vars.reference_name = annots.Chr
      AND vars.start_position = annots.Start
      AND vars.reference_bases = annots.Ref
      AND vars.alt = annots.Alt
    WHERE
      -- Retrieve annotations for rare variants only.
      PopFreqMax <= 0.01
    ORDER BY
      Chr,
      Start;
    
  3. Klicken Sie auf Abfrage ausführen. Die Abfrage dauert ungefähr zehn Sekunden und verarbeitet rund 334 GB an Daten. Die Abfrage liefert als Ergebnis seltene Varianten innerhalb der Kohorte, die mit den betrachteten Regionen überlappen.

    Erweitern Sie den folgenden Abschnitt, um die abgeschnittenen Ergebnisse der Abfrage anzuzeigen:

    Abfrageergebnisse

    Chris Start Ref Alt Func Gene PopFreqMax ExonicFunc Zahl_alles Gesamtwert_alles
    1 2925355 C A interkultur TTC34,ACTRT2 0,001 2 4
    1 2933170 G A interkultur TTC34,ACTRT2 0,0083 0 4
    1 2944477 G A interkultur ACTRT2,LINC00982 0,003 4 6
    1 2967591 A T interkultur ACTRT2,LINC00982 0,0092 1 2
    1 2975255 T C nachgelagert LIS00982 0,0082 1 2
    1 2977223 C T nERNRA_intronic LIS00982 0,0072 1 2
    1 2978803 G C nERNRA_exonic LIS00982 0,002 4 6
    1 3006466 G A Dämonen PRDM16 0,0098 1 2
    1 3011333 G T Dämonen PRDM16 0,004 1 2
    1 3019659 C T Dämonen PRDM16 0,0031 1 2
    1 3036896 G A Dämonen PRDM16 0,001 1 2
    1 3037388 G A Dämonen PRDM16 0,002 2 4
    1 3041250 T G Dämonen PRDM16 0,006 2 4
    1 3042502 A T Dämonen PRDM16 0,003 4 6
    1 3053713 A C Dämonen PRDM16 0,002 1 2
    1 3063109 C T Dämonen PRDM16 0,002 0 2
    1 3063593 T C Dämonen PRDM16 0,003 1 2
    1 3076439 C T Dämonen PRDM16 0,001 2 4
    1 3078960 G A Dämonen PRDM16 0,007 2 4
    1 3084268 A C Dämonen PRDM16 0,005 0 2
    1 3084492 T C Dämonen PRDM16 0,0015 0 2
    1 3084786 T C Dämonen PRDM16 0,0015 0 4
    1 3111119 G A Dämonen PRDM16 0,003 1 2
    1 3111643 C T Dämonen PRDM16 0,0041 1 2
    1 3114807 G A Dämonen PRDM16 0,0041 1 2
    1 3165530 C T Dämonen PRDM16 0,0089 1 2
    1 3169325 G A Dämonen PRDM16 0,008 2 4
    1 3179623 C T Dämonen PRDM16 0,003 2 4
    1 3181097 C T Dämonen PRDM16 0,001 2 4
    1 3194000 G C Dämonen PRDM16 0,005 2 4
    1 3195769 T C Dämonen PRDM16 0,002 1 2
    1 3197351 C T Dämonen PRDM16 0,0061 1 2
    1 3224100 C A Dämonen PRDM16 0,003 2 4
    1 3228644 G T Dämonen PRDM16 0,001 2 4
    1 3234045 G A Dämonen PRDM16 0,002 1 2
    1 3235971 G A Dämonen PRDM16 0,0089 1 2
    1 3274115 C T Dämonen PRDM16 0,001 2 4
    1 3291388 G A Dämonen PRDM16 0,002 2 4
    1 3295658 A C Dämonen PRDM16 0,0068 0 6
    1 3295937 A C Dämonen PRDM16 0,0068 0 2
    1 3296205 T C Dämonen PRDM16 0,0083 0 2
    1 3315690 G A Dämonen PRDM16 0,001 2 4
    1 3329212 G A Exonic PRDM16 0,0031 Missense 1 2
    1 3331787 C T Dämonen PRDM16 0,0099 1 2
    1 3370316 G C vorgelagerter Stream ARHEGE16 0,001 2 4
    1 3379560 A G Dämonen ARHEGE16 0,0051 0 6
    1 3391174 C T Dämonen ARHEGE16 0,006 1 2
    1 3413873 G A Exonic MEGF6 0,003 Missense 1 2
    1 3416272 C T Exonic MEGF6 0,0072 Lautlos 2 4
    1 3417122 G A Dämonen MEGF6 0,0038 2 4
    1 3436219 G A Dämonen MEGF6 0,0046 2 4
    1 12907456 A G Exonic HNRNCL1,LOC649330 0,006 Missense 0 10
    1 12907518 C A Exonic HNRNCL1,LOC649330 1,0E-4 Missense 0 10
    1 12908499 G C Dämonen HNRNCL1 0,0031 0 8
    1 12931660 G C interkultur PRAMEF2,PRAMEF4 0,004 1 2
    1 12937721 G T interkultur PRAMEF2,PRAMEF4 0,0038 0 2
    1 12940827 G T Dämonen PRAMEF4 0,007 2 4
    1 12942759 T G Dämonen PRAMEF4 0,0076 0 10
    1 12942805 T G Dämonen PRAMEF4 0,0061 0 12
    1 12942812 G A Dämonen PRAMEF4 0,0061 0 12
    1 12942875 A G Dämonen PRAMEF4 0,0068 0 6
    1 12942912 G C Dämonen PRAMEF4 2,0-4 0 2
    1 12942937 A T Exonic PRAMEF4 0,0029 Missense 0 2
    1 12942940 T G Exonic PRAMEF4 0,0038 Missense 0 2
    1 12943940 T C Dämonen PRAMEF4 0,0015 0 12
    1 12944138 A G Dämonen PRAMEF4 8.0E-4 0 12
    1 12944234 G A Dämonen PRAMEF4 0,0015 0 12
    1 12944589 T G Dämonen PRAMEF4 0,003 0 4
    1 12944845 A C Dämonen PRAMEF4 0,0014 0 6
    1 12946439 T C vorgelagerter Stream PRAMEF4 0,0029 0 10
    1 12946833 G A vorgelagerter Stream PRAMEF4 0,001 0 8
    1 12946835 T A vorgelagerter Stream PRAMEF4 0,004 0 12
    1 12995204 G T interkultur PRAMEF8,PRAMEF6 0,003 1 4
    1 12997638 T C nachgelagert PRAMEF6,PRAMEF9 0,003 2 4
    1 13007841 G C vorgelagerter Stream PRAMEF6 0,0043 0 8
    1 13019228 T A interkultur PRAMEF6,LOC3003 0,0015 0 10
    1 13038503 G A UTR3 LOC3003 0,0072 1 2
    1 13051650 C T interkultur LOC3003,PRAMEF5 0,002 2 4
    1 15706063 G A Dämonen FHAD1 0,0029 1 2
    1 15713292 C T Dämonen FHAD1 0,001 1 2
    1 15766541 G C Dämonen CTRC 0,001 1 2
    1 15782601 T C vorgelagerter Stream CELA2A 0,0038 1 2
    1 15828125 G A Dämonen CASP9 0,0014 2 4
    1 15831037 G A Dämonen CASP9 0,0099 1 2
    1 15840513 T G Dämonen CASP9 0,0043 2 4
    1 15868742 G A Dämonen DNAJC16 0,001 1 2
    1 15876704 G A Dämonen DNAJC16 0,001 1 2
    1 15900342 C A Dämonen PROGRAMM 0,001 1 2
    1 15906257 T C Dämonen PROGRAMM 8.0E-4 1 2
    1 15911897 A G vorgelagerter Stream PROGRAMM 0,0043 2 4
    1 22764178 C T interkultur WNT4,ZBTB40 0,001 2 4
    1 22791939 C T Dämonen ZBTB40 0,0089 2 4
    1 22874394 C G interkultur ZBTB40,EPHA8 0,007 1 2
    1 22875103 C G interkultur ZBTB40,EPHA8 0,007 1 2
    1 22906403 C T Dämonen EPHA8 0,008 2 4
    1 22912956 G A Dämonen EPHA8 0,001 1 2
    1 22917007 C T Dämonen EPHA8 0,001 2 4
    1 22927240 G A Exonic EPHA8 0,0013 Missense 2 4
    1 22932265 G A interkultur EPHA8,MIR6127 0,0089 2 4
    1 22944057 C T interkultur EPHA8,MIR6127 0,0089 2 4
    1 22978799 A G vorgelagerter Stream C1QB 0,0099 2 4
    1 35170588 C T interkultur C1orf94,GJB5 (USA) 0,01 1 2
    1 35172426 C T interkultur C1orf94,GJB5 (USA) 0,008 1 2
    1 35172447 G A interkultur C1orf94,GJB5 (USA) 0,001 1 2
    1 35175302 C T interkultur C1orf94,GJB5 (USA) 0,008 1 2
    1 35177410 A T interkultur C1orf94,GJB5 (USA) 0,001 1 2
    1 35178768 C T interkultur C1orf94,GJB5 (USA) 0,0014 2 4
    1 35179362 G A interkultur C1orf94,GJB5 (USA) 0,0014 2 4
    1 35186166 G A interkultur C1orf94,GJB5 (USA) 0,0099 2 4
    1 35186520 A C interkultur C1orf94,GJB5 (USA) 0,002 2 4
    1 35196361 G A interkultur C1orf94,GJB5 (USA) 0,0099 2 4
    1 35223545 C T Exonic GJB5 0,001 Lautlos 1 2
    1 35224029 G A UTR3 GJB5 0,003 1 2
    1 35227895 T C UTR3 GJB4 5,0E-4 1 2
    1 35230455 G T interkultur GJB4,GJB3 0,0043 1 2
    1 35232954 T C interkultur GJB4,GJB3 0,003 1 2
    1 35237986 G A interkultur GJB4,GJB3 0,0014 1 2
    1 35245522 C T interkultur GJB4,GJB3 0,001 1 2
    1 35256979 C T interkultur GJB3,GJA4 0,002 2 4
    1 35263872 C T interkultur GJA4,SMIM12 5,0E-4 2 4
    1 35323895 A C Dämonen SMIM12 0,0027 2 4
    1 35369676 G A Dämonen DLGAP3 0,007 2 4
    1 35371634 T A vorgelagerter Stream DLGAP3 0,0015 0 4
    1 39253519 G A interkultur LINC01343,RAGGC 0,005 1 2
    1 39288829 G A interkultur LINC01343,RAGGC 0,0051 1 2
    1 39289832 A C interkultur LINC01343,RAGGC 0,002 0 2
    1 39312638 G A Dämonen Logo: RARG 0,0038 2 4
    1 39361372 G A Dämonen RHBDL2 0,005 1 2
    1 39363826 T G Dämonen RHBDL2 0,0029 1 2
    1 39367555 T C Dämonen RHBDL2 0,007 2 4
    1 39369531 T C Dämonen RHBDL2 0,001 2 4
    1 39370202 T C Dämonen RHBDL2 0,01 1 2
    1 39449101 A G interkultur RHBDL2,AKIRIN1 0,001 2 4
    1 39475057 G A interkultur AKIRIN1,NDUFS5 0,01 1 2
    1 39485016 C T interkultur AKIRIN1,NDUFS5 0,001 2 4
    1 39488137 A G interkultur AKIRIN1,NDUFS5 0,001 2 4
    1 39499212 A C Dämonen NDUFS5 0,001 0 2
    1 39500605 C G nachgelagert NDUFS5 0,002 0 10
    1 46813814 T C Dämonen NSUN4 0,0014 1 2
    1 46817258 A G Dämonen NSUN4 0,005 0 2
    1 46843158 T C interkultur NSUN4.FAAH 0,001 1 2
    1 46933509 A G interkultur LINC01398,DBBX1 0,002 1 2
    1 46935021 G A interkultur LINC01398,DBBX1 0,004 2 4
    1 46939253 T A interkultur LINC01398,DBBX1 0,004 2 4
    1 46951788 C A interkultur LINC01398,DBBX1 0,002 2 4
    1 46980864 G C nachgelagert DMBX1 0,003 1 2
    1 46989657 T C interkultur DMBX1,MKKN1-AS1 0,007 1 2
    1 46994678 C T interkultur DMBX1,MKNK1-AS1 0,002 1 2
    1 46999438 T C interkultur DMBX1,MKNK1-AS1 0,002 1 2
    1 92761505 A G Dämonen GMN 0,001 2 4
    1 92764270 G C Dämonen GMN 0,001 2 4
    1 92802210 G A Dämonen RPAP2 0,0072 1 2
    1 92820663 T A Dämonen RPAP2 0,0058 1 2
    1 92820664 G T Dämonen RPAP2 0,0058 1 2
    1 92820953 G A Dämonen RPAP2 0,007 2 4
    1 92824766 A G Dämonen RPAP2 0,0058 1 2
    1 92849183 C A Dämonen RPAP2 0,01 2 4
    1 92850696 C G Dämonen RPAP2 0,0023 1 2
    1 92861357 T C interkultur RPAP2,GFI1 0,01 2 4
    1 92877460 C G interkultur RPAP2,GFI1 0,002 1 2
    1 92880643 A G interkultur RPAP2,GFI1 0,001 2 4
    1 92911540 G A interkultur RPAP2,GFI1 0,004 2 4
    1 92911721 A C interkultur RPAP2,GFI1 0,0031 0 8
    1 92918277 C T interkultur RPAP2,GFI1 0,001 2 4
    1 92950920 G A Dämonen GFI1 0,008 2 4
    1 92964788 G A interkultur GFI1,EVI5 0,0023 1 2
    1 92977480 C T UTR3 EVI5 0,002 1 2
    1 92985213 C T Dämonen EVI5 0,001 2 4
    1 92988342 C T Dämonen EVI5 0,008 2 4
    1 92992283 G A Dämonen EVI5 0,01 2 4
    1 92999760 C T Dämonen EVI5 0,003 1 2
    1 93005149 G C Dämonen EVI5 0,003 0 4
    1 93018543 A T Dämonen EVI5 0,01 2 4
    1 93033744 C T Dämonen EVI5 0,001 2 4
    1 111400296 G A interkultur KCNA3,CD53 0,0014 2 4
    1 111411924 C T interkultur KCNA3,CD53 0,003 1 2
    1 111441850 C G UTR3 CD53 0,003 2 4
    1 111451527 C T interkultur CD53.LRIF1 0,008 2 4
    1 111454082 C A interkultur CD53.LRIF1 0,001 2 4
    1 111466506 A G interkultur CD53.LRIF1 0,001 2 4
    1 111525974 G A interkultur LRIF1,DRAM2 0,002 2 4
    1 111574573 G T interkultur LRIF1,DRAM2 0,0072 2 4
    1 111574594 T A interkultur LRIF1,DRAM2 0,005 1 2
    1 111574647 G A interkultur LRIF1,DRAM2 0,005 1 2
    1 111591746 T A interkultur LRIF1,DRAM2 0,005 1 2
    1 111601459 A G interkultur LRIF1,DRAM2 0,005 1 2
    1 111604748 G C interkultur LRIF1,DRAM2 0,005 1 2
    1 112191526 T G Dämonen RAP1A 0,001 2 4
    1 112206765 A G Dämonen RAP1A 0,0043 1 2
    1 112226517 G A Dämonen RAP1A 0,001 0 2
    1 112263324 G T interkultur RAP1A,FAM212B 0,003 2 4
    1 112264843 G A UTR3 FAM212B 0,001 1 2
    1 112285810 C T nERNRA_intronic FAM212B-AS1 0,004 1 2
    1 112304285 T C Dämonen DDX20 0,0043 1 2
    1 112307213 A C Dämonen DDX20 0,0043 1 2
    1 112309436 G T Exonic DDX20 0,0 Missense 1 2
    1 112317384 T C interkultur DDX20,KCND3 0,0014 1 2
    1 112381367 C T Dämonen KCND3 0,002 1 2
    1 112396571 G T nERNRA_exonic KCND3-IT1 0,001 1 2
    1 113520038 G A interkultur SLC16A1-AS1,LOC100996251 0,0023 1 2

    Eine ähnliche Abfrage mit Daten aus 1000 Genomes Phase 3 dauert ca.90 Sekunden, wobei rund 3,38 TB an Daten verarbeitet werden.