É possível usar o BigQuery para executar uma consulta JOIN
em variantes com dados descritos por intervalos de região genômica ou sobreposições. Nesta página, mostramos como usar uma consulta JOIN
complexa para receber uma lista de nomes de genes e fazer o seguinte:
- Encontre os SNPs raros que se sobrepõem aos genes.
- Encontrar 100.000 pares de bases em ambos os lados de um gene para todas as amostras do genoma.
Este guia mostra exemplos para três consultas. Cada consulta demonstra como o BigQuery é escalonado em diferentes tamanhos de dados genômicos:
- Consulte uma tabela in-line.
- Consulte uma tabela materializada com genes específicos.
- Consulte uma tabela materializada com 250 genes aleatórios.
Os dados vêm da tabela de anotações do Tute Genomics de quase 9 bilhões de linhas e do conjunto de dados Illumina Platinum Genomes. Se você não estiver familiarizado com esses conjuntos de dados, consulte os links a seguir:
- Exploring genetic variation with Google Genomics and Tute (em inglês) no blog do Google Cloud
- Illumina Platinum Genomes na seção sobre conjuntos de dados públicos
Consultar uma tabela in-line
No exemplo a seguir, usamos uma tabela de intervalo definida na consulta, chamada intervals
, e mostramos como executar uma consulta JOIN
com uma tabela contendo variantes do Illumina Platinum Genomes:
Acesse a página do BigQuery no Console do Google Cloud.
Clique em Compose query.
No campo Nova consulta, execute a seguinte consulta:
#standardSQL WITH -- -- Retrieve the variants in this cohort, flattening by alternate bases and -- counting affected alleles. variants AS ( SELECT REPLACE(reference_name, 'chr', '') as reference_name, start_position, end_position, reference_bases, alternate_bases.alt AS alt, (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles, (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles FROM `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v, UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ), -- -- Define an inline table that uses five rows -- selected from silver-wall-555.TuteTable.hg19. intervals AS ( SELECT * FROM UNNEST ([ STRUCT<Gene STRING, Chr STRING, gene_start INT64, gene_end INT64, region_start INT64, region_end INT64> ('PRCC', '1', 156736274, 156771607, 156636274, 156871607), ('NTRK1', '1', 156785541, 156852640, 156685541, 156952640), ('PAX8', '2', 113972574, 114037496, 113872574, 114137496), ('FHIT', '3', 59734036, 61238131, 59634036, 61338131), ('PPARG', '3', 12328349, 12476853, 12228349, 12576853) ])), -- -- JOIN the variants with the genomic intervals overlapping -- the genes of interest. -- -- The JOIN criteria is complicated because the task is to see if -- an SNP overlaps an interval. With standard SQL you can use complex -- JOIN predicates, including arbitrary expressions. gene_variants AS ( SELECT reference_name, start_position, reference_bases, alt, num_variant_alleles, total_num_alleles FROM variants INNER JOIN intervals ON variants.reference_name = intervals.Chr AND intervals.region_start <= variants.start_position AND intervals.region_end >= variants.end_position ) -- -- And finally JOIN the variants in the regions of interest -- with annotations for rare variants. SELECT DISTINCT Chr, annots.Start AS Start, Ref, annots.Alt, Func, Gene, PopFreqMax, ExonicFunc, num_variant_alleles, total_num_alleles FROM `silver-wall-555.TuteTable.hg19` AS annots INNER JOIN gene_variants AS vars ON vars.reference_name = annots.Chr AND vars.start_position = annots.Start AND vars.reference_bases = annots.Ref AND vars.alt = annots.Alt WHERE -- Retrieve annotations for rare variants only. PopFreqMax <= 0.01 ORDER BY Chr, Start;
Clique em Executar consulta. A consulta leva cerca de 10 segundos para ser executada e processa cerca de 334 GB de dados. Os resultados da consulta identificam variantes raras dentro da coorte que se sobrepõem às regiões de interesse.
Expanda a seção a seguir para ver os resultados da consulta:
Resultados da consulta
Chr Iniciar Ref Alt Função Gene PopFreqMax Funco exonic num_variante_todos total_num_aeleis 1 156699757 Q C intronético RRNAD1 0,002 2 4 1 156705390 C Q intronético RRNAD1 8E-4 0 2 1 156714207 Q C intronético HDGF 0.003 0 6 1 156714440 A C intronético HDGF 0,0068 0 12 1 156723870 C Q intergênico / intergênica HDGF,RPC 0,006 1 2 1 156724456 C Q intergênico / intergênica HDGF,RPC 0,002 2 4 1 156733988 C Q intergênico / intergênica HDGF,RPC 0,001 1 2 1 156742258 Q G intronético República Popular da China 0,001 2 4 1 156744826 Q G intronético República Popular da China 0,002 0 8 1 156779764 G A intronético SH2D2A 0,001 2 4 1 156783454 A C intronético SH2D2A 0,0014 1 2 1 156786144 C Q intronético NTRK1,SH2D2A 0,0031 2 4 1 156790510 A Q intronético NTRK1 0,002 1 2 1 156815332 A C intronético INSRR.NTRK1 0.003 0 2 1 156830778 G A exônica NTRK1 0,0067 Missense 2 4 1 156842064 C Q intronético NTRK1 0,0014 1 2 1 156843438 C A exônica NTRK1 0,0032 Missense 1 2 1 156845773 C Q intronético NTRK1 0,001 2 4 1 156873318 Q C intronético PERA1 0,01 4 8 1 156922740 G A intronético ARHEFEF11 0,007 1 2 1 156930100 C Q intronético ARHEFEF11 0,001 2 4 2 113901230 G A intergênico / intergênica IL1RN (PSD4) 0,0082 1 2 2 113953418 C A intronético PSD4 0,001 2 4 2 113967621 G C intergênico / intergênica PSD4,PAX8 0,002 0 6 2 113967624 Q C intergênico / intergênica PSD4,PAX8 0,002 0 2 2 113980967 G A intronético Pax 8 0,002 2 4 2 113994010 A C ncRNA_exônico PAX8-AS1 0,001 0 4 2 113997745 C A ncRNA_exônico PAX8-AS1 0,001 2 4 2 114061327 Q C intergênico / intergênica PAX8,CBWD2 0,001 2 4 2 114084018 A C intergênico / intergênica PAX8,CBWD2 0,0045 0 4 2 114099037 G A intergênico / intergênica PAX8,CBWD2 0,0051 1 2 2 114105670 A Q intergênico / intergênica PAX8,CBWD2 0,001 1 2 2 114111325 G Q intergênico / intergênica PAX8,CBWD2 0,001 1 2 3 12265797 C Q intergênico / intergênica P2 0,0089 2 4 3 12277958 A G intergênico / intergênica P2 0,002 1 2 3 12296019 G A intergênico / intergênica P2 0,002 2 4 3 12316549 G C intergênico / intergênica P2 0,002 1 2 3 12335681 Q G intronético PPARG 0,0092 2 4 3 12348795 Q C intronético PPARG 0,0014 1 2 3 12353106 Q C intronético PPARG 0,001 2 4 3 12403825 G A intronético PPARG 0,0051 2 4 3 12404394 G A intronético PPARG 0,001 1 2 3 12410289 G A intronético PPARG 0,008 2 4 3 12431381 C Q intronético PPARG 0,0061 2 4 3 12447267 G A intronético PPARG 0,0089 2 4 3 12449379 C Q intronético PPARG 0,0092 2 4 3 12450848 C A intronético PPARG 0,0092 2 4 3 12462847 Q C intronético PPARG 0,002 1 2 3 12492797 G A intergênico / intergênica PPARG (TSEN2) 0,01 1 2 3 12503201 G A intergênico / intergênica PPARG (TSEN2) 0,0099 2 4 3 12530460 A G intronético TSEN2 0,0092 2 4 3 12531167 A G intronético TSEN2 0,0099 2 4 3 12557737 A G intronético TSEN2 0,001 2 4 3 59636143 A G intergênico / intergênica C3orf67,FHIT 0.003 3 6 3 59645934 A C intergênico / intergênica C3orf67,FHIT 0,004 1 2 3 59646893 G A intergênico / intergênica C3orf67,FHIT 0,002 1 2 3 59697024 A G intergênico / intergênica C3orf67,FHIT 0,0072 1 2 3 59701013 G A intergênico / intergênica C3orf67,FHIT 0,004 2 4 3 59733945 A G intergênico / intergênica C3orf67,FHIT 0,001 2 4 3 59747482 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59750635 A G intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 59757776 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59770612 G A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59804444 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59819769 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59884396 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59960728 A C intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 59970345 G A intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 59972417 Q A intronético CONDICIONAMENTO FÍSICO 0,0072 0 2 3 60104328 C A intronético CONDICIONAMENTO FÍSICO 0,01 2 4 3 60139062 G A intronético CONDICIONAMENTO FÍSICO 0,01 0 2 3 60158066 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60169285 C Q intronético CONDICIONAMENTO FÍSICO 0,005 1 2 3 60216185 Q C intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 60226380 G A intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60234539 C A intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 60247464 A C intronético CONDICIONAMENTO FÍSICO 0,004 2 4 3 60269926 A G intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60271228 G Q intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60286972 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60301412 C G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60312251 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 60317682 A G intronético CONDICIONAMENTO FÍSICO 0,008 1 2 3 60328557 C G intronético CONDICIONAMENTO FÍSICO 0,0043 2 4 3 60342562 C Q intronético CONDICIONAMENTO FÍSICO 0,006 1 2 3 60400033 G A intronético CONDICIONAMENTO FÍSICO 0,004 2 4 3 60435819 C Q intronético CONDICIONAMENTO FÍSICO 0,006 2 4 3 60435820 G Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60441288 Q C intronético CONDICIONAMENTO FÍSICO 0,006 2 4 3 60444465 C A intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 60444575 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60450581 Q C intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 60456571 G A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60473568 C G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60487557 Q C intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60559705 A G intronético CONDICIONAMENTO FÍSICO 0,002 2 4 3 60570764 Q C intronético CONDICIONAMENTO FÍSICO 0,008 2 4 3 60582100 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60587192 G A intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60599869 G A intronético CONDICIONAMENTO FÍSICO 0,0086 2 4 3 60603091 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60603250 A Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 60609831 Q G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60619756 G Q intronético CONDICIONAMENTO FÍSICO 0,0015 2 4 3 60680758 C Q intronético CONDICIONAMENTO FÍSICO 0,0089 2 4 3 60702243 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60702532 A G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60714328 A Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60725297 G A intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60726640 G A intronético CONDICIONAMENTO FÍSICO 0,01 2 4 3 60795144 A G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60807171 A G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60813868 Q C intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60826546 C G intronético CONDICIONAMENTO FÍSICO 0,0023 1 2 3 60837392 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60846310 A G intronético CONDICIONAMENTO FÍSICO 0,01 0 2 3 60850985 C Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60852559 Q C intronético CONDICIONAMENTO FÍSICO 0,008 1 2 3 60871759 Q C intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60884396 C Q intronético CONDICIONAMENTO FÍSICO 0,002 2 4 3 60897092 C A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60940759 C Q intronético CONDICIONAMENTO FÍSICO 0,0089 1 2 3 60982595 A G intronético CONDICIONAMENTO FÍSICO 0.003 2 4 3 60999283 G A intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 61042977 A G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61043349 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61044789 A C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61141621 G A intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 61148655 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61170747 C Q intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 61189473 C G intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61190425 C Q intronético CONDICIONAMENTO FÍSICO 0,0023 2 4 3 61193853 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61194793 C Q intronético CONDICIONAMENTO FÍSICO 0,007 0 2 3 61194840 A G intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61194886 Q A intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61201777 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61202292 Q C intronético CONDICIONAMENTO FÍSICO 0,007 1 2 3 61232806 G C intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61232910 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61235824 A Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61283810 A C intergênico / intergênica FHIT,PTPRG 0,0089 1 2 3 61293731 Q A intergênico / intergênica FHIT,PTPRG 0,0089 2 4 3 61296730 C Q intergênico / intergênica FHIT,PTPRG 0,001 1 2 3 61326341 C Q intergênico / intergênica FHIT,PTPRG 0,004 2 4 3 61326620 Q C intergênico / intergênica FHIT,PTPRG 0,01 1 2 3 61327649 G C intergênico / intergênica FHIT,PTPRG 0,001 2 4 3 61330545 G C intergênico / intergênica FHIT,PTPRG 0,001 2 4 3 61335803 G A intergênico / intergênica FHIT,PTPRG 0,001 2 4 Uma consulta semelhante usando dados de Fase 3 do 1000 Genomes leva cerca de 90 segundos para ser executada e processa cerca de 3,38 TB de dados.
Usar uma tabela materializada
Ao trabalhar com Big Data em escala, é possível materializar uma tabela de intervalo e executar uma consulta JOIN
na nova tabela. Antes de continuar com o restante desta seção, crie um conjunto de dados seguindo estas etapas:
Abra a página do BigQuery no console do Google Cloud.
No painel Explorador, selecione o projeto em que você quer criar o conjunto de dados.
Expanda a opção
Ações e clique em Criar conjunto de dados.Na página Criar conjunto de dados, faça o seguinte:
- Para o código do conjunto de dados, insira
genomics
. - Mantenha as outras configurações padrão.
- Clique em Criar conjunto de dados.
- Para o código do conjunto de dados, insira
Consultar uma tabela materializada com genes específicos
As etapas a seguir mostram como materializar uma nova tabela de intervalos que contém uma lista de genes específicos da tabela silver-wall-555:TuteTable.hg19.
Para criar a tabela de intervalos, siga estas etapas:
Abra a página do BigQuery no console do Google Cloud.
Clique em Compose query.
No campo Nova consulta, execute a consulta a seguir. A consulta materializa parte da tabela silver-wall-555:TuteTable.hg19 para uma nova tabela de intervalo
genomics.myIntervalTable
.#standardSQL CREATE TABLE `genomics.myIntervalTable` AS ( SELECT Gene, Chr, MIN(Start) AS gene_start, MAX(`End`) AS gene_end, MIN(Start)-100000 AS region_start, MAX(`End`)+100000 AS region_end FROM `silver-wall-555.TuteTable.hg19` WHERE Gene IN ('APC', 'ATM', 'BMPR1A', 'BRCA1', 'BRCA2', 'CDK4', 'CDKN2A', 'CREBBP', 'EGFR', 'EP300', 'ETV6', 'FHIT', 'FLT3', 'HRAS', 'KIT', 'MET', 'MLH1', 'NTRK1', 'PAX8', 'PDGFRA', 'PPARG', 'PRCC', 'PRKAR1A', 'PTEN', 'RET', 'STK11', 'TFE3', 'TGFB1', 'TGFBR2', 'TP53', 'WWOX') GROUP BY Chr, Gene );
Clique em Executar consulta. A consulta retorna o seguinte resultado:
This statement created a new table named PROJECT_ID:genomics.myIntervalTable.
No campo Nova consulta, execute a seguinte consulta:
#standardSQL WITH -- -- Retrieve the variants in this cohort, flattening by alternate bases and -- counting affected alleles. variants AS ( SELECT REPLACE(reference_name, 'chr', '') as reference_name, start_position, end_position, reference_bases, alternate_bases.alt AS alt, (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles, (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles FROM `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v, UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ), -- -- JOIN the variants with the genomic intervals overlapping -- the genes of interest. -- -- The JOIN criteria is complicated because the task is to see if -- an SNP overlaps an interval. With standard SQL you can use complex -- JOIN predicates, including arbitrary expressions. gene_variants AS ( SELECT reference_name, start_position, reference_bases, alt, num_variant_alleles, total_num_alleles FROM variants INNER JOIN `genomics.myIntervalTable` AS intervals ON variants.reference_name = intervals.Chr AND intervals.region_start <= variants.start_position AND intervals.region_end >= variants.end_position ) -- -- And finally JOIN the variants in the regions of interest -- with annotations for rare variants. SELECT DISTINCT Chr, annots.Start AS Start, Ref, annots.Alt, Func, Gene, PopFreqMax, ExonicFunc, num_variant_alleles, total_num_alleles FROM `silver-wall-555.TuteTable.hg19` AS annots INNER JOIN gene_variants AS vars ON vars.reference_name = annots.Chr AND vars.start_position = annots.Start AND vars.reference_bases = annots.Ref AND vars.alt = annots.Alt WHERE -- Retrieve annotations for rare variants only. PopFreqMax <= 0.01 ORDER BY Chr, Start;
Clique em Executar consulta. A consulta leva cerca de 10 segundos para ser executada e processa cerca de 334 GB de dados. Os resultados da consulta identificam variantes raras dentro da coorte que se sobrepõem às regiões de interesse.
Expanda a seção a seguir para ver os resultados da consulta:
Resultados da consulta
Chr Iniciar Ref Alt Função Gene PopFreqMax Funco exonic num_variante_todos total_num_aeleis 1 156699757 Q C intronético RRNAD1 0,002 2 4 1 156705390 C Q intronético RRNAD1 8E-4 0 2 1 156714207 Q C intronético HDGF 0.003 0 6 1 156714440 A C intronético HDGF 0,0068 0 12 1 156723870 C Q intergênico / intergênica HDGF,RPC 0,006 1 2 1 156724456 C Q intergênico / intergênica HDGF,RPC 0,002 2 4 1 156733988 C Q intergênico / intergênica HDGF,RPC 0,001 1 2 1 156742258 Q G intronético República Popular da China 0,001 2 4 1 156744826 Q G intronético República Popular da China 0,002 0 8 1 156779764 G A intronético SH2D2A 0,001 2 4 1 156783454 A C intronético SH2D2A 0,0014 1 2 1 156786144 C Q intronético NTRK1,SH2D2A 0,0031 2 4 1 156790510 A Q intronético NTRK1 0,002 1 2 1 156815332 A C intronético INSRR.NTRK1 0.003 0 2 1 156830778 G A exônica NTRK1 0,0067 Missense 2 4 1 156842064 C Q intronético NTRK1 0,0014 1 2 1 156843438 C A exônica NTRK1 0,0032 Missense 1 2 1 156845773 C Q intronético NTRK1 0,001 2 4 1 156873318 Q C intronético PERA1 0,01 4 8 1 156922740 G A intronético ARHEFEF11 0,007 1 2 1 156930100 C Q intronético ARHEFEF11 0,001 2 4 2 113901230 G A intergênico / intergênica IL1RN (PSD4) 0,0082 1 2 2 113953418 C A intronético PSD4 0,001 2 4 2 113967621 G C intergênico / intergênica PSD4,PAX8 0,002 0 6 2 113967624 Q C intergênico / intergênica PSD4,PAX8 0,002 0 2 2 113980967 G A intronético Pax 8 0,002 2 4 2 113994010 A C ncRNA_exônico PAX8-AS1 0,001 0 4 2 113997745 C A ncRNA_exônico PAX8-AS1 0,001 2 4 2 114061327 Q C intergênico / intergênica PAX8,CBWD2 0,001 2 4 2 114084018 A C intergênico / intergênica PAX8,CBWD2 0,0045 0 4 2 114099037 G A intergênico / intergênica PAX8,CBWD2 0,0051 1 2 2 114105670 A Q intergênico / intergênica PAX8,CBWD2 0,001 1 2 2 114111325 G Q intergênico / intergênica PAX8,CBWD2 0,001 1 2 3 12265797 C Q intergênico / intergênica P2 0,0089 2 4 3 12277958 A G intergênico / intergênica P2 0,002 1 2 3 12296019 G A intergênico / intergênica P2 0,002 2 4 3 12316549 G C intergênico / intergênica P2 0,002 1 2 3 12335681 Q G intronético PPARG 0,0092 2 4 3 12348795 Q C intronético PPARG 0,0014 1 2 3 12353106 Q C intronético PPARG 0,001 2 4 3 12403825 G A intronético PPARG 0,0051 2 4 3 12404394 G A intronético PPARG 0,001 1 2 3 12410289 G A intronético PPARG 0,008 2 4 3 12431381 C Q intronético PPARG 0,0061 2 4 3 12447267 G A intronético PPARG 0,0089 2 4 3 12449379 C Q intronético PPARG 0,0092 2 4 3 12450848 C A intronético PPARG 0,0092 2 4 3 12462847 Q C intronético PPARG 0,002 1 2 3 12492797 G A intergênico / intergênica PPARG (TSEN2) 0,01 1 2 3 12503201 G A intergênico / intergênica PPARG (TSEN2) 0,0099 2 4 3 12530460 A G intronético TSEN2 0,0092 2 4 3 12531167 A G intronético TSEN2 0,0099 2 4 3 12557737 A G intronético TSEN2 0,001 2 4 3 59636143 A G intergênico / intergênica C3orf67,FHIT 0.003 3 6 3 59645934 A C intergênico / intergênica C3orf67,FHIT 0,004 1 2 3 59646893 G A intergênico / intergênica C3orf67,FHIT 0,002 1 2 3 59697024 A G intergênico / intergênica C3orf67,FHIT 0,0072 1 2 3 59701013 G A intergênico / intergênica C3orf67,FHIT 0,004 2 4 3 59733945 A G intergênico / intergênica C3orf67,FHIT 0,001 2 4 3 59747482 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59750635 A G intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 59757776 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59770612 G A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59804444 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59819769 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59884396 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 59960728 A C intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 59970345 G A intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 59972417 Q A intronético CONDICIONAMENTO FÍSICO 0,0072 0 2 3 60104328 C A intronético CONDICIONAMENTO FÍSICO 0,01 2 4 3 60139062 G A intronético CONDICIONAMENTO FÍSICO 0,01 0 2 3 60158066 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60169285 C Q intronético CONDICIONAMENTO FÍSICO 0,005 1 2 3 60216185 Q C intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 60226380 G A intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60234539 C A intronético CONDICIONAMENTO FÍSICO 0,002 1 2 3 60247464 A C intronético CONDICIONAMENTO FÍSICO 0,004 2 4 3 60269926 A G intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60271228 G Q intronético CONDICIONAMENTO FÍSICO 0,007 2 4 3 60286972 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60301412 C G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60312251 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 60317682 A G intronético CONDICIONAMENTO FÍSICO 0,008 1 2 3 60328557 C G intronético CONDICIONAMENTO FÍSICO 0,0043 2 4 3 60342562 C Q intronético CONDICIONAMENTO FÍSICO 0,006 1 2 3 60400033 G A intronético CONDICIONAMENTO FÍSICO 0,004 2 4 3 60435819 C Q intronético CONDICIONAMENTO FÍSICO 0,006 2 4 3 60435820 G Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60441288 Q C intronético CONDICIONAMENTO FÍSICO 0,006 2 4 3 60444465 C A intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 60444575 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60450581 Q C intronético CONDICIONAMENTO FÍSICO 0,01 1 2 3 60456571 G A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60473568 C G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60487557 Q C intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60559705 A G intronético CONDICIONAMENTO FÍSICO 0,002 2 4 3 60570764 Q C intronético CONDICIONAMENTO FÍSICO 0,008 2 4 3 60582100 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60587192 G A intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60599869 G A intronético CONDICIONAMENTO FÍSICO 0,0086 2 4 3 60603091 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60603250 A Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 60609831 Q G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60619756 G Q intronético CONDICIONAMENTO FÍSICO 0,0015 2 4 3 60680758 C Q intronético CONDICIONAMENTO FÍSICO 0,0089 2 4 3 60702243 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60702532 A G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60714328 A Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60725297 G A intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60726640 G A intronético CONDICIONAMENTO FÍSICO 0,01 2 4 3 60795144 A G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60807171 A G intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60813868 Q C intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60826546 C G intronético CONDICIONAMENTO FÍSICO 0,0023 1 2 3 60837392 C Q intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 60846310 A G intronético CONDICIONAMENTO FÍSICO 0,01 0 2 3 60850985 C Q intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60852559 Q C intronético CONDICIONAMENTO FÍSICO 0,008 1 2 3 60871759 Q C intronético CONDICIONAMENTO FÍSICO 0,004 1 2 3 60884396 C Q intronético CONDICIONAMENTO FÍSICO 0,002 2 4 3 60897092 C A intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 60940759 C Q intronético CONDICIONAMENTO FÍSICO 0,0089 1 2 3 60982595 A G intronético CONDICIONAMENTO FÍSICO 0.003 2 4 3 60999283 G A intronético CONDICIONAMENTO FÍSICO 0,001 1 2 3 61042977 A G intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61043349 Q C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61044789 A C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61141621 G A intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 61148655 G C intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61170747 C Q intronético CONDICIONAMENTO FÍSICO 0.003 1 2 3 61189473 C G intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61190425 C Q intronético CONDICIONAMENTO FÍSICO 0,0023 2 4 3 61193853 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61194793 C Q intronético CONDICIONAMENTO FÍSICO 0,007 0 2 3 61194840 A G intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61194886 Q A intronético CONDICIONAMENTO FÍSICO 0,0099 0 2 3 61201777 C Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61202292 Q C intronético CONDICIONAMENTO FÍSICO 0,007 1 2 3 61232806 G C intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61232910 C Q intronético CONDICIONAMENTO FÍSICO 0,0099 1 2 3 61235824 A Q intronético CONDICIONAMENTO FÍSICO 0,001 2 4 3 61283810 A C intergênico / intergênica FHIT,PTPRG 0,0089 1 2 3 61293731 Q A intergênico / intergênica FHIT,PTPRG 0,0089 2 4 3 61296730 C Q intergênico / intergênica FHIT,PTPRG 0,001 1 2 3 61326341 C Q intergênico / intergênica FHIT,PTPRG 0,004 2 4 3 61326620 Q C intergênico / intergênica FHIT,PTPRG 0,01 1 2 3 61327649 G C intergênico / intergênica FHIT,PTPRG 0,001 2 4 3 61330545 G C intergênico / intergênica FHIT,PTPRG 0,001 2 4 3 61335803 G A intergênico / intergênica FHIT,PTPRG 0,001 2 4 Uma consulta semelhante usando dados de Fase 3 do 1000 Genomes leva cerca de 90 segundos para ser executada e processa cerca de 3,38 TB de dados.
Consultar uma tabela materializada com 250 genes aleatórios
O exemplo a seguir mostra como executar um JOIN
de intervalo em uma tabela materializada que contém 250 genes selecionados aleatoriamente da tabela silver-wall-555:TuteTable.hg19.
Para criar a tabela de intervalos, siga estas etapas:
Abra a página do BigQuery no console do Google Cloud.
Clique em Compose query.
No campo Nova consulta, execute a consulta a seguir, que materializa parte da tabela silver-wall-555:TuteTable.hg19 para uma nova tabela de intervalo
genomics.randomGenesIntervalTable
.#standardSQL CREATE TABLE `genomics.randomGenesIntervalTable` AS ( SELECT Gene, Chr, MIN(Start) AS gene_start, MAX(`End`) AS gene_end, MIN(Start) - 100000 AS region_start, MAX(`End`) + 100000 AS region_end FROM `silver-wall-555.TuteTable.hg19` WHERE Gene IN (SELECT Gene FROM `silver-wall-555.TuteTable.hg19` GROUP BY Gene LIMIT 250) GROUP BY Chr, Gene );
- Clique em Executar consulta. A consulta retorna o seguinte resultado:
This statement created a new table named PROJECT_ID:genomics.randomGenesIntervalTable.
No campo Nova consulta, execute a seguinte consulta:
#standardSQL WITH -- -- Retrieve the variants in this cohort, flattening by alternate bases and -- counting affected alleles. variants AS ( SELECT REPLACE(reference_name, 'chr', '') as reference_name, start_position, end_position, reference_bases, alternate_bases.alt AS alt, (SELECT COUNTIF(gt = alt_offset+1) FROM v.call call, call.genotype gt) AS num_variant_alleles, (SELECT COUNTIF(gt >= 0) FROM v.call call, call.genotype gt) AS total_num_alleles FROM `bigquery-public-data.human_genome_variants.platinum_genomes_deepvariant_variants_20180823` v, UNNEST(v.alternate_bases) alternate_bases WITH OFFSET alt_offset ), -- -- JOIN the variants with the genomic intervals overlapping -- the genes of interest. -- -- The JOIN criteria is complicated because the task is to see if -- an SNP overlaps an interval. With standard SQL you can use complex -- JOIN predicates, including arbitrary expressions. gene_variants AS ( SELECT reference_name, start_position, reference_bases, alt, num_variant_alleles, total_num_alleles FROM variants INNER JOIN `genomics.randomGenesIntervalTable` AS intervals ON variants.reference_name = intervals.Chr AND intervals.region_start <= variants.start_position AND intervals.region_end >= variants.end_position ) -- -- And finally JOIN the variants in the regions of interest -- with annotations for rare variants. SELECT DISTINCT Chr, annots.Start AS Start, Ref, annots.Alt, Func, Gene, PopFreqMax, ExonicFunc, num_variant_alleles, total_num_alleles FROM `silver-wall-555.TuteTable.hg19` AS annots INNER JOIN gene_variants AS vars ON vars.reference_name = annots.Chr AND vars.start_position = annots.Start AND vars.reference_bases = annots.Ref AND vars.alt = annots.Alt WHERE -- Retrieve annotations for rare variants only. PopFreqMax <= 0.01 ORDER BY Chr, Start;
Clique em Executar consulta. A consulta leva cerca de 10 segundos para ser executada e processa cerca de 334 GB de dados. Os resultados da consulta identificam variantes raras dentro da coorte que se sobrepõem às regiões de interesse.
Expanda a seção a seguir para ver os resultados truncados da consulta:
Resultados da consulta
Chr Iniciar Ref Alt Função Gene PopFreqMax Funco exonic num_variante_todos total_num_aeleis 1 2925355 C A intergênico / intergênica TTC34,ACTRT2 0,001 2 4 1 2933170 G A intergênico / intergênica TTC34,ACTRT2 0,0083 0 4 1 2944477 G A intergênico / intergênica ACTRT2.LINC00982 0.003 4 6 1 2967591 A Q intergênico / intergênica ACTRT2.LINC00982 0,0092 1 2 1 2975255 Q C downstream LINC00982 0,0082 1 2 1 2977223 C Q ncRNA_intronico LINC00982 0,0072 1 2 1 2978803 G C ncRNA_exônico LINC00982 0,002 4 6 1 3006466 G A intronético PRDM16 0,0098 1 2 1 3011333 G Q intronético PRDM16 0,004 1 2 1 3019659 C Q intronético PRDM16 0,0031 1 2 1 3036896 G A intronético PRDM16 0,001 1 2 1 3037388 G A intronético PRDM16 0,002 2 4 1 3041250 Q G intronético PRDM16 0,006 2 4 1 3042502 A Q intronético PRDM16 0.003 4 6 1 3053713 A C intronético PRDM16 0,002 1 2 1 3063109 C Q intronético PRDM16 0,002 0 2 1 3063593 Q C intronético PRDM16 0.003 1 2 1 3076439 C Q intronético PRDM16 0,001 2 4 1 3078960 G A intronético PRDM16 0,007 2 4 1 3084268 A C intronético PRDM16 0,005 0 2 1 3084492 Q C intronético PRDM16 0,0015 0 2 1 3084786 Q C intronético PRDM16 0,0015 0 4 1 3111119 G A intronético PRDM16 0.003 1 2 1 3111643 C Q intronético PRDM16 0,0041 1 2 1 3114807 G A intronético PRDM16 0,0041 1 2 1 3165530 C Q intronético PRDM16 0,0089 1 2 1 3169325 G A intronético PRDM16 0,008 2 4 1 3179623 C Q intronético PRDM16 0.003 2 4 1 3181097 C Q intronético PRDM16 0,001 2 4 1 3194000 G C intronético PRDM16 0,005 2 4 1 3195769 Q C intronético PRDM16 0,002 1 2 1 3197351 C Q intronético PRDM16 0,0061 1 2 1 3224100 C A intronético PRDM16 0.003 2 4 1 3228644 G Q intronético PRDM16 0,001 2 4 1 3234045 G A intronético PRDM16 0,002 1 2 1 3235971 G A intronético PRDM16 0,0089 1 2 1 3274115 C Q intronético PRDM16 0,001 2 4 1 3291388 G A intronético PRDM16 0,002 2 4 1 3295658 A C intronético PRDM16 0,0068 0 6 1 3295937 A C intronético PRDM16 0,0068 0 2 1 3296205 Q C intronético PRDM16 0,0083 0 2 1 3315690 G A intronético PRDM16 0,001 2 4 1 3329212 G A exônica PRDM16 0,0031 Missense 1 2 1 3331787 C Q intronético PRDM16 0,0099 1 2 1 3370316 G C upstream ARHGEF16 0,001 2 4 1 3379560 A G intronético ARHGEF16 0,0051 0 6 1 3391174 C Q intronético ARHGEF16 0,006 1 2 1 3413873 G A exônica MEG 0.003 Missense 1 2 1 3416272 C Q exônica MEG 0,0072 silencioso 2 4 1 3417122 G A intronético MEG 0,0038 2 4 1 3436219 G A intronético MEG 0,0046 2 4 1 12907456 A G exônica HNRNPCL1,LOC649330 0,006 Missense 0 10 1 12907518 C A exônica HNRNPCL1,LOC649330 1.0E-4 Missense 0 10 1 12908499 G C intronético HNRNPCL1 0,0031 0 8 1 12931660 G C intergênico / intergênica PRAMEF2,PRAMEF4 0,004 1 2 1 12937721 G Q intergênico / intergênica PRAMEF2,PRAMEF4 0,0038 0 2 1 12940827 G Q intronético PRAMEF4 0,007 2 4 1 12942759 Q G intronético PRAMEF4 0,0076 0 10 1 12942805 Q G intronético PRAMEF4 0,0061 0 12 1 12942812 G A intronético PRAMEF4 0,0061 0 12 1 12942875 A G intronético PRAMEF4 0,0068 0 6 1 12942912 G C intronético PRAMEF4 2.0E a 4 0 2 1 12942937 A Q exônica PRAMEF4 0,0029 Missense 0 2 1 12942940 Q G exônica PRAMEF4 0,0038 Missense 0 2 1 12943940 Q C intronético PRAMEF4 0,0015 0 12 1 12944138 A G intronético PRAMEF4 8E-4 0 12 1 12944234 G A intronético PRAMEF4 0,0015 0 12 1 12944589 Q G intronético PRAMEF4 0.003 0 4 1 12944845 A C intronético PRAMEF4 0,0014 0 6 1 12946439 Q C upstream PRAMEF4 0,0029 0 10 1 12946833 G A upstream PRAMEF4 0,001 0 8 1 12946835 Q A upstream PRAMEF4 0,004 0 12 1 12995204 G Q intergênico / intergênica PRAMEF8 e PRAMEF6 0.003 1 4 1 12997638 Q C downstream PRAMEF6,PRAMEF9 0.003 2 4 1 13007841 G C upstream PRAMEF6 0,0043 0 8 1 13019228 Q A intergênico / intergênica PRAMEF6,LOC391003 0,0015 0 10 1 13038503 G A UTR3 LOC 391.003 0,0072 1 2 1 13051650 C Q intergênico / intergênica LOC391003,PRAMEF5 0,002 2 4 1 15706063 G A intronético FHAD1 0,0029 1 2 1 15713292 C Q intronético FHAD1 0,001 1 2 1 15766541 G C intronético CTRC (taxa de cliques) 0,001 1 2 1 15782601 Q C upstream CELA2A 0,0038 1 2 1 15828125 G A intronético CASP9 0,0014 2 4 1 15831037 G A intronético CASP9 0,0099 1 2 1 15840513 Q G intronético CASP9 0,0043 2 4 1 15868742 G A intronético DNAJC16 0,001 1 2 1 15876704 G A intronético DNAJC16 0,001 1 2 1 15900342 C A intronético AGMAT 0,001 1 2 1 15906257 Q C intronético AGMAT 8E-4 1 2 1 15911897 A G upstream AGMAT 0,0043 2 4 1 22764178 C Q intergênico / intergênica WNT4,ZBTB40 0,001 2 4 1 22791939 C Q intronético ZB TB 40,00 0,0089 2 4 1 22874394 C G intergênico / intergênica ZBTB 40,EPA8 0,007 1 2 1 22875103 C G intergênico / intergênica ZBTB 40,EPA8 0,007 1 2 1 22906403 C Q intronético EPHA8 0,008 2 4 1 22912956 G A intronético EPHA8 0,001 1 2 1 22917007 C Q intronético EPHA8 0,001 2 4 1 22927240 G A exônica EPHA8 0,0013 Missense 2 4 1 22932265 G A intergênico / intergênica Epha8,MIR6127 0,0089 2 4 1 22944057 C Q intergênico / intergênica Epha8,MIR6127 0,0089 2 4 1 22978799 A G upstream C1QB 0,0099 2 4 1 35170588 C Q intergênico / intergênica C1orf94,GJB5 0,01 1 2 1 35172426 C Q intergênico / intergênica C1orf94,GJB5 0,008 1 2 1 35172447 G A intergênico / intergênica C1orf94,GJB5 0,001 1 2 1 35175302 C Q intergênico / intergênica C1orf94,GJB5 0,008 1 2 1 35177410 A Q intergênico / intergênica C1orf94,GJB5 0,001 1 2 1 35178768 C Q intergênico / intergênica C1orf94,GJB5 0,0014 2 4 1 35179362 G A intergênico / intergênica C1orf94,GJB5 0,0014 2 4 1 35186166 G A intergênico / intergênica C1orf94,GJB5 0,0099 2 4 1 35186520 A C intergênico / intergênica C1orf94,GJB5 0,002 2 4 1 35196361 G A intergênico / intergênica C1orf94,GJB5 0,0099 2 4 1 35223545 C Q exônica GJb5 0,001 silencioso 1 2 1 35224029 G A UTR3 GJb5 0.003 1 2 1 35227895 Q C UTR3 JJB4 5 E/4 1 2 1 35230455 G Q intergênico / intergênica GJB4 e GJB3 0,0043 1 2 1 35232954 Q C intergênico / intergênica GJB4 e GJB3 0.003 1 2 1 35237986 G A intergênico / intergênica GJB4 e GJB3 0,0014 1 2 1 35245522 C Q intergênico / intergênica GJB4 e GJB3 0,001 1 2 1 35256979 C Q intergênico / intergênica GJB3 e GJA4 0,002 2 4 1 35263872 C Q intergênico / intergênica GJA4,SMIM12 5 E/4 2 4 1 35323895 A C intronético SMIM12 0,0027 2 4 1 35369676 G A intronético DLGAP3 0,007 2 4 1 35371634 Q A upstream DLGAP3 0,0015 0 4 1 39253519 G A intergênico / intergênica LINC01343 (RRAGC) 0,005 1 2 1 39288829 G A intergênico / intergênica LINC01343 (RRAGC) 0,0051 1 2 1 39289832 A C intergênico / intergênica LINC01343 (RRAGC) 0,002 0 2 1 39312638 G A intronético RRAGC 0,0038 2 4 1 39361372 G A intronético RHBDL2 0,005 1 2 1 39363826 Q G intronético RHBDL2 0,0029 1 2 1 39367555 Q C intronético RHBDL2 0,007 2 4 1 39369531 Q C intronético RHBDL2 0,001 2 4 1 39370202 Q C intronético RHBDL2 0,01 1 2 1 39449101 A G intergênico / intergênica RHBDL2 e AKIRIN1 0,001 2 4 1 39475057 G A intergênico / intergênica AKIRIN1,NDUFS5 0,01 1 2 1 39485016 C Q intergênico / intergênica AKIRIN1,NDUFS5 0,001 2 4 1 39488137 A G intergênico / intergênica AKIRIN1,NDUFS5 0,001 2 4 1 39499212 A C intronético NDUFS5 0,001 0 2 1 39500605 C G downstream NDUFS5 0,002 0 10 1 46813814 Q C intronético NSUN4 0,0014 1 2 1 46817258 A G intronético NSUN4 0,005 0 2 1 46843158 Q C intergênico / intergênica NSUN4,FAA 0,001 1 2 1 46933509 A G intergênico / intergênica LINC01398,DMBX1 0,002 1 2 1 46935021 G A intergênico / intergênica LINC01398,DMBX1 0,004 2 4 1 46939253 Q A intergênico / intergênica LINC01398,DMBX1 0,004 2 4 1 46951788 C A intergênico / intergênica LINC01398,DMBX1 0,002 2 4 1 46980864 G C downstream DMBX1 0.003 1 2 1 46989657 Q C intergênico / intergênica DMBX1,MKNK1-AS1 0,007 1 2 1 46994678 C Q intergênico / intergênica DMBX1,MKNK1-AS1 0,002 1 2 1 46999438 Q C intergênico / intergênica DMBX1,MKNK1-AS1 0,002 1 2 1 92761505 A G intronético GLMN 0,001 2 4 1 92764270 G C intronético GLMN 0,001 2 4 1 92802210 G A intronético RPAP2 0,0072 1 2 1 92820663 Q A intronético RPAP2 0,0058 1 2 1 92820664 G Q intronético RPAP2 0,0058 1 2 1 92820953 G A intronético RPAP2 0,007 2 4 1 92824766 A G intronético RPAP2 0,0058 1 2 1 92849183 C A intronético RPAP2 0,01 2 4 1 92850696 C G intronético RPAP2 0,0023 1 2 1 92861357 Q C intergênico / intergênica RPAP2 e GFI1 0,01 2 4 1 92877460 C G intergênico / intergênica RPAP2 e GFI1 0,002 1 2 1 92880643 A G intergênico / intergênica RPAP2 e GFI1 0,001 2 4 1 92911540 G A intergênico / intergênica RPAP2 e GFI1 0,004 2 4 1 92911721 A C intergênico / intergênica RPAP2 e GFI1 0,0031 0 8 1 92918277 C Q intergênico / intergênica RPAP2 e GFI1 0,001 2 4 1 92950920 G A intronético GFI1 0,008 2 4 1 92964788 G A intergênico / intergênica GFI1,EVI5 0,0023 1 2 1 92977480 C Q UTR3 EVI5 0,002 1 2 1 92985213 C Q intronético EVI5 0,001 2 4 1 92988342 C Q intronético EVI5 0,008 2 4 1 92992283 G A intronético EVI5 0,01 2 4 1 92999760 C Q intronético EVI5 0.003 1 2 1 93005149 G C intronético EVI5 0.003 0 4 1 93018543 A Q intronético EVI5 0,01 2 4 1 93033744 C Q intronético EVI5 0,001 2 4 1 111400296 G A intergênico / intergênica KCNA3,CD53 0,0014 2 4 1 111411924 C Q intergênico / intergênica KCNA3,CD53 0.003 1 2 1 111441850 C G UTR3 CD53S 0.003 2 4 1 111451527 C Q intergênico / intergênica CD53 e LRIF1 0,008 2 4 1 111454082 C A intergênico / intergênica CD53 e LRIF1 0,001 2 4 1 111466506 A G intergênico / intergênica CD53 e LRIF1 0,001 2 4 1 111525974 G A intergênico / intergênica LRIF1;DRAM2 0,002 2 4 1 111574573 G Q intergênico / intergênica LRIF1;DRAM2 0,0072 2 4 1 111574594 Q A intergênico / intergênica LRIF1;DRAM2 0,005 1 2 1 111574647 G A intergênico / intergênica LRIF1;DRAM2 0,005 1 2 1 111591746 Q A intergênico / intergênica LRIF1;DRAM2 0,005 1 2 1 111601459 A G intergênico / intergênica LRIF1;DRAM2 0,005 1 2 1 111604748 G C intergênico / intergênica LRIF1;DRAM2 0,005 1 2 1 112191526 Q G intronético RAP1A 0,001 2 4 1 112206765 A G intronético RAP1A 0,0043 1 2 1 112226517 G A intronético RAP1A 0,001 0 2 1 112263324 G Q intergênico / intergênica RAP1A,FAM212B 0.003 2 4 1 112264843 G A UTR3 FAM 212 bi 0,001 1 2 1 112285810 C Q ncRNA_intronico FAM212B-AS1 0,004 1 2 1 112304285 Q C intronético DDX20 0,0043 1 2 1 112307213 A C intronético DDX20 0,0043 1 2 1 112309436 G Q exônica DDX20 0,0 Missense 1 2 1 112317384 Q C intergênico / intergênica DDX20,KCND3 0,0014 1 2 1 112381367 C Q intronético KCND3 0,002 1 2 1 112396571 G Q ncRNA_exônico KCND3-IT1 0,001 1 2 1 113520038 G A intergênico / intergênica SLC16A1-AS1,LOC100996251 0,0023 1 2 Uma consulta semelhante usando dados de Fase 3 do 1000 Genomes leva cerca de 90 segundos para ser executada e processa cerca de 3,38 TB de dados.