BANCOS DE DADOS BIOLÓGICOS
O aumento na quantidade de dados biológicos disponíveis ficou evidente há alguns anos trazendo a necessidade de armazenamento e agrupamento destas informações. Diversos bancos de dados biológicos (BDB) foram e têm sido criados afim de armazenar e organizar de maneira lógica e estruturada os variados tipos de dados biológicos visando idealmente uma padronização. O fator de agrupamento das informações de cada BDB é dependente da necessidade ou interesse de quem os cria e/ou os utiliza.
Com os progressos nas técnicas de sequenciamento, os bancos de dados de sequências de nucleotídeos foram bastante incrementados em conteúdo e atualmente servem como base para diversas áreas de pesquisa. Dentre os principais BDB de sequências de nucleotídeos estão o GenBank (National Center for Biotechnology Information – NCBI), EMBL (European Bioinformatics Institute) e DDBJ (DNA Data Bank of Japan – National Institute of Genetics) que juntamente constituem o INSD (International Nucleotide Sequence Database). Além de centralizarem informações biológias sobre qualquer tipo de organismo, estes BDB trocam informações e servem como fonte para outros bancos de dados especializados.
Bancos especializados em algum tipo de informação têm sido de grande relevância quando olhamos para o tempo e facilidade entre busca e resultado. Um forte exemplo de um tipo de BDB especializado são compostos de dados de RNA ribossômico, dentre os mais conhecidos estão: Silva (contém sequências de 16S rRNA para Bacterias e Archaeas e 18S rRNA para Eucariotos), Greengenes (contém sequências de 16S rRNA de Bacterias e Archaeas) e RDP (Ribosomal Database Project – contém sequências de 16S rRNA de Bacterias, Archaeas e Fungos).
Mesmo que o objetivo inicial da criação dos bancos de dados biológicos fosse a centralização e facilidade de acesso de suas informações, atualmente são de elevada importância e foram sendo aprimorados podendo possuir flexibilidade e portabilidade para outras ferramentas, integrar muitos programas e aplicações voltados à análises biológicas, como por exemplo o BLAST (Basic Local Alignment Search Tool) que permite análises, buscas e comparações entre sequências.
As aplicações que utilizam como base bancos de dados biológicos são diversas.Vamos imaginar que comemos uma pizza que não nos caiu nada bem e que a causa aparenta ser do alimento contaminado por algum microrganismo. Uma alternativa para esclarecer esta dúvida poderia ser a de sequenciar o DNA dos microrganismos que haviam na pizza e comparar estas sequências em um banco de dados de sequências de microrganismos, certo? Diferentes verificações de controle de qualidade de alimentos, ambientes e processos podem ser solucionados partindo deste simples pensamento.
Bancos de dados biológicos ainda que aplicados de diversas formas em inúmeras áreas de pesquisa e agrupados por uma gama de fatores são dependentes da informação que os constitui e sua manutenção é essencial. Classes e padrões de curadoria foram estabelecidos para sabermos lidar com a qualidade da informação com que estamos trabalhando para que os resultados obtidos sejam biologicamente relevantes.
Curiosidade sugerida: Reconhecendo criminosos!
> http://www.nytimes.com/2009/04/19/us/19DNA.html
> https://www.forbes.com/sites/forbes-finds/2018/01/22/upgrade-your-valentines-day-flowers-with-these-6-tips/#6f7d5e9b3db9
Referências:
> Balvočiūtė, M; Huson, D. H. “SILVA, RDP, Greengenes, NCBI and OTT — how do these taxonomies compare?”. BMC Genomics 2017;
> Benson, D. A. etal. “GenBank”. Nucleic Acids Research, 2009, Vol. 37;
> Quast, C. et al. “The SILVA ribosomal RNA gene database project: improved data processing and web-based tools”. Nucleic Acids Research, 2013, Vol. 41;
> DeSantis, T. Z. et al. “Greengenes, a Chimera-Checked 16S rRNA Gene Database and Workbench Compatible with ARB”. Applied and environmental Microbiology, 2006, Vol. 72.