BANCOS DE DADOS BIOLÓGICOS

O aumento na quantidade de dados biológicos disponíveis ficou evidente há alguns anos trazendo a necessidade de armazenamento e agrupamento destas informações. Diversos bancos de dados biológicos (BDB) foram e têm sido criados afim de armazenar e organizar de maneira lógica e estruturada os variados tipos de dados biológicos visando idealmente uma padronização. O fator de agrupamento das informações de cada BDB é dependente da necessidade ou interesse de quem os cria e/ou os utiliza.

Com os progressos nas técnicas de sequenciamento, os bancos de dados de sequências de nucleotídeos foram bastante incrementados em conteúdo e atualmente servem como base para diversas áreas de pesquisa. Dentre os principais BDB de sequências de nucleotídeos estão o GenBank (National Center for Biotechnology Information – NCBI), EMBL (European Bioinformatics Institute) e DDBJ (DNA Data Bank of Japan – National Institute of Genetics) que juntamente constituem o INSD (International Nucleotide Sequence Database). Além de centralizarem informações biológias sobre qualquer tipo de organismo, estes BDB trocam informações e servem como fonte para outros bancos de dados especializados.

Bancos especializados em algum tipo de informação têm sido de grande relevância quando olhamos para o tempo e facilidade entre busca e resultado. Um forte exemplo de um tipo de BDB especializado são compostos de dados de RNA ribossômico, dentre os mais conhecidos estão: Silva (contém sequências de 16S rRNA para Bacterias e Archaeas e 18S rRNA para Eucariotos), Greengenes (contém sequências de 16S rRNA de Bacterias e Archaeas) e RDP (Ribosomal Database Project – contém sequências de 16S rRNA de Bacterias, Archaeas e Fungos).

Mesmo que o objetivo inicial da criação dos bancos de dados biológicos fosse a centralização e facilidade de acesso de suas informações, atualmente são de elevada importância e foram sendo aprimorados podendo possuir flexibilidade e portabilidade para outras ferramentas, integrar muitos programas e aplicações voltados à análises biológicas, como por exemplo o BLAST (Basic Local Alignment Search Tool) que permite análises, buscas e comparações entre sequências.

As aplicações que utilizam como base bancos de dados biológicos são diversas.Vamos imaginar que comemos uma pizza que não nos caiu nada bem e que a causa aparenta ser do alimento contaminado por algum microrganismo. Uma alternativa para esclarecer esta dúvida poderia ser a de sequenciar o DNA dos microrganismos que haviam na pizza e comparar estas sequências em um banco de dados de sequências de microrganismos, certo? Diferentes verificações de controle de qualidade de alimentos, ambientes e processos podem ser solucionados partindo deste simples pensamento.

Bancos de dados biológicos ainda que aplicados de diversas formas em inúmeras áreas de pesquisa e agrupados por uma gama de fatores são dependentes da informação que os constitui e sua manutenção é essencial. Classes e padrões de curadoria foram estabelecidos para sabermos lidar com a qualidade da informação com que estamos trabalhando para que os resultados obtidos sejam biologicamente relevantes.

Curiosidade sugerida: Reconhecendo criminosos!
> http://www.nytimes.com/2009/04/19/us/19DNA.html
> https://www.forbes.com/sites/forbes-finds/2018/01/22/upgrade-your-valentines-day-flowers-with-these-6-tips/#6f7d5e9b3db9

Referências:
> Balvočiūtė, M; Huson, D. H. “SILVA, RDP, Greengenes, NCBI and OTT — how do these taxonomies compare?”. BMC Genomics 2017;
> Benson, D. A. etal. “GenBank”. Nucleic Acids Research, 2009, Vol. 37;
> Quast, C. et al. “The SILVA ribosomal RNA gene database project: improved data processing and web-based tools”. Nucleic Acids Research, 2013, Vol. 41;
> DeSantis, T. Z. et al. “Greengenes, a Chimera-Checked 16S rRNA Gene Database and Workbench Compatible with ARB”. Applied and environmental Microbiology, 2006, Vol. 72.

 

Graduação em andamento em Sistemas de Informação. Conhecimento na área biotecnológica voltada ao estudo e análise bioinformática de genômica funcional e estrutural/comparativa.