Determinação do unigene do Projeto Genoma Café

Sales, Raphael M. O. B.; Andrade, Alan Carvalho; Silva, Felipe R. da

Determinação do unigene do Projeto Genoma Café

Arquivos

166733_Art059f.pdf (245.37 KB)

Data

2005

Autores

Sales, Raphael M. O. B.

Andrade, Alan Carvalho

Silva, Felipe R. da

Resumo

O Projeto Genoma Café gerou seqüências parciais de mais de duzentos mil clones de EST (Expressed Sequence Tag). Essa estratégia gera dados redundantes. Nesse trabalho, selecionamos o conjunto mínimo de clones que representam todos os transcritos encontrado no projeto. Para tanto, as 213.157 seqüências geradas pelo projeto, apos um processo criterioso que resultou em 145.507 seqüências limpas, foram agrupadas por similaridade dando origem a 32.958 possíveis transcritos, aqui chamados de Unigenes. Para cada Unigene, determinamos o clone correspondente à extremidade 5' o que, pela metodologia empregada na construção das bibliotecas, deve corresponder ao clone de maior extensão. Todos os resultados obtidos foram centralizados e organizados em uma base de dados relacional, de forma a facilitar sua utilização em posteriores aplicações de diferentes plataformas e linguagens. O SGDB usado foi o PostgreSQL. Desenvolvemos uma interface Web usando as linguagens PHP e Perl rodando sobre o Apache para permitir a usuários acesso aos dados de maneira simplificada e rápida. Escolhemos essas ferramentas por serem todas de código livre, permitindo personalizações, se necessárias, e por não agregarem nenhum vinculo de licença.
The Coffee Genome Project has generated partial sequences in excess of two hundred thousand EST (Expressed Sequence Tag) clones. This approach generates redundant data. In this work, we have devised the minimal clone set that represents all transcripts found in the project. The 213,157 sequences generated by the project were submitted to an elaborated cleaning process that resulted in 145,507 trimmed sequences. Those trimmed sequences where grouped by similarity in 32,958 putative transcripts, here called Unigenes. For each Unigene, we have picked the clone in the 5’ edge, which should correspond to the one with the largest insert, due to the methodology used in library construction. All data was organized in a single relational database, allowing its use by future applications in diverse platforms and languages. The RDBMS in this work is PostgreSQL. An Web interface, using PHP and Perl over Apache was developed, allowing users fast and simple access to the data. We have chosen to work with open source tools because it allows us to make customizations, if necessary, and due to its free license and distribution policy.

Descrição

Trabalho apresentado no Simpósio de Pesquisa dos Cafés do Brasil (4. : 2005 : Londrina, PR). Anais. Brasília, D.F. : Embrapa Café, 2005.

Palavras-chave

Bioinformática EST Genômica Coffea Bancos de dados, Bionformatics EST Genomics Coffea Data bank

Citação

Sales, Raphael M. O. B.; Andrade, Alan C.; Silva, Felipe R. da. Determinação do unigene do Projeto Genoma Café. In: Simpósio de Pesquisa dos Cafés do Brasil (4. : Londrina, PR : 2005). Anais. Brasília, D.F. : Embrapa - Café, 2005. (1 CD-ROM), 4p.

URI

http://www.sbicafe.ufv.br/handle/123456789/1891

Coleções

SPCB (04. : 2005 : Londrina, PR) - Resumos Expandidos

Página do item completo

Determinação do unigene do Projeto Genoma Café

Arquivos

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Descrição

Palavras-chave

Citação

URI

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por