Comparação ampla de famílias de proteínas ATPases em genomas de espécies representantes do domínio Eukarya: sua distribuição, motivos característicos e relações filogenéticas

Comparação ampla de famílias de proteínas ATPases em genomas de espécies representantes do domínio Eukarya: sua distribuição, motivos característicos e relações filogenéticas 

Autor(a)
Farias, Clara Dáfne Alves de.
<clara.farias@arapiraca.ufal.br>
Ano de publicação
2021
Data da defesa
23/11/2021
Curso/Outros
Ciências Biológicas
Número de folhas
53
Tipo
TCC - Trabalho de Conclusão de Curso
Local
UFAL, Campus Arapiraca, Unidade Educacional ARAPIRACA
Resumo

As ATP sintases são complexos enzimáticos multiproteicos integrais de membranas com característica rotativa, tais proteínas são responsáveis pela maior produção de energia celular e são altamente conservadas nos domínios da vida. Apesar de haver muitos estudos acerca das ATPases, poucos são filogenômicos e inúmeras proteínas ainda não possuem função identificada, principalmente em organismos com grandes informações genéticas como a maioria dos eucariotos e, especialmente, os vegetais. Esse estudo, objetivou-se aplicar técnicas de biologia molecular computacional para a prospecção ampla das famílias de proteínas ATPase, e outros alvos com potencial para resolução taxonômica e evolutiva, buscando uma maior compreensão da distribuição dessas famílias a partir de uma coleção de genomas de espécies representantes do domínio Eukarya. Os genomas preditos utilizados foram selecionados no banco de dados do GenBank do NCBI (National Center for Biotechnology Information) para a identificação com o modelo oculto de Markov (HMM) derivado do alinhamento flatfile do Pfam. Em seguida, os hits positivos foram então submetidos ao procedimento de anotação envolvendo comparação com BLASTP (Basic Local Alignment Search Tool Program – BLAST+2.10.1) contra o banco de dados de sequência de proteínas não redundantes (nr – todas as traduções de CDS não redundantes do GenBank). O alinhamento das proteínas realizado com o hmmaling do pacote HMM foi utilizado para gerar a inferência filogenética executada pelo software Fasttree, e a análise dos motivos conservados foi efetivada pelo software Jalview que podem fornecer vestígios sobre a expansão de organismos ancestrais, adaptações evolutivas e distribuição atual das espécies. Os resultados obtidos demonstram que a filogenia de P-ATPases é altamente conservada e consistente com a divergência dos genomas dos táxons analisados, sendo encontradas em Protista, Fungi, Plantae e Metazoa, demonstrando seu potencial como relógio molecular na reconstrução da ancestralidade do domínio Eukarya. O alto grau de conservação destaca a importância que essas proteínas desempenharam ao longo dos processos evolutivos. Assim, essas proteínas podem ser utilizadas para melhor compreender e manipular os mecanismos de translocação de íons durante a produção de energia dos organismos fotossintéticos, permitindo o aumento da produção de alimentos de forma que não agrida o meio ambiente ou a saúde humana, por exemplo.

 

Abstract

ATP synthases are integral membrane multiprotein enzymatic complexes with a rotating characteristic, such proteins are responsible for greater cellular energy production and are highly conserved in the domains of life. Although there are many studies about ATPases,few are phylogenomic and many proteins still have no identified function, mainly in organisms with great genetic information such as most eukaryotes and, especially, plants. Thus, the objective was to apply computational molecular biology techniques for the broad prospection of ATPase protein families, and other targets with potential for taxonomic and evolutionary resolution, seeking a greater understanding of the distribution of these families from a collection of genomes of representative species of the Eukarya Domain.The predicted genomes used were selected in the GenBank database of the NCBI (National Center for Biotechnology Information) for identification with the hidden Markov model (HMM) derived from the Pfam flatfile alignment. Then, the positive hits were submitted to annotation procedure involving comparison with BLASTP (Basic Local Alignment Search Tool Program - BLAST + 2.10.1) against the non-redundant protein sequence database (nr - all non-CDS redundant translations from GenBank) . Protein alignment performed with the HMM hmmaling package was used to generate the phylogenetic inference performed by the Fasttree software, and the analysis of conserved motifs was performed by the Jalview software which can provide clues about the expansion of ancestral organisms, evolutionary adaptations and current distribution of species. The results obtained demonstrate that the phylogeny of P-ATPases is highly conserved and consistent with the divergence of the genomes of the analyzed taxa, found in Protista, Fungi, Plantae and Metazoa, demonstrating its potential as a molecular clock in the reconstruction of the ancestry of the Eukarya domain.The high degree of conservation highlights the importance that these proteins played throughout evolutionary processes. Thus, these proteins can be used to better understand and manipulate the ion translocation mechanisms during the energy production of photosynthetic organisms, allowing the increase of food production in a way that does not harm the environment or human health, for example.

Orientador(a)
Dr. Broetto, Leonardo.
Banca Examinadora
Dr.ª Cavalcanti, Eliane Aparecida Holanda.
Silva, Lucas de Almeida.
Palavras-chave
Genômica comparativa.
Bioinformática.
Filogenômica.
Áreas do Conhecimento/Localização
Coleção Propriedade Intelectual (CPI) - BSCA.
Categorias CNPQ
2.00.00.00-6 Ciências biológicas.
Visualizações
603
Observações


Não foi possível exibir o PDF