Comparação ampla de famílias de proteínas ATPases em genomas de espécies representantes do domínio Eukarya: sua distribuição, motivos característicos e relações filogenéticas
Comparação ampla de famílias de proteínas ATPases em genomas de espécies representantes do domínio Eukarya: sua distribuição, motivos característicos e relações filogenéticas
<clara.farias@arapiraca.ufal.br>
As ATP sintases são complexos
enzimáticos multiproteicos integrais de membranas com característica rotativa,
tais proteínas são responsáveis pela maior produção de energia celular e são
altamente conservadas nos domínios da vida. Apesar de haver muitos estudos
acerca das ATPases, poucos são filogenômicos e inúmeras proteínas ainda não
possuem função identificada, principalmente em organismos com grandes
informações genéticas como a maioria dos eucariotos e, especialmente, os
vegetais. Esse estudo, objetivou-se aplicar técnicas de biologia molecular
computacional para a prospecção ampla das famílias de proteínas ATPase, e
outros alvos com potencial para resolução taxonômica e evolutiva, buscando uma
maior compreensão da distribuição dessas famílias a partir de uma coleção de
genomas de espécies representantes do domínio Eukarya. Os genomas preditos
utilizados foram selecionados no banco de dados do GenBank do NCBI (National
Center for Biotechnology Information) para a identificação com o modelo
oculto de Markov (HMM) derivado do alinhamento flatfile do Pfam. Em seguida, os hits positivos foram então submetidos ao procedimento de anotação
envolvendo comparação com BLASTP (Basic
Local Alignment Search Tool Program – BLAST+2.10.1) contra o banco de dados
de sequência de proteínas não redundantes (nr – todas as traduções de CDS não
redundantes do GenBank). O
alinhamento das proteínas realizado com o hmmaling
do pacote HMM foi utilizado para gerar a inferência filogenética executada
pelo software Fasttree, e a análise
dos motivos conservados foi efetivada pelo software
Jalview que podem fornecer vestígios sobre a expansão de organismos
ancestrais, adaptações evolutivas e distribuição atual das espécies. Os
resultados obtidos demonstram que a filogenia de P-ATPases é altamente
conservada e consistente com a divergência dos genomas dos táxons analisados,
sendo encontradas em Protista, Fungi, Plantae e Metazoa, demonstrando seu
potencial como relógio molecular na reconstrução da ancestralidade do domínio
Eukarya. O alto grau de conservação destaca a importância que essas proteínas
desempenharam ao longo dos processos evolutivos. Assim, essas proteínas podem
ser utilizadas para melhor compreender e manipular os mecanismos de
translocação de íons durante a produção de energia dos organismos
fotossintéticos, permitindo o aumento da produção de alimentos de forma que não
agrida o meio ambiente ou a saúde humana, por exemplo.
ATP synthases are integral membrane multiprotein enzymatic complexes
with a rotating characteristic, such proteins are responsible for greater
cellular energy production and are highly conserved in the domains of life.
Although there are many studies about ATPases,few are phylogenomic and many
proteins still have no identified function, mainly in organisms with great
genetic information such as most eukaryotes and, especially, plants. Thus, the
objective was to apply computational molecular biology techniques for the broad
prospection of ATPase protein families, and other targets with potential for
taxonomic and evolutionary resolution, seeking a greater understanding of the
distribution of these families from a collection of genomes of representative
species of the Eukarya Domain.The predicted genomes used were selected in the
GenBank database of the NCBI (National Center for Biotechnology Information)
for identification with the hidden Markov model (HMM) derived from the Pfam
flatfile alignment. Then, the positive hits were submitted to annotation procedure
involving comparison with BLASTP (Basic Local Alignment Search Tool Program -
BLAST + 2.10.1) against the non-redundant protein sequence database (nr - all
non-CDS redundant translations from GenBank) . Protein alignment performed with
the HMM hmmaling package was used to generate the phylogenetic inference
performed by the Fasttree software, and the analysis of conserved motifs was
performed by the Jalview software which can provide clues about the expansion
of ancestral organisms, evolutionary adaptations and current distribution of
species. The results obtained demonstrate that the phylogeny of P-ATPases is
highly conserved and consistent with the divergence of the genomes of the
analyzed taxa, found in Protista, Fungi, Plantae and Metazoa, demonstrating its
potential as a molecular clock in the reconstruction of the ancestry of the
Eukarya domain.The high degree of conservation highlights the importance that
these proteins played throughout evolutionary processes. Thus, these proteins
can be used to better understand and manipulate the ion translocation
mechanisms during the energy production of photosynthetic organisms, allowing
the increase of food production in a way that does not harm the environment or
human health, for example.
Silva, Lucas de Almeida.
Bioinformática.
Filogenômica.