Pesquisas mapeiam milhares de proteínas de diversos tecidos humanos e constroem o mais completo catálogo dessas moléculas já apresentado. O feito pode auxiliar no diagnóstico de doenças e na escolha de tratamentos contra o câncer.
Em junho de 2000, Francis Collins e J. Craig Venter anunciaram a produção do primeiro rascunho do genoma humano, uma forma de catalogar os genes da nossa espécie. Quase 14 anos depois, dois estudos publicados hoje na revista Nature trazem o mapeamento mais completo já realizado das proteínas codificadas por nossos genes, um rascunho do chamado proteoma humano.
Uma das pesquisas reuniu esforços de 11 instituições de cinco países diferentes para identificar proteínas codificadas por 17.294 genes – que correspondem a 84% dos genes humanos codificadores de proteínas. Ainda que o Projeto Genoma Humano tenha conseguido mapear quase 100% dos nossos genes, pouco se sabia até então sobre quais partes desse genoma eram realmente importantes para a produção de proteínas.
“Agora temos uma referência do proteoma humano normal, o que é importante porque, ainda que o DNA instrua a produção das proteínas, são elas as responsáveis por todos os processos biológicos em células e tecidos”, destaca o médico e coautor do estudo Akhilesh Pandey, da Universidade Johns Hopkins, nos Estados Unidos. Com a possibilidade de acessar o catálogo de proteínas do corpo humano, pesquisadores do mundo todo poderão conhecer suas propriedades e buscar aplicações para elas na pesquisa biomédica.
Dos genes analisados no estudo, 2.350 foram associados à produção de proteínas de manutenção. Presentes em todas as células humanas, tais proteínas são responsáveis por funções básicas dessas estruturas do corpo, como a geração de energia, e não tinham sido catalogadas até então.
O estudo resultou na identificação das sequências genéticas responsáveis pela produção de mais de 30 mil proteínas
Para isso, a equipe analisou amostras de 30 tipos diferentes de tecidos adultos e fetais e células-tronco, que tiveram suas proteínas extraídas. A seguir, essas proteínas foram submetidas à ação de enzimas que as cortaram em pequenos pedaços chamados peptídeos. Os peptídeos foram, então, analisados por meio de espectrometria de massa, técnica que descreve a sequência de aminoácidos que os forma.
Com isso, os pesquisadores puderam consultar em bancos de dados genéticos quais genes codificavam aqueles aminoácidos, o que resultou na identificação das sequências genéticas responsáveis pela produção de mais de 30 mil proteínas.
Por fim, a equipe comparou as sequências genéticas encontradas com dois dos maiores bancos de dados que reúnem informações sobre proteínas já descobertas. Das centenas de milhares de peptídeos encontrados pela equipe, metade ainda não estava catalogada. “Acreditamos que muitos peptídeos foram descobertos porque nós estudamos as proteínas de vários tecidos diferentes que ainda não tinham sido analisados”, avalia Pandey.
Novos genes codificadores
Outra surpresa foi descobrir que 193 proteínas encontradas eram codificadas por genes não codificadores, sequências de DNA que não têm as características convencionais de um material genético responsável pela geração de proteínas. “Só conseguimos descobrir isso porque confrontamos nossos dados com outros bancos de dados que registram sequências não codificadoras como pseudogenes, por exemplo”, diz o médico.
Além disso, a equipe identificou dois terços do grupo conhecido como proteínas perdidas, que tem 4 mil exemplares. O pesquisador esclarece que a existência dessas proteínas era sustentada apenas pela presença de seus genes no genoma, mas ninguém havia provado ainda que elas de fato existem no corpo humano. “Isso significa que as proteínas saíram do ‘imaginário’ para o ‘determinado experimentalmente’”, destaca.
Com o mapeamento, os pesquisadores criaram o Mapa do Proteoma Humano (traduzido livremente do inglês Human Proteome Map), um portal com informações sobre as proteínas identificadas. “O registro das proteínas específicas de cada órgão permite que se forme uma lista de biomarcadores que podem ser usados na detecção de doenças que acometem esses órgãos e que podem ser dosados no sangue”, conclui Pandey.
Outro mapa
O segundo estudo divulgado na Nature usou a mesma técnica de espectrometria de massa para analisar pouco mais de 18 mil genes codificadores de proteínas, o equivalente a 92% dos genes já identificados. Essa pesquisa apontou que cerca de 10 mil genes eram responsáveis por produzir proteínas de manutenção.
A equipe avaliou 27 tipos diferentes de tecidos humanos, além de 13 tipos de fluidos corporais como urina, sangue e leite materno e 147 linhagens celulares. Os cientistas também pesquisaram informações disponíveis em bancos de dados on-line, o que permitiu ampliar a análise para 60 tecidos diferentes. O catálogo está disponível na internet no ProteomicsDB, um banco de dados que inclui o tipo, a distribuição e a abundância de proteínas em vários tecidos e fluidos corporais.
O segundo estudo analisou pouco mais de 18 mil genes codificadores de proteínas, o equivalente a 92% dos genes já identificados
A surpresa dessa pesquisa foi não localizar 2 mil proteínas que, de acordo com o genoma humano, deveriam estar presentes em nosso organismo. Segundo o estudo, isso pode ser uma amostra da evolução da espécie humana, já que genes como os que eram associados ao olfato humano acabaram perdendo sua função, pois não dependemos mais tanto desse sentido para sobreviver.
Além disso, os pesquisadores identificaram proteínas que podem determinar se a célula é resistente a certos medicamentos usados no tratamento contra o câncer. Para isso, a equipe testou 24 remédios em 35 tipos celulares diferentes. Dentre as diversas proteínas de resistência encontradas estão as do tipo S100, comuns a diferentes tecidos, segundo o estudo.
Para o químico e coautor da pesquisa Bernhard Kuster, da Universidade Técnica de Munique, na Alemanha, o achado pode aproximar a medicina de um tratamento individualizado. “No futuro, será possível que o médico determine o tipo e a dose do remédio que irá receitar com base no perfil proteico individual de cada paciente”, completa.
Mariana Rocha
Ciência Hoje On-line