Dez anos de genoma humano

Em 26 de junho de 2000, Francis Collins e J. Craig Venter anunciaram, em cerimônia na Casa Branca, com a presença do presidente Bill Clinton, que haviam completado o primeiro rascunho do genoma humano. Comemoramos aqui o décimo aniversário desse evento, fazendo uma avaliação do mundo genômico deste então.

Os dois cientistas protagonistas do feito histórico não poderiam ser mais diferentes. Francis Collins (1950-), médico-geneticista, dirigia na época o Instituto Nacional de Pesquisa do Genoma Humano, vinculado aos Institutos Nacionais de Saúde dos Estados Unidos (NIH).

J. Craig Venter (1946-), biólogo, enfant-gâté da genômica, estava à frente da companhia Celera, fundada por ele com capital da Perkin-Elmer, empresa esta que havia desenvolvido e comercializava sequenciadores de DNA. Os projetos de sequenciamento do genoma humano que cada um deles capitaneava de forma independente refletiam bem as personalidades divergentes dos diretores.

O projeto público, internacional, sob a batuta de Francis Collins nos Estados Unidos e John Sulston na Inglaterra, era cuidadoso, meticuloso, voltado para a aquisição de dados seguros, construindo o genoma humano cromossomo por cromossomo. Já o projeto da Celera era rápido, arriscado, intensivo em computação, propondo-se a sequenciar todo o genoma de uma vez.

Dos cromossomos aos nucleotídeos
O sequenciamento do genoma humano envolveu a elucidação da sequência dos 3 bilhões de nucleotídeos que compõem os cromossomos humanos. Se a sequência fosse datilografada, letra a letra, teríamos uma pilha de papel equivalente a um edifício de 20 andares (montagem modificada pelo colunista a partir de imagem original da Wikimedia Commons).

Desde o marcante anúncio de 2000, as carreiras dos dois personagens mudaram bastante. Francis Collins continuou a fazer pesquisa genômica e dedicou-se além disso a tentar uma reconciliação da religião e da ciência, tendo escrito a esse respeito um best-seller, A linguagem de Deus (disponível no Brasil). Atualmente, ele é o diretor dos NIH.

Os projetos de sequenciamento do genoma humano de Collins e Venter refletiam suas personalidades divergentes

Craig Venter foi despedido da Celera em 2002 por não ter conseguido montar um plano de negócios lucrativo a partir da sequência do genoma humano.

Ele, então, fundou o Craig Venter Institute, dedicado à pesquisa na nova área de biologia sintética. Recentemente, esteve em todas as manchetes pela construção de uma bactéria primitiva (Mycoplasma mycoides) controlada por um genoma sintetizado quimicamente em seu laboratório.

Venter, um velejador entusiástico, também fez em seu iate Sorcerer II uma viagem de volta ao mundo coletando amostras de água dos vários oceanos para usá-las em estudos genômicos das suas variadas comunidades bacterianas (metagenômica). Essas pesquisas estão relatadas em uma série de fascinantes artigos disponíveis gratuitamente na internet.

A genômica de 2000 a 2010

O Projeto Genoma Humano público foi iniciado oficialmente em 1989 como um esforço internacional, com a estimativa de custar 1 dólar por base de DNA sequenciada, ou seja, 3 bilhões de dólares no total. A Human Genome Organization (Hugo) fazia a coordenação multinacional do projeto. A propósito, eu participei do conselho diretor da Hugo por dois anos (1994-1996).

Genoma humano na 'Time'
Capa da revista ‘Time’ de 3 de julho de 2000 com o anúncio histórico do primeiro rascunho do genoma humano. O exemplar é da biblioteca do colunista.

O custo do projeto nos 11 anos de sequenciamento até 2000 foi um pouco menor –cerca de 2 bilhões de dólares. Estima-se que o projeto público tenha usado 600 sequenciadores de DNA espalhados em laboratórios de vários países. Por outro lado, a Celera utilizou cerca de 300 sequenciadores, todos sob o mesmo teto.

Vale a pena lembrar que o mundo científico teve de esperar até 2001 para ver em detalhe os resultados do primeiro rascunho do genoma humano. Os dados do projeto público finalmente apareceram em 11 artigos acompanhados de um número semelhante de comentários na edição de 15 de fevereiro de 2001 da Nature. Os dados da Celera apareceram um dia depois, no número de 16 de fevereiro da Science.

O Projeto Genoma Humano só terminou oficialmente em abril de 2003, 50 anos após a descoberta seminal da estrutura molecular do DNA por James Watson e Francis Crick, que havia sido descrita em 25 de abril de 1953 na Nature.

Entretanto, foi apenas mais tarde ainda, em 2007, que foi descrita a primeira sequência genômica completa diploide de um único indivíduo. Essa sequência é conhecida como HuRef e o genoma, no caso, era o do próprio Craig Venter.

Nova revolução genômica

Hoje, em 2010, estamos vivendo uma nova revolução genômica, alavancada por sequenciadores de DNA de segunda geração, altamente paralelos, 50 mil vezes mais rápidos do que os de 2000! As atuais plataformas de sequenciamento das empresas americanas Applied Biosystems, Helicos e Illumina podem ler mais de 30 bilhões de pares de base de DNA em um único dia.

Evolução do sequenciamento genômico
Gráfico mostra a fantástica evolução do sequenciamento genômico nos últimos 10 anos. O eixo vertical mostra a velocidade de sequenciamento, medida em milhares de pares de base (quilobases) por sequenciador por dia. O gráfico foi desenhado pelo colunista a partir de dados apresentados por Craig Venter em artigo de opinião publicado em 2010 na ‘Nature’.

Isso significa que um único equipamento de nova geração faz o mesmo trabalho que 30 mil sequenciadores do modelo usado em 2000! Por outro lado, essas milhões de bases lidas estão em fragmentos muito pequenos que, para a montagem de um genoma completo, têm de ser concatenados como em um quebra-cabeça gigantesco.

Sequenciadores de DNA de segunda geração são 50 mil vezes mais rápidos do que os de 2000

Existe uma relação inversa entre o tamanho dos fragmentos e ao grau de cobertura necessária para uma montagem confiável do genoma. O Projeto Genoma Humano envolveu aproximadamente 30 milhões de leituras de aproximadamente 800 pares de base em comprimento. Isso corresponde a cerca de 24 bilhões de bases, ou seja, uma cobertura de aproximadamente oito vezes o genoma humano, que contém 3 bilhões de bases.

Já para montar um genoma humano com sequenciadores de segunda geração, que só leem fragmentos pequenos, precisaríamos de uma cobertura bem maior, de pelo menos 30 vezes – ou seja, 90 bilhões de bases.

Pesquisadores chineses conseguiram, recentemente, montar o genoma do panda gigante dessa forma. De fato, os chineses querem ser a próxima grande potência do sequenciamento genômico. Corre pela internet a notícia de que o Instituto de Genética de Pequim está comprando 128 (!) sequenciadores HiSeq 2000 da Illumina, a coqueluche do momento, pois cada corrida gera 100 bilhões de pares de base em fragmentos de DNA de cerca de 100 pares de base.

Um desses equipamentos de segunda geração seria capaz de sequenciar um genoma humano em um só dia, a um custo de apenas cerca de 6 mil dólares em reagentes! Assim, a genômica pessoal emerge como uma possibilidade concreta e há perspectivas de que em poucos anos seja possível sequenciar comercialmente o genoma de qualquer pessoa por cerca de mil dólares. Isto será de fundamental importância para o campo emergente da medicina genômica.

O genoma do Homo neanderthalensis

Nada é mais ilustrativo da explosão genômica dos últimos tempos do que o anúncio do primeiro rascunho do genoma do homem de Neandertal (Homo neanderthalensis), o parente evolucionário mais próximo do Homo sapiens, publicado no último dia 7 de maio, 10 anos após o anúncio de Collins e Venter em 2000. Esse trabalho espetacular foi realizado pelo grupo do geneticista sueco Svante Paabo no Instituto Max Planck de Genética Evolucionária em Leipzig, Alemanha.  

Crânio de neandertal
Crânio de ‘Homo neanderthalensis’ descoberto em 1908 na França (foto: Wikimedia Commons – CC 3.0 BY SA).

É interessante lembrar que o sequenciamento de espécimes arqueológicos apresenta uma variedade de problemas sérios. Um deles é a degradação do DNA em fragmentos menores do que 200 pares de base. Mas como o sequenciamento de nova geração é feito em segmentos pequenos, o empecilho não é tão grave hoje em dia.

Outro problema é que uma grande proporção (mais de 90% em alguns casos) do DNA obtido dos ossos arqueológicos é bacteriano. A equipe de Paabo desenvolveu várias estratégias para fazer o enriquecimento do DNA do Neandertal, usando enzimas de restrição e hibridização preparativa em microarranjos de DNA. 

Após vencer uma série de batalhas técnicas – inclusive de contaminação com DNA humano –, o grupo de Paabo finalmente obteve 5,3 bilhões de bases de sequência de DNA do Homo neanderthalensis, a partir de três espécimes diferentes. A maior parte da sequência (75%) foi obtida com o sequenciador da Illumina em pequenos fragmentos e, o restante, com o sequenciador 454 da Roche, que não é tão rápido, mas fornece sequências um pouco maiores.

Em 10 anos miraculosos fomos do genoma do Homo sapiens ao genoma do Homo neanderthalensis

A cobertura de apenas 1,6 vezes do genoma Neandertal não é nem de longe suficiente para fazer a montagem de novo do genoma (com fragmentos tão pequenos seria necessária uma cobertura de mais de 30 vezes).

Para contornar esse obstáculo e chegar ao primeiro rascunho, a equipe de Paabo usou o arcabouço do genoma humano e do genoma do chimpanzé. Sem dúvida foi um tour de force, um trabalho fabuloso.

Assim, em 10 anos miraculosos fomos do genoma do Homo sapiens ao genoma do Homo neanderthalensis, abrindo nesse processo as portas da genômica pessoal e da genômica arqueológica. Certamente os próximos 10 anos vão ser tremendamente estimulantes do ponto de vista genômico. Imagino as maravilhas que virão por aí – mal posso conter minha curiosidade…

PS – Após escrever esta coluna, já recebi notícias de novas fabulosas engenhosidades genômicas. Em artigo publicado on-line em maio, a Nature Methods relata que uma nova técnica de sequenciamento em tempo real de moléculas únicas permite a leitura direta do status de metilação das bases do DNA.

A capacidade de obter dados epigenômicos da metilação das bases, ao mesmo tempo que adquirimos a sequência genômica das mesmas, adicionará uma camada extra de informação sobre a regulação das células e os mecanismos das doenças.

(Para entender melhor o que é metilação de DNA e epigenética, recomendo a leitura das colunas “A guerra (genômica) dos sexos” e “Viva Lamarck (!?)“, em que abordo essa questão, e do Glossário de Termos Técnicos que preparei para esta coluna.)

Sergio Danilo Pena
Departamento de Bioquímica e Imunologia
Universidade Federal de Minas Gerais