Em 23 de outubro, o Instituto de Ciências da Vida da BGI (Huada) e o Laboratório Zhijiang anunciaram o Genos, o primeiro modelo genômico fundamental de uso geral e implantável do mundo com mais de 10 bilhões de parâmetros. O modelo analisa contextos ultra longos de até um milhão de pares de bases e identifica mutações com precisão de base única.
O genoma humano possui cerca de 3 bilhões de pares de bases. Embora o Projeto Genoma Humano tenha decifrado a sequência completa, a função específica de cada base ainda precisa ser determinada com precisão. Modelos anteriores geralmente se baseiam em um ou dois genomas de referência, limitando a representação da diversidade genética humana.
O Genos supera essas limitações ao integrar múltiplos recursos públicos de referência, como o Consórcio de Pangenoma Humano (HPRC) e o Projeto de Mapa de Variações Estruturais do Genoma Humano (HGSVC). Para treinar o modelo, os pesquisadores usaram 636 genomas humanos completos do tipo “telômero a telômero”, cobrindo populações globais. Isso permite uma compreensão mais ampla da diversidade genética.
O modelo adota a arquitetura “mistura de especialistas” (Mixture of Experts), que direciona os algoritmos mais relevantes para cada tarefa. A estrutura reduz o custo de inferência e o consumo de recursos, mantendo alto desempenho mesmo com o grande volume de parâmetros.
Testes mostram que o Genos alcançou 92% de precisão na interpretação de mutações patogênicas com aplicação clínica direta. Quando combinado com modelos científicos fundamentais, a precisão chega a 98,3%. Avaliações comparativas indicam que o Genos supera os modelos genômicos existentes.
O Instituto de Ciências da Vida da BGI informou que o Genos já está disponível em código aberto nas plataformas Hugging Face e Model Scope, com versões de 1,2 bilhão e 10 bilhões de parâmetros, atendendo a diferentes demandas de pesquisa e aplicação clínica.
Fonte: gmw.cn
Adicionar Comentário