Tecnologia

Plataforma chinesa abre código de modelo para criar humanos digitais em tempo real

humanos digitais
Imagem: SoulX-FlashHead/ Divulgação

A plataforma social chinesa Soul anunciou nesta sexta-feira (12), em sua conta oficial no WeChat, que liberou o código do seu modelo de criação de humanos digitais em tempo real, o SoulX-FlashHead. Segundo a empresa, a ferramenta permite gerar avatares realistas ao vivo usando uma única placa de vídeo de uso comum em computadores pessoais.

De acordo com a Soul, o modelo foi desenvolvido para funcionar em placas gráficas de consumo da NVIDIA. Em testes, a versão voltada à velocidade alcançou até 96 quadros por segundo em uma RTX 4090, com consumo de memória de 6,4 GB e suporte a até três conexões ao mesmo tempo. Já a versão focada em qualidade atingiu 16,8 quadros por segundo em uma RTX 5090 com uma placa e mais de 25 quadros por segundo com duas placas, mantendo a sincronização entre a fala e os movimentos da boca.

A empresa informou que o modelo foi treinado com um grande volume de vídeos e áudios selecionados para reduzir erros visuais e melhorar a estabilidade dos personagens ao longo do tempo. Ao todo, foram usadas 782 horas de material de alta qualidade, extraídas de mais de 10 mil horas de conteúdo bruto, após etapas de limpeza e seleção dos dados.

Na prática, a tecnologia pode ser aplicada em transmissões ao vivo contínuas, personagens virtuais para jogos e apoio ao ensino de idiomas com o uso de avatares. O estudo técnico foi publicado em repositório acadêmico, e o código, o modelo e o conjunto de dados estão disponíveis para acesso público.

Fonte: IT Home