Tecnologia

China investe em IA para digitalizar manuscritos antigos e ampliar uso do mandarim na tecnologia

Manuscritos IA
Fonte da imagem: Chen Bin/ Xinhua

A China está digitalizando textos históricos para ampliar o acesso a manuscritos antigos e desenvolver tecnologias de inteligência artificial (IA) voltadas para a língua chinesa. O governo estabeleceu um plano para transformar registros como os ossos oraculares (uma das formas mais antigas de escrita chinesa) em bancos de dados acessíveis a pesquisadores e modelos de IA.

O Ministério da Educação, a Comissão Nacional de Línguas e a Administração do Ciberespaço lançaram, em 31 de março, diretrizes para a digitalização da língua chinesa. O projeto prevê a criação de um corpus nacional e o aprimoramento de modelos de IA especializados na interpretação de caracteres antigos. Até 2035, o país pretende integrar o idioma em aplicações tecnológicas e expandir sua presença digital.

Universidades impulsionam a digitalização

Instituições acadêmicas chinesas lideram iniciativas para converter textos históricos em formatos digitais. A Beijing Normal University desenvolveu um modelo de IA capaz de interpretar manuscritos clássicos, traduzir textos para o chinês moderno e fornecer explicações detalhadas sobre palavras e expressões.

A universidade também criou bancos de dados linguísticos, incluindo um repositório digital do Shuowen Jiezi, um dos primeiros dicionários da língua chinesa. Além disso, catalogou inscrições antigas e manuscritos em plataformas digitais para ampliar o acesso à pesquisa acadêmica.

IA e o futuro do idioma chinês

A digitalização permitirá que algoritmos avancem na análise de textos históricos, facilitando o estudo da língua e sua adaptação em diversos contextos, desde traduções automáticas até assistentes virtuais com compreensão avançada da língua chinesa. Esse processo, além de facilitar o ensino e a pesquisa, amplia as possibilidades de interação digital em chinês. Além disso, com mais dados disponíveis, a expectativa é que modelos de IA consigam gerar traduções mais precisas, aprimorar o reconhecimento de caracteres e até recriar textos históricos com base em padrões linguísticos.

Fonte: Gov.cn