IA do Google faz leitura labial melhor que humanos

deepmind

A divisão de Inteligência Artificial do Google, chamada de Deep Mind, e a Universidade de Oxford conseguiram criar o software de leitura labial mais preciso do mundo.

Para treinar a plataforma de rede neural e conseguir esse resultado, os cientistas usaram mais de 5 mil horas de programação de TV da rede britânica BBC, incluindo atrações como Newsnight e World Today, que totalizaram mais de 118 mil sentenças diferentes.

Segundo os pesquisadores, o software, chamado de Watch, Listen, Attend, and Spell, conseguiu registrar uma precisão de 46,8% na leitura labial das filmagens de vídeo, bem mais do que os 12,4% de precisão registrados por um ser humano especialista em leitura labial com os mesmos vídeos, que incluíam conversas entre políticos de programas da BBC.

Esse projeto segue um trabalho parecido publicado no início do mês pela Universidade de Oxford, que usou técnicas parecidas para criar um programa de leitura labial chamado LipNet, que conseguiu 93,4% de precisão nos testes contra 52,4% de um ser humano especialista na área. No entanto, o teste do programa usou filmagens de sentenças formulaicas, muito mais simples do que as utilizadas pelo novo projeto do Google e Oxford.

Apesar de ser diferente fazer a leitura labial a partir de imagens profissionais e bem-iluminadas de um programa de TV e de imagens feitas com câmeras de vigilância, não deixa de ser preocupante pensar que no futuro essa tecnologia pode vir a ser usada com fins de vigilância.

 

Fonte: IDGNow!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *