Pesquisadores da USP e UFSCar criam ferramenta para caçar fake news

Pesquisadores da USP e UFSCar criam ferramenta para caçar fake news

As fake news viraram polêmi­ca na inter­net nos últi­mos anos. Na eleição para pres­i­dente nos EUA em 2016, hack­ers rus­sos impul­sion­aram a divul­gação de con­teú­do que prej­u­di­cou a cam­pan­ha de Hillary Clin­ton e favore­ceu a vitória de Don­ald Trump. No Brasil, o What­sApp se tornou a prin­ci­pal fer­ra­men­ta para a dis­sem­i­nação de dados fal­sos envol­ven­do as eleições. De olho nesse fenô­meno, um grupo de pesquisadores Insti­tu­to de Ciên­cias Matemáti­cas e de Com­putação (ICMC) da Uni­ver­si­dade de São Paulo (USP) e da Uni­ver­si­dade Fed­er­al de São Car­los (UFS­Car) desen­volver­am uma platafor­ma para detec­tar notí­cias fal­sas.

A platafor­ma usa estraté­gias de inteligên­cia arti­fi­cial para que o com­puta­dor “apren­da” a iden­ti­ficar padrões de escri­ta das notí­cias. “Ofer­e­ce­mos ao com­puta­dor um con­jun­to de 3.600 notí­cias ver­dadeiras e um con­jun­to de 3.600 notí­cias fal­sas. Uma vez que o com­puta­dor aprende a dis­tinção entre elas, ele apli­ca esse apren­diza­do para ten­tar predi­z­er o tipo de novas notí­cias que o usuário fornece”, expli­ca Thi­a­go Par­do, coor­de­nador do pro­je­to e pesquisador do Núcleo Interin­sti­tu­cional de Lin­guís­ti­ca Com­puta­cional (NILC) do ICMC. Os tex­tos uti­liza­dos na pesquisa foram pub­li­ca­dos na web entre janeiro de 2016 e janeiro de 2018, e podem ser con­sul­ta­dos neste link.
Pesquisadores da USP e UFSCar criam ferramenta para caçar fake news

Roney Lira, aluno de doutora­do em Ciên­cia da Com­putação pelo ICMC e um dos autores do pro­je­to, expli­ca que um dos parâmet­ros rel­e­vantes para iden­ti­ficar notí­cias fal­sas na platafor­ma é a quan­ti­dade de erros ortográ­fi­cos e advér­bios. “Nos tex­tos pub­li­ca­dos pelos veícu­los jor­nalís­ti­cos, é bem difí­cil encon­trar­mos notí­cias com advér­bios que expressem dúvi­da, por exem­p­lo. Se uma notí­cia uti­liza ess­es recur­sos em notí­cias fac­tu­ais, podemos clas­si­fi­ca-la como fal­sa”.

Out­ros parâmet­ros tam­bém são lev­a­dos em con­sid­er­ação, como o número médio de sub­stan­tivos, adje­tivos e pronomes nos tex­tos. A tec­nolo­gia tam­bém uti­liza out­ros soft­wares para proces­sa­men­to de tex­to, como clas­si­fi­cadores gra­mat­i­cais, anal­isadores sin­táti­cos e dicionários espe­cial­iza­dos.

Pesquisadores da USP e UFSCar criam ferramenta para caçar fake news

Ain­da em fase de aper­feiçoa­men­to, a platafor­ma já pode ser aces­sa­da via web ou pelo What­sApp. Ao aces­sar a pági­na, o usuário deve inserir o tex­to da notí­cia a ser checa­da no cam­po indi­ca­do e que deve con­ter pelo menos 100 palavras, pois o sis­tema pode não fun­cionar cor­re­ta­mente com ape­nas partes de notí­cias. Se forem detec­ta­dos indí­cios de que o tex­to seja fal­so, o sis­tema aler­tará: “Essa notí­cia pode ser fal­sa. Por favor, pro­cure out­ras fontes con­fiáveis antes de divul­gá-la”.

Uti­lizan­do méto­dos clás­si­cos de machine learn­ing, os pesquisadores con­seguiram treinar o sis­tema com um índice de 90% de acer­to na claf­s­si­fi­cação de notí­cias. “Mas é pre­ciso con­sid­er­ar que isso foi obti­do em testes con­tro­la­dos de lab­o­ratório, com notí­cias inteira­mente fal­sas ou ver­dadeiras”, expli­ca Thi­a­go Pra­do. “O mun­do real, fora do lab­o­ratório, é bem mais desafi­ador”. Os próx­i­mos desafios, segun­do ele, são anal­is­ar não ape­nas os padrões de escri­ta, mas novas estraté­gias de detecção de fake news com checagem automáti­ca de fatos.

Ape­sar do bom desem­pen­ho da platafor­ma na detecção de fake news, Thi­a­go aler­ta que não acred­i­tar pronta­mente em tudo o que lemos e a bus­car por fontes con­fiáveis de notí­cias ain­da são essen­ci­ais para a não propa­gação de notí­cias fal­sas. Ele ressalta tam­bém a importân­cia de não del­e­gar com­ple­ta­mente para o com­puta­dor a tare­fa de sep­a­rar notí­cias fal­sas das ver­dadeiras. “O soft­ware desen­volvi­do deve ser usa­do como um apoio para a seleção e fil­tragem de con­teú­do, sendo que o usuário ain­da deve faz­er a checagem final”.

Finan­cia­do pelo Pro­gra­ma Insti­tu­cional de Bol­sas de Ini­ci­ação Cien­tí­fi­ca (PIBIC) do CNPq e por out­ras duas agên­cias de fomen­to brasileiras (CAPES e FAPESP), a tec­nolo­gia faz parte do pro­je­to Detecção Automáti­ca de Notí­cias Fal­sas para o Por­tuguês, que resul­tou na pub­li­cação do arti­go Con­tri­bu­tions to the Study of Fake News in Por­tuguese: New Cor­pus and Auto­mat­ic Detec­tion Results.

Posts Similares