Coronavírus

Inteligência artificial rastreia notícias sobre COVID-19

Redação/Assessoria Fapesp
07/04/2020 13:46
Visualizações: 1086 (0) (0) (0) (0)

Uma ferramenta desenvolvida para mineração de dados e textos, chamada Websensors, está sendo utilizada na análise da evolução da pandemia de COVID-19. Capaz de extrair dados de textos de notícias, obtendo informações sobre “o que aconteceu”, “quando aconteceu” e “onde aconteceu, a Websensors possibilita ajustar, dia a dia, os modelos de propagação da doença.

A ferramenta foi desenvolvida no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), em São Carlos, pelos pesquisadores Solange Rezende, Ricardo Marcacini e Rafael Rossi, e teve também a participação de Roberta Sinoara. Recebeu apoios da FAPESP por meio do projeto “Aprendizado de máquina para WebSensors: algoritmos e aplicações”, e de bolsas concedidas a Marcacini, Rossi e Sinoara  – todos eles orientados na ocasião por Rezende.

A instância da ferramenta Websensors dedicada à epidemia de COVID-19 está disponível em http://websensors.net.br/projects/covid19/, com a interface web desenvolvida por Luan Martins, mestrando no ICMC-USP.

“Nós usamos mineração de dados em textos de notícias como forma de identificar eventos que estão ocorrendo em cada país e, assim, ajustar a projeção com as características do Brasil”, diz Rezende à Agência FAPESP.

Segundo a pesquisadora, a principal questão investigada na pesquisa da Websensors é a possibilidade de extrair informações complementares sobre um problema a partir de notícias e, com base nelas, ajustar os modelos preditivos já existentes.

“A ferramenta utiliza uma metodologia de mineração de eventos estruturada em cinco etapas: identificação do problema; pré-processamento; extração de padrões; pós-processamento; e uso do conhecimento”, conta Ricardo Marcacini.

A primeira etapa, a da identificação do problema, consiste em definir o escopo da aplicação e as fontes de dados. “Os dados diários de propagação internacional da COVID-19 são coletados no Data Repository by Johns Hopkins CSSE. E as notícias, publicadas em mais de 100 idiomas, são obtidas por meio do GDELT Project. Essa grande plataforma, altamente seletiva, nos protege contra fake news”, diz Rezende.

Na segunda etapa, a do pré-processamento, são utilizados algoritmos que transformam as notícias em eventos. “Queremos apenas notícias em que possamos identificar o que aconteceu, quando aconteceu e onde aconteceu (georreferenciado). Quando pelo menos essas três informações podem ser extraídas da notícia, então temos um evento, que um programa de computador possa analisar”, explica Marcacini.

Na terceira etapa, a da extração de padrões, é empregada uma rede neural que recebe, como entrada, as curvas de contágio de alguns países. E as enriquece, adicionando os eventos pré-processados na etapa anterior. “Como saída, nós configuramos a rede neural para que ela retorne à curva de contágio, considerando as características do Brasil”, relata Marcacini.

No pós-processamento, que configura a quarta etapa, os responsáveis pela ferramenta fazem uma avaliação do modelo utilizado. “Diferentes técnicas de avaliação podem ser empregadas”, diz Rezende. “Uma delas é usar o modelo para prever alguns dos dados que já conhecemos e, assim, quantificar a margem de acertos.”

A quinta e última etapa, finalmente, diz respeito ao uso do conhecimento. Isso significa disponibilizá-lo para ser explorado por usuários ou mesmo por outros sistemas. No caso, todo o conhecimento obtido acerca da pandemia pode ser acessado abertamente no endereço http://websensors.net.br/projects/covid19/.

Rezende afirma que a plataforma Websensors tem publicado diariamente as previsões dos próximos sete dias da curva de contágio do Brasil, usando o modelo ajustado com os eventos. As informações encontram-se disponíveis para qualquer interessado. Mas alerta para o fato de que a ferramenta ainda está recebendo ajustes. “É importante ressaltar que a Websensors não foi construída para essa finalidade. No entanto, acreditamos que, nesse período difícil, podemos utilizar o que temos à disposição para colaborar", afirma.

Mais Lidas De Hoje
veja Também
Resultado
Setor de Óleo e Gás lidera distribuição de proventos em ...
10/07/25
Gás Natural
Comgás recebe 41 propostas em chamada pública para aquis...
10/07/25
Pessoas
Lucas Mota de Lima assume gerência executiva da ABPIP
10/07/25
Biometano
Presidente Prudente (SP) inicia obra de R$12 milhões par...
10/07/25
Combustíveis
Preços do diesel, etanol e gasolina seguem tendência de ...
10/07/25
E&P
Hitachi Energy ajudará a Petrobras a analisar alternativ...
10/07/25
Energia Solar
Thopen capta R$ 293 milhões com XP e Kinea e acelera exp...
10/07/25
Exportação
Firjan manifesta grande preocupação com o anúncio de tar...
10/07/25
Debate
IBP debate direitos humanos na cadeia de suprimentos de ...
09/07/25
Macaé Energy
Com mais de dois mil participantes, 2ª edição do Macaé E...
09/07/25
Combustíveis
Vibra amplia presença da gasolina Petrobras Podium e ava...
09/07/25
Biocombustíveis
Brasil: protagonista da transição do transporte internac...
08/07/25
Evento
Nova Era Connections 2025 celebra os 20 anos da Nova Era...
08/07/25
Sustentabilidade
Foresea conquista Selo Social e apresenta resultados exp...
08/07/25
Meio Ambiente
Tecnologia da Unicamp viabiliza produção sustentável de ...
08/07/25
Premiação
Gasmar conquista prêmio nacional com projeto desenvolvid...
08/07/25
Pré-Sal
FPSO Guanabara MV31 lidera produção nacional de petróleo...
08/07/25
Gás Natural
Petrobras vai escoar mais gás do pré-sal para baixar pre...
07/07/25
Sergipe Oil & Gas 2025
Petrobras aposta no Sergipe Oil & Gas e será a patrocina...
07/07/25
Indústria Naval
Estaleiros brasileiros e chineses assinam documento para...
07/07/25
Etanol
Anidro sobe 0,11% e hidratado recua 0,17% na semana
07/07/25
VEJA MAIS
Newsletter TN

Fale Conosco

Utilizamos cookies para garantir que você tenha a melhor experiência em nosso site. Se você continuar a usar este site, assumiremos que você concorda com a nossa política de privacidade, termos de uso e cookies.