Mineração de dados no combate à Covid-19

Pesquisadores cruzam dados oficiais com aqueles capturados da web, do Twitter e do Google

Os professores Faculdade de Ciências e Tecnologia (FCT) da Unesp, câmpus de Presidente Prudente, conversaram com o Portal Unesp sobre a iniciativa multicâmpus de pesquisadores da Universidade de criar o RADAR UNESP COVID-19 para ajudar as autoridades de saúde na tomada de decisão porque mostra, de forma antecipada, a propagação da COVID-19.

Os professores entrevistados são Rogério Eduardo Garcia (pesquisador e diretor da unidade), Danilo Medeiros Eler e Ronaldo Celso Messias Correia (Departamento de Matemática e Computação). Participam também o professor Edmur Azevedo Pugliesi (Departamento de Cartografia), o professor Raul Borges Guimarães (Departamento de Geografia) e o professor Carlos Magno Castelo Branco Fortaleza (Departamento de Doenças Tropicais e Diagnóstico por Imagem da Faculdade de Medicina da Unesp, câmpus de Botucatu), além do doutorando em Ciência da Computação Wilson Estécio Marcílio Júnior e do mestrando na mesma área Rafael Bezerra de Menezes Rodrigues, da FCT-Unesp.

Portal Unesp: O que é o RADAR UNESP COVID 19? 

Rogério Eduardo Garcia: RADAR COVID-19 é um site construído e atualizado diariamente com dados da evolução dos casos reais no estado de São Paulo e no Brasil, por iniciativa dos pesquisadores da Faculdade de Ciências e Tecnologia (FCT) da Unesp, câmpus de Presidente Prudente. O link da plataforma é http://www.fct.unesp.br/covid19

Portal Unesp: Quais as técnicas e metodologias usadas para o levantamento das informações?

Danilo Medeiros Eler: Os pesquisadores trabalham com dados oficiais e com os capturados da Internet, por meio do Twitter e do mecanismo de buscas do Google. No primeiro caso, são informações de uma base confiável e oficial. Já os dados da Internet, dividimos em duas formas de levantamento. Uma é a coleta de postagens do Twitter no estado de São Paulo que são filtradas com base em palavras-chave que estejam relacionadas com os sintomas da COVID-19. Assim, temos os rumores de possíveis infecções ou consultas relacionadas com a disseminação da doença. Como as postagens (tweet) são georreferenciadas, conseguimos indicar tal localização no mapa. As outras são as consultas no Google, obtidas pelo sistema Google Trends, que fornece a localização e a quantidade de interesse que as pessoas estão com relação a alguns dos principais sintomas da COVID-19; no caso, o interesse de uma região é medido pela quantidade de consultas provenientes daquela área.


Continua depois da publicidade


Portal Unesp: Quais são as pesquisas realizadas?

Danilo Medeiros Eler: Em um primeiro momento, as pesquisas estão relacionadas com a visualização dos casos reais de infecção da COVID-19 e dos rumores nas diferentes cidades do estado de São Paulo. Em seguida, com a coleta dos rumores provenientes das postagens do Twitter e das consultas no buscador do Google, buscamos fazer análises e predições de possíveis rotas de disseminação da doença pelo interior do estado de São Paulo. Por exemplo, as postagens do Twitter serão classificadas como relevantes ou não para análise se tiverem relação com os casos confirmados de infecção da COVID-19. Também são elaboradas representações cartográficas.

Portal Unesp: Como essas pesquisas ajudam a combater a COVID-19?

Danilo Medeiros Eler: Os dados de rumores podem ser um indicativo de uma disseminação antes da confirmação dos casos. Por exemplo, se uma região começa a ter um interesse repentino sobre os sintomas da COVID-19, isso pode indicar que aquela região esteja com uma possível contaminação ou nova contaminação. Dessa maneira, esses indicativos podem ser utilizados pelas autoridades na tomada de decisão.

Portal Unesp: Qual é o diferencial da Unesp em relação a outras pesquisas semelhantes?

Danilo Medeiros Eler: Pelo que temos observado, muitos estão mapeando os casos confirmados. Na nossa perspectiva, o nosso diferencial é a coleta de dados de rumores das postagens do Twitter e das pesquisas do Google, bem como de uma aplicação que está para ser finalizada, que coletará relato de alunos e funcionários da Unesp. Essas informações serão utilizadas para análises e previsões de um possível aumento da propagação da COVID-19 no interior do estado de São Paulo, considerando que a UNESP possui unidades em 23 cidades distribuídas por todas as regiões do território paulista.

Portal Unesp: Os mapas e gráficos produzidos são montados para especialistas ou o para o público em geral?

Ronaldo Celso Messias Correia: Os mapas foram produzidos para que qualquer pessoa possa observar como está a propagação da doença em sua cidade ou região. Para isso, são apresentados mapas interativos e técnicas de visualização de dados revelam a quantidade de casos ou de rumores na região de interesse.

Portal Unesp: Como foi a formação do time com pesquisadores da Matemática, Ciências da Computação, Geografia e Medicina?

Ronaldo Celso Messias Correia: O professor Carlos Fortaleza convidou o professor Raul para apoiar a análise de possíveis caminhos da propagação da doença pelo estado de São Paulo, bem como análise de dados de rumores. Em seguida, o professor Raul convidou o professor Rogério junto comigo e o professor Danilo para compor o time, juntamente com os alunos Wilson e Rafael. Finalmente, o professor Edmur, que estava elaborando mapas para representar informações sobre os casos reais no Brasil, também somou esforços ao grupo inicial.

Portal Unesp: O senhor acredita que as pesquisas que são realizadas no combate à Covid 19 mudarão a percepção da sociedade sobre a importância da ciência?

Ronaldo Celso Messias Correia: Esperamos que sim! Esperamos que mudem a visão sobre a importância da Ciência e que também observem o importante papel que a universidade pode fazer pela população, bem como a divulgação de áreas do conhecimento e a importância da sua interação pelo bem da Ciência e da sociedade. Além da população, também esperamos que as autoridades reflitam sobre a importância em fomentar pesquisas.

Portal Unesp: Os dados coletados podem ter respostas para perguntas que ainda não foram feitas?

Ronaldo Celso Messias Correia: Sim. Por exemplo, estabelecer a relação dos casos confirmados com a faixa etária e a densidade demográfica em cada região estudada, além de outros desafios que ainda vão nos estimular.