Perfil
Propostas
Democracia Participativa com o Crowd4City
Nome completo e instituição: Cláudio de Souza Baptista, Ph.D. - Universidade Federal de Campina Grande - UFCG
E-mail: baptista@computacao.ufcg.edu.br
Tipo de proposta : Apresentação (20 minutos, no plenário).
Título da apresentação: Democracia Participativa com o Crowd4City.
Foco principal da apresentação: Gerencial.
Fase do trabalho apresentado: Estudo de caso.
Descrição da apresentação:
Apresentamos o Crowd4City que visa facilitar a aplicação do conceito de “Democracia Participativa”, com estudo de caso na cidade de Campina Grande-PB, utilizando-se de técnicas de análise de sentimentos em dados de redes sociais.
O sistema disponibiliza um mapa, usando o Google maps, no qual usuários inserem diversas informações georreferenciadas (e.g. reclamações, denúncias, elogios), no formato vetorial: pontos, linhas ou polígonos. Assim, além das funcionalidades do Google maps, são acrescentadas consultas espaciais.
Usuários podem denunciar, por exemplo, trechos de rua mal iluminados ou com problemas no calçamento; pontos onde ocorrem muitos acidentes ou áreas inseguras (como por exemplo um quarteirão). De posse dessas informações registradas no Crowd4City, a população e os meios de comunicação podem avaliar a condição geral de bairros ou mesmo da cidade como um todo, e também realizar cobranças aos órgãos competentes para que os problemas sejam solucionados, exercendo assim o poder do fiscal social. Os cidadãos passam a ter voz ativa e os problemas, por sua vez, mais visibilidade.
Por meio dos filtros espaciais, é possível realizar buscas como, por exemplo, encontrar todas as denúncias feitas com o tema “Segurança” em um raio de 100 metros da sua casa; denúncias de poluição sonora próxima a hospitais; reclamações de problemas no caminho em que você faz para ir ao trabalho; entre outras inúmeras possibilidades.
Além de permitir que usuários cadastrados possam realizar denúncias no mapa, foi desenvolvida uma metodologia de recuperação de textos do Twitter para encontrar mais informações sobre a cidade. Por meio de um filtro geográfico, foram recuperados tweets que dizem respeito ao estado da Paraíba para enriquecer a base de dados do Crowd4City, visto que esta é uma rede social já consolidada e é bastante utilizada também por seus usuários para registrar reclamações, denúncias e também elogios.
Após a recuperação desses tweets, foram aplicadas técnicas de análise de sentimentos para identificar a polaridade da opinião.
Uma vez que os tweets coletados eram geo-referenciados, estes foram plotados no mapa do Crowd4City e foram exibidos de acordo com o sentimento identificado. Assim, foi possível visualizar o mapa como um todo e identificar o sentimento geral dos usuários do Twitter com relação à cidade e o estado.
Detalhes técnicos:
O Crowd4City exibe postagens coletadas do Twitter (tweets) em tempo real, que estejam relacionadas com contratos, obras ou outras formas de utilização de recursos públicos. Para tanto, o Crowd4City conta com um módulo que se utiliza da API de Streaming do Twitter (https://developer.twitter.com/en/docs/tweets/filter-realtime/api-reference/post-statuses-filter.html ) que possibilita que sejam capturados um percentual de tweets que estão sendo publicados em tempo real. Utilizamos a captura de tweets com um filtro baseado em um conjunto de palavras-chave relevantes ao contexto de recursos públicos, juntamente com uma filtragem por metadados, de modo a se obter somente os tweets escritos em Português e geolocalizados no estado da Paraíba.
O módulo de tweets também encarrega-se de processar os tweets recebidos de modo a remover spam e outros tipos de conteúdo inadequado ou não desejado. O processamento também realiza expansão de hashtags e análise de metadados, a exemplo dos campos responsáveis pela geolocalização do tweet. A partir desse processamento, é possível aplicar um filtro secundário, baseado na indexação dos tweets coletados a partir de suas palavras-chave. Esse processo de indexação ajuda a manter somente os tweets com potencial relevância para o contexto trabalhado.
Realizada essa etapa de pré-processamento para identificação de tweets relevantes ao contexto do Crowd4City, estes tweets são submetidos ao crivo de um classificador de sentimentos para a identificação da polaridade (Positivo ou Negativo) e enriquecimento dos dados da base de dados do Crowd4City. O classificador foi construído através de técnicas de aprendizagem supervisionada utilizando dois classificadores bayesianos, onde o primeiro é responsável por identificar tweets opinativos e o segundo classifica a polaridade dos tweets opinativos. Os classificadores foram construídos e avaliados com dados de treinamentos e testes da própria base do Crowd4City separados e rotulados para estes propósitos. O classificador de sentimentos foi implementado na linguagem de programação Java utilizando a biblioteca do WEKA (https://www.cs.waikato.ac.nz/ml/weka/) para modelagem dos classificadores bayesianos.
Foi desenvolvido um aplicativo para Android utilizando Google maps, Java e a biblioteca Volley para requisição via Web services do servidor do Crowd4City. O servidor do Crowd4City foi desenvolvido em PHP e os dados são armazenados no SGBD Postgresql com extensão POSTGIS para os dados, consultas e indexação espacial via R-Trees.
Mini-currículo:
Cláudio de Souza Baptista é Professor Titular do Departamento de Sistemas e Computação da Universidade Federal de Campina Grande, onde coordena o Laboratório de Sistemas de Informação - LSI. Possui Ph.D. em Computer Science pela University of Kent, UK, em 2000; Mestrado e Bacharelado em Ciência da Computação pela UFPB, em 1991 e 1989, respectivamente. Realiza pesquisa em Geoprocessamento, Text Mining, Business Intelligence e Analytics, Banco de Dados e Sistemas de Informação, tendo orientado várias teses de doutorado e dissertações de mestrado nestas áreas. Possui mais de 150 artigos científicos publicados em periódicos, congressos internacionais e nacionais. É bolsista de produtividade em Desenvolvimento Tecnológico do CNPQ.