Perfil
Sobre mim
Coordenador de Análise de Dados e Inteligência da Informação da Diretoria de Tecnologia da Presidência da República.
Pós-doutor em Ciência da Computação pela Universidade de Ottawa, Canada. Doutor em Ciência da Informação pela Universidade de Brasília.
Propostas
Similaridade entre Atos Normativos, Decretos, Resoluções e Acórdãos - SANDRA
O Projeto de Mineração Textual para o Cálculo de Similaridade entre Atos Normativos, Decretos, Resoluções e Acórdãos - SANDRA, foi desenvolvido na Coordenação de Análise de Dados e Inteligência da Informação, da Diretoria de Tecnologia da Presidência da República (COADI/DITEC/SA/SG/PR).
Introdução:
A ideia central deste projeto foi a construção de um sistema de busca de similaridades entre os documentos legislativos, visando facilitar a elaboração de atos normativos na Casa Civil da Presidência da República, podendo ser expandido para os demais órgãos do governo federal em atividades que requeiram a consulta de base de dados legislativa, principalmente no tocante a busca de legislação similar.
Características da Proposta:
– Tipo: Apresentação (20 minutos, no plenário);
– Título: Similaridade entre Atos Normativos, Decretos, Resoluções e Acórdãos - SANDRA
– Foco: Técnico-Gerencial, visando facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados e demonstrar a gestores públicos os resultados potencializados pela análise de dados;
– Fase: estudo de caso com resultados práticos, apresentado em diversas instâncias na Presidência da República e recentemente aprovado pela Casa Civil como subsistema do Projeto Dra. Norma, concebido pela Assessoria Especial da Secretaria-Executiva da Casa Civil.
Descrição:
A solução foi completamente desenvolvida com base nos metadados de legislação disponibilizados no Portal LexML, tendo sido considerados especificamente as ementas e assuntos dos decretos e leis da esfera federal compreendidos no período de 1988 a 2018, contemplando assim, 30 anos de legislação a partir do ano de promulgação da Constituição Federal. Os conjuntos de dados (datasets) contêm aproximadamente 35 mil registros. Outros datasets foram utilizados para outras finalidades.
Os itens de software utilizados para o desenvolvimento da prova de conceito foram os seguintes: Python (Spyder), Scikit Learn, RapidMiner, QlikView, Microsoft PowerBI. Algumas rotinas foram desenvolvidas em Java e os resultados foram armazenados em banco de dados mySQL.
As técnicas e algoritmos de ciência de dados empregados foram TF-IDF, Agrupamentos X-Means e Similaridade de Cosseno.
Os resultados obtidos foram extremamente satisfatórios, tendo sido apresentados para várias audiências na Presidência da República e aprovados em diferentes ocasiões por assessores, técnicos e advogados, que realizaram inúmeras buscas no sistema e encontraram insights para variadas aplicações em suas respectivas unidades, inclusive com recomendação para disponibilização para a sociedade. Em linhas gerais, foram produzidos painéis interativos em um sistema de Business Intelligence, desenvolvido tanto em QlikView como em Microsoft Power BI:
1. Vetores (TF*IDF) por Decretos e Leis, com filtro por tipo de legislação e ano;
2. Gráfico de Legislação por Vetor e Ano;
3. Evolução anual de termos relevantes encontrados na legislação;
4. Similaridade (cosseno) entre Decretos e Leis;
5. Grafo de Agrupamentos em Classes de Decretos e Leis;
6. Tabela de Agrupamentos em Classes de Decretos e Leis, com identificação dos termos relevantes de cada classe;
7. Similaridade entre Minutas de Atos Normativos com Decretos e Leis;
8. Gráfico de Totais de Decretos e Leis por Ano;
Considerações Finais
Como considerações finais, entendemos que este projeto pode ser aplicado em inúmeros domínios no governo federal, daí a recomendação pela disponibilização da
solução para a sociedade em geral. Na próxima fase do projeto, estaremos expandindo o corpus de legislação, podendo incluir um período mais abrangente e outros tipos de Legislação, como atos, decretos-lei, deliberações, emendas, enunciados, instruções normativas, medidas provisórias, ordens de serviço, orientações normativas, portarias, provimentos, recomendações, regimentos internos e resoluções; Jurisprudência, como acórdãos, decisões, orientações e súmulas; Proposições Legislativas, como projetos de lei e propostas de emendas constitucionais; e Doutrina, como artigos, capítulos de livros, folhetos, livros e revistas.
Também, vemos emergir uma importante oportunidade de aplicação dos algoritmos e técnicas utilizados neste projeto, considerando-se a recente publicação do Decreto Nº 9.468 de 13 de agosto de 2018, no sentido que este trata das finalidades do Conselho de Transparência Pública e Combate à Corrupção. Certamente, o uso de ciência de dados e inteligência artificial poderá incentivar o desenvolvimento de soluções inovadoras para as finalidades do órgão.
Résumé
ROMUALDO ALVES PEREIRA JÚNIOR, D.Sc.
Titulação Acadêmica
– Pós-doutorado em Ciência da Computação pela Universidade de Ottawa - uOttawa, Canadá. Integrante do grupo de pesquisa em Inteligência Artificial
e Mineração Textual daquela universidade (2017);
– Doutorado em Ciência da Informação (Arquitetura da Informação) pela Universidade de Brasília - UnB (2012);
– Mestrado em Sistemas de Informação pela Universidade Federal da Paraíba - UFPb (1997);
– Especialização em Engenharia de Software pela Universidade Católica de Brasília - UFC (1988);
– Graduação em Tecnologia de Processamento de Dados pela Universidade de Brasília - UnB (1985).
Experiência Profissional
– 2017-Atualmente: Coordenador de Análise de Dados e Inteligência da Informação da Diretoria de Tecnologia da Presidência da República;
– 2005-2017: Gestor de Tecnologia da Informação da Agência Espacial Brasileira - AEB;
– 1997-2005: Analista Senior em C&T do Instituto Nacional de Pesquisas Espaciais - INPE;
– 1984-1997: Coordenador de Desenvolvimento de Sistemas do Conselho Nacional de Desenvolvimento Cientí1co e Tecnológico - CNPq.
Produção Científica
Disponível para acesso na última seção do seguinte link da página pessoal: <http://romualdoalves.com/about/>