Perfil

Henrique Pougy @hpougy


Sobre mim

-

Propostas

NLP e aprendizagem de máquina aplicados à transparência ativa dos gastos públicos municipais

Nome completo: Henrique Pougy
Instituição:
Prefeitura Municipal de São Paulo
Tipo de proposta: apresentação (20 minutos, no plenário)
Foco principal da apresentação: técnico
Fase do trabalho apresentado: estudo de caso com resultados práticos

 


NLP e aprendizagem de máquina aplicados à transparência ativa dos gastos públicos municipais


Descrição da apresentação:


 


 


    Se a estrutura funcional-programática hoje adotada pela administração pública brasileira proporciona um enquadramento conceitual bastante interessante no que diz respeito ao planejamento dos gastos públicos, por outro lado ela implica em perdas na transparência ativa, sobretudo no que diz respeito às contratações com a iniciativa privada e terceiro setor. Trespassada pela representação proporcional do legistlativo, que se manifesta na forma de emendas às leis orçamentárias anuais, e enviesada pela cultura organizacional das unidades técnicas elaboradoras do orçamento, que muitas vezes tendem a replicar o orçamento anterior, apenas adequando os valores, a estrutura orçamentária decorrente deste processo muitas vezes não corresponde à forma real como se distribuem os gastos públicos. Dotações que representam descrições genéricas dos gastos são colocadas lado a lado com dotações específicas, e contratos de mesmo objeto podem ser classificados em mais de uma dotação. Além disso, a criação e/ou extinção de dotações torna difícil compreender a evolução temporal dos gastos com determinados produtos e serviços.


    Esta apresentação tem por objetivo apresentar uma forma complementar de se analisar a estrutura dos gastos públicos com contratos de bens e serviços com a iniciativa privada e terceiro setor. Por meio de técnicas de processamento de línguas naturais e algoritmos de aprendizagem de máquina supervisionados e não-supervisionados, estruturaremos uma nova classificação por temas, complementar à estrutura orçamentária, a  partir da descrição do objeto do contrato (campo de texto aberto obrigatoriamente preenchido quando do momento do cadastro de novos contratos no Sistema Orçamentário Financeiro da Prefeitura Municipal de São Paulo). Além de trazer ganhos em termos de transparência ativa, fornecendo uma classificação mais clara dos gastos com determinados tipos de serviços e bens, esta nova classificação permite também identificar potenciais economias de escala, identificar anomalias de gastos, padronizar contratações e mesmo repensar a própria estrutura orçamentária.


    Dentre essas aplicações, apresentaremos uma análise da implementação do Marco Regulatório das Organizações da Sociedade Civil na Prefeitura Municipal de São Paulo, a partir da consideração das formas de contratação com organizações da sociedade civil.


Detalhes técnicos: 


A apresentação será feita por meio de um Jupyter Notebook com código em Python 3.6, empregando as librarys NLTK, Pandas, SKLearn, Numpy, Requests.


O fluxo da aplicação apresentada consiste em:


1 - Requisições à API do Sistema Orçamentário Financeiro e parseamento do JSON por ela retornada, por meio de wrapper em python que abstrai essas requisições em classes


2 - Pipeline de processamento de línguas naturais, incluindo tokenização, remoção de stopwords, stemming e construção da matriz de termos por documentos


3 - Implementação de algoritmo de clusterização (k-means) a partir da matriz de termos por documentos


4 - Implementação de algoritmo supervisionado de classificação (decision tree boosting) a partir da análise dos clusters encontrados


5 - Aplicação de algoritmo de classificação supervisionado (Naive Bayes) para analisar a implementação do Marco Regulatório das Organizações da Sociedade Civil


 


Mini-currículo:


Formado em Ciências Sociais pela Universidade de São Paulo e cursando MBA em Big Data Analytics pela Fundação Instituto de Administração da Universidade de São Paulo, o proponente é Analista de Políticas Públicas e Gestão Governamental na Prefeitura Municipal de São Paulo, tendo atuado na Secretaria de Gestão (atual) e na Secretaria do Verde e Meio Ambiente.