Perfil

LEONARDO RIBEIRO @leovilela


Sobre mim

Profissional com experiência na aplicação de Algoritmos de Mineração de Dados e Textos para problemas de Classificação , Clusterização e Aplicação de Machine Learning para a Classificação de Textos através de NLP( Natural Language Processing).
Eficiente com as Linguagem R e Python, consolidou sua carreira em 10 anos de experiência com sistemas de B.I. com as Ferramentas Microsoft, Tableau, IBM e Oracle.
https://www.linkedin.com/in/leovilelaribeiro/

Propostas

NLP na prática: Aprendizado de Máquina, Deep Learning e Análise de Similaridade de textos no Controle - Conhecendo os cases, os algoritmos e bilbiotecas disponíveis em Python.

Em resposta ao chamado do seminário, trazemos uma proposta para compartilhar conhecimentos sobre a NLP em uma Oficina de 04 (quatro) horas em Laboratório de Informática, com apresentações teóricas e exercícios práticos envolvendo Dados Abertos sobre:


a) Clusterização de textos - Conceitos básicos sobre a clusterização de textos: dendograma, bag of words e exemplo prático da ferramenta Open Refine.


b) Reconhecimento de Entidades Nomeadas (REN) em textos descritivos como notas de empenho ou notas fiscais através de Aprendizado de Máquina. - Conceituação de Aprendizado de Máquina e discussão teórica sobre o aprendizado e a taxonomia para o ambiente público. Exemplos em Python.


c) Uso de Conditional Random Fiels (CRF) para REN. Conceituação do Reconhecimento de Entidades Nomeadas. Um caso prático de uso do CRF para identificar classificações de contratos, padrões de escrita  e tipologias de produtos ou serviços. Apresentação de Bibliotecas e exemplos no GitHub para utilização imediata.


d) Uso de Deep Learning com CRF. Apresentação teórica sobre uma pesquisa recente do autor comparanto o Deep Learning e o Machine Learning


e) Análise de Similaridade e aplicação de Recommender System para indicar documentos com conteúdos suspeitos. Conceituação de Sistemas de Recomendação, Matriz TF-IDF e recomendação em análise de objetos de contratos, licitações e empenhos.


 Objetivo:


Apresentar aos participantes as alternativas técnicas já avaliadas em nossa pesquisa universitária ( PUC, IGTI e TCE-MG) para possibilitar ou incrementar a aplicação de NLP em bases de dados abertas. Dar exemplos para que os participantes possam se familiarizar com os padrões de entrada para o aprendizado de máquina e rodar as principais bilbiotecas em Python.


Metodologia:


Aula Expositiva (01 hora)


Processamento dos Notebooks para aprendizado ( 02 Horas)


Avaliação dos Resutados (01 horas)


Mini Curriculo:


Professor Leonardo Vilela Ribeiro.


 https://www.linkedin.com/in/leovilelaribeiro/


Mestrando em Informática na PUC Minas  - ënfase em Recuperação de Informação. MBA em Banco de Dados e Business Inteligence pelo Unicentro Newton Paiva. Coordenador da Pós Graduação em Análise de Dados para o Controle Externo da Escola de Contas Professor Pedro Aleixo, do TCE-MG. Cordenador do Grupo de Pesquisa em Processamento de Linguagem Natural NLP da Escola de Contas Professor Pedro Aleixo, do TCE-MG.  Professor no Centro de Tecnologia e Sociedade da Fundação Getúlio Vargas, Escola de Direito, Rio de Janeiro. Professor de Descoberta de Conhecimento em Bancos de Dados na Pós Graduação em Data Science e BIG DATA do Instituto de Gestão em Tecnologia de Informação (IGTI).Professor de Linguagem de Programação Estatística na Pós Graduaçãom em Data Science e BIG DATA da PucMinas. Analista Pleno na Innova Tecnologia  a serviço no Tribunal de Contas de Minas Gerais, na Central Suricato.