Perfil

Rogers Reiche de Mendonça @rogers


Sobre mim

Mestre em Sistemas de Informação (2013) pelo Programa de Pós Graduação em Informática (PPGI) da UFRJ, com pesquisas nas áreas de Proveniência de Dados, Web Semântica e Inteligência de Negócios (Business Intelligence).

Analista de Sistemas da Petrobras (Petróleo Brasileiro) desde 2006, com atuação em Auditoria Interna de Sistemas, Auditoria Contínua, Ciência de Dados, Gestão de Conteúdo e Busca Corporativa (Enterprise Search).

Propostas

Auditoria em Tempos de Big Data: Uso de Mineração de Textos para Reunir Informações com Agilidade e Segurança

Nome: Rogers Reiche de Mendonça


E-mails:
rogers.mendonca@petrobras.com.br
rogers.rj@gmail.com


Instituição:
Petrobras


Tipo de Proposta:
Apresentação (20 minutos, no plenário)


Título:
Auditoria em Tempos de Big Data: Uso de Mineração de Textos para Reunir Informações com Agilidade e Segurança


Foco Principal:
Técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados.


Fase do Trabalho:
Estudo de Caso com resultados práticos.


Descrição:
Na atual era de Big Data, convivemos com enormes desafios na gestão e no controle de entidades e políticas públicas.


Entre os desafios do dia-a-dia está a questão: como reunir, de maneira rápida, simples e segura, as informações relevantes para a condução das análises de auditoria, num cenário complexo de grande volume de dados com diferentes formatos e provenientes de diversas fontes?


Nesse sentido, será apresentado um Estudo de Caso com resultados práticos, no qual técnicas de Mineração de Textos e Recuperação da Informação foram aplicadas para encontrar, reunir e classificar informações relevantes ao contexto de auditoria.


Na apresentação, haverá a demonstração de um protótipo desenvolvido com tecnologias open source e gratuitas, que poderá ser livremente adaptado e estendido para uso em atividades de gestão e controle corporativos.


Por fim, serão compartilhados os resultados do Estudo de Caso e as experiências aprendidas.


Estrutura da apresentação:
1. Desafios e problemas da era de Big Data para a gestão e o controle de entidade e políticas públicas;
2. Estratégia de Mineração de Textos para reunir informações relevantes ao contexto de auditoria;
3. Demonstração prática;
4. Resultados.


Detalhes Técnicos:
Aplicação de algoritmos e métodos de Mineração de Textos (Ex.: normalização, remoção de stopwords, stemming, classificação em facetas, recuperação rankeada).


Utilização do Apache Lucene (biblioteca Java) para processar e recuperar conteúdo textual.


Utilização do Apache Tika (biblioteca Java) para extrair dados e metadados de diferentes tipos de documentos.


Utilização de JSF e Spring (frameworks Java) para implementar a interface Web de visualização.


Mini-Currículo:
Auditor Interno e Analista de Sistemas da Petrobras (2006 - Atual).
Mestre em Sistemas de Informação pelo Programa de Pós Graduação em Informática (PPGI), UFRJ.
Bacharel em Ciência da Computação pela UFRJ.


* Certificações:
CISA (ISACA - Certified Information Systems Auditor)
CRISC (ISACA - Certified in Risk and Information Systems Control)
CDIA+ (CompTIA - Certified Document Imaging Architech)
E20-120 (EMC Proven Professional - Content Management Foundations)
IBM FileNet FCP Content Manager-Administrator 4.0
SCJP (Sun Certified Java Programmer)
SCWCD (Sun Certified Web Component Developer)


* Palestras sobre Análise de Dados (título, local e ano):
LOP - Capturing and Linking Open Provenance on LOD cycle.
Workshop on Semantic Web Information Management (SWIM), New York, 2013


Gerência de Proveniência Multigranular em Linked Data com a Abordagem ETL4LinkedProv.
Simpósio Brasileiro de Banco de Dados (SBBD), Curitiba, 2014


Auditoria de Sistemas em tempos de Big Data.
Fórum de Auditoria de Sistemas (Vale), Rio de Janeiro, 2016


Auditoria de Sistemas em tempos de Big Data: Busca de Informações.
Fórum de Auditoria de Sistemas (TIM), Rio de Janeiro, 2017


* Publicação em periódico:
ETL4LinkedProv: Managing Multigranular Linked Data Provenance. Journal of Information and Data Management (JIDM), 2016