Perfil

Mateus Vitor @vittorduartte


Sobre mim

-

Propostas

Uma solução Python, semi-automática, para extração, transformação e carga de dados abertos conectados

Resumo


A internet nas últimas décadas tem incorporado-se cada vez mais nas nossas vidas, nos mais diversos aspectos desde indústria, saúde, gestão, relacionamentos e etc. O que, talvez, algumas pessoas não saibam é que os seus insumos, os dados, também atravessaram uma série de mudanças até alcançar o propósito e as possibilidades que hoje eles prometem.


Para entendermos o cenário macro analisaremos rapidamente a evolução dos dados na web e seus paradigmas: Dados Abertos, Dados Conectados, Dados Abertos Conectados e Padrão 5 Estrelas. Veremos também conceitos de Data Warehouse, como ETL (Extract Transform and Load), e DevOps. 


Tudo isso para tirarmos proveito ao máximo do nosso estudo de caso. Uma aplicação com toda codebase em Python desenvolvida na Universidade Federal do Maranhão - UFMA, onde a partir de portais totalmente públicos foi feita (1) a abertura destes dados, através de scrapers e disposição destes por meio de uma API REST; (2) a conversão dos dados para formato de dados conectados (xml rdf); e por fim (3) a carga e conexão destes para um banco de dados conectados.


Publico-Alvo


Estudantes, pesquisadores e profissionais de tecnologia que tenham interesse em trabalhos interdisciplinares. Estudantes, pesquisadores e profissionais da área de Ciência da Informação que procuram introduzir-se ou aprofundar-se mais nas tecnologias paralelas à área.  Inciantes em projetos colaborativos.


Objetivos


Entender os paradigmas de dados na web, acompanhar o desenvolvimento de uma aplicação python desde a sua idealização à implementação e mostrar que é possível adaptar as ferramentas que estão disponíveis no mercado de maneira a alavancar o seu projeto.