Perfil
Propostas
Extracting web data with Sparql (web semantics)
No mundo de Business Intelligence, Big data, etc...
Extrair os dados da(s) fonte(s) correta(s) é o maior desafio, definir os targets já é um desafio (querying the web with google).
A ideia é mostrar os conceitos de web semantica nos seguintes:
* o que é?
* arquitetura padrao w3c;
* rdf (resource description framework);
*rdfs (resource description framework standards);
* sample de código.
Bonus:
Ferramentas e shortcuts.
WebCrawlers and Data analysis with python
O objetivo é mostrar técnicas de econometria no vasto mundo web. Antes de qualquer técnica e/ou ferramenta de estatística.
Mostrar tecnicas para trabalhar com requisicoes como por exemplo emular browser, trabalhar com requisicoes (como utilizar fiddler, wireshark).
Conceitos basicos para analise de texto como:
Regex;
Xquery;
Frameworks recomendados.
Estruturação de base de dados.
* streaming apis