Perfil
Propostas
Desenvolvendo seu Primeiro “Data Product” com Python e Google Cloud Platform [4h]
O objetivo deste tutorial é dar as primeiras noções do que é um “Data Product” e como você pode utilizar Python, Google Cloud Platform e algumas ferramentas livres para produzir seu primeiro primeiro produto.
Para isso, iremos:
- conhecer técnicas fundamentais de exploração que usamos para sumarizar dados. Normalmente estas técnicas são utilizadas para direcionar o desenvolvimento de modelos estatísticos mais complexos e também para explorar hipóteses que possam ser realmente respondidas pelos dados disponíveis;
- discutiremos porque uma boa análise precisa ser reprodutível. A reprodutibilidade é fundamental para garantir que os resultados de um estudo possa ser validado independentemente. Como efeito colateral, impõe uma disciplina maior na execução de projetos de análise e um processo automatizado de trabalho;
- conceituaremos o que constitui um “Data Product”, que é o resultado final de uma análise estatística. O foco estará na criação de um relatório dinâmico que automatiza o processo de análise, mas os conceitos podem ser extrapolados para muitas outras aplicações;
Durante o tutorial implantaremos um stack básico para análise de dados e exploraremos como podemos fazer uso de uma oferta de cloud pública para executar processamento e divulgar nossos resultados.
Público Alvo:
- Programadores em busca de conhecimentos mais formais de estatística e análise de dados;
- Analistas que trabalham com muitos dados e que gostariam de ter menos esforço braçal no seu dia a dia;
- Gerentes que estejam refletindo se Data Science é só mais uma “buzzword” ou se podem gerar valor real para suas iniciativas;
Pré Requisitos:
- Conhecimento básico de Python;
- Conhecimento básico de Linux;