Perfil

Fabio Franco Costa @fabio5


Sobre mim

-

Propostas

Desenvolvendo seu Primeiro “Data Product” com Python e Google Cloud Platform [4h]

O objetivo deste tutorial é dar as primeiras noções do que é um “Data Product” e como você pode utilizar Python, Google Cloud Platform e algumas ferramentas livres para produzir seu primeiro primeiro produto.


Para isso, iremos:



  • conhecer técnicas fundamentais de exploração que usamos para sumarizar dados. Normalmente estas técnicas são utilizadas para direcionar o desenvolvimento de modelos estatísticos mais complexos e também para explorar hipóteses que possam ser realmente respondidas pelos dados disponíveis;

  • discutiremos porque uma boa análise precisa ser reprodutível. A reprodutibilidade é fundamental para garantir que os resultados de um estudo possa ser validado independentemente. Como efeito colateral, impõe uma disciplina maior na execução de projetos de análise e um processo automatizado de trabalho;

  • conceituaremos o que constitui um “Data Product”, que é o resultado final de uma análise estatística. O foco estará na criação de um relatório dinâmico que automatiza o processo de análise, mas os conceitos podem ser extrapolados para muitas outras aplicações;


Durante o tutorial implantaremos um stack básico para análise de dados e exploraremos como podemos fazer uso de uma oferta de cloud pública para executar processamento e divulgar nossos resultados.


Público Alvo:



  • Programadores em busca de conhecimentos mais formais de estatística e análise de dados;

  • Analistas que trabalham com muitos dados e que gostariam de ter menos esforço braçal no seu dia a dia;

  • Gerentes que estejam refletindo se Data Science é só mais uma “buzzword” ou se podem gerar valor real para suas iniciativas;


Pré Requisitos:



  • Conhecimento básico de Python;

  • Conhecimento básico de Linux;