7º Behave Data Meetup
A sétima edição do Behave Data Meetup está chegando e temos chamada para lightning talks! Uma lightning talk é uma apresentação curta. Para este meetup teremos apresentações de 15 minutos sobre Data Science. Você é livre para falar sobre ferramentas, casos de sucesso ou até mesmo algum trabalho acadêmico que você tenha feito.
Esta edição será no dia 31 de Maio, às 19 horas, na ThoughtWorks. Você pode submeter sua palestra até o dia 20 de Maio!
Endereço: Avenida dos Andradas, número 3000 - 6 andar.
Propostas
Algoritmos Ensemble com Árvores de Decisão
Árvore de Decisão é um algoritmo de máquina de aprendizado supervisionado. Uma das grandes desvantagens desse algoritmo é a dependência do conjunto de treino. Qual o problema disso? O que ocorre com classificadores desse tipo é o overfitting. Em outras palavras, tais classificadores ficam 'viciados' no conjunto de treino. O que fazer para contornar isso? É aí que surge o método ensemble: tal método utiliza como classificação o voto majoritário de um conjunto de classificadores ditos fracos. Intuitivamente, seria como se numa conferência médica, especialistas em diferentes áreas quisessem diagnosticar um paciente com diferentes sintomas. O diagnóstico dado pelo voto majoritário de todos os conferencistas é mais forte que o diagnóstico dado por um único médico, certo? Quer ver isso funcionando? Você pode conferir essa palestra através de uma apresentação de exemplos práticos.
Bancos de dados em grafos e Neo4j
Nos últimos anos tem surgido bancos de dados baseados em modelos diferentes do modelo relacional. Uma classe particular desses bancos de dados são os bancos de dados baseados em grafos, que, como o nome sugere, representam e armazenam dados como um grafo. Nesta apresentação introduziremos o modelo baseado em grafo a apresentaremos um estudo de caso utilizando o Neo4j, um dos principais bancos de dados baseados em grafos da atualidade. Recentemente, por exemplo, o Neo4j foi utilizado como uma das principais tecnologias por trás da investigação dos Panama Papers.
Alguns topicos da apresentação incluem o modelo em grafo, diferenças para o modelo relacional, o Neo4j e a linguagem Cypher e um estudo de caso com dados reais, abrangendo desde modelagem, carga e consulta de dados. Por fim, pretende-se mostrar exemplos de análises utilizando métricas de redes complexas.
Excel e Data Science - Parte II - Melhorando o modelo apresentado no último Meetup
No último Meetup apresentei um modelo de predição utilizando Regressão Linear Simples a idéia agora é mostrar como melhorar o modelo para conseguir obter melhores resultados utilizando Regressão Linear Multipla. A apresentação seguirá a mesma dinâmica da anterior mostrando o passo a passo e análise dos resultados.
Modelo Matemático para Otimização de Rotas de Ônibus com Dados Coletados por IoT
O objetivo desta pesquisa foi detalhar a análise operacional de uma rota de ônibus, do ponto de vista do proprietário da frota e do usuário simultaneamente, procurando encontrar a melhor freqüência de viagens por hora para esta rota. Para isso, foi analisada uma situação real onde diversos parâmetros operacionais foram coletados com a ajuda da Internet das Coisas, possibilitando um tratamento prático e mais detalhado da teoria. O modelo matemático criado permite simular diversas situações diferentes sobre a rota analisada.