Profile
Proposals
Algoritmos Ensemble com Árvores de Decisão
Árvore de Decisão é um algoritmo de máquina de aprendizado supervisionado. Uma das grandes desvantagens desse algoritmo é a dependência do conjunto de treino. Qual o problema disso? O que ocorre com classificadores desse tipo é o overfitting. Em outras palavras, tais classificadores ficam 'viciados' no conjunto de treino. O que fazer para contornar isso? É aí que surge o método ensemble: tal método utiliza como classificação o voto majoritário de um conjunto de classificadores ditos fracos. Intuitivamente, seria como se numa conferência médica, especialistas em diferentes áreas quisessem diagnosticar um paciente com diferentes sintomas. O diagnóstico dado pelo voto majoritário de todos os conferencistas é mais forte que o diagnóstico dado por um único médico, certo? Quer ver isso funcionando? Você pode conferir essa palestra através de uma apresentação de exemplos práticos.
Faça Kung Fu com Pandas!
Aviso! Esta não é uma palestra sobre Kung Fu, mas sim sobre como explorar de maneira interativa a biblioteca open-source Pandas, escrita em Python.
Pra quem não sabe, quando estamos trabalhando com Ciência de Dados, é bastante comum utilizar esta biblioteca para manipular o conjunto de dados que se tem em mãos, como uma etapa anterior a aplicação de qualquer algoritmo de Machine Learning.
O objetivo desta palestra é mostrar a você a alta performance provida pelo Pandas e também como é fácil utilizá-lo. Através de exemplos interativos utilizando Jupyter Notebook, você perceberá que não precisa ser especialista na área pra cair dentro de análise de dados.
E aí? Vamos começar fazendo um alongamento?
[ Machine Learning ] Treinando Modelos Ensemble com Scikit-Learn
Árvore de Decisão é um algoritmo de máquina de aprendizado supervisionado. Uma das grandes desvantagens desse algoritmo é a dependência do conjunto de treino. Qual o problema disso? O que ocorre com classificadores desse tipo é o overfitting. Em outras palavras, tais classificadores ficam 'viciados' no conjunto de treino. O que fazer para contornar isso? É aí que surgem os modelos ensemble: tais modelos utilizam como classificação o voto majoritário de um conjunto de classificadores ditos fracos. Intuitivamente, seria como se numa conferência médica, especialistas em diferentes áreas quisessem diagnosticar um paciente com diferentes sintomas. O diagnóstico dado pelo voto majoritário de todos os conferencistas é mais forte que o diagnóstico dado por um único médico, certo? Quer saber mais sobre isso? Você pode conferir essa palestra através de uma apresentação de exemplos cotidianos.