Perfil

Heitor Santos @heitormsantos


Sobre mim

-

Propostas

Classificação de variantes genéticas no Kaggle: NLP e classes desbalanceadas

Descrição da solução criada no Laboratório de Inovação do Hospital Albert Einstein para classificação de variantes genéticas na competição Personalized Medicine: Redefining Cancer Treatment, do Kaggle.


Trata-se de um problema de classificação de texto em 9 classes extremamente desbalanceadas. Discutiremos principalmente tópicos de balanceamento de classes e, em menor escala, técnicas de NLP (natural language processing) em Python.


Duração: 30 minutos.