Perfil
Propostas
Classificação de variantes genéticas no Kaggle: NLP e classes desbalanceadas
Descrição da solução criada no Laboratório de Inovação do Hospital Albert Einstein para classificação de variantes genéticas na competição Personalized Medicine: Redefining Cancer Treatment, do Kaggle.
Trata-se de um problema de classificação de texto em 9 classes extremamente desbalanceadas. Discutiremos principalmente tópicos de balanceamento de classes e, em menor escala, técnicas de NLP (natural language processing) em Python.
Duração: 30 minutos.