Perfil
Propostas
Os Desafios de Resolução de Entidades na era do Big Data
Resumo:
Nesta palestra pretendo falar sobre o que vem a ser Resolução de Entidade, do inglês Entity Resolution (ER), apresentarei alguns termos técnicos como Deduplication, Canonization, Recod Linkage.
A resolução de entidades é a tarefa de desambiguar manifestações de entidades do mundo real em vários registros ou menções, vinculando e agrupando. Por exemplo, pode haver diferentes maneiras de abordar a mesma pessoa em texto, endereços diferentes para empresas ou fotos de um objeto específico. Isso claramente tem muitas aplicações, principalmente dados de Saúde Pública e do Governo, pesquisa na web, comparação de compras, aplicação da lei, detecção de fraude e muito mais.
Algumas perguntas que vão ser respondidas na palestra são: Como empresas como o Google usam ER no dia a dia? Quais os principais desafios na Resolução de Entidade na Era do Big Data ? Como usar o Python e técnicas de ER em projetos pessoais ? Como aplicar o Dedupe ?
Nessa palestra pretendo mostrar aos ouvintes os desafios da ER bem como mostrar o que é preciso para que possam aplicar técnicas de ER no trabalho e em projetos pessoais, empresáriais.
Público alvo:
Progamadores (do nível básico ao avançado).
Profissionais que tenham afinidade ou se interessem por Análises de Dados, Ciência de Dados.
Profissionais e entusiastas de negócios que desejem melhorar processos de aquisição de dados e agregar valor para os projetos.
O que esperar da palestra?
1. Será apresentado o que vem a ser Resolução de Entidade.
2. Será mostrado exemplos de aplicações com Resolução de Entidades.
3. Será mostrado os principais desafios da Resolução de Entidade na era do Big Data
4. Será mostrado o que vem a ser a biblioteca Dedupe.io e como usá-la.
5 Será mostrado um exemplo do uso Dedupe em um problema para resolver a Resolução de Entidade.
Há algum requisito ou pré-requisito para a palestra?
1- Linguagem Python (básico)