Perfil
Propostas
Estrutura de Dados Probabilisticas
As estruturas de dados probalisticas são extremamente úteis quando se quer manter um 'foot print` de memória baixo atrelado a uma baixa complexidade computacional ao custo de uma margem de erro no resultado. Essas estruturas são muito úteis quando se trata de ambientes com grandes quantidades de dados e é aceitavel até uma determinada margem de erro.
Nessa palestra, pretendo mostrar três estruturas de dados probabilisticas (ordem de complexidade):
1. Bloom Filters
2. Count-Min Speck
3. Hyper LogLog
Mostrarei as principais motivações para usar essas estruturas de dados, como funcionam (apresentar a idéia por trás de cada uma dessas estrturas), libs de python que implementam essas estruturas e compações com suas alternativas tradicionais (uso de memória e complexidade computacional).