Profile

Rebeca Sarai @rsarai


About Me

-

Proposals

A busca por gargalos: Otimizando seu código python

Quando se trabalha com grandes quantidades de dados seu código Python não deve só ser executado corretamente, ele também precisa ser executado rapidamente. Otimizar código é uma grande parte do dia-a-dia do programador e à medida que a complexidade do projeto/problema aumenta as soluções comuns já não são eficientes. Essa palestra visa apresentar ferramentas para identificar gargalos no desempenho e mostrar como resolvê-los efetivamente. A partir de exemplos reais abordaremos ferramentas para lidar com “profiling”, otimização de código, concorrência, paralelismo e como modificar essas ferramentas para se adequarem a realidade do problema.

Jane Doe: como garantir proteção de dados pessoais no seu projeto.

Em dias de vazamentos de dados sigilosos, proteger os dados de clientes se tornou um ponto de falha para várias empresas e a solução está longe de trancar tudo em um lugar seguro. Compartilhar de dados é inevitável. Nesta palestra abordaremos o problema da anonimização de dados, explorando como usar técnicas de anonimização para proteger as informações pessoais dos usuários ao analisar, testar, processar ou compartilhar um banco de dados.


Jane Doe é uma personagem fictícia que perdeu a memória e não tem noção nenhuma da sua identidade, apesar disso ela consegue realizar as mesmas atividades complexas de antes. Essa palestra vai utilizar o exemplo de vida de Jane Doe no desenvolvimento de software, abordando como realizar uma anonimização em uma base de dados com o objetivo de permitir que qualquer um possa testar/analisar/processar sem infringir os direitos de privacidade do usuário garantidos pela Lei Geral de Proteção de Dados Pessoais (LGPD).


A partir de um projeto amostra, todos os campos de identificação pessoal do usuário serão substituídos por pseudônimos, explorando algumas estratégias genéricas de implementação, seus desempenhos e limitações. Por fim, o uso desse conceito excede o teste de features mais complexas, mas também protege a privacidade dos usuários nos sistemas em que trabalhamos.

Jane Doe e o desenvolvimento de software.

Testar antes de deployar é uma máxima no desenvolvimento de software. Em alguns casos isso pode ser bem simples, no entanto quanto mais complexo for o seu sistema, mais difícil será testá-lo como um todo. Outra boa prática é criar um ambiente de teste exatamente igual ao seu ambiente de produção. Ainda assim, os dados de teste podem ficar desatualizados e não refletir a situação real do seu sistema, causando bugs inesperados. Então como validar sistemas complexos?


Jane Doe é uma personagem fictícia que perdeu a memória e não tem noção nenhuma da sua identidade, apesar disso ela consegue realizar as mesmas atividades complexas de antes. Essa palestra vai utilizar o exemplo de vida de Jane Doe na validação de software, abordando como realizar uma anonimização em uma base de dados com o objetivo de permitir que qualquer um possa testar/analisar/processar sem infringir os direitos de privacidade do usuário garantidos pela Lei Geral de Proteção de Dados Pessoais (LGPD).


A partir de um projeto amostra, todos os campos de identificação pessoal do usuário serão substituídos por pseudônimos, explorando algumas estratégias de implementação, seus desempenhos e limitações. Por fim, o uso desse conceito excede o teste de features mais complexas, mas também protege a privacidade dos usuários nos sistemas em que trabalhamos.

Métodos de preservação de privacidade: como construir um projeto seguro

Dados são importantes. Nos últimos anos o número de leis relacionadas a privacidade foi de 20 para 100, alguns exemplos são: PCI compliance no setor de pagamentos, a GDPR europeia e a LGPD brasileira. Todos esses novos regulamentos tentam preencher uma lacuna antiga: o problema da anonimização de dados. Como proteger informações pessoais de usuários ao analisar, testar, processar ou compartilhar um banco de dados? E como continuar garantindo privacidade quando temos produtos baseados em IA?


Proteger os dados de clientes se tornou um ponto de falha para várias empresas e a solução está longe de trancar tudo em um lugar seguro. Compartilhar de dados é inevitável. Nesta palestra abordaremos o problema da anonimização de dados, explorando as técnicas mais comuns (K-anonymity, I-diversity, T-closeness) e as mais avançadas (Privacidade Diferencial, Federated Learning).


Quem é o público-alvo da sua palestra?


Pessoas de todos os níveis técnicos podem aproveitar esta palestra.


 O que os/as participantes devem esperar da sua palestra?



  • Participantes irão aprender a importância de anonimizar uma base de dados e como realizar essa operação em um cenário real.

  • Quais são as partes relevantes para desenvolvedores de regulamentos comuns (GDPR, LGPD, PCI)

  • Quais são os principais algoritmos de anonimização e como eles funcionam? (K-anonymity, I-diversity, T-closeness)

  • Em que situações anonimização não é suficiente e o que fazer nessas horas

Previsão de séries temporais com PyData e Inteligência Artificial

Uma previsão correta sobre um conjunto de dados observados pode significar milhões de lucro para uma empresa, ao mesmo tempo que uma previsão errada pode levar outra empresa a falência. Nessa palestra você vai ver como utilizar alguns módulos do PyData (Pandas, numpy e outras) e algumas técnicas de Inteligência Artificial (redes neurais, computação evolucionária, inteligência de enxames) para resolver problemas reais de previsão.