Profile

Arthur Fortes @fortesarhur


About Me

Doutorando no Instituto de Ciências Matemáticas e Computacionais da Universidade de São Paulo. Bacharel em Ciência da Computação (2012) pelo Centro de Ensino Unificado de Teresina (CEUT) e Mestre em Ciência da Computação (2015) pela Universidade de São Paulo. Atua nas áreas de Inteligência Artificial, Mineração de Dados e Sistemas Web Multimídia, focando nos seguintes temas: sistemas de recomendação, agrupamento de dados, personalização e adaptação de conteúdo e desenvolvimento de si

Proposals

Case Recommender: Fazendo recomendação em Python

Que tal falar sobre recomendação?


Bons sistemas de recomendação podem aumentar as vendas/ acessos em vários pontos percentuais. É por isso que eles se tornaram um recurso essencial para lojas e serviços online e tem se tornado uma área bastante procurada no mercado. Devido a esta necessidade de conquista, a personalização tem se apresentado como um fator facilitador no momento de "cativar" o usuário.


No últimos anos, tenho me dedicado a área e reunido os principais algoritmos em uma única ferramenta, o Case Recommender. O framework é implementado em Python e possui uma série de populares algoritmos de recomendação, tanto para feedback implícito quanto explícito em diferentes tipos de abordagens baseadas nos principais tipos recomendação (previsão de notas e ranking).


Este palestra dará uma visão geral sobre os sistemas de recomendação utilizados nas tarefas de personalização, assim como ferramentas que podem auxiliar os desenvolvedores a implementar esses sistemas.

Case Recommender: Utilizando Python para desenvolver sistemas de recomendação

Que tal falar sobre recomendação?


Os sistemas de recomendação são uma subárea de recuperação de informação (do inglês, Information Retrival) que tem por objetivo fazer novas sugestões personalizadas que possam vir a ser de interesse do usuário, com base nos seus feedback (sejam implícitos ou explícitos) ou nas escolhas feitas por outros usuários com gostos similares. Bons sistemas de recomendação podem aumentar as vendas/acessos em vários pontos percentuais. É por isso que eles se tornaram um recurso essencial para lojas e serviços online e têm sido uma área bastante procurada no mercado. Devido a esta necessidade de conquista, a personalização tem se apresentado como um fator facilitador no momento de "cativar" o usuário.


Ao navegar por sites como Amazon, Facebook e Americanas você já se deparou com frases como “Quem viu este produto, viu também…”, “Clientes que compraram este item também compraram…” e “Porque você comprou este produto…” ? Ou quem sabe, ao assistir um filme ou ouvir uma música no Netflix/Spotify, encontrou, dentre as sugestões, alguma outra produção que se encaixava direitinho com seu gosto? Este tutorial dará uma visão geral sobre os sistemas de recomendação utilizados nas tarefas de personalização, assim como ferramentas e bibliotecas que podem auxiliar os desenvolvedores a implementar esses sistemas em Python. Serão apresentadas diversas bases de dados públicas reais, scripts e algoritmos em Python, para gerar e avaliar a recomendação, além dos principais problemas que surgem durante a implementação de um recomendador. A fim de facilitar a aprendizagem e a compreensão do conceito, este tutorial irá se utilizar do framework Case Recommender: uma ferramenta implementada em Python, que possui uma série de populares algoritmos de recomendação, tanto para feedback implícito quanto explícito, em diferentes abordagens baseadas nos principais tipos de recomendação, sendo eles previsão de notas e ranking.


Serão abordados, ainda, conceitos de Aprendizado de Máquina e Inteligência Artificial, como Cross Validation, KNN, SVD, métricas de similaridade, entre outros, utilizando as bibliotecas numpy, scipy e sklearn do Python. Assim, serão apresentados os principais conceitos e estratégias que os sistemas de recomendação utilizam para transformar dados em informação personalizada altamente poderosa. 


 


 


Duração: 4 ~6 horas
Nível de conhecimento: Intermediário


Configuração de ambiente e OS:



[Linux, Windows e MAC]
[Python 3]


Bibliotecas: [numpy, scipy, sklearn, pandas e caserecommender] (Todos em pip)

[Data Science] [Científico] Case Recommender: Fazendo recomendação em Python

Que tal falar sobre recomendação?


Os sistemas de recomendação são uma subárea de recuperação de informação (do inglês, Information Retrival) que tem por objetivo fazer novas sugestões personalizadas que possam vir a ser de interesse do usuário, com base nos seus feedback (sejam implícitos ou explícitos) ou nas escolhas feitas por outros usuários com gostos similares. Bons sistemas de recomendação podem aumentar as vendas/acessos em vários pontos percentuais. É por isso que eles se tornaram um recurso essencial para lojas e serviços online e têm sido uma área bastante procurada no mercado. Devido a esta necessidade de conquista, a personalização tem se apresentado como um fator facilitador no momento de "cativar" o usuário.


Ao navegar por sites como Amazon, Facebook e Americanas você já se deparou com frases como “Quem viu este produto, viu também…”, “Clientes que compraram este item também compraram…” e “Porque você comprou este produto…” ? Ou quem sabe, ao assistir um filme ou ouvir uma música no Netflix/Spotify, encontrou, dentre as sugestões, alguma outra produção que se encaixava direitinho com seu gosto? Esta palestra dará uma visão geral sobre os sistemas de recomendação utilizados nas tarefas de personalização, assim como ferramentas e bibliotecas que podem auxiliar os desenvolvedores a implementar esses sistemas em Python. Serão apresentadas diversas bases de dados públicas reais, scripts e algoritmos em Python, para gerar e avaliar a recomendação, além dos principais problemas que surgem durante a implementação de um recomendador. A fim de facilitar a aprendizagem e a compreensão do conceito, esta palestra irá se utilizar do framework Case Recommender: uma ferramenta implementada em Python, que possui uma série de populares algoritmos de recomendação, tanto para feedback implícito quanto explícito, em diferentes abordagens baseadas nos principais tipos de recomendação, sendo eles previsão de notas e ranking.


Serão abordados, ainda, conceitos de Aprendizado de Máquina e Inteligência Artificial, como Cross Validation, KNN, SVD, métricas de similaridade, entre outros, utilizando as bibliotecas numpy, scipy e sklearn do Python. Assim, serão apresentados os principais conceitos e estratégias que os sistemas de recomendação utilizam para transformar dados em informação personalizada altamente poderosa.

​Mineração de contexto em textos PT-BR usando Keras e NLTK

 A Mineração de Textos é uma das subáreas da Inteligência Artificial que tem como objetivo básico a busca por padrões e conhecimento útil em textos. O exemplo clássico dessa área são os filtros de spam muito utilizados nos sistemas de e-mail, os quais aplicam algoritmos de machine learning para identificar se uma mensagem é ou não é spam! Além disso, essas técnicas também podem ser utilizadas para classificação de notícias, ou seja, caso o sistema receba um conjunto de textos como entrada, os algoritmos podem identificar se são notícias sobre esporte, economia ou política; por exemplo.

 

Com essa apresentação o público terá uma visão teórica e prática de como funciona o processo de mineração de textos utilizando a técnica de classificação. É abordado um estudo de caso prático que mostra passo a passo como utilizar deep learning para identificar contexto em frases. Serão abordados os conceitos sobre classificação de textos, remoção de stops words, aplicação de algoritmos de stemming, teoria sobre deep learning e finalmente a implementação do classificador de contexto. Com isso, o público terá uma visão teórica e prática passo a passo de todas as etapas que envolvem a classificação de textos!

 

Sobre mim: Orientado a café e código eu sou ciêntista de dados no Instituto de Pesquisas Eldorado e doutorando em ciência da computação na USP. Minhas atuais áreas de pesquisas são sistemas de recomendação, deep learning e técnicas de pre-processamento de texto. 

Transcrição automática de áudio em texto usando Python e Deep Learning


Você sabe o que é e como funciona a transcrição automática de áudio em texto? Transcrever um áudio em texto nada mais é do que passar o que se está sendo falado para o meio escrito. Ou seja, transformar uma gravação sonora, um áudio, normalmente uma audiência, ou entrevista, em várias linhas de texto, escrevendo cada sílaba do que foi falado, tornando assim mais fácil a compreensão pra quem deseja saber o que foi registrado em forma de  áudio naquela mídia.  


 

Nesta palestra você irá entender como as redes  neurais profundas (Deep Learning) são treinadas para reconhecer padrões em áudios e transformá-los em textos de maneira automática e quais os principais desafios e limitações da área.