Profile

Brasil Digital @BrasilDigital


About Me

-

Events

7º Seminário Internacional sobre Análise de Dados na Administração Pública

O Idioma

@ Se necessita de informações em português, continue a leitura na seção abaixo.

@ Si necesita información en español, haga clic en el siguiente enlace: detalles de la llamada para trabajos en español.

O Evento

A sétima edição do Seminário Internacional sobre Análise de Dados na Administração Pública será transmitida por streaming pelo canal YouTube do TCU nos dias 21 e 22 de outubro de 2021

O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU, pela CGU e pela Enap.

Chamada de trabalhos

A chamada de trabalho estará aberta até às 23h55 de domingo 26 de setembro, para submissão de propostas de oficinas e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

São de interesse do Seminário quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Processamento de linguagem natural (Natural Language Processing - NLP);

- Geoprocessamento e geotecnologias;

- Aplicações de Inteligência Artificial na atuação do Estado;

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público;

  -  o evento será transmitido pela internet, assim os palestrantes precisarão ter disponibilidade para transmitirem sua apresentação no dia e horário programado, com compartilhamento das transparências e vídeo ao vivo, pela aplicação Teams da Microsoft.

  -  as propostas de apresentação da edição anterior encontram-se no site do Speaker Fight: https://speakerfight.com/events/6o-seminario-internacional-sobre-analise-de-dados-na-administracao-publica

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  tipo de proposta: apresentação (20 minutos na programação principal do evento) ou ação educacional prática (tutorial ou oficina, com duração entre 1 a 4 horas em sala de aula "virtual" no Teams);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 1 a 4 horas;

  -  nome completo, instituição, dados para contato (email institucional, email privado e whatsapp) e mini-currículo (destacando sua experiência acadêmica e/ou profissional no tópico apresentado): essas informações devem estar presentes apenas na seção "Mais informações" visível unicamente pela organização do evento; as votações na plataforma serão realizadas com anônimato do palestrante proponente, assim procure evitar referências diretas à autoria no texto aberto da proposta.

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

6º Seminário Internacional sobre Análise de Dados na Administração Pública

O Evento

A sexta edição do Seminário Internacional sobre Análise de Dados na Administração Pública será transmitida por streaming pelo canal YouTube do TCU nos dias 29 e 30 de setembro de 2020

O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU e CGU.

O site www.brasildigital.gov.br traz maiores detalhes sobre o evento e suas edições passadas, com acesso ao conteúdo das palestras dos anos anteriores.

Chamada de trabalhos

A chamada de trabalho estará aberta até às 23h da terça-feira 15 de setembro, para submissão de propostas de oficinas e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

São de interesse do Seminário quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Processamento de linguagem natural (Natural Language Processing - NLP);

- Geoprocessamento e geotecnologias;

- Aplicações de Inteligência Artificial na atuação do Estado;

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público;

  -  o evento será transmitido pela internet, assim os palestrantes precisarão ter disponibilidade para transmitirem sua apresentação no dia e horário programado, com compartilhamento das transparências e vídeo ao vivo, pela aplicação Teams da Microsoft.

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  tipo de proposta: apresentação (20 minutos na programação principal do evento) ou ação educacional prática (tutorial ou oficina, com duração entre 1 a 4 horas em sala de aula "virtual" no Teams);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 1 a 4 horas;

  -  nome completo, instituição, dados para contato (email institucional, email privado e whatsapp) e mini-currículo (destacando sua experiência acadêmica e/ou profissional no tópico apresentado): essas informações devem estar presentes apenas na seção "Mais informações" visível unicamente pela organização do evento; as votações na plataforma serão realizadas com anônimato do palestrante proponente, assim procure evitar referências diretas à autoria no texto aberto da proposta.

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

5º Seminário Internacional sobre Análise de Dados na Administração Pública

 

O Evento

A quinta edição do Seminário Internacional sobre Análise de Dados na Administração Pública ocorrerá em Brasília nos dias 16 a 18 de setembro de 2019. O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU, CGU e ENAP. 

Chamada de trabalhos

A chamada de trabalho estará aberta até às 14h de 19 de agosto, para submissão de propostas de oficinas  e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

Neste ano, os principais eixos temáticos na formação nos painéis serão:

- Processamento de linguagem natural (Natural language processing - NLP);

- Geoprocessamento e geotecnologias; e

- Aplicações de Inteligência Artificial na atuação do Estado.

Continuam sendo de interesse do Seminário quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público; e

  -  o evento será realizado em Brasília, sendo que os eventuais custos de deslocamento, alimentação e hospedagem ficarão a cargo dos palestrantes ou de seus órgãos de origem.

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  tipo de proposta: apresentação (20 minutos, no plenário) ou ação educacional prática (tutorial ou oficina, com duração entre 2 a 4 horas em sala de aula ou laboratório);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 2 a 4 horas;

  -  nome completo, instituição, dados para contato e mini-currículo (destacando sua experiência acadêmica e/ou profissional no tópico apresentado): essas informações devem estar presentes apenas na seção "Mais informações" visível unicamente pela organização do evento; as votações na plataforma serão realizadas de forma anônima

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

4º Seminário Internacional sobre Análise de Dados na Administração Pública

O Evento

A quarta edição do Seminário Internacional sobre Análise de Dados na Administração Pública ocorrerá em Brasília nos dias 24 a 26 de setembro de 2018O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU, CGU eENAP. 

Chamada de trabalhos

A chamada de trabalho estará aberta até 15 de agosto, para submissão de propostas de oficinas  e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

Neste ano, os principais eixos temáticos na formação nos painéis serão:

- Processamento de linguagem natural (Natural language processing - NLP);

- Geoprocessamento e geotecnologias; e

- Avaliação de Políticas Públicas.

Continuam sendo de interesse do Seminários quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público; e

  -  o evento será realizado em Brasília, sendo que os eventuais custos de deslocamento, alimentação e hospedagem ficarão a cargo dos palestrantes ou de seus órgãos de origem.

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  nome completo e instituição;

  -  tipo de proposta: apresentação (20 minutos, no plenário) ou ação educacional prática (tutorial ou oficina, com duração entre 2 a 4 horas em sala de aula ou laboratório);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 2 a 4 horas;

  -  mini-currículo destacando sua experiência acadêmica e/ou profissional no tópico apresentado.

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

Proposals

Capacitação relâmpago em Machine Learning com projeto pessoal

Experiência de como capacitar dezenas de servidores públicos de diversos órgãos em Machine Learning (ML) de forma rápida (30h de aulas práticas em um mês) numa abordagem de aprendizado baseado em projeto (PBL, da sigla em inglês Project Based Learning), em que os alunos trazem uma proposta de aplicação de ML em uma área relevante para eles ou suas instituições e são guiados no desenvolvimento de modelos preditivos, em aprendizagem supervisionada utilizando as bibliotecas python pandas e scikit-learn em ambiente Jupyter, para rápida iteração experimental e compreensão conceitual e prática das técnicas mais relevantes para seu problema.


Ao final do mês os alunos apresentam seus protótipos funcionais de modelos preditivos, publicando dados brutos, dados tratados, código de pré-processamento, análise e treinamento, assim como o modelo preditivo final em plataformas de desenvolvimento colaborativo (github, kaggle) para fácil reuso por outros interessados no problema ou nas técnicas utilizadas, reforçando assim o ecossistema de desenvolvedores de ML no Brasil.


Os resultados atingidos com os protótipos desenvolvidos durante o curso, os ganhos de conhecimento sobre o problema/desafio trazido nos projetos e o desenvolvimento de capacidade técnica em ML dos alunos e sua autonomia em tocar novos projetos de ML aplicado permitem uma rápida e pouco custosa incursão na área, facilitando a transição cultural das instituições para o uso mais sistemático de ML em suas operações.


 


  -  tipo de proposta: apresentação (20 minutos na programação principal do evento)


  -  título da apresentação: "Capacitação relâmpago em Machine Learning com projeto pessoal"


  -  foco principal da apresentação: gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;


  -  fase do trabalho apresentado: estudo de caso com resultados práticos;


  -  descrição da apresentação (em até 2000 caracteres sem espaço): ver acima.


  -  detalhes técnicos: bibliotecas python pandas e scikit-learn em ambiente Jupyter. Técnicas de importação de dados, análise exploratória, transformação e limpeza, imputação dados faltantes, numericalização de dados categóricos e textuais. Conceitos: modelos paramétricos, treinamento/teste, avaliação de desempenho, validação cruzada, overfit, pipeline, otimização de híper-parâmetros, ensemble, bootstrap/bagging. NLP: pré-processamento, bag-of-words e tf-idf para classificação. Modelos: KNN, regressão linear e logística, árvore de decisão e Random Forest. Interpretação dos modelos e comunicação dos resultados para público não especialista.


  -  nome completo, instituição, dados para contato e mini-currículo: informado apenas no campo "mais informações" da nova proposta e não na descrição geral aberta ao público!

Machine Learning na complementação de julgamento humano: bloqueando vieses e limitando a variabilidade das decisões humanas

Apresentação mostrando quais os principais vieses e fontes de variabilidade do julgamento humano que podem ser compensadas com o bom uso de modelagem estatística.


Conteúdo na linha do recém-lançado livro do Daniel Kahneman, "Noise: A Flaw in Human Judgment": https://www.goodreads.com/book/show/55339408-noise


 


[As informações de contato do proponente da apresentação encontram-se no segundo campo textual que não é publicado no site e fica visível apenas para a banca de avaliação das propostas.

Panorama de aplicações modernas de Processamento de Linguagem Natural com Deep Learning

-  nome: Lembrando que as propostas são ANÔNIMAS! (ainda que o tema e abordagem identifiquem o autor...)


  -  tipo de proposta: apresentação (20 minutos, no plenário);


  -  título da apresentação: Panorama de aplicações modernas de Processamento de Linguagem Natural com Deep Learning


  -  foco principal da apresentação: gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;


  -  fase do trabalho apresentado: trabalho em andamento


  -  descrição da apresentação (em até 2000 caracteres sem espaço).


Entenda os resultados recentes, em 2019, de uma das áreas da Inteligência Artificial (IA) que tem passado por mais rápida transformação em seu patamar de desempenho, abrindo oportunidades para inúmeras novas aplicações transformadoras: o Processamento de Linguagem Natural (NLP), área encarregada em ensinar a IA a entender e produzir textos em linguagens como português e inglês.


Tópicos abordados: - Machine Learning & Deep Learning - Processamento de Linguagem Natural (NLP): bases, tarefas padrão - Transferência de Aprendizado em NLP: "momento Imagenet" - Tarefas e conjuntos de dados para avaliação padronizada (benchmarking): - classificação de texto, análise de sentimento - compreensão de linguagem: frases bem formadas, equivalência semântica entre frases, grau de similaridade, inferência lógica, perguntas e respostas, desambiguação de pronomes - Superação do desempenho humano em compreensão de texto: - GLUE: benchmark multi-tarefas - SQuAD: perguntas e respostas baseadas em artigos wikipedia - RACE: provas de compreensão de texto para humanos - Estado da arte em geração de texto: exemplo GPT-2 - Tradução não supervisionada - Desenvolvendo competência em ML/DL: grupo de estudo em Brasília


Será apresentado um modelo baseado na arquitetura ULMFiT treinado para o português do Brasil, que poderá ser reutilizado livrementre por todos para tarefas de NLP em aplicações específicas, como classificação textual, síntese ou perguntas e respostas. 


  -  detalhes técnicos: NLP com Deep Learning, modelos baseados em ULMFiT construídos no stack python/pyTorch/fastai;