Profile

Brasil Digital @BrasilDigital


About Me

-

Events

5º Seminário Internacional sobre Análise de Dados na Administração Pública

 

O Evento

A quinta edição do Seminário Internacional sobre Análise de Dados na Administração Pública ocorrerá em Brasília nos dias 16 a 18 de setembro de 2019. O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU, CGU e ENAP. 

Chamada de trabalhos

A chamada de trabalho estará aberta até às 14h de 19 de agosto, para submissão de propostas de oficinas  e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

Neste ano, os principais eixos temáticos na formação nos painéis serão:

- Processamento de linguagem natural (Natural language processing - NLP);

- Geoprocessamento e geotecnologias; e

- Aplicações de Inteligência Artificial na atuação do Estado.

Continuam sendo de interesse do Seminário quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público; e

  -  o evento será realizado em Brasília, sendo que os eventuais custos de deslocamento, alimentação e hospedagem ficarão a cargo dos palestrantes ou de seus órgãos de origem.

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  tipo de proposta: apresentação (20 minutos, no plenário) ou ação educacional prática (tutorial ou oficina, com duração entre 2 a 4 horas em sala de aula ou laboratório);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 2 a 4 horas;

  -  nome completo, instituição, dados para contato e mini-currículo (destacando sua experiência acadêmica e/ou profissional no tópico apresentado): essas informações devem estar presentes apenas na seção "Mais informações" visível unicamente pela organização do evento; as votações na plataforma serão realizadas de forma anônima

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

4º Seminário Internacional sobre Análise de Dados na Administração Pública

O Evento

A quarta edição do Seminário Internacional sobre Análise de Dados na Administração Pública ocorrerá em Brasília nos dias 24 a 26 de setembro de 2018O Seminário tem por objetivo promover o compartilhamento de experiências e boas práticas relacionadas ao uso de técnicas de análise e mineração de dados, enquanto instrumento para melhoria da gestão e do controle de entidades e políticas públicas. O evento é organizado conjuntamente pelo TCU, CGU eENAP. 

Chamada de trabalhos

A chamada de trabalho estará aberta até 15 de agosto, para submissão de propostas de oficinas  e/ou de palestras. Ela busca identificar palestrantes de instituições de controle, de entidades da administração direta e indireta, bem como do meio acadêmico e do terceiro setor, para apresentar casos práticos e respectivos resultados, envolvendo a análise de dados da Administração Pública nas três esferas.

Neste ano, os principais eixos temáticos na formação nos painéis serão:

- Processamento de linguagem natural (Natural language processing - NLP);

- Geoprocessamento e geotecnologias; e

- Avaliação de Políticas Públicas.

Continuam sendo de interesse do Seminários quaisquer trabalhos que se enquadrem no amplo leque temático de análise de dados da Administração Pública. Exemplos de tópicos de interesse:

- Detecção de padrões e relacionamentos úteis à formulação ou execução de políticas públicas;

- Detecção de anomalias, abusos ou fraudes na arrecadação ou no gasto de recursos públicos;

- Priorização, por critérios de risco, urgência ou importância, de casos para auditoria, análise ou investigação pelo poder público;

- Otimização de processos repetitivos, como atendimento a demandas, triagem de denúncias ou confecção de peças processuais;

- Mineração de textos e outras fontes de dados não estruturados, para geração de insumos para processos de análise;

- Utilização de Sistemas de Informação Georreferenciadas (SIG) no planejamento, implementação, execução e monitoramento das políticas públicas;

- Utilização de geoprocessamento com a finalidade de descoberta e interpretação de informações relevantes para o controle ao longo de diversos períodos (espaço-tempo);

- Utilização de imagens de satélite e sensoriamento remoto como ferramentas para o monitoramento das políticas públicas ou situações de interesse público, por exemplo, na área ambiental, agrícola, de defesa ou de infraestrutura;

- Apoio à tomada de decisão em políticas públicas baseada no uso de visão computacional ou no processamento de imagens;

- Monitoramento ambiental e de risco de desastres por meio de sensoriamento remoto;

- Análise de redes (network analysis); e

- Análise de séries temporais. 

Observações importantes:  

  -  a apresentação deverá abordar, no mínimo, a motivação do uso de análise de dados, as técnicas e ferramentas utilizadas e os resultados atingidos (ou esperados, no caso de trabalhos ainda em curso);

  -  não serão aceitos trabalhos ou propostas de oficina que tenham como único objetivo a comparação entre ferramentas ou a divulgação de ferramentas específicas, gratuitas ou comerciais;

  -  não há exigência de que o trabalho tenha sido descrito em artigo científico ou realizado com rigor acadêmico, visto que o foco será no compartilhamento de experiências práticas;

  -  serão aceitos trabalhos realizados por entidades públicas, universidades, organizações do terceiro setor ou pessoas físicas independentes, desde que tenham sido utilizados dados do setor público para alcance de resultados de interesse público; e

  -  o evento será realizado em Brasília, sendo que os eventuais custos de deslocamento, alimentação e hospedagem ficarão a cargo dos palestrantes ou de seus órgãos de origem.

Cada trabalho deve ser submetido de forma independente na plataforma, informando, pelo menos:

  -  nome completo e instituição;

  -  tipo de proposta: apresentação (20 minutos, no plenário) ou ação educacional prática (tutorial ou oficina, com duração entre 2 a 4 horas em sala de aula ou laboratório);

  -  título da apresentação/oficina;

  -  foco principal da apresentação: se técnico, para facilitar a realização de trabalhos semelhantes por analistas e cientistas de dados, ou gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;

  -  fase do trabalho apresentado: estudo de caso com resultados práticos; trabalho ou projeto em andamento ou proposta em estudo para implementação;

  -  descrição da apresentação (em até 2000 caracteres sem espaço). Se possível, descreva os impactos vislumbrados ou que de fato foram alcançados pela proposta, estudo, trabalho ou projeto a ser apresentado;

  -  detalhes técnicos: métodos estatísticos ou modelos de aprendizagem utilizados; softwares e linguagens de programação utilizados;

  -  em se tratando de oficina, descreva: uma breve ementa, detalhando o conteúdo que pretende apresentar, duração necessária para a oficina, entre 2 a 4 horas;

  -  mini-currículo destacando sua experiência acadêmica e/ou profissional no tópico apresentado.

Seleção dos trabalhos

A seleção das propostas será realizada por júri composto por representantes dos órgãos patrocinadores, considerando: votação da proposta na plataforma Speakerfight; impacto esperado do trabalho; originalidade; replicabilidade; e pertinência temática às áreas do Seminário.

Proposals

Panorama de aplicações modernas de Processamento de Linguagem Natural com Deep Learning

-  nome: Lembrando que as propostas são ANÔNIMAS! (ainda que o tema e abordagem identifiquem o autor...)


  -  tipo de proposta: apresentação (20 minutos, no plenário);


  -  título da apresentação: Panorama de aplicações modernas de Processamento de Linguagem Natural com Deep Learning


  -  foco principal da apresentação: gerencial, para demonstrar a gestores públicos os resultados potencializados pela análise de dados;


  -  fase do trabalho apresentado: trabalho em andamento


  -  descrição da apresentação (em até 2000 caracteres sem espaço).


Entenda os resultados recentes, em 2019, de uma das áreas da Inteligência Artificial (IA) que tem passado por mais rápida transformação em seu patamar de desempenho, abrindo oportunidades para inúmeras novas aplicações transformadoras: o Processamento de Linguagem Natural (NLP), área encarregada em ensinar a IA a entender e produzir textos em linguagens como português e inglês.


Tópicos abordados: - Machine Learning & Deep Learning - Processamento de Linguagem Natural (NLP): bases, tarefas padrão - Transferência de Aprendizado em NLP: "momento Imagenet" - Tarefas e conjuntos de dados para avaliação padronizada (benchmarking): - classificação de texto, análise de sentimento - compreensão de linguagem: frases bem formadas, equivalência semântica entre frases, grau de similaridade, inferência lógica, perguntas e respostas, desambiguação de pronomes - Superação do desempenho humano em compreensão de texto: - GLUE: benchmark multi-tarefas - SQuAD: perguntas e respostas baseadas em artigos wikipedia - RACE: provas de compreensão de texto para humanos - Estado da arte em geração de texto: exemplo GPT-2 - Tradução não supervisionada - Desenvolvendo competência em ML/DL: grupo de estudo em Brasília


Será apresentado um modelo baseado na arquitetura ULMFiT treinado para o português do Brasil, que poderá ser reutilizado livrementre por todos para tarefas de NLP em aplicações específicas, como classificação textual, síntese ou perguntas e respostas. 


  -  detalhes técnicos: NLP com Deep Learning, modelos baseados em ULMFiT construídos no stack python/pyTorch/fastai;