Eventos da PÓS-GRADUAÇÃO/CEFOR/CÂMARA DOS DEPUTADOS, X Jornada de Pesquisa e Extensão

Tamanho da fonte: 
PROPOSTA DE PLATAFORMA DE BENCHMARKS PARA CIÊNCIA DE DADOS NA CÂMARA DOS DEPUTADOS
Marcio Fonseca, Michael Onishi

Última alteração: 2019-09-18

Resumo


Inspirado pelos casos de sucesso da literatura de aprendizado de máquina, o presente trabalho propõe uma solução para criação de benchmarks no contexto do trabalho de ciência de dados conduzido na Câmara dos Deputados. Especificamente, é apresentada uma plataforma que centraliza o acesso às informações sobre os problemas investigados pelo Serviço de Ciência de Dados da Diretoria de Inovação e Tecnologia da Informação - Ditec, incluindo conjunto de dados, métricas de desempenho, rankings de modelos e seus respectivos códigos-fonte.

As estatísticas de uso da plataforma mostram o impacto positivo da centralização das informações na disseminação do conhecimento e na potencial redução do custo da experimentação de múltiplos tipos de modelos e ajustes de parâmetros, que é fundamental para o sucesso do trabalho de aplicação de aprendizado de máquina.



Palavras-chave


Ciência de dados; Conjunto de dados; Benchmarks; Aprendizado de máquina

Texto completo: PDF