Seleção de processos de mineração de dados através de heurísticas
O processo de indução automática de modelos de classificação é composto de quatro etapas principais, pela ordem: amostragem, discretização, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis não existe a melhor técnica de amostragem, ou de discretização, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, discretização, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, o principal objetivo é descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, pretende-se confeccionar uma ferramenta baseada nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável.. Situação: Desativado; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (1) / Doutorado: (1) . Integrantes: David Moises Barreto dos Santos - Coordenador.
2006 - 2008