o Cross-Industry processo padrão de Data Mining (CRISP-DM) É a estrutura dominante processo de mineração de dados. É uma qualquer normalização aberto pode usá-lo. A lista a seguir descreve as várias fases do processo.

  • Conhecimento do negócio: Obter uma compreensão clara do problema que você está fora de resolver, como ele afeta sua organização e seus objetivos para abordá-lo. Tarefas nesta fase incluem:

  • Identificando seus objetivos de negócio

  • Avaliando sua situação

  • Definindo suas metas de mineração de dados

  • Produzir seu plano de projeto

  • a compreensão de dados: Reveja os dados que você tem, documentá-lo, identificar gerenciamento de dados e questões de qualidade de dados. Tarefas para esta fase incluem:

  • Juntando informação

  • descrevendo

  • explorando

  • Verificando a qualidade

  • Preparação de dados: Obter os seus dados pronto para ser usado para a modelagem. Tarefas para esta fase incluem:

  • A seleção de dados

  • dados limpeza

  • construindo

  • integrando

  • formatação

  • Modelagem: Use técnicas matemáticas para identificar padrões dentro de seus dados. Tarefas para esta fase incluem:

  • selecionando técnicas

  • testes Designing

  • construção de modelos

  • avaliação de modelos

  • Avaliação: Rever os padrões que você descobriu e avaliar seu potencial para uso comercial. Tarefas para esta fase incluem:

  • avaliação de resultados

  • Revendo o processo

  • Determinar os próximos passos

  • implantação: Coloque as suas descobertas para trabalhar em negócios todos os dias. Tarefas para esta fase incluem:

  • implantação de planejamento (seus métodos para integrar as descobertas de mineração de dados em uso)

  • Relatar os resultados finais

  • Revendo os resultados finais