CRISP-DM

Cross-Industry Standard Process for Data Mining : processus inter-industries standard pour l'exploration de données.

Analyse

CRISP est un effort de standardisation d'un processus de data science, sorte de version itérative du KDD.

Conception

Le processus CRISP
Le processus CRISP

CRISP définit un processus itératif contenant les étapes suivantes :

  1. Compréhension du métier : il est impossible de comprendre les données sans comprendre les processus métiers qui les ont générées
  2. Compréhension des données : exploration et sélection de données
  3. Préparation des données (feature engineering, rééchelonnage, etc.)
  4. Analyse/modélisation : sélection et paramétrage des algorithmes d'apprentissage
  5. Evaluation/validation : métriques d'évaluation, test à l'aveugle
  6. Présentation/visualisation des résultats auprès du métier et éventuel déploiement d'une automatisation si satisfaisant

Notes