Arbre de décision
Classification
Elle permet de prédire si un élément est membre d’un groupe ou d ’une catégorie donnée.
Classes
Identification de groupes avec des profils particuliers Possibilité de décider de l’appartenance d’une entité à une classe
Caractéristiques
Apprentissage supervisé : classes connues à l’avance Pb : qualité de la classification (taux d’erreur)
Classification - Applications
Accord de crédit Applications
Marketing ciblé
Diagnostic médical
Analyse de l’effet d’un traitement
Détection de fraudes
fiscales etc. Processus à deux étapes
Etape 1 : Construction du modèle à partir de l’ensemble d’apprentissage (training set)
Etape 2 : Utilisation du modèle : Valider le modèle et l’utiliser dans la classification de nouvelles données
processus à 2 étapes
Construction du modèle
Chaque instance est supposée appartenir à une classe prédéfinie La classe d’une instance est déterminée par l’attribut ”classe” L’ensemble des instances d’apprentissage est utilisé dans la construction du modèle
Etape 1
Le modèle est représenté par des règles de classification, arbres de décision, formules mathématiques, ...
Utilisation du modèle
Classification de nouvelles instances ou instances inconnues
Etape 2
Validation du modèle la classe connue d’une instance test est comparée avec le résultat du modèle Ex: Taux d’erreur = pourcentage de tests incorrectement classés par le modèle
Validation du modèle
Mesure de qualité d’un classeur : cas de classification binaire
VP/VN : Le nombre de vrais positifs/négatifs : exemples de classe positive/négative et dont la classe est prédite comme positive/négative. FP/FN : Le nombre de faux positifs/negatifs: Les exemples de classe négative/positive est dont la classe est prédite comme positive/négative. Classe prédite +
Classe réelle + Classe réelle VP FP
Classe prédite FN VN
Validation du modèle
• Mesure de qualité d’un classeur : cas de classification