INITIATION AU DATA MINING
Désormais, le Datamining est au cœur de toutes les préoccupations du monde des affaires. C’est un processus qui permet de découvrir, dans de grosses bases de données consolidées, des informations jusque là inconnues mais qui peuvent être utiles et lucratives et d'utiliser ces informations pour soutenir des décisions commerciales tactiques et stratégiques.
Les approches traditionnelles de la statistique ont des limites avec de grosses bases de données, car en présence de milliers ou de millions d’individus et de centaines ou de milliers de variables, on trouvera forcément un niveau élevé de redondance parmi ces variables. Les techniques de datamining interviennent et offrent des réponses à l’analyse de données volumineuse et nous permettra d’extraire des informations intéressantes et apportent de nouvelles connaissances jusque là inconnues, que les méthodes statistiques classiques n’ont pas mit en avant.
L’exploitation de ces nouvelles informations peut présenter un intérêt pour analyser et interpréter les comportements d’individus et ensemble d’individus. Les résultats obtenus s’insérant dans un dispositif d’analyse globale permettent alors de dresser dans des plans stratégiques ou politiques les axes d’effort à respecter.
Les techniques du datamining sont regroupées dans deux principales catégories :
Les méthodes descriptives qui visent à structurer et à simplifier les données issues de plusieurs variables, sans privilégier l'une d'entre elles en particulier, il s’agit notamment de l'analyse en composantes principales (ACP), l'analyse factorielle des correspondances (AFC), l'analyse des correspondances multiples (ACM) et des méthodes de classification