Weka
Apprentissage ` partir d’exemples a janvier 2009
Weka Pr´sentation e
Weka (Waikato Environment for Knowledge Analysis) est un ensemble d’outils permettant de manipuler et d’analyser des fichiers de donn´es, impl´mentant la plupart des algorithmes d’intelligence artificielle, entre e e autres, les arbres de d´cision et les r´seaux de neurones. e e Il est ´crit en java, disponible sur le web1 , et s’appuie sur le livre : e Data Mining, practical machine learning tools and techniques with Java implementations Witten & Frank Editeur : Morgan Kauffman Il se compose principalement : – De classes Java permettant de charger et de manipuler les donn´es. e – De classes pour les principaux algorithmes de classification supervis´e ou non supervis´e. e e – D’outils de s´lection d’attributs, de statistiques sur ces attributs. e – De classes permettant de visualiser les r´sultats. e On peut l’utiliser ` trois niveaux : a – Via l’interface graphique, pour charger un fichier de donn´es, lui appliquer un algorithme, v´rifier son e e efficacit´. e – Invoquer un algorithme sur la ligne de commande. – Utiliser les classes d´finies dans ses propres programmes pour cr´er d’autres m´thodes, impl´menter e e e e d’autres algorithmes, comparer ou combiner plusieurs m´thodes. e C’est cette troisi`me possibilit´ qui sera utilis´e en travaux pratiques. e e e
1
But des travaux pratiques
L’interˆt de Weka dans le cadre du cours d’Apprentissage par l’exemple est multiple : e – Pouvoir mettre en œuvre les algorithmes ´tudi´s en cours en grandeur nature, sans devoir r´ecrire tout le e e e code correspondant (quoiqu’une telle r´´criture peut s’av´rer tr`s fructueuse !). ee e e – Comprendre et utiliser intelligemment les diff´rentes sorties de ces algorithmes. e – Pouvoir programmer des agents intelligents en un temps raisonnable, pour des tˆches (pour nous, princia palement des jeux) non triviaux. – Evaluer les performances d’un algorithme. – Comparer les