Réseau neurones
R.R.
Objectif
Comparer TANAGRA, SIPINA et WEKA lors de l’apprentissage d’un réseau de neurones. S’agissant de l’apprentissage d’un réseau de neurones, un perceptron multicouches dans notre cas (MULTILAYER PERCEPTRON en anglais), quel que soit le logiciel utilisé, nous devons impérativement passer par les étapes suivantes : • • • • • • Importer les données dans le logiciel ; Définir le problème à résoudre, c.-à-d. sélectionner les descripteurs et la variable à prédire ; Subdiviser les données en ensemble d’apprentissage et de test ; Sélectionner la méthode et éventuellement la paramétrer ; Lancer l’induction sur les données d’apprentissage ; Evaluer le réseau sur l’ensemble test.
Fichier
Nous utilisons le fichier IONOSPHERE.ARFF (source UCI IRVINE – format de données WEKA). Les données ont été d’emblée centrées et réduites pour nous affranchir des différences entre les techniques de pré-traitement mis en œuvre par les logiciels. Le fichier comporte 351 observations, 33 descripteurs continus ; l’attribut classe est binaire.
Construire un perceptron multicouches avec TANAGRA
Charger les données
Première étape toujours, après le lancement du logiciel, nous devons charger les données. Nous activons le menu FILE/NEW pour créer un nouveau diagramme et nous sélectionnons le fichier IONOSPHERE.ARFF.
27/03/2006
Page 1 sur 27
Didacticiel - Etudes de cas
R.R.
Subdiviser les données en ensemble d’apprentissage et de test
L’étape suivante consiste à subdiviser les données en 2 parties : la première servira à construire le modèle de prédiction, la seconde sera utilisée pour en évaluer les performances en prédiction. Pour ce faire, nous insérons le composant SAMPLING dans le diagramme, 66% des observations seront utilisés pour l’apprentissage.
27/03/2006
Page 2 sur 27
Didacticiel - Etudes de cas
R.R.
Sélectionner les attributs
Pour définir les variables d’entrées et la variable à prédire, nous plaçons le