Methodologie de recherche
Nadia LAARJ
Zaynab EL ALAOUY
Plan
Introduction I. Vocabulaire statistique II. Le but de l’analyse bidimensionnelle
III. Analyse des relations entre deux variables 1. Les tableaux statistiques 2. Calculs de paramètre de position 3. Calculs de paramètre de dispersions 4. La corrélation 5. Test de khi2 6. La loi de Fisher et test de Fisher IV. Etude de cas Conclusion
Bibliographie/ Webographie
Introduction
L’analyse des données est un domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données. On peut également chercher à classer les données en différents sous groupes plus homogènes: un exemple d'utilisation d'un tel classement serait celui de la reconnaissance automatique des spam. En résumé, l'Analyse des données relève de la représentation graphique, et de la classification.
Le principe de l'analyse de données est de tracer sur un graphique en 2 dimensions (grâce à une projection) l'ensemble des observations.
Cependant, les axes choisis ne correspondent pas à l'une ou l'autre des variables mais sont des axes virtuels, issus de combinaisons entre les variables et calculés pour passer le plus près possible de tous les points du nuage. Chaque point est projeté sur ce plan.
Le choix des axes est fait de manière à ce que le graphique résume les données en minimisant la déperdition de l'information.
On a alors un outil descriptif utile qui permet de synthétiser l'information et de cibler des groupes de variables proches.
I. Vocabulaire statistique • Population
C'est