Tp sur r
Analyse univariée de l’ensemble des notes :
Toutes les variables sont quantitatives et sont les noms de chaque matière auxquelles on étudie les notes pour chaque observation. Nous avons 72 observations et 13 variables. Pour Anova, Maths et Eco nous avons environ une moyenne de 11. Pour les sondages et l’ADD on a une moyenne de 9.5 environ, de 8 en test, 4 en programmation WEB et 13 environ en études de cas R, Exposé de communication, en Anglais, en PT et stage.
Pour une meilleure analyse de la base de données, il a fallu regrouper les notes de BD Objet avec les notes de maths, ce qui enlève les valeurs manquantes dans la variable créée Option. Nous obtenons ce graphique : Cependant, il y a un souci dans les données, des élèves ont une note autant en DB objet qu’en maths, ce qui cumule leur note dans la variable Option.
La classe modale est [12 ; 14]. L’ensemble des notes des options se concentrent autour de cette même classe.
La classe modale des notes d’économie est [8 ; 10]. L’ensemble des notes se concentre autour de cette classe.
Analyse bivariée
> cor(notes$Anova,notes$ADD) [1] 0.5551829 > cor(notes$ExpCom,notes$EtudeCasR) [1] 0.4093381 > cor(notes$Sondages,notes$Test) [1] 0.5387748 Pour ces trois correlations on se rend compte que les variables Anova et ADD, ExpCom et EtudesCasR, Sondage et Test semblent plutôt corrélées.
On trouve une confirmation du lien entre ADD et Anova car plus les notes d’Anova augmentent et plus les élèves ont des notes élevées en ADD => relation linéaire.
Nuage de point 2 à 2 :
On remarque que les notes de projet n’ont pas de lien linéaire avec les autres matières, de même pour les notes de stage. En effet, les calculs de coefficient de corrélation le démontre bien. > cor(notes$Stage,notes$Option) [1] -8.814005e-05 > cor(notes$Stage,notes$EtudeCasR) [1] 0.1342189 > cor(notes$PT,notes$Sondages) [1] 0.1834435 > cor(notes$PT,notes$Eco) [1] 0.2284890
On ne remarque pas d’éventuel lien entre les notes