Mon projet professionnel
Formation: Licence Appliqué en Statistique et Traitement des Données
(LASTD)
RALISER PAR: Barkadleh Meraneh Absieh
Sous le bon cadre de Mme Hodan
Rapport du Tp
SOMMAIRE Introduction ...................................................... 2 I. Jeu de données .............................................. 4 EXERCICE N°2
PAGE 1
Rapport du Tp
1. Importation de données ............................. 4 3. La statistique sommaire ............................. 5 II. Nuage du point............................................ 6 III. Test de normalité ........................................ 7 IV. Choix et calcule de coefficients .................. 9 V. Test de significativité................................ 10 Conclusion de l'interprétation ...................... 11
Introduction On dispose des observations sur des entreprises dont on connait le nombre de travailleurs qu’elles emploient (X) et la quantité de bien produit par chacune (Y) au cours d’une certaine période. En effet d’après ces données qu’on dispose on effectue une étude sur ces derniers pour en tirer vers la fin des résultats concrets. Effectivement notre problématique se dispose de tel : EXERCICE N°2
PAGE 2
Rapport du Tp Existe-t-il un lien entre le nombre de travailleurs et la quantité de bien produit dans ces entreprises? Pour parvenir à répondre a cette problématique on effectue des multiples étapes qui sont développer vers la suit.
EXERCICE N°2
PAGE 3
Rapport du Tp
I. Jeu de données 1. IMPORTATION DE DONNEES Code R: dataexo2=read.table("C:/Users/abdisoubaneh/Desktop/Macktireh LASTD 2eme semestre/Econometrie/Base_TP1_Econométrie-Exo2.txt",header = T ,sep = "\t") Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R
2. Description de la base de données Code R : str(dataexo2) Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R Ce dernier, la base de données contient trois variables quantitatives : •
la variable X est le nombre de travailleurs ;
•
la variable Y est la quantité de bien produit ;
• la variable Num_Entreprise est le numéro d'entreprise ; avec dix observation (c'est-à-dire dix entreprise).
EXERCICE N°2
PAGE 4
Rapport du Tp
3. LA STATISTIQUE SOMMAIRE Code R : summary(dataexo2) ##cette fonction permet de faire le résume statistique des variables. Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R
Ce tableau récapitule la statistique sommaire des variables X et Y. Pour la variable X on constate que le nombre moyenne des travailleurs est égale à 8, le maximum est de 10 tant dis que le minimum est de 5. Pour la variable Y on constate que la quantité moyenne de bien produit est égale à 9.6, sa valeur maximum est de 12 et sa valeur minimum est de 6.
EXERCICE N°2
PAGE 5
Rapport du Tp
II.
Nuage du point
Code R : attach( dataexo2) La fonction attach permet mettre en mémoire la base de données dans le logiciel et elle permet aussi d’éviter de mettre souvent le symbole dollar ($). plot(X,Y, main = "nuage de point entre le nombre de travailleurs et la quantité de bien produit", pch="x", col="red", xlab = "X nombre de travailleurs", ylab = "Y la quantité de bien produit") La fonction main permet mettre une titre au nuage du points ,Xlab et Ylab permet de nomme les noms des abscisse et ordonnées ,col est une fonction elle aussi et permet d’attribut les nuages du points à une couleur et enfin pch permet le choix du point du nuage des points. Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R D’après la représentation, le nuage du point a une forme d’une droite, il s'agit une relation linéaire entre le nombre de travailleurs et la quantité de bien produit.
EXERCICE N°2
PAGE 6
Rapport du Tp
III.
Test de normalité
Dans cette partie on s’intéresse sur la normalité des variables, c’est-à-dire savoir si les variable qu’on dispose sont normale ou pas. Et pour parvenir à donner une réponse au sujet de la normalité on effectue un le test de normalité. En effet il existe deux tests de normalité de tel: test de Jacque Bera Shapiro-wilk. Dans notre étude on décide d’utilise le test de Jacque Bera, et on effectue ce test sur chacune de nos deux variables. Et on met en place nos hypothèses définies au préalable : Ho: les variables sont normales h1:les variables ne sont pas normales En effet on regarde la vérification suivante : Si p-value est supérieur à alpha (0.05) on accepte H0, on rejette H1 ; Si p-value est inférieur à alpha (0.05) on accepte H1, on rejette H0. Code R : Le test de normalité sur la variable X : ##Chargement du packages library(normtest) Ici on charge le package « normtest », pour parvenir à faire le test de normalité sur la variable X. jb.norm.test(X) Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R EXERCICE N°2
PAGE 7
Rapport du Tp
D'après le résultat obtenue, on a une p-value=0.5595 qui est supérieur à alpha=0.05, alors on accepte H0 ce qui revient dire que la variable X est bien normale (elle suit la loi normal). Le test de normalité de la variable Y : Code R : jb.norm.test(Y) Ici aussi on charge le package « normtest », pour parvenir à faire le test de normalité sur la variable Y. Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R D'après le résultat obtenue, ce dernier on a p-value = 0.1685 qui est supérieur à alpha = 0.05, alors on accepte H0 ce qui veut dire que la variable Y est bien normale. D’après le test de normalité de Jacque Bera appliquer sur les deux variables, on en déduit que variables X et Y sont des variables normales (suit la loi normale).
EXERCICE N°2
PAGE 8
Rapport du Tp
IV.
Choix et calcule de coefficients
Comme les deux variables X et Y suit une loi normale, alors le coefficient le plus adapté est le coefficient de Pearson. Code R: cor( X,Y, method ="pearson") Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R Ce dernier on a une corrélation positive qui égale à 0.7197862 car le coefficient est proche à 1. Ce qui veut dire que le nombre de travailleurs et la quantité de bien produit sont fortement corrélé.
EXERCICE N°2
PAGE 9
Rapport du Tp
V.
Test de significativité
Ce test permet de dire si le coefficient de Pearson est significative ou pas. À savoir pour chaque test les hypothèses définies aux préalables. Les hypothèses de ce test sont les suivants : Ho: le coefficient n'est pas significative (c'est-à-dire il est égale à 0) h1: le coefficient est significative (c'est-à-dire il est différent de 0) Code R : Pour calculer et tester en même temps le coefficient on utilise la fonction cor.test. cor.test(X,Y, method = "pearson") Résultat :
Source: Nos calculs à partir des données de l'exercice 2, sur R D'après le test p-value = 0.01892 qui est inférieur à alpha = 0.05, on rejette H0 et on accepte H1, autrement dit le coefficient de Pearson est significative.
EXERCICE N°2
PAGE 10
Rapport du Tp
Conclusion de l'interprétation D'après le test de significativité le coefficient de Pearson est significatif, alors on peut conclure qu'il existe une relation linéaire positive entre le nombre de travailleurs et la quantité de bien produit. Si le nombre de travailleurs augmente d'un point (ou 100%) la quantité de bien produit va augmenter de 0.72 (ou 72%).
EXERCICE N°2
PAGE 11