EXERCICE DE REVISION : PARTIE 1 : On relève les chiffres d’affaires en millions d’euros de 200 entreprises du secteur du bien être et de la santé pour l’année 2000. Les données sont présentées dans le tableau suivant : Xi [20 ;25 [ [25.30[ [30 ;40[ [40 ;50[ [50 ;80[ TOTAL
ni 25 45 55 55 20 200
ci 22,5 27,5 35 45 65
fi 0,125 0,225 0,275 0,275 0,1 1
ai 5 5 10 10 30
5×fi /ai 0,125 0,225 0,1375 0,1375 0,0167
Ni 25 70 125 180 200
Fi 0,125 0,35 0,625 0,9 1
1. Définissez le plus précisément possible le type du caractère observé : X : CA en millions d’euros est un caractère mesurable quantitatif. On peut donc définir une variable statistique qui est continue (valeurs présentées en classes ou intervalles).
2. Déterminez le chiffre d’affaires type du secteur d’activité : Il faut calculer les 3 paramètres de tendance centrale : Moyenne ; Mode et Médiane. •
x=
Pour le calcul de la moyenne :
∑n
i
n
× xi
= ∑ f i × xi = 37,5
On prend comme valeur xi les centres des classes notées ci.
•
Pour déterminer le mode : on prend la classe pour laquelle la fréquence par unité d’amplitude est la plus élevée, c'est-à-dire la classe modale : [25.30[.
•
Pour le calcul de la médiane : on a besoin des effectifs cumulés Ni ou des fréquences cumulées Fi. La médiane correspond à la valeur de N i = 100 ou de Fi = 0,5. On réalise ensuite une interpolation linéaire :
MED − 30 100 − 70 = 40 − 30 125 − 70 ⇒ MED = 35,45 3. Représentez graphiquement le diagramme des fréquences simples. Quel est son nom ? Attention, pour représenter le diagramme des fréquences simples, qui s’appelle un histogramme, on prend en compte les fréquences par unité d’amplitude comme pour le calcul du mode : cas continu avec classes inégales. 4. La distribution est-elle symétrique ?
1
La distribution n’est pas symétrique puisque le mode, la moyenne et la médiane ne sont pas égaux. Comme la moyenne est supérieure à la médiane qui elle-même est supérieure au mode, la distribution des dissymétrique à droite (vers les valeurs fortes). Pour s’en assurer, on peut calculer le coefficient de Yule et Kendall :
CY =
Avec
Q1 − 25 50 − 25 = 30 − 25 70 − 25 ⇒ Q1 = 27,77
Et
Q3 − 40 150 − 125 = 50 − 40 180 − 125 ⇒ Q3 = 44,54
(Q3 + Q1 − 2 × ME ) ( Q3 − Q1 )
Donc CY = 0,08. Comme il est positif, on prouve bien la dissymétrie à droite de la distribution.
PARTIE 2 : On dispose des chiffres d’affaires moyens du secteur pour les années 2000 à 2006. On veut étudier l’impact éventuel des dépenses en publicité sur ce chiffre d’affaires. On reporte les données dans le tableau ci-dessous : Année 2000 2001 2002 2003 2004 2005 2006 TOT
(
X
Y
x−x
y−y
( x − x) × y − y
1800 1870 1950 2100 2100 2150 2280
38 38 40 42 44 47 51
-235,71 -165,71 -85,71 64,29 64,29 114,29 244,29
-4,86 -4,86 -2,86 -0,86 1,14 4,14 8,14
1145,55 805,35 245,13 -55,29 73,29 473,16 1988,52 4675,71
) ( x − x)
2
55559,2 27459,8 7346,2 4133,2 4133,2 13062,2 59677,6 171371,
( y − y)
2
23,62 23,62 8,18 0,74 1,3 17,14 66,26 140,86
4
1. Représentez le nuage de points de la série : Attention, il s’agit bien de représenter Y en fonction de X. L’année n’intervient pas dans l’exercice. X : Dépenses en Milliers € Y : CA en Millions € 2. Quelle a été la variation en % du chiffre d’affaires entre 2000 et 2006 ? Le CA est passé de 38 à 51 millions entre 2000 et 2006.
2
51 − 38 × 100 = 34,2 38
La variation en % est donc :
3. Calculez le coefficient de corrélation linéaire. Qu’en tirez-vous comme conclusion ? On remplit le tableau des moindres carrés avec : X = 2035,71 Y = 42,86 r=
∑(x
) (
−x × y−y
∑ (x − x ) × 2
)
∑(y − y)
2
our =
cov( x; y ) Var ( X ) × Var (Y )
= 0,95
Comme r est très proche de 1, l’ajustement linéaire de la série est justifié. La qualité de la régression sera très bonne.
4. Estimez le montant du chiffre d’affaires si le niveau des dépenses en publicité atteint 3 millions d’euros : Nous avons besoin de l’équation de la droite de régression linéaire :
y = ax + b Avec : a=
∑ ( x − x ) × ( y − y ) oua = cov( x; y ) = 0,027 var( x ) ∑ ( x − x) 2
b = y − a × x = −12,1 Donc y = 0,027x-12,1 Pour un niveau de dépenses de 3 millions d’euros, on doit remplacer x par 3000 (X est exprimé en milliers d’euros). y = 0,027×3000 – 12,1 = 68,9 millions d’euros.
3