suivant: Série statistique quantitative à
monter: Statistique à 1 variable
précédent: Série statistique quantitative
Table des matières
Index
Soit une série quantitative à 1 variable L.
La différence entre la plus grande valeur et la plus petite valeur du
caractère effectivement obtenue est l'étendue de la série L.
Le nombre de membres de la population étudiée est l'effectif total.
Si le caractère est discret, il est commode d'indiquer pour chaque valeur du
caractère, le nombre des membres de la population ayant cette valeur : c'est
l'effectif de cette valeur.
Si le caractère est continu, on partage l'intervalle sur lequel s'étendent
ces valeurs en intervalles (en général égaux) que l'on appelle
classe. Le nombre des membres de la population ayant leur valeur dans une
classe est l'effectif de cette classe.
La valeur moyenne des bornes d'une classe est le centre de cette
classe.
L'effectif cumulé d'une valeur (ou d'une classe) est la somme de
l'effectif de cette valeur (ou de cette classe) et de tous les effectifs des
valeurs (ou des classes) qui précèdent.
La fréquence d'une valeur (ou d'une classe) est le rapport de
l'effectif de cette valeur (ou de cette classe) par l'effectif total.
La fréquence cumulée d'une valeur (ou d'une classe) est la somme de
la fréquence de cette valeur (ou de cette classe) et de toutes les
fréquences des valeurs (ou des classes) qui précèdent.
Avec Xcas on tape par exemple :
cumulated_frequencies([[0.75,30],[1.75,50],[2.75,20]])
ou
cumulated_frequencies([[0.25..1.25,30],[1.25..2.25,50],
[2.25..3.25,20]])
L'histogramme des effectifs (resp fréquences) d'un caractère discret
ou continu est le graphique qui permet de visualiser l'effectif (resp
fréquences) des différentes valeurs du caractère : on met en abscisse les
différentes valeurs du caractère (ou le centre des différentes classes),
puis on forme des rectangles accolés deux à deux, ses rectangles ont deux
cotés parralléles à l'axe des ordonnées,
le coté porté par l'axe des abscisses a pour longueur l'amplitude de la
classe, et l'autre est tel que l'aire du rectangle est égale à l'effectif
(resp fréquences) de la valeur considérée.
L'histogramme des fréquences permet de visualiser les fréquences des
différentes classes au moyen de la surface de rectangles : chaque rectangle
correspond à une classe et a pour surface la fréquence de cette classe.
Avec Xcas on tape par exemple :
histogram([[0.75,30],[1.75,50],[2.75,20]])
ou
histogram([[0.25..1.25,30],[1.25..2.25,50],
[2.25..3.25,20]])
On obtient un histogramme des fréquences.
La fonction de répartition des fréquences est égale pour chaque
valeur du caractère à la fréquence cumulée de cette valeur.
Le mode est la valeur du caractère dont l'effectif est le plus grand.
Le maximum est la plus grande valeur du caractère effectivement
obtenue.
Le minimum est la plus petite valeur du caractère effectivement
obtenue.
La médiane partage la série statistique en deux groupes de même
effectif. C'est une valeur du caractère à partir de laquelle
l'effectif des valeurs qui lui sont inférieures est superieur ou ègal à
l'effectif des valeurs qui lui sont supérieures (par exemple
la médiane de [140,145,146,147] est 146 et la médiane de [140,145,146] est
145). La médiane est donc la valeur du caractère à partir de laquelle la
fréquence cumulée atteint ou dépasse 0.5.
Les quartiles sont trois valeurs du caractère qui partage la série
statistique en quatre groupes de même effectif :
- le 1-ier quartile est la valeur du caractère à partir de laquelle
la fréquence cumulée atteint ou dépasse 0.25.
- le 2-ième quartile est confondu avec la médiane.
- le 3-ième quartile est la valeur du caractère à partir de
laquelle la fréquence cumulée atteint ou dépasse 0.75.
On peut définir les déciles. Il y a 9 déciles :
le 1-ier décile est la valeur du caractère à partir de laquelle la
fréquence cumulée atteint ou dépasse 0.1.
le 2-ième décile est la valeur du caractère à partir de laquelle
la fréquence cumulée atteint ou dépasse 0.2.
etc...
le 9-ième décile est la valeur du caractère à partir de laquelle
la fréquence cumulée atteint ou dépasse 0.9.
On peut aussi définir le centile (il y a 99 centiles) et le
quantile d'ordre p :
le 1-ier centile est la valeur du caractère à partir de laquelle la
fréquence cumulée atteint ou dépasse 0.01.
etc...
le 99-ième centile est la valeur du caractère à partir de laquelle
la fréquence cumulée atteint ou dépasse 0.99.
Le quantile d'ordre p (p un réel de [0,1[), est la valeur
du caractère à partir de laquelle la fréquence cumulée atteint ou
dépasse p.
Le semi-interquartile est égal à
(Q3 - Q1) où
Q1 et Q3 désigne le premier et le troisième quartile. Cet indice
fournit un renseignement sur l'étalement des valeurs de part et d'autre de la
médiane.
L'interquartile est égal à Q3 - Q1 où
Q1 et Q3 désigne le premier et le troisième quartile. Cet indice
fournit un renseignement sur l'étalement des valeurs de part et d'autre de la
médiane.
L'interdécile est égal à D9 - D1 où
D1 et D9 désigne le premier et le neuvième décile. Cet indice
fournit un renseignement sur l'étalement des valeurs de part et
d'autre de la médiane.
Exemples avec Xcas
On tape :
L:=[1,2,3,4,5,6,7,8,9,10]
min(L) et on obtient 1
quartile1(L) et on obtient 3.0
median(L) et on obtient 5.0
quartile3(L) et on obtient 7.0
max(L) et on obtient 10
quartiles(L) pour avoir le résultat des 5 commandes précédentes
et on obtient [[1.0],[3.0],[5.0],[7.0],[10.0]]
quantile(L,0.9) et on obtient 9.0
La boite à moustaches permet de visualiser ces différentes
valeurs :
c'est un rectangle dont un coté est un trait allant de Q1 à Q3 sur
lequelle un trait vertical indique la valeur de la médiane et d'où
deux traits horizontaux (les moustaches) débordent : l'un va de la valeur
minimum à Q1 et l'autre de Q3 à la valeur maximum.
Sur ces deux moustaches, on trouvent quelquefois deux traits verticaux
indiquant la valeur du premier et du neuvième décile.
Avec Xcas on tape :
moustache(L)
Cela ouvre le graphique et dessine une boite à moustaches où on peut
lire que :
Q2=médiane= 3, Q1=2, Q3=6, minimum=0, maximum=8.
La moyenne est le quotient de la somme des valeurs du caractère (pas
toujours distinctes) par l'effectif total.
Si le caractère prend n valeurs distinctes xk d'effectifs ek pour
k = 0...(n - 1) alors l'effectif total vaut
N =
ek et
la moyenne m est :
m = 
ekxk.
La variance est la moyenne des carrés des écarts à la moyenne des
valeurs du caractère.
Si le caractère prend n valeurs distinctes xk d'effectifs ek
(
k = 0...(n - 1)), si la moyenne vaut m et, si l'effectif total vaut N alors
la variance v = s2 est :
s2 = 
ek(xk - m)2 =
(
ekxk2) - m2.
L'écart-type s est la racine carrée de la variance.
Soit une série statistique quantitative d'effectif N à 1 variable,
un échantillon d'ordre n désigne le système des n valeurs
prises par le caractère au cours de n tirages indépendants. Les valeurs
prises par l'échantillon sont donc les valeurs prises par n variables
aléatoires
X1,..., Xn qui suivent la même loi que la variable
aléatoire X égale à la valeur du caractère étudié.
Par exemple, si dans une ville de N habitants, on étudie la taille
(exprimée en centimètres) de ses habitants, la taille de 100 personnes
prises au hasard dans cette ville est un échantillon d'ordre 100.
En général, on ignore la loi de la variable aléatoire égale à la
taille des habitants de cette ville, et on veut
dégager un certain nombre d'éléments caractéristiques de cette variable
grâce à l'échantillon.
suivant: Série statistique quantitative à
monter: Statistique à 1 variable
précédent: Série statistique quantitative
Table des matières
Index
Documentation de giac écrite par Renée De Graeve