next up previous contents index
suivant: Série statistique quantitative à monter: Statistique à 1 variable précédent: Série statistique quantitative   Table des matières   Index

Vocabulaire des séries quantitatives à 1 variable

Soit une série quantitative à 1 variable L.
La différence entre la plus grande valeur et la plus petite valeur du caractère effectivement obtenue est l'étendue de la série L.
Le nombre de membres de la population étudiée est l'effectif total.
Si le caractère est discret, il est commode d'indiquer pour chaque valeur du caractère, le nombre des membres de la population ayant cette valeur : c'est l'effectif de cette valeur.
Si le caractère est continu, on partage l'intervalle sur lequel s'étendent ces valeurs en intervalles (en général égaux) que l'on appelle classe. Le nombre des membres de la population ayant leur valeur dans une classe est l'effectif de cette classe.
La valeur moyenne des bornes d'une classe est le centre de cette classe.
L'effectif cumulé d'une valeur (ou d'une classe) est la somme de l'effectif de cette valeur (ou de cette classe) et de tous les effectifs des valeurs (ou des classes) qui précèdent.
La fréquence d'une valeur (ou d'une classe) est le rapport de l'effectif de cette valeur (ou de cette classe) par l'effectif total.
La fréquence cumulée d'une valeur (ou d'une classe) est la somme de la fréquence de cette valeur (ou de cette classe) et de toutes les fréquences des valeurs (ou des classes) qui précèdent.
Avec Xcas on tape par exemple :
cumulated_frequencies([[0.75,30],[1.75,50],[2.75,20]])
ou
cumulated_frequencies([[0.25..1.25,30],[1.25..2.25,50],
[2.25..3.25,20]])
L'histogramme des effectifs (resp fréquences) d'un caractère discret ou continu est le graphique qui permet de visualiser l'effectif (resp fréquences) des différentes valeurs du caractère : on met en abscisse les différentes valeurs du caractère (ou le centre des différentes classes), puis on forme des rectangles accolés deux à deux, ses rectangles ont deux cotés parralléles à l'axe des ordonnées, le coté porté par l'axe des abscisses a pour longueur l'amplitude de la classe, et l'autre est tel que l'aire du rectangle est égale à l'effectif (resp fréquences) de la valeur considérée.
L'histogramme des fréquences permet de visualiser les fréquences des différentes classes au moyen de la surface de rectangles : chaque rectangle correspond à une classe et a pour surface la fréquence de cette classe.
Avec Xcas on tape par exemple :
histogram([[0.75,30],[1.75,50],[2.75,20]])
ou
histogram([[0.25..1.25,30],[1.25..2.25,50],
[2.25..3.25,20]])
On obtient un histogramme des fréquences.
La fonction de répartition des fréquences est égale pour chaque valeur du caractère à la fréquence cumulée de cette valeur.
Le mode est la valeur du caractère dont l'effectif est le plus grand.
Le maximum est la plus grande valeur du caractère effectivement obtenue.
Le minimum est la plus petite valeur du caractère effectivement obtenue.
La médiane partage la série statistique en deux groupes de même effectif. C'est une valeur du caractère à partir de laquelle l'effectif des valeurs qui lui sont inférieures est superieur ou ègal à l'effectif des valeurs qui lui sont supérieures (par exemple la médiane de [140,145,146,147] est 146 et la médiane de [140,145,146] est 145). La médiane est donc la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.5.
Les quartiles sont trois valeurs du caractère qui partage la série statistique en quatre groupes de même effectif :
- le 1-ier quartile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.25.
- le 2-ième quartile est confondu avec la médiane.
- le 3-ième quartile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.75.
On peut définir les déciles. Il y a 9 déciles :
le 1-ier décile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.1.
le 2-ième décile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.2.
etc...
le 9-ième décile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.9.
On peut aussi définir le centile (il y a 99 centiles) et le quantile d'ordre p :
le 1-ier centile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.01.
etc...
le 99-ième centile est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse 0.99.
Le quantile d'ordre p (p un réel de [0,1[), est la valeur du caractère à partir de laquelle la fréquence cumulée atteint ou dépasse p.
Le semi-interquartile est égal à $ {\frac{{1}}{{2}}}$(Q3 - Q1) où Q1 et Q3 désigne le premier et le troisième quartile. Cet indice fournit un renseignement sur l'étalement des valeurs de part et d'autre de la médiane.
L'interquartile est égal à Q3 - Q1Q1 et Q3 désigne le premier et le troisième quartile. Cet indice fournit un renseignement sur l'étalement des valeurs de part et d'autre de la médiane.
L'interdécile est égal à D9 - D1D1 et D9 désigne le premier et le neuvième décile. Cet indice fournit un renseignement sur l'étalement des valeurs de part et d'autre de la médiane.
Exemples avec Xcas
On tape :
L:=[1,2,3,4,5,6,7,8,9,10]
min(L) et on obtient 1
quartile1(L) et on obtient 3.0
median(L) et on obtient 5.0
quartile3(L) et on obtient 7.0
max(L) et on obtient 10
quartiles(L) pour avoir le résultat des 5 commandes précédentes et on obtient [[1.0],[3.0],[5.0],[7.0],[10.0]]
quantile(L,0.9) et on obtient 9.0
La boite à moustaches permet de visualiser ces différentes valeurs :
c'est un rectangle dont un coté est un trait allant de Q1 à Q3 sur lequelle un trait vertical indique la valeur de la médiane et d'où deux traits horizontaux (les moustaches) débordent : l'un va de la valeur minimum à Q1 et l'autre de Q3 à la valeur maximum. Sur ces deux moustaches, on trouvent quelquefois deux traits verticaux indiquant la valeur du premier et du neuvième décile.
Avec Xcas on tape :
moustache(L)
Cela ouvre le graphique et dessine une boite à moustaches où on peut lire que :
Q2=médiane= 3, Q1=2, Q3=6, minimum=0, maximum=8.

\begin{pspicture}(0.0000,-2.0000)(8.0000,3.0000)
\psset{linewidth=.5pt}
\psset{a...
...0,0)(5.0,0.05)
\psline(6.0,0)(6.0,0.05)
\psline(7.0,0)(7.0,0.05)
\end{pspicture}
La moyenne est le quotient de la somme des valeurs du caractère (pas toujours distinctes) par l'effectif total. Si le caractère prend n valeurs distinctes xk d'effectifs ek pour k = 0...(n - 1) alors l'effectif total vaut N = $ \sum_{{k=0}}^{{n-1}}$ek et la moyenne m est : m = $\displaystyle {\frac{{1}}{{N}}}$$\displaystyle \sum_{{k=0}}^{{n-1}}$ekxk.
La variance est la moyenne des carrés des écarts à la moyenne des valeurs du caractère. Si le caractère prend n valeurs distinctes xk d'effectifs ek ( k = 0...(n - 1)), si la moyenne vaut m et, si l'effectif total vaut N alors la variance v = s2 est : s2 = $\displaystyle {\frac{{1}}{{N}}}$$\displaystyle \sum_{{k=0}}^{{n-1}}$ek(xk - m)2 = $\displaystyle {\frac{{1}}{{N}}}$($\displaystyle \sum_{{k=0}}^{{n-1}}$ekxk2) - m2.
L'écart-type s est la racine carrée de la variance.
Soit une série statistique quantitative d'effectif N à 1 variable, un échantillon d'ordre n désigne le système des n valeurs prises par le caractère au cours de n tirages indépendants. Les valeurs prises par l'échantillon sont donc les valeurs prises par n variables aléatoires X1,..., Xn qui suivent la même loi que la variable aléatoire X égale à la valeur du caractère étudié. Par exemple, si dans une ville de N habitants, on étudie la taille (exprimée en centimètres) de ses habitants, la taille de 100 personnes prises au hasard dans cette ville est un échantillon d'ordre 100. En général, on ignore la loi de la variable aléatoire égale à la taille des habitants de cette ville, et on veut dégager un certain nombre d'éléments caractéristiques de cette variable grâce à l'échantillon.
next up previous contents index
suivant: Série statistique quantitative à monter: Statistique à 1 variable précédent: Série statistique quantitative   Table des matières   Index
Documentation de giac écrite par Renée De Graeve