Statistiques      Série


Définition.

Une variable peut être :

•        Quantitative : numérique et fait l'objet de calcul  ( âge, taille, poids, notes, nombres d'heures etc ...)

•        Qualitative : c'est le contraire de quantitative, mais la variable peut très bien être numérique.

•        Discrète : si la variable ne prend qu'un nombre fini de valeurs (ces valeurs sont appelées modalités et notées xi ) .

•        Continue : si la variable prend ses valeurs dans un intervalle (classe )



Exemple : des notes obtenues tab 1 et ensuite rangées selon des variables discrétes Tab2 et continues. Tab 3 et par fréquences Tab 4.


Tab 1

Tab 2

Tab 3

Tab 4


Exemple de cours adultes.  

                                                

STATISTIQUES  OUTILS  I . (Niveau IV).

1. Echantillon sur recensement.

1.1. Le calcul de la taille de l'échantillon s'appuie sur la propriété remarquable suivante : Quelle que soit la répartition des valeurs dans la population les moyennes observées sur des échantillons de taille n suffisante ( n> 30) obéissent généralement à une loi normale. (cf. Stat outil I  2.4.1.)

Connaissant (en général exemple de l'âge) la moyenne et l'écart-type  d   ( ou du moins en faisant cette hypothèse pour le raisonnement selon un plan de sondage) on est en mesure de construire la courbe représentative de la loi à laquelle obéissent les moyennes des échantillons. On lit sur cette courbe la probabilité P ( ou niveau de confiance) avec laquelle il est possible d'observer une moyenne. Ce sont les aires hachurées de la figure ci-dessous, (ces documents sont dans le cours de base) délimitées par la courbe de l'intervalle de confiance choisi. Autrement dit, il y a  P chances sur 100 pour qu'on puisse observer sur un échantillon de taille n une moyenne se situant dans l'intervalle de confiance. Pour déterminer la taille de l'échantillon ou bien n est fixé à l'avance, on effectue le sondage et l'on calcule, à la fin, la fourchette de précision, il faut alors connaître l'écart type de la population ou bien n doit être fixé et il faut dès le départ, connaître l'écart type de la population pour calculer n.

 Sur le plan pratique il est bon de signaler que m et d s'exprime avec la même unité que a.  Soit N la taille de l'échantillon défini à partir d'un recensement de population.

                                

r =   le paramètre se lit directement dans la table  en fonction du niveau de confiance P choisi.

P               r                       P             r                               P                    r

80 %       1,282                 94 %       1,881                    99,5 %             2,813

85 %       1,440                 95 %       1,96                      99,8 %             3,090

90 %       1,645                 96 %       2,054                    99,9 %             3,291

91 %       1,695                 97 %       2,17                      99,99 %           3,891

92 %       1,751                 98 %       2,326                    99,999 %         4,417

93 %       1,812                 99 %       2,576                   99,9999999%    6,109

 

STATISTIQUES  OUTILS  I I.

2. METHODE.

2.1. La méthode statistique s'impose toutes les fois que la multiplicité, la complexité et l'intrication des faits et/ou leur causes rendent l'interprétation des observations impossibles sans recourir aux résultats théoriques du calcul de probabilité.

La méthode statistique doit donc : collecter, dépouiller, coordonner les renseignements; comparer la répartition observée avec la répartition théorique; interpréter, conclure et préciser le degré de confiance à accorder aux résultats.

2.2. La statistique descriptive décrit, trie, organise, représente graphiquement, elle utilise pour se faire les paramètres de position et/ou de dispersion.

Ces paramètres sont d'un usage constant pour caractériser tant les distributions observées (statistique descriptive) que les distributions théoriques (résultant du calcul des probabilités).

2.3. La statistique des probabilités construit une distribution théorique par le biais de lois statistiques.

2.3.1. Loi Binomiale ou loi de Bernouilli. Cette loi apparaît lors de n tirage successif de boules a1 et a2 d'une urne en remettant  après chaque tirage la boule tirée dans l'urne avant d'effectuer un nouveau tirage. On dit que le tirage est non exhaustif.

La loi est multinomiale pour n boules >2.

2.3.2. Loi de Laplace-Gauss ou loi limite ou encore loi normale  pour a1 et a2 identique, cette loi présente la particularité d'être complètement définie par deux paramètres simples, l'un de position ( la moyenne) l'autre de dispersion ( l'écart-type ).

2.3.3. Loi de Poisson pour l'analyse d'un très petit nombre a1 pour a2 grand ou réciproquement. Cette loi s'applique idéalement aux événements rares.

2.3.4. Loi hypergéométrique ou loi des tirages exhaustifs. Cette loi s'applique pour un nombre important de tirage exhaustifs, c'est-à-dire sans remettre dans l'urne par exemple les boules a1 noires et a2 blanches. Si le tirage est peu important, la loi de Bernouilli peut être appliquée.

2.3.5. Loi de Student-Fisher s'applique à des échantillons "n" petits. n < 30. Student pseudonyme de W.S. Gosset. (Niveau III).

2.4. La Statistique mathématique. Elle interprète cherche et précise. (Niveau II)

2.4.1. Le théorème central limite, (appelé aussi théorème de Liapounov). Si l'on prélève au hasard un certain nombre d'échantillons sur une population quelconque, les valeurs moyennes de ces échantillons tendent d'autant plus à se distribuer selon la loi Laplace-Gauss que le nombre d'échantillon ou la taille "n" est plus grand, tel que n > 30.