Tests Statistiques

SOSstat

Introduction

Les tests statistiques ont une place privilégiée dans la mise en place pratique d’un processus de décision. Il en existe de très nombreux. Nous présenterons dans cette page les principaux tests proposés dans SOSstat.

Les tests de comparaison

Lorsque l’on parle de tests de comparaison, il s’agit souvent des tests à hypothèse simple qui visent à accepter ou refuser une hypothèse. Parmi ces tests, on distingue deux grandes familles [1]:

  • Les tests paramétriques, qui comme leur nom l’indique sont construits sur le calcul de paramètres des échantillons étudiés. Ces tests supposent que les échantillons proviennent d’une population normale.
  • Les tests non paramétriques, qui à l’inverse de leurs prédécesseurs ne posent aucune hypothèse sur la loi de distribution de la population.

Pour choisir entre ces deux familles de tests, il peut être conseillé de faire un test de Normalité.

[1]Nous décrirons également dans cette page, les tests d’équivalence, qui suivent une toute autre logique.

Les tests de Normalité

Les tests de normalité sont très nombreux et chacun peut avoir des préférences. SOSstat propose les trois tests les plus utilisés dans les applications Qualité :

  • Le test de Kolmogorov-Smirnov construit à partir de la fonction de répartition empirique de l’échantillon
  • Le test de Anderson-Darling, qui se base sur des principes assez proches, mais qui est plus sensible sur des petits échantillons
  • Le test de Shapiro-Wilk qui, grâce à des algorithmes relativement récents, peut traiter de gros échantillons

SOSstat fournit une interprétation claire de la décision du test, en plus de la traditionnelle p-value (pas toujours évidente à interpréter).

Tests de normalité de Kolmogorov-Smirnov réalisé avec SOSstat

Tests de normalité de Kolmogorov-Smirnov réalisé avec SOSstat

Pour compléter l’usage de ces tests, SOSstat représente les données sur des graphiques tels que l’histogramme ou le graphe des Quantiles Normaux.

Les tests paramétriques

Les tests paramétriques sont, sans aucun doute, les tests les plus utilisés dans les activités industrielles. Ils sont à la fois performants et simples à interpréter. En effet, leur dénomination provient du fait qu’ils utilisent des estimations de paramètres pour comparer certains caractères des populations étudiées : on utilise généralement la moyenne pour traiter des problématiques de centrage et la variance ou l’écart-type pour comparer les variabilités ou dispersions.

SOSstat propose des tests de comparaison de moyennes ou d’écart-types dans trois situations pratiques :

  • Les cas où l’on compare un échantillon à une valeur théorique
  • Les cas où l’on compare deux échantillons
  • Les cas où l’on compare plus de deux échantillons (n échantillons)
Nombre d’échantillons Moyenne Écart-type
1 Test de Student [2] Test du Khi2
2 Test de Welch [3] Test de Fisher
n Analyse de la variance Test de Bartlett
[2]Écart-type connu ou estimé
[3]Écart-type connu ou estimé, échantillons appariés

Ces tests sont très largement utilisés pour l’analyse de données industrielles dans le cadre de résolution de probléme :

  • Comparaison de performance de deux processus ou deux instruments de mesure
  • Comparaison de lots de produits
  • Comparaison avant et après maintenance d’une machine …
Tests sur 1 échantillon réalisé avec SOSstat

Tests de Student sur 1 échantillon

Comparaison de 2 variances

Test de Fisher, les variances ne sont pas significativement différentes

Analyse de la variance réalisée avec SOSstat

Analyse de la variance réalisée avec SOSstat

Les tests non-paramétriques

A la différence des tests précédents, les tests non-paramétriques ne posent aucune hypothèse sur la loi de distribution des variables. C’est en travaillant sur les rangs des observations, que ces tests peuvent s’affranchir de l’hypothèse de normalité des données. On dit aussi que ce sont des tests libres de distribution.

Les tests non-paramétriques ont donc un large potentiel d’applications : Ils peuvent s’appliquer sur des variables continues (des mesures par exemple) lorsque les caractéristiques ne suivent pas des lois normales, mais aussi sur des variables discrètes (comptage) ou encore des variables de rang (notamment dans le cas d’analyses sensorielles).

Comme pour les tests paramétriques, on peut classer les tests selon qu’il s’intéressent au centrage ou à la dispersion des variables. D’autre part, on retrouve les trois situations d’échantillonnage décrites précédemment 3 familles de tests habituelles : les tests à une variable, 2 variables et plus de 2 variables (n).

Nombre d’échantillons Centrage Dispersion
1 1 Test de signe Test de Wilcoxon  
2 Test U de Mann Whitney Test de Ansari-Bradley
n n Test de Kruskal Wallis Test de Friedman Test de Levene
Test de MannWhitney avec SOSstat

Test U de MannWhitney avec SOSstat

Assistant de tests

Pour guider l’utilisateur dans le choix du test le plus adapté, SOSstat propose un assistant de test. A l’aide d’une série de questions organisées dans un arbre de décision, l’utilisateur est orienté vers le test qui correspond le mieux à son besoin. Il n’est plus nécessaire de reprendre ses « vieux cours de stat ».

Assistant de sélection des tests de comparaison de SOSstat

Assistant de sélection des tests de comparaison - SOSstat

L’assistant de test se charge d’ouvrir la boite de dialogue, avec les paramétrages appropriés, afin de réaliser le test dans la foulée.

Les tests d’équivalence

Les tests de comparaison, comme le test de Student par exemple, sont conçus pour détecter des écarts. Dans ce type de test, on pose l’hypothèse (H_0) selon laquelle il n’y a pas d’écart. Si l’analyse révèle un écart significatif entre les échantillons, l’hypothèse nulle (H_0) est rejetée : on démontre donc un écart. A l’inverse, si le test ne démontre pas d’écart significatif, on ne peut rien conclure (et surtout pas une équivalence !).

Dans les tests d’équivalence, l’hypothèse est formulée de sorte que le test prouve l’équivalence. A l’inverse, l’hypothèse alternative (H_1) est que l’écart entre les échantillons est inférieur à un écart acceptable \Theta (seuil d’équivalence). Ainsi, si l’on rejette l’hypothèse nulle, on peut affirmer que les échantillons sont équivalents. On a prouvé que l’écart était inférieur à l’écart acceptable \Theta .

Dans l’application des tests d’hypothèses, il existe une asymétrie logique implicite entre les rôles joués par l’hypothèse nulle (H_0) et l’hypothèse alternative (H_1). Dans les tests d’équivalence, on propose de tester l’hypothèse de non-équivalence (H_0) avec un risque maîtrisé de conclure à l’équivalence à tort.

  • H_0 : Il n’y a pas d’équivalence
  • H_1 : On démontre l’équivalence

SOSstat propose deux types de tests d’équivalence :

  • Les équivalences de moyenne , qui visent à démontrer qu’un écart entre les moyennes est inférieur à un écart acceptable \Theta
  • Les équivalences de population , qui permettent de comparer simultanément la moyenne et la variance de deux échantillons. Cette technique est recommandée par le FDA pour les bio-équivalences.
Tests d'équivalence avec SOSstat

Équivalence de population : l’équivalence est démontrée

Les tests d’équivalence ont un large potentiel d’application dans l’industrie. Ils sont largement utilisés dans l’industrie pharmaceutique pour démontrer l’équivalence entre un dispositif médical de référence et un dispositif générique. Il peuvent être utilisés pour valider l’équivalence entre deux équipements de mesures (pour comparer un équipement neuf et un équipement historique), ils peuvent aussi être utilisés pour qualifier des processus industriels en cas de transfert de production ou de duplication d’équipements.

Bibliographie

DROESBEKE, J. - Éléments de Statistique , Éditions Ellipses, 2015, ISBN-13: 978-2340009080 GoogleBooks

SAPORTA, G. - Probabilités, analyse des données et statistique , Technip, 2011- 622 pages, ISBN-13: 978-2710809807 GoogleBooks

Chow SC, Liu JP. - Design and Analysis of Bioavailability and Bioequivalence Studies. 2nd edn. Marcel Dekker: New York, 1999. GoogleBook

FDA. Guidance for Industry on Bioavailability and Bioequivalence Studies for Nasal Aerosols and Nasal Sprays for Local Action. Center for Drug Evaluation and Research, Food and Drug Administration: Rockville, Maryland, 1999.

Gopal K. Kanji - 100 Statistical tests , SAGE Publications Ltd, 2006 , ISBN-13 : 978 1 4129 2375 0 [Amazon]