Tests Statistiques

SOSstat

Introduction

Les tests statistiques ont une place privilégiée dans la mise en place pratique d’un processus de décision. Il en existe de très nombreux. Nous présenterons dans cette page les principaux tests proposés dans SOSstat.

Les tests de comparaison

Lorsque l’on parle de tests de comparaison, il s’agit souvent des tests à hypothèses simple qui visent à accepter ou refuser un hypothèse. Parmi ces tests, on distingue deux grandes familles :

  • Les tests paramétriques, qui comme leur nom l’indique sont construits sur le calcul de paramètres des échantillons étudiés. Ces test supposent que les échantillons proviennent d’une population normale.
  • Les tests non paramétrique, qui à l’inverse de leur prédécesseurs ne posent aucune hypothèses sur la loi de distribution de la population.

Pour choisir entre ces deux types de test, ont peut être amenés à faire un test de Normalité.

Les tests de Normalité

Le tests de normalité sont très nombreux. SOSstat propose d’utiliser les trois tests les plus courants dans les applications Qualité :

  • Le tests de Kolmogorov-Smirnov construit à partir de la fonction de répartition empirique de l’échantillon
  • Le test de Anderson-Darling, qui se base sur des principes assez proche, mais qui est plus sensible sur des petits échantillons
  • Le test de Shapiro-Wilk qui, grâce à des algorithmes relativement récents, peut traiter de gros échantillons
Tests de normalité de Kolmogorov-Smirnov réalisé avec SOSstat

Tests de normalité de Kolmogorov-Smirnov réalisé avec SOSstat

Pour compléter l’usage de ces tests, SOSstat représente les donnée sur un graphe des Quantiles Normaux, qui permet de valider la normalité de la distribution de manière graphique puisque tous les points doivent alignés sur une droite.

Les tests paramétriques

Les tests paramétriques utilisent généralement la comparaison des moyennes pour les problématiques de centrage et la comparaison des variances lorsqu’il s’agit de comparer des phénomènes de variabilités. SOSstat propose les comparaison de moyenne et écart-types dans trois situations :

  • Les cas où l’on compare un échantillons à une valeur théorique
  • Les cas où l’on compare deux échantillons
  • Les cas où l’on compare plus de deux échantillons (n échantillons)
Nombre d’échantillons Moyenne Écart-type
1 Test de Student [1] Test du Khi2
2 Test de Welch [2] Test de Fisher
n Analyse de la variance Test de Bartlett
[1]Écart-type connu ou estimé
[2]Écart-type connu ou estimé, échantillons appariés

Ces tests sont très largement utilisés pour l’analyse de données industrielles dans le cadre de résolution de probléme :

  • Comparaison de performance de deux processus ou deux instruments de mesure
  • Comparaison de lots de produits
  • Comparaison avant et après maintenance d’une machine ...
Tests sur 1 échantillon réalisé avec SOSstat

Tests de Student sur 1 échantillon

Comparaison de 2 variances

Test de Fisher, les variances ne sont pas significativement différentes

Analyse de la variance réalisée avec SOSstat

Analyse de la variance réalisée avec SOSstat

Les tests non-paramétriques

A la différence des tests précédents, les tests non-paramétriques ne posent aucune hypothèse sur la loi de distribution des variables. C’est en travaillant sur les rangs, et non les mesures, que ces tests n’ont pas besoin de poser d’hypothèses sur les distributions. On dit aussi que ce sont des tests libres de distribution.

Ces tests ont donc un large éventail d’applications possibles : Ils peuvent s’appliquer sur des variables continues (des mesures par exemple) lorsque les caractéristiques ne suivent pas des lois normale, mais aussi sur des variables discrètes (comptage) ou encore des variables de rang (classement), notamment dans le cas d’analyses sensorielles.

Comme pour les tests paramétriques, on peut classer les tests selon qu’il s’intéressent au centrage ou la dispersion des variables. D’autre part, on retrouve les 3 familles de tests habituelles : les tests à une variable, 2 variables et plus de 2 variables (n).

Nombre d’échantillons Centrage Dispersion
1 Test de signe de Wilcoxon  
2 Test de Mann Whitney Test de Ansari-Bradley
n Test de Kruskal Wallis Test de Levene
Test de MannWhitney avec SOSstat

Test de MannWhitney avec SOSstat

Les tests d’équivalence

Les tests de comparaison, comme le test de Student par exemple, sont assez largement utilisés pour détecter des écarts. Dans ce type de test, on teste l’hypothèse (H0) selon laquelle il n’y a pas d’écart. Si l’analyse révèle un écart significatif entre les échantillons, l’hypothèse (H0) nulle est rejetée : on démontre que l’écart est significatif.

Dans les tests d’équivalence, l’hypothèse est formulée de sorte que le test prouve l’équivalence. A l’inverse, l’hypothèse alternative (H1) est que l’écart entre les échantillons est inférieur a un écart acceptable \Theta . Ainsi, si l’on rejette l’hypothèse nulle, on peut affirmer que les échantillons sont équivalent. On aprové que l’écart était inférieur à l’écart acceptable \Theta .

Dans l’application des tests d’hypothèses, il existe une asymétrie logique implicite entre les rôles joués par l’hypothèse nulle (H0) et l’hypothèse alternative (H1). Dans les tests d’équivalence, on propose de tester l’hypothèse de non-équivalence (H0) avec un risque maîtrisé de conclure à la équivalence à tort.

  • H0 : Il n’y a pas d’équivalence
  • H1 : On démontre l’équivalence

SOSstat propose deux types de tests d’équivalence :

  • Les équivalence de moyenne , qui visent à démontrer qu’un écart entre les moyennes est inférieur à un écart acceptable \Theta
  • Les équivalence de population , qui permettent de comparer simultanément la moyenne et la variance de deux échantillon. Cette technique est recommandée par le FDA pour le bioéquivalences.
Tests d'équivalence avec SOSstat

Equivalence de population : l’équivalence est démontrée

Les tests d’équivalence ont un large potentiel d’application dans l’industrie. Il sont largement utilisés dans l’industrie pharmaceutique pour démontrer l’équivalence entre un dispositif médical de référence et un dispositif générique. Il peuvent être utilisés pour valider l’équivalence entre deux équipements de mesures (pour comparer un équipement neuf et un équipement historique), ils peuvent aussi être utilisés pour qualifier des processus industriels en cas de transfert de production ou de duplication d’équipement.

Bibliographie

DROESBEKE, J. - Éléments de Statistique , Éditions Ellipses, 2015, ISBN-13: 978-2340009080 GoogleBooks

SAPORTA, G. - Probabilités, analyse des données et statistique , Technip, 2011- 622 pages, ISBN-13: 978-2710809807 GoogleBooks

Chow SC, Liu JP. - Design and Analysis of Bioavailability and Bioequivalence Studies. 2nd edn. Marcel Dekker: New York, 1999. GoogleBook

FDA. Guidance for Industry on Bioavailability and Bioequivalence Studies for Nasal Aerosols and Nasal Sprays for Local Action. Center for Drug Evaluation and Research, Food and Drug Administration: Rockville, Maryland, 1999.

Gopal K. Kanji - 100 Statistical tests , SAGE Publications Ltd, 2006 , ISBN-13 : 978 1 4129 2375 0 [Amazon]