SOSstat 3 - deskriptive Statistik

SOSstat

Deskriptive Statistik

Am Ende eines Experiments, einer Testreihe oder einer Probe gibt es im Allgemeinen einen Satz von Rohdaten, die verarbeitet werden sollten, um eine synthetische Darstellung zu erhalten. Der Zweck der deskriptiven Statistik ist es, Werkzeuge zur Verfügung zu stellen, um diesen Datensatz zusammenzufassen. Diese Analyse kann in zwei komplementäre Schritte unterteilt werden: die grafische Zusammenfassung und die numerische Zusammenfassung.

SOSstat bietet in seinen Analysemodulen viele deskriptive Statistikfunktionen.

Histogramme et Boxplot avec SOSstat

Deskriptive Statistik mit SOSstat

Zusammenfassende grafische Darstellungen

Die grafischen Tools sind zahlreich, aber einige von ihnen sind unbedingt notwendig, wie z.B. :

  • Das Histogramm, das eine Darstellgung der Datenverteilung ermöglicht
  • Das Boxplot unterteilt die Stichprobe in 4 Teile, mit der gleichen Anzahl der Einzelwerten (Quartile). Diese Darstellung, obwohl Sie zunächst recht künstlich erscheint, wird verwendet, um grafisch mehrere Stichproben zu vergleichen.
Méthode des noyaux

Schätzung der Dichte mit der Kerndichte Methode

Numerische Zusammenfassung

Die numerische Zusammenfassung berechnet Parameterdie die Eigenschaften der Verteilung der Grundgesamtheit repräsentieren. Es gibt im Wesentlichen drei Gruppen von Parametern: Lage, Streuungs und Form Parameter einer Verteiliung.

SOSstat berechnet sehr einfach die Parameter einer großen Anzahl von Stichproben.

Calcul de paramètre sur des échantillons

Numerische Zusammenfassung mit SOSstat

Lage Parameter oder Position auf einer Skala

Die am weitesten verbreiteten Lageparameter sind :

Das arithmetische Mittel
Es stellt den Schwerpunkt der Probe dar (es drückt die Größe aus, die jedes Element des Satzes haben würde, wenn es alle identisch wäre, ohne die Gesamtabmessung des Satzes zu ändern) \(\bar{x}=\frac{1}{n} \cdot \sum_{i=0}^n x_{i}\)
Der Median :
Wert, der es ermöglicht, eine numerische Reihe, die in zwei Teile der gleichen Anzahl von Elementen geordnet ist, zu teilen. Für eine ungerade Probe wird der Median durch die Beziehung definiert \(\tilde{x}= x_{ \left( \frac{n+1}{2} \right)}\) und für eine gerade Probe durch \(\tilde{x}= \frac{ x_{\left( \frac{n}{2} \right) } + x_{\left( \frac{n}{2} +1 \right) }}{2}\)

Streuungs oder Skalen-Parameter

Die am häufigsten verwendeten Streuungsparameter sind :

Spannweite :
Abstand zwischen min und max-Wert einer Stichprobe \(R= \max (x_{1} \ldots x_{n}) - min (x_{1} \ldots x_{n})\)
Varianz :
Messung der Konzentration von Daten um den Mittelwert. \(\sigma^2= \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2\)
Standardabweichung :
Wurzel aus der Varianz \(\sigma = \sqrt{ \frac{ \sum_{i=1}^{n} (x_i-\bar{x})^2}{n-1} }\)

Formparameter

Formparameter sind in der Regel Schiefe zur Beschreibung der Symmetrie einer Verteilung und Kurtosis zur Beschreibung der Steilheit oder Flachheit einer Verteilung.

Literaturverzeichnis

DROESBEKE, J. Éléments de Statistique , Éditions Ellipses, 2015, ISBN-13: 978-2340009080 GoogleBooks

SAPORTA, G. Probabilités, analyse des données et statistique , Technip, 2011- 622 pages, ISBN-13: 978-2710809807 GoogleBooks