beraten
programmieren
implementieren
trainieren
Quartile.INKL und Quartile.EXKL
Allgemein
Mit Hilfe der Quartilsberechnung können Daten in vier gleich große Teile eingeteilt werden, wobei das Quartil jenen Wert angibt, der die Grenze zwischen zwei Vierteln bildet.
Am bekanntesten ist sicher das 2. Quartil, das auch Median genannt wird. Dieser teilt die Daten in zwei gleich große Hälften.
Zur Berechnung des Median werden die Daten aufsteigend sortiert und der Wert in der Mitte abgezählt. Liegt eine gerade Anzahl von Daten vor, so wird der arithmetische Mittelwert der beiden benachbarten Werte gebildet.
Die folgende Abbildung zeigt die Ermittlung des Median:
Der Median ergibt sich aus (23 + 27) / 2 und beträgt 25.
Für die Berechnung des 1. und 3. Quartils gab es vor Office 2007 eine Funktion mit der Bezeichnung Quartile. Mit der Version 2007 wurden zwei neue Funktionen eingeführt: Quartile.INKL und Quartile.EXKL. Da die Excel Hilfe nicht allzu viel Information zum Unterschied der beiden Funktionen liefert, soll hier ein Erklärungsversuch unternommen werden.
Quartile.INKL
Nehmen wir an, es liegen 10 Testwerte vor. Wir schreiben die Werte in aufsteigender Reihenfolge auf und geben zu jedem Wert eine Indexposition dazu. Da unser Index bei 0 startet ist der Index des letzten Wertes gleich 9 (Anzahl der Werte - 1).
Die Position des ersten Quartil berechnet sich aus dem größten Index multipliziert mit 25%:
(n - 1 ) * 25% (10 - 1 ) * 25% Ergebnis: 2,25
Die Position des zweiten Quartil (Median) berechnet sich aus dem größten Index multipliziert mit 50%:
(n - 1) * 50% (10 - 1) * 50% Ergebnis: 4,5
Die Position des dritten Quartil berechnet sich aus dem größten Index multipliziert mit 75%:
( n - 1 ) * 75% (10 - 1 ) * 75% Ergebnis: 6,75
Zeichnen wir die drei Positionen ein, so ergibt sich folgendes Bild:
Das 1. Quartil befindet sich ein wenig oberhalb des Wertes an der Indexposition 2, also ein wenig oberhalb von 12. Wir berechnen die Differenz zwischen 12 und dem nächsten Wert, ermitteln den entsprechenden Anteil und addieren diesen Anteil zu 12 dazu.
Indexposition: 2,25 Berechnung 1. Quartil: 12 + (17 - 12) * 0,25 Ergebnis: 13,25
Das 2. Quartil (Median) befindet sich genau in der Mitte zwischen den Werten 23 und 27. Zur Berechnung kann der arithmetische Mittelwert herangezogen werden.
Indexposition: 4,5 Berechnung 2. Quartil (Median): (23 + 27) / 2 Ergebnis: 25
Das 3. Quartil wird analog zum 1. Quartil berechnet. Wir berechnen die Differenz zwischen 31 und dem nächsten Wert, ermitteln den entsprechenden Anteil und addieren diesen Anteil zu 31 dazu.
Indexposition: 6,75 Berechnung 3. Quartil: 31 + (32 - 31) * 0,75 Ergebnis: 31,75
Die Funktion Quartile.INKL basiert also auf einem (n-1)-Index. Die alte Funktion Quartile liefert die gleichen Ergebnisse.
Quartile.EXKL
Nehmen wir an, es liegen 10 Testwerte vor. Wir schreiben die Werte in aufsteigender Reihenfolge auf und geben zu jedem Wert eine Indexposition dazu. Der Index startet zwar bei 0, der erste Wert wird aber der Indexposition 1 zugeordnet. Um die Gleichmäßigkeit zu bewahren, wird am Ende noch ein weiterer Index ohne Wertzuordnung hinzugefügt.
Somit umfassen unsere Indizes die Werte 0 bis 11. Die Werte sind den Indizes 1 bis 10 zugeordnet.
Die Position des ersten Quartil berechnet sich aus dem größten Index multipliziert mit 25%:
(n + 1 ) * 25% (10 + 1 ) * 25% Ergebnis: 2,75
Die Position des zweiten Quartil (Median) berechnet sich aus dem größten Index multipliziert mit 50%:
(n + 1) * 50% (10 + 1) * 50% Ergebnis: 5,5
Die Position des dritten Quartil berechnet sich aus dem größten Index multipliziert mit 75%:
( n + 1 ) * 75% (10 + 1 ) * 75% Ergebnis: 8,25
Zeichnen wir die drei Positionen ein, so ergibt sich folgendes Bild:
Das 1. Quartil befindet sich im rechten Bereich zwischen der Indexposition 2 und 3. Wir berechnen die Differenz zwischen 11 und dem nächsten Wert, ermitteln den entsprechenden Anteil und addieren diesen Anteil zu 11 dazu.
Indexposition: 2,75 Berechnung 1. Quartil: 11 + (12 - 11) * 0,75 Ergebnis: 11,75
Das 2. Quartil (Median) befindet sich genau in der Mitte zwischen den Werten 23 und 27. Zur Berechnung kann der arithmetische Mittelwert herangezogen werden.
Indexposition: 4,5 Berechnung 2. Quartil (Median): (23 + 27) / 2 Ergebnis: 25
Das 3. Quartil wird analog zum 1. Quartil berechnet. Wir berechnen die Differenz zwischen 32 und dem nächsten Wert, ermitteln den entsprechenden Anteil und addieren diesen Anteil zu 32 dazu.
Indexposition: 8,25 Berechnung 3. Quartil: 32 + (36 - 32) * 0,25 Ergebnis: 33
Die Funktion Quartile.EXKL basiert also auf einem (n+1)-Index.
Zusammenfassung
Die Berechnung des 2. Quartils (Median) kommt bei beiden Funktionen zum selben Ergebnis.
Das 1. und 3. Quartil der Funktion Quartile.INKL liegt näher am Median als das 1. und 3. Quartil der Funktion Quartile.EXKL. Somit ist der Quartilsabstand bei Verwendung von Quartile.INKL kleiner als bei der Verwendung von Quartile.EXKL. Dies hat unter anderem Konsequenzen bei der Definition von Aussreissern bei der grafischen Darstellung der Daten mit Hilfe von Boxplots.
Manche Quellen schlagen einen Mittelweg vor, bei dem beide Ergebnisse ermittelt werden und dann aus dem Inklusiv- und dem Exklusivwert der arithmetische Mittelwert gebildet wird.
Welchen Weg auch immer Sie gehen, bleiben Sie in Ihrem Vorgehen konsistent und verwenden Sie immer die gleiche Berechnungsart.
Download Beispieldatei
Die gezeigten Codebeispiele können Sie als xlsx-Datei herunterladen.