Omni Calculator logo

Boxplot Rechner

Created by Maciej Kowalski, PhD candidate
Reviewed by Anna Szczepanek, PhD and Jack Bowater
Translated by Luise Schwenke and Julia Kopczyńska, PhD candidate
Last updated: Oct 30, 2024


Willkommen bei Omni's Boxplot-Rechner — deinem alltäglichen Box-Whisker-Plot-Ersteller. Ein Boxplot ist vielleicht die gängigste Methode, um einen Datensatz zu visualisieren, ohne die einzelnen Werte aufzulisten. Er verwendet die sogenannte Fünf-Zahlen-Zusammenfassung 🇺🇸, die die Verteilung der Werte auf der Zahlenreihe beschreibt. Wenn dir diese ausgefallene Terminologie nichts sagt, mach dir keine Sorgen! Wir werden gleich sehen, was ein Boxplot ist und erklären, wie man einen Box-Whisker-Plot liest. Für diejenigen, die sich in der Statistik auskennen, stellen wir den modifizierten Boxplot vor, der die Ausreißer aus dem Box-Whisker-Plot herausnimmt.

Was ist ein Boxplot?

Ein Boxplot (auch Box-Whisker-Plot genannt) stellt die Verteilung eines Datensatzes dar. Er wird meist verwendet, um große Zahlenreihen zu analysieren, bei denen es weniger auf die einzelnen Werte ankommt, sondern eher darauf, wie die Werte verteilt sind und wie weit die Extremwerte davon entfernt sind.

Schauen wir uns ein Beispiel für ein Box-Whisker-Diagramm an und erklären seine Bestandteile.

Ein Beispiel für ein Box-Whisker-Diagramm.

Im Grunde genommen sind die fünf horizontalen Linien alles, was es gibt. Das Bündel wird die Fünf-Punkte-Zusammenfassung eines Datensatzes genannt, und natürlich liefert Omni's Box-Whisker-Plot-Ersteller ihre Werte zusammen mit dem Diagramm selbst. Es ist an der Zeit zu lernen, was sie von oben nach unten bedeuten.

  1. Das Maximum

    Das ist ganz einfach: Es ist der größte Eintrag im Datensatz. In der Grafik ist es die obere dunkelblaue Linie.

  2. Das dritte Quartil

    Ein Quartil ist ein Viertel des Datensatzes. Das dritte Quartil markiert also das Ende der Spanne, in der drei Viertel der Einträge liegen. Der Formel nach ist es der Median der oberen Hälfte der Werte. Im Diagramm ist es die obere Seite des Kastens.

  3. Der Median

    Er markiert die Mitte des Datensatzes. Er ist nicht dasselbe wie der Mittelwert, wohlgemerkt! Stattdessen sagt er aus, dass die Hälfte der Einträge größer und die andere Hälfte kleiner als der Median ist. In der Abbildung ist das die hellblaue Linie in der Mitte.

  4. Das erste Quartil

    Ähnlich wie sein Äquivalent aus Punkt 2. markiert es das Ende des Bereichs, in dem ein Viertel der Werte liegt. Zusammen mit dem dritten Quartil bildet es den Interquartilsabstand, d. h. der Kasten im obigen Box-Whisker-Diagramm, die anzeigt, wo ungefähr die Hälfte der Einträge liegt. In der Grafik ist es die untere Seite des Kastens.

  5. Das Minimum

    Das Gegenteil vom Maximum: Es markiert den kleinsten Eintrag im Datensatz. In der Grafik ist es die untere dunkelblaue Linie.

Da wir nun wissen, was ein Boxplot ist und seine Bestandteile kennen, ist es an der Zeit zu sehen, wie man einen Box-Whisker-Plot in der Praxis erstellt. Zunächst konzentrieren wir uns auf allgemeine Anweisungen und Formeln, die wir dann auf ein numerisches Beispiel in dem entsprechenden Abschnitt anwenden. Zudem gehen wir das Ganze auch andersherum durch, d. h. wir erklären, wie man einen Box-Whisker-Plot liest.

Wie du siehst, sind hier mehrere statistische Begriffe im Spiel. Wenn du mit einem davon nicht vertraut bist, solltest du unseren Rechner besuchen, um mehr zu erfahren!

Wie man ein Box-Whisker-Diagramm erstellt

Wie im obigen Abschnitt erwähnt, ist der Box-Whisker-Plot-Rechner im Grunde ein Werkzeug, um fünf Werte zu visualisieren, die mit einem Datensatz verbunden sind. Deshalb ist es sinnvoll, zunächst zu erklären, wie man sie findet, oder?

Nehmen wir an, du hast eine Zahlenreihe a1,a2,,ana_1, a_2, \ldots, a_n. Der Einfachheit halber nehmen wir an, dass sie in der Reihenfolge vom niedrigsten zum höchsten Wert aufgeführt sind. Wäre das nicht der Fall, müssten wir sie ordnen, bevor wir etwas anderes tun. Beachte auch, dass die nachfolgenden Schritte zur Erstellung eines Box-Whisker-Diagramms in einer anderen Reihenfolge ausgeführt werden als im obigen Abschnitt. Das liegt daran, dass es in der Regel einfacher ist, die fünf Werte in der unten angegebenen Reihenfolge zu bestimmen.

  • Das Maximum

    Das ist die größte der Zahlen. In unserem Fall sind die Einträge geordnet, also haben wir Maximum=an\textrm{Maximum} = a_n.

  • Das Minimum

    Die kleinste Zahl. In der geordneten Folge ist es Minimum=a1\textrm{Minimum} = a_1.

  • Der Median

    Das ist ein bisschen schwieriger. Wir müssen den Wert finden, der die gleiche Anzahl von Einträgen links (also kleiner) und rechts (also größer) hat. Wenn nn ungerade ist, gibt es tatsächlich einen solchen Eintrag, und wir haben Median=a(n+1)/2\textrm{Median} = a_{(n+1)/2}. Wenn nn hingegen gerade ist, müssen wir den Durchschnitt der beiden mittleren Zahlen nehmen, also Median=12(an/2+a(n+2)/2)\textrm{Median} = \frac 12 (a_{n/2} + a_{(n+2)/2}).

  • Das erste Quartil

    Das ist der Median der unteren Hälfte der Einträge. Allerdings müssen wir wieder die Parität von nn berücksichtigen. Wenn nn gerade ist, teilt sich die Folge in zwei Hälften, und wir finden den Median der unteren Hälfte. Wenn nn hingegen ungerade ist, d. h. wenn Median=a(n+1)/2\textrm{Median} =a_{(n+1)/2}, dann ist das erste Quartil der Median aller Einträge von a1a_1 bis einschließlich a(n+1)/2a_{(n+1)/2}.

  • Das dritte Quartil

    Der Median der oberen Hälfte der Einträge. Wir berechnen ihn genauso wie das erste Quartil, nehmen aber die andere Hälfte. Für nn ungerade, nehmen wir die Zahlen von a(n+1)/2a_{(n+1)/2} bis ana_n (d. h. die Zahl a(n+1)/2a_{(n+1)/2} erscheint in beiden Berechnungen).

Sobald wir die fünf Werte haben, können wir die Buntstifte rausholen: Es ist Zeit zum Malen!

Um einen Boxplot zu zeichnen, beginnen wir mit dem Kasten selbst. Wir markieren das erste und das dritte Quartil auf der Linie (beachte, dass der Box-Whisker-Plot-Rechner von Omni das Ganze vertikal mit der Skala nach links zeichnet, aber manchmal findest du auch eine horizontale Version) und zeichnen ein Rechteck, dessen zwei gegenüberliegende Seiten diesen Werten entsprechen (die Breite des Rechtecks spielt keine Rolle). Als Nächstes markieren wir den Median durch eine Linie innerhalb des Rechtecks, die parallel zu den Quartilen verläuft. Damit ist der Teil des Kastens erledigt.

Nun zu den Whiskern. Wir suchen das Maximum und Minimum auf der Skala und ziehen Linien an den entsprechenden Stellen, wiederum parallel zu den Quartilen. Danach verbinden wir ihre Mittelpunkte mit den Seiten des Kastens und markieren so das dritte bzw. erste Quartil.

Wenn du mit dem letzten Schritt fertig bist, kannst du dich als Box-Whisker-Plot-Macher bezeichnen, und das Diagramm ist fertig!

Wie man ein Box-Whisker-Diagramm liest

Angenommen, du bekommst ein Beispiel für ein Box-and-Whisker-Diagramm und möchtest etwas über den zugrunde liegenden Datensatz aussagen, ohne die Einträge selbst zu kennen. In diesem Abschnitt erfährst du genau, wie du das machen kannst.

Wir erklären, wie man ein Box-Whisker-Diagramm liest, indem wir die Informationen, die es liefert, in beliebiger Reihenfolge auflisten. Zur Veranschaulichung geben wir das gleiche Beispiel wie im ersten Abschnitt.

Der Box-Whisker-Plot.
  • Die fünf horizontalen Linien im Diagramm markieren die fünf Zahlen des Datensatzes. Von oben nach unten sind das: das Maximum, das dritte Quartil, der Median, das erste Quartil und das Minimum.
  • Die beiden Grenzlinien sind die Extrema des Datensatzes, d. h. alle Einträge des Datensatzes (egal wie viele es sind) liegen irgendwo zwischen diesen beiden Werten.
  • Der Kasten markiert den Interquartilsabstand. Um genau zu sein, befindet sich dort etwa die Hälfte der Einträge.
  • Die Linie, die durch die Mitte des Kastens geht, ist der Median. Du kannst ihn dir als die Mitte des Datensatzes vorstellen: Die Hälfte der Einträge ist größer und die andere Hälfte kleiner. Er ist jedoch nicht dasselbe wie der Mittelwert.
  • Wenn die Box „dünn“ ist, ist der Datensatz wenig gestreut. Insbesondere kann es in diesem Fall viele Wiederholungen geben, die ähnlich oder gleich dem Median sind.
  • Wenn die Whisker (d. h. die Linien, die die Box mit dem Minimum und Maximum verbinden) lang sind, dann unterscheiden sich die Extremwerte stark vom Großteil des Datensatzes. Es kann sogar sein, dass sie die Ausreißer des Box-Whisker-Plots sind. Deshalb möchtest du dir vielleicht stattdessen den modifizierten Box-Plot ansehen (weitere Informationen findest du im entsprechenden Abschnitt).

Es ist fast so, als könnten wir den Datensatz kennenlernen, ohne ihn in- und auswendig zu kennen.

Doch wie im letzten Punkt angedeutet, gibt es eine Möglichkeit, unsere Datensatzanalyse in extremen Fällen zu verbessern. Wir haben gelernt, was ein Boxplot ist, also sind wir bereit, seinen älteren Bruder zu analysieren: den modifizierten Boxplot (der natürlich auch in Omni's Boxplot-Rechner verfügbar ist).

Der modifizierte Boxplot

Manchmal hat ein Datensatz ein paar Einträge, die sich stark vom Rest unterscheiden. Zum Beispiel kann es einen besonders guten Schüler geben, der bei einem Test eine viel bessere Note als der Rest der Klasse geschrieben hat. Wenn du nicht zu dieser Person gehörst, beschweren sich deine Eltern vielleicht, dass du nicht so fleißig lernst wie diese Person. In diesem Fall kannst du das modifizierte Boxplot benutzen, um ihnen zu zeigen, dass du dich genauso anstrengst wie alle anderen und dass die eine Person sicherlich ein Außerirdischer, oder sowas Ähnliches, ist.

Die modifizierte Version des Boxplots trennt die sogenannten Ausreißer vom Rest des Datensatzes. Um genau zu sein, handelt es sich dabei um das reguläre Diagramm, wie es im ersten Abschnitt erklärt wurde, aber wir erhalten nur die Nicht-Ausreißer, d. h. wir nehmen nicht die Werte, die unerklärlich groß oder ungewöhnlich klein sind. Trotzdem vergessen wir diese schrulligen Typen nicht: Die Ausreißer des Box-Whisker-Plots sind immer noch als einzelne Punkte im Bild, nur außerhalb der Whisker.

Nehmen wir an, dass Q1 und Q3 das erste bzw. dritte Quartil des gesamten Datensatzes sind (Ausreißer oder nicht). Bezeichne den Interquartilsabstand (IQR) mit IQR = Q3 - Q1.

💡 Ein Ausreißer ist ein Eintrag x, der eine der folgenden Ungleichungen erfüllt: x < Q1 - 1,5 ∙ IQR oder x > Q3 + 1,5 ∙ IQR. Erfahre mehr mit unserem Ausreißer Rechner 🇺🇸. Um mehr über IQR herauszufinden, gehe direkt zum Interquartilsabstand Rechner (IQR) 🇺🇸.

Mit anderen Worten: Das Zeichnen eines modifizierten Box-Plots ist ein mehrschichtiger Prozess. Zuerst müssen wir die Quartile aller Einträge finden und prüfen, ob es Ausreißer gibt. Wenn ja, entfernen wir sie und folgen den üblichen Anweisungen aus dem zweiten Abschnitt, aber für den reduzierten Datensatz. Beachte, dass dies bedeutet, dass wir die Quartile erneut berechnen müssen, weil der Datensatz jetzt anders ist.

So, genug Theorie für heute! Es ist höchste Zeit, dass wir unser erworbenes Wissen anwenden und den Boxplot-Rechner von Omni mit einigen numerischen Daten benutzen.

Beispiel: Verwendung des Boxplot-Rechners

Stell dir vor, du bist Sportlehrer an einer Schule und beschließt eines Tages, deine Schüler im 100-Meter-Lauf zu testen. Jeder aus deiner zwanzigköpfigen Gruppe sprintet die Strecke, während du ihre Zeiten notierst:

13,2 s, 14,1 s, 11,9 s, 15,2 s, 14,5 s, 12,9 s, 12,7 s, 14,1 s, 18,3 s, 15,6 s, 14,5 s, 13,8 s, 12,9 s, 13,3 s, 13,9 s, 16,6 s, 15 s, 14,2 s, 17,4 s, 16,2 s.

Du willst nicht nur die Schüler/innen benoten, sondern auch die Leistungen der ganzen Klasse analysieren. Und was eignet sich dafür besser, als ein Box-Whisker-Diagramm zu zeichnen?

Zunächst werden wir sehen, wie einfach die Aufgabe ist, wenn du den Boxplot-Rechner von Omni zur Hand hast. Oben können wir zwischen der normalen und der modifizierten Version wählen. Wir brauchen die modifizierte Version hier nicht, also wählen wir einfach „Ich möchte den normalen Boxplot sehen“.

Als Nächstes geben wir die Daten ein. Beachte, dass zunächst nur acht Felder sichtbar sind, aber sobald du anfängst, Werte einzugeben, erscheinen neue Felder (insgesamt kannst du bis zu dreißig Werte eingeben). Beachte auch, wie der Boxplot-Rechner bereits die Antwort für zwei Zahlen anzeigt und das Ergebnis und die Grafik mit jeder weiteren Eingabe anpasst. Sobald wir den letzten Wert eingegeben haben, können wir nach unten scrollen, um die Zusammenfassung der fünf Zahlen unseres Datensatzes und das dazugehörige Box-Whisker-Plot zu sehen.

Sehen wir uns nun an, wie wir das Box-Whisker-Diagramm selbst erstellen können, d. h. ohne Hilfe des Boxplot-Rechners. Gemäß der Anleitung aus dem entsprechenden Abschnitt beginnen wir mit der Reihenfolge der Einträge. Das heißt, dass wir statt der obigen Reihenfolge mit folgenden Werten arbeiten werden:

11,9 s, 12,7 s, 12,9 s, 12,9 s, 13,2 s, 13,3 s, 13,8 s, 13,9 s, 14,1 s, 14,1 s, 14,2 s, 14,5 s, 14,5 s, 15 s, 15,2 s, 15,6 s, 16,2 s, 16,6 s, 17,4 s, 18,3 s.

Daraus können wir bereits erkennen

Minimum = 11,9 s und Maximum = 18,3 s.

Zweitens suchen wir nach dem Median. Wir haben zwanzig Einträge (eine gerade Zahl), also wird es das arithmetische Mittel) des 10. und 11. Wertes,

Median = (14,1 s + 14,2 s) / 2 = 14,15 s.

Als Nächstes brauchen wir die Quartile, d. h. die Mediane der ersten und zweiten Hälfte des Datensatzes. Jedes Quartil enthält 20 / 2 = 10 Einträge (wieder eine gerade Zahl), also sind sie wieder das arithmetische Mittel: der 5. und 6. Eintrag für das erste Quartil und der 15. und 16 für das dritte Quartil.

Q1 = (13,2 s + 13,3 s) / 2 = 13,25 s,

Q3 = (15,2 s + 15,6 s) / 2 = 15,4 s.

Damit haben wir alle Komponenten eines Box-Whisker-Plots, sodass wir die visuelle Darstellung unseres Datensatzes zeichnen können:

Die Box-and-Whisker-Darstellung des angegebenen Datensatzes.

Wir sehen, dass sich die Ergebnisse der Schüler im Allgemeinen nicht allzu sehr unterscheiden. Trotzdem haben wir einen hohen Maximalwert, also wäre es vielleicht eine gute Idee, diese Person zu ermutigen, mehr Sport zu treiben?

FAQ

Wie mache ich ein Boxplot?

Um einen Box-Whisker-Plot zu erstellen:

  1. Ordne den Datensatz vom kleinsten zum größten Wert an.

  2. Identifiziere das Minimum (der erste geordnete Eintrag).

  3. Identifiziere das Maximum (den letzten geordneten Eintrag).

  4. Ermittle den Median des gesamten Datensatzes.

  5. Ermittle das erste Quartil, d. h. den Median der unteren Hälfte der Einträge.

  6. Ermittle das dritte Quartil, d. h. den Median der oberen Hälfte der Einträge.

  7. Zeichne den Box-Whisker-Plot:

    • Einen Kasten mit zwei Seiten bei den Werten der Punkte 5-6;
    • Eine Linie durch den Kasten bei dem Wert von Punkt 4;
    • Linien parallel zur obigen Linie bei den Werten von Punkt 2-3;
    • Eine Linie, die die Punkte 2. und 5. verbindet; und
    • Eine Linie, die die Punkte 3. und 6. verbindet.

Wie lese ich ein Boxplot?

Du kannst die folgenden Informationen aus einem Box-Whisker-Plot ablesen:

  • Die horizontalen Linien auf dem Diagramm entsprechen der fünfstelligen Zusammenfassung;
  • Die obere und untere Linie sind das Maximum bzw. das Minimum;
  • Der Kasten entspricht dem Interquartilsabstand;
  • Die Linie durch den Kasten entspricht dem Median;
  • Die Einträge des Datensatzes liegen zwischen der oberen und unteren Linie; und
  • Rund die Hälfte der Werte liegen innerhalb des Interquartilsabstands.

Wo liegt der Mittelwert in einem Boxplot?

Der Boxplot-Rechner von Omni zeigt den Mittelwert nicht an, aber in manchen Quellen wird er mit einem Punkt, einem Plus oder einer Raute in das Diagramm eingefügt. Wir können ihn dann mit dem Median vergleichen, um die Schiefe des Datensatzes zu analysieren.

Wie berechne ich den Interquartilsabstand eines Boxplots?

Um den Interquartilsabstand eines Boxplots zu ermitteln, musst du Folgendes tun:

  1. Lies den Wert der oberen Seite des Kastens ab.
  2. Lies den Wert der unteren Seite ab.
  3. Subtrahiere die Zahl aus Punkt 2. von der in 1. angegebenen.
  4. Freue dich, dass du den Interquartilsabstand deines Boxplots gefunden hast.

Wie erstelle ich einen modifizierten Boxplot?

Um einen modifizierten Boxplot zu erstellen:

  1. Ordne den Datensatz vom kleinsten zum größten Wert an.

  2. Das erste und dritte Quartil finden.

  3. Berechne den Interquartilsabstand IQR.

  4. Überprüfe anhand des IQR, ob es Ausreißer gibt.

  5. Schreibe den Datensatz ohne die Ausreißer.

  6. Finde die fünfstellige Zusammenfassung des reduzierten Datensatzes.

  7. Zeichne den regulären Box-Whisker-Plot des reduzierten Datensatzes.

  8. Falls es Ausreißer gab, markiere sie als einzelne Punkte.

Maciej Kowalski, PhD candidate
I'd like to see a
regular
box plot.
Values (enter up to 30 numbers)
#1
#2
#3
#4
#5
#6
#7
#8
Check out 32 similar collection of journalist's guide calculators
AveragePercentagePercentage change… 29 more
People also viewed…

Bertrand's box paradox

What is the chance of choosing the box containing only gold? Find the answer to Bertrand's box paradox with Omni!

Chilled drink

With the chilled drink calculator, you can quickly check how long you need to keep your drink in the fridge or another cold place to have it at its optimal temperature. You can follow how the temperature changes with time with our interactive graph.

Empirical rule

The empirical rule calculator allows you to find the three intervals within which you'll find 68, 95, and 99.7% of your data.

Plastic footprint

Find out how much plastic you use throughout the year with this plastic footprint calculator. Rethink your habits, reduce your plastic waste, and make your life a little greener.