Statistik:Daten und Diagramme: Unterschied zwischen den Versionen

Aus Matura Wiki
Zur Navigation springen Zur Suche springen
(Der Seiteninhalt wurde durch einen anderen Text ersetzt: „{{Inhalt:Statistik:Daten und Diagramme}}“)
 
(5 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
 
+
{{Inhalt:Statistik:Daten und Diagramme}}
== Begriffe ==
 
$n...$ Umfang der Stichprobe
 
 
 
$x_1...$ Zahl an der 1. Stelle 
 
 
 
$x_i...$ Zahl an der $i.$ Stelle
 
 
 
$\{ x_1;x_2;.....;x_n \} ...$ Stichprobe (z.B. $\{ 1; ;5; 5; 5; 10;\}$ )
 
 
 
$a_1...$ erster Wert, der in der Stichprobe vorkommt (im oberen Beispiel ist $a_1=1$)
 
 
 
$a_2...$ zweiter Wert, der in der Stichprobe vorkommt (im oberen Beispiel ist $a_2=5$)
 
 
 
$a_i...$ $i.$Wert, der in der Stichprobe vorkommt
 
 
 
== Arten von Merkmalen/Daten ==
 
Im groben unterscheidet man zwischen 3 Arten von Merkmalen:
 
* '''nominale Merkmale''' können nicht sinnvoll durch eine Zahl beschrieben oder in eine Reihenfolge gebracht werden. Beispiele sind "Geschlecht", "Haarfarbe".
 
* '''ordinale Merkmale''' können in eine Reihenfolge gebracht werden, eignen sich aber nicht für Rechnungen (wie z.B. Addition). Beispiele sind "Platzierung bei einem Rennen", "Bildungsabschlüsse".
 
* '''metrische Merkmale''' können durch Zahlen beschrieben werden, mit denen man auch rechnen kann. Beispiele: "Gehalt", "Alter", "Schuhgröße".
 
 
 
 
 
 
 
 
 
== Absolute und relative Häufigkeit ==
 
{{Vorlage:Definition|1= Die '''absolute Häufigkeit $H_i$''' gibt an, wie oft das $i-$te Element in der Stichprobe auftritt.
 
 
 
z.B.: In der Menge $\{ 1;2;2;2;4;4;6\} $ ist die absolute Häufigkeit der Zahl 2 genau $H=3$, da die 2 insgesamt dreimal vorkommt}}
 
 
 
{{Vorlage:Beispiel|1= In einer (kleinen) Umfrage werden von $n=15$ Personen die Schuhgrößen gemessen. Das Ergebnis ist in der folgenden Liste angegeben:
 
$$\{36;36;36;37;37;37;37;38;38;40;41;42;42;42;46\}$$
 
Aufgabe: Ermitteln Sie in einer Tabelle die Häufigkeit jedes Merkmals (=$a_i$).
 
|2=
 
'''Lösung'''
 
<span style="color:#E6F6CE;" > { </span>
 
{{{!}}  class="wikitable"
 
{{!}}-
 
! Werte $a_i$
 
! Häufigkeiten $H_i$
 
{{!}}-
 
{{!}} 36
 
{{!}} 3
 
{{!}}-
 
{{!}} 37
 
{{!}} 4
 
{{!}}-
 
{{!}} 38
 
{{!}} 2
 
{{!}}-
 
{{!}} 40
 
{{!}} 1
 
{{!}}-
 
{{!}} 41
 
{{!}} 1
 
{{!}}-
 
{{!}} 42
 
{{!}} 3
 
{{!}}-
 
{{!}} 46
 
{{!}} 1
 
{{!}}-
 
{{!}} '''Summe'''
 
{{!}} '''15'''
 
{{!}}}
 
 
 
 
 
}}
 
 
 
 
 
Aus der absoluten Häufigkeit kann man noch nicht darauf schließen, ob ein Merkmal wirklich häufig auftritt oder nicht, da es immer auch auf die Gesamtanzahl $n$ der untersuchten Werte ankommt.
 
 
 
So ist eine absolute Häufigkeit von $100$ für $n=150$ sehr groß, für $n=1$ Mrd dagegen wohl eher klein.
 
 
 
 
 
In solchen Fällen ist es hilfreich zu wissen, wie viel '''Prozent''' der Gesamtmenge $n$ dieses Merkmal besitzen. Dies wird berechnet mit...
 
{{Vorlage:Definition|1= Die '''relative Häufigkeit $h_i$''' gibt an, mit wie viel Prozent ein Merkmal in Bezug auf die Gesamtmenge $n$ auftritt. Es gilt:
 
$$h_i=\frac{H_i}{n}$$
 
 
 
z.B.: In der Menge $\{1;2;2;2;4;4;6\}$ ist die absolute Häufigkeit der Zahl 2 genau $H=3$, die relative Häufigkeit ergibt sich dann mit:
 
$$h=\frac{H}{n}=\frac{3}{7}\approx 43\%$$}}
 
 
 
{{Vorlage:Beispiel|1= Berechnen Sie mithilfe der Tabelle aus der Schuhgrößenumfrage (siehe oben)
 
die relative Häufigkeiten $h_i$.
 
<span style="color:#E6F6CE;" > { </span>
 
{{{!}}  class="wikitable"
 
{{!}}-
 
! Werte $a_i$
 
! absolute Häufigkeiten $H_i$
 
! relative Häufigkeiten $h_i$
 
{{!}}-
 
{{!}} 36
 
{{!}} 3
 
{{!}} $\ \ \ $
 
{{!}}-
 
{{!}} 37
 
{{!}} 4
 
{{!}}
 
{{!}}-
 
{{!}} 38
 
{{!}} 2
 
{{!}}
 
{{!}}-
 
{{!}} 40
 
{{!}} 1
 
{{!}}
 
{{!}}-
 
{{!}} 41
 
{{!}} 1
 
{{!}}
 
{{!}}-
 
{{!}} 42
 
{{!}} 3
 
{{!}}
 
{{!}}-
 
{{!}} 46
 
{{!}} 1
 
{{!}}
 
{{!}}-
 
{{!}} '''Summe'''
 
{{!}} '''15'''
 
{{!}}
 
{{!}}}
 
|2=
 
'''Lösung'''
 
$n=15$
 
<span style="color:#E6F6CE;" > { </span>
 
{{{!}}  class="wikitable"
 
{{!}}-
 
! Werte $a_i$
 
! absolute Häufigkeiten $H_i$
 
! relative Häufigkeiten $h_i$
 
{{!}}-
 
{{!}} 36
 
{{!}} 3
 
{{!}} $\frac{3}{15}=20$%
 
{{!}}-
 
{{!}} 37
 
{{!}} 4
 
{{!}} $\frac{4}{15}=26.7$%
 
{{!}}-
 
{{!}} 38
 
{{!}} 2
 
{{!}} $\frac{2}{15}=13.3$%
 
{{!}}-
 
{{!}} 40
 
{{!}} 1
 
{{!}} $\frac{1}{15}=6.7$%
 
{{!}}-
 
{{!}} 41
 
{{!}} 1
 
{{!}} $\frac{1}{15}=6.7$%
 
{{!}}-
 
{{!}} 42
 
{{!}} 3
 
{{!}} $\frac{3}{15}=20$%
 
{{!}}-
 
{{!}} 46
 
{{!}} 1
 
{{!}} $\frac{1}{15}=6.7$%
 
{{!}}-
 
{{!}} '''Summe'''
 
{{!}} '''15'''
 
{{!}} '''$\frac{15}{15}=100$%'''
 
{{!}}}
 
}}
 
 
 
== Diagramme ==
 
=== Stab-/Säulen- und Balkendiagramm ===
 
In Stab- oder Säulendiagrammen gibt die y-Achse die absolute Häufigkeit (oder relative Häufigkeit) eines Merkmales auf der x-Achse an.
 
[[Datei:Säulendiagramm-bsp1-excel.png|500px|mini|zentriert|Säulendiagramm der Schuhgrößen]]
 
 
 
 
 
Bei Balkendiagrammen sind die Achsen vertauscht.
 
 
 
[[Datei:Balkendiagramm-bsp1.png|500px|mini|zentriert|Balkendiagramm der Schuhgrößen]]
 
 
 
Schummeln: Klassen vereinigen
 
=== Kreisdiagramm ===
 
 
 
Bei Kreisdiagrammen entspricht ein Kreissegment der relativen Häufigkeit eines Merkmales. Alle Kreissegmente zusammen (d.h. alle relativen Häufigkeiten) ergeben einen ganzen Kreis (d.h. 100 %).
 
 
 
[[Datei:Kreisdiagramm.png|500px|mini|zentriert|Kreisdiagramm der Schuhgrößen]]
 
 
 
{{Vorlage:Merke|1= [[Datei:Kreisdiagram-3d.png|300px|mini|rechts|Kreisdiagramm mit 3d-Effekt]]
 
'''Schummeln mit Kreisdiagrammen'''
 
 
 
Bei dreidimensionalen Kreisdiagrammen erscheinen Segmente im hinteren Bereich kleiner, als Segemnte im vorderen Bereich. Deshalb sollte man auf den 3d-Effekt verzichten.
 
 
 
}}
 
 
 
=== Boxplot (Kastenschaubild) ===
 
 
 
Boxplot-Diagramme geben einen Überblick über die Verteilung der Daten, indem Sie die Datenreihe in 4 25%-Bereiche teilen. Hierbei bildet der Bereich zwischen den [[Statistik:Streuungsmaße#Quartile|Quartilen]] den "Kasten", von dem aus die die Antennen zum minimalen und maximalen Wert gehen ($x_{min}$ und $x_{max}$).
 
 
 
[[Datei:Boxplot-allgemein.png|500px|mini|zentriert|Boxplot-Diagramm]]
 
 
 
{{Vorlage:Merke|1= In jedem der 4 Bereiche eines Boxplot-Diagrammes liegen ca. 25 % aller Werte}}
 
 
 
 
 
{{Vorlage:Beispiel|1= Gegeben ist das folgende Boxplot-Diagramm, das aus den Daten der Schuhgrößen erstellt wurde.
 
 
 
[[Datei:Boxplot-bsp-schuhe-ohnebeschriftungen.png|500px|mini|zentriert|Boxplot der Daten für die Schuhgrößen]]
 
Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind und begründen Sie diese Entscheidung:
 
# Die Anzahl der Werte zwischen 36 und 37 ist mit Sicherheit geringer als die Anzahl der Werte zwischen 42 und 46.
 
# 25 % aller Werte sind kleiner als 42.
 
# Zwischen 37 und 38 liegen gleich viele Werte wie zwischen 38 und 42.
 
 
 
|2=
 
$\ $
 
# Falsch! Da jeder Bereich ca. 25 % aller Werte umfasst, liegen in beiden Bereichen ungefähr gleich viele Werte.
 
# Falsch! Es sind 75% aller Werte kleiner als 42 (oder 25 % aller Werte sind '''größer''' als 42).
 
# Richtig! Siehe 1.
 
 
 
}}
 
 
 
http://tube.geogebra.org/student/m5245
 
 
 
http://tube.geogebra.org/student/m274871  (Andi Lindner)
 
 
 
http://tube.geogebra.org/student/b115371#material/56673  (sollte bearbeitet werden)
 
 
 
http://tube.geogebra.org/student/m129201  (Test)
 
 
 
=== Schummeln mit Statistik ===
 
 
 
{{Vorlage:Video|Db2VMc69urk}}
 
 
 
Rest folgt noch
 

Aktuelle Version vom 1. Januar 2016, 17:25 Uhr