Einführung in die Datenarbeit

Dieses Kapitel stellt die Grundlage für diesen Statistikkurs. Dabei befinden wir uns zu Beginn im Bereich der deskriptiven Statistik. Die deskriptive Statistik (beschreibende Statistik) dient dazu, Strukturen und Zusammenhänge in Datensätzen zu erkennen.¹

Stichproben, Begriffsdefinitionen

Zunächst gilt es zu verstehen, in welchem Umfeld die Daten erhoben wurden. Dazu unterscheidet man grundlegend zwischen der Grundgesamtheit und einzelner Stichproben:

Abb. 1: Abgrenzung Grundgesamtheit und Stichprobe

Skalen und Merkmalstypen

Merkmale können auf vier verschiedene Arten abgegrenzt werden:

Excel Cheatsheet

Einfache statistische Auswertungen von Datensätzen müssen nicht unbedingt mit Statistikprogrammen wie SPSS berechnet werden. Für viele Anwendungen genügt Excel. Die folgende Übersicht soll Ihnen eine Hilfestellung bei der Verwendung von Excel-Formeln geben:

Addieren:	`=Zahl1+Zahl2+…`
Subtrahieren:	`=Zahl1-Zahl2-…`
Multiplizieren:	`=Zahl1Zahl2…`
Dividieren:	`=Zahl1/Zahl2`
Potenzieren:	`=Zahl1^Zahl2`
Mittelwert:	`=MITTELWERT(Start:Ende)`
Minimum:	`=MIN(Start:Ende)`
Maximum:	`=MAX(Start:Ende)`
Summe:	`=SUMME(Start:Ende)`
Standardabweichung:	`=STABW.N(Start:Ende)`
Korrelation:	`=KORREL(Matrix1;Matrix2)`
T-Test:	`=T.TEST(Matrix1;Matrix2;Seiten;Typ)`
R²-Bestimmtheitsmaß:	`=BESTIMMTHEITSMASS(Y_Werte,X_Werte)`

Übungsaufgabe

Theoretische Einführung, Begriffsdefinitionen
Lösung

A1) Was ist der Unterschied zwischen einer Population und einer Stichprobe?

A2) Wieso betrachten wir in Statistiken häufig nur Stichproben?

A3) Welche Eigenschaften sollten Stichproben bei der Erstellung von Statistiken aufweisen?

A1) Die Grundgesamtheit (auch Population) ist die gesamte Anzahl an Objekten, über die du Schlüsse ziehen möchtest. Die Stichprobe ist eine Teilmenge der Grundgesamtheit. Der Unterschied zwischen Stichprobe und Grundgesamtheit besteht darin, dass die Grundgesamtheit alle Objekte umfasst, über die du Erkenntnisse gewinnen willst. Die Stichprobe ist hingegen der Teil der Grundgesamtheit, den du untersuchst, um Schlüsse zu ziehen.

A2) Häufig ist es schlichtweg nicht möglich die gesamte Grundgesamtheit (Population) zu testen, da diese zu groß ist. Dies würde einen erheblichen Zeit- und Kostenaufwand mit sich bringen, welcher oftmals gar nicht notwendig ist. In Ausnahmefällen kann es allerdings notwendig sein, eine Erhebung mit der kompletten Grundgesamtheit durchzuführen. In diesem Fall spricht man von einer Vollerhebung.

A3) Die Stichprobe muss zufällig aus der Grundgesamtheit entnommen worden sein, sie muss groß genug sein. Die Stichprobe muss repräsentativ und objektiv sein und darf möglichst wenige Verzerrungen beinhalten

Migräne und Akupunktur
Lösung

Migräne ist eine besonders schmerzhafte Form von Kopfschmerzen, die Patienten mit Akupunktur zu behandeln versuchen. Um festzustellen, ob Akupunktur Migräneschmerzen lindert, führten Forscher eine randomisierte kontrollierte Studie durch, bei der 89 Frauen mit Migränekopfschmerzen nach dem Zufallsprinzip einer von zwei Gruppen zugeteilt wurden:

Treatment group: 43 Patienten in der Behandlungsgruppe erhielten Akupunktur, die speziell für die Behandlung von Migräne entwickelt wurde.
Control group: 46 Patienten in der Kontrollgruppe erhielten eine Placebo-Akupunktur (Einstechen von Nadeln an Stellen, die nicht zu den Akupunkturpunkten gehören).

24 Stunden nachdem die Patienten die Akupunktur erhielten, wurden sie gefragt, ob sie schmerzfrei waren. Die Ergebnisse sind in der folgenden Kontingenztabelle zusammengefasst:

	Pain free
	Yes	No	Total
Treatment	10	33	43
Control	2	44	46
Total	12	77	89

A1) Wie viel Prozent der Patienten in der Behandlungsgruppe (treatment group) waren nach 24 Stunden schmerzfrei, nachdem Sie Akupunktur erhalten haben?

A2) Wie viel Prozent der Patienten in der Kontrollgruppe wurden schmerzfrei?

A3) Ihre bisherigen Erkenntnisse könnten darauf hindeuten, dass Akupunktur für alle Menschen, die unter Migräne leiden, eine wirksame Behandlung ist. Dies ist jedoch nicht die einzige mögliche Schlussfolgerung, die sich aus die sich aus Ihren bisherigen Erkenntnissen ergibt. Was ist eine weitere mögliche Erklärung für die beobachteten Unterschiede zwischen dem Prozentsatz der Patienten, die 24 Stunden nach der Akupunkturbehandlung in den beiden Gruppen schmerzfrei sind?

Quelle: Open Intro to statistics (2015). Seite 11

A1) 10 Personen waren nach der Behandlung schmerzfrei und 43 Personen wurden insgesamt behandelt.

\frac{10}{43}=0,23\underline{\underline{=23\%}}

A2) 2 Personen der Kontrollgruppe wurden schmerzfrei und insgesamt befanden sich 46 Personen in der Kontrollgruppe.

\frac{2}{46}=0,04\underline{\underline{=4\%}}

A3) Es lässt sich generell zwar festhalten, dass mehr Patienten, welche solch eine Behandlung erhielten, auch schmerzfrei waren, allerdings könnte dies auch folgende Gründe haben:

Zufall, da die Stichprobengröße eventuell zu klein war.
Vielleicht gab es allerdings auch eine Beeinflussung eines Mediators, welcher sich auf die Ergebnisse auswirkte. Beispielsweise könnten andere Vorerkrankungen das Ergebnis manipuliert haben.

Quellen

¹Cramer, Erhard & Kamps, Udo. (2020). Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Eine Einführung für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. 10.1007/978-3-662-60552-3 .

Searching in

Stichproben, Begriffsdefinitionen

Skalen und Merkmalstypen

Excel Cheatsheet

Übungsaufgabe

Quellen