Lineare Regression – online lernen

Du möchtest erfolgreich Mathe lernen, aber bitte mit Spaß? Egal, welches Thema, welche Klasse oder Schulform: Wir haben die besten Erklärungen zu allen Mathethemen!

Beschreibende Statistik — Lineare Regression & Korrelation

Mit Hilfe der linearen Regression und der Korrelation wirst du lernen, wie man gewissen Voraussagen treffen kann, was statistische Werte angeht. Das wird dir bei vielen Aufgaben sehr weiterhelfen..

Wiki zum Thema Beschreibende Statistik — Lineare Regression & Korrelation

Korrelation

Die Korrelation (von lat. correlatio für „Wechselbeziehung“) beschreibt den Zusammenhang zwischen zwei oder mehreren Ereignissen, Merkmalen etc.

Hierbei interessiert nicht nur, ob zwei oder mehrere Elemente eines Systems zusammenhängen, sondern auch wie stark dieser Zusammenhang ist.

Wichtig ist, zu verstehen, dass eine Korrelation nicht zwingend eine „Ursache& Wirkung“-Beziehung beschreibt.

Eine starke Korrelation bedeutet nicht zwangsläufig, dass das eine Element des betrachteten Systems das andere bedingt.

Eine starke Korrelation bedeutet nicht zwangsläufig, dass das eine Element des betrachteten Systems das andere bedingt.

Beispiel 1) Im Winter werden mehr Heißgetränke (Tee, Kakao, Kaffee) konsumiert als im Sommer. Außerdem treten im Winter mehr Erkältungen auf.

  • Gibt es eine Korrelation zwischen dem erhöhten Konsum von Heißgetränken und der erhöhten Anzahl an Erkältungen?
  • Liegt eine „Ursache&Wirkung“-Beziehung vor?
Korrelation 1
Abbildung1. - Thema: Korrelation.

Bemerkung: Die Messgrößen (Heißgetränkkonsum und Erkältung) hängen hier über eine dritte Größe kausal zusammen, und zwar über die kälteren Temperaturen im Winter, welche sowohl den Konsum von Heißgetränken anregt, als auch Erkältungen begünstigt.

Wichtig: Das wohl bekannteste Maß, mit dem man solche Zusammenhänge misst, ist der Korrelationskoeffizient (von Bravais-Pearson). Diesen zu berechnen, erfordert allerdings Methoden der höheren Statistik und ist nicht Gegenstand des Schulunterrichts.

Jetzt gratis registrieren und 7 Tage unbegrenzten Zugang genießen

Lineare Regression

Unter linearer Regression versteht man ein mathematisches Verfahren, um eine Gerade möglichst genau an gegebene Messwerte anzupassen. Ein genaues Verfahren soll hier nicht Thema sein, da man dafür Methoden der höheren Mathematik benötigen würde. Ein anschauliches Beispiel soll aber gegeben werden.

Beispiel 1) Wie könnte eine Regressionsgerade zu den Punkten A(2 j 1), B(2;5 j 2) und C(4;5 j 2) aussehen?

Lineare Regression 1
Abbildung1. - Thema: Lineare Regression.

Wenn man möchte, kann man nun ein Maß für die Qualität dieser Gerade finden. Dazu geht man wie folgt vor:

  • Für jeden gegebenen x-Wert berechnen wir mit Hilfe der Geradengleichung einen y-Wert.
  • Für jeden gegebenen Punkt wird die Differenz des gegebenen y-Wertes mit dem berechneten y-Wert bestimmt.
  • Um negative Differenzen nutzbar zu machen und den einzelnenWerten mehr Gewichtung zu geben, werden die Differenzen quadriert.
  • Die quadratischen Abweichungen werden nun aufaddiert. Je kleiner der Wert, desto besser die Regressionsgerade.

n diesem Beispiel wäre die Summe der quadratischen Abweichungen 0;36 + 0;0625 + 0;1225 = 0;545. Kein schlechter Wert, aber es geht noch besser. Die ideale Regressionsgerade würde lauten: y = 0;29x + 0;81. Diese zu bestimmen, ist mit Mitteln der Schulmathematik jedoch nicht möglich.

Jetzt gratis registrieren und 7 Tage unbegrenzten Zugang genießen

Mittlere Lineare Abweichung

Die mittlere lineare Abweichung e gibt an, wie sehr die einzelnen Datenwerte vom Mittelwert abweichen. Sie ermöglicht es, verschiedene Stichproben miteinander zu vergleichen.

Um die mittlere lineare Abweichung zu bestimmen, muss man folgendermaßen vorgehen:

  • Man bestimmt das arithmetische Mittel (den Mittelwert) der Daten.
  • Man berechnet für jeden Datenwert den Betrag der Differenz zum Mittelwert. (Betrag bedeutet, dass man bei negativen Ergebnissen das Minus weglässt.)
  • Man bestimmt das arithmetische Mittel dieser Beträge. Das Ergebnis ist die gesuchte mittlere lineare Abweichung.

Es dabei ist sinnvoll, sich die Daten in einer Tabelle anzuordnen.

Als Beispiel dient die Datengruppe 2, 4, 6, 6, 8, 16.

Zusatzinfo:     als Formel fasst man die mittlere lineare Abweichung mit Hilfe des Summenzeichens Σ zusammen. Die einzelnen Dateinwerte heißen xi. Für n Datenwerte lautet sie dann:

Jetzt gratis registrieren und 7 Tage unbegrenzten Zugang genießen

Mittlere Quadratischer Abweichung

Die mittlere quadratische Abweichung gibt an, wie weit die einzelnen Datenwerte vom Mittelwert abweichen. Man nennt sie auch Varianz V. Die Varianz ermöglicht es, verschiedene Stichproben miteinander zu vergleichen.

Um die Varianz zu bestimmen, muss man folgendermaßen vorgehen:

  • Man bestimmt das arithmetische Mittel (den Mittelwert) der Daten.
  • Man berechnet für jeden Datenwert die Differenz zum Mittelwert.
  • Man rechnet jede dieser Differenzen zum Quadrat.
  • Man bestimmt das arithmetische Mittel dieser Quadrate. Das Ergebnis ist die gesuchte Varianz.

Es dabei ist sinnvoll, sich die Daten in einer Tabelle anzuordnen.

Als Beispiel dient die Datengruppe 2, 4, 6, 6, 8, 16.

Zusatzinformation:    Als Formel fasst man die Varianz mit Hilfe des Summenzeichens Σ zusammen. Die einzelnen Dateinwerte heißen xi . Für n Datenwerte lautet sie dann:

Jetzt gratis registrieren und 7 Tage unbegrenzten Zugang genießen

Der Satz von Bayes

Vorbemerkung: Vorab sollte das Wiki zum Satz der totalen Wahrscheinlichkeit gelesen und nachvollzogen werden.

Theorem: ( Satz von Bayes ) Sei Ω ein Ergebnisraum und seien B1,B2,....,Bi eine Zerlegung von (d.h. die B's sind Teilmengen von Ω, die vereinigt insgesamt wieder Ω ergeben) und dann gilt für jedes Ereignis A mit P(A) > 0 und jedes Bi aus der Zerlegung:

Da der Satz von Bayes und der Satz der totalen Wahrscheinlichkeit die gleichen Voraussetzungen haben, kann auf den Ausdruck im Nenner der Satz der totalen Wahrscheinlichkeit angewendet werden. Der Term im Nenner ist genau derjenige, den der Satz der totalen Wahrscheinlichkeit als P(A) bezeichnet, also folgt:

Wir sehen also, dass zur erfolgreichen Anwendung des Satzes von Bayes zunächst der Satz der totalen Wahrscheinlichkeit benötigt wird.

Beispiel 1) Ausgehend von den gleichen Urnen und den gleichen Ereignissen wie im Beispiel zum Satz der totalen Wahrscheinlichkeit:

  • Es wurde eine schwarze Kugel gezogen. Mit welcherWahrscheinlichkeit stammt sie aus Urne Uj?
Jetzt gratis registrieren und 7 Tage unbegrenzten Zugang genießen

Aufgabenblätter zum Thema Beschreibende Statistik — Lineare Regression & Korrelation

Die Übungsaufgaben sind nur für registrierte Nutzer uneingeschränkt nutzbar.
Jetzt gratis registrieren
  1. Aufgabenblatt Schwierigkeitsgrad 1

  2. Aufgabenblatt Schwierigkeitsgrad 1

  3. Aufgabenblatt Schwierigkeitsgrad 2

  4. Aufgabenblatt Schwierigkeitsgrad 2

  5. Aufgabenblatt Schwierigkeitsgrad 3

  6. Aufgabenblatt Schwierigkeitsgrad 3

Lineare Regression – Wir machen euch fit für die nächsten Prüfungen. Behandelt werden Themen, die für jeden von Interesse sind. Schulische Erfolge erreichen.