Mathematik III
Wahrscheinlichkeitsrechnung
Mitte
des 17. Jh. Chevalier de Mèrè,
Blaise Pascal
Spiel mit 3 Würfeln Augensumme 11
öfter als Augensumme 12
Auffassung, daß Ereignisse "11" oder "12" gleichwahrscheinlich sind
Überlegung: 6 Möglichkeiten, eine
11 zu würfeln
|
|
|
|
|
|
aber auch 6 Möglichkeiten für die 12:
|
|
|
|
|
|
Briefwechsel zwischen Pascal und Fermat: Anfang
der Wahrscheinlichkeitstheorie
Moderne
Theorie
Stochastik
Wahrscheinlichkeitstheorie und Statistik
seit Anfang dieses Jahrhunderts: Anstrengungen zur Formalisierung
Beispiel: Münzwurf
deterministischer Vorgang, Aufgrund unscharfer Anfangsbedingungen
ist Ergebnis nicht exakt vorhersagbar. Zwei einander ausschließende Ergebnisse: Kopf oder Zahl. Jedes Ergebnis ist gleichberechtigt Kopf oder Zahl treten jeweils mit Wahrscheinlichkeit ½ auf.
Fazit: Experiment, Versuch mit ungewissem Ausgang, zumindest prinzipiell
oder gedanklich unter gleichen Versuchsbedingungen beliebig oft
wiederholbar. Beobachtung: Bei unabhängiger Wiederholung
derartiger Versuche sind Gesetzmäßigkeiten erkennbar.
Spezialfall: Alle endlich vielen Versuchsausgänge schließen einander aus und
sind gleichberechtigt. Versuch wird "auf gut Glück" durchgeführt.
Unter diesen Voraussetzungen sei A ein Ereignis, das aus verschiedenen Versuchsausgängen zusammengesetzt sein kann.
Wahrscheinlichkeit (von Laplace)
Anzahl der für A günstigen Fälle
P(A) =
Anzahl aller möglichen Fälle
Beispiel: Münze
Spielwürfel - 6 Ausgänge, A = "6", A = "gerade Zahl"
zwei Spielwürfel - 36 Ausgänge, A = "gleiche Augenzahl"
Praxis: lange Beobachtungsreihe: mehrmalige unabhängige Durchführung
ein und desselben Experiments, Ereignis A det. Bei n Versuchen trete n(A) - mal das Ereignis A ein. Dann zeigt sich, daß die relative Häufigkeit
n(A)
(n = 1, 2, 3, )
n
für wachsendes n stabil ist. Sie schwankt mehr oder weniger um einen gewissen Wert, nämlich die Wahrscheinlichkeit P(A).
statistischer Wahrscheinlichkeitsbegriff, begründet Kontakt der (noch zu entwickelnden) Theorie mit der Realität
Problem beim Laplace'schen Wahrscheinlichkeitsbegriff: gleichwahrscheinliche Ereignisse finden, mit deren Hilfe das interessierende Ereignis zusammengesetzt werden kann.
K Mengen A1, A2, , Ak'
vom Umfang n1, n2, , nk Elemente
Kombination von Elementen bilden (a1, a2, , ak) mit ai I Ai
Wie viele solcher Kombinationen sind möglich ?
Fundamentalprinzip der Kombinatorik:
Anzahl verschiedener geordneter k-Tupel N = n1 · n2 · · nk
Beispiel: Wie groß ist die Wahrscheinlichkeit für das Ereignis A, beim Spielen
mit 3 Würfeln die maximale Augenzahl zu erreichen ?
Ai (i = 1, 2, 3) gleich, sechselementig
N = 63 Möglichkeiten
1 günstig P(A) = 1/216
geordnete
Probe mit Wiederholung
Elemente können mehrfach berücksichtigt werden, "Auswahl mit Zurücklegen". Eine
Menge A mit n Elementen, k Elemente wählen
Zurückführung auf Fundamentalprinzip:
A1 = A2 = = Ak = A N = nk
geordnete
Probe ohne Wiederholung
Eine Menge A mit n Elementen, k
n Elemente wählen, dabei Zurücklegen verboten
Zurückführung auf Fundamentalprinzip:
A1 = A Element
a1 wählen n Elemente
A2 = A Element
a2 wählen n - 1 Elemente
A2 = A Element a3 wählen n - 2 Elemente
Ak = A Element ak wählen n - k + 1 Elemente
n!
N = n (n - 1)(n - 2) (n - k + 1) =
(n - k) !
Noch spezieller:
k = n setzen Anzahl der Permutationen von n Elementen ohne Wiederholung
N = n!
Beispiel: Gruppe von k Studenten sitzt in einem Zug mit n k Wagen. Jeder
Student habe seinen Wagen unabhängig und "auf gut Glück" gewählt. Gesucht ist die Wahrscheinlichkeit, daß alle Studenten in verschiedenen Wagen sitzen.
Zunächst alle Möglichkeiten:
k Studenten auf n Wagen aufteilen, Problem mit Wiederholung und mit Berücksichtigung der Reihenfolge insgesamt N = nk Möglichkeiten, Studenten auf die Wagen aufzuteilen.
Ereignis A: "höchstens ein Student pro Wagen"
für A günstige Fälle: Wiederholung verboten, Zahl der Kombinationen (mit Berücksichtigung der Reihenfolge, ohne Wiederholung)
N(A) =
Jetzt die Berücksichtigung der Reihenfolge aufgeben.
Menge A vom Umfang n, k-elementige Teilmengen bilden. Also ohne Rücklegen, ohne Wiederholung. Gesuchte Anzahl: N
Wir bekommen alle möglichen geordneten Proben aus A vom Umfang k ohne Wiederholung und jede nur einmal, indem wir zunächst eine beliebige k-elementige Teilmenge von A wählen und dann alle ihre Permutationen bilden.
Nach dem Fundamentalprinzip ergibt sich:
Teilmengen · Permutation = Proben (m. R., o. W.)
k-elementig
Zerlegung der Menge A in Teilmengen B1, B2, , Bs vom
Umfang k1, k2, , bzw. ks
k1 + k2 + + ks = n
Permutation mit Wiederholung
Beispiel: Qualitätskontrolle, Los von 100 Teilen, 10 wurden "auf gut Glück"
gewählt und kontrolliert. Falls kein Ausschuß, Annahme des Loses. Gesucht ist die Wahrscheinlichkeit des Ereignisses A, daß ein Los mit 100 Ausschußteilen nicht beanstandet wird ?
Anzahl
der Möglichkeiten 10 Teile aus 100 zu wählen, Kombinationen ohne
Berücksichtigung der Reihenfolge, ohne Wiederholung
Anzahl
der für das Ereignis A günstigen Fälle: 90 gute Teile, davon
10 heraus greifen
Noch offen: Aus n Elementen k herauszugreifen, mit Wiederholung (zurücklegen
erlaubt), ohne Berücksichtigung der Reihenfolge.
Anzahl der möglichen Kombinationen
Beispiel: Auf wieviele Weisen lassen sich k Markstücke auf n Personen aufteilen
A Menge von n Personen, numerieren
Problem: ohne Berücksichtigung der Reihenfolge, mit Wiederholung
Dies gibt Anlaß zu alternativen Interpretationen von Kombinationen:
Gegeben sind n Zellen, auf die k Teilchen aufgeteilt werden sollen.
Teilchen
sind unterscheidbar oder nicht
Problem mit oder ohne Berücksichtigung der Reihenfolge
Mehrfachbelegung
einer Zelle möglich oder nicht
Problem mit oder ohne Wiederholung
Beispiel: Es sind n unterschiedliche Dinge auf N Schubfächer zu verteilen. Jede
Möglichkeit der Verteilung sei gleich wahrscheinlich. Mit welcher Wahrscheinlichkeit gelangen bei der Verteilung in ein Schubfach k Dinge ?
Jedes Ding läßt sich in eines der N Schubfächer legen, N Möglichkeiten ein Ding zu verteilen.
Fundamentalprinzip
Anzahl aller Möglichkeiten bei der Verteilung ist Nn
Anzahl der günstigen Fälle:
k von n Dingen auf ein Schubfach verteilen (ohne Wiederholung, ohne Berücksichtigung der Reihenfolge)
die übrigen n - k Dinge in N - 1 Schubfächer (egal wie) verteilen
(N - 1)n -k
Proben vom Umfang k |
ohne Berücksichtigung der Reihenfolge |
mit Berücksichtigung der Reihenfolge |
|
ohne Wiederholung |
|
|
keine Mehrfachbelegung |
mit Wiederholung |
|
nk |
mit Mehrfachbelegung |
|
Teilchen sind nicht unterscheidbar |
Teilchen sind unterscheidbar |
Verteilung von k Teilchen auf n Zellen |
nächster Schritt zur Formalisierung des Wahrscheinlichkeitsbegriffes, durch Identifizierung zufälliger Ereignisse mit Mengen
Zufälliger Versuch habe Ausgang w : Realisierung, Stichprobe oder Elementarereignis
Elementarereignis: alle Elementarereignisse (alle Versuchsausgänge) in einer
Menge W zusammenfassen: Raum aller Elementarereignisse. (gewisse) Teilmengen von W bilden dann die zufälligen Ereignisse, W und seien Ereignisse.
Beispiel: Würfelexperiment
W
Ereignis A: "gerade Zahl würfeln"
A = W
W das "sichere Ereignis " tritt stets ein
das "unmögliche Ereignis" tritt niemals ein
Das Eintreten des Elementarereignisses w hat alle Ereignisse A mit w I A zur Folge. Die Ereignisse A sind Teilmengen des Raumes der Elementarereignisse
w I A W
Damit ist eine sichere Basis für alle näheren Betrachtungen gelegt.
Raum der Elementarereignisse entsprechend den Regeln der Mengenlehre strukturieren.
Definition: Das Ereignis A aus W, ziehe das Ereignis B aus W nach sich, A B,
falls w I A T w I B
Stets gilt: A , A W
Definition: Zieht A W das Ereignis B W sowie B das Ereignis A nach sich, so
heißen die Ereignisse A und B gleich.
A = B A B B A
Definition: Die Summe (Vereinigung) A B der Ereignisse A, B W, tritt genau
dann ein, wenn wenigstens eines der Ereignisse A oder B eintritt.
w I A B w I A w I B
Stets gilt: A = A A A B
A A = A B A B
A W W
Kommutativität: A B = B A
Assoziativität: A (B C) = (A B) C
Allgemein: endliche Summe von Ereignissen
(Ai)
i = 1, 2, Folge von Ereignissen, Ai W. Dann bedeutet
Definition: Das Produkt (der Durchschnitt) A B der Ereignisse A, B I W tritt
genau dann ein, wenn sowohl A als auch B eintreten.
w I A B w I A w I B
Stets gilt: A A B A
A A = A A B B
A W = A
Außerdem gilt das Kommutativ- und das Assoziativgesetz bezüglich
Allgemein: endliches Produkt von Ereignissen
Ai W
Definition: Das zu A W komplementäre Ereignis
nicht eintritt. Es gilt
,
d.h. A und
Definition: Sind A und B zufällige Ereignisse, so bezeichnen wir das Ereignis das
genau dann eintritt, wenn A aber nicht B entritt, mit A B.
Es gilt: A B = A
Bemerkung: Aufgrund der von uns gewählten Konstruktion gelten für Ereignisse
grundsätzlich die Regeln der Mengenlehre, etwa die Distributivgesetze:
A (B C) = (A B) (B C)
A (B C) = (A B) (B C)
oder die DeMorgan'sche Regel:
Beispiel: 4 Geräte seien in der folgenden Weise geschaltet:
Ai bezeichne das zufällige Ereignis: "Das Gerät i fällt aus"
(i = 1, 2, 3, 4)
Ereignis A: "Das System fällt aus"
Ereignis B: "Das System fällt nicht aus"
Definition: Eine Menge M zufälliger Ereignisse heißt Ereignisalgebra, wenn gilt:
E1: W I M
E2: A I M , B I M A B I M ( M ist -stabil)
E3: A I M
Enthält M unendlich viele Elemente, so habe M überdies die
Eigenschaft
E4 : Ai I M (i
= 1, 2, )
In diesem Fall ist M eine s-Algebra.
Folgerungen: Eine Ereignisalgebra besitzt die Eigenschaften:
I M
A, B I M A B I M, A B I M M ist -stabil)
Ai
I M (i
= 1, 2, )
Beispiel: 1. W gegeben, sowie A W ; A W ; A
Ereignisalgebra M mit A I M konstruieren
M
2. Kleinste Algebra: M =
3. Größte Algebra: M = A W) (Potenzm. aller Teilmeng.)
Sei W = endlich mit N Elementen. Wieviele Elemente enthält dann die Potenzmenge?
Mengen A W konstruieren: Mengenbildungsprinzip
wi I A oder wi A
Also N "Teilchen" auf zwei Zellen aufteilen.
A W) enthält 2N Elemente.
Beispiel: Spiel mit zwei Würfeln: 6 · 6 = 36 Elementarereignisse
W
A W) enthält 236 = 68.719.476.736 Elemente
A W) enthält qualitativ mehr Elemente als W
W abzählbar W
A W) überabzählbar
In diesem Falle lassen sich "gerade noch" Wahrscheinlichkeiten auf
allen Ereignissen A A W) definieren. Bei überabzählbaren W
z.B. W = R1 gilt das nicht mehr.
Borel-Mengen
Sei W = R1 die reelle Achse. Nach dem Ereignis (x I R) zu fragen ist oft nicht sinnvoll, dagegen nach sehr.
spezielle Teilmengen von W betrachten:
A = (a, b] ; - < a < b <
Bilden diese Mengen eine Algebra ?
(a, b]
(b, c] = (a, c] ,
Wir müssen Menge hinzunehmen.
Definition: Sei W = R1. Mit L 1 bezeichnen wir die kleinste s-Algebra (Existenz
gesichert), die alle betroffenen Intervalle (a, b], - < a < b < enthält.
L 1 heißt s-Algebra der Borel-Mengen in R1. Mittels geeigneter Parallelepipede (Rechteck, Quader, ) definiert man die s-Algebra L n der Borel-Mengen im Rn.
Im folgenden setzen wir nun stets voraus, daß der jeweils betrachtete Raum der Elementarereignisse W durch eine geeignete Ereignisalgebra strukturiert sei. Nur die Elemente A I M wollen wir künftig als Ereignisse zulassen.
Definition: Es sei W ein Elementarereignisraum versehen mit der Ereignisalgebra
M. Zwei Ereignisse A, B I M heißen unvereinbar oder disjunkt, falls ihr gemeinsames Eintreten unmöglich ist.
A B =
Die Ereignisse A und B schließen einander aus.
Beispiel: 1 Würfel
Ereignis A = "ungerade Zahl würfeln"
Ereignis B = "eine Zahl größer 5 würfeln"
Definition: Eine Menge nicht unmöglich zufälliger Ereignisse ,
A I M ) heißt vollständiges Ereignissystem wenn gilt:
V1: Ai (i = 1, 2, ) paarweise unvereinbar
Ai Ak = (i k)
V2: Vollständigkeit
A1 A2 An W
Vollständiges Ereignissystem zerlegt den Raum W
Nächstes Ziel ist die Weiterentwicklung des Wahrscheinlichkeitsbegriffes.
Spezialisierung: Raum der Elementarereignisse sei höchstens abzählbar:
W = oder W
Ereignisalgebra M enthalte alle einpunktigen Ereignisse Ai = I M (i = 1, 2, ).
bildet also vollständiges Ereignissystem.
Für alle A I M Wahrscheinlichkeit P(A) definieren:
A P(A) , A I M
Zuerst Funktion P : M [0, 1] auf dem vollständigen Ereignissystem definieren:
Ai P(Ai) = P() = pi i = 1, 2,
Dabei muß für die Folge
Für ein beliebiges Ereignis A I M setzen wir P(A) :=
Beispiel: W = Menge der natürlichen Zahlen.
l > 0 feste reelle Zahl
pk > 0
Eigenschaften der Wahrscheinlichkeit P:
P(A) 1 ,
mit P(A) =
P(W)
=
P( ) = 1 - P(W
Additionstheorem: A und B unvereinbar P(A
B) = P(A) + P(B)
Verallgemeinerung: Ai , i = 1, 2,
höchstens abzählbar viele paarweise unvereinbare Ereignisse
Ai Ak = ( i
k ; i, k = 1, 2, )
Unvereinbarkeit fallen
lassen: A, B I M beliebig
P(A B) = P(A) + P(B) - P(A
B)
Isotonie der
Wahrscheinlichkeit:
A B P(A)
P(B)
Zufällige Experimente mit überabzählbar vielen Ausgängen können mit elementaren Methoden behandelt werden.
Beispiel: Eine Dame verspricht, zwischen 17.00 und 18.00 Uhr zu einem
Rendezvous zu erscheinen, nähere Angaben macht sie nicht.
Wahrscheinlichkeit für das Ereignis, daß sie zwischen 17.03 und 17.23 Uhr eintrifft ist gesucht.
Anschauung und Intuition: |
|
Abstraktion: "Inhalt" der Menge A =
"Inhalt" der Menge W
Beispiel: Glücksrad mit Zeiger; zufälliger Versuch: Rad drehen, wo bleibt Zeiger
stehen, jede Zeigerstellung gleichberechtigt.
|
für Ereignis A günstige Zeigerstellungen identifizieren A =
|
Beispiel: Zwei Personen vereinbaren, sich zwischen 12 und 13 an einem
bestimmten Ort zu treffen. Jeder wartet auf den anderen nötigenfalls 15 Minuten, danach geht er. Wie groß ist die Wahrscheinlichkeit für ein Treffen ?
|
Punkt (x, y) repräsentiert Ankunftszeiten für beide Personen I und II. W A =
|
P(A) =
Allgemeines Modell: Versuch lasse sich als zufälliges Werfen eines Punktes in
einem beschränktem Grundbereich W des n-dimensionalen euklidischen Raumes zu interpretieren. Dabei gelte:
Der geworfene Punkt kann auf jeden beliebigen Punkt w I W fallen
Inhaltsgleiche Teilmengen von W ( = Ereignisse) haben die gleiche Wahrscheinlichkeit
Das sichere Ereignis entspricht dem Grundbereich W
Dann berechnet sich die Wahrscheinlichkeit des Ereignisses
A W nach der Formel:
Bemerkungen: Wahrscheinlichkeit eines Ereignisses ist also unabhängig
von der speziellen Lage und Gestalt in W
Die Analogie zum klassischen Laplace'schen Wahrscheinlichkeitsbegriff ist offensichtlich.
Die derartig definierte geometrische Wahrscheinlichkeit hat viel Anlaß zu Mißverständnissen und Einwänden gegeben. Grund: Paradoxon von Bertrand.
Aufgabe: In einem Kreis wird zufällig eine Sehne gezogen. Wie groß ist
die Wahrscheinlichkeit dafür, daß deren Länge die Seite eines im Kreis einbeschriebenen gleichseitigen Dreiecks übertrifft ?
1. Auffassung:
Aus Symmetriegründen o.B.d.A. Richtung der Sehne festhalten. Dann senkrecht
Durchmesser des Kreises betrachten.
|
Wann gilt s > l ? Mittelpunkt M der Sehne zwischen
|
2. Auffassung:
Spitzen des gleichseitigen Dreiecks in einem Endpunkt der Sehne, Winkel der
Sehne mit Tangente.
|
günstiger Bereich:
|
3. Auffassung:
Mittelpunkt M der Sehne zufällig im Kreisinnern wählen. Außerdem muß Abstand M
zu 0 kleiner als
|
|
Lösung der Aufgabe offenbar von Lösungsweg abhängig.
Auflösung des Paradoxon: Es wurden jeweils verschiedene Aufgaben formuliert.
"zufällig" bedeutet hier, den Punkt M "auf gut Glück" auf (0, 2r) zu wählen Winkel x
"auf gut Glück" in Punkt "auf gut Glück" in der inneren Kreisfläche wählen damit ganz verschiedene Zufallsmechanismen vorausgesetzt unterschiedliche Lösungen |
|
Gegeben: Wahrscheinlichkeitsraum (W, M, P)
Modell für (realen) Bedingungskomplex eines zufälligen Experiments Ereignis B I M, P(B) > 0
zusätzliche Hypothese: "Das Ereignis B tritt ein"
Durch Hinzunahme dieser Hypothese wird der Bedingungskomlex geändert. Folglich werden sich i.a. auch die Wahrscheinlichkeiten der Ereignisse A I M ändern.
Definition: Unter den obigen Voraussetzungen heißt:
die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B.
Beispiel: Maschinensystem in Reihe
|
Wahrscheinlichkeit für Ursache eines Ausfalls des Systems bei: Maschine I: p Maschine II: q Maschine III: 1 - (p + q) |
System sei ausgefallen, bereits vergeblich nach einem Fehler in Maschine I gesucht. Wie ist die Wahrscheinlichkeit dafür, daß dann die Ursache in Maschine II liegt?
Ereignis A: "Ursache des Ausfalls liegt genau an Maschine II"
Ereignis B: "Ursache des Ausfalls liegt nicht an Maschine II"
Gesucht: P(A | B)
Es gilt hier A B, sowie P(A) = q
P(B) = 1 - P(A) = 1 - p und weiter
P(A | B) =
Eigenschaften der bedingten Wahrscheinlichkeit
P(A | B)
B unvereinbar P(A | B) =
B
A
P(A | B) =
[X1]
| W) =
Die bedingte Wahrscheinlichkeit P(A | B) kann kleiner, größer oder gleich der unbedingten Wahrscheinlichkeit P(A) sein.
Beispiel: 1 Spielwürfel
B = "gerade Augenzahl" P(B) = ½
a) A
= "Augenzahl nicht größer als 3"
P(A) = ½
b) A
= "Augenzahl gleich 2, 3 oder 4"
P(A) = ½
c) A
= "Augenzahl gleich 1 oder 2"
P(A) =
Hypothese: B, P(B) > 0 festhalten
Funktion A PB (A) := P(A | B), A I M betrachten.
Bei festem B besitzt P(B) alle Eigenschaften einer Wahrscheinlichkeit; ist also eine neue Wahrscheinlichkeit auf M. - ohne Beweis -
A, B seien Ereignisse mit P(A) > 0, P(B) > 0 P(A B) = ?
Zuweilen P(A | B) oder P(B | A) bekannt oder leichter zu ermitteln. Definition der bedingten Wahrscheinlichkeit
Multiplikationssatz: Es seien A und B Ereignisse positiver Wahrscheinlichkeit.
Dann
gilt:
Folgerung:
Beispiel: 10 Bauelemente sind in einer Kiste, 4 davon sind defekt.
2 Elemente werden nacheinander "auf gut Glück" entnommen. Mit welcher Wahrscheinlichkeit sind beide Elemente intakt ? (Ereignis A)
Ai = "i-tes Element intakt" (i = 1, 2)
P(A1)
=
Verallgemeinerung: Es seien A1, A2, , An zufällige Ereignisse mit
Gegeben: Ereignis A, vollständiges Ereignissystem
Bi
paarweise disjunkt
Standpunkt: P(A) gesucht, P(A | Bi) dagegen bekannt.
Formel der totalen Wahrscheinlichkeit
|
|
Beweis:
Beispiel: "Ruin des Spielers"
Spieler nimmt an Spielrunden teil: Erraten des Resultats eines Münzwurfs. Es wird um eine Mark gespielt.
Münze erraten - richtig + 1 DM - falsch - 1 DM
Anfangskapital: x DM ; x = 0, 1, (0 = keine Spielrunde möglich)
Strategie des Spielers: Solange spielen, bis Summe a Mark erreicht ist (a x)
Problem: Mit welcher Wahrscheinlichkeit verliert der Spieler sein Kapital?
P(x) = Wahrscheinlichkeit, daß sich der Spieler mit
Anfangskapital von x DM ruiniert. (x = 0, 1, , a)
Ereignis B1 = "Spieler gewinnt in der ersten Runde" x x + 1
Ereignis B2 = "Spieler verliert in der ersten Runde" x x - 1
Ereignis A = "Der Spieler wird ruiniert"
B1,
B2 : vollständiges Ereignissystem:
P(A) nicht erkennbar, aber Beziehung für bedingte Wahrscheinlichkeiten.
|
|
Anwenden der Formel der totalen Wahrscheinlichkeit:
P(0) = 1, P(a) = 0
allgemeine Lösung der Differenzengleichung: P(x) = c1 + c2 · x
Einsetzen in die Randbedingungen:
1 = P(0) = c1 0 = p(a) = c1 (= 0) +
c2 · a
Lösung:
A, B seien Ereignisse mit P(A), P(B) > 0
möglicher Spezialfall: (*) P(A | B) = P(A)
Damit ist
Definition: Zufällige Ereignisse A und B heißen unabhängig, falls gilt:
Bemerkung: Voraussetzungen P(A), P(B) > 0 haben wir vernachlässigt. Hat
wenigstens eines der Ereignisse A oder B die Wahrscheinlichkeit Null, so sind A und B unabhängig.
Vergleich mit dem Multiplikationssatz:
A, B I M, P(A), P(B) > 0
Man
unterscheide die Begriffe "unabhängig" und "unvereinbar" für Ereignisse.
Unvereinbarkeit von A und B:
Folglich sind zwei unvereinbare
Ereignisse A, B positiver Wahrscheinlichkeit nicht
unabhängig:
Beispiel: "Skatblatt"
eine Karte "auf gut Glück" ziehen
Ereignis A1 = "Farbe ist Pik"
Ereignis A2 = "Karte ist Dame"
Sind A1 und A2 unabhängig?
Formal:
Es
gilt:
Ereignisse sind unabhängig
Bemerkung: Unabhängigkeit von A und B drückt aus, daß A und B
wahrscheinlichkeitstheoretisch
in dem Sinne keinen Einfluß aufeinander haben, daß die Information "B tritt
ein" - wenn sie überhaupt positive Wahrscheinlichkeit hat - nichts an der
Wahrscheinlichkeit von A ändert.
Satz: Sind die Ereignisse A und B unabhängig, so sind es auch die
Ereignisse
Beweis: Seien A und B unabhängige Ereignisse:
Es
genügt zu zeigen: Dann sind auch
Ereignis B disjunkt zerlegen:
Addivität:
Beispiel: zwei verschiedene Würfel werfen
Ereignis A = "Würfel 1 zeigt ungerade Augenzahl"
B = "Würfel 2 zeigt ungerade Augenzahl"
C = "Die Augensumme ist ungerade"
A und B
offenbar unabhängig
bedingte Wahrscheinlichkeiten:
A, C sowie B, C jeweils unabhängig
anders
ausgedrückt:
Ereignisse A, B ,C paarweise unabhängig.
Aber: P(C | A B) = 0 C nicht unabhängig von
es besteht hier offenbar Abhängigkeit "zu dritt" Definition
Definition: Die zufälligen Ereignisse A1, A2, , An heißen vollständig unabhängig,
wenn für beliebige k = 2, 3, , n und beliebige natürliche Zahlen i1, ik mit 1 i1 < i2 < < in n gilt:
Die zufälligen Ereignisse einer unendlichen Folge A1, A2, heißen vollständig abhängig, wenn für jedes natürliche n = 2, 3, die Ereignisse A1, , An vollständig sind.
Folgerung: Sind die Ereignisse A1, , An vollständig unabhängig, so sind sie es
auch paarweise.
Bemerkungen: Die Umkehrung obiger Folgerungen gilt nicht (siehe Beispiel).
Aus
der Beziehung
folgt i.a.
nicht
Beispiel:
P(D) - Inhalt von D (Länge)
Es gilt:
Aber:
Dies begründet die komplizierte Definition der vollständigen Unabhängigkeit.
Bayessche Formel:
Formel der totalen Wahrscheinlichkeit:
vollständiges Ereignissystem
Andere Fragestellung: Ereignis positiver Wahrscheinlichkeiten: P(A) > 0
bekannt: P(Bi), P(A | Bi) (i = 1, 2, , n)
gesucht: P(Bk | A) = ?
Satz: (Bayessche Formel)
Unter den obigen Voraussetzungen gilt:
Beweis: nach Definition der bedingten Wahrscheinlichkeit:
Voraussetzungen zur Anwendung der Formel der totalen Wahrscheinlichkeit für P(A) erfüllt.
Sprechweise: P(Bk) a priori Wahrscheinlichkeiten
P(Bk | A) a posteriori Wahrscheinlichkeiten
Physikalisches Analogon der Bayesschen Formel:
In n Gefäßen seien Lösungen ein und desselben Stoffes in unterschiedlichen Konzentrationen enthalten. Das Gesamtvolumen der Lösungen sei 1 Liter.
P(Bk) - Volumen der Lösungen im k-ten Gefäß (k = 1, 2, , n)
P(Bk
| A) =
Anteil der Gesamtstoffmengen im k-ten Gefäß.
Kolmogorov 1933
Vorgegeben:
M - System von
Teilmengen von
S1. W I
M
S2. A I M
S3. Ai I
M (i = 1, 2, ) T
P reellwertig auf M, P erfüllt die Axiome
W1. P(A) > 0
W2. P(
W3. An I
M (n = 1, 2, ) paarweise unvereinbar
Die Funktion P heißt Wahrscheinlichkeit
oder auch Wahrscheinlichkeitsmaß auf M. Das Trippel (
Bemerkung: Die nunmehr endgültige Fassung des Wahrscheinlichkeitsbegriffs
verallgemeinert unsere bisherigen Konstruktionen. Viele der im speziellen Fall gezeigten Eigenschaften sind allgemeingültig.
Eigenschaften: (Auswahl)
P( )
= 0
Beweis: P(W)
=
endliche Additivität
A, B unvereinbare Ereignisse
Beweis:
A1 = A, A2 = B, Ai =
(i = 3, 4, )
Beweis:
A I M
1 = P(W =
Monotonie
Beweis:
Ereignis B disjunkt zerlegen:
B =
Subaddivität
An, (n = 1, 2, ) Folge von
Ereignissen aus M T
Beweis:
Aus (An) eine Folge paarweiser disjunkter Ereignisse (Bn)
konstruieren:
B1 = A1, B2 = A2 A1, B3
= A3 (A1
A2), , Bn = An (A1
A2
An-1)
= An
Weiterhin gilt: Bk
Stetigkeit
a) isotone
Folge von Ereignissen
Limes der Mengenfolge:
Beweis:
Wieder die Glieder der Folge (An) disjunkt machen: B1 = A1, B2
= A2 B1, , Bn = An
|
|
Folge (Bn)
paarweise disjunkter Ereignisse,
b) antitone
Folge von Ereignissen
Beweis:
durch Übergang zu den komplementären Ereignissen:
Einführung: Bernoulli-Schema: (
zufälliges Ereignis A, P(A) = p, 0 < p < 1
Experiment wird n-mal unabhängig voneinander ausgeführt
A tritt ein:
"Erfolg",
Indikator
Folge
"unabhängiger" vom Zufall abhängiger
Größen
P(A)
Wertebereich: R Verteilung
0 1
Die Größe X zählt die Anzahl der Erfolge bei Durchführung von n Versuchen:
Welche Werte kann X annehmen ?
1 2 . . . n - 1 n
Mit welchen Wahrscheinlichkeiten ?
Verteilung auf
k-Erfolge
(*)
2 3 n - 1
Jede
konkrete Folge (*) hat die Wahrscheinlichkeit
Wieviele solcher Folgen gibt es ? * * * k-Erfolge
k-mal "Erfolg" auf n Plätze verteilen.
1 2 . . . n - 1 n
Kombinatorische
Standardaufgabe:
Verteilung von k Teilchen auf n Zellen
Teilchen nicht unterscheidbar
keine Mehrfachbelegungen
P =
Das ist die Verteilung der Anzahl der
Erfolge:
"Binominalverteilung mit den Parametern n und p"
Versuchsserie: "Bernoulli-Schema"
"unabhängige Verteilung ein- und desselben Versuches"
Bemerkung: die Größen
ausführlich:
Spätere Definition solcher Größen als "Zufallsgrößen".
Bewertung des Punktes k entsprechend der Binominalverteilung:
0 k n
Parameter der Lage der Verteilung
anderer Parameter: charakterisiert die Streuung der Verteilung
mittlere quadratische Abweichung
Mittelwert
Konstruktion X:
0 n
Was passiert bei wachsendem n ?
Trick: Größe Xn
zentrieren und normieren, d.h.
Dann gilt der Grenzwertsatz von de MOIRE-LAPLACE
praktische Bedeutung:
n groß, nicht Einzelwahrscheinlichkeiten
P, sondern P seien
interessant (a, b I R)
Uneigentliches Integral:
Integral interessiert, es gilt sogar
Funktion F vertafelt oder im Computer
Beispiel: Produktion von Glühlämpchen
Kartons
zu je 1000 Stück
Erfahrungstatsache: Ausschuß
im Mittel 3%
(vage) Erwartung,
pro Karton 30 Lämpchen defekt.
Realisierbare
Frage: Wahrscheinlichkeit dafür, daß 20 bis 40
Lämpchen defekt sind.
Modell: X (zufällige) Anzahl defekter Lämpchen in einem
"auf gut Glück" gewähltem Karton mit 1000 Lämpchen.
X ist binominalverteilt mit den Parametern n = 1000 und p = 0,03
Mittel: n · p = 1000 * 0.03 = 30
mittlere quadratische Abweichung:
n · p · q = 1000 * 0.03 * (1 - 0.03) = 29.1
gesuchte Wahrscheinlichkeit:
P=
zu kompliziert
Näherung
2. Das Integral F
besitzt eine Dichte:
F(x) + F(-x) = 1
F(x) - F(-x) = F(x) - (1-F(x) = 2F(x) - 1
Die Funktion definiert die Verteilung einer (stetigen) zufälligen Größe Y, die Werte aus ganz R annehmen kann, es gilt:
P = F(x), x I R
es gilt außerdem: P = F(b) - F(a) , a < b
Die Größe Y heißt normalverteilt, genauer
standard-normal-verteilt nach N(0, 1).
vorgegeben: Wahrscheinlichkeitsraum (W,
M, P)
Definition: Eine reellwertige Funktion X auf W w X(w w I W
heißt Zufallsgröße, falls für jede reelle Zahl x gilt:
I M (*)
W
X
w
X(w R
Urbild von (- , x)
Bemerkungen:
Den Regeln der s-Algebra
folgend sind dann auch Mengen der Gestalt:
=
Die Bedingung (*)
genannt "Meßbarkeit von X" ist technischer Natur; sie sichert, daß alle Mengen
, , Ereignisse sind, für die folgende
Wahrscheinlichkeiten gebildet werden können:
w: X(w)
< x}, P
üblicherweise schreibt
man kurz:
, und P, P ,
(M)
P
P
P(G
G X
GIM (M) G
(W, M, P) [ )
Px (R1, L1)
Mittels der Abbildung X wird in der s-Algebra L1 der Borel-Mengen von R1 das Bildmaß Px von P definiert:
Px(G) := P
Definition: Das Maß Px heißt Verteilung, auch Wahrscheinlichkeitsverteilung von
X auf (R1, L1).
Dieses Maß regelt, mit welcher Wahrscheinlichkeit die Zufallsgröße X bei einer Realisierung einen Wert aus einer gegebenen Borel-Menge annimmt:
Px([x1, x2)) = P
Wir unterscheiden 2 Spezialfälle:
Definition: Die Zufallsgröße X heißt diskret, wenn sie nur endlich oder abzählbar
unendlich viele Werte annehmen kann. Es gilt dann:
P = P
Beispiel: Binominalverteilte Zufallsgröße mit Parametern (n, p) nimmt
ausschließlich Werte in an.
Definition: Die Zufallsgröße X heißt stetig, wenn ihre
Wahrscheinlichkeitsverteilung eine Dichte p 0 besitzt, so daß
P =
Folgerung:
P
= P
=
P(x)
x x + Dx x
P = p(x) · Dx + o(Dx)
Beispiel: standardnormalverteilte Zufallsgröße X, andere Verteilung
konstruieren: Zufallsgröße X
Beispiel: X Zeit des Eintretens irgendeines Ereignisses;
(Lebensdauer, Zerfallszeit)
s
Zeit
0 t t + s
Angenommen Frage: ?
Zufallsgröße X sei "gedächtnislos", falls P = P (s, t 0) gilt.
Funktionalitätsgleichung: [Y(t + s) = Y(t) · Y(s)]
gesucht: beschränkte Lösung P = e-lt (t
Komplement bilden:
Zufallsgröße mit dieser Verteilung heißt expotentiell verteilt mit dem Parameter l > 0.
P
=
Zufallsgröße X hat eine Dichte:
Also: P =
Sei Xn binominalverteilte Zufallsgröße mit den Parametern n und p:
P =
Problem: p werde klein mittlere Zahl der Erfolge klein, läßt man simultan n
wachsen, dann ist der Mittelwert trotzdem bedeutend.
Ansatz: n · p = l l > 0 konstant.
Was passiert für n
k = konstant:
P =
Wegen
Definition: Eine Zufallsgröße X mit P =
POISSON-verteilt mit dem Parameter l > 0.
Modell: radioaktiver Zerfall
Radium Radon
a - Teilchen (He-Kern)
Im Zeitintervall der Länge t zerfällt das Radiumatom mit Wahrscheinlichkeit p(t).
n Radiumabnahme
Abstand sehr groß, Zerfall eines Kerns erfolgt unabhängig von allen anderen.
Mittlere Zahl der ausgesandten a - Teilchen während t: a(t) = n · p(t)
Experimentelle Erfahrungen (Messungen) für t = 1s und n = 1022 (= 19 Radien):
a(t) p(t) 10-12 (also sehr klein)
Versuch: Beobachtungen eines dieser Atome
Erfolg: Zerfall während 1s
gleichzeitig laufen also 1022 solcher Versuche ab.
Voraussetzungen des Bernoullischema erfüllt.
Zerfallsgröße X(t): Anzahl der während t ausgesandten a-Teilchen.
n sehr groß, p sehr klein annähernd POISSON-verteilt mit Parameter l = n · p.
P =
Verallgemeinerung
des Begriffes der Zufallsgröße:
Definition: Es seien x1, x2, , xn Zufallsgrößen auf ein- und demselben
Wahrscheinlichkeitsraum (W, M, P).
Dann
heißt das n-Tupel
Bemerkungen: zufällige Vektoren sind Vektoren, deren Komponenten Zufallsgrößen
sind. Man kann X als (meßbare) Abbildung von W in den Raum Rn auffassen.
Die Verteilung von
Beispiele für Zufallsvektoren:
simultane Messung verschiedener Größen
bei einem Experiment. (p-V-Diagramm,
Körpergröße eines Menschen, Dimension eines Werkstückes)
Definition: Ein Zufallsvektor
abzählbar viele
verschiedene Werte
Definition: Der Zufallsvektor
p(x1, x2, , xn) 0 besitzt:
P =
X1, X2, , Xn, höchstens abzählbar viele Zufallsgrößen auf (W, M, P)
Definition: Die Zufallsgrößen X1, X2, , Xn, heißen unabhängig, falls für
beliebige Zahlen xk´ xk´´ die Ereignisse
k = 1, 2, , n,
vollständig
unabhängig sind.
Folgerungen:
Bei diskreten
unabhängigen Zufallsgrößen X1, X2, , Xn
gilt für die (gemeinsame) Verteilung von
P = P · P
· · P(Xn = xn}, (x1, x2, , xn)
I Rn.
Bei stetigen
unabhängigen Zufallsgrößen X1, X2, , Xn mit
den Dichten p1, p2, , pn gilt für die
(gemeinsame) Dichte des zufälligen Vektors
p(x1, x2, , xn) = p1(x1)
· p2(x2) · · pn(xn)
mit (x1, x2, , xn) I
Rn.
Funktionen von Zufallsgrößen
X sei Zufallsgröße auf (W,
M, P), g ist reelle Funktion g:
Unter ganz schwachen Voraussetzungen (Meßbarkeit muß gesichert sein) ist dann auch die durch w g(X(w w I W definierte Abbildung eine Zufallsgröße.
Analoges gilt für einen Zufallsvektor (X1,
X2, , Xn) und die Funktion h: Rn R1.
Y = h(X1, X2, , Xn) ist dann Zufallsgröße
auf (W, M, P).
Charakterisierung von Zufallsgrößen und Vektoren
X sei Zufallsgröße auf (W,
M, P)
wichtigste Charakteristik von X: Verteilung
PX (aber oft "unhandlich")
Definition: Die durch FX (x) = P , x I R definierte Funktion heißt
Verteilungsfunktion
der Zufallsgröße X.
Bemerkung: Die Verteilungsfunktion der Zufallsgröße X charakterisiert die Verteilung einer
Zufallsgröße vollständig, es gilt:
P = FX (x2) - FX(x1)
Beispiel:
Standard-Normalverteilung N(0, 1) y
FX
= F (x) =
Binominalverteilung mit Parametern n, p
FX(x) =
FX(x)
n x
Eigenschaften
einer Verteilungsfunktion FX
FX(x) x I R
FX monoton wachsend x1 x2 F(x1) F(x2)
FX
linksseitig stetig
Bemerkung: Diese Eigenschaften sind sogar charakterisierend, d.h. jede Funktion F
mit diesen
Eigenschaften 1 - 4 ist Verteilungsfunktion einer gewissen Zufallsgröße X.
Verteilungsfunktion enthält volle Information über die Verteilung, aber kompliziert und schwierig zu bestimmen (bei Zufallsgrößen mit a priori unbekannter Verteilung)
Wunsch nach Informationsverdichtung
Beispiel: (Gleichverteilung)
Die diskrete Zufallsgröße X mit den Werten x1, x2, , xn heißt gleichverteilt, falls gilt:
P =
1
x1 x2 xn
Analog gilt für die Dichte einer stetigen Gleichverteilung auf dem Intervall [a, b] R:
1 FX(x)
p(x)
=
0 a b
Mittelmarke für X: X diskret:
arithmetisches Mittel =
X
stetig: Intervallmitte =
Verallgemeinerung für diese Mittelungen für beliebige diskrete und stetige Zufallsgrößen X?
Definition: Es sei X eine diskrete Zufallsgröße mit den Werten xk , k = 1,2,
Dann heißt die durch
EX =
definierte Zahl der Erwartungswert der Zufallsgröße X. Dabei wird der Eindeutigkeit wegen die absolute Konvergenz obiger Reihe vorausgesetzt:
Definition: Für eine stetige Zufallsgröße X
definieren wir EX =
Erwartungswert.
Es wird wieder die absolute Konvergenz vorausgesetzt:
EX
=
absolut
konvergent
EX
=
Bemerkungen: Der Begriff des Erwartungswertes kommt unserer anschaulichen
Vorstellung eines Mittels (Mittelung) sehr nahe. Deutet man eine diskrete oder stetige Wahrscheinlichkeitsverteilung als Massenverteilung eines diskret oder stetig verteilten mechanischen Systems auf der Achse, so ist EX der Schwerpunkt des Systems (im physikalischen Sinne).
Es gibt aber auch andere Methoden zu Mitteln (Median, Zentralwert)
Beispiele:
Poisson-Verteilung
EX =
=
Parameter der Poisson-Verteilung ist in diesem Falle = Erwartungswert
derselben, vorteilhaft für statistische Untersuchungen.
Expotentialverteilung
EX =
Linearität E(aX + bY) = aEX + bEY
Funktion einer
Zufallsgröße g(X)
X diskret: Eg(X) =
X stetig: Eg(X) =
absolute Konvergenz der rechten Seite jeweils vorausgesetzt.
Der Erwartungswert charakterisiert die Lage des Zentrums einer Verteilung (Lageparameter); über die Stärke möglicher Abweichungen der Zufallsgröße vom Zentrum gibt er keine Auskunft.
Wunsch nach einem Maß für die "Streuung"
Definition: Es sei X eine Zufallsgröße mit dem Erwartungswert EX.
Dann wird im Falle der Existenz durch D2X = E(X - EX)2
die Streuung (oder Varianz) der Zufallsgröße X definiert.
Speziell gilt:
X
diskret: D2X
=
p(x)
X stetig: D2X =
denn
D2X wird über die Funktion g(X) = (X - EX)2 von X
bestimmt.
Bemerkung: Auch die Streuung gestattet eine mechanische Interpretation.
Veranschaulicht
man sich die Verteilung als diskretes oder stetiges Massensystem auf der Achse
mit dem Schwerpunkt EX, so entspricht D2X dem Trägheitsmoment dieses
Systems bezüglich einer Achse durch den
Schwerpunkt. (Existenz jeweils vorausgesetzt).
D2(aX + b)
= a2D2X
Beweis: D2(aX + b)
= E[(aX + b) - E(aX + b)]2 = E[a(X - EX) + (b - Eb)]2
=
E[a2 (X - EX)2] = a2 D2X
Folgerung:
D2 (-X) = D2X
D2
Annahme: X einpunktverteilt:
P = 1 c feste
reelle Zahl
X = c fast sicher, EX = c
Die Streuung einer Zufallsgröße X ist genau dann Null, wenn X einpunktverteilt
ist.
D2X
= EX2 - (EX)2
Beweis: D2X
= E(X - EX)2 = E[X2 - 2X EX + (EX)2] = EX2
- 2EX (EX) + (EX)2
=
EX2 - (EX)2
Diese Aussage ist mit dem Steinerschen Satz äquivalent:
EX2
= D2X +
(EX)2
Trägheitsmoment
bzgl. d. Trägheitsmoment bzgl. d. Abstandsquadrat:
Achse durch
0 Achse durch Schwerpunkt Schwerpunkt-Nullpunkt
D2 (X+Y) = D2X + D2Y + 2[E (XY) - (EX) (EY)]
Beispiele:
X ist Poisson-verteilt
mit Parameter l > 0
= l
= l l+1)
Steinerscher Satz D2X = EX2 -(EX)2 = l l l l
X ist expotentialverteilt
mit Parameter l > 0
EX2 =
D2X = EX2 - (EX)2 =
Normalverteilung
Y sei eine standardnormalverteilte Zufallsgröße
EY = 0, D2Y = 1 (Streuung)
kurz: N (0, 1)
X = sY + m
- lineare Transformation von Y; s
> 0, m I
R
FX(x) = P = P = P
= FY (
Definition: Eine Zufallsgröße X mit dieser Verteilungsfunktion FX heißt
normalverteilt mit den Parametern s > 0, m I R oder N(m s ) verteilt.
Bedeutung der Parameter:
EX = E(sY
+ m s
D2X = D2(sY
+ m s
X, Y seien Zufallsgrößen auf (W, M, P)
g: R2 R Funktion, (Meßbarkeit sei
gesichert)
neue Zufallsgröße: Z = g(X, Y)
Verteilung von Z ?
speziell: X, Y seien disjunkt mit Werten xi, yk ; (i, k = 0, 1, )
P =
Summiert wird also über disjunkte Indizes i, k für die g(xi, yk) = z.
Existieren keine solchen Werte xi, yk, so ist die Summe gleich Null.
Zur Berechnung von P muß man also i. a. die gemeinsame Verteilung von X und Y kennen.
noch spezieller: Summe von X und Y
P =
Übung: X, Y Poisson-verteilt Speziell X, Y mit Werten 0, 1, 2,
P =
=
nennt man "Faltung der Verteilung von X und Y !!"
Ziel: Übertragung der Methode auf stetige Zufallsgrößen X, Y mit der
gemeinsamen Dichte fX,Y
gesucht: Z
= X + Y stetig ? , Dichte fZ ?
Doppelintegral, Integrationsgebiet
B =
y
z
y = z - x x + y = z
x z x x
y = z - x
=
(Integral iterieren) =
Substitution: z = x + y, y = z - x
dy = dz
y = - z
y = z - x z = x + y = x + (z - x) = z
=
Ziel:
Funktion von z
Integralreihenfolgetausch
=
Dichte für fZ(z) : fZ (z
Dichte für Z = X + Y
fZ(z)
=
Damit ist Z = X + Y eine stetige
Zufallsgröße
speziell: Annahme: X und Y
unabhängig
fX,Y(x,y) = fX(x)
* fY(y) (x, y I
R)
fZ(z) =
"Faltungsformel" für die Dichte fX
und fY (bei Unabhängigkeit)
fZ(z) =
Bemerkung: Durch Vertauschen der Rolle von x und y in den obigen Überlegungen
beweist man die Formel:
fZ(z)
=
weitere Aussagen über unabhängige Zufallsgrößen X und Y:
EXY = EX EY
f, g reelle Funktionen, X,Y unabhängig T f(X), g(X) unabhängig
X - Zufallsgröße
Definition: Im Falle der Existenz heißt mk = EXk (k = 1, 2, ) das k-te Moment der
Zufallsgröße X.
allgemein: mk
= E(x - c)k (k = 1, 2, )
heißt k-tes Moment
von X bezüglich c I R
Momente sind sowohl theoretisch (Momentenproblem) als auch praktisch (Statistik) bedeutsam.
Vorbemerkung: komplexe Zufallsgröße
X, Y (reelle) Zufallsgrößen auf dem Wahrscheinlichkeitsraum (W, M, P)
Z = X + iY komplexe Zufallsgröße auf (W, M, P)
Meßbarkeit überträgt sich
Verteilung von Z kann durch die gemeinsame Verteilung von X, Y charakterisiert werden
Erwartungswert von Z: formal summieren EZ = EX + iEY
Zj
= Xj + iYj (j = 1, 2)
Z1, Z2 unabhängig: (X1, Y1
unabhängig von X2, Y2)
Betrag
Darstellung komplexer Zahlen (Wdh.)
y z
algebraische Form:
z = x + iy x
trigonometrische Form: y r z
z = r(cos z + i sin z) z
x
Expotentialform:
z = r eiz
Definition: Sei X eine (reelle) Zufallsgröße auf dem
Wahrscheinlichkeitsraum (W, M, P). Dann bezeichnen wir die Abbildung t zX(t) := E(eitX), - < t < als charakteristische Funktion der Zufallsgröße X oder der Verteilung von X.
Bemerkung: Aufgrund von |eitx| = 1 ist obiger Ausdruck absolut und gleichmäßig in t
konvergent. Zu jeder Zufallsgröße X existiert also die charakteristische Funktion zX(t).
X diskrete Zufallsgröße:
z(t)
= E (eitX)
(absolute
Konvergenz)
Beispiel: X sei zweipunktverteilt
P = P =
z(t)
= e-it1*
X stetig:
Verteilung von X besitzt Dichte fX
z(t)
= E( eitX) =
Konvergenz:
(absolut konvergent und gleichmäßig in t)
X stetig: Verteilung von X besteht aus Dichte fX
j(t) = E (eitX) =
g(x) = eitx
Konvergenz:
Beispiel: X auf [0, 1] gleichmäßig verteilt:
Dichte
fX(x) =
j(t) =
Eigenschaften charakteristischer Funktionen
j(0)
= E eitX
j(t)| = |E (eitX)| |EitX| = E*1 = 1 (qualitative Aussage)
j(-t)
=
[jede charakteristische Funktion erfüllt (notwendigerweise) diese Bedingungen; sie sind indessen nicht hinreichend]
lineare Transformation von X:
Zufallsgröße Y =aX + b charakteristische Funktion ?
jY(t) = E (eitY) = E (eit(aX + b)) = E(eitb eitaX) = eitb E(eitaX) = eitbjX(at) , t I R1
Multiplikationssatz:
X, Y seien zwei unabhängige Zufallsgrößen
charakteristische Funktion der Summe Z = X + Y ?
jZ(t) = E (eitZ) = E (eit(X + Y)) = E (eitX eitY) = (unter der Voraussetzung, daß X und Y unabhängig sind) = E (eitX) E (eitY) = jX (t) * jY (t) , t I R
Satz: Die charakteristische Funktion der Summe endlich vieler vollständig
unabhängiger Zufallsgrößen ist gleich dem Produkt der charakteristischen Funktionen dieser Zufallsgrößen.
Beispiel: X sei Poisson-verteilt mit Parameter l > 0
jX(t) = E (eitX) =
Y sei Poisson-verteilt mit Parameter m > 0 und unabhängig von X.
Wie ist Z = X + Y verteilt ?
jZ(t) = jX(t) j Y(t) =
charakteristische Funktion einer Poissonverteilung mit Parametern l m
Bemerkung: Falls jZ die Verteilung von Z, eindeutig charakterisiert, so ist Z
Poisson-Verteilt mit dem Parameter l m
Eindeutigkeitssatz: Jede Verteilung ist durch ihre charakteristische Funktion
eindeutig bestimmt.
Erzeugung der Momente einer Zufallsgröße
Besitzt die Zufallsgröße X das Moment k-ter Ordnung mk = EXk, so existiert die k-te Ableitung von jX und es gilt:
mk
=
Charakteristiken im 2-dimensionalen
Zufallsvektor (X, Y) auf dem Wahrscheinlichkeitsraum (W, M , P)
[P(X,Y) (B) = P = P, B I L2]
Informationsverdichtung: Erwartungswert, Streuung (Varianz) verallgemeinern.
Erwartungsvektor: (EX, EY) y
(EX, EY)
x
Varianz verallgemeinern:
zwei Zufallsgrößen X, Y aus D2X, D2Y aber auch Abhängigkeiten zwischen X und Y berücksichtigen.
cov (X, Y) = E(X - EX) (Y-EY) cov (X, Y) = D2X
Kovarianzmatrix:
Kovarianz normieren: z(X,Y)
=
Aussage: Komponenten X und Y unabhängig E( X*Y) = (EX) (EY)
cov (X,Y) = 0
z(X, Y) = 0
D2(X + Y) = D2X + D2Y
(Anmerkung: +2[E (XY) - EX EY] = cov (X, Y))
Beispiel: 2-dimensionale Normalverteilung, angegeben durch die Dichte
der Verteilung von (X, Y):
f(x,y) =
y
my
mx x
cov (X, Y) = z sxsy , z(x, y) = z
X N(mx sx , Y N(my sy
Markovsche Ungleichungen:
Es sei X eine fast sicher nicht negative Zufallsgröße: P = 1, für die der Erwartungswert EX existiert. Dann gilt für jede Zahl t > 0 die Abkürzung:
P
Beweis:
X ist diskret: Einzelwahrscheinlichkeiten P (i = 0, 1, 2, )
EX =
X sei fast sicher
0 EX t
P
X sei stetig: Dichte fX(x) > 0
EX
=
P = 0
Bemerkung: In dieser Ungleichung wird von der Verteilung von X lediglich der
Erwartungswert EX benutzt, daher ist die obige Abschätzung oft recht grob. Zu besseren Resultaten kommt man, wenn man auch die Summe D2X der Zufallsgrößen benutzen kann.
Die Zufallsgröße X besitze Erwartungswert und Streuung.
Dann gilt für t > 0:
P
Beweis: Unter Anwendung der Markovschen Ungleichung auf (X - EX)2,
t wird durch t2 ersetzt:
P
Das Ereignis tritt genau dann ein,
wenn
t2 dick gekennzeichnete Bereiche
auf der t-Achse entsprechen
genau dem markierten Bereich der
t2-Achse
t2
-t t t
Bemerkungen: Für t2 D2X wird die Aussage dieser Ungleichung trivial, denn dann ist
Im Falle t = 3s
=
EX-3s EX EX+3s
P
= 1 - P
1 -
(quantitativ wichtige Aussage)
Bemerkung: Wenn die Wahrscheinlichkeit =
[EX-3s, EX+3s
Bernoulli-Schema: Serie von n unabhängigen Versuchen, Zufallsgröße Xn zählt
das Eintreten des Ereignisses A in der Serie.
P(A) = p Xn binominal verteilt mit den Parametern n, p
Exn = n · p , D2Xn = n · p (1 - p)
Xn: absolute Häufigkeit des Eintretens von A
relative
Häufigkeit: hn(A):=
Naturbeobachtung: Folge der relativen Häufigkeiten hn(A) (n = 1, 2, ) ist stabil.
Erwartungswert und Streuung der relativen Häufigkeiten:
E hn(A) = E
E hn(A) = P(A) (n = 1, 2, )
[Erwartungswert d. relativen Häufigkeit von A ist gleich der Wahrscheinlichkeit von A]
D2 hn(A) =
Die Varianz und damit die Abweichung der relativen Häufigkeit hn(A) von der dem Experiment zugrunde liegende Wahrscheinlichkeit P(A), die wir als objektiv gegeben ansehen, wird immer kleiner. Mit Hilfe der Tschebyscheffschen Ungleichung läßt sich diese Abweichung sogar quantitativ erfassen:
Für e
> 0 gilt: P = P
Es sei A ein in einem zufälligen Versuch auftretendes Ereignis und hn(A) die relative Häufigkeit des Eintretens von A in einer Serie von unabhängigen Wiederholungen dieses Versuches (n = 1, 2, ). Dann gilt:
Man sagt: "hn(A) konvergiert stochastisch gegen die Wahrscheinlichkeit P(A).
Bemerkungen:
Neben seiner unmittelbaren Bedeutung lehrt dieses Gesetz auch, daß jedes Ereignis positiver Wahrscheinlichkeit - wie klein diese auch sein mag - in einer genügend langen Versuchsserie mit einer beliebig nahe an Eins gelegenen Wahrscheinlichkeit mindestens einmal vorkommt: "Gesetz der großen Zahlen" - der Traum jeden Spielers.
Allgemein ist dieses Gesetz ein hervorragender Beleg für die adäquate Beschreibung realer zufälliger Phänomene durch die Wahrscheinlichkeitstheorie.
Verallgemeinerung: Xk; k = 1, 2, Folge von Zufallsgrößen
arithmetisches Mittel der ersten n Zufallsgrößen Xk:
Yn
=
Aussage: X1, X2, , Xn, Folge unabhängiger Zufallsgrößen mit gleichem
Erwartungswert Exk = m (k = 1, 2, ) und beschränkter Streuung D2Xk M
Für
e > 0 gilt: (*)
Aussage: X1, X2, , Xk, paarweise unabhängige identisch verteilte
Zufallsgrößen , deren Erwartungswert und Streuung existieren. Auch dann gilt das Gesetz der großen Zahlen (*).
Wie wir schon beim Grenzwertsatz von de Moire-Laplace kennenlernten, sind auch Aussagen über Grenzverteilungen möglich.
Es sei (Xk) eine Folge unabhängiger, identisch verteilter Zufallsgrößen mit positiver Streuung.
Dann genügt die Folge (Xk) dem "zentralen Grenzwertsatz":
EXk = m , D2Xk = s > 0 (k = 1, 2, )
Zn =
P
d.h. die Zufallsgröße Zn =
Bemerkung: Der Zentrale Grenzwertsatz manifestiert die enorme theoretische und
praktische Bedeutung der Normalverteilung. Ergibt sich eine Zufallsgröße aus der Überlagerung einer Vielzahl weitgehend unabhängiger zufälliger Effekte, so ist sie genähert normalverteilt.
Zur Bestimmung der asymptotischen Verteilung ist dann nur die Kenntnis der Erwartungswerte und Streuungen erforderlich.
PAGE # ''Seite: '#'
'' [X1]
Haupt | Fügen Sie Referat | Kontakt | Impressum | Nutzungsbedingungen