Transcript
Vorlesung:
Computergestützte Datenauswertung Meßdaten und Zufall: statistische Datenauswertung Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
SS '16
www.kit.edu
Zufall in den Naturwissenschaften Schon in der klassischen Physik: – Einfluss unkontrollierbarer Größen (Ablesegenauigkeit, Fertigungsgenauigkeit von wird als „Messfehler“ statistisch behandelt – in Vielteilchensystemen: statistische Mechanik betrachtet Eigenschaften von Verteilungen statt aller Phasenraumkoordinaten von Teilchen Messgeräten, „Rauschen“ usw.)
In der Quantenphysik: - Vorhergesagt werden Wahrscheinlichkeitsverteilungen von Observablen → nur statistische Aussagen, z.B. „ mittlere Lebensdauer eines Zustands“ oder „ Erwartungswert des Aufenthaltsortes“
sehr häufig: Mischung aus vorhersagbarer Komponente und Zufallskomponente. → Wahrscheinlichkeitsaussage, Statistik.
Ziel: Extraktion der vorhersagbaren Komponente(n)
Wozu Statistische Datenanalyse ? der Job des Wissenschaftlers:
Vergleich von Modellen mit der Wirklichkeit Frage: Passt das (theoretische) Modell zu den Beobachtungen (Messungen) ? - wenn nein: Modell verwerfen oder verbessern - wenn ja: freie Modellparameter bestimmen
– Messungen sind immer mit statistischen Ungenauigkeiten behaftet (Rauschen, Ablese- oder Digitalisierungsgenauigteit, Eichung, ...)
– in der Quantenphysik sind die relevanten Modellvorhersagen und -Größen selbst Parameter von Zufallsverteilungen (mittlere Lebensdauer eines Zustands, Erwartungswert eines Operators, ...)
–– gutes Modell –– schlechteres Modell
Modell einer Messung gemessener Wert
m = w + wahrer Wert
z zufälliger Beitrag
z kann mehrere Ursachen haben: - zufälliger Beitrag zum Messwert („Rauschen“) → „statistische Unsicherheit“ - Genauigkeit des verwendeten Messinstruments → „systematische Unsicherheit“ - mitunter gibt es auch eine Unsicherheit auf den „wahren“ Wert, den man oft z zuschlägt → „theoretische Unsicherheit“ - Fehler im Messprozess – sollten nicht passieren !
z = zstat + zsyst + ztheo
Grundsätzliches zur Datenauswertung Eine Datenerhebung (oder Messreihe) ist eine „Stichprobe“ aus einer „Grundgesamtheit“ Grundgesamtheit: die Menge aller Möglichen Ergebnisse (engl.: basic population)
Stichprobe:
eine (endliche) Untermenge davon (engl.: sample)
Die Datananalyse verwendet statistische Methoden, um – Stichprobe durch Kennzahlen oder grafische Darstellung zu beschreiben deskriptiv Bsp.: - Verteilung eines Notendurchschnitts einer Klausur Kenngrößen: Mittelwert, Streuung (Varianz) – auf die Eigenschaften der Grundgesamtheit zu schließen inferenziell Bsp.: - Lebensdauerverteilung eines Radionuklids, Kennzahl Halbwertszeit – Aufdecken von Zusammenhängen zwischen verschiedenen Variablen explorativ: Bsp: - der Zusammenhang zwischen Ernährung und Körpergewicht - die Abhängigkeit des Stromes durch ein el. Bauteil von der Spannung
Beispiel: Längenmessung bitte die Höhe der vorderen Oberkante Ihrer Tischplatte über dem Boden messen und mir mitteilen ... Daten in Text-Editor eingeben:
# Messung 28. Apr. 2016 # h[cm] xx.xx yy.yy …. liveData.dat
Beispiel: Längenmessung bitte die Höhe der vorderen Oberkante Ihrer Tischplatte über dem Boden messen und mir mitteilen ... import numpy as np
Deten in Text-Editor eingeben:
import matplotlib.pyplot as plt #read columns from file: infile="Data.dat" A=np.loadtxt(infile,unpack=True)
# Messung 28. Apr. 2016 # h[cm] xx.xx yy.yy ….
print A # check input # visualize as histogram (with matplotlib) fig=plt.figure(figsize=(10,10)) plt.hist(A,100) plt.title('Distribution of Data')
liveData.dat Mit kleinem Python-script darstellen und auswerten
→
print "Mittelwert: %.3f" % np.mean(A) print "Standardabweichung: %.3f" % np.std(A) print "Unsicherheit auf Mittelwert: %.3f" \ % (np.std(A)/np.sqrt(len(A))) plt.show()
s. auch liveDisplay.py (in der Vorlesung verwendet)
read_array.py
Ergebnis Beispiel 1:
Visualisierung der Messreihe (typisch wie z.B. mit MS Excel)
Darstellung als „Häufigkeitsverteilung“ oder „Histogramm“
(engl. frequency distribution“, „histogram“)
Statistische Information:
Mittelwert: 79.954 Standardabweichung: 0.522 Unsicherheit auf Mittelwert: 0.074
Anm.: Standardabweichung beschreibt „Breite der Verteilung“
Beispiel Strom-Spannungsmessung (1)
? Messreihe:
I
+ –
Draht
U
Grafische Darstellung mit (Millimeter -) Papier und Bleistift oder Tabellenkalkulation beherrschen Sie alle mit ein wenig Python-Code wird es komfortabler ...
Beispiel Strom-Spannungsmessung (2) Messreihe:
import numpy as np
Python Code
import matplotlib.pyplot as plt #read columns from file infile="DataOhmsLaw.dat" U, I = np.loadtxt(infile,unpack=True) # plot the results fig, ax=plt.subplots(1,1) ax.errorbar(U, I, fmt='o') ax.set_xlabel('U') ax.set_ylabel('I(U)') plt.show()
# Measurements: Ohm's Law # Prec.: U: +\-0.015V, I: +\-0.015A # U[V] I[A] 0.15 0.14 0.25 0.22 0.40 0.36 0.50 0.48 0.60 0.53 0.70 0.64 0.75 0.65 Text-Datei 0.80 0.74 0.90 0.81 DataOhmsLaw.dat
Frage: Gilt das Ohm'sche Gesetz ?
Grafik
I=U/R = G R für R bzw. G = const
?
Beispiel Strom-Spannungsmessung (3) Frage: Gilt das Ohm'sche Gesetz ? d.h. ist der Zusammenhang zwischen Strom und Spannung unter Berücksichtigung der Messunsicherheiten linear ?
Wie kann man vorgehen ? 1.) deskritptive Analyse – Für jedes ( I, U )-Paar den Leitwert berechnen – Mittelwert über alle Messungen bilden – Messunsicherheit empirisch aus „Streuung“ der Gi bestimmen
Mittelwert: G=0.907 S Standaradabweichung σ=0.028 S
Sieht doch gut aus: Linearer Zusammenhang, also Leitwert G bzw. Widerstand R bestimmen.
Unsicherheit des Mittelwerts: ΔG= σ /√n =0.009 S
Beispiel Strom-Spannungsmessung (4) Mit Berücksichtigung der bekannten Messunsicherheiten:
Unsicherheiten der Strombzw. Spannungsmessung aus - Herstellerangaben - eigener Erfahrung - eigenen Studien zur „Kalibration“
2.) – Für jedes (I , U) – Paar den Leitwert I/U berechnen – Messunsicherheiten für jeden Wert bestimmen Stichwort: Fehlerfortpflanzung – die Werte für G unter Berücksichtigung der Unsicherheiten kombinieren *) („Mittelung“ über alle Messungen) * mit Unsicherheiten geeignet gewichteter Mittelwert, Stichwort: 1/σ ² - Wichtung – Unsicherheit des gemittelten Werts bestimmen Ergebnis: G= 0.903 ± 0.011 S
Beispiel Strom-Spannungsmessung (5) Berücksichtigung der bekannten Messunsicherheiten (2) 3.) Der Leitwert G ist die Steigung der Geraden – „Anpassung“ (engl. “Fit“) einer Ursprungsgeraden an die Messpunkte durchführen – Qualität der Übereinstimmung überprüfen Probability pχ²=74%
Wenn ok: Wert für G aus der Anpassung incl. Unsicherheit als Ergebnis festhalten
Beispiel Strom-Spannungsmessung (6) 4.) Der Leitwert G ist die Steigung der Geraden, evlt. gibt es aber „systematische“ Probleme mit der Messung? Als Test Anpassung – einer allgemeinen Geraden oder – einer quadratischen Funktion an die Messpunkte durchführen Probability linear pχ²=64% quadratic pχ²=52%
• Mit mehr freien Parametern wird – die Unsicherheit auf den linearen Term größer – die Übereinstimmung mit den Daten aber eher schlechter • die zusätzlichen Parameter sind (innerhalb ihrer Unsicherheiten) mit Null verträglich
Strom-Spannungsmessung (7)
Die im Beispiel verwendeten statistischen Methoden und Programmpakete bzw. Software-Impelmierungen werden Sie in diesem Kurs kennen lernen bzw. selbst entwickeln. - Motivation der wichtigsten Formeln und Zusammenhänge (keine stringenten Herleitungen - dazu bitte Literatur konsultieren)
- Monte-Carlo-Methode zur Simulation von Messungen, d.h. zur Überprüfung der statistischen Verfahren - Programmbeispiele in python mit numpy-Funktionen - Funktionsanpassung und Software
Konzept: Learning by Doing ! Bitte machen Sie mit, der Lohn ist eine eigene Arbeitsumgebung zur Auswertung von Praktikumsversuchen, und noch viel mehr …