: Hallo Jens,
: Danke. Hast Dus gelesen?
Damals ging es mir darum, wie bei solchen Problematiken überhaupt statistisch vorgegangen wird. Ich habe es digitalisiert inkl. OCR, damit ich den Google Übersetzer nutzen kann. Bei Interesse mail.
: Bleiben wir mal bei dem Beispiel des Okularmikrometers, da kann ich
: allerhöchstenfalls auf 0,5 Skalenteile, ablesen. Der Einfachheit halber
: nehmen wir auch mal an, dass das dann auch 0,5 µm Ablesegenauigkeit
: wären. Jetzt habe ich z.B. eine Spore, die gerade ein bisschen kleiner
: als 6,25 µm (bitte nicht falsch verstehen, ich meine gerade ein bisschen
: weniger als 6 + 1/4 Skalenteil) wäre, also würde ich wegen der
: Ablesegenauigkeit von 0,5 µm 6 µm aufschreiben. Die nächste Spore wäre
: z.B. gerade ein bisschen größer als 6,25 µm, also würde ich da 6,5 µm
: aufschreiben. Diese Abweichung entspricht also einem Fehler, der auf Grund
: meiner Messgenauigkeit zustandekommt und entspricht nach meinem
: Verständnis nicht dem statistischen Fehler.
Der Fehler wird oft als zufälliger Fehler bezeichnet.
: Wenn ich jetzt als nächstes
: eine Spore messe, die ziemlich genau 6 Skalenteile also 6 µm lang wäre
: und die nächste wäre 7 µm, dann repräsentiert diese Abweichung den
: statistischen Fehler, der seinen Ausdruck bei der Auswertung in der
: Standardabweichung findet.
: Wenn ich jetzt bei einer Messung z.B. den statistischen Fehler des
: Mittelwerts (=Standardabweichung/Wurzel(Anzahl der Messwerte-1)) von 0.1
: µm rausbekäme, widerspricht das der Aussage, dass ich ja eine
: Messungenaugkeit von +- 0,25 µm habe. So genau kann ich ja gar nicht
: messen, also muss der Messfehler noch dazu gerechnet werden. Aber ich
: denke auch, dass das jetzt nicht wirklich wesentlich für Sporenmessungen
: ist ;-).
Ich wiederspreche dir da zwar nur ungerne, weil dann die Diskussion auch hier weiter geht, aber warum soll der Mittelwertfehler nicht viel kleiner sein, als die Messgenauigkeit. Es handelt sich schließlich nicht um einen Einzelwert. Und ich ich kann ja auch nur die Aussage treffen, dass ein neuer Mittelwert derselben Population.... s.o.
: Ich hab heute schon im eigenen Hause gemerkt, dass das ein schlechtes
: Beispiel für einen Ingenieur ist, sorry ;-). Ich meinte was ganz Anderes.
: Ich wollte mir 100.000 normalverteilte Kugeln basteln, die
: unterschiedliche Durchmesser haben (Stell Dir vielleicht vor, wie Kugeln
: früher gefertigt wurden: flüssiges Bleitropfen durchfallen eine Strecke.
: Die Kugeln streuten sehr stark im Durchmesser). Die 0.01 mm waren als
: Unterschied im Durchmesser zwischen benachbarten Kugeln gedacht, sind aber
: eigentlich total überflüssig, vergiss das einfach. Damit die
: Kugeldurchmesser nicht so lästig negativ werden, sei der Mittelwert des
: Durchmesser bei 8 mm, die Standardabweichung bei 3 mm, dann passt das ja
: auch mit Deinem Konfidenzintervall. Was ich nun habe sind normalverteilte
: Kugeln, ich will die Kugeln als das betrachten, was in den Büchern meist
: als Parentpopulation bezeichnet wird und was ich hier schon mal die
: "echte" Normalverteilung bezeichnet habe. Ist jetzt klar, wie
: ich das meine?
: Jetzt mischt man die Kugeln gut durch und Du ziehst 6 Kugeln. Du kennst aber
: weder Standardabweichung noch Mittelwert noch Konfidenzintervall dieser
: echten Normalverteilung, sondern willst durch die 6 Stichproben
: Abschätzungen für diese Werte erhalten. Du erhältst aus den 6
: Stichproben z.B. einen Mittelwert von 3mm mit einer Standardabweichung von
: 0,5 mm, gibt ein Konfidenzintervall von 1.7 - 4.3 mm. Dieser Mittelwert
: und diese Standardabweichung ergeben eine "neue"
: Normalverteilung (von mir jetzt mal Childpopulation benannt), das
: Konfidenzintervall gilt nur für diese "neue" Nomalverteilung.
: Der "echte" Mittelwert der Parentpopulation liegt weitab vom
: Konfidenzintervall bei 8 mm. Wenn Du nochmal 6 Kugeln ziehst, liegst Du
: jetzt zufällig ;-) auf der anderen Seite der Parentpopulation und
: bekommst z.B. einen zu großen Mittelwert von 12 mm usw und damit
: Childpopulation Nr. 2, die sich nicht mit dem ersten Kind überschneidet.
: Die Idee ist wohl hoffentlich klar? Natürlich ist das so betrachtet
: ziemlich unwahrscheinlich, aber bei 6 Werten noch möglich. Bei 6 Werten
: ist es allerdings ganz und gar nicht unmöglich, dass Du bei Deinen
: Stichproben auf eine "Seite" der Parentpopulation rutschst.
: Wenn Dir das zu extrem ist, dann schau Dir bitte das Beispiel im ersten Link
: mit dem Haushaltseinkommen nochmal an. Da wurden z.B. jeweils 25
: Stichproben genommen, daraus Mittelwert und Konfidenzintervalle berechnet,
: mit dem Ergebnis, dass die Konfidenzintervalle der jeweiligen
: Childpopulationen in einigen Fällen den Mittelwert der Parentpopulation
: nicht beinhalten. Aber eigentlich ist in diesem Fall schon anschaulich
: klar, dass eine Stichprobe von 25 Haushalten nicht ausreichen kann um das
: durchschnittliche mit Konfidenzintervall aller
: deutschen Haushalte zu bestimmen.
Haushaltseinkommen sind rechtsschief und nicht normalverteilt. Deshalb ist das Beispiel für uns nicht geeignet.
: Zur Verdeutlichung: die 95%- Aussage bezieht sich nur auf Deine durch
: Stichproben gewonnene Childpopulation. Wenn Die mit der Parentpopulation
: nur schlecht übereinstimmt, kannst Du diese Aussage nicht auf die
: Parentpopulation übertragen. Bei einer weiteren Stichprobe kannst Du dann
: eine weitere Childpopulation erhalten, die sich mit der ersten nicht
: überschneidet.
: Jaja, wenn Du mehr als 6 Stichproben nimmst, schon ;-). 0.5 hoch 6 wär immer
: noch eine Wahrscheinlichkeit von 1.6 %. Und es müssen ja nicht alle 6
: Werte unten sein, es reichen evtl. auch schon 4 Werte.
: siehe oben, ich hoffe, jetzt ists klar, was ich meine.
: Der t-Wert ist doch nicht das einzig Ausschlaggebende. Die Standardabweichung
: könnte zum Beispiel noch größer werden, wenn mehr Sporen gemessen
: werden, der Mittelwert kann sich ebenfalls noch verändern.
: Nur, wenn die NOrmalverteilung der Stichprobe der Normalverteilung der
: Grundgesamtheit weitestgehend entspricht.
: Wieder siehe oben.
: Ausreisser können auch nur dann wirklich sicher entfernt werden, wenn Du
: genügend Messwerte hast, ansonsten könnten sie zu Deiner
: Gruundgesamtheit gehören.
Es gibt kein sicheres Entfernen! Auch das Entfernen der Ausreisser geschieht mit einer Wahrscheinlichkeit. In z.B. 5% der Fälle habe ich einen Ausreisser entfernt, der keiner war. Aber in 95% war er einer.
: Ach übrigens, nur so nebenbei. Die Zahl der Zerfälle pro Zeitintervall
: eines radioaktiven Präparats mit langer Halbwertszeit ist normalverteilt.
: Wir durften im Physikpraktikum zu Beginn des Studiums 200 mal je 10 s lang
: die Zahl der Zerfälle messen, um Mittelwert und Standardabweichung zu
: bestimmen, das war sicher vollkommen unnötig ;-).
Sollte die Anzahl Zerfalle pro 10s normalverteilt sein, war es wohl Beschäftigungstherapie, es sei denn, ich möchte einen Mittelwert mit sehr hoher Genauigkeit und einem sehr kleinen Mittelwertfehler erhalten. Das Prozedere könnte ich mir vorstellen, wenn man z.B. einer theoretischen Konstanten auf die Schliche kommen möchte oder eine bekannte nachweisen...
Ach ja, dass sich die (zufälligen) Messfehler mit zunehmenden n immer mehr ausgleichen sagt m.M.n. der "zentrale Grenzwertsatz" und deshalb werden sie auch nicht mit im Gesamtfehler angegeben.
Was jetzt für mich wirklich positiv war: Ich habe mich mal wieder damit beschäftigt. Und ich wollte immer nochmal den Populationsellipsen-Vergleich in Smaff mit reinprogrammieren. Vielleicht ist jetzt ein guter Zeitpunkt, damit anzufangen.
LG, Jens