Hallo Jens,
: Für Hymenomycetes: Parmasto, Erast; Parmasto, Ilmi (1987) - Variation of
: basidiospores in the hymenomycetes and its significance to their taxonomy
: - Bibliotheca Mycologica, Band 115
Danke. Hast Dus gelesen?
: Warum im Beispiel der Fehler der Messschraube als systematischer Fehler
: behandelt wird, verstehe ich auch nicht, da systematische Fehler immer in
: eine Richtung fehl gehen. Für mich ist das ein zufälliger Fahler.
: Aber das Beispiel zeigt, dass andere Fehler größer sein können als der
: statistische Fehler und da waren wir uns ja schon einig, dass er dann
: relevant wird. Bei uns ist allerdings i.d.R. wohl der statische Fehler
: erheblich größer als der zufällige.
Bleiben wir mal bei dem Beispiel des Okularmikrometers, da kann ich allerhöchstenfalls auf 0,5 Skalenteile, ablesen. Der Einfachheit halber nehmen wir auch mal an, dass das dann auch 0,5 µm Ablesegenauigkeit wären. Jetzt habe ich z.B. eine Spore, die gerade ein bisschen kleiner als 6,25 µm (bitte nicht falsch verstehen, ich meine gerade ein bisschen weniger als 6 + 1/4 Skalenteil) wäre, also würde ich wegen der Ablesegenauigkeit von 0,5 µm 6 µm aufschreiben. Die nächste Spore wäre z.B. gerade ein bisschen größer als 6,25 µm, also würde ich da 6,5 µm aufschreiben. Diese Abweichung entspricht also einem Fehler, der auf Grund meiner Messgenauigkeit zustandekommt und entspricht nach meinem Verständnis nicht dem statistischen Fehler. Wenn ich jetzt als nächstes eine Spore messe, die ziemlich genau 6 Skalenteile also 6 µm lang wäre und die nächste wäre 7 µm, dann repräsentiert diese Abweichung den statistischen Fehler, der seinen Ausdruck bei der Auswertung in der Standardabweichung findet.
Wenn ich jetzt bei einer Messung z.B. den statistischen Fehler des Mittelwerts (=Standardabweichung/Wurzel(Anzahl der Messwerte-1)) von 0.1 µm rausbekäme, widerspricht das der Aussage, dass ich ja eine Messungenaugkeit von +- 0,25 µm habe. So genau kann ich ja gar nicht messen, also muss der Messfehler noch dazu gerechnet werden. Aber ich denke auch, dass das jetzt nicht wirklich wesentlich für Sporenmessungen ist ;-).
: Wenn ich Kugeln auf 0,01mm fertige, dann ist das mein vorgegebener
: Gesamtfehler. Da passt schon eine Standardabweichung von 3mm nicht rein.
: Deshalb dachte ich auch hier, du hast vielleicht 0,003mm oder so als
: Standardabweichung gemeint.
Ich hab heute schon im eigenen Hause gemerkt, dass das ein schlechtes Beispiel für einen Ingenieur ist, sorry ;-). Ich meinte was ganz Anderes. Ich wollte mir 100.000 normalverteilte Kugeln basteln, die unterschiedliche Durchmesser haben (Stell Dir vielleicht vor, wie Kugeln früher gefertigt wurden: flüssiges Bleitropfen durchfallen eine Strecke. Die Kugeln streuten sehr stark im Durchmesser). Die 0.01 mm waren als Unterschied im Durchmesser zwischen benachbarten Kugeln gedacht, sind aber eigentlich total überflüssig, vergiss das einfach. Damit die Kugeldurchmesser nicht so lästig negativ werden, sei der Mittelwert des Durchmesser bei 8 mm, die Standardabweichung bei 3 mm, dann passt das ja auch mit Deinem Konfidenzintervall. Was ich nun habe sind normalverteilte Kugeln, ich will die Kugeln als das betrachten, was in den Büchern meist als Parentpopulation bezeichnet wird und was ich hier schon mal die "echte" Normalverteilung bezeichnet habe. Ist jetzt klar, wie ich das meine?
Jetzt mischt man die Kugeln gut durch und Du ziehst 6 Kugeln. Du kennst aber weder Standardabweichung noch Mittelwert noch Konfidenzintervall dieser echten Normalverteilung, sondern willst durch die 6 Stichproben Abschätzungen für diese Werte erhalten. Du erhältst aus den 6 Stichproben z.B. einen Mittelwert von 3mm mit einer Standardabweichung von 0,5 mm, gibt ein Konfidenzintervall von 1.7 - 4.3 mm. Dieser Mittelwert und diese Standardabweichung ergeben eine "neue" Normalverteilung (von mir jetzt mal Childpopulation benannt), das Konfidenzintervall gilt nur für diese "neue" Nomalverteilung. Der "echte" Mittelwert der Parentpopulation liegt weitab vom Konfidenzintervall bei 8 mm. Wenn Du nochmal 6 Kugeln ziehst, liegst Du jetzt zufällig ;-) auf der anderen Seite der Parentpopulation und bekommst z.B. einen zu großen Mittelwert von 12 mm usw und damit Childpopulation Nr. 2, die sich nicht mit dem ersten Kind überschneidet. Die Idee ist wohl hoffentlich klar? Natürlich ist das so betrachtet ziemlich unwahrscheinlich, aber bei 6 Werten noch möglich. Bei 6 Werten ist es allerdings ganz und gar nicht unmöglich, dass Du bei Deinen Stichproben auf eine "Seite" der Parentpopulation rutschst.
Wenn Dir das zu extrem ist, dann schau Dir bitte das Beispiel im ersten Link mit dem Haushaltseinkommen nochmal an. Da wurden z.B. jeweils 25 Stichproben genommen, daraus Mittelwert und Konfidenzintervalle berechnet, mit dem Ergebnis, dass die Konfidenzintervalle der jeweiligen Childpopulationen in einigen Fällen den Mittelwert der Parentpopulation nicht beinhalten. Aber eigentlich ist in diesem Fall schon anschaulich klar, dass eine Stichprobe von 25 Haushalten nicht ausreichen kann um das durchschnittliche Haushaltseinkommen mit Konfidenzintervall aller deutschen Haushalte zu bestimmen.
: Deshalb gibt man ja auch immer die Irrtumswahrscheinlichkeit mit an.
: Wie ich schon in meinen Beispielen schrieb, kann ich mit 95%iger Sicherheit
: etwas aussagen. In 5% der Fälle liege ich daneben. Das ändert sich auch
: nicht, wenn ich mehr vermesse. Nur mein Konfidenzintervall wird bei
: gleichbleibender Standardabweichung kleiner, dass aber auch zunehmend
: weniger.
Zur Verdeutlichung: die 95%- Aussage bezieht sich nur auf Deine durch Stichproben gewonnene Childpopulation. Wenn Die mit der Parentpopulation nur schlecht übereinstimmt, kannst Du diese Aussage nicht auf die Parentpopulation übertragen. Bei einer weiteren Stichprobe kannst Du dann eine weitere Childpopulation erhalten, die sich mit der ersten nicht überschneidet.
: Das könnte natürlich auch noch vorkommen, wenn ich bis zu 50% aller in dieser
: Grundgesamtheit vorkommenden dummerweise nach z.B. unten ziehe, also aus
: Versehen sozusagen alle kleinen ziehe. Die Wahrscheinlich dafür könnte man
: auch ausrechnen, aber die dürfte so gering sein...
Jaja, wenn Du mehr als 6 Stichproben nimmst, schon ;-). 0.5 hoch 6 wär immer noch eine Wahrscheinlichkeit von 1.6 %. Und es müssen ja nicht alle 6 Werte unten sein, es reichen evtl. auch schon 4 Werte.
: Nein, das gibt man ja doch auch selber vor. Oben hast du doch selbst eine
: Irrtumswahrscheinlichkeit von 0,05 vorgegeben, um dein
: Extrembeispielintervall auszurechenen. So "zuverlässig" ist dein
: Konfidenzintervall, auch wenn du es nicht glauben magst.
siehe oben, ich hoffe, jetzt ists klar, was ich meine.
: Da ist es viel sauberer, verschiedene Populationen zu messen. Mehr als 30
: bringt nicht viel mehr an Aussagekraft, denn ab 30 Messungen wird der zu
: verwendende t-Wert kaum noch kleiner. t(30)=2,042 t(100)=1,984, also eine
: Aussageverbesserungmöglichkeit von 5,8%, falls die Standardabweichung
: gleich bleibt.
Der t-Wert ist doch nicht das einzig Ausschlaggebende. Die Standardabweichung könnte zum Beispiel noch größer werden, wenn mehr Sporen gemessen werden, der Mittelwert kann sich ebenfalls noch verändern.
: Ich möchte hier noch einmal zum Verständnis zusammenfassen: - Man selbst gibt
: die Wahrscheinlichkeit vor, mit der dann das Konfidenzintervall
: ausgerechnet wird.
: - Weitere Messwerte fallen mit der selbst vorgegebenen Wahrscheinlichkeit in
: das zuvor errechnete Konfidenzintervall
Nur, wenn die NOrmalverteilung der Stichprobe der Normalverteilung der Grundgesamtheit weitestgehend entspricht.
: - Weitere Messreihen derselben Population haben einen neuen Mittelwert, der
: mit der selbst angebenen Wahrscheinlichkeit in das
: Mittelwertkonfindenzintervall vorrausgegangener Messreihen fällt (Achtung,
: der Mittelwertfehler wird anders berechnet).
Wieder siehe oben.
: Und noch einmal zu Präzisierung: bei 95%-Intervall habe ich natürlich etwa 5
: Messwerte auf 100 Messungen die ausserhalb des Konfidenzintervalles
: liegen. Die können mir aber egal sein, da ich ja auch weiß, dass sie
: normalerweise immer da sind. Nur wenn sie so weit ausserhalb liegen, dass
: sie womöglich Ausreisser sind (also genetische Mutanten, von einer anderen
: Art mit eingeschleppt, ein Messfehler o.ä.) sollte man sie nicht mit in
: der Messreihe verwenden, da sie die Mittelwerte stark verfälschen können.
Ausreisser können auch nur dann wirklich sicher entfernt werden, wenn Du genügend Messwerte hast, ansonsten könnten sie zu Deiner Gruundgesamtheit gehören.
Ach übrigens, nur so nebenbei. Die Zahl der Zerfälle pro Zeitintervall eines radioaktiven Präparats mit langer Halbwertszeit ist normalverteilt. Wir durften im Physikpraktikum zu Beginn des Studiums 200 mal je 10 s lang die Zahl der Zerfälle messen, um Mittelwert und Standardabweichung zu bestimmen, das war sicher vollkommen unnötig ;-).
gute Nacht,in den nächsten Tagen werde ich übrigens wenig Zeit für diese Diskussion haben
Birgit