Dersom vi i utgangspunktet har observasjonane 0.2972, 0.2973 og 0.2975, har dei gjennomsnitt 0.29727 og empirisk standardavvik 0.00025. Observasjonen 0.2929 er då 17 standardavvik frå gjennomsnittet, (0.2929-0.29727)/0.00025= -17.35.
Sidan det er 3 observasjoner i det opprinnelige datamaterialet, har t-fordelinga 2 friheitsgrader (3-1=2). Dersom vi går inn i tabellen for t-fordelinga med 2 friheitsgrader, kan vi sjå at 99.5 prosent av massen ligg innafor 14 standardavvik og 99.8 prosent av massen ligg innafor 22 standardavvik. Med denne metoden vil vi då seie at 0.2929 truleg er ein uteliggar, då så ekstreme observasjonar berre skjer ein av 300 gonger.
https://no.wikipedia.org/wiki/Students_t-fordeling Usikker på hvorfor du konkluderer med at de opprinnelige datasettet består av 3 observasjoner. 0,2929 hører til også. Datasettet er 4 observasjoner. Men kan man si at det er bare to tall som er relevante til å testes og det er ytterpunktene? (I et større sett kan det vare flere men det må nødvendigvis være ytterpunktene her også. Man fjerner uteliggere og kjører testen på nytt? Men jeg klarer ikke å se om dette er legitimt eller om man da eventuelt jukser seg til bedre tall)
Kom etterhvert frem til omtrent det samme men med at det testes på 95% var 17 langt over 4,3 og 0,2929 en uteligger. Tenket ikke på vinklingen din (99,5 og 99,8 %), lærte igjen noe nytt her.
Med at jeg alt har brukt q-testen og fikk 'påvist' 0,2929 som uteligger er det selvfølgelig kjekt å få til en test som holder 0,2929 innenfor.
Så på Thompson Tau-testen fra linken.
Tenker jeg riktig med at rejection region blir:
4.303 (4-1)sqrt(4) * sqrt(4-2+4.303 = 2,57
mens ô= |0,02929-0,29621/0,0022| = 1,5
Og 0,2929 er ikke en uteligger.
Hovedforskjellen her med t-testen som du kjørte er vel at 0,2929 er med i beregning av s (som blir ca. 10 ganger større) og dermed holder 0,2929 innenfor.
Ser at
This process is continued until no outliers remain in a data set.på en måte bekrefter tankegangen min over at det er legitimt å fjerne uteliggere til det 'ikke er noen igjen'.
Eg vil likevel seie at å jobbe på denne måten vil klassifisere mange observasjonar som uteliggarar, sjølv om dei ikkje er det. Sannsynligheita for å vinne i lotte er ein til fem mill, men dersom du alt har vunne er sannsynligheita ein!
Ser poenget her men som jeg skrev over så er det ikke resulatene av beregningen jeg er interessert i. (Hvis min Thompson tau er riktig har jeg en test som holder 0,2929 innenfor i motsetning til Q-testen) Det er selve beregingene som er interessant.
Fint at du/dere tar dere tid til litt grubling.