Ćwiczenia ze statystyki: Testowanie hipotez statystycznych -- repróbkowanie
W podejściu repróbkowania tworzymy statystyczny model badanego procesu i następnie badamy w drodze symulacji prawdopodobieństwa generowania przez ten model interesujących nas sytuacji. Największą uwagę musimy tu poświęcić na prawidłowe sformułowanie modelu, a następnie precyzyjne określenie prawdopodobieństwo jakiego zdarzenia nas naprawdę interesuje.
Załóżmy, że wymyśliliśmy metodę napromieniowywania muszek owocowych powodującą taką mutację, że potomstwo ich nie będzie miało jednakowej szansy na bycie samcem lub samiczką. W pierwszych 20 zbadanych przypadkach uzyskujemy 14 samców i 6 samiczek.
- Pytanie naukowe:
- Czy wyniki eksperymentu potwierdzają, że nasza metoda zaburza proporcję płci?
Najpierw musimy przetłumaczyć pytanie naukowe na pytanie statystyczne.
- Pytanie statystyczne:
- Jakie jest prawdopodobieństwo uzyskania zaobserwowanej próbki jeśli rzeczywista proporcja płci jest 1:1?
Z tego pytania wynikają dwie możliwe hipotezy:
- Hipoteza zerowa:
- Nowa metoda nie zaburza proporcji płci 1:1. Zaobserwowana próbka pochodzi z populacji, w której proporcja płci jest 1:1
- Hipoteza przeciwna:
- Zaobserwowana próbka pochodzi z populacji, w której proporcja płci nie jest 1:1.
- Prawdopodobieństwo, które musimy oszacować:
- Jakie jest prawdopodobieństwo uzyskania 14 lub więcej jedynek w serii 20 prób, jeśli prawdopodobieństwo jedynki jest
?
- Oznaczmy 1 -- samiec 0 -- samiczka.
- Zróbmy wektor 20 elementowy zawierający 10 zer i 10 jedynek.
- Wylosujmy ze zwracaniem nowy wektor 20 elementowy. (Jest to nasz model uzyskiwania 20 elementowej próbki z populacji o proporcji 1:1.) Zapamiętajmy ilość jedynek.
- Powtórzmy poprzedni krok 1000 razy
- Zróbmy histogram ilości jedynek.
- Policzmy ile razy zdarzyło sie 14 lub więcej jedynek (to odpowiada 14 lub więcej samców) i dodajmy do tego ilość przypadków gdy mieliśmy 6 lub mniej jedynek (to odpowiada 14 lub więcej samiczek). Wynik podzielmy przez ilość losowań (1000).
Powyższa procedura opisuje test dwustronny. Testu dwustronnego musimy użyć jeśli nie mamy istotnych powodów,żeby wierzyć,że nowa metoda działa jedynie na zwiększenie szansy pojawienia się samca.
Załóżmy, że krowy są bardziej wartościowe od byków. Bio-inżynier twierdzi, że przy pomocy pewnych zabiegów jest w stanie spowodować zwiększenie szansy na urodzenie się krowy powyżej 50%. W jego eksperymencie na 10 urodzonych zwierząt 9 było krowami, a tylko 1 bykiem. Czy powinnniśmy wierzyć temu bio-inżynierowi? Jakia jest szansa na uzyskanie takiego, bądź bardziej ekstremalnego wyniku przy założeniu, że procedura stosowana przez naszego inżyniera nia ma żadnych efektów? W tym problemie dla odmiany założymy, że w normalnych warunkach 100 spośród 206 cieląt to krowy.
Władze miasta chciałyby wiedzieć, czy przyznać koncesję operatorowi sieci kablowej. W tym celu zleciły nam przeprowadzenie sądy wśród mieszkańców. Zapytaliśmy o zdanie 50 przypadkowo wybranych osób. 30 osób powiedziało "tak" a 20 "nie". Na ile pewnie otrzymane wyniki wskazują, że mieszkańcy chcą tej kablówki?
Celem naszych badań jest uniknięcie błędu polegającego na tym, że powiemy iż większość miezkańców chce kablówki podczas gdy tak na prawdę to nie chce.
Wskazówka: Granicznym przypadkiem popełnienia tego błędu jest proporcja 1:1 zwolenników i przeciwników kablówki. Jeśli przeciwników kablówki byloby jeszcze więcej to uzyskanie naszych wyników byłoby jeszcze mniej prawdopodobne.
W ankiecie uzyskaliśmy 840 głosów popierających kandydaturę A i 660 kandydaturę B. Jaka jest szansa, że tak naprawdę kandydat B ma poparcie 50% lub większe? Jakie jest prawdopodobieństwo pojawienia sie zaobserwowanej próbki lub próbki wskazującej na jeszcze większe poparcie dla kandydata A, jeśli w rzeczywistości poparcie kandydata A byłoby 50% lub mniej.
Badamy skuteczność leku na raka. Mamy grupę 12 chorych: 6 osobom podajemy lek -- poprawa wystąpiła u 5 osób, pozostałym sześciu osobom podajemy placebo -- poprawa wystąpiła u 2 osób. Czy te wyniki upoważniają do stwierdzenia, że lek istotnie zwiększa szansę poprawy?
Uwaga: W tym zadaniu porównujemy dwie grupy ze sobą.
- Jaka jest hipoteza zerowa?
- Rozkład jakiej wielkości musimy zbadać?
Rozważmy dwie ankiety przeprowadzone w USA, pytano 1500 respondentów o stosunek do legalizacji marihuany. Pierwszą ankietę przeprowadzono w 1980, wówczas za legalizacją opowiadało się 52% a drugą w 1985 i za legalizacją było 46%. Czy wyniki tych dwóch ankiet są istotnie różne?
Z jaką proporcją powinniśmy porównywać te wyniki?
Jaka jest hipoteza zerowa?
Badano grupę 605 osób. 135 osób z tej gurpy miało wysoki poziom cholesterolu a 470 niski. W grupie z wysokim poziomem cholesterolu odnotowano 10 przypadków zawału serca a w grupie z niskim poziomem 21, w czasie 16 lat obserwacji. Nasze pytanie brzmi: Czy możemy uznać, że wysoki poziom cholesterolu zwiększa ryzyko zawału serca?
Innymi słowy: czy możemy założyć, że obie grupy pochodzą z tej samej "populacji"?
Badamy dwie nowe karmy dla świń; nazwijmy je A i B. Mamy dwie grupy po 12 zwierząt. Uzyskane przyrosty masy są następujące:
A: 31 34 29 26 32 35 38 34 31 29 32 31
B: 26 24 28 29 30 29 31 29 32 26 28 32
Czy któraś z karm daje istotnie większe przyrosty masy?
Rozważmy pięć planet znanych w antycznym świecie. Chcemy zbadać, czy planety wewnętrzne Merkury (0.68) i Wenus (0.94) mają istotnie większe gęstości niż planety zewnętrzne Mars(0.71) Jowisz (0.24) i Saturn(0.12)?
Ćwiczenia ze statystyki: Testowanie hipotez statystycznych -- repróbkowanie
This document was generated using the
LaTeX2HTML translator Version 2002-2-1 (1.70)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html hypothesis_resamp.tex -split 0
The translation was initiated by Jaroslaw Zygierewicz on 2003-10-29
Jaroslaw Zygierewicz
2003-10-29