next_inactive up previous


Ćwiczenia ze statystyki: Przedziały ufności

Wstęp

Bootstrap jest związany z pobieraniem próby. Najkorzystniejszą sytuacją jest ta, w której dla oszacowania różnych parametrów statystycznych populacji mamy możliwość pobierania z tej populacji wielu prób. Jeśli jest to niemożliwe możemy posłużyć się pobieranim wielokrotnie prób z tej próby którą posiadamy. Postępowanie takie jest sensowne pod warunkiem, że próba, która służy nam do generowania innych możliwych pobrań próby jest reprezentatywna. W bootstrapie losujemy ze zwracaniem (dlaczego?).

Przedział ufności (CI) odzwierciedla zarówno wielkość badanej grupy jak i zmienność analizowanej cechy wewnątrz tej grupy. Średnia będąca wynikiem przeprowadzonych badań nie jest równa rzeczywistej średniej populacyjnej. Rozbieżność między uzyskanym wynikiem a rzeczywistą średnią populacji zależy od wielkości badanej grupy oraz zmienności badanej cechy w jej obrębie. Jeśli badana grupa jest niewielka i ma dużą zmienność analizowanej cechy wówczas rozbieżność między średnią uzyskaną a rzeczywistą może być znaczna. Natomiast, jeśli badana grupa jest dużą z niewielką zmiennością danych wówczas uzyskana średnia będzie prawdopodobnie bardzo bliska średniej populacyjnej. CI jest określany z różnym procentem "zaufania", np. 90 czy też 95%. Najczęściej używa się 95% przedziału ufności, który przy założeniu, że grupa badana była zgromadzona w sposób losowy wskazuje z 95% pewnością, że w zakresie przedziału ufności znajduje się rzeczywista średnia populacyjna. Przedział ufności jest wskaźnikiem precyzji wykonanych pomiarów.

Pewnych problemów koncepcyjnych nastręcza konstrukcja przedziałów ufności. Dla danej znanej populacji możemy obliczyć średnią populacji oraz prawdopodobieństwo uzyskania konkretnej wartości średniej przy losowanie próby o zadanej liczebności z tejże populacji, możemy więc określić prawdopodobieństwo $ P$, że odległość średniej z próby i średniej z populacji jest $ D$. Mając do dyspozycji tylko próbę i zakładając, że jest ona reprezentatywna możemy metodą bootstrapu "wytworzyć" wiele innych prób z badanej populacji i oszacować jakie są granice, w które wpada rządana frakcja średnich (np.:90%, 95%).

Przykład

Rozważmy sondę przedwyborczą, mamy dwóch kandydatów na prezydenta. Ankietowano 1500 osób. 840 osób deklarowało poparcie dla kandydata A zaś 660 dla kandydata B. Na ile pewny może być kandydat A swojego zwycięstwa?

  1. Jak dokładnie brzmi pytanie? Jaki jest 95% przedział ufności dla poparcia kandydata A w całej populacji? Czy też innymi słowami: W jakim przedziale na 95% znajduje się proporcja glosujących popierających kandydata A.
  2. Nasze najlepsze mniemanie o własnościach "świata" z którego pochodzą dane otrzymujemy ze zwykłej proporcji. Wynika z niej, że kandydat A ma poparcie 56% zaś kandydat B poparcie 44% wyborców.
  3. Przypiszmy do kandydata A 0 zaś do B 1
  4. Pobranie ankiety modelujemy przez pobranie losowo 1500 próbek z modelu naszego "świata" czyli wektora złożonego z 56 zer i 44 jedynek. Wynikiem jednej ankiety jest proporcja popierających kandydata A (lub B)
  5. Zbieramy rozkład proporcji - musimy w tym celu "przeprowadzić" wielokrotnie ankietę. Narysujmy histogram.
  6. Chcemy znaleźć 95% przedział ufności musimy znaleźć percentyl 2.5 oraz 97.5. Liczby te stanowią poszukiwany przedział ufności.

Zadania

Przyrost masy w nowej diecie

Producent karmy dla zwierząt chciał przetestować nowy rodzaj karmy. Próbki podawał 12 zwierzakom przez 4 tygodnie. Po tym czasie zanotował następujące przyrosty masy:
15.43 16.92 14.43 12.94 15.92 17.42 18.91 16.92 14.93 14.49 15.92 15.43 kg
średni przyrost wynosi 15.80 kg. producent widzi jednak, że w próbie jest dość znaczny rozrzut pomiędzy poszczególnymi zwierzętami $ 12.94 - 18.91$ i nie jest pewien czy można reklamować nowy pordukt podając średni przyrost 15.8 kg. Podejrzewa, że inna grupa zwierząt może mieć zupełnie inną średnią.

Średnica drzew

Ogrodnik eksperymentuje z nowym gatunkiem drzew. Posadził 20 sztuk i po dwóch latach zmierzył następujące średnice pni (w cm):
8.5 7.6 9.3 5.5 11.4 6.9 6.5 12.9 8.7 4.8 4.2 8.1 6.5 5.8 6.7 2.4 11.1 7.1 8.8 7.2

Zawartość aluminium w Tebańskich naczyniach.

Zawartość procentowa aluminium w 18 antycznych naczyniach z Teb była następująca:
11.4 13.4 13.5 13.8 13.9 14.4 14.5 15 15.1 15.8 16 16.3 16.5 16.9 17 17.2 17.5 19.0
Jaka jest mediana procentowej zawartości aluminium i jaki jest 95% przedział ufności.

Przedział ufności dla różnicy dwóch średnich

Mamy 7 myszy, którym podano środek, który miał poprawić ich przeżywalność po operacji oraz 9 myszy kontrolnych, którym owego środka nie podano. Myszy traktowane specjalnie przeżyły
94 38 23 197 99 16 141 dni
a myszy traktowane standardowo:
52 10 40 104 51 27 146 30 46 dni
Srednia różnica wynosi 30.63 dni dłużej dla myszy traktowanych po nowemu. Pytanie, na które chcielibyśmy znać odpowiedź to: Czy nowy środek faktycznie poprawia przeżywalność.

Skonstruujmy przedział ufności 95% dla średniej różnicy w przeżywalności.

Uwaga: przy tym problemie każdą z grup traktujemy jako reprezentantów bardzo dużych populacji.

Przedział ufności dla proporcji

W badaniach nad cholesterolem u ludzi stwierdzono, że w grupie 135 badanych z wysokim poziomem cholesterolu 10 osób przeszło zawał serca. Pytanie: Na ile pewni możemy być, że jeśli weźmiemy dużo większą grupę pod uwagę to proporcja zawałowców będzie podobna? Obejrzeć histogram. Jakie wnioski?

Bezrobotni

W próbce 200 osób 7 procent jest bezrobotnych. Określić 95% przedział ufności dla prawdziwej średniej w populacji.

Żywotność baterii

W próbce 20 testowanych baterii stwierdzono średni czas życia 28.85 miesiąca. Określić 95% przedział ufności dla średniej. Wartości dla badanej próbki były następujące:
30 32 31 28 31 29 29 24 30 31 28 28 32 31 24 23 31 27 27 31 miesięcy

Pomiary

Mamy 10 pomiarów pewnej wielkości:
0.02 0.026 0.023 0.017 0.022 0.019 0.018 0.018 0.017 0.022
Proszę znaleźć średnią i 95% przedział ufności. Czy pomiarów jest wystarczająco dużo aby sensownie wyznaczyć średnią i przedział ufności?

About this document ...

Ćwiczenia ze statystyki: Przedziały ufności

This document was generated using the LaTeX2HTML translator Version 2002-2-1 (1.70)

Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

The command line arguments were:
latex2html bootstrap.tex -split 0

The translation was initiated by Jaroslaw Zygierewicz on 2003-10-29


next_inactive up previous
Jaroslaw Zygierewicz 2003-10-29