Logo: Statystyka dla Fizyków
... śmiertelnych - stu na stu.
Liczba, która jak dotąd nie uległa zmianie.

Wisława Szymborska,
Przyczynek do statystyki

Wykład

STATYSTYKA DLA FIZYKÓW (in spe)

(studentów fizyki jądra atomowego i cząstek elementarnych)

Rok IV i V

Wydział Fizyki UW

Semestr zimowy, rok akademicki 2008/2009

        Metody statystycznej analizy danych doświadczalnych w dziedzinie fizyki jądra i cząstek elementarnych stanowią integralną część warsztatu fizyka doświadczalnika. Gdy przystępujecie Państwo do studiów nad tymi dziedzinami wiedzy,  nieomal na każdym kroku spotykacie się z wieloma pojęciami statystki matematycznej i jej procedurami, gdzie wielokrotnie powtarzają się takie terminy jak: minimum chi-kwadrat, metoda największej wiarogodności, poziom ufności itp. Potrzebują Państwo także stosownej wiedzy z tego zakresu prowadząc analizę własnych danych doświadczalnych zebranych na potrzeby pracy magisterskiej. Aby ułatwić Państwu kontakt z tymi, jak również wieloma innymi pojęciami, wytłumaczyć skąd sie one biorą, co oznaczaja i do czego służa, prowadził będę wykład ze statystyki matematycznej adresowany własnie do studentów IV i/lub V roku, a także doktorantów specjalizujących się w dziedzinie doświadczalnej fizyki jądra atomowego i cząstek elementarnych. Wykład prowadzony jest na średnim poziomie trudności i nie wymaga od słuchacza żadnej specyficznej wiedzy. Wystarczy elementarne doświadczenie życiowe wyniesione z Pierwszej Pracowni Studenckiej, podstawowe umiejętnosci z zakresu rachunku różniczkowego i całkowego, troche wyobraźni i dobre chęci.

        Wykład odbywa się wg książki wykładowcy: Statystyka dla fizyków, PWN, Warszawa, 2002 (patrz niżej). Ponieważ materiał prezentowany w książce jest istotnie szerszy niż ten, jaki jest przedstawiany na wykładzie, dlatego też warto zajrzeć do minimum wymagan programowych określających treści niezbędne do zaliczenia przedmiotu (PostScriptowa wersja skompresowana w formacie ZIP - 44 Kb - dostępna jest tutaj).

        Zajęcia, obecność na których nie jest obowiązkowa, odbywają sie dwa razy w tygodniu po dwie godziny i mają charakter zintegrowany, tzn. w tok wykładu wplecione są ćwiczenia rachunkowe wykonywane przez słuchaczy-ochotników.

Kreska pozioma - tecza

Zasady zaliczenia przedmiotu.

O zaliczeniu przedmiotu zadecyduje łączny wynik z zadań domowych, dwóch kolokwiów i egzaminu pisemnego na koniec semestru. Względna waga każdego z tych elementów wynosi:
  • zadania domowe nie są obowiązkowe, ale ich rozwiązywanie może dostarczyć maksimum 10% punktów,
  • każde z kolokwiów: 25%,
  • egzamin: 50%.

  • Do zaliczenia wykładu należy uzyskać minimum 50% punktów.

    Kreska pozioma - tecza

  • Termin wykładu: wtorek: 8:15 - 10:00 (sala SDT) i czwartek 15:15 - 17:00 (sala SST);
  • Terminy kolokwiów: te ustalają władze Wydziału,
  • Termin konsultacji: ..., pokój 13 w pawilonie IPJ (gorąco zachęcam wszystkich do udziału i oczekuję dowolnych pytań, nie wykluczajćc następujacego: Jak rozwiazać to zadanie, w którym ....); mogą także wpaść Panstwo do mnie bez zapowiedzi, bądż umowić sie e-mailem,
  • Termin egzaminu: ustalają władze Wydziału.

  • Na egzaminie i kolokwiach dozwolone są wszelkie pomoce: notatki, skrypt, książki, kalkulator, laptop, ... ale nie środki telekomunikacji.

    Kreska pozioma - tecza

        Książka Statystyka dla fizyków obejmuje wszystkie podstawowe pojęcia przedmiotu. Po Wstępie ukazującym literaturę przedmiotu i stosowaną symbolikę matematyczną, Rozdział 1 ilustruje rolę statystyki matematycznej w fizyce jądra i cząstek elementarnych. Prezentacja rachunku prawdopodobieństwa - Rozdział 2 - odbywa sią przez odwołanie się do klasycznej - częstościowej - definicji prawdopodobieństwa i funkcji gęstości, po czym następuje przejście do układu pewników, po których przedstawione są fundamentalne pojęcia rachunku prawdopodobieństwa, tj. prawdopodobieństwo warunkowe, zdarzenia niezależne, dystrybuanata, przekształcenia zmiennych losowych, rozkłady brzegowe, rozkłady warunkowe, zagadnienie randomizacji rozkładu zmiennej losowej i jego związek z pomiarem. Rozdział konczy prezentacja twierdzenia Bayesa odgrywającego istotną rolę we współczesnej teorii prawdopodobieństwa. W Rozdziałe 3 przedstawione są klasyczne wyniki rachunku prawdopodobieństwa, jakimi są momenty rozkładów: wartość oczekiwana, wariancja, kowariancja i współczynnik Pearsona korelacji liniowej, a także wyższe momenty wraz z własnościami tych wielkości. W naturalny sposób pojawiają się tu również wyniki dotyczące momentów funkcji zmiennych losowych, co w żargonie okreslane jest mianem "propagacji błedów". W dalszej częsci Rozdziału pokrótce omówione jest zagadnienie warunkowej wartości oczekiwanej, czyli regresji pierwszego rodzaju i w kontekście metody najmniejszych kwadratów zagadnienie regresji drugiego rodzaju. Rozdział kończy krótka informacja o parametrach pozycyjnych - modzie, medianie i kwantylach. Rozdział 4 to pierwszy kontakt ze statystyka matematyczna. Omówiony jest w nim sposób konstrukcji nieobciążonych ocen momentów (w tym średniej ważonej) z danych doświadczalnych. Wprowadzona jest także dystrybuanta empiryczna. Rozdział 5 to fundamentalne rezultaty kombinatoryczne: wariacje i kombinacje, z powtórzeniami i bez, i prezentacja standardowych rozkładów prawdopodobieństwa najczęściej spotykanych w zastosowaniach: dwu- i wielomianowego (schemat Bernoulliego) , wykładniczego, Poissona, Gaussa jedno- i wielowymiarowego (wraz ze sformułowaniem centralnego twierdzenia granicznego), chi-kwadrat, Studenta, Fishera, Breita-Wignera i jednostajnego. Dla wszystkich tych rozkładów dyskutowane jest wyprowadzenie, kształt, momenty i formy graniczne wraz z przykładami zastosowań. Nastepny Rozdział, 6, to elementarne wprowadzenie do metod Monte Carlo i ich zastosowania w fizyce. Omówione jest tu zagadnienie generatora liczb z rozkładu jednostajnego i metody generacji zmiennych losowych podlegających innym rozkładom. Podane jest także parę prostych przykładów zastosowania metody symulacji numerycznej. Zagadnieniu estymacji parametrycznej poświecony jest Rozdział 7. Po krótkim omówieniu metody momentów, dyskutowane są własności estymatorów: zgodność, efektywność i dostateczność. Wprowadzone jest pojęcie funkcji wiarogodności i estymatora najbardziej efektywnego określonego przez twierdzenie Rao-Cramera. Dalej prezentowane są metody estymacji punktowej najwększej wiarogodności i najmniejszych kwadratów. Ta ostatnia dość szeroko dyskutowana jest w przypadku linowej zależności od estymowanych parametrów zarówno w przypadku znanych jak i nieznanych błedów wielkości mierzonych. Króciutko omówine jest także zagadnienie estymacji w przypadku nieliniowym, a trochę szerzej zagadnienie regresji danych normalnych. Rozdział kończy wprowadzenie i omówienie metody estymacji przedziałowej dla małych i dużych próbek. W przedostatnim Rozdziale, 8, prezentowane jest zagadnienie weryfikacji hipotez: test istotności i zgodności chi-kwadrat Pearsona. Ostatni Rozdzial, 9, prezentuje współczesną (Bayesowską) teorię prawdopodobieństwa. W książce zamieszczone są także 3 Suplementy: pierwszy poświęcony unormowaniom jakie parę lat temu zostaly wprowadzone w terminologii obowiązującej w dziedzinie statystyki matematycznej (patrz niżej), drugi  informuje o pewnej technice rachunkowej przydatnej przy ocenianiu własności estymatorów i trzeci podsumowuje informacje o rozkładach wykorzystywanych w książce. W formie oddzielnego zeszytu: Statystyka dla fizyków. Ćwiczenia (także: PWN, Warszawa, 2002) ujęty jest stosunkowo obfity zestaw zadań, o różnym stopniu trudności, związanych ze wszystkimi omawianymi zagadnieniami. Ponieważ książka jest adresowana do studentów fizyki jądra atomowego i cząstek elemetarnych, praktycznie wszystkie przykłady ilustrujące tok wykładu związane są z tymi dziedzinami wiedzy. Również zadania "wzbogacone" są w zagadnienia zwiazane z tą tematyką (choc autor, jako fizyk cząstek elementarnych, uległ zapewne pewnemu obciążeniu zawodowemu). 

            Książka i wykład Statystyka dla fizyków nie obejmuja niektórych standardowych zagadnień rachunku prawdopodobieństwa i statystyki matematycznej, by wspomnieć tylko: statystyki pozycyjne, funkcje charakterystyczne, analizę sekwencyjną, analizę wariancji i procesy stochastyczne. Spowodowane jest to względami czysto praktycznymi: w semestralnym wykładzie trudno byłoby pomieścic te tak obfite treściowo tematy. Ponadto, nie stanowią one materiału "pierwszej potrzeby" dla osoby, która przygotowuje pracę magisterską. Autor ufa, że zrozumienie zagadnień ujętych w książce da Czytelnikowi dobre podstawy do samodzielnego uzupełnienia tej wiedzy, gdyby taka potrzeba się pojawiła.

    Kreska pozioma - tecza

           Dla wygody Czytelnika zamieszczamy połączenie do strony tytułowej Particle Data Group, wydawców kompendium Particle Properties i zachęcamy Czytelnika do zapoznania się z nim. Dla ułatwienia dostepu, podajemy połaczenie do wybranych, przechowywanych lokalnie, kopii stron (w formacie PDF) tego kompendium: Probability, Statistics and Monte Carlo Techniques .

            Proponujemy także zajrzeć do Guide to the Expression of Uncertainity in Measurements (wersja dokumentu Miedzynarodowej Organizacji Normalizacyjnej (ISO - International Organization for Standarization), przyjęta przez amerykański Narodowy Instytut Normalizacji i Technologii (NIST - National Institute of Standards and Technology)). Te regulacje omówione są w jednym z Suplementow książki.

           Podajemy także połączenie E.T. Jaynes - Probability Theory: The Logic of Science do, wzmiankowanej we Wstępie do książki, publikacji, dość całościowo ujmującej zagadnienie współczesnej teorii prawdopodobieństwa.
          Trzy inne pozycje z zakresu Bayesowskiej analizy danych, to wspomniane we Wstępie  artykuly (wszystkie w formacie PostScriptowym, kompresja ZIP):
    T.J. Loredo - The Promise of Bayesian Inference for Astrophysics (ok. 130 KB, po rozpakowaniu ok. 380 KB, 49 stron);
    T.J. Loredo - From Laplace to Supernova (ok. 160 Kb, po rozpakowaniu ok. 500 Kb, 65 stron);
    Prasenjit Saha - Principles of Data Analysis (ok. 220 Kb; po rozpakowaniu ok. 800 Kb, 40 stron).

            Czytelnika bliżej zainteresowanego podejściem Bayesowskim do zastosowań rachunku prawdopodobieństwa w fizyce cząstek elementarnych, zachęcamy do zapoznania się z wykładem: Bayesian Reasoning in High Energy Physisc: Principles and Applications autorstwa Giulio D'Agostini.

    Kreska pozioma - tecza

    P.S. Czytelnika zainteresowanego podobnym wykładem, jednak adresowanym do szerszego grona, a nie tylko do fizyków, zachecam do odwiedzenia strony: Statystyka matematyczna.

    kreska pozioma - tecza

    Wykładowca:
    Roman J. Nowak,
    Hoza 69,
    Instytut Fizyki Doswiadczalnej,
    PL-00-681 Warszawa,
    pawilon, pokój 13,
    telefon 55-32-223,
    adres e-mail: rjn@fuw.edu.pl
     
    1 października 2008
    kreska pozioma - tecza