Aplet „Funkcja gęstości prawdopodobieństwa (FGP) a posteriori – rozkład Beta i analiza Bayesowska” ilustruje najprostsze zastosowanie rozkładu Beta do analizy Bayesowskiej estymującej wartość nieznanego współczynnika leżącego w zakresie <0,1>. Uwaga: poniżej Beta pisane dużą literą oznacza specyficzny rozkład, a beta pisane małą literą oznacza jego parametr. Wynika to ze zwyczajowego zapisu gdzie parametry rozkładu Beta oznaczamy dwoma pierwszymi literami alfabetu greckiego.
Rozkład Beta(alfa,beta)(x) to funkcja gęstości prawdopodobieństwa zmiennej x w zakresie <0,1> zależna od dwóch parametrów rzeczywistych dodatnich alfa i beta. W szczególności dla alfa=beta=1 rozkład Beta jest równy jednorodnej funkcji gęstości na odcinku <0,1>.
Rozkład ten spełnia ważną rolę w analizie Bayesowskiej jako że należy do klasy tzw. rozkładów sprzężonych (conjugate priors). Oznacza to, że jeśli FGP a priori pewnego parametru wyrazimy poprzez rozkład Beta(alfa, beta) to FGP a posteriori wyrażona będzie również rozkładem Beta tylko o innych parametrach: Beta(alfa’ , beta’). Zachodzi zawiązek: alfa’=alfa+r oraz beta’=beta+n-r gdzie „n” to liczba prób po których obliczmy funkcję a posteriori, a „r” to liczba sukcesów osiągniętych w tych próbach. Widać zatem, że FGP a priori w postaci rozkładu Beta warto stosować w przypadku, gdy badamy prawdopodobieństwo osiągnięcia sukcesu w pojedynczej próbie. Przykładem może być rzut monetą – nasze początkowe oszacowanie prawdopodobieństwa wyrzucenia orła (przyjmijmy to za sukces) możemy opisać rozkładem Beta(alfa, beta). Po wykonaniu n rzutów, w których wyrzuciliśmy r orłów nasza intuicja co do prawdopodobieństwa wyrzucenia orła (używaną monetą) powinna zmienić się na rozkład Beta(alfa’, beta’). Dla przykładu startując z FGP a priori: Beta(10,10) w której prawdopodobieństwo sukcesu ma wartość oczekiwaną i modę wynoszącą 0.5 (czyli moneta jest najprawdopodobniej uczciwa), po uzyskaniu r=9 sukcesów w n=10 próbach moda zmieni się do 0.643, a więc wskazuje, że moneta może być zafałszowana na korzyść wyrzucania orłów.
Aplet „Funkcja gęstości prawdopodobieństwa (FGP) a posteriori – rozkład Beta i analiza Bayesowska” ilustruje obie FGP (a priori oraz a posteriori), przy czym druga z nich wyliczana jest dla określonej przez użytkownika wartości liczby prób „n” i liczby sukcesów „r”. Użytkownik powinien zatem wybrać z pomocą suwaków z lewej strony parametry „alfa” i „beta” opisujące FGP a priori (rozkład Beta(alfa, beta) oraz wartości „n” i „r”. Na wykresie można wtedy zobaczyć wybraną przez użytkownika FGP a priori (krzywa niebieska) oraz obliczoną FGP a posteriori (krzywa czerwona). Aplet wypisuje (z lewej strony) parametry FGP a posteriori: alfa’ i beta’ oraz wylicza wartość oczekiwaną i modę obu FGP (wypisywane są nad wykresem). W przypadku, gdy wielkości te nie istnieją aplet wypisuje wartość nieokreśloną (NaN).
Aplet wylicza także, poprzez całkowanie numeryczne, wartości granice obszaru o największej funkcji gęstości prawdopodobieństwa (HDPR – highest density probability region) na poziomie wiarygodności 0.95. Jego lewa i prawa granica (odpowiednio HDPRL i HDPRR) są wypisywane w lewym górnym rogu ekranu. Na wykresie obszar HDPR zaznaczony jest jasnoróżowym tłem. HDPR jest odpowiednikiem przedziału ufności w standardowej (niebayesowskiej) analizie danych, a poziom wiarygodności odpowiada poziomowi ufności. Dokładniejsze omówienie (istotnych) różnic pomiędzy tymi wartościami, jak i podstaw wnioskowania w analizie Bayesowskiej są omawiane na wykładzie metod statystycznych.
Pracując z apletem proszę zbadać również następujące przypadki:
a) nieinformatywny prior : wybierając FGP a priori jako Beta(1,1) proszę zaobserwować zależność FGP a posteriori (kształt, wartość oczekiwana, moda) od liczby prób i liczby sukcesów, a także szerokość HDPR w zależności od liczby sukcesów.
b) prior przypominający funkcję Gaussa (alfa=beta) dla różnych wartości alfa=beta, co wpływa na wariancję rozkładu. Jak zmienia się FGP a posteriori gdy porównamy np. wyniki dla FGP a priori danej rozkładem Beta(3,3) z wynikami dla FGP a priori danej rozkładem Beta(10,10) przy ustalonych n=10 i r=9.
c) rozkład Beta zmienia znacząco kształt dla małych wartości alfa i beta (0.5; 1.0, 1.5, 2.0). Proszę zapoznać się z kształtem rozkładu Beta dla kombinacji tych wartości i zobaczyć jak otrzymywane wyniki (n,r) wpływają na FGP a posteriori.