Regresja liniowa

Aplet „Regresja liniowa” pozwala na porównanie rodzajów regresji liniowej: klasycznej (bez uwzględniania niepewności punktów), zwyczajnej (każdemu punktowi przypisujemy tę samą niepewność - średnia z prawdziwych niepewności punktów) i ważonej (uwzględniająca założone niepewności). Dla wszystkich przypadków dopasowywany jest model y=ax+b. Pierwszym krokiem jaki należy wykonać jest dodanie punktów (wraz z niepewnościami – niezależnie od rodzaju planowanej regresji). Można tego dokonać na trzy sposoby:
a) wpisując wartości współrzędnych punktów w polach „X-coord” i „Y-coord” oraz wartości ich niepewności w polach „ErrorX” i „ErrorY”, a następnie wybierając przycisk „Add Point”. Czynność tę należy powtórzyć dla wszystkich punktów do których będziemy dopasowywać prostą.
b) dodając punkty za pomocą myszki. W tym celu należy naprzód wybrać opcję „Click ON”. Następnie należy ustawić wartości niepewności w polach „ErrorX” i „ErrorY”, i wreszcie dodać punkt na wykresie poprzez kliknięcie myszką.
c) wczytując odpowiednie dane ze zbioru (opcja „Add file”): w kolejnych wierszach powinny być podane kolejno wartości X-coord, Y-coord, ErrorX, ErrorY oddzielone przecinkami. Przykładowe dwie linie zbioru wyglądają następująco:
1,8.3,0.1,4
2,17.3,0.2,3.5


Punkty możemy usuwać przez równoczesne naciśnięcie klawisza „Ctrl” i kliknięciu na punkt myszką. Drugim krokiem jest wybór rodzaju regresji: należy wybrać, czy niepewności mają być brane pod uwagę (opcja „Consider Errors”) czy nie („Do Not Consider Errors”). Ustawiając wartość niepewności i wybierając „For All” zmieniamy niepewności dla wszystkich punktów naraz. Wreszcie w ostatniej linii opcji („Lines”) wybieramy, jakie proste i krzywe będą pokazane na wykresie:
a) “Central”: y=a*x+b
b) “With Std”: y=(a+Sa)*x+b, y=(a-Sa)*x+b, y=a*x+b+Sb oraz y=a*x+b-Sb
c) “Extreme”: y=(a+Sa)*x+b+Sb, y=(a-Sa)*x+b+Sb, y=(a+Sa)*x+b-Sb oraz y=(a-Sa)*x+b-Sb
d) “Coinfidence”: obwiednie pęku prostych wyznaczonych przez parametry a i b leżące w ich przedziałach ufności na poziomie ufności wybranym w wierszu „Coinfidence level”. Odpowiada to estymacji położenia (współrzędnej Y) już istniejących punktów
e) „Prediction”: obwiednie pokazujące na poziomie ufności wybranym w wierszu „Coinfidence level” estymację położenia (współrzędnej Y) nowego punktu (pochodzącego np. z tego samego pomiaru co już dodane punkty). Otrzymane parametry regresji wyświetlane są poniżej wykresu. Wyświetlane Delta_a i Delta_b (oznaczone powyżej jako Sa i Sb) to wartości estymatora odchylenia standardowego pomnożone przez odpowiedni kwantyl rozkładu t-Studenta o (n-2) stopniach swobody, gdzie n to liczba punktów do których dopasowujemy prostą. Wzory nie występujące na wykładzie można znaleźć np. w M.Rouaud „Probability, Statistics and Estimation”.
Wartości te i sam wykres pozwala na oszacowanie w jakim obszarze zawierają się proste będące wynikiem procedury regresji. Szczególnie ciekawe jest zbadanie przypadku regresji ważonej i obserwacja, jak dołożenie kolejnego punktu zmienia parametry prostej, w zależności od odległości dokładanego punktu od pozostałych punktów i wartości jego niepewności. Jak można prześledzić, dołożenie punktu o dużej niepewności nieznacznie zmienia parametry, a dołożenie punktu o małej niepewności ma na nie duży wpływ. Proszę również zaobserwować paradoks Simpsona. Proszę zbadać również co dzieje się gdy punkty są nieskorelowane ze sobą liniowo, np. ułożone na okręgu. W razie potrzeby zakres osi możemy ustalić w wierszu „Axis Range”.