Najprostszy przypadek procesu autoregresji został omówiony ostatnio. Jest to model zawierający jeden parametr liczbowy,
determinujący zależność jego bieżącej wartości od poprzedniej. Warto jednak
zwrócić uwagę na fakt, że zależność ta ma charakter
rekurencyjny, skoro odwołuje się do wartości tego samego procesu. W istocie
oznacza to, że w chwili bieżącej model odwzorowuje całą jego – teoretycznie
przynajmniej – nieskończoną historię. Proponuję zatem bliżej przyjrzeć się
wzorom określającym funkcyjną postać tego odwzorowania.
Jak wspomniałem ostatnio, formalny aparat matematyczny
służący do badania tego typu modeli jest dość złożony – wymaga rozwiązywania
układów równań (choć na szczęście liniowych). Natomiast, jak łatwo się
domyślić, liczba niewiadomych i zarazem równań w nich występujących zależy
wprost od rzędu modelu, czyli liczby określającej liczbę wartości przeszłych,
jawnie występujących w jego definicji. Skoro rozważamy model pierwszego rzędu,
to można liczyć na to, że układ równań stanie się pojedynczą prostą formułą.
I tak będzie w istocie, natomiast w pierwszej kolejności,
aby przybliżyć nieco intuicyjnie sens rozważanej zależności funkcyjnej, rozpiszemy
ją korzystając wielokrotnie z przejścia do wartości o jeden indeks
wcześniejszych. Kontynuując przekształcenia podawane w poprzednim odcinku, w
każdym kroku cofamy się, podstawiając w miejsce danej wartości y, kombinację odpowiednich y oraz epsilon. Prowadzi to do następującej serii wzorów
Zatem mamy kombinację kolejno coraz wcześniejszych
zmiennych epsilon, każdej mnożonej
przez współczynnik alfa w coraz to
wyższych potęgach. Nietrudno zauważyć, że we wzorze tym powstaje kombinacja o
współczynnikach tworzących wspomniany wcześniej ciąg geometryczny. Zarazem pozostaje składnik zawierający
pojedynczą wartość y, jednak o coraz
dawniejszym indeksie i dodatkowo mnożony przez coraz wyższą potęgę alfa.
W tym momencie należy podać jedno z istotnych założeń,
przy których model autoregresji ma w ogóle sens. Otóż w tym najprostszym
przypadku, z pojedynczym parametrem, zakłada się, że jego wartość bezwzględna
jest mniejsza od jedności. Innymi słowy, liczba alfa przyjmuje wartości z przedziału (-1, 1). A przy tym założeniu
nasz ciąg geometryczny jest ciągiem zbieżnym, a wpływ potęgi alfa staje się malejący wraz oddalaniem
się indeksu w czasie.
Oznacza to, że przy N
przechodzącym do nieskończoności, otrzymujemy model opisywany przez nieskończoną sumę impulsów losowych o
wagach wykładniczo malejących wraz z oddalaniem się w przeszłość:
Natomiast sens i przydatność tego modelu dla projektowania
i analizy procesów zachodzących na rynkach kapitałowych postaram się ilustrować
na przykładach, przedstawianych w kolejnych odcinkach.
Dlaczego autorgeresja dla sekwencji zysków miałaby przynieść lepsze rezultaty niż dla sekwencji cen? Wyznaczamy alfę(-y) na danych historycznych, epsilony na bieżących i prawie wiemy jaka cena będzie zaraz. Znając rozkład epsilonów możemy wyznaczyć wartość oczekiwaną i zagrać pod kątem najbardziej prawdopodobnego przyszłego epsilon...
OdpowiedzUsuńMoże dlatego, że średnia dla epsilonu wynosi zazwyczaj 0 i nie da się przewidzieć w którą stronę podąży cena (jaka będzie wartość epsilonu w okresie t+1). Do tego epsilonu się nie wyznacza - to jest "szum", który zostaje jako różnica między wynikiem modelu a wzorcem.
OdpowiedzUsuńNatomiast wartością oczekiwaną (średnią) jest wynik modelu bez epsilonu - tj. Yn = alfa*Yn-1
Ja się natomiast zastanawiam czy w tym modelu nie zabrakło przypadkiem wyrazu wolnego (Bety)? Czy może to było celowe?
Można chyba przyjąć, że beta jest zawarta w epsilon - czyli jego średnia nie wynosi jednak 0?
UsuńNiestety obawiam się, że tak nie można przyjąć :).
OdpowiedzUsuńTak jak napisałem wcześniej - epsilon to "szum" wynikający z niedoskonałości modelu. Fakt, że beta (wyraz wolny) to stała i teoretycznie można ją "połączyć" z espilonem (wówczas rozkład epsilonu będzie trochę przesunięty w lewo bądź w prawo), jednak wydaje mi się, że nie będzie to formalnie zbyt poprawne - w końcu to dwie zupełnie niezależne od siebie zmienne - oznaczające zupełnie co innego.
Aha i chyba jest literówka we wzorze - index przy Y jest mniejszy od index-u przy epsilonie a potęga jest o 1 większa więc:
albo wzór ogólny powinien mieć:
Alfa^(N+1)*Y(n-N+1)
albo na końcu powinno być
Alfa^(N-1)*epsilon(n-N-1)
Wygląda jednak, że epsilon nie jest tylko szumem a istotnym "impulsem losowym" - bez niego zyski tylko malałyby (-1<alfa<1), co jest sprzeczne z rzeczywisotością.
OdpowiedzUsuńRozwinięty wzór powinien mieć "-1" przy ostatnim wyrazie, ale końcowa suma jest poprawna inf-1=inf.
Indeks w końcowym (tzn. najdawniejszym) składniku faktycznie był błędny - powinna być (N-1)-sza potęga.
OdpowiedzUsuńCo do wartości oczekiwanej i stałego składnika (a raczej jego braku) to zakładam że wynosi zero. Innymi słowy, opisywany proces modeluje odchylenia od średniej.