poniedziałek, 3 grudnia 2012

Proces autoregresji pierwszego rzędu – model zależności od historycznych wartości


Najprostszy przypadek procesu autoregresji został omówiony ostatnio. Jest to model zawierający jeden parametr liczbowy, determinujący zależność jego bieżącej wartości od poprzedniej. Warto jednak zwrócić uwagę na fakt, że zależność ta ma charakter rekurencyjny, skoro odwołuje się do wartości tego samego procesu. W istocie oznacza to, że w chwili bieżącej model odwzorowuje całą jego – teoretycznie przynajmniej – nieskończoną historię. Proponuję zatem bliżej przyjrzeć się wzorom określającym funkcyjną postać tego odwzorowania.

Jak wspomniałem ostatnio, formalny aparat matematyczny służący do badania tego typu modeli jest dość złożony – wymaga rozwiązywania układów równań (choć na szczęście liniowych). Natomiast, jak łatwo się domyślić, liczba niewiadomych i zarazem równań w nich występujących zależy wprost od rzędu modelu, czyli liczby określającej liczbę wartości przeszłych, jawnie występujących w jego definicji. Skoro rozważamy model pierwszego rzędu, to można liczyć na to, że układ równań stanie się pojedynczą prostą formułą.

I tak będzie w istocie, natomiast w pierwszej kolejności, aby przybliżyć nieco intuicyjnie sens rozważanej zależności funkcyjnej, rozpiszemy ją korzystając wielokrotnie z przejścia do wartości o jeden indeks wcześniejszych. Kontynuując przekształcenia podawane w poprzednim odcinku, w każdym kroku cofamy się, podstawiając w miejsce danej wartości y, kombinację odpowiednich y oraz epsilon. Prowadzi to do następującej serii wzorów



Zatem mamy kombinację kolejno coraz wcześniejszych zmiennych epsilon, każdej mnożonej przez współczynnik alfa w coraz to wyższych potęgach. Nietrudno zauważyć, że we wzorze tym powstaje kombinacja o współczynnikach tworzących wspomniany wcześniej ciąg geometryczny. Zarazem pozostaje składnik zawierający pojedynczą wartość y, jednak o coraz dawniejszym indeksie i dodatkowo mnożony przez coraz wyższą potęgę alfa.

W tym momencie należy podać jedno z istotnych założeń, przy których model autoregresji ma w ogóle sens. Otóż w tym najprostszym przypadku, z pojedynczym parametrem, zakłada się, że jego wartość bezwzględna jest mniejsza od jedności. Innymi słowy, liczba alfa przyjmuje wartości z przedziału (-1, 1). A przy tym założeniu nasz ciąg geometryczny jest ciągiem zbieżnym, a wpływ potęgi alfa staje się malejący wraz oddalaniem się indeksu w czasie.

Oznacza to, że przy N przechodzącym do nieskończoności, otrzymujemy model opisywany przez nieskończoną sumę impulsów losowych o wagach wykładniczo malejących wraz z oddalaniem się w przeszłość:



Natomiast sens i przydatność tego modelu dla projektowania i analizy procesów zachodzących na rynkach kapitałowych postaram się ilustrować na przykładach, przedstawianych w kolejnych odcinkach.

6 komentarzy:

  1. Dlaczego autorgeresja dla sekwencji zysków miałaby przynieść lepsze rezultaty niż dla sekwencji cen? Wyznaczamy alfę(-y) na danych historycznych, epsilony na bieżących i prawie wiemy jaka cena będzie zaraz. Znając rozkład epsilonów możemy wyznaczyć wartość oczekiwaną i zagrać pod kątem najbardziej prawdopodobnego przyszłego epsilon...

    OdpowiedzUsuń
  2. Może dlatego, że średnia dla epsilonu wynosi zazwyczaj 0 i nie da się przewidzieć w którą stronę podąży cena (jaka będzie wartość epsilonu w okresie t+1). Do tego epsilonu się nie wyznacza - to jest "szum", który zostaje jako różnica między wynikiem modelu a wzorcem.
    Natomiast wartością oczekiwaną (średnią) jest wynik modelu bez epsilonu - tj. Yn = alfa*Yn-1

    Ja się natomiast zastanawiam czy w tym modelu nie zabrakło przypadkiem wyrazu wolnego (Bety)? Czy może to było celowe?

    OdpowiedzUsuń
    Odpowiedzi
    1. Można chyba przyjąć, że beta jest zawarta w epsilon - czyli jego średnia nie wynosi jednak 0?

      Usuń
  3. Niestety obawiam się, że tak nie można przyjąć :).
    Tak jak napisałem wcześniej - epsilon to "szum" wynikający z niedoskonałości modelu. Fakt, że beta (wyraz wolny) to stała i teoretycznie można ją "połączyć" z espilonem (wówczas rozkład epsilonu będzie trochę przesunięty w lewo bądź w prawo), jednak wydaje mi się, że nie będzie to formalnie zbyt poprawne - w końcu to dwie zupełnie niezależne od siebie zmienne - oznaczające zupełnie co innego.

    Aha i chyba jest literówka we wzorze - index przy Y jest mniejszy od index-u przy epsilonie a potęga jest o 1 większa więc:
    albo wzór ogólny powinien mieć:
    Alfa^(N+1)*Y(n-N+1)
    albo na końcu powinno być
    Alfa^(N-1)*epsilon(n-N-1)

    OdpowiedzUsuń
  4. Wygląda jednak, że epsilon nie jest tylko szumem a istotnym "impulsem losowym" - bez niego zyski tylko malałyby (-1<alfa<1), co jest sprzeczne z rzeczywisotością.
    Rozwinięty wzór powinien mieć "-1" przy ostatnim wyrazie, ale końcowa suma jest poprawna inf-1=inf.

    OdpowiedzUsuń
  5. Indeks w końcowym (tzn. najdawniejszym) składniku faktycznie był błędny - powinna być (N-1)-sza potęga.

    Co do wartości oczekiwanej i stałego składnika (a raczej jego braku) to zakładam że wynosi zero. Innymi słowy, opisywany proces modeluje odchylenia od średniej.

    OdpowiedzUsuń