poniedziałek, 26 listopada 2012

Parametryczny opis procesu autoregresji


W poprzednim tekście zaproponowałem badanie sekwencji danych uzyskiwanych jako rezultaty stosowania strategii pod kątem modeli szeregów czasowych. Te modele mają za zadanie ująć w postaci ilościowej zależności zachodzące w obrębie tych ciągów liczb. Wskazałem na szczególną rolę procesu autoregresji. Teraz przejdę do wyjaśnienia jego sensu, zaczynając od podstawowych pojęć z nim związanych, aby później przejść do zastosowań w analizie rynków terminowych.

Pojęcie funkcji regresji jest dość powszechnie znane wśród osób zainteresowanych analizą danych, szczególnie ekonometrycznych. Jest to, w dużym uproszczeniu, forma ujęcia funkcyjnej zależności jednej wielkości od drugiej. A zależność ta ma formę funkcji liniowej. Występują tam, w najprostszym przypadku, dwa współczynniki: współczynnik kierunkowy (tangens kąta nachylenia prostej regresji) oraz wyraz wolny. A ich dobór odbywa się z wykorzystaniem też klasycznej metody najmniejszych kwadratów.


Oczywiście funkcja ta może zostać uogólniona, od najprostszego przypadku jednej zmiennej zależnej, do ich większej ilości. Ale zawsze wyrażanej skończoną liczbą naturalną. I liczba ta musi być z góry znana, można powiedzieć arbitralnie dobrana przez badacza stosującego dany model liniowy. Dodatkowo, przypominając podstawową własność tej metody, należy wspomnieć, że równanie regresji nie opisuje dokładnej funkcyjnej zależności pomiędzy zmiennymi w nim występującymi, a jedynie związek przybliżony. Nieodłącznym jego składnikiem jest element losowy.

Przyjmując „książkową” konwencję oznaczeń, w której zmienne wejściowe (argumenty) są symbolizowane przez litery x, a wynik (wartość funkcji) przez y, równanie regresji przybiera prostą postać, w której dodatkowo składnik losowy oznacza się często grecką literą epsilon.


Współczynniki oznaczane greckimi literami alfa są parametrami modelu. Ich dobór, za pomocą wspomnianej wyżej metody najmniejszych kwadratów (ang. least squares, LS) jest zadaniem obliczeniowo prostym, oczywiście przy założeniu, że dostępne są zbiory danych wejściowych i wynikowych, w postaci tablic o odpowiedniej liczebności. W takiej sytuacji dopasowanie parametrów modelu do tych danych można zrealizować przy użyciu powszechnie dostępnych narzędzi – nie tylko specjalizowanych programów statystycznych, ale praktycznie każdego arkusza kalkulacyjnego.

A jak to przenieść na przypadek szeregów czasowych, w szczególności sekwencji rezultatów stosowania strategii na rynkach instrumentów pochodnych? Cóż, nazwa procesu mówi sama za siebie – przedrostek „auto” oznacza funkcyjną zależność procesu od samego siebie. Intuicyjnie można to zrozumieć jako zależność bieżącej obserwacji od wartości poprzednich. Równanie, w którym wartości procesu są oznaczane literami y o kolejnych indeksach, przybiera tutaj zupełnie naturalną postać:



 Jak mówi tytuł, opis procesu jest parametryczny a parametrami są liczby alfa. Jak dobrać te parametry dla określonych wartości procesu, które są wynikiem obserwacji bądź symulacji? Efektywne algorytmy, wraz z formułami arkuszy kalkulacyjnych zostaną przedstawione w kolejnych tekstach.

Brak komentarzy:

Publikowanie komentarza