W poprzednim tekście zaproponowałem badanie
sekwencji danych uzyskiwanych jako rezultaty stosowania strategii pod
kątem modeli szeregów czasowych. Te modele mają za zadanie ująć
w postaci ilościowej zależności zachodzące w obrębie tych ciągów
liczb. Wskazałem na szczególną rolę procesu
autoregresji.
Teraz przejdę do wyjaśnienia jego sensu, zaczynając od
podstawowych pojęć z nim związanych, aby później przejść do
zastosowań w analizie rynków terminowych.
Pojęcie
funkcji regresji jest dość powszechnie znane wśród osób
zainteresowanych analizą danych, szczególnie ekonometrycznych.
Jest to, w dużym uproszczeniu, forma ujęcia funkcyjnej zależności
jednej wielkości od drugiej. A zależność ta ma formę funkcji
liniowej. Występują tam, w najprostszym przypadku, dwa
współczynniki: współczynnik kierunkowy (tangens kąta nachylenia
prostej regresji) oraz wyraz wolny. A ich dobór odbywa się z
wykorzystaniem też klasycznej metody
najmniejszych kwadratów.
Oczywiście
funkcja ta może zostać uogólniona, od najprostszego przypadku
jednej zmiennej zależnej, do ich większej ilości. Ale zawsze
wyrażanej skończoną liczbą naturalną. I liczba ta musi być z
góry znana, można powiedzieć arbitralnie dobrana przez badacza
stosującego dany model liniowy. Dodatkowo, przypominając podstawową
własność tej metody, należy wspomnieć, że równanie regresji
nie opisuje dokładnej funkcyjnej zależności pomiędzy zmiennymi w
nim występującymi, a jedynie związek
przybliżony.
Nieodłącznym jego składnikiem jest element losowy.
Przyjmując
„książkową” konwencję oznaczeń, w której zmienne wejściowe
(argumenty) są symbolizowane przez litery x,
a wynik (wartość funkcji) przez y,
równanie regresji przybiera prostą postać, w której dodatkowo
składnik losowy oznacza się często grecką literą epsilon.
Współczynniki
oznaczane greckimi literami alfa
są parametrami modelu. Ich dobór, za pomocą wspomnianej wyżej
metody
najmniejszych kwadratów
(ang. least squares, LS) jest zadaniem obliczeniowo prostym,
oczywiście przy założeniu, że dostępne są zbiory danych
wejściowych i wynikowych, w postaci tablic o odpowiedniej
liczebności. W takiej sytuacji dopasowanie parametrów modelu do
tych danych można zrealizować przy użyciu powszechnie dostępnych
narzędzi – nie tylko specjalizowanych programów statystycznych,
ale praktycznie każdego arkusza kalkulacyjnego.
A
jak to przenieść na
przypadek szeregów czasowych, w szczególności sekwencji rezultatów
stosowania strategii na rynkach instrumentów pochodnych? Cóż,
nazwa procesu mówi sama za siebie – przedrostek „auto” oznacza
funkcyjną
zależność procesu od samego siebie.
Intuicyjnie można to zrozumieć jako zależność bieżącej
obserwacji od wartości poprzednich. Równanie, w którym wartości
procesu są oznaczane literami y
o kolejnych indeksach, przybiera tutaj zupełnie naturalną postać:
Jak
mówi tytuł, opis procesu jest parametryczny a parametrami są
liczby alfa.
Jak dobrać te parametry dla określonych wartości procesu, które
są wynikiem obserwacji bądź symulacji? Efektywne algorytmy, wraz z
formułami arkuszy kalkulacyjnych zostaną przedstawione w kolejnych
tekstach.
Brak komentarzy:
Prześlij komentarz