Dotarliśmy ostatnio do wykresu funkcji autokorelacji dla sekwencji zysków
osiąganych w kolejnych interwałach czasowych w wyniku użycia
strategii podążania za trendem. Teraz chciałbym parę zdań
poświęcić interpretacji uzyskanych wyników. Wyznaczając pewną
wielkość statystyczną warto mieć na uwadze to, jaki mają sens
przyjmowane przez nią wartości i czy istnieje jakieś naturalne
kryterium jakości – kiedy wyniki mają wydźwięk pozytywny a
kiedy oznaczają zjawisko niekorzystne.
W
pierwszej kolejności krótkie omówienie należy się kwestii znaków
przyjmowanych przez wartości tej funkcji, czyli kolejne
współczynniki autokorelacji. Na pozycji 0 jest oczywiście wartość
1, natomiast kolejne elementy przyjmują już wartości z przedziału
od -1 do 1, przy czym zwykle będziemy się spodziewać tam liczb o
niewielkiej wartości bezwzględnej. Co więcej, rozmieszczenie
znaków tych liczb nie może przyjmować dowolnego układu, co
postaram się krótko wyjaśnić poniżej.
Najprostsza
jest sytuacja, kiedy wszystkie wartości na pozycjach począwszy od
indeksu 1 mają znaki dodatnie. Oznacza to, że elementy w sekwencji,
niezależnie od ich położenia są ze sobą dodatnio skorelowane,
czyli wykazują podobieństwa pod względem rozkładu. Dodatkowo
należy się spodziewać, że w miarę wzrostu indeksu wartości tej
korelacji będą maleć, ponieważ zyski w interwałach są coraz
słabiej powiązane w miarę oddalania się tych interwałów od
siebie.
Nieco
ciekawsza jest sytuacja, kiedy pojawiają się autokorelacje ujemne.
Rozważmy
przykład kiedy autokorelacja o indeksie 1 jest liczbą ujemną.
Oznacza to, że elementy odległe od siebie o 1 pozycję są ujemnie
skorelowane. Prosta intuicja podpowiada, że skoro próbka o numerze
n jest ujemnie skorelowana z tą o numerze (n+1), a próbka (n+1)-sza
z próbką (n+2)-gą również, to pomiędzy próbkami n i (n+2)
powinna występować podobieństwo czyli korelacja dodatnia. Przez
analogię do szkolnej regułki „minus razy minus daje plus”.
Niestety,
trzeba pamiętać, że w
przypadku zmiennych, pomiędzy którymi zachodzą relacje o
charakterze statystycznym, mierzone za pomocą odpowiednich
wskaźników, proste reguły arytmetyczne przybierają nieco bardziej
złożone formy. Pamiętać należy o tym, że idealna przechodniość
lub antyprzechodniość relacji może mieć miejsce wtedy, gdy
związki pomiędzy nimi miałyby ściśle funkcyjny, jednoznaczny
charakter. A tak byłoby tylko dla współczynników korelacji
przyjmujących dokładnie wartości +/-1.
Natomiast
w przypadkach pośrednich związki pomiędzy poszczególnymi
zmiennymi mają bardziej lub mniej luźny
charakter. Poniżej przytaczam ponownie wykres autokorelacji
wyznaczony w poprzednim odcinku.
Jak
widać, ujemna
wartość na pozycji 1 nie stoi w sprzeczności z również ujemną
autokorelacją próbek odległych o 2 pozycje. Co więcej, ten drugi
związek ma większą siłę, co objawia się większą wartością
bezwzględną autokorelacji. Jednak ten ciąg ujemnych zależności
musi być kiedyś przerwany i, jak widzimy na wykresie, próbki
odległe o 3 pozycje mają już korelację dodatnią. Ogólna
prawidłowość jest taka, że funkcja autokorelacji nie może mieć
wyłącznie ujemnych współczynników. Ujemne wartości muszą
występować w przybliżeniu naprzemiennie z dodatnimi.
Uwagę
na wykresie powinny też przyciągnąć stosunkowo duże wartości na
odległych pozycjach. Może to wydawać się sprzeczne z
przypuszczeniem o słabnącej sile związków pomiędzy próbkami o
odległych pozycjach. Przyczyną może być występowanie zjawisk
sezonowych, np. cykli kwartalnych, półrocznych lub rocznych.
Zarazem też należy pamiętać o zjawisku rosnących błędów na
dalszych pozycjach funkcji autokorelacji wynikających z coraz
krótszych sekwencji próbek uwzględnianych przy jej wyznaczaniu.
Kwestia
wartości bezwzględnych autokorelacji
i dlaczego chcielibyśmy, aby były jak najmniejsze, zostanie podjęta
w następnym tekście.
Wykresy trochę przypomniały mi badanie średniej ilości świec tego samego koloru pod rząd - wynosi ona około 2 (trochę mniej dla krótszych interwałów, trochę więcej dla dłuższych - silniejsze trendy), dlatego postanowiłem trochę zmodyfikować arkusz i zamiast jednego z algorytmów podstawić przyrosty kursu (ceny close).
OdpowiedzUsuńWnioski: algorytmy foll dla różnych p są ze sobą dodatnio skorelowane, natomiast z kursem ujemnie. Pomimo tego wykres autokorelacji dla kursu nie różni się specjalnie od algorytmów (słupki mieszczą się w przedziale -0,3..0,3 ilość serii słupków o tym samym znaku mieści się w przedziale 6..12). Możnaby pokusić się o hipotezę, że przepuszczając kursy przez algorytm możnaby otrzymać kursy o sensownym rozkładzie do symulacji MC.
Ciekawe czemu chcielibyśmy niskiej autokorelacji, przewidywacze kursów wolą wysokie :).
Ujemna korelacja wyników strategii z kursami mnie też zaskakuje. Dzisiaj przyszła mi do głowy hipoteza o istnieniu zależności pomiędzy wynikami algorytmów a kursami ale z opóźnieniem. To można badać wyznaczając funkcje korelacji wzajemnych i to z przesunięciem czasowym. Prowadzi to m.in. do charakterystyk kospektralnych i kwadrospektralnych. Jeśli wnioski będą jakieś konstruktywne, to otrzymane rozkłady empiryczne faktycznie można wykorzystać do symulacji.
UsuńPytaniem o postulat niskiej autokorelacji trafiłeś w sedno planowanego przyszłego wątku. Teraz powiem tylko tyle - bo prace są w toku - że w przypadku prognozowania kursów faktycznie oczekuje się związków korelacyjnych pomiędzy rejestrowanymi próbkami. Natomiast dla wyników tradingu jednym z postulatów jest charakter "białego szumu". Innymi słowy, wszelkie zależności czasowe powinny być "skonsumowane" przez system transakcyjny, ergo nieobecne w sekwencjach rezultatów wynikowych.