czwartek, 31 maja 2012

Dywersyfikacje, korelacje – jak to w praktyce policzyć?



W artykule Jak można mieć wroga i przyjaciela w tej samej osobie wskazałem na to jak koncepcja dwu wirtualnych inwestorów może prowadzić do redukcji ryzyka. Dalsze geometryczno  -  statystyczne dywagacje, mające w zamierzeniu liczbowe ujęcie tego zjawiska, doprowadziły do postulatu, aby współczynnik korelacji pomiędzy sekwencjami zysków był możliwie bliski zeru. Sens tego kryterium najlepiej zilustruje przykład, który przedstawię w obecnym odcinku.

Przykład ten zawiera dane reprezentujące sekwencje zysków osiąganych w kolejnych przedziałach czasowych przez „braci bliźniaków”. Te same dane, które były zaprezentowane na wcześniej omawianych wykresach. Przedział czasowy to tydzień kalendarzowy, a horyzont czasowy inwestycji, jak pamiętamy, wynosi nieco ponad rok. Daje to sekwencje każda o długości około 60 elementów. Jest to zdecydowanie zbyt dużo, aby był sens wykonywać obliczenia na kartce papieru, albo nawet przy użyciu zwykłego kalkulatora.

Dlatego też, jak w wielu podawanych w przyszłości przykładach, proponuję zaprzęgnięcie do pracy arkusza kalkulacyjnego. Ponieważ jednym z najpopularniejszych jest Excel, prezentować będę arkusze obliczeniowe właśnie w formacie danych stosowanym przezeń, czyli w postaci plików XLS. Dodatkowo warto pamiętać, że jakkolwiek aplikacja ta stanowi część komercyjnego pakietu Microsoft Office, to istnieje darmowy pakiet biurowy OpenOffice dostępny tutaj , który w wielu zastosowaniach zapewnia podobną funkcjonalność co jego komercyjny odpowiednik. Większość przykładowych arkuszy będę konstruować tak, aby możliwe było ich przeliczenie właśnie za pomocą OpenOffice.

Niezależnie od tego, dla czytelników zainteresowanych wykonaniem obliczeń w jakimkolwiek innym programie, podaję plik w formacie CSV. Jest on po prostu plikiem tekstowym, zawierającym w kolejnych linijkach wartości liczbowe oddzielane przecinkami. Wspominam o tym formacie między innymi dlatego, że w dalszych, nawet bardziej zaawansowanych przykładach, ten format będzie często stosowany do przekazywania końcowych albo pośrednich wyników obliczeń. W tym przypadku wartości te to odpowiednio: data w postaci liczby, wartość skumulowanego zysku inwestora podążającego za trendem, i analogiczna wartość dla inwestora antytrendowego.

Natomiast obliczenia zrealizowane za pomocą arkusza kalkulacyjnego można znaleźć w tym pliku. Pokrótce omówię teraz jego strukturę i układ komórek, licząc na to, że pomoże to w zrozumieniu metody obliczeń.

Kolumna A zawiera kolejne daty początków przedziałów czasowych w postaci liczbowej. Kolumna C zawiera wartości skumulowanych zysków inwestora protrendowego. Początkowa wartość równa 0 oznacza po prostu, że interesuje nas różnica pomiędzy bieżącą wartością jego kapitału a kapitałem początkowym. Kolejna kolumna zawiera, począwszy od drugiego tygodnia, różnice czyli zyski bądź straty osiągane w kolejnych tygodniach. Na samym jej dole znajduje się formuła wyznaczająca średnią arytmetyczną tych wartości, czyli średni tygodniowy wynik działania strategii.

Fragment danych dostępnych w pliku do którego link znajduje się w tekście


W kolejnej kolumnie znajdują się wartości wyników tygodniowych z odjętą średnią, ponieważ jak wskazałem z tekście o geometrycznej interpretacji tutaj, interesuje nas ryzyko jako wskaźnik odchyleń od średniego zysku. Z kolei kolumna F zawiera wartości poprzedniej podniesione do kwadratu. Na samym jej dole znajduje się pierwiastek kwadratowy sumy tych wartości, czyli po prostu długość wektora odchyleń (zwana też jego normą Euklidesową). Jest ona miarą ryzyka.



Analogiczny układ wartości znajduje się w kolumnach od H do K, oczywiście odpowiadając strategii antytrendowej. Kolumna M zaś zawiera iloczyny odchyleń jednej strategii i drugiej. Na jej dole znajduje się suma tych iloczynów czyli wspomniany już wcześniej iloczyn skalarny. W sąsiedniej komórce jest wartość tego iloczynu podzielona przez iloczyn długości wektorów obu strategii. Jak wiemy, w interpretacji statystycznej jest to po prostu współczynnik korelacji pomiędzy wynikami strategii w poszczególnych przedziałach czasowych.



W podanym przykładzie wartość tego współczynnika wynosi on niewiele ponad 0.02. Oznacza to, że wektory strategii są niemal idealnie ortogonalne. W następnej części zostaną podane obliczenia pokazujące w jaki sposób przekłada się to na redukcję ryzyka strategii uśrednionej.

Brak komentarzy:

Prześlij komentarz