Нормальность совместного распределения

Известна следующая теорема: если совместное распределение компонент случайного вектора (X1 , X2 , …, Xn) является нормальным, то любая линейная комбинация этих компонент
с 1 X 1 + с 2 X 2 + … + с n X n (1)
также имеет нормальное распределение. Верно и обратное: если всякая линейная комбинация вида (1) имеет нормальное распределение, то нормальным является и совместное распределение компонент. Соотношение (1) означает, в частности, что каждая из компонент имеет нормальное распределение (для компоненты i это вытекает из (1) при ci = 1 и остальных коэффициентах комбинации, равных 0). Отсюда часто возникает иллюзия, что нормальность распределений компонент влечет нормальность совместного распределения. В портфельном анализе на основании этой иллюзии часто делают ошибочный вывод, что, поскольку распределения доходностей отдельных активов являются нормальными, таковым будет и распределение доходности портфеля. Однако, на самом деле это не так. При нормальном распределении компонент случайного вектора, как совместное распределение, так и распределения линейных комбинаций компонент (в частности, распределение доходности портфелямогут быть весьма далекими от нормального. На данной странице приведен соответствующий пример и обсуждение.

Пример двумерного распределения

Пример взят из книги Glyn Holton. Value-at-Risk: Theory and Practice. Academic Press, 2003. Мы построим двумерный случайный вектор (X1,X2), компоненты которого имеют стандартные нормальные распределения (то есть, нормальные распределения с нулевым средним и единичной дисперсией), совместное распределение которого не является нормальным, в частности, не являются нормальными распределения линейных комбинаций вида aX1 + bX2 . В качестве отправной точки рассмотрим случайный вектор (X1,Z) со стандартным двумерным нормальным распределением, то есть, средние значения компонент равны 0, а ковариационная матрица распределения является единичной:
EX1 = EZ = 0, DX1 = DZ = 1, r(X1,Z) = 0.
Определение коэффициента корреляции r(.,.) можно найти здесь. Такое совместное распределение вектора (X1,Z) имеет нормальную плотность распределения график которой имеет форму «шапочки». Определим новую случайную величину X2 = |Z| sgn(X1), где функция знака sgn(x) принимает значения +1 или -1, когда значения ее аргумента, соответственно, положительны или отрицательны, и значение 0, когда x = 0. Легко убедиться в том, что случайная величина X2 имеет стандартное нормальное распределение. Таким образом, компоненты случайного вектора (X1,X2) являются стандартными нормальными величинами. Однако, их совместное распределение далеко от нормального. Ясно, что компоненты этого вектора принимают значения одинаковых знаков, поэтому вероятность попадания этого вектора во второй и четвертый квадранты плоскости (x,y) равна 0 (см. рисунок ниже), в частности, значения плотности распределения (X1,X2) в этой части плоскости равны 0. Также нетрудно понять, что в первом и третьем квадрантах распределение (X1,X2) описывается плотностью, в два раза превышающей плотность стандартного нормального распределения (2). График этой плотности показан на следующем рисунке.

Портфель ценных бумаг

Теперь посмотрим, что происходит, если из компонент вектора (X1,X2) сформировать портфель, например, с равным представительством инструментов. Его доходность будет описываться случайной величиной P = (X1 + X2) / 2, плотность распределения которой изображена на следующем рисунке. Видно, что хотя распределения доходностей исходных инструментов X1 и X2 нормальны, распределение доходности портфеля является двумодальным, и имеет мало общего с нормальным. Предположение о нормальности P может приводить к значительным ошибкам в расчетах

Обсуждение

Если бы компоненты вектора (X1,X2) были не только нормальными, но и независимыми, то совместное распределение, а вместе с ним — и распределение доходности портфеля P были бы, конечно же, нормальными. Вся проблема заключается в наличии зависимости, или, точнее — в форме зависимости инструментов. Точное описание формы зависимости дается функцией копулы. В рассмотренном выше примере копула C(u,v) задается на квадрате [0,1]2 следующим образом: C(u,v) = 2 при 0 ≤ u,v ≤ 1/2 и 1/2 ≤ u,v ≤ 1, и C(u,v) = 0 в остальных случаях. На следующем рисунке показана область определения этой функции копулы, и области с ненулевыми значениями функции изображены с заливкой.

Иллюстрация

Программу, иллюстрирующую рассмотренный пример методом Монте-Карло, можно загрузить здесь. Доказательство нормальности X2 и ненормальности X1 + X2 приведено в работе The sum of dependent normal variables may be not normal.