Параметрическое оптимальное f при нормальном распределении
\(A\) — среднее арифметическое; \(X_i\) — значение, соответствующее точке i; \(N\) — общее число точек данных в распределении.
#важно Среднее арифметическое обычно оказывается плохим выбором, если распределение имеет широкие хвосты, то есть если вероятность получить значение, удаленное от среднего, высока. В такой ситуации средние, рассчитанные по разным наборам случайно выбранных из распределения точек, будут сильно различаться
Могут использоваться также другие спецификации среднего: геометрическое (для положительных значений), гармоническое или квадратическое (среднеквадратический корень). Формулы:
Среднее геометрическое: \(G=^\) Среднее гармоническое: \(\frac1H=\frac1N\sum_^\frac1\) Среднее квадратическое: \(R^2=\frac1N\sum_^X_i^2\), где
\(G\) — среднее геометрическое; \(H\) — среднее гармоническое; \(R\) — среднее квадратическое; \(X_i\) — значение, соответствующее точке i; \(N\) — общее число точек данных в распределении.
- тремя квартилями, чтобы получить четыре области равного размера или вероятности;
- девятью децилями, чтобы получить десять областей равного размера или вероятности;
- 99 перцентилями, чтобы получить сто областей — при этом 50 перцентиль является медианой, а вместе с 25 и 75 перцентилями — квартилем;
- N–1 квантилем, чтобы получить N областей.
\(M\) — среднее абсолютное отклонение; \(X_i\) — значение, соответствующее точке i; \(A\) — среднее арифметическое значение точек; \(N\) — общее число точек данных.
#важно Данная формула позволяет вычислить среднее абсолютное отклонение по всей совокупности данных. Однако его можно рассчитать и по выборке из них. Для этого в формуле необходимо заменить \(\frac1N\) на \(\frac1\) Дисперсия — среднее арифметическое квадратов абсолютных отклонений значения каждой точки от среднего арифметического всех значений. Иными словами, это средний квадрат удаления от среднего. Формула:
\(V\) — среднее абсолютное отклонение; \(X_i\) — значение, соответствующее точке i; \(A\) — среднее арифметическое значение точек; \(N\) — общее число точек данных.
Стандартное отклонение (сигма, σ) — квадратный корень из дисперсии.
#важно Формулу для дисперсии — а соответственно, и для стандартного отклонения, также можно применять для совокупности данных или для выборки из них. Второй вариант также требует замены \(\frac1N\) на \(\frac1\)
Асимметрия и эксцессКоэффициент Пирсона \(=S=\fracσ=\fracσ\)
ИЛИ
\(S\) — асимметрия; \(Mo\) — мода; \(Me\) — медиана; \(X_i\) — значение, соответствующее точке i; \(A\) — среднее арифметическое значение точек; \(N\) — общее число точек данных; \(σ\) — стандартное отклонение точек.
Четвертый момент распределения — эксцесс. Он показывает, насколько у распределения плоско- или островершинная форма по сравнению с нормальным. Как и асимметрия, это безразмерная величина. Менее остроконечная, чем нормальная, кривая имеет эксцесс отрицательный, и наоборот. Для вершины, аналогичной пику нормального распределения, эксцесс равен нулю — в таком случае он называется нормальным. Различные виды эксцесса: Наиболее распространенные методы расчета эксцесса:
ИЛИ
\(K\) — эксцесс; \(Q\) — семи-интерквартильная широта; \(P\) — широта перцентиля 10-90; \(Mo\) — мода; \(Me\) — медиана; \(X_i\) — значение, соответствующее точке i; \(A\) — среднее арифметическое значение точек; \(N\) — общее число точек данных; \(σ\) — стандартное отклонение точек.
Примеры распределений
Нормальное\(Z_i\) — значение нормированной точки i; \(A\) — среднее арифметическое значение точек; \(σ\) — стандартное отклонение точек; \(X_i\) — значение наблюдаемой точки i.
Логарифмически нормальное распределениеНапример, представим акцию стоимостью $10. В соответствии с нормальным распределением примерно равновероятны падения цены с $10 до $5 (50% понижение) и с $5 до $0 (100% понижение). При логнормальном распределении примерно равновероятны падения цены на 50% (с $10 до $5) и еще на 50% (с $5 до $2,5).
Нормальное и логнормальное распределение: Перейти от логнормального распределения к нормальному в случае с динамикой цен, необходимо взять натуральные логарифмы от относительных изменений котировок, то есть от выражения \(\frac\). Полученный ряд будет подчиняться нормальному закону распределения.
Поиск оптимального f пo нормальному распределению
Выбрать, сколько данных мы отсекаем. Известно, что 99,73% всех точек данных находятся в интервале плюс и минус 3σ от среднего, поэтому рекомендуется сохранять для использования точке в интервале плюс и минус 3–5 сигм от среднего.
Решить, на сколько равноотстоящих точек мы разделим интервал между двумя крайними точками, выбранными на предыдущем шаге. Для интервала плюс и минус 3σ от среднего их должно быть не менее 30, включая крайние, — чем больше, тем ближе к реальному распределению. Они будут образовывать 29 интервалов по (3σ+3σ)/29≈0,21σ. Значит, полученные интервалы будут располагаться от -3σ от среднего до (-3+0,21)σ от среднего и так далее до 3σ.
Для каждой из точек также необходимо рассчитать ассоциированную вероятность. Формула (Z — данные, преобразованные в нормированные нормальные по формуле выше) — подробные пояснения к этой и следующим выражениям можно прочитать в оригинале книги:
Далее рассчитываем действительные вводные параметры: среднюю арифметическую сделку (выигрыш) и ее стандартное отклонение. Если последнее рассчитать затруднительно, можно использовать приблизительную формулу \(S≈1,253314137M\), где S — стандартное отклонение, а М — среднее отклонение. Дополнительно можно рассчитать два дополнительных параметра, которые позволят увидеть влияние изменения вводных параметров.
Сжатие — множитель средней сделки. Показывает влияние среднего значения на оптимальное f. Сжатие должно иметь такой знак, чтобы при умножении на среднюю сделку получалось положительное значение.
Растяжение — множитель стандартного отклонения. Показывает влияние разброса на оптимальное f. Растяжение всегда должно быть положительным числом.
Таким образом формула цены для стандартной единицы (границы одного из полученных ранее равных интервалов — например, -3+0,21=-2,79) будет выглядеть следующем образом:
\(D\) — значение цены, соответствующее значению стандартной единицы; \(A\) — среднее арифметическое значение точек; \(σ\) — стандартное отклонение точек; \(E\) — значение стандартной единицы.
D также называется ассоциированным значением P&L. Такие значения необходимо получить для всех стандартных единиц. Далее необходимо найти оптимальное f от 0 до 1 — например перебором. Оптимальным будет такое f, при котором наибольшим становится среднее геометрическое значение HPR, рассчитанное на основании стандартных единиц по формуле:
\(D\) — ассоциированное значение P&L; \(W\) — ассоциированное значение P&L наихудшего случая (всегда отрицательное значение); \(f\) — тестируемое значение f; \(N(Z)\) — ассоциированная вероятность.
Что еще почитатьБанк России наращивает долю золота в международных резервах страны. Это следует из материалов регулятора. Так,…
Власти Китая признали возможность долгового кризиса в стране. Об этом пишет официальная газета китайского правительства…
Рубль снова заметно укрепился. В ходе торгов курс российской валюты пробил сверху отметку 63 по…