Параметрическое оптимальное f при нормальном распределении

$A$ — среднее арифметическое; $X_i$ — значение, соответствующее точке i; $N$ — общее число точек данных в распределении.

#важно Среднее арифметическое обычно оказывается плохим выбором, если распределение имеет широкие хвосты, то есть если вероятность получить значение, удаленное от среднего, высока. В такой ситуации средние, рассчитанные по разным наборам случайно выбранных из распределения точек, будут сильно различаться

Могут использоваться также другие спецификации среднего: геометрическое (для положительных значений), гармоническое или квадратическое (среднеквадратический корень). Формулы:

Среднее геометрическое: $G=^$ Среднее гармоническое: $\frac1H=\frac1N\sum_^\frac1$ Среднее квадратическое: $R^2=\frac1N\sum_^X_i^2$, где

$G$ — среднее геометрическое; $H$ — среднее гармоническое; $R$ — среднее квадратическое; $X_i$ — значение, соответствующее точке i; $N$ — общее число точек данных в распределении.

тремя квартилями, чтобы получить четыре области равного размера или вероятности;
девятью децилями, чтобы получить десять областей равного размера или вероятности;
99 перцентилями, чтобы получить сто областей — при этом 50 перцентиль является медианой, а вместе с 25 и 75 перцентилями — квартилем;
N–1 квантилем, чтобы получить N областей.

Разброс значений

$M$ — среднее абсолютное отклонение; $X_i$ — значение, соответствующее точке i; $A$ — среднее арифметическое значение точек; $N$ — общее число точек данных.

#важно Данная формула позволяет вычислить среднее абсолютное отклонение по всей совокупности данных. Однако его можно рассчитать и по выборке из них. Для этого в формуле необходимо заменить $\frac1N$ на $\frac1$ Дисперсия — среднее арифметическое квадратов абсолютных отклонений значения каждой точки от среднего арифметического всех значений. Иными словами, это средний квадрат удаления от среднего. Формула:

$V$ — среднее абсолютное отклонение; $X_i$ — значение, соответствующее точке i; $A$ — среднее арифметическое значение точек; $N$ — общее число точек данных.

Стандартное отклонение (сигма, σ) — квадратный корень из дисперсии.

#важно Формулу для дисперсии — а соответственно, и для стандартного отклонения, также можно применять для совокупности данных или для выборки из них. Второй вариант также требует замены $\frac1N$ на $\frac1$

Асимметрия и эксцесс

Коэффициент Пирсона $=S=\fracσ=\fracσ$

ИЛИ

$S$ — асимметрия; $Mo$ — мода; $Me$ — медиана; $X_i$ — значение, соответствующее точке i; $A$ — среднее арифметическое значение точек; $N$ — общее число точек данных; $σ$ — стандартное отклонение точек.

Четвертый момент распределения — эксцесс. Он показывает, насколько у распределения плоско- или островершинная форма по сравнению с нормальным. Как и асимметрия, это безразмерная величина. Менее остроконечная, чем нормальная, кривая имеет эксцесс отрицательный, и наоборот. Для вершины, аналогичной пику нормального распределения, эксцесс равен нулю — в таком случае он называется нормальным. Различные виды эксцесса: Наиболее распространенные методы расчета эксцесса:

ИЛИ

$K$ — эксцесс; $Q$ — семи-интерквартильная широта; $P$ — широта перцентиля 10-90; $Mo$ — мода; $Me$ — медиана; $X_i$ — значение, соответствующее точке i; $A$ — среднее арифметическое значение точек; $N$ — общее число точек данных; $σ$ — стандартное отклонение точек.

Примеры распределений

Нормальное

$Z_i$ — значение нормированной точки i; $A$ — среднее арифметическое значение точек; $σ$ — стандартное отклонение точек; $X_i$ — значение наблюдаемой точки i.

Логарифмически нормальное распределение

Например, представим акцию стоимостью $10. В соответствии с нормальным распределением примерно равновероятны падения цены с $10 до $5 (50% понижение) и с $5 до $0 (100% понижение). При логнормальном распределении примерно равновероятны падения цены на 50% (с $10 до $5) и еще на 50% (с $5 до $2,5).

Нормальное и логнормальное распределение: Перейти от логнормального распределения к нормальному в случае с динамикой цен, необходимо взять натуральные логарифмы от относительных изменений котировок, то есть от выражения $\frac$. Полученный ряд будет подчиняться нормальному закону распределения.

Поиск оптимального f пo нормальному распределению

Выбрать, сколько данных мы отсекаем. Известно, что 99,73% всех точек данных находятся в интервале плюс и минус 3σ от среднего, поэтому рекомендуется сохранять для использования точке в интервале плюс и минус 3–5 сигм от среднего.

Решить, на сколько равноотстоящих точек мы разделим интервал между двумя крайними точками, выбранными на предыдущем шаге. Для интервала плюс и минус 3σ от среднего их должно быть не менее 30, включая крайние, — чем больше, тем ближе к реальному распределению. Они будут образовывать 29 интервалов по (3σ+3σ)/29≈0,21σ. Значит, полученные интервалы будут располагаться от -3σ от среднего до (-3+0,21)σ от среднего и так далее до 3σ.

Для каждой из точек также необходимо рассчитать ассоциированную вероятность. Формула (Z — данные, преобразованные в нормированные нормальные по формуле выше) — подробные пояснения к этой и следующим выражениям можно прочитать в оригинале книги:

Далее рассчитываем действительные вводные параметры: среднюю арифметическую сделку (выигрыш) и ее стандартное отклонение. Если последнее рассчитать затруднительно, можно использовать приблизительную формулу $S≈1,253314137M$, где S — стандартное отклонение, а М — среднее отклонение. Дополнительно можно рассчитать два дополнительных параметра, которые позволят увидеть влияние изменения вводных параметров.

Сжатие — множитель средней сделки. Показывает влияние среднего значения на оптимальное f. Сжатие должно иметь такой знак, чтобы при умножении на среднюю сделку получалось положительное значение.

Растяжение — множитель стандартного отклонения. Показывает влияние разброса на оптимальное f. Растяжение всегда должно быть положительным числом.

Таким образом формула цены для стандартной единицы (границы одного из полученных ранее равных интервалов — например, -3+0,21=-2,79) будет выглядеть следующем образом:

$D$ — значение цены, соответствующее значению стандартной единицы; $A$ — среднее арифметическое значение точек; $σ$ — стандартное отклонение точек; $E$ — значение стандартной единицы.

D также называется ассоциированным значением P&L. Такие значения необходимо получить для всех стандартных единиц. Далее необходимо найти оптимальное f от 0 до 1 — например перебором. Оптимальным будет такое f, при котором наибольшим становится среднее геометрическое значение HPR, рассчитанное на основании стандартных единиц по формуле:

$D$ — ассоциированное значение P&L; $W$ — ассоциированное значение P&L наихудшего случая (всегда отрицательное значение); $f$ — тестируемое значение f; $N(Z)$ — ассоциированная вероятность.

Что еще почитать

Банк России наращивает долю золота в международных резервах страны. Это следует из материалов регулятора. Так,…

Власти Китая признали возможность долгового кризиса в стране. Об этом пишет официальная газета китайского правительства…

Рубль снова заметно укрепился. В ходе торгов курс российской валюты пробил сверху отметку 63 по…

📎📎📎📎📎📎📎📎📎📎