Прикладная корреляция.
Современный интернет-трейдинг не возможно себе представить без механических торговых систем. Торговые роботы прочно заняли свою нишу в сфере биржевых операций, год за годом увеличивая долю в общем объеме совершенных сделок. Повышенный интерес к полной или частичной автоматизации торговли со стороны конечных пользователей обусловил быстрое развитие индустрии биржевого роботостроительства. Готовые программные продукты, предлагаемые сегодня системным трейдерам, позволяют с легкостью реализовывать сложнейшие торговые алгоритмы и продвинутые системы управления рисками и объемами позиций. Механическая торговая система в понимании опытного трейдера - это нечто большее, чем просто набор скользящих средних линий или интересная комбинация технических индикаторов. Высокая скорость реакции, исполнения заявок и низкая брокерская комиссия - все эти факторы дали толчок к развитию целого класса высокочастотных математических алгоритмов. Всевозможные спредеры, арбитражеры и корреляторы основаны на некоторой математической зависимости двух или нескольких финансовых инструментов. Поэтому простейшие вариации парного трейдинга или арбитража сегодня доступны практически любому трейдеру в виде, так называемых, черных ящиков. Получая программу со скрытым алгоритмом поиска и анализа статистических связей, пользователь просто выбирает из нескольких торговых пар и базовых опциональных настроек. Таким образом получается сильно упрощенный вариант парного трейдинга, но очень удобный для трейдеров без знаний эконометрического или коинтеграционного анализа.
В прошлых статьях я разбирал основные предпосылки для успешной парной торговли. Методы анализа спреда достаточно просты, а вот непосредственно выбору подходящей пары активов необходимо уделить повышенное внимание. Основным условием парного трейдинга является "сходимость" пары, ее коинтегрированность, позволяющая получить стационарный спред. В таком случае, трейдер сможет легко проследить историческую динамику расхождений в доходности выбранных акций и определить моменты экстремального дисбаланса. Именно в этот момент открывается "парная" позиция, направленная на обратное схождение спреда к своим обычным (средним) значениям. Вот почему такая торговля часто называется "Mean reversion". Главной сложностью при таком подходе является задача протестировать доступные пары на коинтегрированность. В этой статье я хочу рассказать о более простом способе выбора подходящей пары для торговли.
Прежде чем рассматривать непосредственно корреляцию, хотелось бы еще раз рассказать о физическом смысле коинтеграции. Ранее ( http://www.russian-trader.ru/forums/...duk-regression ) я уже пробовал отыскать аналогии из обычной жизни. Но сейчас гораздо более интересна идея разложения доходности акций на три основных компонента. Итак, предположим, что доходность акций зависит от трех главных факторов:
1. макроэкономический фактор;
2. микроэкономический и внутриотраслевой (собственный) фактор;
3. спекулятивный фактор.
Смотрим рисунок:
В верхней части графика расположены все три фактора по отдельности и показана их динамика во времени. Сплошная синяя полоса - макроэкономический фактор с долгосрочными трендами, красный пунктир - собственные финансовые факторы отдельно взятой компании, зеленая "кардиограмма" - спекулятивный фактор. В нижней части - сумма трех факторов, формирующая биржевую цену акции.
Всю суть макроэкономического фактора очень хорошо объясняет популярная трейдерская поговорка: "Прилив поднимает все лодки". В периоды глобального восходящего тренда даже очень слабые и бесперспективные акции растут в цене. Бычьи настроения настолько сильны, что оптимизма инвесторов хватает даже на те компании, которые привели бы в ужас любого грамотного бухгалтера. Обратная ситуация происходит в периоды инвестиционной депрессии, когда под тотальную распродажу попадают высококачественные активы. Массовый макроэкономический психоз способен загнать цену акций так низко, что рыночная цена компании становится ниже, чем сумма наличности на ее банковских счетах. Из-за неотвратимой всемирной инфляции фондовые индексы склонны к глобальным восходящим тенденциям. И часто встречающееся среди начинающих инвесторов заблуждение "Не продам - все равно отрастет!" больше соответствует именно общему фондовому индексу, чем отдельно взятой акции. Покупка портфеля акций, в точности повторяюшего состав сводного биржевого индекса, имеет гораздо больше шансов на рост в долгосрочной перспективе. В регрессионном разложении долгосрочной доходности акции макроэкономический фактор имеет наибольший вес.
Микроэкономический фактор определяется собственным финансовым положением компании, ее долгосрочными перспективами, эмоциональной окраской конкурентных и внутриотраслевых новостей. Успешная компания, постоянно увеличивающая прибыли, должна дорожать в цене. Собственная капитализация не всегда совпадает с биржевой ценой фирмы, во многом из-за рассмотренного выше макроэкономического фактора. И даже составив портфель из "хороших" акций, инвестор не сможет избежать более общих фундаментальных рисков. В своей статье "Теханализ и портфель акций" я рассматривал способ, как можно избежать макроэкономического риска, инвестировав средства исключительно в "собственную" стоимость привлекательных компаний. Суть подобной операции сводилась к долгосрочной парной сделке Портфель-против-Индекс. Такой подход позволял сконцентрировать усилия исключительно на фундаментальном анализе отобранных кандидатов, без учета внешних факторов. Микроэкономический фактор имеет не очень сильное влияние, которое способно проявиться только в условиях долгосрочного инвестирования.
Спекулятивный фактор - это тот самый рыночный шум. Своими эмоциями, сделками и ошибками трейдеры в своей массе генерируют высокочастотные колебания цены на бирже. Невозможно заранее определить, каким будет следующий ценовой тик, импульсное движение или даже цена актива к закрытию дня. Исход случаен, поэтому спекулятивный фактор сродни стационарному белому шуму. Почему именно стационарному? Я его рассматриваю как случайное блуждание цены с нулевым средним. Цель любой спекулятивной операции - фиксация реальной прибыли. Купив любой актив, трейдер имеет на собственном брокерском депозите бумажную прибыль или, в худшем случае, убыток. Можно передерживать убыточные периоды, переусреднять позицию или использовать заемные средства - но любая позиция будет рано или поздно закрыта путем совершения противоположных сделок в том же объеме. Спекулятивная прибыль не берется из ниоткуда - любой дополнительный рубль на счете успешного трейдера оплачен другими участниками биржевой игры. В долгосрочном периоде влияние спекулятивного фактора стремится к нулю. Но вот при краткосрочном или даже внутридневном трейдинге подобная шумовая неопределенность оказывает огромное влияние на игроков и методы анализа ценовых колебаний. В этом случае на первый план выходят статистические и вероятностные модели.
В результате, трейдер может торговать любым из трех аспектов биржевой доходности. Торговая система, основанная на коинтеграции активов, позволяет ее разработчику извлекать прибыль из спекулятивного шума. Краткосрочные хаотичные колебания цены бывают настолько велики, что очень часто доминируют над логически обоснованными предпосылками. Но проблема в том, что мы не можем однозначно определить, где заканчивается логика и начинается хаос. Смотрим рисунок:
На графике показан приближенный участок смоделированной ранее суммарной доходности биржевого актива. Красным цветом представлена итоговая доходность с учетом рыночного шума. Синим пунктиром показана гипотетическая, "реальная" доходность, включающая в себя только микро и макроэкономические факторы. Задачей коинтеграционного анализа состоит в том, чтобы среди всего множества доступных активов найти такой, чья "реальная" доходность будет максимально полно повторять динамику исходного актива. Тогда приведенная разница в их "реальных" доходностях будет стремиться к нулю, а в остатке мы будем иметь линейную комбинацию из двух спекулятивных факторов. То есть в итоге, наблюдая за стационарным остатком от коинтегрированной пары, мы всегда сможем увидеть периоды максимального дисбаланса в их динамике.
Теперь переходим непосредственно к корреляционному способу поиска "сходящихся" пар. Забегая вперед, скажу, что этот метод гораздо мягче относится к критериям выбора торговых пар. По-настоящему коинтегрированных активов на отечественных биржевых площадках не так уж много. И в большинстве случаев выбранные акции не будут отвечать эконометрическим критериям. Корреляция же не требует выполнения никаких дополнительных условий, кроме достаточности анализируемой выборки. И при должном старании может выявить потенциально-сходящиеся пары. Сам по себе коэффициент корреляции не ищет зависимость между различными группами данных - он только показывает, есть между ними связь или нет. Рассмотрим классический пример: социологические исследования в 150 городах показали, что коэффициент корреляции между числом осужденных по тяжким преступлениям и количеством церквей составляет около 0,86, что обозначает наличие сильной связи между этими двумя показателями.
Результат статистически достоверен, хоть и несколько парадоксален. С первого раза очень трудно придумать логическое объяснение этому факту. Со второй попытки в голову приходят самые невероятные домыслы, но и они в итоге окажутся не верными. Все дело в том, что эти две переменные связаны опосредованно через третью, поэтому их непосредственный анализ будет не совсем корректен. Все дело в том, что обе эти величины зависят от численности населения исследуемых городов. И, соответственно, чем больше в городе жителей, тем больше в нем церквей и преступников. "Больше" именно в абсолютных величинах. Население и есть та третья переменная, которая в этом случае обусловливает высокий коэффициент корреляции между первыми двумя.
Как в поговорке "Друг моего друга - мой друг", переменные, имеющие высокую корреляцию с третьей, сами будут иметь высокий "технический" коэффициент парной корреляции. На графике представлены диаграммы рассеяния церквей и преступников в зависимости от численности населения. Обе шкалы представлены в логарифмированном виде, поэтому хорошо прослеживается прямая зависимость между переменными. Теперь, когда мы определили, что сильная прямая связь обусловлена внешним фактором, можно попытаться определить истинную связь между уровнем преступности и числом церквей в исследованных городах. Есть два различных способа:
- математический;
- логический.
Математический способ предполагает вычисление коэффициента частной корреляции между двумя переменными при условии, что определена их корреляция по отношению к третьей. Проще говоря, мы должны вычислить чистую взаимосвязь переменных, исключив влияние найденного третьего фактора. Смотрим расчеты:
Хорошо видно, что в расчете коэффициента частной корреляции используются все три рассчитанных ранее коэффициента. Извлекая из переменных общий компонент, в нашем случае это численность населения, мы получаем пренебрежительно маленькую корреляционную связь. вывод: с математической точки зрения преступность и религиозность между собой не связаны.
Второй способ, логический, предполагает переход от абсолютных величин к относительным. То есть вместо абсоютного числа преступников и церквей теперь возьмем их относительную плотность по городам:
И диаграмма рассеяния, и рассчитанный коэффициент корреляции относительных величин также показывают отсутствие какой бы то ни было взаимосвязи. Оба эти подхода показывают, каким образом из следуемых переменных можно извлекать общие факторы, тенденции и компоненты. Эта возможность позволит рассчитать коэффициенты частных корреляций для всех интересующих нас пар акций. Возвращаясь к рассмотренной ранее трехкомпонентной структуре доходности, мы можем убрать макроэкономические факторы и анализировать собственную доходность актива.
Определив собственную корреляцию колебаний за вычетом общего тренда, мы сможем корректно сравнивать "парность" акций, схожесть их собственной динамики. Обычная парная корреляция сильно завышает чистую связь между активами, накладывая на их собственные колебания общую тенденцию. В дальнейшем эта общая тенденция станет той самой "осью вращения", от которой будут отклоняться доходности выбранных активов. Как и в рассмотренном выше социологическом примере, определим собственную взаимосвязь двумя способами:
- через коэффициент частной корреляции. Доходность активов в этом случае будет определяться по синхронизированным 30-минутным интервалам. Общим третьим фактором в этом случае будет доходность индекса ММВБ за тот же период;
- путем обычного вычитания общего тренда. В этом случае будет рассчитан коэффициент обычной парной корреляции между доходностями активов, из которых была вычтена доходность индекса ММВБ.
Смотрим полученную таблицу:
Часть таблицы, расположенная левее и ниже диагонали, отображает коэффициенты частной корреляции. Правее и выше - коэффициенты с ручным вычитанием общего тренда. Полученные значения заметно различаются, но лидеры по уровню взаимосвязи совпадают. Это, естественно, пара Сбербанк-СбербанкПР, пара энергетических компаний и две пары из металлургического сектора. Еще раз хочется сказать, что для практического использования ни один из двух вариантов корреляционного анализа не является более правильным. Оба этих способа выполняют одну и ту же задачу - извлечение общего тренда и определение собственной связи в ценовых колебаниях. Основная разница между рассмотренными методами в том, что алгоритм расчета частной корреляции может сильно занизить уровень связи, если обе переменные имеют очень сильную корреляцию с третьим фактором.
Для дальнейшего анализа выберем две пары: пара Сбербанка и Северсталь-НЛМК. Корреляционная матрица сигнализирует о наличии между ними заметной связи. Отдельно нужно сказать, что абсолютное значение коэффициентов при этих методах сравнения будут заметно ниже, чем при классических. Ведь мы сознательно убираем одно общее звено, рассматривая "собственные" колебания. Итак, корреляция одной пары в два раза больше, чем второй. Проведем эконометрический анализ:
Тесты на коинтеграцию показывают хорошую "сходимость" обыкновенных и привилегированных акций Сбербанка, что вполне логично. А вот пара акций металлургического сектора не дает стационарного спреда. Устойчивая во времени стационарность, как и коинтеграция активов, на фондовых рынках является недостижимой утопией. Любой самый качественный спред рано или поздно изобразит фазовую ступеньку или тренд. Поэтому даже в коинтегрированной паре, где подразумевается однозначная "сходимость", необходимо предусмотреть планы закрытия убыточной позиции. Парный трейдинг очень либерально относится и даже приветствует ограниченное усреднение позиции, приносящей бумажный убыток. Но глупо усредняться бесконечно, вместо того, чтобы завершить сделку по "сломавшейся" паре.
Таким образом, торговая система для дальнейших тестов будет иметь дополнительный элемент, допускающий закрытие позиций в случае их бесперспективности. Схема торгового алгоритма сводится к следующему:
- вычисляем доходности двух активов;
- вычисляем спред, среднее значение спреда, стандартное отклонение спреда;
- в случае расхождения спреда за допустимые границы открывается парная позиция "на возврат к среднему"
Более подробно на торговой системе останавливаться не хочу, перейдем сразу к результатам теста. Сначала прогоним тестовый алгоритм на "сходящейся" паре Сбербанк-СбербанкПР. С точки зрения достоверности и робастности полученных результатов, так делать не очень корректно. Ведь мы протестируем систему на том же отрезке котировок, на котором уже априори установлена коинтеграция активов. Но для обкатки парного алгоритма на заведомо хорошей паре этот вариант вполне подходит, ведь в дальнейшем эта же система будет тестироваться на некоинтегрированной паре. Смотрим таблицу сделок:
Сводная таблица характеристик системы, генерируемая Вэлслабом, будет мало информативна. Ведь парную сделку по двум активам Вэлс считает как две самостоятельные сделки, соответственно расчитывая необъективные показатели. А на этой таблице сделок в предпоследней колонке представлены суммированные результаты парных сделок. Всего за последний год было совершено 64 парных сделки, 70% из которых оказались прибыльными.
Теперь прогоним эту же систему на паре Северсталь-НЛМК. Выключим блок регулировки объемами позиций, указав, чтобы обе стороны парной сделки были равны 100000 рублей (то есть, всего в сделке задействовано 200000 рублей). Смотрим сводную таблицу:
Тест проводился при условии в 40 рублей комиссионных на полный круг парной сделки. Всего за последний год было совершено 115 парных сделок со средней прибылью в 0,8%. Результат вполне удовлетворительный, кривая эквити тоже внушает оптимизм. Таким образом, торговые тесты полностью подтверждают идею о схожести ценовых колебаний у этих двух акций. Уровень корреляции "собственной" доходности настолько высок, что для парной торговли даже не требуется коинтеграции в выбранной паре. Теперь можем посмотреть, насколько эта стратегия отвечает принципам контртрендового "возврата к среднему". Протестируем различные уровни, на которых расхождение в доходностях активов будет считаться достаточным для открытия парной сделки:
Тестируемая переменная №1 определяет границу допустимого канала, выраженную в стандартных отклонениях спреда. Результаты всех тестов оказались прибыльными. Значит, усреднение парной позиции при расширении спреда будет вполне оправдано.
Но наличие сильной взаимосвязи еще ничего не говорит о природе возможных зависимостей между рядами данных. Попробовать их определить можно при помощи эконометрических тестов на причинно-следственную связь, но помимо чисто математических методов всегда есть более простой и логичный способ. Для этого проанализируем раздельную результативность парных сделок:
В левой части рисунка расположен график средней прибыли на сделку в зависимости от торгуемой акции. Эффективность трейдов различается почти в два раза. Это вполне допустимое отклонение для такого количества сделок за период, ограниченный одним последним годом. Увеличение разницы в прибыльности "ног" у парной сделки будет говорить о наличии ведущего и ведомого актива. В пределе эта разница приведет к эффекту "собачки на поводке у хозяина". То есть, доходность одной акции будет вращаться вокруг другой. Этот эффект может быть объяснен различной волатильностью, спекулятивной составляющей или даже не сравнимой капитализацией. В случае, когда значительная часть прибыли достигается за счет только одной стороны парной сделки, торговый подход может быть изменен на различные вариации одностороннего арбитража. При этом появляется риск направленной позиции, поэтому такой способ торговли мало пригоден для трейдеров, любящих переносить позицию через ночь.
В правой части рисунка рассмотрена доходность длинных и коротких позиций по отдельности. Хорошо видно, что короткие позиции приносят гораздо больше денег. Можно вспомнить аналогию из физики, что "для роста цены нужна внешняя сила, падать же цена может просто под действием собственной тяжести". Получается, что в этой паре дисбаланс в доходностях компенсируется за счет выросшего актива. Внезапный спекулятивный рост быстрее фиксируется в желании получить хоть и небольшую, но быструю прибыль. Безусловно, внешнее возмущение распространяется по активам гораздо сложнее, многократно получая отклики с разных сторон. Полная модель парных доходностей должна включать и внешние переменные, и векторную авторегрессию, но торговать подобные комплексные модели на не очень ликвидных активах будет весьма затруднительно. Сложный эконометрический аппарат опирается на множество упрощений и допущений, которые далеко не всегда выполняются на биржевых площадках. Поэтому очень часто лучшим вариантом будет пожертвовать академичностью подхода в угоду простоте и надежности модели.
В этой статье я рассказал о более простом, чем коинтеграционный анализ, способе выбора пар для парного трейдинга. Доходность акции определяется тремя факторами: макроэкономическим, "собственным" и спекулятивным, матожидание которого в долгосрочном периоде стремится к нулю. Для успешного парного трейдинга необходима "сходимость" активов. Она может быть достигнута при высокой корреляции "собственных" доходностей акций. Определить степень этой взаимосвязи можно двумя способами, исключив влияние общего макроэкономического фактора: через коэффициент частной корреляции или через парную корреляцию доходностей, из которых был вручную вычтен общий тренд. Полученный спред может не обладать абсолютной стационарностью, поэтому в торговой системе должны быть предусмотрены дополнительные правила на закрытие убыточных позиций.
"Автор статьи: Тарас Правдюк, специально для Русского Трейдера."
Современный интернет-трейдинг не возможно себе представить без механических торговых систем. Торговые роботы прочно заняли свою нишу в сфере биржевых операций, год за годом увеличивая долю в общем объеме совершенных сделок. Повышенный интерес к полной или частичной автоматизации торговли со стороны конечных пользователей обусловил быстрое развитие индустрии биржевого роботостроительства. Готовые программные продукты, предлагаемые сегодня системным трейдерам, позволяют с легкостью реализовывать сложнейшие торговые алгоритмы и продвинутые системы управления рисками и объемами позиций. Механическая торговая система в понимании опытного трейдера - это нечто большее, чем просто набор скользящих средних линий или интересная комбинация технических индикаторов. Высокая скорость реакции, исполнения заявок и низкая брокерская комиссия - все эти факторы дали толчок к развитию целого класса высокочастотных математических алгоритмов. Всевозможные спредеры, арбитражеры и корреляторы основаны на некоторой математической зависимости двух или нескольких финансовых инструментов. Поэтому простейшие вариации парного трейдинга или арбитража сегодня доступны практически любому трейдеру в виде, так называемых, черных ящиков. Получая программу со скрытым алгоритмом поиска и анализа статистических связей, пользователь просто выбирает из нескольких торговых пар и базовых опциональных настроек. Таким образом получается сильно упрощенный вариант парного трейдинга, но очень удобный для трейдеров без знаний эконометрического или коинтеграционного анализа.
В прошлых статьях я разбирал основные предпосылки для успешной парной торговли. Методы анализа спреда достаточно просты, а вот непосредственно выбору подходящей пары активов необходимо уделить повышенное внимание. Основным условием парного трейдинга является "сходимость" пары, ее коинтегрированность, позволяющая получить стационарный спред. В таком случае, трейдер сможет легко проследить историческую динамику расхождений в доходности выбранных акций и определить моменты экстремального дисбаланса. Именно в этот момент открывается "парная" позиция, направленная на обратное схождение спреда к своим обычным (средним) значениям. Вот почему такая торговля часто называется "Mean reversion". Главной сложностью при таком подходе является задача протестировать доступные пары на коинтегрированность. В этой статье я хочу рассказать о более простом способе выбора подходящей пары для торговли.
Прежде чем рассматривать непосредственно корреляцию, хотелось бы еще раз рассказать о физическом смысле коинтеграции. Ранее ( http://www.russian-trader.ru/forums/...duk-regression ) я уже пробовал отыскать аналогии из обычной жизни. Но сейчас гораздо более интересна идея разложения доходности акций на три основных компонента. Итак, предположим, что доходность акций зависит от трех главных факторов:
1. макроэкономический фактор;
2. микроэкономический и внутриотраслевой (собственный) фактор;
3. спекулятивный фактор.
Смотрим рисунок:
В верхней части графика расположены все три фактора по отдельности и показана их динамика во времени. Сплошная синяя полоса - макроэкономический фактор с долгосрочными трендами, красный пунктир - собственные финансовые факторы отдельно взятой компании, зеленая "кардиограмма" - спекулятивный фактор. В нижней части - сумма трех факторов, формирующая биржевую цену акции.
Всю суть макроэкономического фактора очень хорошо объясняет популярная трейдерская поговорка: "Прилив поднимает все лодки". В периоды глобального восходящего тренда даже очень слабые и бесперспективные акции растут в цене. Бычьи настроения настолько сильны, что оптимизма инвесторов хватает даже на те компании, которые привели бы в ужас любого грамотного бухгалтера. Обратная ситуация происходит в периоды инвестиционной депрессии, когда под тотальную распродажу попадают высококачественные активы. Массовый макроэкономический психоз способен загнать цену акций так низко, что рыночная цена компании становится ниже, чем сумма наличности на ее банковских счетах. Из-за неотвратимой всемирной инфляции фондовые индексы склонны к глобальным восходящим тенденциям. И часто встречающееся среди начинающих инвесторов заблуждение "Не продам - все равно отрастет!" больше соответствует именно общему фондовому индексу, чем отдельно взятой акции. Покупка портфеля акций, в точности повторяюшего состав сводного биржевого индекса, имеет гораздо больше шансов на рост в долгосрочной перспективе. В регрессионном разложении долгосрочной доходности акции макроэкономический фактор имеет наибольший вес.
Микроэкономический фактор определяется собственным финансовым положением компании, ее долгосрочными перспективами, эмоциональной окраской конкурентных и внутриотраслевых новостей. Успешная компания, постоянно увеличивающая прибыли, должна дорожать в цене. Собственная капитализация не всегда совпадает с биржевой ценой фирмы, во многом из-за рассмотренного выше макроэкономического фактора. И даже составив портфель из "хороших" акций, инвестор не сможет избежать более общих фундаментальных рисков. В своей статье "Теханализ и портфель акций" я рассматривал способ, как можно избежать макроэкономического риска, инвестировав средства исключительно в "собственную" стоимость привлекательных компаний. Суть подобной операции сводилась к долгосрочной парной сделке Портфель-против-Индекс. Такой подход позволял сконцентрировать усилия исключительно на фундаментальном анализе отобранных кандидатов, без учета внешних факторов. Микроэкономический фактор имеет не очень сильное влияние, которое способно проявиться только в условиях долгосрочного инвестирования.
Спекулятивный фактор - это тот самый рыночный шум. Своими эмоциями, сделками и ошибками трейдеры в своей массе генерируют высокочастотные колебания цены на бирже. Невозможно заранее определить, каким будет следующий ценовой тик, импульсное движение или даже цена актива к закрытию дня. Исход случаен, поэтому спекулятивный фактор сродни стационарному белому шуму. Почему именно стационарному? Я его рассматриваю как случайное блуждание цены с нулевым средним. Цель любой спекулятивной операции - фиксация реальной прибыли. Купив любой актив, трейдер имеет на собственном брокерском депозите бумажную прибыль или, в худшем случае, убыток. Можно передерживать убыточные периоды, переусреднять позицию или использовать заемные средства - но любая позиция будет рано или поздно закрыта путем совершения противоположных сделок в том же объеме. Спекулятивная прибыль не берется из ниоткуда - любой дополнительный рубль на счете успешного трейдера оплачен другими участниками биржевой игры. В долгосрочном периоде влияние спекулятивного фактора стремится к нулю. Но вот при краткосрочном или даже внутридневном трейдинге подобная шумовая неопределенность оказывает огромное влияние на игроков и методы анализа ценовых колебаний. В этом случае на первый план выходят статистические и вероятностные модели.
В результате, трейдер может торговать любым из трех аспектов биржевой доходности. Торговая система, основанная на коинтеграции активов, позволяет ее разработчику извлекать прибыль из спекулятивного шума. Краткосрочные хаотичные колебания цены бывают настолько велики, что очень часто доминируют над логически обоснованными предпосылками. Но проблема в том, что мы не можем однозначно определить, где заканчивается логика и начинается хаос. Смотрим рисунок:
На графике показан приближенный участок смоделированной ранее суммарной доходности биржевого актива. Красным цветом представлена итоговая доходность с учетом рыночного шума. Синим пунктиром показана гипотетическая, "реальная" доходность, включающая в себя только микро и макроэкономические факторы. Задачей коинтеграционного анализа состоит в том, чтобы среди всего множества доступных активов найти такой, чья "реальная" доходность будет максимально полно повторять динамику исходного актива. Тогда приведенная разница в их "реальных" доходностях будет стремиться к нулю, а в остатке мы будем иметь линейную комбинацию из двух спекулятивных факторов. То есть в итоге, наблюдая за стационарным остатком от коинтегрированной пары, мы всегда сможем увидеть периоды максимального дисбаланса в их динамике.
Теперь переходим непосредственно к корреляционному способу поиска "сходящихся" пар. Забегая вперед, скажу, что этот метод гораздо мягче относится к критериям выбора торговых пар. По-настоящему коинтегрированных активов на отечественных биржевых площадках не так уж много. И в большинстве случаев выбранные акции не будут отвечать эконометрическим критериям. Корреляция же не требует выполнения никаких дополнительных условий, кроме достаточности анализируемой выборки. И при должном старании может выявить потенциально-сходящиеся пары. Сам по себе коэффициент корреляции не ищет зависимость между различными группами данных - он только показывает, есть между ними связь или нет. Рассмотрим классический пример: социологические исследования в 150 городах показали, что коэффициент корреляции между числом осужденных по тяжким преступлениям и количеством церквей составляет около 0,86, что обозначает наличие сильной связи между этими двумя показателями.
Результат статистически достоверен, хоть и несколько парадоксален. С первого раза очень трудно придумать логическое объяснение этому факту. Со второй попытки в голову приходят самые невероятные домыслы, но и они в итоге окажутся не верными. Все дело в том, что эти две переменные связаны опосредованно через третью, поэтому их непосредственный анализ будет не совсем корректен. Все дело в том, что обе эти величины зависят от численности населения исследуемых городов. И, соответственно, чем больше в городе жителей, тем больше в нем церквей и преступников. "Больше" именно в абсолютных величинах. Население и есть та третья переменная, которая в этом случае обусловливает высокий коэффициент корреляции между первыми двумя.
Как в поговорке "Друг моего друга - мой друг", переменные, имеющие высокую корреляцию с третьей, сами будут иметь высокий "технический" коэффициент парной корреляции. На графике представлены диаграммы рассеяния церквей и преступников в зависимости от численности населения. Обе шкалы представлены в логарифмированном виде, поэтому хорошо прослеживается прямая зависимость между переменными. Теперь, когда мы определили, что сильная прямая связь обусловлена внешним фактором, можно попытаться определить истинную связь между уровнем преступности и числом церквей в исследованных городах. Есть два различных способа:
- математический;
- логический.
Математический способ предполагает вычисление коэффициента частной корреляции между двумя переменными при условии, что определена их корреляция по отношению к третьей. Проще говоря, мы должны вычислить чистую взаимосвязь переменных, исключив влияние найденного третьего фактора. Смотрим расчеты:
Хорошо видно, что в расчете коэффициента частной корреляции используются все три рассчитанных ранее коэффициента. Извлекая из переменных общий компонент, в нашем случае это численность населения, мы получаем пренебрежительно маленькую корреляционную связь. вывод: с математической точки зрения преступность и религиозность между собой не связаны.
Второй способ, логический, предполагает переход от абсолютных величин к относительным. То есть вместо абсоютного числа преступников и церквей теперь возьмем их относительную плотность по городам:
И диаграмма рассеяния, и рассчитанный коэффициент корреляции относительных величин также показывают отсутствие какой бы то ни было взаимосвязи. Оба эти подхода показывают, каким образом из следуемых переменных можно извлекать общие факторы, тенденции и компоненты. Эта возможность позволит рассчитать коэффициенты частных корреляций для всех интересующих нас пар акций. Возвращаясь к рассмотренной ранее трехкомпонентной структуре доходности, мы можем убрать макроэкономические факторы и анализировать собственную доходность актива.
Определив собственную корреляцию колебаний за вычетом общего тренда, мы сможем корректно сравнивать "парность" акций, схожесть их собственной динамики. Обычная парная корреляция сильно завышает чистую связь между активами, накладывая на их собственные колебания общую тенденцию. В дальнейшем эта общая тенденция станет той самой "осью вращения", от которой будут отклоняться доходности выбранных активов. Как и в рассмотренном выше социологическом примере, определим собственную взаимосвязь двумя способами:
- через коэффициент частной корреляции. Доходность активов в этом случае будет определяться по синхронизированным 30-минутным интервалам. Общим третьим фактором в этом случае будет доходность индекса ММВБ за тот же период;
- путем обычного вычитания общего тренда. В этом случае будет рассчитан коэффициент обычной парной корреляции между доходностями активов, из которых была вычтена доходность индекса ММВБ.
Смотрим полученную таблицу:
Часть таблицы, расположенная левее и ниже диагонали, отображает коэффициенты частной корреляции. Правее и выше - коэффициенты с ручным вычитанием общего тренда. Полученные значения заметно различаются, но лидеры по уровню взаимосвязи совпадают. Это, естественно, пара Сбербанк-СбербанкПР, пара энергетических компаний и две пары из металлургического сектора. Еще раз хочется сказать, что для практического использования ни один из двух вариантов корреляционного анализа не является более правильным. Оба этих способа выполняют одну и ту же задачу - извлечение общего тренда и определение собственной связи в ценовых колебаниях. Основная разница между рассмотренными методами в том, что алгоритм расчета частной корреляции может сильно занизить уровень связи, если обе переменные имеют очень сильную корреляцию с третьим фактором.
Для дальнейшего анализа выберем две пары: пара Сбербанка и Северсталь-НЛМК. Корреляционная матрица сигнализирует о наличии между ними заметной связи. Отдельно нужно сказать, что абсолютное значение коэффициентов при этих методах сравнения будут заметно ниже, чем при классических. Ведь мы сознательно убираем одно общее звено, рассматривая "собственные" колебания. Итак, корреляция одной пары в два раза больше, чем второй. Проведем эконометрический анализ:
Тесты на коинтеграцию показывают хорошую "сходимость" обыкновенных и привилегированных акций Сбербанка, что вполне логично. А вот пара акций металлургического сектора не дает стационарного спреда. Устойчивая во времени стационарность, как и коинтеграция активов, на фондовых рынках является недостижимой утопией. Любой самый качественный спред рано или поздно изобразит фазовую ступеньку или тренд. Поэтому даже в коинтегрированной паре, где подразумевается однозначная "сходимость", необходимо предусмотреть планы закрытия убыточной позиции. Парный трейдинг очень либерально относится и даже приветствует ограниченное усреднение позиции, приносящей бумажный убыток. Но глупо усредняться бесконечно, вместо того, чтобы завершить сделку по "сломавшейся" паре.
Таким образом, торговая система для дальнейших тестов будет иметь дополнительный элемент, допускающий закрытие позиций в случае их бесперспективности. Схема торгового алгоритма сводится к следующему:
- вычисляем доходности двух активов;
- вычисляем спред, среднее значение спреда, стандартное отклонение спреда;
- в случае расхождения спреда за допустимые границы открывается парная позиция "на возврат к среднему"
Более подробно на торговой системе останавливаться не хочу, перейдем сразу к результатам теста. Сначала прогоним тестовый алгоритм на "сходящейся" паре Сбербанк-СбербанкПР. С точки зрения достоверности и робастности полученных результатов, так делать не очень корректно. Ведь мы протестируем систему на том же отрезке котировок, на котором уже априори установлена коинтеграция активов. Но для обкатки парного алгоритма на заведомо хорошей паре этот вариант вполне подходит, ведь в дальнейшем эта же система будет тестироваться на некоинтегрированной паре. Смотрим таблицу сделок:
Сводная таблица характеристик системы, генерируемая Вэлслабом, будет мало информативна. Ведь парную сделку по двум активам Вэлс считает как две самостоятельные сделки, соответственно расчитывая необъективные показатели. А на этой таблице сделок в предпоследней колонке представлены суммированные результаты парных сделок. Всего за последний год было совершено 64 парных сделки, 70% из которых оказались прибыльными.
Теперь прогоним эту же систему на паре Северсталь-НЛМК. Выключим блок регулировки объемами позиций, указав, чтобы обе стороны парной сделки были равны 100000 рублей (то есть, всего в сделке задействовано 200000 рублей). Смотрим сводную таблицу:
Тест проводился при условии в 40 рублей комиссионных на полный круг парной сделки. Всего за последний год было совершено 115 парных сделок со средней прибылью в 0,8%. Результат вполне удовлетворительный, кривая эквити тоже внушает оптимизм. Таким образом, торговые тесты полностью подтверждают идею о схожести ценовых колебаний у этих двух акций. Уровень корреляции "собственной" доходности настолько высок, что для парной торговли даже не требуется коинтеграции в выбранной паре. Теперь можем посмотреть, насколько эта стратегия отвечает принципам контртрендового "возврата к среднему". Протестируем различные уровни, на которых расхождение в доходностях активов будет считаться достаточным для открытия парной сделки:
Тестируемая переменная №1 определяет границу допустимого канала, выраженную в стандартных отклонениях спреда. Результаты всех тестов оказались прибыльными. Значит, усреднение парной позиции при расширении спреда будет вполне оправдано.
Но наличие сильной взаимосвязи еще ничего не говорит о природе возможных зависимостей между рядами данных. Попробовать их определить можно при помощи эконометрических тестов на причинно-следственную связь, но помимо чисто математических методов всегда есть более простой и логичный способ. Для этого проанализируем раздельную результативность парных сделок:
В левой части рисунка расположен график средней прибыли на сделку в зависимости от торгуемой акции. Эффективность трейдов различается почти в два раза. Это вполне допустимое отклонение для такого количества сделок за период, ограниченный одним последним годом. Увеличение разницы в прибыльности "ног" у парной сделки будет говорить о наличии ведущего и ведомого актива. В пределе эта разница приведет к эффекту "собачки на поводке у хозяина". То есть, доходность одной акции будет вращаться вокруг другой. Этот эффект может быть объяснен различной волатильностью, спекулятивной составляющей или даже не сравнимой капитализацией. В случае, когда значительная часть прибыли достигается за счет только одной стороны парной сделки, торговый подход может быть изменен на различные вариации одностороннего арбитража. При этом появляется риск направленной позиции, поэтому такой способ торговли мало пригоден для трейдеров, любящих переносить позицию через ночь.
В правой части рисунка рассмотрена доходность длинных и коротких позиций по отдельности. Хорошо видно, что короткие позиции приносят гораздо больше денег. Можно вспомнить аналогию из физики, что "для роста цены нужна внешняя сила, падать же цена может просто под действием собственной тяжести". Получается, что в этой паре дисбаланс в доходностях компенсируется за счет выросшего актива. Внезапный спекулятивный рост быстрее фиксируется в желании получить хоть и небольшую, но быструю прибыль. Безусловно, внешнее возмущение распространяется по активам гораздо сложнее, многократно получая отклики с разных сторон. Полная модель парных доходностей должна включать и внешние переменные, и векторную авторегрессию, но торговать подобные комплексные модели на не очень ликвидных активах будет весьма затруднительно. Сложный эконометрический аппарат опирается на множество упрощений и допущений, которые далеко не всегда выполняются на биржевых площадках. Поэтому очень часто лучшим вариантом будет пожертвовать академичностью подхода в угоду простоте и надежности модели.
В этой статье я рассказал о более простом, чем коинтеграционный анализ, способе выбора пар для парного трейдинга. Доходность акции определяется тремя факторами: макроэкономическим, "собственным" и спекулятивным, матожидание которого в долгосрочном периоде стремится к нулю. Для успешного парного трейдинга необходима "сходимость" активов. Она может быть достигнута при высокой корреляции "собственных" доходностей акций. Определить степень этой взаимосвязи можно двумя способами, исключив влияние общего макроэкономического фактора: через коэффициент частной корреляции или через парную корреляцию доходностей, из которых был вручную вычтен общий тренд. Полученный спред может не обладать абсолютной стационарностью, поэтому в торговой системе должны быть предусмотрены дополнительные правила на закрытие убыточных позиций.
"Автор статьи: Тарас Правдюк, специально для Русского Трейдера."