Статья: Т.Правдюк: Алгоритмы Data-Mining в системной торговле

  • Автор темы mehanizator
  • Дата начала

eternal_digger

New member
Вот возник вопрос, а Вы когда формируете портфель, например из стоков, пользуетесь какой-либо внешней информацией?
 

tarasp

New member
если это мне вопрос, то я вообще не держу акций.
года два назад была попытка совместить долгосрочную позицию с внутридневным трейдингом, и закончилось все плачевно. мозгам трудно было допускать шорты против основной позиции)) с тех пор торговые горизонты стараюсь не смешивать
 

eternal_digger

New member
если это мне вопрос, то я вообще не держу акций.
Я наверно не совсем корректно вопрос сформулировал. Имелось ввиду следующее: не всю информацию получается "засунуть" в тс, в смысле запрограммировать. Поэтому я как бы для себя поделил ее на "внутреннюю" (типа ОНLC OI) и "внешнюю" (ну события там всякие, мнения аналитиков и пр.). Если что-то из внешнего оказывалось полезным, я это пытаюсь учитывать. Хотя статистически оценить такую "полезность" бывает непросто. Потому и спросил, учитываете Вы что-либо из таких "внешних" данных.
 

Kardinal_M

New member
Прошу прощения, здесь все правда всё всё поняли????? Я один такой тупой, что первый вопрос возник в самом начале, а именно: какие показатели нормировались и как? Что вообще делалось с данными, чтобы привести их к одному знаменателю? Какие данные брались, и что в конце-концов получилось?
И почему именно этот показатель нормировался именно таким образом? Если это где-то уже написано автором, прошу простить, неплохо бы давать пруфлинк, чтобы незнакомые с темой, тоже могли причаститься.
 

eternal_digger

New member
Прошу прощения, здесь все правда всё всё поняли?????
Видите ли в чем дело. Вопрос с данными здесь ИМХО и является ключевым. Если человек реально работающий по "робастной" тс сообщит Вам, что и каким образом он подает на вход и какими метриками пользуется для нормировки, то в общем-то уже и никакой dataminning не нужен чтобы эту системку скопировать. Ну и зачем он должен таким альтруизмом заниматься? Автор здесь привел (причем на мой взгляд весьма профессионально) пример "кирки" или "лопаты" (что Вам больше по вкусу), которая может весьма успешно заменить часы и часы достаточно примитивного тестирования, например в велсе. За что ему можно только сказать Спасибо. А выступать проводником к граалю он вроде нигде не подписывался.
Что же касается "примеров" факторов (показателей), то их вроде как здесь приводили:
- процентное отношение вчерашнего диапазона к позавчерашнему;
Вчера(хай-лоу) / позавчера(хай-лоу)
- отношение стандартного отклонения цены к своему среднему;
стандартное отклонение / среднее значение стандартного отклонения
- нормированный рост за предыдущий день.
(закрытие вчера - закрытие позавчера) / диапазон позавчера
При этом в этих примерах все понятно что и как нормируется.
 

tarasp

New member
Теперь понял) раньше, когда торговал вручную, кое-что использовал. Это были комментарии по рынку Альфа-Банка из ленты комментариев http://www.prime-tass.ru/news/comments/ . Там удобный и большой архив, удалось протестировать все комментарии за два года. Результаты удивили - в течение пары-тройки дней после обзора ситуация на рынке или конкретной акции менялась на противоположную прогнозу. И это случалось гораздо чаще 50% (точно не помню, но вероятность меня тогда поразила). Не думаю, что аналитики в своих очень подробных обзорах с цифрами и расчетами наивно ошибались...

Сейчас в системах подобные данные не использую. Просто потому, что не собираю базу таких данных. А использовать их в численном анализе не очень трудно - нейросети или логистическая регрессия как раз-таки и предназначена для анализа критериальных признаков.
 
Последнее редактирование:

yu-sha

New member
Проясните, плз, общую картину происходящего

1) взяли некоторый "срез" теханализа размерностью 15
2) привели к диапазону [-1:+1]
3) прогнали на участке истории и проверили кандидатов на корреляцию (коллинеарность здесь при чем? имеется в виду "горизонтальный срез" при прогоне по данным?) - ну да ладно, в общем и целом понятно
3) скомбинировали схожие входы методами факторного анализа (можно было линейную комбинацию, можно было просто отбросить лишние). Другими словами - понизили размерность с 15 до 11. Годится!
4) Разбили на 50 кластеров бары обучающей выборки (сетью Кохонена или k-средних) . Название метода выбираем по вкусу, а сути дела это не меняет. Принято.
5) И вот теперь самое непонятное для меня: зачем городить нейронную сеть с 15-тью!!! входами и 50-тью выходами, обучать ее кластеризации и радоваться 83%, если у нас уже есть готовая k-means, которая априори на 100% (а иначе быть не может, мы же по ней учим персептрон) правильно проводит кластеризацию???
 

tarasp

New member
нужно в реальном времени относить вновь поступающие котировки к соответствующим кластерам. мне было проще обучить сеть, чем разобраться с программированием правил кластеризации

как передать полученные правила на новую ненормированную котировку?
 

yu-sha

New member
нужно в реальном времени относить вновь поступающие котировки к соответствующим кластерам. мне было проще обучить сеть, чем разобраться с программированием правил кластеризации

как передать полученные правила на новую ненормированную котировку?
а в персептрон Вы подавали ненормированные данные ?
 
Последнее редактирование:

yu-sha

New member
На мой взгляд все намного проще
имеем 15 входов
имеем правило перехода к 11
затем слой Кохонена
дальше фильтры
итого сеть 15 х П x 11 х 50 х Ф

Но есть одно "НО" - это надо запрограммировать)
P.S. Отписался в личку
 

Rodeo

Well-known member
Первым делом перестал слушать аналитиков, потом перестал торговать по новостям, в сад ( зад) пошла большая часть индикаторов остались только тренда. Есть тренд - есть торговля,нет тренда - нет торговли. Два первых года - два слитых депозита. Третий - 10%. Четвертый расчитываю выйти в +. Стиль торговли сильно поменялся . Вручную так торговать полная засада. Можно просидеть целый день без сделок, а пойдешь поср..(чаю попить) и проср..(пропьешь) сигнал. Так же отсутствие стопов ( ну не знаю я когда тренд закончится - через час или завтра или через три дня). А дарить рынку 1%(обязательно попилит) или 3-5%(а харя у рынка не треснет?). Когда торгую вручную стоп ставлю, но вот засада - движение закончилось и как дурень ждешь когда отстопит. Закрыться типа не феншуйно(ну типа не системно). А с роботом такой номер не проходит. Он если взял прибыль,то не отдаст. Приходится правда жертвовать началом движения. Если не получилось на одной бумаге может повезти на другой - деньги то свободные. Перебор по бумагам пока не написал, но это не проблема. Проблема в другом - ноутбук не сервер. A попытка что-нибудь предугадать - это гадание на кофейной гуще. Рынок большую часть времени не логичен. А исходные данные могут быть недостоверными(новости например).
 

eternal_digger

New member
Сейчас в системах подобные данные не использую. Просто потому, что не собираю базу таких данных. А использовать их в численном анализе не очень трудно - нейросети или логистическая регрессия как раз-таки и предназначена для анализа критериальных признаков.
Спасибо за ответ. В принципе интересовало используете или нет.
Для меня сложность в том, что долго и нудно эти данные заводить (время теряется куча), да и глубина по ним очень часто не совпадает с глубиной тестов "понятных" данных. Кроме того, частенько их просто не бывает по каким-либо конкретным инструментам. Вот и встал вопрос, а может ну его на фиг.
 

tarasp

New member
Тарас, а Вы не пытались использовать описанную методу в приложении с сантиментом?
нет. вообще всерьез не занимался неценовыми данными.

на стокпортале кто-то однажды выложил экселевскую таблицу активности в теме "рынок сегодня". там наблюдалась интересная закономерность, что всплески активности форума соответствовали окончанию движения.

больше не встречал на рфр похожих индикаторов, а самому долго делать. потенциальная идея тут - Индекс оптимизма OPT.IX - но мало людей голосуют...
 

tarasp

New member
ссылки по теме "Использование компонентов Data Mining в продуктах Office 2007"

http://www.it2b.ru/blog/arhiv/513.html
http://www.microsoft.com/downloads/ru-ru/details.aspx?displaylang=ru&FamilyID=7c76e8df-8674-4c3b-a99b-55b17f3c4c51
http://microsoftbi.ru/2009/08/05/data-mining/
http://msdn.microsoft.com/ru-ru/library/ms175595.aspx
http://www.osp.ru/win2000/2010/07/13004722/
http://habrahabr.ru/blogs/data_mining/66561/
 
Последнее редактирование:
Your email address will not be publicly visible. We will only use it to contact you to confirm your post.
Сверху