Вопросы к тем кто дружит с мат.статистикой

Файзуло · 23 Май 2010

Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.

eternal_digger · 23 Май 2010

Файзуло написал(а):
Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.

Имхо,
1. при операциях со средними, из-за вовлеченности в расчеты одних и тех же данных, скорее всего имеем дело со связанными выборками. Хотя, если исходить из предположения о том, что подавляющее время мы имеем дело с эффективным рынком прямой (в лоб) анализ сегодняшних и вчерашних оценок цен (или их производных) вряд ли даст что-либо робастное, в лучшем случае будем иметь дело с курвфиттингом.
2. Не совсем понял какое отношение кол-во баров имеет к применяемым методам расчета. Если говорить о параметрических или не параметрических методах, то здесь скорее всего предпочтение в выборе будет определяться известностью/неизвестностью закона распределения случайной величины, а также расчетной шкалой, используемой в качестве оценок такого распределения. Если же Вы имели ввиду репрезентативность самой выборки, и/или оценки ее дисперсии, то здесь, на мой взгляд вернее говорить о кол-ве, например трейдов, за какое-то время. Если, например кол-во трейдов более 200, то на мой взгляд это достаточно для вывода о резпрезентативности выборки.
3. Не совсем понял что Вы имеете ввиду. Если речь о доверительном интервале какой-либо оценки, то здесь ИМХО, все очень индивидуально. Хотя по классике жанра вроде как говорят о 95% уровне значимости. Правда я не встречал никаких обоснований таких оценок для трейдинга, да и на мой взгляд это не настолько важно.

Файзуло · 23 Май 2010

Благодарю за участие в моей проблемме.Речь идёт о сравнении SMA(N-дней) с целью установления факта наличия или отсутствия тренда в этом временном масштабе.
Второй вопрос попробую задать иначе: какое значение N в SMA(N-дней) даст распределение которое можно считать нормальным.Отсюда третий вопрос :какой метод применим к слишком малым выборкам?
Таблиц распределения критических значений существует несколько: для 5%,1% и др . уровней.Какой уровень достоверности применяют в теханализе?
Спасибо.

eternal_digger · 23 Май 2010

Файзуло написал(а):
Благодарю за участие в моей проблемме.Речь идёт о сравнении SMA(N-дней) с целью установления факта наличия или отсутствия тренда в этом временном масштабе.
Второй вопрос попробую задать иначе: какое значение N в SMA(N-дней) даст распределение которое можно считать нормальным.Отсюда третий вопрос :какой метод применим если выборки слишком малы.Спасибо.

Честно говоря не понятно зачем Вам для "установления факта наличия или отсутствия тренда" нужно использовать какие-либо индикаторы, так как сам тренд прекрасно идентифицируется и без них, но всегда постфактум. Использование же SMA,EMA,TEMA и прочих сглаживающих фильтров никакой предсказательной силы не несет. Хотя, если Вы пытаетесь создать что-то типа трендфолловинга тогда понятно. Но тогда для чего Вам стат. методы?
Относительно Вашего второго вопроса, думаю, что сами распределения на рынке скорее логнормальные, и в данном контексте, ИМХО, к периоду осреднения отношения не имеют.
По третьему вопросу, сорри, не понял, что Вы имеете ввиду под выбором метода.
Если Вы будете пытаться работать с "малыми" выборками, т.е. с такими, которые не смогут помочь Вам идентифицировать распределение с приемлемой для Вас погрешностью, это будет означать, что все оценки статистики полетят "как фанера над городом Парижем", и следовательно, все что Вы попытаетесь создать на основе этих оценок статистики будет сродни бросанию монетки, т.е. ни о каком стат. преимуществе здесь говорить не придется. Хотя не понимаю почему для Вас выборки могут быть "слишком малы"? Если набор инстументов не позволяет, то можно удлиннить историю.
Удачных трейдов.

eternal_digger · 23 Май 2010

Файзуло написал(а):
Таблиц распределения критических значений существует несколько: для 5%,1% и др . уровней.Какой уровень достоверности применяют в теханализе?
Спасибо.

Сорри, но здесь я видимо не в теме. Что такое "Таблиц распределения критических значений"?
Если можно уточните поподробнее pls.

Файзуло · 23 Май 2010

Таблици распределения разные для разных метод (f-тест,U-тест,T-тест,хи-квадрат и проч.)Тренд SMA-это частный случай.В изменениях объёмов или волатильности тренд не так очевиден как в ценах.Думаю что стат.методы здесь уместны.Удлинняя историю загрубляем индикатор.Уменьшая историю увеличиваем погрешность.Смысл в том чтобы найти приемлемую середину.В литературе пишут: выборки с числом n=30 приближают распределение к нормальному.Спасибо за содержательные ответы.Удачи.

eternal_digger · 24 Май 2010

Файзуло написал(а):
Таблици распределения разные для разных метод (f-тест,U-тест,T-тест,хи-квадрат и проч.)Тренд SMA-это частный случай.В изменениях объёмов или волатильности тренд не так очевиден как в ценах.Думаю что стат.методы здесь уместны.Удлинняя историю загрубляем индикатор.Уменьшая историю увеличиваем погрешность.Смысл в том чтобы найти приемлемую середину.В литературе пишут: выборки с числом n=30 приближают распределение к нормальному.Спасибо за содержательные ответы.Удачи.

А, понял, что Вы имеете ввиду под таблицами распределения. Я работаю в statistica и если возникает необходимость в каких-либо тестах, то в общем это делается нажатием пары кнопок и все уровни значимости уже заведены, так что это как-то выскользнуло из внимания.
Сорри, но в м моем понимании фраза "В литературе пишут: выборки с числом n=30 приближают распределение к нормальному" имеет отношение не к периоду осреднения, в данном примере SMA, а скорее к идентификации закона распределения.
Если я правильно Вас понял, Вы пытаетесь использовать некий синтетический ряд (на основе значений, например SMA) значения которого образуют для Вас некую генеральную совокупность и пытаетесь нормализовать получающееся распределение посредством изменения периода осреднения n ?
Если Ваша цель получить нечто сродни "нормальному", не проще ли стандартизировать исходный. А, имхо, изменение n не приведет к желаемой цели в силу того, что ряды на базаре хоть и перидичны, но период каждый раз разный.
Удачных трейдов.
Удачных терйдов.

Cinoptik · 24 Май 2010

Файзуло написал(а):
Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.

1 выборки независимы.
2 критериев для расчёта нет, простой пример, измените график баров и свечей в линию. вы там не увидите кроме линии ничего. свечной и барный анализ лучше поддаётся визуальному анализу чем математическому.
3 в одном роддоме 20 палат, в другом 200, в первом роддоме стандартное отклонение равно 5-и в день и во втором равно 5-и. Какой уровень достоверности следует применять в таких расчётах?

MikeCurious · 25 Май 2010

Cinoptik написал(а):
1 выборки независимы.

Категорически несогласен. Выборки зависимы, через третью (третью, четвертую и т.д. если точнее) величину - предыдущие бары.

Насчет количества баров для прогноза - по моему тут нужно в общем случае учитывать - вероятность ошибки. Например провели 100 опытов. Из них 55 прибыльных, 45 убыточных, с некоторым мат.ожидание. Нужно посчитать какая вероятность получения меньшего числа прибыльных сделок, чтоб мат. ожидание стало 0. Если эта вероятность очень мала, то данные выборка достоверна. А вот как считать эту вероятность это уже другой вопрос

. Скорее всего получится некоторая оценка ее через случайные выборки. Которая, по определению, будет нижней границей - т.к. в реальности есть неизвестные взаимосвязи и корреляции, которые эту вероятность ошибки увеличивают, по сравнению со случайным распределением.

Cinoptik · 25 Май 2010

MikeCurious написал(а):
Категорически несогласен. Выборки зависимы, через третью (третью, четвертую и т.д. если точнее) величину - предыдущие бары.
.

как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.

eternal_digger · 25 Май 2010

Cinoptik написал(а):
как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.

Полагаю, что Вы согласитесь с гипотезой о том, что, ИМХО,на рынке, в некие моменты времени, может присутствовать некая неэффективность. Если это так, то тогда выявление и использование этой неэффективности может позволить трейдеру в некие моменты времени просоответсвовать рынку с некоторой вероятностью, таким образом, что результирующее МО будет иметь положительное значение. Фактически это и будет проявляться в некой вероятностной связи оценок цены, объемов и/или их производных. При этом возникает нетривиальная задача фильтрации именно таких моментов времени, что решается в соответствии со своим пониманием рынка и своего бэкграунда.
Удачных трейдов.

eternal_digger · 25 Май 2010

MikeCurious написал(а):
Нужно посчитать какая вероятность получения меньшего числа прибыльных сделок.....

Может быть ИМХО это не нужно считать, если есть возможность убедиться в стационарности случайного процесса.

MikeCurious · 26 Май 2010

Cinoptik написал(а):
как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.

Мы про средние говорим? Я да

SMA(Close,5)=(c[0]+c[-1]+c[-2]+c[-3]+c[-4])/5
SMA вчерашний = (c[-1]+c[-2]+c[-3]+c[-4]+c[-5])/5;
четыре общих переменных. Какое еще доказательство связи нужно.

MikeCurious · 26 Май 2010

eternal_digger написал(а):
Может быть ИМХО это не нужно считать, если есть возможность убедиться в стационарности случайного процесса.

А как можно считать вероятность у нестационарного процесса? По моему это в любом случае придется сделать (скорее сделать такое допущение, чем реально убедиться).

eternal_digger · 26 Май 2010

MikeCurious написал(а):
А как можно считать вероятность у нестационарного процесса? По моему это в любом случае придется сделать (скорее сделать такое допущение, чем реально убедиться).

да, имхо, вся беда в том, что посчитать-то можно, только вот толку от этого.... Для нестационарного процесса вероятность просто будет функцией времени.
Как мне кажется, на маркете, отсутствуют стационарные процессы (прошу сильно не пинать, т.к. это мое скромное ИМХО). В лучшем случае, речь можно вести о неких зонах стационарности, что в общем-то и может определять время работы стратегии. Только вот оценить "глубину" этих зон, задача весьма непростая...

Cinoptik · 26 Май 2010

MikeCurious написал(а):
Мы про средние говорим? Я да
SMA(Close,5)=(c[0]+c[-1]+c[-2]+c[-3]+c[-4])/5
SMA вчерашний = (c[-1]+c[-2]+c[-3]+c[-4]+c[-5])/5;
четыре общих переменных. Какое еще доказательство связи нужно.

мы говорим про стандартное отклонение и их зависимость между выборками.пример зависиммых данных: внутри дня 9 часовых данных, допустим 4 белых, 4 черных и одна нейтральная, когда на вашем мониторе появились 4 белых и нейтральная , то вы с завидомой точностью можете сказать что будет дальше. думаю что пример независимых данных не требуется

данный пример ничего общего ни имет со случайностью и форсмажорными факторами.

Cinoptik · 26 Май 2010

eternal_digger написал(а):
Полагаю, что Вы согласитесь с гипотезой о том, что, ИМХО,на рынке, в некие моменты времени, может присутствовать некая неэффективность. Если это так, то тогда выявление и использование этой неэффективности может позволить трейдеру в некие моменты времени просоответсвовать рынку с некоторой вероятностью, таким образом, что результирующее МО будет иметь положительное значение. Фактически это и будет проявляться в некой вероятностной связи оценок цены, объемов и/или их производных. При этом возникает нетривиальная задача фильтрации именно таких моментов времени, что решается в соответствии со своим пониманием рынка и своего бэкграунда.
Удачных трейдов.

скажите пожалуйста о чём этот график?

eternal_digger · 26 Май 2010

Cinoptik написал(а):
скажите пожалуйста о чём этот график?

Прошу прощения, не совсем понял к чему он. Визуально, распределение близко к нормальному, остальное по картинке сказать трудно.

Cinoptik · 26 Май 2010

eternal_digger написал(а):
Прошу прощения, не совсем понял к чему он. Визуально, распределение близко к нормальному, остальное по картинке сказать трудно.

совершенно верно,это и есть нормальное распределение, это я к тому что МО=0, на мой взгляд,лучше не ловить те моменты когда появляется скос,т.е именно те мометны времени про которые вы говорите, а лучше использовать распределени риска.

eternal_digger · 26 Май 2010

Cinoptik написал(а):
совершенно верно,это и есть нормальное распределение, это я к тому что МО=0, на мой взгляд,лучше не ловить те моменты когда появляется скос,т.е именно те мометны времени про которые вы говорите, а лучше использовать распределени риска.

Возможно, я что-то не совсем корректно написал, но идея в общем-то и заключалась в том, что вход/выход в позицию (если мы говорим о краткосрочных свингах) должен происходить именно в достаточно "узком" диапазоне в окрестностях экстремума распределения. Другое дело, какие моменты (ситуации на маркете) и какие фильтры использовать для того, чтобы получить то искомое распределение, параметры которого позволят получить максимально лучшее соотношение риск/ревард.
Удачных трейдов.

Вопросы к тем кто дружит с мат.статистикой

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member

New member