Вопросы к тем кто дружит с мат.статистикой

  • Автор темы Файзуло
  • Дата начала

Файзуло

New member
Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.
 

eternal_digger

New member
Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.
Имхо,
1. при операциях со средними, из-за вовлеченности в расчеты одних и тех же данных, скорее всего имеем дело со связанными выборками. Хотя, если исходить из предположения о том, что подавляющее время мы имеем дело с эффективным рынком прямой (в лоб) анализ сегодняшних и вчерашних оценок цен (или их производных) вряд ли даст что-либо робастное, в лучшем случае будем иметь дело с курвфиттингом.
2. Не совсем понял какое отношение кол-во баров имеет к применяемым методам расчета. Если говорить о параметрических или не параметрических методах, то здесь скорее всего предпочтение в выборе будет определяться известностью/неизвестностью закона распределения случайной величины, а также расчетной шкалой, используемой в качестве оценок такого распределения. Если же Вы имели ввиду репрезентативность самой выборки, и/или оценки ее дисперсии, то здесь, на мой взгляд вернее говорить о кол-ве, например трейдов, за какое-то время. Если, например кол-во трейдов более 200, то на мой взгляд это достаточно для вывода о резпрезентативности выборки.
3. Не совсем понял что Вы имеете ввиду. Если речь о доверительном интервале какой-либо оценки, то здесь ИМХО, все очень индивидуально. Хотя по классике жанра вроде как говорят о 95% уровне значимости. Правда я не встречал никаких обоснований таких оценок для трейдинга, да и на мой взгляд это не настолько важно.
 

Файзуло

New member
Благодарю за участие в моей проблемме.Речь идёт о сравнении SMA(N-дней) с целью установления факта наличия или отсутствия тренда в этом временном масштабе.
Второй вопрос попробую задать иначе: какое значение N в SMA(N-дней) даст распределение которое можно считать нормальным.Отсюда третий вопрос :какой метод применим к слишком малым выборкам?
Таблиц распределения критических значений существует несколько: для 5%,1% и др . уровней.Какой уровень достоверности применяют в теханализе?
Спасибо.
 

eternal_digger

New member
Благодарю за участие в моей проблемме.Речь идёт о сравнении SMA(N-дней) с целью установления факта наличия или отсутствия тренда в этом временном масштабе.
Второй вопрос попробую задать иначе: какое значение N в SMA(N-дней) даст распределение которое можно считать нормальным.Отсюда третий вопрос :какой метод применим если выборки слишком малы.Спасибо.
Честно говоря не понятно зачем Вам для "установления факта наличия или отсутствия тренда" нужно использовать какие-либо индикаторы, так как сам тренд прекрасно идентифицируется и без них, но всегда постфактум. Использование же SMA,EMA,TEMA и прочих сглаживающих фильтров никакой предсказательной силы не несет. Хотя, если Вы пытаетесь создать что-то типа трендфолловинга тогда понятно. Но тогда для чего Вам стат. методы?
Относительно Вашего второго вопроса, думаю, что сами распределения на рынке скорее логнормальные, и в данном контексте, ИМХО, к периоду осреднения отношения не имеют.
По третьему вопросу, сорри, не понял, что Вы имеете ввиду под выбором метода.
Если Вы будете пытаться работать с "малыми" выборками, т.е. с такими, которые не смогут помочь Вам идентифицировать распределение с приемлемой для Вас погрешностью, это будет означать, что все оценки статистики полетят "как фанера над городом Парижем", и следовательно, все что Вы попытаетесь создать на основе этих оценок статистики будет сродни бросанию монетки, т.е. ни о каком стат. преимуществе здесь говорить не придется. Хотя не понимаю почему для Вас выборки могут быть "слишком малы"? Если набор инстументов не позволяет, то можно удлиннить историю.
Удачных трейдов.
 

eternal_digger

New member
Таблиц распределения критических значений существует несколько: для 5%,1% и др . уровней.Какой уровень достоверности применяют в теханализе?
Спасибо.
Сорри, но здесь я видимо не в теме. Что такое "Таблиц распределения критических значений"?
Если можно уточните поподробнее pls.
 

Файзуло

New member
Таблици распределения разные для разных метод (f-тест,U-тест,T-тест,хи-квадрат и проч.)Тренд SMA-это частный случай.В изменениях объёмов или волатильности тренд не так очевиден как в ценах.Думаю что стат.методы здесь уместны.Удлинняя историю загрубляем индикатор.Уменьшая историю увеличиваем погрешность.Смысл в том чтобы найти приемлемую середину.В литературе пишут: выборки с числом n=30 приближают распределение к нормальному.Спасибо за содержательные ответы.Удачи.
 

eternal_digger

New member
Таблици распределения разные для разных метод (f-тест,U-тест,T-тест,хи-квадрат и проч.)Тренд SMA-это частный случай.В изменениях объёмов или волатильности тренд не так очевиден как в ценах.Думаю что стат.методы здесь уместны.Удлинняя историю загрубляем индикатор.Уменьшая историю увеличиваем погрешность.Смысл в том чтобы найти приемлемую середину.В литературе пишут: выборки с числом n=30 приближают распределение к нормальному.Спасибо за содержательные ответы.Удачи.
А, понял, что Вы имеете ввиду под таблицами распределения. Я работаю в statistica и если возникает необходимость в каких-либо тестах, то в общем это делается нажатием пары кнопок и все уровни значимости уже заведены, так что это как-то выскользнуло из внимания.
Сорри, но в м моем понимании фраза "В литературе пишут: выборки с числом n=30 приближают распределение к нормальному" имеет отношение не к периоду осреднения, в данном примере SMA, а скорее к идентификации закона распределения.
Если я правильно Вас понял, Вы пытаетесь использовать некий синтетический ряд (на основе значений, например SMA) значения которого образуют для Вас некую генеральную совокупность и пытаетесь нормализовать получающееся распределение посредством изменения периода осреднения n ?
Если Ваша цель получить нечто сродни "нормальному", не проще ли стандартизировать исходный. А, имхо, изменение n не приведет к желаемой цели в силу того, что ряды на базаре хоть и перидичны, но период каждый раз разный.
Удачных трейдов.
Удачных терйдов.
 

Cinoptik

New member
Добрый день.Вопросы такие.
1.При сравнении стандартных отклонений двух SMA (например: SMA(30) на сегодняшний день и SMA(30) на вчерашний день) следует считать эти две SMA зависимыми или независимыми выборками?
2.Какое количество баров является критерием для применения того или иного метода расчёта (параметрического и непараметрического)?
3.Какой уровень достоверности следует применять в таких расчётах?
Спасибо.
1 выборки независимы.
2 критериев для расчёта нет, простой пример, измените график баров и свечей в линию. вы там не увидите кроме линии ничего. свечной и барный анализ лучше поддаётся визуальному анализу чем математическому.
3 в одном роддоме 20 палат, в другом 200, в первом роддоме стандартное отклонение равно 5-и в день и во втором равно 5-и. Какой уровень достоверности следует применять в таких расчётах?
 

MikeCurious

New member
1 выборки независимы.
Категорически несогласен. Выборки зависимы, через третью (третью, четвертую и т.д. если точнее) величину - предыдущие бары.

Насчет количества баров для прогноза - по моему тут нужно в общем случае учитывать - вероятность ошибки. Например провели 100 опытов. Из них 55 прибыльных, 45 убыточных, с некоторым мат.ожидание. Нужно посчитать какая вероятность получения меньшего числа прибыльных сделок, чтоб мат. ожидание стало 0. Если эта вероятность очень мала, то данные выборка достоверна. А вот как считать эту вероятность это уже другой вопрос ;). Скорее всего получится некоторая оценка ее через случайные выборки. Которая, по определению, будет нижней границей - т.к. в реальности есть неизвестные взаимосвязи и корреляции, которые эту вероятность ошибки увеличивают, по сравнению со случайным распределением.
 

Cinoptik

New member
Категорически несогласен. Выборки зависимы, через третью (третью, четвертую и т.д. если точнее) величину - предыдущие бары.
.
как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.
 

eternal_digger

New member
как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.
Полагаю, что Вы согласитесь с гипотезой о том, что, ИМХО,на рынке, в некие моменты времени, может присутствовать некая неэффективность. Если это так, то тогда выявление и использование этой неэффективности может позволить трейдеру в некие моменты времени просоответсвовать рынку с некоторой вероятностью, таким образом, что результирующее МО будет иметь положительное значение. Фактически это и будет проявляться в некой вероятностной связи оценок цены, объемов и/или их производных. При этом возникает нетривиальная задача фильтрации именно таких моментов времени, что решается в соответствии со своим пониманием рынка и своего бэкграунда.
Удачных трейдов.
 

MikeCurious

New member
как завтрашний бар будет зависть от сегодняшнего,как следующий часовой бар зависит от предыдущего кроме того что в день их 9,и завтра и после завтра. можно пример? как завтрашний объём будет зависть от сегодняшнего? как количество трейдеров завтра, будет зависить от сегодня? я привел несколько факторов которые указывают на независимость.
Мы про средние говорим? Я да :)
SMA(Close,5)=(c[0]+c[-1]+c[-2]+c[-3]+c[-4])/5
SMA вчерашний = (c[-1]+c[-2]+c[-3]+c[-4]+c[-5])/5;
четыре общих переменных. Какое еще доказательство связи нужно.
 

MikeCurious

New member
Может быть ИМХО это не нужно считать, если есть возможность убедиться в стационарности случайного процесса.
А как можно считать вероятность у нестационарного процесса? По моему это в любом случае придется сделать (скорее сделать такое допущение, чем реально убедиться).
 

eternal_digger

New member
А как можно считать вероятность у нестационарного процесса? По моему это в любом случае придется сделать (скорее сделать такое допущение, чем реально убедиться).
да, имхо, вся беда в том, что посчитать-то можно, только вот толку от этого.... Для нестационарного процесса вероятность просто будет функцией времени.
Как мне кажется, на маркете, отсутствуют стационарные процессы (прошу сильно не пинать, т.к. это мое скромное ИМХО). В лучшем случае, речь можно вести о неких зонах стационарности, что в общем-то и может определять время работы стратегии. Только вот оценить "глубину" этих зон, задача весьма непростая...
 

Cinoptik

New member
Мы про средние говорим? Я да :)
SMA(Close,5)=(c[0]+c[-1]+c[-2]+c[-3]+c[-4])/5
SMA вчерашний = (c[-1]+c[-2]+c[-3]+c[-4]+c[-5])/5;
четыре общих переменных. Какое еще доказательство связи нужно.
мы говорим про стандартное отклонение и их зависимость между выборками.пример зависиммых данных: внутри дня 9 часовых данных, допустим 4 белых, 4 черных и одна нейтральная, когда на вашем мониторе появились 4 белых и нейтральная , то вы с завидомой точностью можете сказать что будет дальше. думаю что пример независимых данных не требуется :) данный пример ничего общего ни имет со случайностью и форсмажорными факторами.
 

Cinoptik

New member
Полагаю, что Вы согласитесь с гипотезой о том, что, ИМХО,на рынке, в некие моменты времени, может присутствовать некая неэффективность. Если это так, то тогда выявление и использование этой неэффективности может позволить трейдеру в некие моменты времени просоответсвовать рынку с некоторой вероятностью, таким образом, что результирующее МО будет иметь положительное значение. Фактически это и будет проявляться в некой вероятностной связи оценок цены, объемов и/или их производных. При этом возникает нетривиальная задача фильтрации именно таких моментов времени, что решается в соответствии со своим пониманием рынка и своего бэкграунда.
Удачных трейдов.
скажите пожалуйста о чём этот график?
 

Cinoptik

New member
Прошу прощения, не совсем понял к чему он. Визуально, распределение близко к нормальному, остальное по картинке сказать трудно.
совершенно верно,это и есть нормальное распределение, это я к тому что МО=0, на мой взгляд,лучше не ловить те моменты когда появляется скос,т.е именно те мометны времени про которые вы говорите, а лучше использовать распределени риска.
 

eternal_digger

New member
совершенно верно,это и есть нормальное распределение, это я к тому что МО=0, на мой взгляд,лучше не ловить те моменты когда появляется скос,т.е именно те мометны времени про которые вы говорите, а лучше использовать распределени риска.
Возможно, я что-то не совсем корректно написал, но идея в общем-то и заключалась в том, что вход/выход в позицию (если мы говорим о краткосрочных свингах) должен происходить именно в достаточно "узком" диапазоне в окрестностях экстремума распределения. Другое дело, какие моменты (ситуации на маркете) и какие фильтры использовать для того, чтобы получить то искомое распределение, параметры которого позволят получить максимально лучшее соотношение риск/ревард.
Удачных трейдов.
 
Your email address will not be publicly visible. We will only use it to contact you to confirm your post.
Сверху