Только здесь прошу избегать обсуждения ЕР, честности выборов и прочей политоты, речь о чистой математике.
Да, и никакого верю / не верю, только доказательства.
Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей.
В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода.
Далее, случайная величина — это численное выражение результата случайного события.
Ну и поскольку речь все таки о результатах голосования — где там случайность?
Если любого человека попросить проголосовать не 1 раз, а 10, результат разве изменится?
Это же не стрельба из ружья, когда пули попадают в цель, с неким отклонением. И как не стреляй, все точно в яблочко не лягут.
А если меня 10 раз спросить за кого голосовать, я 10 раз отвечу одно и то же. Как и любого другого человека в трезвом уме и здравой памяти.
Более того, эксперимент проводился 1 раз, и мы не знаем какой результат будет в другой раз, кроме как предположить.
Так как выборы не позволяют этого сделать, это ключевое свойство.
Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина.
Про распределение можно говорить уже потом. И кстати, распределения не только нормальные бывают.
И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование.
Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Навеяно взрывом одинаковых тем в политике.
ES>Только здесь прошу избегать обсуждения ЕР, честности выборов и прочей политоты, речь о чистой математике. ES>Да, и никакого верю / не верю, только доказательства.
ES>Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей. ES>В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода. ES>Далее, случайная величина — это численное выражение результата случайного события.
ES>Ну и поскольку речь все таки о результатах голосования — где там случайность? ES>Если любого человека попросить проголосовать не 1 раз, а 10, результат разве изменится? ES>Это же не стрельба из ружья, когда пули попадают в цель, с неким отклонением. И как не стреляй, все точно в яблочко не лягут. ES>А если меня 10 раз спросить за кого голосовать, я 10 раз отвечу одно и то же. Как и любого другого человека в трезвом уме и здравой памяти. ES>Более того, эксперимент проводился 1 раз, и мы не знаем какой результат будет в другой раз, кроме как предположить. ES>Так как выборы не позволяют этого сделать, это ключевое свойство.
ES>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина. ES>Про распределение можно говорить уже потом. И кстати, распределения не только нормальные бывают.
ES>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование. ES>Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
Смотрят не на вероятность, что какой-то конкретный индивид проголосует так, а на распределение голосов на участках.
Подразумевается, что явной взаимосвязи между политическими взглядами и почтовым адресом нет, поэтому при 60% поддержке какой-то партии населением она не на всех участках получит ровно 60%, а на каких-то 100%, на каких-то 0% (это будут края гауссианы, очень небольшое количество и тех, и других), но большинство будет в точке 60%. Если взять 60k белых шариков и 40k красных, перемешать, а потом разделить на произвольные кучки, то в очень редких кучках будут шарики одного цвета, большая часть кучек будет содержать 55-65% белых и очень будет подозрительно, если в точках 70% и 80% обнаружится значительное количество кучек, значительно превышающее количество 69- и 71-процентных.
При этом с существованием 100% кучек в воинских частях молча соглашаются и обычно не учитываают в анализе, хотя мне и это кажется неправильным, но тут природа другая.
Повторюсь: единственное допущение, которое здесь делается: в общем случае нет причин, по которым жители дома 2, которые ходят на свой участок голосования, будут любить одну политическую партию значительно больше, чем жители дома 3 через дорогу. Такие дома могут существовать, но они — редкость.
Здравствуйте, arv, Вы писали:
arv>Повторюсь: единственное допущение, которое здесь делается: в общем случае нет причин, по которым жители дома 2, которые ходят на свой участок голосования, будут любить одну политическую партию значительно больше, чем жители дома 3 через дорогу. Такие дома могут существовать, но они — редкость.
Откуда всё таки похожесть на нормальное распределение? Кажется, что оно должно быть мультимодальным: благополучные районы голосуют одним образом, рабочие — другим, новостройки — третьим. Уже упомянутые воинские части дадут свой 100% результат за правящую партию.
Есть классические пример со временем дороги на работу: если пробок нет, то доезжает за 10 минут. Если есть, то за 30. В среднем будет 20, но гистограмма окажется бимодальной, в которой значение 20 будет почти не предствлено. И при этом мы будем иметь множественные измерения одной и той же СЛУЧАЙНОЙ величины.
Так что я согласен с топикстартером: нормальность — это второе, сначала надо определиться с тем, что мы вообще исследуем.
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, arv, Вы писали:
arv>>Повторюсь: единственное допущение, которое здесь делается: в общем случае нет причин, по которым жители дома 2, которые ходят на свой участок голосования, будут любить одну политическую партию значительно больше, чем жители дома 3 через дорогу. Такие дома могут существовать, но они — редкость.
N>Откуда всё таки похожесть на нормальное распределение?
Из опыта выборов с хорошим покрытием наблюдателями, в других странах, из здравого смысла, который подсказывает, что такой нехилой сегрегации нашего населения, которая дала бы видимый второй горб на графике, нет. Это ж нужно хотя бы 10 миллионов любителей одной конкретной партии отселить от прочего населения и поместить их всех в новостройки. Прямо перед выборами, чтоб не успели перемешаться. Извините, очень тянет поутрировать в таких обсуждениях, но это действительно так: из вариантов "существуют миллионы иллюминатов, которые притворяются такими как мы, но на выборах ведут себя по-другому" и "опять все подделали" более реалистичным кажется второй. Страна большая, никакого видимого фактора, способного поделить ее хотя бы на два хорошо отделимых класса, нет. Почти любое распределение будет близким к нормальному.
Здравствуйте, koenig, Вы писали:
ES>>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина.
K>как обычно доказывают случайность? K>как выглядит доказательство для ружья? K>ружье тот же, ты тот же, что именно дает случайность?
arv>>>Повторюсь: единственное допущение, которое здесь делается: в общем случае нет причин, по которым жители дома 2, которые ходят на свой участок голосования, будут любить одну политическую партию значительно больше, чем жители дома 3 через дорогу. Такие дома могут существовать, но они — редкость.
Как вполне реалистичный вариант — в доме №2 живет красноречивый и общительный сосед с шилом в заднице, который многих жителей дома склонил голосовать таким-то образом.
N>>Откуда всё таки похожесть на нормальное распределение?
arv>Из опыта выборов с хорошим покрытием наблюдателями, в других странах, из здравого смысла, который подсказывает, что такой нехилой сегрегации нашего населения, которая дала бы видимый второй горб на графике, нет. Это ж нужно хотя бы 10 миллионов любителей одной конкретной партии отселить от прочего населения и поместить их всех в новостройки. Прямо перед выборами, чтоб не успели перемешаться. Извините, очень тянет поутрировать в таких обсуждениях, но это действительно так: из вариантов "существуют миллионы иллюминатов, которые притворяются такими как мы, но на выборах ведут себя по-другому" и "опять все подделали" более реалистичным кажется второй. Страна большая, никакого видимого фактора, способного поделить ее хотя бы на два хорошо отделимых класса, нет. Почти любое распределение будет близким к нормальному.
Тут кроме этих, есть масса промежуточных вариантов — как с жульничеством, так и без.
В общем, центральная предельная теорема, конечно, верна, но ее часто применяют не проверив условия ее применимости. Примерно о чем пишет в своих книгах Нассим Талеб.
Здравствуйте, Nuzhny, Вы писали:
N>Откуда всё таки похожесть на нормальное распределение? Кажется, что оно должно быть мультимодальным: благополучные районы голосуют одним образом, рабочие — другим, новостройки — третьим. Уже упомянутые воинские части дадут свой 100% результат за правящую партию.
ЦПТ . Но вообще же речь должна идти о каком-нибудь Бета-распределении, т.е. смещенный колокол.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей. ES>В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода. ES>Далее, случайная величина — это численное выражение результата случайного события.
ES>Ну и поскольку речь все таки о результатах голосования — где там случайность?
Деление на участки это случайные выборки в пределах города, где распределение голосов (вероятностей) равномерно.
Осталось посмотреть карты деления на участки, чтобы в этом убедиться.
Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования. Будем ли мы видеть это в результатах голосования по участкам. Я думую, что да.
Общий процент голосов стороников не случаен и может быть известен заранее в результате соц.опросов к примеру. Случайно распределение их по разным участкам голосования и как результат, случаен результат голосования на конкретном участке голосования.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Из чего следует что это распределение должно быть нормальным? То что оно самое распространенное? ну такое себе доказательство.
А она и не является нормальным, хотя бы потому, что не может быть отрицательный процент проголосовавших. Скорее это логнормальное распределение, что не отменяют ту самую гауссиану.
ES>Я напомню, распределения бывают и не нормальные. И встречаются в природе.
Встречаются. Но мультмидальные распределения (с двуми и более пиками) встречаются сильно реже унимодальных.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
K>>как обычно доказывают случайность? K>>как выглядит доказательство для ружья? K>>ружье тот же, ты тот же, что именно дает случайность?
ES>Я собственно именно этот вопрос и задал.
Ну вот и подумай.
Общепризнано, что стрельба из ружья — случайный вероятностный процесс.
Хотя полётом пули управляют хорошо известные законы физики.
Даже когда ружьё закреплено в тисках.
arv>Повторюсь: единственное допущение, которое здесь делается: в общем случае нет причин, по которым жители дома 2, которые ходят на свой участок голосования, будут любить одну политическую партию значительно больше, чем жители дома 3 через дорогу. Такие дома могут существовать, но они — редкость.
Простой (и, на мой взгляд, частый) пример — точечная застройка. Есть некий квартал, жители которого более-менее перемешаны. И в этом квартале втыкают новый дом.
Если все квартиры продадут по ипотеке — жители будут из слоя, который может позволить себе ипотеку.
Если все квартиры выкупит муниципалитет и отдаст детдомовцам — там будет другой срез общества.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Ну допустим. ES>Из чего следует что это распределение должно быть нормальным? То что оно самое распространенное? ну такое себе доказательство.
ES>Я напомню, распределения бывают и не нормальные. И встречаются в природе.
Начнём с того, что даже на фальсифицированных выборах мы видим искажённую гаусиану.
Этого достаточно.
Рассмотрим науку физику, в истинности которой никто не сомневается.
Вот ты сомневаешься в том, что ускорение свободного падения одинаково для всех тел?
Как ты думаешь, Галлилей, который это открыл, сколько экспериментов сделал?
Использовал ли он аппарат статистики?
Здравствуйте, alpha21264, Вы писали:
A>Ну вот и подумай. A>Общепризнано, что стрельба из ружья — случайный вероятностный процесс. A>Хотя полётом пули управляют хорошо известные законы физики. A>Даже когда ружьё закреплено в тисках.
И вот взяли патроны из двух разных партий, одна с бракованными, несимметричными пулями, смешали. И получился не один, а два колокола с разными дисперсиями. Хм!
T>Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования.
Вне зависимости от стоимости квартир, престижности районов и т.п? И на стыке нахаловки и элитки, например, не будет различий?
S>Если все квартиры продадут по ипотеке — жители будут из слоя, который может позволить себе ипотеку. S>Если все квартиры выкупит муниципалитет и отдаст детдомовцам — там будет другой срез общества.
Возможно. Но для подтверждения этой гипотезы надо показать статистически, что у жителей с ипотекой совершенно другие политические предпочтения. А также что у детдомовцев совершенно другие предпочтения. А потом показать в этих конкретных выборах дома с ипотекой и дома с детдомовцами. Без статистического подтверждения твоя гипотеза ничем не отличается от "в одном доме есть макаронной монстр, а в другом нет", а теперь сторонники махинаций на выборах попрыгайте и докажите, что макаронного монстра в домах нет или что он не влияет.
T>>Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования. S>Вне зависимости от стоимости квартир, престижности районов и т.п? И на стыке нахаловки и элитки, например, не будет различий?
Если есть значимые отличия, то покажи их статистикой. А потом покажи, где были нахаловки и элитки на этих конкретных выборах.
DB>Возможно. Но для подтверждения этой гипотезы надо показать статистически, что у жителей с ипотекой совершенно другие политические предпочтения. А также что у детдомовцев совершенно другие предпочтения. А потом показать в этих конкретных выборах дома с ипотекой и дома с детдомовцами. Без статистического подтверждения твоя гипотеза ничем не отличается от "в одном доме есть макаронной монстр, а в другом нет", а теперь сторонники махинаций на выборах попрыгайте и докажите, что макаронного монстра в домах нет или что он не влияет.
Т.е. вместо того, чтобы доказать корректность математической модели выборов нужно потребовать доказать свою точку зрения противникам? тоже вариант...
S>Т.е. вместо того, чтобы доказать корректность математической модели выборов нужно потребовать доказать свою точку зрения противникам? тоже вариант...
Нет. Ты просишь доказать отсутствие. В данном случае: "докажите отсутствие других всевозможных факторов, которые привели к такому распределению". Как только тебе докажут, что там нет элиток и домов детдомовцев, ты начнёшь просить доказательства отсутствия активной домоуправляющей, а потом макаронного монстра.
Когда просят доказать отсутствие, то это "фи".
Я же тебе предлагаю доказать присутствие.
ES>>>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина.
K>>как обычно доказывают случайность? K>>как выглядит доказательство для ружья? K>>ружье тот же, ты тот же, что именно дает случайность?
ES>Я собственно именно этот вопрос и задал.
я отвечу
процессом стрельбы управляет нервная система
мы не знаем, где именно она вносит разброс, при том что исходные импульсы одинаковые
мы видим этот разброс по факту, и поэтому считаем процесс случайным
нету никакого доказательства, есть наблюдение — мы собрали статистику выстрелов, и видим, что она похожа на случайный процесс
с выборами то же самое мешает сделать политическая ангажированность
не было бы фальсификаций — те же самые люди благосклонно считали бы выборы случайным процессом
более того, ставили бы в вину демократии эту самую случайность
судьбоносные решения принимаются случайным процессом — тьфу
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей. ES>В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода.
Ни-хре-на.
Гауссиана гораздо лучше получается на неслучайных процессах, чем на случайных.
Если ты возьмёшь обычный счетчик километража на автомобиле,
и посчитаешь сумму всех видимых цифр (сумму шести видимых цифр в каждый момент)
за всё время работы счётчика, то получишь абсолютно чёткую гауссиану.
И таким свойством обладает любой процесс (не обязательно случайный),
у которого число факторов в сумме больше трёх.
N>Откуда всё таки похожесть на нормальное распределение? Кажется, что оно должно быть мультимодальным: благополучные районы голосуют одним образом, рабочие — другим, новостройки — третьим. Уже упомянутые воинские части дадут свой 100% результат за правящую партию.
я вот когда квартиру покупал, сильно этим морочился
так вот, деление на районы у нас очень, очень слабое
я бы с удовольствием переехал в город-сад, но на самом деле у нас плюс-минус везде как на картинке "посмотри, как прекрасен мир без наркотиков"
я, блин, даже к рублевке присматривался (там есть еще развалюхи, в которые вполне можно въехать)
воздух норм, но в целом опять та же картина, просто с другими типами строений (вместо стен многоэтажек стены заборов)
чтобы районы голосовали по-разному они должны быть, для начала
а то я приезжаю в бирюлево, гуляю там ночью и не понимаю, о чем все говорят — всё то же самое
DB>Нет. Ты просишь доказать отсутствие. В данном случае: "докажите отсутствие других всевозможных факторов, которые привели к такому распределению". Как только тебе докажут, что там нет элиток и домов детдомовцев, ты начнёшь просить доказательства отсутствия активной домоуправляющей, а потом макаронного монстра. DB>Когда просят доказать отсутствие, то это "фи". DB>Я же тебе предлагаю доказать присутствие.
Я это вижу по другому. Есть модель, которая не работает в каком-то достаточно большом количестве случаев (сейчас быстро не найду, кажется было процентов 20-30 участков?). Эти расхождения объясняются не проблемами модели, а некорректностью входных данных.
Даже несколько уточнюсь. Если у меня на 10 бросков монеткой выпадет 9 раз Орел могут быть варианты: модель неверная, монетка искажена, недостаточное количество попыток (т.е. модель верная, но в данном конкретном случае она не сработала). Возможно что данные некорректны, возможно в данном конкретном случае были какие-то неучтенные нюансы.
Здравствуйте, Nuzhny, Вы писали:
A>>Ну вот и подумай. A>>Общепризнано, что стрельба из ружья — случайный вероятностный процесс. A>>Хотя полётом пули управляют хорошо известные законы физики. A>>Даже когда ружьё закреплено в тисках.
N>И вот взяли патроны из двух разных партий, одна с бракованными, несимметричными пулями, смешали. И получился не один, а два колокола с разными дисперсиями. Хм!
Персонаж спрашивает не про колокол, а про само понятие случайности.
Стрельба — это случайный процесс или нет?
Двухмодальное (и даже двухдисперсное) распределение — это тоже случайность.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Ну и поскольку речь все таки о результатах голосования — где там случайность?
Заранее не известно за кого проголосует гражданин. Случайное событие — это число от 1 до n (количество кандидатов) от каждого следующего гражданина.
ES>Если любого человека попросить проголосовать не 1 раз, а 10, результат разве изменится?
Если брать одно и то же число каждый раз, то оно, конечно, не изменится.
ES>Это же не стрельба из ружья, когда пули попадают в цель, с неким отклонением. И как не стреляй, все точно в яблочко не лягут.
Тут ты каждый раз новую пулю берешь, так и нового человека надо опрашивать каждый раз.
ES>А если меня 10 раз спросить за кого голосовать, я 10 раз отвечу одно и то же. Как и любого другого человека в трезвом уме и здравой памяти. ES>Более того, эксперимент проводился 1 раз, и мы не знаем какой результат будет в другой раз, кроме как предположить.
Тебя надо опросить раз. Ты и есть случайное событие. Да, у нас есть конечное количество случайных величин и нет возможности брать их сколь угодно много.
ES>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина.
Процент голосов — это среднее выборки случайных величин, поэтому он и сам случайная величина.
ES>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование.
Да вполне. ЦПТ говорит, что если мы будем брать среднее по выборке из N величин много-много раз, то при росте N распределение будет стремиться к нормальному.
Т.е. у нас есть выборки по примерно 500-1000 величин (один участок) и таких выборок у нас столько, сколько есть участков.
Вроде размер выборки достаточно большой, на практике 30 хватает обычно, а у нас 1000. Только самих выборок сколько? Не особо много.
Т.е. у нас есть два параметра, которые надо стремить к бесконечности, чтобы получить нормальное распределение. Ну ладно, размер выборки не особо надо, а вот количество выборок должно быть большим. А у нас нету столько.
В итоге, какое-то приближение мы имеем к гауссиане, но оценить его тоже не можем. Ну по крайней мере никто этого не сделал пока. Только "на глазок". А на глазок — это в сад.
ES>Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
Инструмент правильный. Не хватает характеристик этой случайной величины, т.е. не понятно, подходит ли она под условия ЦПТ. И не хватает оценки сходимости на том количестве данных, что у нас есть. Бесконечного количества граждан у нас, к счастью, нет.
Здравствуйте, Sammo, Вы писали:
S>Вне зависимости от стоимости квартир, престижности районов и т.п? И на стыке нахаловки и элитки, например, не будет различий?
Ты о чём говоришь?
Об абстрактном шаре в вакууме или о конкретных выборах?
На конкретных выборах мы имеем множество участков, где есть пик на распределении на значении 70%.
Это теорией элитки не обьясняется.
Если говорить про шар в вакууме, то
1) Есть множество участков. На каждом участке соотношение элитки и нахалки разное.
И вообще нынешнем обществе распределение доходов более или менее плавное.
2) Даже в элитке и нахалке каждый человек разный.
Поэтому нету 100% ни за того ни за другого кандидата.
N>Есть классические пример со временем дороги на работу: если пробок нет, то доезжает за 10 минут. Если есть, то за 30. В среднем будет 20, но гистограмма окажется бимодальной, в которой значение 20 будет почти не предствлено.
А если на одну гистограмму наложить времена поездок всех жителей города?
Такой пример, как мне кажется, ближе к оригинальному в начале топика.
Здравствуйте, alpha21264, Вы писали:
A>Персонаж спрашивает не про колокол, а про само понятие случайности.
Нет, он спрашивает, плотность распределения какой случайной величины на выборах хотят выдать за нормальное.
В случае стрельбы из ружья мы измеряет случайный вектор [X, Y], элементы которого являются смещением от центра мишени в мм.
A>Стрельба — это случайный процесс или нет?
Стрельба всем понятна и не интересна. Почему ты на вопрос топикстартера не отвечаешь?
A>Двухмодальное (и даже двухдисперсное) распределение — это тоже случайность.
Или не случайность. Распределения вполне могут быть результатом детерменированного процесса. Например, число протонов и нейтронов в ядре атома химического элемента.
Здравствуйте, alpha21264, Вы писали:
A>Рассмотрим науку физику, в истинности которой никто не сомневается. A>Вот ты сомневаешься в том, что ускорение свободного падения одинаково для всех тел?
Здравствуйте, Muxa, Вы писали:
M>А если на одну гистограмму наложить времена поездок всех жителей города? M>Такой пример, как мне кажется, ближе к оригинальному в начале топика.
Это уже будет как средняя температура по больнице.
Здравствуйте, Sammo, Вы писали:
S>Простой (и, на мой взгляд, частый) пример — точечная застройка. Есть некий квартал, жители которого более-менее перемешаны. И в этом квартале втыкают новый дом. S>Если все квартиры продадут по ипотеке — жители будут из слоя, который может позволить себе ипотеку. S>Если все квартиры выкупит муниципалитет и отдаст детдомовцам — там будет другой срез общества.
Это не имеет значения, ЦПТ как раз и говорит, что пофиг на это. Если ты возьмешь среднее с дохреналлиона участков, то выбивающихся будет мало (края колокола), в большинстве все будут ходить строем (середина колокола).
А если взять чуть меньше, чем дохрена, участков, то там любая картина может получиться.
Здравствуйте, arv, Вы писали:
arv>Страна большая, никакого видимого фактора, способного поделить ее хотя бы на два хорошо отделимых класса, нет. Почти любое распределение будет близким к нормальному.
Так, стоп.
При чем тут вся страна? Речь идет о небольшой группе людей проживающих в пределах 1-2 кварталов.
Или ты забыл, что люди голосуют на своем участке, а не всей страной скопом. В масштабах страны, кстати распределение нормальное.
Но никто не гарантирует что такое же распределение будет на участках, где голосует 100 человек.
Там запросто могут быть общаги какого-то завода, и получи перекос.
arv>>Из опыта выборов с хорошим покрытием наблюдателями ES>Как в эту теорию вписываются участки где голосуют военные?
Такие специфические участки (в воинских частях, СИЗО, разных закрытых учреждениях) иногда исключают из общего массива при анализе.
Кстати, сама идея "ну всем же ясно, что военные голосуют по приказу"... ну ладно, просили без политоты обойтись.
Здравствуйте, Nuzhny, Вы писали:
N>И вот взяли патроны из двух разных партий, одна с бракованными, несимметричными пулями, смешали. И получился не один, а два колокола с разными дисперсиями. Хм!
Само отклонение да. Но мы же берем среднее выборки какого-то размера, как с выборами (процент голосов на участке), а там уже пофиг, будет в пределе нормальное распределение.
S>Я это вижу по другому. Есть модель, которая не работает в каком-то достаточно большом количестве случаев (сейчас быстро не найду, кажется было процентов 20-30 участков?). Эти расхождения объясняются не проблемами модели, а некорректностью входных данных.
Совершенно не так. Моделью тебе никто ничего не доказывает. Есть гипотеза (нарисованные цифры). В подкреплении которой есть факты: результаты прошлых выборов на этих участках, результаты этих выборов, расположение участков. Есть наблюдения: напечатанные на принтере протоколы, время подачи результатов аномальных протоколов. Никакие из этих фактов не противоречат гипотезе. Гипотеза же объясняет все факты. Этого достаточно, чтобы составить своё мнение о чистоте выборов, а для прокуратуры есть достаточно оснований для проверки.
Такие же как ты начинают скакать: а докажите, что не "элитные дома", а "докажите, что не домоуправяющая". Так не работает. Если у тебя есть гипотеза, которая объясняет факты и не противоречит им, подтверди свою гипотезу статистикой, описанием районов и домов, процентом детдомовцев там. А потом наложи свою гипотезу на результаты прошлых выборов. Что ж на прошлых то элитка, детдомовцы и подобное проголосовали иначе при той же явке?
Доказать статистикой нельзя ничего. Я уже приводил пример. 100 раз кинули монетку. 100 раз подряд орёл. Махинация? Фальшивая монетка? А ты докажи что это не божественное проведение!!! Так может и здесь ангел хранитель президента подействовал на умы избирателей. Но только на 20 участках. А на остальных не подействовал (не успел долететь). А докажи, что это не так!
Здравствуйте, De-Bill, Вы писали:
DB>Если есть значимые отличия, то покажи их статистикой. А потом покажи, где были нахаловки и элитки на этих конкретных выборах.
Смысл случайной величины как раз в том, что мы не хотим/не можем копаться в мелочах, которые вызывают различия.
Здравствуйте, Tourist, Вы писали:
T>Здравствуйте, Evgeniy Skvortsov, Вы писали:
T>Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования. Будем ли мы видеть это в результатах голосования по участкам. Я думую, что да.
T>Общий процент голосов стороников не случаен и может быть известен заранее в результате соц.опросов к примеру. Случайно распределение их по разным участкам голосования и как результат, случаен результат голосования на конкретном участке голосования.
Почему твоя модель не работает на участках где голосуют вояки? Или квартал заселен работягами завода.
Здравствуйте, andrey.desman, Вы писали:
AD>Тебя надо опросить раз. Ты и есть случайное событие. Да, у нас есть конечное количество случайных величин и нет возможности брать их сколь угодно много.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Но никто не гарантирует что такое же распределение будет на участках, где голосует 100 человек. ES>Там запросто могут быть общаги какого-то завода, и получи перекос.
Результат на таких участках будет рандомным. А если на графике видно скопление вокруг целого числа процентов..
Здравствуйте, Evgeniy Skvortsov, Вы писали:
AD>>Тебя надо опросить раз. Ты и есть случайное событие. Да, у нас есть конечное количество случайных величин и нет возможности брать их сколь угодно много. ES>Голосование на участках для военных.
Здравствуйте, andrey.desman, Вы писали:
AD>Так и что? У колокола есть края, на которых за кандидата 0% и 100% соответственно. Но их мало должно быть. Но они есть.
В масштабах страны — да. Тут даже вопросов нет.
А в масштабах одного участка?
M>>А если на одну гистограмму наложить времена поездок всех жителей города? M>>Такой пример, как мне кажется, ближе к оригинальному в начале топика. N>Это уже будет как средняя температура по больнице.
DB>Совершенно не так. Моделью тебе никто ничего не доказывает. Есть гипотеза (нарисованные цифры). В подкреплении которой есть факты: результаты прошлых выборов на этих участках, результаты этих выборов, расположение участков. Есть наблюдения: напечатанные на принтере протоколы, время подачи результатов аномальных протоколов. Никакие из этих фактов не противоречат гипотезе. Гипотеза же объясняет все факты. Этого достаточно, чтобы составить своё мнение о чистоте выборов, а для прокуратуры есть достаточно оснований для проверки. DB>Такие же как ты начинают скакать: а докажите, что не "элитные дома", а "докажите, что не домоуправяющая". Так не работает. Если у тебя есть гипотеза, которая объясняет факты и не противоречит им, подтверди свою гипотезу статистикой, описанием районов и домов, процентом детдомовцев там. А потом наложи свою гипотезу на результаты прошлых выборов. Что ж на прошлых то элитка, детдомовцы и подобное проголосовали иначе при той же явке?
DB>Доказать статистикой нельзя ничего. Я уже приводил пример. 100 раз кинули монетку. 100 раз подряд орёл. Махинация? Фальшивая монетка? А ты докажи что это не божественное проведение!!! Так может и здесь ангел хранитель президента подействовал на умы избирателей. Но только на 20 участках. А на остальных не подействовал (не успел долететь). А докажи, что это не так!
1. Про "такие как ты" — забавно.
2. Личное имхо — почему я пишу про дома, элитку и прочее. Именно потому, что, на мой взгляд, отсутствует ключевое — доказательства. В большинстве случаев озвучивается, что нарушена гауссиана = подтасовки выборов. Если бы было как описано — есть нарушения модели (гипотезы) — это основание для дополнительной проверки. На основании проверки обнаружены факты = были подтасовки. Не смогли найти найти факты — извините = подтасовок не было. Прокуратура может и не будет проводить проверку, но есть наблюдатели, есть протоколы, в некоторых случаях есть видео записи — все это может использоваться для обнаружения фактов.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина.
Это не надо доказывать, даже константа — это случайная величина со своим законом распределения. Есть такая наука эконометрика, там все измеряемые экономические переменные рассматриваются как случайные величины, зависимости между ними оцениваются в терминах корелляция-ковариация. Они и есть случайные, т.к. случайность означает что мы не можем это контролировать/предсказывать, например потому что оно зависит от неизвестного числа причин. С выборами тоже этот подход норм.
Насчёт нормального распределения добавлю, оно часто в природе (и в выборах) встречается, т.к. к нему сходится сумма независимых случайных величин. То есть если что-то (результат канидата на выборах в разных районах) зависит от большого количества независимых слагаемых (голоса индивидов), то наверное там будет распределение нормальное.
опа опа мы воюем с нато
любит хавать этот кал
путинская вата
Здравствуйте, Evgeniy Skvortsov, Вы писали:
AD>>Так и что? У колокола есть края, на которых за кандидата 0% и 100% соответственно. Но их мало должно быть. Но они есть. ES>В масштабах страны — да. Тут даже вопросов нет. ES>А в масштабах одного участка?
В каких ещё масштабах? Не понимаю, что ты хочешь сказать...
Мы генерирует новую случайную величину (голос участка), усредняя выборки из оригинальной величины (отдельные голоса).
Тут нет никаких масштабов, просто нам повезло и тысячу раз выпала решка. Но таких везём мало. Но они есть.
Здравствуйте, Nuzhny, Вы писали:
N>И вот взяли патроны из двух разных партий, одна с бракованными, несимметричными пулями, смешали. И получился не один, а два колокола с разными дисперсиями. Хм!
А бывают такие бракованные патроны, которые дают идеально точное попадание?
Здравствуйте, Sammo, Вы писали:
DB>>возможно в данном конкретном случае были какие-то неучтенные нюансы.
Ну их уже нашли) Есть правда одна проблемка — протоколы были переписаны в ворде.
Так что я не понимаю о чем речь в принципе.
Проблема-то решена, а теоретизировать о всяких теоретически возможных нюансах теперь нет смысла.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование. ES>Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
В принципе ты верно уловил суть, именно давление градусником. Применение нормального закона базируется на мощном допущении о том, что распределение голосов по явке случайная величина, подчиняющаяся ЦТП. Это допущение принимается как аксиома. Причем попыток как-то доказать не принималось. В качестве доказательств приводятся данные голосования в некоторых странах (Чехия, Польша, Мексика), на данных которых строится красивый колокол. Причем, что характерно, данные берутся не все, а те, которые не портят картину. В «классической статье» Шпилькина по Польше взяты взяты данные II тура выборов президента в 2007 г. Ну, т.е. указанное допущение «доказывается» методом подгона.
Когда может получится красивый колокол? Тогда, когда сторонники разных кандидатов равномерно распределены по участкам голосования и имеют одинаковую электоральную активность. В противном случае, распределение может быть каким угодно. Стоит посмотреть на данные выборов, например, в США (кстати, любопытно изучать праймериз, там как раз видно не однородность и группировки разных кандидатов).
Здравствуйте, Sammo, Вы писали:
S>1. Про "такие как ты" — забавно. S>2. Личное имхо — почему я пишу про дома, элитку и прочее. Именно потому, что, на мой взгляд, отсутствует ключевое — доказательства. В большинстве случаев озвучивается, что нарушена гауссиана = подтасовки выборов. Если бы было как описано — есть нарушения модели (гипотезы) — это основание для дополнительной проверки. На основании проверки обнаружены факты = были подтасовки. Не смогли найти найти факты — извините = подтасовок не было. Прокуратура может и не будет проводить проверку, но есть наблюдатели, есть протоколы, в некоторых случаях есть видео записи — все это может использоваться для обнаружения фактов.
Но ведь факты как раз найдены.
Тебе ссылку показать?
ES>>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование.
AD>Да вполне. ЦПТ говорит, что если мы будем брать среднее по выборке из N величин много-много раз, то при росте N распределение будет стремиться к нормальному. AD>Т.е. у нас есть выборки по примерно 500-1000 величин (один участок) и таких выборок у нас столько, сколько есть участков. AD>Вроде размер выборки достаточно большой, на практике 30 хватает обычно, а у нас 1000. Только самих выборок сколько? Не особо много. AD>Т.е. у нас есть два параметра, которые надо стремить к бесконечности, чтобы получить нормальное распределение. Ну ладно, размер выборки не особо надо, а вот количество выборок должно быть большим. А у нас нету столько. AD>В итоге, какое-то приближение мы имеем к гауссиане, но оценить его тоже не можем. Ну по крайней мере никто этого не сделал пока. Только "на глазок". А на глазок — это в сад.
Тоже не факт, что ЦПТ здесь применима.
В ЦПТ есть еще 2 важных условия — случайные величины должны быть независимые и одинаково распределенные. И то, и другое вполне могут нарушаться. Например, Вася проголосует за любимого кандидата, а Петя проголосует так же, как Вася. Ну и распределение на разных участках вполне может быть разное.
Насколько существенны эти отклонения, можно ли с их учетом с помощью ЦПТ получить хотя бы приблизительный результат — непонятно.
В общем, социология — эта такая наука (в отличие, например, от физики и многих других), где вряд ли можно полагаться на простые статистические модели. Статистические модели, конечно, должны использоваться, но они будут более хитровывернутыми
Здравствуйте, Evgeniy Skvortsov, Вы писали:
A>>Если ружьё закреплено в тисках, гауссиана становится ещё более чёткой.
ES>Оставьте в покое стрельбу, к ней вопросов нет. Вопросы к выборам.
К стрельбе вопросы есть.
Давай объясняй, откуда в этом случае берётся случайность и что это такое.
Не объяснишь — значит не понимаешь.
Значит ты это воспринимаешь на уровне религиозной догмы —
"ну мне же сказали в школе, что стрельба случайна"
"а про выборы не сказали".
ES>Я еще раз говорю, доказательства по аналогии не работают.
Это не доказательство по аналогии. Это понимание природы случайности.
Ты её не понимаешь.
Совсем.
K>В ЦПТ есть еще 2 важных условия — случайные величины должны быть независимые и одинаково распределенные. И то, и другое вполне могут нарушаться. Например, Вася проголосует за любимого кандидата, а Петя проголосует так же, как Вася. Ну и распределение на разных участках вполне может быть разное.
э, нет
распределение может быть любым
масштаб должен быть одинаковым
т.е. никто не должен приходить с пачкой из 100 бюллетеней, а то цпт сломается
а распределения, из которых складывается общее, могут быть любыми
в частности, не требуется чтобы хотя бы одно из них было нормальным
Здравствуйте, alpha21264, Вы писали:
A>Здравствуйте, Evgeniy Skvortsov, Вы писали:
K>>>как обычно доказывают случайность? K>>>как выглядит доказательство для ружья? K>>>ружье тот же, ты тот же, что именно дает случайность?
ES>>Я собственно именно этот вопрос и задал.
A>Ну вот и подумай. A>Общепризнано, что стрельба из ружья — случайный вероятностный процесс. A>Хотя полётом пули управляют хорошо известные законы физики. A>Даже когда ружьё закреплено в тисках.
Вот только модель у тебя не полная. В любом измерение есть +-х отклоений, вот все эти +- и дают вероятность отклонения.
ES>Тут пока увидел доказательства по аналогии, типа вот там де работает, значит и на выборах должно. Какая связь — непонятно.
тараканы всё же настойчиво советуют понять, почему там работает
да, это общепринято и вроде не требует подтверждения
но понять — почему — будет очень полезно
Здравствуйте, Evgeniy Skvortsov, Вы писали:
A>>Рассмотрим науку физику, в истинности которой никто не сомневается. A>>Вот ты сомневаешься в том, что ускорение свободного падения одинаково для всех тел?
ES>Доказательства аналогией — в топку.
Не надо говорить слов, которые ты не понимаешь.
Похоже, что ты вообще не понимаешь, что такое доказательство.
Вот есть Галлилей. Вот есть ускорение свободного падения.
Способен ли ты понять доказательство этого (абсолютно очевидного) закона?
Если ты не можешь даже этого, то какого хрена ты лезешь в вероятность?
Это же гораздо сложнее!
K>>>>как обычно доказывают случайность? K>>>>как выглядит доказательство для ружья? K>>>>ружье тот же, ты тот же, что именно дает случайность?
ES>>>Я собственно именно этот вопрос и задал.
A>>Ну вот и подумай. A>>Общепризнано, что стрельба из ружья — случайный вероятностный процесс. A>>Хотя полётом пули управляют хорошо известные законы физики. A>>Даже когда ружьё закреплено в тисках. W>Вот только модель у тебя не полная. В любом измерение есть +-х отклоений, вот все эти +- и дают вероятность отклонения.
тогда придется рассмотреть модель ошибки измерения
какая там ошибка? систематическая? вводи поправку или меняй линейку
случайная? померяй много раз и бери среднее
или под отклонением измерения ты имел ввиду отклонение самого выстрела? (т.е. выстрел == измерение)
Здравствуйте, De-Bill, Вы писали:
T>>>Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования. S>>Вне зависимости от стоимости квартир, престижности районов и т.п? И на стыке нахаловки и элитки, например, не будет различий?
DB>Если есть значимые отличия, то покажи их статистикой. А потом покажи, где были нахаловки и элитки на этих конкретных выборах.
Нет, этот тот кто заявляет что на всех участках должны быть +- одинаковые доли по кандидатам пусть это докажет.
А почему ты урезал мой вопрос, оставив только часть?
Я спросил — "Способность с высокой вероятностью предсказать результат — достаточный критерий?"
Такая способность была доказана.
8 из 13 аномальных протоколов были найдены, и было видно что они сфальсифицированы.
И все 13 оказались рассчитаны по простой формуле.
Этого тебе не хватает?
Какая вообще цель поста? Доказать что-то там абстрактное, и постоянно требовать подтверждений, попутно говоря "а это не доказано"?
DO>Когда может получится красивый колокол? Тогда, когда сторонники разных кандидатов равномерно распределены по участкам голосования и имеют одинаковую электоральную активность. В противном случае, распределение может быть каким угодно. Стоит посмотреть на данные выборов, например, в США (кстати, любопытно изучать праймериз, там как раз видно не однородность и группировки разных кандидатов).
а когда сторонники неравномерно распределены — эту неравномерость можно изучить и понять причины
скажем, часто видна зависимость предпочтений от дохода
результаты на российских выборах тоже изучили — таких зависимостей не нашли, чего не скажешь про вбросы и переписывание протоколов
но ты волен внести свой вклад — если продемонстрируешь зависимость результатов от каких-то социальных параметров и эта зависимость будет распространена — это будет очень сильный аргумент. фактически, если модель окажется хорошей — она полностью закроет вопрос
Здравствуйте, koenig, Вы писали:
K>а когда сторонники неравномерно распределены — эту неравномерость можно изучить и понять причины K>скажем, часто видна зависимость предпочтений от дохода
Именно, для этого можно и нужно изучать данные.
K>результаты на российских выборах тоже изучили — таких зависимостей не нашли, чего не скажешь про вбросы и переписывание протоколов
Ссылки на исследования есть?
K>но ты волен внести свой вклад — если продемонстрируешь зависимость результатов от каких-то социальных параметров и эта зависимость будет распространена — это будет очень сильный аргумент. фактически, если модель окажется хорошей — она полностью закроет вопрос
Совершено, это была бы сильная работа, может на докторскую потянуть. Для этого нужно время и кто-то кто будет делать всякую черновую работу, ну дам данные выдирать в Excel, например. Я сейчас преподавательской работой не занимаюсь, но если вдруг случится вернуться в лоно высшей школы, то несколько тем дипломный проектов у меня уже есть.
Здравствуйте, koenig, Вы писали:
K>но ты волен внести свой вклад — если продемонстрируешь зависимость результатов от каких-то социальных параметров и эта зависимость будет распространена — это будет очень сильный аргумент. фактически, если модель окажется хорошей — она полностью закроет вопрос
Да, предлагаю взять ленинский район г. Владивостока, выборы 16 декабря.
Вся статистика официальная есть, правда 13 из 59 участков сфальсифицированы, и это доказано. Но наших оппонентов это не смущает, вот и отлично, пусть делают вид что данные не сфальсифицированы, и заморочатся создать модель которая это объясняет.
Пусть посмотрят что за дома, частные, не частные, гостинки, элитное жилье. Формула должна быть очень сложная, но думаю, нет ничего невозможного.
А потом мы просто возьмем эту модель и проверим ее на выборах которые были за 3 месяца до этого. Ведь за 3 месяца социальные параметры не очень сильно должны были измениться, так?
И если модель покажет такие же аномальные пики, то значит она работает.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
AD>>И что с ним не так?
ES>на некоторых 100% голосов за 1 кандидата
С точки зрения теории вероятности в воинской части все "избиратели":
1) Имеют один пол
2) Имеют один возраст
3) Имеют одну профессию
4) Про уровень дохода можно не говорить — к этим избирателям он не применим.
5) Имеют одни и те же источники информации
6) Имеют одни и те же бытовые условия
Почему в такой ситуации тебя удивляет, что они голосуют одинаково?
Так что там со случайностью процессов при стрельбе?
Здравствуйте, alpha21264, Вы писали:
A>С точки зрения теории вероятности в воинской части все "избиратели": A>1) Имеют один пол A>2) Имеют один возраст A>3) Имеют одну профессию A>4) Про уровень дохода можно не говорить — к этим избирателям он не применим. A>5) Имеют одни и те же источники информации A>6) Имеют одни и те же бытовые условия
Здравствуйте, vl690001x, Вы писали:
V>А потом мы просто возьмем эту модель и проверим ее на выборах которые были за 3 месяца до этого. Ведь за 3 месяца социальные параметры не очень сильно должны были измениться, так?
А ничего, что в прошлых выборах и нынешних совершенно разные кандидаты? Ты считаешь это одно и то же?
Здравствуйте, vl690001x, Вы писали:
A>>С точки зрения теории вероятности в воинской части все "избиратели": A>>1) Имеют один пол A>>2) Имеют один возраст A>>3) Имеют одну профессию A>>4) Про уровень дохода можно не говорить — к этим избирателям он не применим. A>>5) Имеют одни и те же источники информации A>>6) Имеют одни и те же бытовые условия
V>P.S. И имеют одного и того же начальника
Что прекрасно укладывается в теорию вероятности, как причина, которая сильнее всех других причин.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
V>>А потом мы просто возьмем эту модель и проверим ее на выборах которые были за 3 месяца до этого. Ведь за 3 месяца социальные параметры не очень сильно должны были измениться, так?
ES>А ничего, что в прошлых выборах и нынешних совершенно разные кандидаты? Ты считаешь это одно и то же?
Ну почему же разные, довольно схожие.
И выборы одинаковые — губернатора.
Да что самое интересное, и результат одинаков, за полновластного проголосовало столько же, сколько и на прошлых, правда за исключением нескольких аномальных участков на которых процент был расчитан по формуле https://www.newsvl.ru/vlad/2018/12/19/176542/
И вот тебе придется доказать что это можно объяснить и естесственным путем)
Правда не знаю, с какой целью, но, как говорится, чем бы дитя не тешилось.
Будешь делать модель? Мне просто забавно как она будет выглядеть. будут ли это простые формулы, или без условных конструкций не обойтись. Типа, "если тут номера домов такие, такие, и улица такая, то вероятность за кандидата 90%, а если номера домов другие и улица другая, то 10%".
Ну как-то так она, твоя модель будет выглядеть
Ну че, будешь модель делать? Данные я все предоставлю. Ссылку на статистику голосования, номера и адреса участков, и дома которые к ним относятся.
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Здравствуйте, vl690001x, Вы писали:
ES>Не устраивай тут политику, я ничего доказывать не собирался. ES>Перечитай первое сообщение, там написано о чем речь.
Я прочитал. Речь о выборах. Или не?
Не собираешься доказывать, ну и не доказывай, проблем-то... Хочешь чтобы тебе что-то доказывали?
Здравствуйте, koenig, Вы писали:
K>а распределения, из которых складывается общее, могут быть любыми
Нет, конечно. Распределение должно быть одинаковым, а с.в. независимыми. В противном случае возможноы горбы, т.е. о нормальности говорить не придется.
Не даром там всюду используется аббревиатура iid.
K>в частности, не требуется чтобы хотя бы одно из них было нормальным
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Навеяно взрывом одинаковых тем в политике.
ES>Только здесь прошу избегать обсуждения ЕР, честности выборов и прочей политоты, речь о чистой математике. ES>Да, и никакого верю / не верю, только доказательства.
ES>Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей. ES>В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода. ES>Далее, случайная величина — это численное выражение результата случайного события.
Неверно, случайная величина -- это функция на вероятностном пространстве. По определению.
ES>Ну и поскольку речь все таки о результатах голосования — где там случайность?
Теория вероятностей изучает математическую случайность. Как и любой математический объект, математическая случайность -- это чисто воображаемая вещь,
не имеющая прямого отношения к реальному миру. Применения теории вероятности к объектам реального миря требует специального обоснования
в каждом конкретном случае. Например в физике применимость тер-вера объясняется теоремой Лиувилля и эргодической теорией.
ES>Если любого человека попросить проголосовать не 1 раз, а 10, результат разве изменится? ES>Это же не стрельба из ружья, когда пули попадают в цель, с неким отклонением. И как не стреляй, все точно в яблочко не лягут. ES>А если меня 10 раз спросить за кого голосовать, я 10 раз отвечу одно и то же. Как и любого другого человека в трезвом уме и здравой памяти. ES>Более того, эксперимент проводился 1 раз, и мы не знаем какой результат будет в другой раз, кроме как предположить. ES>Так как выборы не позволяют этого сделать, это ключевое свойство.
ES>Все дальнейшие выкладки являются бессмысленными, так как сперва нужно доказать, что процент голосов на выборах — случайная величина. ES>Про распределение можно говорить уже потом. И кстати, распределения не только нормальные бывают.
ES>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование.
Для ответа на этот вопрос неплохо бы описать, как именно вы собираетесь применять тер-вер к выборам.
ES>Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
У свидетелей секты Гаусса именно так и получается.
K>>а распределения, из которых складывается общее, могут быть любыми
S>Нет, конечно. Распределение должно быть одинаковым, а с.в. независимыми.
ну прям про совсем любые я сгоряча, но одинаковость необязательна
Здравствуйте, Evgeniy Skvortsov, Вы писали:
ES>Здравствуйте, Tourist, Вы писали:
T>>Здравствуйте, Evgeniy Skvortsov, Вы писали:
T>>Стороников партии А: 40%. Стороников партии Б: 60%. Но, они распределены нормально случайно по разным участкам для голосования. Будем ли мы видеть это в результатах голосования по участкам. Я думую, что да.
ES>Почему твоя модель не работает на участках где голосуют вояки? Или квартал заселен работягами завода.
Скорее требует уточнения и оговорок. Что процент поддержки партии А и Б разный в разных социальных слоях и расматриваем участки для голосования преимущественно должны быть заселенными представителями одного социального слоя. Поэтому, вояки отдельно, работяги с завода отдельно.
A>Ни-хре-на. A>Гауссиана гораздо лучше получается на неслучайных процессах, чем на случайных. A>Если ты возьмёшь обычный счетчик километража на автомобиле, A>и посчитаешь сумму всех видимых цифр (сумму шести видимых цифр в каждый момент) A>за всё время работы счётчика, то получишь абсолютно чёткую гауссиану.
A>И таким свойством обладает любой процесс (не обязательно случайный), A>у которого число факторов в сумме больше трёх.
Вы бредите! Точную формулировку утверждения в студию плиз. Со ссылкой на публикацию, где это доказано.
Была такая задача на вступительных экзаменах на ФизТех:
Есть студент Вася. Живет, скажем, в районе м. Университет (Красная линия).
У Васи есть мама, живет в районе м. Юго-Западная (та же Красная линия).
Еще у Васи есть девушка Маня. Живет в районе м. Парк Культуры (та же Красная линия).
Т.е. Вася обретается посредине между Юго-Западная и Парк Культуры на одной ветке.
Чтобы не обижать ни маму ни Маню Вася решает что он будет посещать маму и Маню по принципу как "карта ляжет" — по науке Статистике.
Его алгоритм: когда он спускается в м. Университет, то выбирает первый пришедший поезд в любую сторону.
Вводная: Вася ведет спорадический образ жизни и появляется на станции м. Университет абсолютно случайно.
Через месяц такой практики от Васи ушла Маня. Ибо за весь месяц он у неё появился пару раз только.
Вот такая грустная история.
Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
Здравствуйте, koenig, Вы писали:
K>>>>>как обычно доказывают случайность? K>>>>>как выглядит доказательство для ружья? K>>>>>ружье тот же, ты тот же, что именно дает случайность?
ES>>>>Я собственно именно этот вопрос и задал.
A>>>Ну вот и подумай. A>>>Общепризнано, что стрельба из ружья — случайный вероятностный процесс. A>>>Хотя полётом пули управляют хорошо известные законы физики. A>>>Даже когда ружьё закреплено в тисках. W>>Вот только модель у тебя не полная. В любом измерение есть +-х отклоений, вот все эти +- и дают вероятность отклонения.
K>тогда придется рассмотреть модель ошибки измерения K>какая там ошибка? систематическая? вводи поправку или меняй линейку K>случайная? померяй много раз и бери среднее
Считаем что там как раз нормально распределение отклонений.
K>или под отклонением измерения ты имел ввиду отклонение самого выстрела? (т.е. выстрел == измерение)
Нет. Если иметь полную модель, то теория вероятности идет лесом. Но как правило модели не полные, часть факторов или не известны или задаются диапазонами, с некоторыми вероятностями получения значения из диапазона.
Для выстрела мы никогда не знаем точную форму ствола, форму очередной пули, ее массу, распределение массы по объему и т.д. Мы используем усредненные показатели, что пуля весит 7 грамм, имеет определенную форму, ствол ровный, с максимальным отклонением не больше Х секунд, диаметр ствола тоже всегда вилкой дается. Так все эти параметры еще и не хило меняются от температуры и влажности+скорости ветра (когда ствол начинает отдавать тепло, на танках сверху орудия ставят экран, иначе в дождь стволы ведет наверх).
Здравствуйте, koenig, Вы писали:
W>>Нет, этот тот кто заявляет что на всех участках должны быть +- одинаковые доли по кандидатам пусть это докажет.
K>на такие смелые утверждения, кажется, еще никто не сподобился K>желающих доказать найти будет сложно
Тогда обсуждать не чего.
Если хотя бы один фактор не обладает нормальным распределением то итоговая вероятность не будет с нормальным распределением. Это вроде даже по остаточным знаниям тервера понятно.
Здравствуйте, Sharov, Вы писали:
S>Здравствуйте, c-smile, Вы писали:
CS>>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
S>Какой-то из поездов ходил чаще, т.е. тот который к маме.
Нет. Метро-поезда ходят в трубе — сколько в одну сторону — столько и в другую (в основном)
Здравствуйте, Sharov, Вы писали:
S>Здравствуйте, c-smile, Вы писали:
CS>>Нет. Метро-поезда ходят в трубе — сколько в одну сторону — столько и в другую (в основном)
S>Значит не так уж и случайно в метро спускался, т.е. неравнозначно подбрасыванию справедливой монеты.
Абсолютно случайно. Считай время события захода в метро это чистое и незамутненное равномерное распределение.
ES>Первое, когда упоминают нормальное распределение, часто опускают последнее слово — нормальное распределение вероятностей.
Норма́льное распределение, также называемое распределением Гаусса или Гаусса — Лапласа — распределение вероятностей, которое в одномерном случае задаётся функцией плотности вероятности, совпадающей с функцией Гаусса.
ES>В свою очередь, распределение вероятностей — это закон, описывающий область значений случайной величины и вероятности их исхода.
Нормальное распределение и распределение вероятностей — это совершенно разные вещи. Почувствуйте сэр разницу. Распределение вероятностей может быть нормальным, а может и не быть в силу каких-то причин.
ES>Далее, случайная величина — это численное выражение результата случайного события.
Если распределение вероятностей не совпадает с нормальным распределением, то процесс является не случайным.
ЗЫ: Простой пример из физики — вы меряете одну и туже величину, но много раз, а потом строите график — по оси X измеряемую величину, а по оси Y кол-во результатов соответсвующих данному x.
В идеальном мире должна получится дельта функция Дирака отцентрированая по X согласно измеряемомму значению. В реальном мире измереные значения будут различаться.
Вот если профиль измерений совпадает с нормальным распределением (с соотвествующим среднеквадратичным отклонением) то вы померили то что надо,
а вот если нет — то при всем уважении сэр, вы намеряли полную херню. Ищите дополнительные факторы влиящие на измерения.
ЗЫ2: ES>А если меня 10 раз спросить за кого голосовать, я 10 раз отвечу одно и то же. Как и любого другого человека в трезвом уме и здравой памяти.
Безусловно ты ответиш все 10 раз одно и то же. Но это совсем не значит что все твои ответы будут услышаны, записаны и подсчитаны все 10 раз одинаково верно, тем более когда ты не один, а сотни тысяч.
Причем здесь нормально распределение?
Вспомни выборы 2011 года, когда не соседних участках в Москве было 20 и 80% за ЕДРО, а также инфа от наблюдателей (которых было три, только из моих личныхьзнакомых), что были вбросы и массовые нарушения.
Конечно, графики голосов выглядят в таких случаях дико. Тут можно развивать науку, защищать докторские, но ситуация такая, что массовые вбросы показали себя на графиках определенным образом.
Вот с тех пор народ наблюдает за графиками, и правильно делает.
Здравствуйте, sharpcoder, Вы писали:
S>Причем здесь нормально распределение? S>Вспомни выборы 2011 года, когда не соседних участках в Москве было 20 и 80% за ЕДРО, а также инфа от наблюдателей (которых было три, только из моих личныхьзнакомых), что были вбросы и массовые нарушения. S>Конечно, графики голосов выглядят в таких случаях дико. Тут можно развивать науку, защищать докторские, но ситуация такая, что массовые вбросы показали себя на графиках определенным образом. S>Вот с тех пор народ наблюдает за графиками, и правильно делает.
При фальсификациях, видимо, возможно аномальные пики, несвойственные гауссиане.
Здравствуйте, Sharov, Вы писали:
CS>>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
S>Какой-то из поездов ходил чаще, т.е. тот который к маме.
Вот! Видишь!
Задачка абсолютно для первокласника.
А ты не можешь её решить.
Здравствуйте, alpha21264, Вы писали:
A>Здравствуйте, Sharov, Вы писали:
CS>>>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
S>>Какой-то из поездов ходил чаще, т.е. тот который к маме.
A>Вот! Видишь! A>Задачка абсолютно для первокласника. A>А ты не можешь её решить.
Для первоклассника? Окей, интервал прибытия поезда ровно две минуты, какое наиболее вероятное время ожидания будет? Подсказка: совсем не ровно одна минута.
Здравствуйте, andrey.desman, Вы писали:
AD>Заранее не известно за кого проголосует гражданин. Случайное событие — это число от 1 до n (количество кандидатов) от каждого следующего гражданина.
Вот это требует доказательства: то, за кого проголусует гражданин — случайная величина. Вот почему она должна быть случайная?
Здравствуйте, Micht, Вы писали:
AD>>Заранее не известно за кого проголосует гражданин. Случайное событие — это число от 1 до n (количество кандидатов) от каждого следующего гражданина. M>Вот это требует доказательства: то, за кого проголусует гражданин — случайная величина. Вот почему она должна быть случайная?
А что тут доказывать и что в твоем понимании случайная?
Любая величина есть значение функции многих переменных. Если мы не можем учесть все эти переменные, чтобы вычислить точное значение функции, то объявляем ее "случайной" и работаем уже с вероятностями. В этом смысл теорвера.
Здравствуйте, Micht, Вы писали:
M>Здравствуйте, alpha21264, Вы писали:
A>>Здравствуйте, Sharov, Вы писали:
CS>>>>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
S>>>Какой-то из поездов ходил чаще, т.е. тот который к маме.
A>>Вот! Видишь! A>>Задачка абсолютно для первокласника. A>>А ты не можешь её решить.
M>Для первоклассника? Окей, интервал прибытия поезда ровно две минуты, какое наиболее вероятное время ожидания будет? Подсказка: совсем не ровно одна минута.
ES>Ну и поскольку речь все таки о результатах голосования — где там случайность? ES>Если любого человека попросить проголосовать не 1 раз, а 10, результат разве изменится? ES>Это же не стрельба из ружья, когда пули попадают в цель, с неким отклонением.
ES>И напоследок, я не пытаюсь доказать что математика не права и ТО не работает. Я пытаюсь выяснить применима ли ТО для такого процесса как голосование. ES>Иначе получается что мы пытаемся измерить давление градусником, а потом удивляемся — что за хрень выходит.
теорвер прекрасно работает при голосовании вот так: если в городах а1, а2, а3 — средний процент за путина 69%,
то и в других городах он тоже такой будет.
Если говорить о прикладных задачах, то интересен критерий при котором выборы считаются не состоявшимися, Навальный говорят этим занимается.
Здравствуйте, Salih, Вы писали:
S>теорвер прекрасно работает при голосовании вот так: если в городах а1, а2, а3 — средний процент за путина 69%, S>то и в других городах он тоже такой будет.
Что бы не провести выборы в трех случайно выбранных городах и разойтись?
Здравствуйте, sharpcoder, Вы писали:
S>Причем здесь нормально распределение? S>Вспомни выборы 2011 года, когда не соседних участках в Москве было 20 и 80% за ЕДРО, а также инфа от наблюдателей (которых было три, только из моих личныхьзнакомых), что были вбросы и массовые нарушения. S>Конечно, графики голосов выглядят в таких случаях дико. Тут можно развивать науку, защищать докторские, но ситуация такая, что массовые вбросы показали себя на графиках определенным образом. S>Вот с тех пор народ наблюдает за графиками, и правильно делает.
О да, смотрят в книгу — видят фигу. Как собственно в твоем примере. Для начала разговора о вбросах надо бы сначала показать, что на участках с повышенной явкой (нельзя значимо вбросить без повышения явки на данном участке выше среднего уровня) в основном голосовали за одного из кандидатов, потом показать, что это оказало существенное влияние на общий результат.
Здравствуйте, andyp, Вы писали:
A>Здравствуйте, Salih, Вы писали:
S>>теорвер прекрасно работает при голосовании вот так: если в городах а1, а2, а3 — средний процент за путина 69%, S>>то и в других городах он тоже такой будет.
A>Что бы не провести выборы в трех случайно выбранных городах и разойтись?
да нет же, чтобы при проверке результатов не все города перепроверять, а только часть.
Или когда exit-poll делаешь. Ну там коэффициенты Стьюдента и всякие такие примочки.
Здравствуйте, Salih, Вы писали:
S>да нет же, чтобы при проверке результатов не все города перепроверять, а только часть. S>Или когда exit-poll делаешь. Ну там коэффициенты Стьюдента и всякие такие примочки.
Я в принципе с тобой не согласен, что вся страна одинаково голосует. Она и не голосовала одинаково всегда. Вспомнить тот же "красный пояс".
Здравствуйте, Ops, Вы писали:
A>>К стрельбе вопросы есть. A>>Давай объясняй, откуда в этом случае берётся случайность и что это такое.
Ops>А ее при выстреле и нет. Она раньше появляется: при изготовлении патрона, при его зарядке.
При выстреле тоже есть. Но не суть.
При "изготовлении" человека случайностей ещё больше. Даже пол не определён.
Здравствуйте, 31415926, Вы писали:
A>>Ни-хре-на. A>>Гауссиана гораздо лучше получается на неслучайных процессах, чем на случайных. A>>Если ты возьмёшь обычный счетчик километража на автомобиле, A>>и посчитаешь сумму всех видимых цифр (сумму шести видимых цифр в каждый момент) A>>за всё время работы счётчика, то получишь абсолютно чёткую гауссиану.
A>>И таким свойством обладает любой процесс (не обязательно случайный), A>>у которого число факторов в сумме больше трёх.
3>Вы бредите! Точную формулировку утверждения в студию плиз. Со ссылкой на публикацию, где это доказано.
Сам дурак.
Вот берём счётчик километража. Складываем циферки. Получаем гауссиану. Что тебе ещё надо?
Какую-такую публикацию? Посмотри на моё предыдущее сообщение на rsdn. Это и есть публикация.
В этом сообщении всё доказано. Бери и суммируй. Неужели не можешь просуммировать?
Здравствуйте, alpha21264, Вы писали:
A>При выстреле тоже есть. Но не суть.
Нету. Все задано заранее. Если идеально повторить исходные условия, то разброса не будет. Другое дело, что повторять надо вплоть до микромира.
A>При "изготовлении" человека случайностей ещё больше. Даже пол не определён.
А при чем тут пол? Взгляды — штука приобретенная. Те факторы, которые определяют выбор, отнюдь не при рождении задаются — в то время и вариантов для этого выбора может еще не быть. И этот выбор подвержен направленному воздействию, всякого рода (анти)рекламе. И если это воздействие было проведено не равномерно, то нормального распределения ты не получишь.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Здравствуйте, c-smile, Вы писали:
CS>Здравствуйте, c-smile, Вы писали:
CS>>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
CS>Поезда ходят в обе стороны с примерно одной и той же частотой.
CS>Image: thetask.png
CS>Т.е. Васина вероятность попадания на поезд определяется смещением фаз на данной конкретной станции.
CS>Ну так вот Васина карта легла. И ровно один раз когда он выбирал где учиться. А не тогда когда он приходил на станцию.
Красиво! Ну т.е. все дело в поездах, главное понять, что имеено. Значит и выборка в месяц подходит...
Здравствуйте, Tourist, Вы писали:
T>Скорее требует уточнения и оговорок. Что процент поддержки партии А и Б разный в разных социальных слоях и расматриваем участки для голосования преимущественно должны быть заселенными представителями одного социального слоя. Поэтому, вояки отдельно, работяги с завода отдельно.
Пенсионеры отдельно, студенты отдельно, миллионеры отдельно, и т.д. С чего бы им быть равномерно перемешанными во всех случаях?
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Здравствуйте, Micht, Вы писали:
A>>Вот! Видишь! A>>Задачка абсолютно для первокласника. A>>А ты не можешь её решить.
M>Для первоклассника? Окей, интервал прибытия поезда ровно две минуты, какое наиболее вероятное время ожидания будет? Подсказка: совсем не ровно одна минута.
Micht!
Ну тебя не поймёшь!
Я с тобой согласился, а ты мне минус поставил.
Ты что, сам не знаешь ответа на собственную задачу?!
Здравствуйте, andrey.desman, Вы писали:
AD>Заранее не известно за кого проголосует гражданин.
Это тебе неизвестно. А ему самому очень даже известно. Он не монетку бросает, когда на участок идет, а уже все обдумал, или, если не способен сам думать, поступает "как все" из его круга.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Здравствуйте, andyp, Вы писали:
A>Я в принципе с тобой не согласен, что вся страна одинаково голосует. Она и не голосовала одинаково всегда. Вспомнить тот же "красный пояс".
В красном поясе если не мухлевать, то получается та же самая гауссиана, только с большим процентом у КПРФ.
Если сложить Гауссианы всех краёв областей и республик, то получится одна большая Гауссиана (с другой высотой и матожиданием).
А вот если на графиках появляются пики, то это — вбросы.
Здравствуйте, Ops, Вы писали:
AD>>Заранее не известно за кого проголосует гражданин. Ops>Это тебе неизвестно. А ему самому очень даже известно. Он не монетку бросает, когда на участок идет, а уже все обдумал, или, если не способен сам думать, поступает "как все" из его круга.
А при чем здесь он? Ему, конечно, известно. А мне нет. Приведи ко мне десяток таких граждан и я понятия иметь не буду, за кого они проголосуют, для меня это случайные данные.
Синий шар, доставаемый из коробки, тоже "знает", что он синий. А я пока не достану, не узнаю...
Здравствуйте, andrey.desman, Вы писали:
AD>А при чем здесь он? Ему, конечно, известно. А мне нет. Приведи ко мне десяток таких граждан и я понятия иметь не буду, за кого они проголосуют, для меня это случайные данные. AD>Синий шар, доставаемый из коробки, тоже "знает", что он синий. А я пока не достану, не узнаю...
Твое знание или незнание не определяет случайность.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Здравствуйте, alpha21264, Вы писали:
A>Здравствуйте, andyp, Вы писали:
A>>Я в принципе с тобой не согласен, что вся страна одинаково голосует. Она и не голосовала одинаково всегда. Вспомнить тот же "красный пояс".
A>В красном поясе если не мухлевать, то получается та же самая гауссиана, только с большим процентом у КПРФ.
Еще раз спрошу — где у тебя гауссина получается? Если ты строишь гистограмму процента голосовавших по данным с участков, то она не получается.
A>Если сложить Гауссианы всех краёв областей и республик, то получится одна большая Гауссиана (с другой высотой и матожиданием). A>А вот если на графиках появляются пики, то это — вбросы.
Используют совсем другие индикаторы — строят графики двумерные гистограммы от процента проголосовавших за кандидата и от явки на участке. Но такие гисторгаммы оказываются бимодальными в плоскости процента проголосовавших даже в странах, где по мнению авторов не было фальсификаций.
Где авторы упоминают гауссовскую модель, так это гистограммы от явки избирателей на участок.
Здравствуйте, Ops, Вы писали:
AD>>А при чем здесь он? Ему, конечно, известно. А мне нет. Приведи ко мне десяток таких граждан и я понятия иметь не буду, за кого они проголосуют, для меня это случайные данные. AD>>Синий шар, доставаемый из коробки, тоже "знает", что он синий. А я пока не достану, не узнаю...
Ops>Твое знание или незнание не определяет случайность.
Что же определяет тогда? Карта, вытянутая из колоды — это случайная величина?
Здравствуйте, Sammo, Вы писали:
S>2. Личное имхо — почему я пишу про дома, элитку и прочее. Именно потому, что, на мой взгляд, отсутствует ключевое — доказательства. В большинстве случаев озвучивается, что нарушена гауссиана = подтасовки выборов. Если бы было как описано — есть нарушения модели (гипотезы) — это основание для дополнительной проверки. На основании проверки обнаружены факты = были подтасовки. Не смогли найти найти факты — извините = подтасовок не было. Прокуратура может и не будет проводить проверку, но есть наблюдатели, есть протоколы, в некоторых случаях есть видео записи — все это может использоваться для обнаружения фактов.
Дело в том, что при такой постановке вопроса подтасовки тоже являются случайной величиной и также подвергаются гауссиане.
Здравствуйте, andrey.desman, Вы писали:
AD>Что же определяет тогда? Карта, вытянутая из колоды — это случайная величина?
Смотря как вытянутая. Случайную величину никто заранее не знает и предсказать не может. Так что если тянет шулер из подготовленной колоды, то величина эта не случайная, даже если ты ее не знаешь заранее.
Переубедить Вас, к сожалению, мне не удастся, поэтому сразу перейду к оскорблениям.
Здравствуйте, Micht, Вы писали:
M>Здравствуйте, alpha21264, Вы писали:
A>>Micht! A>>Ну тебя не поймёшь! A>>Я с тобой согласился, а ты мне минус поставил.
M>Я ж не согласия спрашивал, а решения в общих чертах
Если пассажир пребывает абсолютно случайно, то все интеравлы равновероятны и одна секунда и две минуты.
Одна минута — это матожидание, а не самый вероятный интервал.
Здравствуйте, c-smile, Вы писали:
CS>Вопрос в студию: почему Васе так редко удавалось попадать к Мане?
Так Васе с Маней карма легла. Иными словами, не судьба.
Не, я видел картинку с решением — остроумно, конечно. Но у меня протест. В реальности распределение поездов будет случайным за месяц, на практике они так не синхронизируются. Надо внести корректировки в условия задачи. Может, завуалировано намекнуть в условии на идеальное расписание поездов. Другой вариант — взять короткий интервал, например, один час вхарактерное время (утро, ночь, час пик). В этом случае поезда более-менее синхронизированы. Тогда Васю, который один не сможет уехать с одной станции на многих проходящих поездах, надо заменить группой таких же странных людей со своей целью. Может, есть еще варианты.