a_shen ([info]a_shen) wrote,
@ 2009-10-23 21:33:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
выборы как иллюстрация
теории вероятностей и математический статистики -- написал обзор имеющихся материалов и графиков (в основном от podmoskovnik) с объяснениями, что там изображено, как это можно понимать и пр., что написано в статье Чурова, Арлазарова и ещё кого-то и почему это неубедительно, и пр.

Буду благодарен за критику и по существу, и по изложению (что непонятно).

http://alexander.shen.free.fr/elections.pdf

[update: см. также http://www.cmi.univ-mrs.fr/~ashen/elections.pdf]

Спасибо участникам обсуждений за мотивацию



Page 1 of 2
<<[1] [2] >>

(70 comments) - (Post a new comment)

спасибо, очень интересно
[info]imfromjasenevo
2009-10-23 08:00 pm UTC (link)
Имхо, очень полезно было бы сделать небольшой популярный обзор, как методы математической статистики используются в методах криминалистики и вообще в судебных доказательствах. ( и какие достоверности считаются доказательствами)
Слишком часто слышим от «охранителей», что математические критерии якобы не могут быть рассмотрены в суде как доказательства

(Reply to this) (Thread)

Re: спасибо, очень интересно
[info]a_shen
2009-10-23 08:04 pm UTC (link)
но это уже вопрос к юристам (и, видимо, непростой, если исходить из мировой практики)

(Reply to this) (Parent)(Thread)

Re: спасибо, очень интересно - [info]imfromjasenevo, 2009-10-23 08:28 pm UTC
конечно, нет - - [info]a_shen, 2009-10-23 08:32 pm UTC
В рамках экспертизы. - [info]lkfglkjf, 2009-10-24 02:14 am UTC
Re: В рамках экспертизы. - [info]imfromjasenevo, 2009-10-24 08:34 am UTC
на самом деле - [info]a_shen, 2009-10-24 08:41 am UTC
Re: на самом деле - [info]imfromjasenevo, 2009-10-24 10:20 am UTC
не думаю, что - [info]a_shen, 2009-10-24 11:36 am UTC
Тут неполучиццо монтекарла и вероятностей - [info]lkfglkjf, 2009-10-24 04:08 pm UTC
буквально, - [info]a_shen, 2009-10-24 04:55 pm UTC
Ну дык есть еще формальная сторона. - [info]lkfglkjf, 2009-10-24 04:59 pm UTC
Re: Тут неполучиццо монтекарла и вероятностей - [info]ile_eli, 2009-10-24 07:47 pm UTC
есть, кстати, такое выражение - [info]a_shen, 2009-10-24 07:56 pm UTC
Re: есть, кстати, такое выражение - [info]ile_eli, 2009-10-24 08:11 pm UTC
Ну РФ, например. - [info]lkfglkjf, 2009-10-25 02:02 am UTC
Re: Ну РФ, например. - [info]ile_eli, 2009-10-25 05:40 am UTC
Re: Тут неполучиццо монтекарла и вероятностей - [info]imfromjasenevo, 2009-10-24 08:18 pm UTC
Re: спасибо, очень интересно - [info]original_ivan, 2009-10-25 01:42 am UTC

[info]57ded
2009-10-23 08:02 pm UTC (link)
Спасибо. Весьма познавательно.

(Reply to this)


[info]nabekren
2009-10-23 08:04 pm UTC (link)
Хорошая статья. Про пики явки интересно.

(Reply to this)


[info]glaberrr
2009-10-23 08:15 pm UTC (link)
Спасибо! Я как раз думал, не соберёт ли кто-нибудь подробный статистический анализ в одну статью.
Комментарии:
1. Не добавите ли Вы явную оценку реальных процентов голосов, полученных партиями? (Видимо, возможность получить такую оценку — единственная польза от прошедших выборов.) И данные по тем одномандатным округам, где едро с большой вероятностью проиграло.
2. На стр. 15, видимо, «СССР» нужно заменить на Россию (сколь бы малой ни была разница).
3. Если несколько иллюстраций идут подряд, хотелось бы, чтобы подпись под каждой из них была ближе к своей иллюстрации, чем к следующей.

(Reply to this) (Thread)

оценка голосов
[info]a_shen
2009-10-23 08:33 pm UTC (link)
- это гораздо более деликатная вещь, это обсуждалось у Шпилькина, но я недостаточно компетентен, чтобы уверенно предложить какой-то метод такой оценки. Про СССР сейчас исправлю - а с форматированием иллюстраций мне было лень делать это вручную, а автоматически TeX их размещает странно...

(Reply to this) (Parent)


[info]shkin
2009-10-23 09:11 pm UTC (link)
Спасибо.

PS В самом начале упомянут podmoskovnik.livejournal.ru, который на самом деле должен быть podmoskovnik.livejournal.com.

(Reply to this) (Thread)

исправил -
[info]a_shen
2009-10-23 09:15 pm UTC (link)
надо же, сколько ляпов... спасибо

(Reply to this) (Parent)


[info]rezoner
2009-10-23 09:32 pm UTC (link)
Саш, а почему на самом первом графике ЕР и "все, кроме ЕР" не складываются в 1? Казалось бы, линия регрессии для "всех прочих" должна иметь тот же наклон, но с другим знаком?

P.S. Вопрос снимается :)

Edited at 2009-10-23 09:33 pm UTC

(Reply to this)


[info]bold_raven
2009-10-23 10:13 pm UTC (link)
А что тут объяснять? - Это и так ежу понятно.

Оппозиционные мудаки прибежали голосовать первыми. Потому что - мудаки. После того как они проголосовали, их доля не увеличалась. А нормальные люди приходили голосовать постепенно.

Не будет же автор утвержджать, что ему удалось найти участки с нулевой явкой? - он же по оси абсцисс ПРПОУНТЫ отложил, а не абюсолютное число.

Либо это просто тупая фальсификация. Что джля российской "ОППОЗИЦИИ" тоже нормальное состояние. Третьего не дано.

(Reply to this) (Thread)

Может быть,
[info]a_shen
2009-10-23 10:21 pm UTC (link)
стоит всё-таки прочесть текст сначала? об увеличении доли в ходе голосования там нет ни слова

(Reply to this) (Parent)(Thread)

Re: Может быть, - [info]mmazin, 2009-10-23 11:58 pm UTC
Re: Может быть, - [info]dmugtasimov, 2009-10-24 10:19 am UTC
Re: Может быть, - [info]secondary_tea, 2009-10-25 06:12 pm UTC
Правда?! - [info]mmazin, 2009-10-25 06:38 pm UTC
увы, "патриотические комментаторы" - [info]a_shen, 2009-10-25 06:48 pm UTC
Re: Правда?! - [info]secondary_tea, 2009-10-26 06:08 am UTC

(Anonymous)
2009-10-23 10:24 pm UTC (link)
http://www.polit.ru/analytics/2009/10/20/matstat.html

(Reply to this) (Thread)

спасибо за ссылку,
[info]a_shen
2009-10-23 10:49 pm UTC (link)
я это видел, но хотел написать более подробно, популярно и технически...

(Reply to this) (Parent)

Спасибо!
[info]olegych2007
2009-10-23 11:43 pm UTC (link)
Спасибо за анализ и за ссылки. Давно пора вывести ЕР на чистую воду. Ссылки тоже поучительны =)

(Reply to this)


(Anonymous)
2009-10-23 11:56 pm UTC (link)
Хотя это не по существу и не по изложению, но в источнике [6] в веб-адресе потерялась тильда и второй нафит.

(Reply to this)


[info]yurymakarychev
2009-10-24 12:43 am UTC (link)
Интересная статья!

Вот ещё один случай с вбросом бюллетеней: http://runewsweek.ru/country/30719/

P.S. URL твоей статьи "Algorithmic Information Theory and Foundations of Probability" [6] указан неверно — адрес http://www.cmi.univ-mrs.fr/~ashen/nafit.html у меня не открывается.

(Reply to this) (Thread)

добавил ссылку
[info]a_shen
2009-10-24 12:58 am UTC (link)
и исправил адрес

(Reply to this) (Parent)

исправил - - [info]a_shen, 2009-10-24 11:37 am UTC

[info]matholimp
2009-10-24 05:36 am UTC (link)
Как должны были выглядеть настоящие итоги московских выборов - http://matholimp.livejournal.com/182283.html (в продолжение моего анализа http://matholimp.livejournal.com/170608.html знаменитого графика с http://uborshizzza.livejournal.com/674242.html ).

(Reply to this) (Thread)

оценка "настоящих" результатов -
[info]a_shen
2009-10-24 08:45 am UTC (link)
дело более сложное, к тому же не очень понятно, что считать настоящими результатами - скажем, если кого-то отправляли голосовать на работе, а так бы он не пошёл, но не проверяли результат голосования, то как это считать? К тому же в условиях снятия кандидатов по надуманным причинам называть результаты выборов "настоящими" тоже некоторое преувеличение. В общем, это отдельный вопрос, а хотелось сконцентрироваться на чем-то одном (в данном случае на подтасовках при подсчетах)

(Reply to this) (Parent)

не грузится....
[info]dimpas
2009-10-24 06:08 am UTC (link)
Саша, пардон, но у меня с этого тормозного хостинга файл не грузится (оттуда вообще обычно ничего больше 1MB или около того не грузится...) :(
Может, можно на какие google sites, или просто в arxiv.org ?

(Reply to this) (Thread)

Re: не грузится....
[info]a_shen
2009-10-24 08:47 am UTC (link)
положил также сюда:

http://www.cmi.univ-mrs.fr/~ashen/elections.pdf

в архив меня как-то пугает, что файл большой, только pdf и популярный, а не научный - это скорее злоупотребление добротой arxivа...

(Reply to this) (Parent)


[info]gaz_v_pol
2009-10-24 07:54 am UTC (link)
Саша, спасибо за статью!

Предлагаю добавления:

1. С сайта избиркома невозможно скачать результаты выборов в одном файле. Некоторые граждане написали программы, которые выкачали данные и создали файл. Можно дать ссылку на этот файл (чтобы граждане могли проверять собственные гипотезы). Вот пример, выгодно отличающийся от иных тем, что автор не просто выложил файл, но и предоставил во всеобщее обозрение программу на perl, которая выкачала данные и этот файл создала: http://fritzmorgen.livejournal.com/248815.html


2. Иллюстрировать одну из ключевых идей (зависимость явки и доли голосов за конкретную партию) можно таким примером: разбить всё множество проголосовавших на 3-5-10 групп, равных по численности. В первой группе будут те, кто пришёл голосовать на участки, где явка меньше x1%. Во второй -- те, кто пришёл на участки с явкой от x1% до x2% и т.д. Числа x1, x2.. x5 подобрать так, чтобы число избирателей в каждой из групп было примерно равным. Ясно, что в норме каждая из этих групп должна дать примерно одинаковый вклад в голоса за "Единую Россию". В реальности, судя по графикам, должно оказаться, что эти группы дали существенно неравные вклады в победу. Идея почёрпнута тут: http://www.novayagazeta.ru/data/2009/118/01.html (там же есть другие любопытные примеры)


3. А.Илларионов сделал аналогичные рисунки по другим выборам, см. презентацию
http://www.iea.ru/article/polit_svoboda/26-12-07.ppt

См. также слайд 45 и последующие в презентации http://www.iea.ru/article/polit_svoboda/26-12-07.ppt

Ссылки взял из http://aillarionov.livejournal.com/121165.html (там есть другие ссылки про выборы)


4. Ещё один занятный график -- избирательные округа очень сильно различаются по количеству УИК с высоким уровнем голосования по открепительным удостоверениям. См. http://www.votas.ru/Umeyut%20li%20schitat%27%20izbirkomy.html


(Reply to this) (Thread)

я видел ссылку на программу,
[info]a_shen
2009-10-24 09:13 am UTC (link)
но там еще график в неудачных координатах и бестолковые рассуждения, надо было бы тогда всё это тоже комментировать (а этого там очень много) - так что пусть остается в виде ссылки в твоем комментарии

про п.2 это можно было бы сделать, но это будет просто усреднение (взвешенное) точек с имеющего графика (по группам, разделённым вертикальными линиями) - похоже, что именно это делается в ЦИКовской статье, хотя без всяких объяснений (и результат для них неблагоприятный, чего они не понимают)

про прошлые выборы есть много работ, но поскольку у меня нет большой книги на эту тему (вышедшей в Cambridge University Press в этом году), я не стал подробно про это писать

вообще я обнаружил в процессе написания, что есть довольно много работ на эту тему (в том числе по ссылке из ЦИКовской работы!), только они написаны не очень популярно и обсуждают сразу много вопросов - я пытался подробно объяснить про один конкретный - что на первых двух графиках нарисовано и как это можно интерпретировать

(Reply to this) (Parent)


[info]ntsil
2009-10-24 08:46 am UTC (link)
Спасибо, отличный текст! А фраза из избиркомовской "научной" статьи "сам процесс выборов отнюдь не случаен, т.к. слишком много факторов на него влияет" сама по себе, конечно, шедевральна -- по идее, дальше статью можно уже не читать.

(Reply to this) (Thread)

обидно, что в этом
[info]a_shen
2009-10-24 09:14 am UTC (link)
принял участие Арлазаров - когда-то он был одним из авторов шахматной программы Каисса и в его группе работал мой товарищ, отзывавшийся о нем с уважением...

(Reply to this) (Parent)(Thread)

Re: обидно, что в этом - [info]ilyaraz, 2009-10-24 10:46 am UTC
ну да, конечно - [info]a_shen, 2009-10-24 11:48 am UTC

[info]burivykh
2009-10-24 09:33 am UTC (link)
Спасибо за обзор!

(Reply to this) (Thread)

что называется,
[info]a_shen
2009-10-24 09:43 am UTC (link)
патриотический и педагогический долг зовет:-)

(Reply to this) (Parent)

пик явки в точке 67% (то есть 2/3)
[info]v_phi
2009-10-24 12:14 pm UTC (link)
от списка избирателей участка, помимо указанных в статье 70, 75, 80, 85, можно видеть на рис. 2, 4 (оба - выборы-2009) и рис. 11 график 2008

(Reply to this) (Thread)

Re: пик явки в точке 67% (то есть 2/3)
[info]a_shen
2009-10-24 01:12 pm UTC (link)
тут опять всё тот же философский вопрос - допустим, мы увидели (общий) пик в точке 73% - должно ли это о чём-то свидетельствовать? в какой степени надо учитывать тот факт, что 2/3 - это круглое число. В случае, когда пиков много, и они кратны 5, это выглядит убедительнее - хотя оценить степень этой убедительности каким-то числом трудно...

(Reply to this) (Parent)


[info]bukvoyeditsa
2009-10-24 03:13 pm UTC (link)
Спасибо. Производит глубокое.
Видно, что наглость фальсификаторов возрастает от выборов к выборам.

(Reply to this)


[info]vasbur
2009-10-24 05:16 pm UTC (link)
А есть графики "Голоса за ЕР"/"Явка" на выборов в Мосгордуму отдельно для участков с КОИБ без КОИБ?
Также интересно было бы увидеть аналогичные графики для прошлых выборов в МГД.

(Reply to this) (Thread)

это не ко мне -
[info]a_shen
2009-10-24 05:49 pm UTC (link)
я всего лишь комментировал, что нарисовано на имеющихся графиках, а новых строить не пытался. Стоит спросить экспертов (прежде всего podmoskovnikа)

(Reply to this) (Parent)


[info]ile_eli
2009-10-24 08:05 pm UTC (link)
70%, 75%, 80%, 85%... - а также 67% - две трети.

(Reply to this)


[info]elepha5
2009-10-24 08:31 pm UTC (link)
Спасибо, очень интересно! Некоторых из источников, перечисленных в литературе, я раньше не видел (в частности, очень, позабавила "паническая отповедь" [4], а особенно её пункты 2 и 5, хотя в общем-то весь документ прекрасен, я давно так не смеялся).

(Reply to this)


[info]motimatik
2009-10-25 07:14 am UTC (link)
Спасибо!
Очень поучительно поучилось.

Кстати, трюк с шагом в 3 процента - очень остроумный, там явно работают неглупые люди.

(Reply to this)

Спасибо!
[info]konstantin57
2009-10-25 08:01 pm UTC (link)
Интересно (и немного грустно).

(Reply to this)


[info]80bo
2009-10-26 03:25 am UTC (link)
Спасибо за проделанную работу!
Всё очень ясно и чётко.

(Reply to this)


[info]vtail
2009-10-26 03:57 am UTC (link)
Саша, как всегда очень четко и понятно всё изложено.

Несколько (мелких) замечаний:

1. В примере про рулетку - не уверен, что наклон пола дал бы такой эффект, ибо там вращается и шарик, и (независимо от него и в другую сторону) - лунки.

2. Anecdotal evidence лучше бы перевести (хотя бы сноской) - не все школьники и другие потенциальные читатели могут это знать - как и другие английские фразы.

(Reply to this)


(70 comments) - (Post a new comment)

Page 1 of 2
<<[1] [2] >>

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…