о статистике по голосованиям

мне казалось, что тут уже всё обсуждено, опубликовано и особых вопросов ни у кого нет, но выяснилось, что в связи с недавними "выборами Путина" граждане взволновались и, как я понял, полезно кратко объяснить ситуацию и дать ссылки

обзор ситуации на 2011-2012 год https://arxiv.org/pdf/1204.0307.pdf и ссылки там (боюсь, что многие протухли)

более поздние публикации - см. в

разная (в целом несостоятельная) критика - ссылки в http://www.mat.univie.ac.at/~neretin/pseudoscience.html

Кобак и др. про целые проценты
https://rss.onlinelibrary.wiley.com/doi/full/10.1111/j.1740-9713.2016.00936.x
про корреляции https://arxiv.org/abs/1205.0741 (см. также https://scholar.google.is/citations?user=BUQbD5kAAAAJ&hl=en ссылки на журнальные варианты)

коротко про последнее "голосование" и "подсчёт"

1) статистически заметные фальсификации видны на множестве картинок, вот две совсем наглядные:
https://kobak.livejournal.com/111535.html
https://kireev.livejournal.com/1456665.html
(на всякий случай, кто не знает - при подсчётах и вводе данных в ГАС ни в какой момент проценты не вычисляются, всё идёт - естественно - в целых числах)

2) Оценки количества фиктивных "голосов" - дело существенно более сложное, тут возможны только приблизительные оценки, можно смотреть (как предлагал Шпилькин) по нарушению пропорциональности, см. картинки для областей и всей России в https://www.facebook.com/sergey.shpilkin/media_set?set=a.1654877677934195.1073741835.100002359376948&type=3&pnref=story, можно на тех же картинках смотреть по главному кластеру, можно оценивать по недействительным и т.п. - обсуждение разных методов и результатов см. у Шпилькина, Кобака, Пшеничникова, Овчинникова, Мятлева и других, но это сырое обсуждение и надо читать внимательно и что предлагается, и критику других. Много карт и данных у Киреева (в фейсбуке и ЖЖ, ссылки найти несложно, если надо, напишите, что конкретно интересует, я посмотрю). Сырые данные тоже доступны (и на сайте ЦИКа, и скачанные оттуда). Тут все оценки приблизительные (если кто-то говорит, что может оценить "фактическую явку" или "фактический результат" с точностью до процента, то это недоразумение (просто потому, что часть данных явно цельно-рисованные), но выделить регионы с наибольшими фальсификациями, а также понять, что это в целом скорее 10%, чем 1% или 40%, можно достаточно надёжно, разные методы сравнивались и проверялись на многих выборах, и ошибки на порядок тут очень маловероятны. Самая грубая оценка "на глаз главному кластеру" на приведённой картине показывает, что явка скорее всего чуть больше 60%, а результат чуть больше 70%

Если после изучения всего это что-то непонятно, то спрашивайте (уверен, что все перечисленные охотно ответят на технические грамотные вопросы или дадут имеющиеся файлы с данными, чтобы не скачивать заново и т.п.)

Disclaimer: вопрос о том, зачем "это" надо ("выборы" в целом или фальсификации в частности) и как так получается, выходит за рамки статистического анализа и должен обсуждать отдельно, здесь про это ничего не говорилось и не подразумевалось.

Source: https://a-shen.dreamwidth.org/112496.html,.
Comments: comment count unavailable

итоги подсчёта на "выборах Путина"

photo_2018-03-19_09-44-00

наверно, из графиков всё и так понятно - фальсификации подсчёта заметные, но не настолько, чтобы нельзя было оценить их величину - навскидку оценка: реальной явки чуть больше 60%, доля голосов за Путина чуть больше 70% среди явившихся, приписанных голосов за Путина чуть больше 10% от общего числа голосов за него (но эти приписки входят и в числитель, и в знаменатель, так что это не разница между фактической и официальной долями голосов за Путина)

Графики нарисовал Сергей Шпилькин по данным "цик"

Снова вопрос:

есть ли среди читателей кто-либо, что считает, что утверждение Путина "В конце 2017 года на Центральном полигоне состоялся успешный пуск новейшей российской крылатой ракеты с ядерной установкой. Энергоустановка вышла на необходимую мощность, обеспечила необходимую тягу" (www dot rbc dot ru/politics/01/03/2018/5a97d57d9a794773b7e8e40f) скорее всего верно? прошу отметить это в комментариях. (То, что - если это верно - это большое техническое достижение, вроде бы все согласны. Корректность цитаты тоже вроде бы несомненна - её повторяют разные агентства, и было бы странно, если бы они это придумали сами, тем более что выступление вроде как транслировалось в прямом эфире) [PS: это уже много где обсуждалось, я просто хотел понять результаты - много ли людей считают утверждение верным - в буквальном смысле: тяга летящей ракеты создаётся за счёт ядерной реакции на борту]

Source: https://a-shen.dreamwidth.org/112059.html,.
Comments: comment count unavailable

Об одной распространённой ошибке

Об одной распространённой ошибке при интерпретации результатов работы вероятностных алгоритмов.

Один мой знакомый (весьма уважаемый экономист) опубликовал запись, в которой рассказал, что ему прислали на день рожденья число, которое, будучи записанным цифрами в прямоугольнике, выглядит как его портрет (за счёт того, что одни цифры темнее, а другие светлее), и написал, что простота этого числа проверена вероятностным алгоритмом, с помощью которого установлено, что это число является простым с вероятностью не менее 1-eps (при очень малом eps), и потому с практической точки зрения его можно считать простым.

В чём тут ошибка? Формально можно сказать, что вообще некорректно говорить о том, что данное число является простым с такой-то вероятностью: оно либо является, либо не является, и никакого вероятностного пространства тут нет. Свойство же алгоритма (который получает на вход проверяемое число и использует случайные биты) состоит в другом: что на любом простом числе он всегда даёт ответ "простое", а на любом составном числе даёт ответ "составное" с вероятностью не менее 1-eps. Вероятность тут означает долю последовательностей случайных битов, дающих соответствующий ответ.

Можно было бы считать сказанное моим знакомым допустимой вольностью речи, но это не так - в этом рассуждении есть ошибка по существу (весьма распространённая, американское статистическое общество даже публиковало специальное разъяснение по аналогичному поводу, http://amstat.tandfonline.com/…/10.10…/00031305.2016.1154108). Чтобы объяснить, в чём она состоит, сделаем дополнительные предположения (не противоречащие сказанному):

(а) используемый вероятностный алгоритм на любом составном числе говорит "составное" с вероятностью равно 1-eps (и говорит "простое" с вероятностью eps; вероятность берётся по внутренним случайным битам).

(б) программа генерации картинки перебирает картинки из нужного класса (дающие при печати в прямоугольнике искомый портрет) и для каждой запускает алгоритм проверки простоты, пока не найдёт такую, где алгоритм даст ответ "простое"

(в) по каким-то таинственным законам теории чисел все картинки из нужного класса (соответствующие числа) оказываются составными.

Тогда программа, сделав в среднем 1/eps проб, выдаст картинку нужного класса, на которой алгоритм дал ответ "простое". Тем не менее соответствующее число будет гарантированно составным. (Конец объяснения ошибки.)

Другое дело, если бы именинник, получив такой подарок, собственноручно запустил бы на нём вероятностный алгоритм проверки, при этом бы ещё использовал не псевдослучайные биты от генератора, а собственнноручно бросал монету. Тогда с практической точки зрения вывод "можно считать простым" был бы корректным.

В заключение прошу прощения за занудство, но такая ошибка представляется мне распространённой и опасной, и пройти мимо удачной иллюстрации я не смог.

Source: https://a-shen.dreamwidth.org/111711.html,.
Comments: comment count unavailable

Два вопроса в связи с "выборами":

1) если кто-то из читающих это собирается пойти проголосовать за Путина, буду признателен за комментарий (с сообщением этого и, возможно, кратким комментарием о мотивах) и 2) если кто-то видел декларацию "20 шагов" Грудинина (от КПРФ, см. https://kprf.ru/activity/elections/171941.html) и в целом согласен, что шаги в этом направлении разумны (отвлекаясь от вопроса о шансах и/или искренности Грудинина, а также конкретных подробностей реализации или цифр), тоже буду признателен за сообщение.

Source: https://a-shen.dreamwidth.org/111419.html,.
Comments: comment count unavailable

математическая задача от православного священнника

А.Ильяшенко (http://ruskline.ru/news_rl/2018/01/10/my_sami_sebe_roem_mogilu/)

"В 1965 году смертность в Советском Союзе достигла исторического минимума - 7 человек на тысячу жителей или миллион смертей в год. Этот уровень смертности достижим. Надо увеличивать продолжительность жизни"

Вопрос: какова должна быть средняя продолжительность жизни (в стационарном режиме), чтобы достижимый уровень смертности был достигнут?

Source: https://a-shen.dreamwidth.org/111337.html,.
Comments: comment count unavailable

рассказ Волкова: вопрос к читателям

Леонид Волков (в своё время победитель программистских олимпиад, позже - соратник Навального) пишет в фейсбуке:

разговор со следователем о БастрыкинеCollapse )

Если кто-то полагает сколько-нибудь вероятным, что разговор этот выдуман Волковым или история следователем, прошу отметить в комментариях

Source: https://a-shen.dreamwidth.org/111023.html,.
Comments: comment count unavailable

маловероятные события

сегодня в трамвае в Монпелье сначала зашла дама с четырьмя собаками, похожими на "борзых", а потом в ту же дверь ещё дама с тремя собаками, не знаю на что похожими - и они все мирно разлеглись на полу (кроме дам) и доброжелательно смотрели на переступающих через них пассажиров
chien(ne)s
three others
(чтобы посмотреть картинки, надо открыть их в отдельном tab)

Source: http://a-shen.dreamwidth.org/110552.html,.
Comments: comment count unavailable

просьба о распространении ссылки

Не прошло и...
Тут член "управляющего совета 57 школы" Илья Ноткин прислал мне ссылку на разработанный (как я понял, по заказу этого самого управляющего совета) проект "Этического кодекса ГБОУ Школа №57" и - к моему изумлению - сказал, что у УС есть сложности с тем, чтобы ознакомить с ним учителей (видимо, напечатать на бумаге и принести в учительскую то или им не пришло в голову, то ли они поленились, то ли что-то ещё). Вот эта ссылка: https://docs.google.com/document/d/1FC1h84_ERr5FZ5-vOLlBGK-1xakyrrqi5l_KpX106xE/mobilebasic (и да, мне кажется, что они несколько рехнулись в жанре административного экстаза, но это их право).
Соответственно моя просьба к читающим это: если вы бываете в 57 школе, то напечатайте пару экземпляров и принесите в учительскую, а также пошлите знакомым эту ссылку - вдруг им интересно, "какую поганку тут заворачивают", а может быть, этот текст у кого-то и встретит сочувствие.
(После такого "комментария для привлечения внимания" - который я мог бы написать и подробнее, но моё мнение тут не очень важно, как мне кажется - добавлю на всякий случай во избежание недоразумений, что достойное в том или ином смысле поведение является важнейшим качеством и для преподавателя, и для ученика, и даже для членов управляющего совета.)

Source: http://a-shen.dreamwidth.org/110140.html,.
Comments: comment count unavailable