Роман Колядюк: Політичні рейтинги: "блиск і злиденність куртизанок"
Вчений вказав на приховані маніпуляції при оприлюдненні результатів соціологічних досліджень.
Дослідження можуть бути реальними з вірно підрахованими середніми
даними, проте мають бути і вірно поданими. Щодо відверто сумнівних
політичних рейтингів напередодні різноманітних виборів з високою
конкуренцією, на думку приходять вислови з роману "Блиск і злиденність
куртизанок" французького класика Оноре де Бальзака: «Треба бути
насторожі, щоб розпізнати фальшиву монету, дану тобі другом».
Схоже, замість неупередженого статистичного аналізу, політичні рейтинги
із стійкою регулярністю використовуються в ході виборчих перегонів для
формування громадської думки з метою перетворення вільного доленосного
волевиявлення громадянина в азартну гру вболівальників кандидатів типу
спортивних змагань ліги чемпіонів. Як правдиво трактувати отримані
результати рейтингів, що вирахувані на основі вибіркових досліджень, а
не суцільного опитування - референдуму або виборів?
Справжні вибіркові дослідження громадської думки базуються на
статистичних методах і, відповідно до цієї науки мають бути
інтерпретовані. Традиційно кожне дослідження супроводжується інформацією
про похибку, яка виражається як число у відсотках із знаком плюс-мінус,
наприклад ± 3,2%. Дійсно, про похибку згадують практично всі, хто
презентує чи оприлюднює такі рейтинги. Проте, подача і аналіз рейтингів
є, як правило, не професійними і дуже спрощеними, бо в трактовці
рейтингу похибка не використовується. А це може вводити в оману широкі
верстви споживачів інформації, бо, як правило, навряд чи всі глядачі чи
читачі є фахівцями у сфері статистики.
Подивимося на рейтинг, оприлюднений будь-яким засобом масової
інформації. Для прикладу –телевізійним каналом NewsOne. 22 січня 2019
року був типово оприлюднений черговий політичний рейтинг. Оприлюднений
телеведучим і прокоментований присутнім у студії політтехнологом (без
зауважень щодо змісту рейтингу). Абсолютно грамотно і типово було
вказано, що:
1) такий-то дослідницький центр у власному дослідженні назвав лідерів президентських перегонів у 2019 році;
2) телеведучий згадав дату проведення рейтингу;
3) територію проведення опитування;
4) вікову і статеву групу людей, що взяли участь в опитуванні;
5) кількість опитаних (1200 респондентів);
6) і вказано на похибку словами: «не перевищує 3,2%»
Варто одразу розуміти, що похибка у 3,2% означає, що вся інформація є не
стовідсотковою, а вірогідною, тобто поданою з імовірністю 100%-3,2%=
96,8%. Найцікавіше те, що з точки зору математичної статистики, не варто
сприймати за реальну ситуацію рейтинг послідовних середніх значень
популярності кандидатів (у %), що ми дуже часто спостерігаємо. Чому? Бо
середні значення рейтингу для кожного кандидата насправді є ЛИШЕ ОДНИМ
ІЗ МОЖЛИВИХ значень певного інтервалу. Такий інтервал називається
довірчим (діапазон розраховується у два значення похибки, наприклад ±
3,2% від середнього). Правдиве значення популярності кандидата лежить у
межах цього інтервалу, а не визначається середнім значенням. Проте,
рейтинги типово представляють, наприклад у вигляді стовпчиків діаграм з %
чи так:
1) Юлія Т = 17,6%
2) Петро П = 15,1%
3) Юрій Б = 12,6%
4) Володимир З = 10,1%
5) Олег Л = 9,3%
Припускаю, що більшість бачить п’ять рівнів популярності кандидатів,
лідера та аутсайдера. Про щаблі рейтингу з відсотками, як правило,
говорять на ток-шоу чи в новинах. Насправді, з точки зору математичної
статистики, наукове трактування рейтингу має демонструвати не середнє
значення, а довірчий інтервал, у який може потрапити справжнє значення
популярності кандидата. При похибці вибірки ± 3,2% довірчий інтервал
складає 6,4%. Усі значення популярності, які лежать в межах різниці, що
не перевищує 6,4% (в т.ч і середні значення) є ГІПОТЕТИЧНИМИ, а НЕ
ДІЙСНИМИ щодо реальної популярності кандидата. Тобто рейтинг має
виглядати як інтервал істинних значень, від мінімуму і до максимуму:
Юлія Т = 14,4% - 20,8% (середнє значення 17,6%)
Петро П = 11,9% - 18,3% (середнє значення 15,1%)
Юрій Б = 9,4% - 15,8% (середнє значення 12,6%)
Володимир З = 6,9% - 13,3% (середнє значення 10,1%)
Олег Л = 6,1% - 12,5% (середнє значення 9,3%)
Рейтинг із п’яти прорангованих позицій середніх значень популярності
рейтинг не варто подавати і розглядати як рейтинг істинних значень ще й
тому, що рівнів рейтингу в реальності може виявитися набагато менше,
ніж п’ять…
Загалом, якщо різниця між найближчими порівнюваними середніми
значеннями популярності менша за два значення похибки (3,2% х 2 = 6,4%),
то невідомо, який кандидат є популярнішим, і вони, незалежно від
значення середнього, мають однаковий рейтинг!
Так, по відношенню до одного з трьох рівноправних лідерів - Юлії Т,
істинні значення яких лежать у межах довірчого інтервалу в 6,4%, з нею
перше місце в рейтингу займають Петро П і Юрій Б, бо довірчі інтервали
перших трьох кандидатів перетинаються і всі три можуть мати значення,
наприклад 15%. Нижнє можливе значення в Юлії Т – 14,4%, а максимально
можливе правдиве значення популярності Юрія Б є 15,8%. Себто направду,
може виявитися, що в Юрія Б реальний рейтинг вищий за популярність Юлії Т
і Петра П! Тобто, за даним дослідженням не відомо, хто з трійки
попереду кого є в дійсності. Хоча шанси на першість у лідерстві в Юлії Т
вищі за шанси інших:
1 місце) Юлія Т (інтервал істинного значення = 14,4% - 20,8%, середнє значення 17,6%)
1 місце) Петро П (інтервал істинного значення = 11,9% - 18,3%, середнє значення 15,1%)
1 місце) Юрій Б (інтервал істинного значення = 9,4% - 15,8%, середнє значення 12,6%,)
2 місце) Володимир З (інтервал істинного значення = 6,9% - 13,3%, середнє значення 10,1%)
2 місце) Олег Л (інтервал істинного значення = 6,1% - 12,5% , середнє значення 9,3%)
Два інших кандидати – Володимир З та Олег Л займають друге місце
рейтингу. Максимальне значення популярності Володимира З – 13,3% нижче
на 1,1% найнижчого можливого значення Юлії Т в 14,4% (14,4%-13,3%=1,1%).
Тобто рейтинг Володимира З, як і Олега Л, насправді нижчий рейтингу
Юлії Т.
По відношенню до Олега Л те саме місце в рейтингу разом з ним займають
усі, окрім головного конкурента - Юлії Т, бо всі, крім неї, можуть мати в
реальності популярність, наприклад, 12%:
1 місце) Юлія Т (інтервал істинного значення = 14,4% - 20,8%, середнє значення 17,6%)
2 місце) Петро П (інтервал істинного значення = 11,9% - 18,3%, середнє значення 15,1%)
2 місце) Юрій Б (інтервал істинного значення = 9,4% - 15,8%, середнє значення 12,6%,)
2 місце) Володимир З (інтервал істинного значення = 6,9% - 13,3%, середнє значення 10,1%)
2 місце) Олег Л (інтервал істинного значення = 6,1% - 12,5%, середнє значення 9,3%)
Такий аналіз зроблено і по відношенню до інших кандидатів (див, нижче у P.S.).
Науково обґрунтована правда щодо встановлення істинної
популярності полягає в тому, що замість демонстрованих П’ЯТИ місць у
даному рейтингу середніх значень популярності по відношенню до лідера чи
аутсайдера ми в реальності можемо говорити ЛИШЕ ПРО ДВА рівні!!!!! Це
при вказаній похибці дослідження ± 3,2% і кількості опитаних у 1200
чоловік з імовірністю 96,8%.
З огляду на вищенаведений можливий аналіз імовірної реальної
популярності всіх кандидатів, лідером за даним дослідженням є, все-таки,
Юлія Т. Ще раз варто звернути увагу, що ніякого третього, четвертого і
п’ятого місця рейтингу в дійсності – за даним дослідженням із вказаною
похибкою, встановити неможливо. Хіба формально - рейтинг середніх
значень з певною вірогідністю, який не демонструє істинних значень
популярності кандидатів, а є лише, так би мовити, варіантом рейтингу
шансів. Проте саме рейтинг середніх значень ми найчастіше споживаємо і
він може хибно сприйматися за істинний стан речей.
Також невідомо, наскільки правильно сформована вибірка опитаних і чи є
вона за структурою представницькою (репрезентативною), тобто чи реально
відображає реальну структуру виборців України. Є сумніви, бо останній
офіційний перепис населення був у 2001 році і дата наступного
запланованого перепису вже декілька разів переносилася... А формування
вибірки має бути науково і статистично обґрунтованою справою, аби
розповсюджуватися на всіх виборців, а не лише на опитаних.
Отож, чи є оприлюднення рейтингів у спрощеній формі політтехнологічним
лукавством, яке схоже на спробу позбавити виборців конституційного права
на вільне волевиявлення і «нав’язати популярних лідерів», чи це просто
некваліфікованість у математичній статистиці ведучих телепрограм,
журналістів та інших – хай вирішує читач. Моя приватна експертна думка
не є спробою образити когось чи принизити шанси на перемогу кандидатів.
Це досвід вченого і аналітика, який практикує вибіркові дослідження з
1986 року. Хтось може мати іншу думку. Проте, перш, ніж дискутувати,
варто почитати підручник чи довідник із статистики.
Дослідження можуть бути реальними з вірно підрахованими середніми
даними, проте мають бути і вірно поданими. Щодо відверто сумнівних
політичних рейтингів напередодні різноманітних виборів з високою
конкуренцією, на думку приходять вислови з роману «Блиск і злиденність
куртизанок» французького класика Оноре де Бальзака: «Треба бути
насторожі, щоб розпізнати фальшиву монету, дану тобі другом».
Роман Колядюк,
кандидат технічних наук, спеціаліст з досліджень і стратегічного
планування в маркетингу та інтегрованих маркетингових комунікаціях,
спеціально для "Досліди"
Р.S.
Щодо популярності і рейтингу Петра П, аналогічно з ним однакове місце в
рейтингу займають і всі інші п’ять претендентів. Тому що у всіх них
можливі істинні значення популярності потрапляють в довірчий інтервал
значень популярності Петра П і можуть гіпотетично скласти наприклад 12%
(окрім Юлії Т). Фактично чіткого рейтингу не існує і не відомо
насправді, чи вища реальна популярність Петра П за інших, наприклад за
Олега Л чи Юлію Т. Проте очевидно, що Юлія Т є конкурентом із шансами на
лідерство вищими за Олега Л, Володимира З та Юрія Б:
1 місце) Юлія Т (інтервал істинного значення = 14,4% - 20,8%, середнє значення 17,6%)
1 місце) Петро П (інтервал істинного значення = 11,9% - 18,3%, середнє значення 15,1%)
1 місце) Юрій Б (інтервал істинного значення = 9,4% - 15,8%, середнє значення 12,6%,)
1 місце) Володимир З (інтервал істинного значення = 6,9% - 13,3%, середнє значення 10,1%)
1 місце) Олег Л (інтервал істинного значення = 6,1% - 12,5%, середнє значення 9,3%)
Щодо рейтингу з позиції Юрія Б. З ним однакове місце в рейтингу також
займають усі інші кандидати. Бо в його інтервалі значень можуть лежати
значення популярності всіх інших претендентів на виграш у виборах.
Проте, очевидно, що Юлія Т і Петро П є конкурентами для Юрія Б в першу
чергу (бо всі можуть мати популярність, наприклад 15%), а Володимир З і
Олег Л – у другу чергу (бо можуть мати популярність 12%, але не можуть
мати 15%):
1 місце) Юлія Т (інтервал істинного значення = 14,4% - 20,8%, середнє значення 17,6%)
1 місце) Петро П (інтервал істинного значення = 11,9% - 18,3%, середнє значення 15,1%)
1 місце) Юрій Б (інтервал істинного значення = 9,4% - 15,8%, середнє значення 12,6%,)
1 місце) Володимир З (інтервал істинного значення = 6,9% - 13,3%, середнє значення 10,1%)
1 місце) Олег Л (інтервал істинного значення = 6,1% - 12,5%, середнє значення 9,3%)
По відношенню до популярності Володимира З, перше місце як його
конкурент займає Юлія Т, бо її ймовірна мінімальна популярність у 14,4%
на 1,1% вища за максимально можливе значення популярності Володимира З
(13,3%). З ним рівноправне друге місце в рейтингу займають Юрій Б, Олег
Л, Петро П, бо всі можуть мати 12%, наприклад:
1 місце) Юлія Т (середнє значення 17,6%, інтервал істинного значення = 14,4% - 20,8%)
2 місце) Петро П (середнє значення 15,1%, інтервал істинного значення = 11,9% - 18,3%)
2 місце) Юрій Б (середнє значення 12,6%, інтервал істинного значення = 9,4% - 15,8%)
2 місце) Володимир З (середнє значення 10,1%, інтервал істинного значення = 6,9% - 13,3%)
2 місце) Олег Л (середнє значення 9,3%, інтервал істинного значення = 6,1% - 12,5%)
Тому, шановні українці, не поспішайте з висновками.