|
|
Již v jednom z minulých příspěvků jsem upozorňoval na značné nesrovnalosti v hlasování čtenářů na serveru novinky.cz. Popsal jsem i statistickou metodu, jak identifikovat podvodné hlasy. Po odhlasování více jak 20000 respondentů lze totiž očekávat fluktuaci podílu odpovědí nejvýše v řádu desetin procent. V zmanipulované anketě však dochází k fluktuacím v řádu desítek procent.
K manipulaci zřejmě docházelo i v aktuálně zveřejněné anketě týkající se hodnocení reforem a stávky. Konkrétně na otázku “Chystané reformy jsou pro vás” zvolilo možnost “nepřijatelné - stávka musí být” 37.9% hlasujících (včera okolo 22:00, celkem 19279 hlasujících), 36.0% (včera okolo 22:30, celkem 20998 hlasujících) a 28.8 (dnes okolo 6:30, celkem 30006 hlasujících).
Pravděpodobně byl realizovan tento scénář. Po nějakém čase si ankety všimnul nějaký najatý profesionál pro vytváření veřejného mínění, který spustil robota. Tento automat během několika hodin naklikal tisíce hlasů pro “správnou” možnost. Specialista na vytváření veřejného mínění byl spokojen, až když poměr odpovědí vychýlil o několik desítek procent. V té chvíli vypnul robota a poměr hlasů začal pomalu relaxovat ke své přirozené hodnotě. V současnosti byla již umělá technická podpora ukončena a výsledek ankety se vrací k přirozeným hodnotám.
Po provedení regrese z mnou odečtených dat (po vyloučení podvodných hlasů) pro zmíněnou odpověď hlasovalo přibližně 70% respondentů.
Doplnění po skončení ankety : Přes noc byl podíl odpovědí “nepřijatelné - stávka musí být” pouhých 12,4% (přibližne 10000 hlasujících). Ráno byl podíl této odpovědi 59,7% (přibližně 4000 hlasujících). Pak začala být anketa znovu manipulována a podíl odpovědí klesl na 18,3% (přibližně 8000 hlasujících), což se projevilo i skokovým několikanásobným zvýšením návštěvnosti (frekvence nových hlasů).
Štítky: Aktuality a komentáře, Nesouvisí s Linuxem
Tyto “ankety” jsou nic než pouťové atrakce, není třeba se jimi blíže zabývat. Takhle kdyby to bylo zabezpečeno přes elektronický podpis, to by byla jiná.
myslím, že je o tom potřeba pořád mluvit. Dokola a znovu a znovu. Abych tak řekl: “šířit osvětu mwzi prostý lid”..
A nemůže být rozdíl prostě v tom, kdy se která část populace dostane k PC? Manuálně pracující usednou k PC (a začnou klikat) večer, kacelářské krysy průběžně přes den. Přičemž lze očekávat, že každá skupina bude hlasovat jinak…
re 3 : Vaši hypotéza by předpovídala mimo jiné :
* Změna trendu nebude skoková.
* K podobným výkyvům bude docházet téměř u všech anket.
* Výsledky jednotlivých anket budou konzistentní.
Sleduji ankety na novinkách delší dobu a chtěl bych zdůraznit, že toto chování se objevuje jen u některých anket. (Jde jen o několik málo anket, kde je silný politický zájem na určitém výsledku.) Navíc změna trendu probíhá skokově. Citovaná anketa dopadla diametrálně odlišně než čtvrteční anketa s podobnou otázkou (”Podporujete stávku odborů?”).
tak já osobne jsem tam hlasoval asi 3x, proste jak mi to vyskocilo v prubehu dne v prohlizecich, nicmene nabizi se i jine vysvetleni, ti co budou stavkovat, === SMAZÁNO (šlo o nadávky) === a jsou to zamestnanci (ne podnikatele) a v pracovni dobe samozrejme lezou na internet
(treba jako jeden policajt co ho znam a co je cely den na seznamu,cz)
no tak je logicke ze hlasovali pro stavku, pak vecer a v noci uz hlasovala jina kategorie lidi, treba studenti, podnikatele, co pracuji 16 h denne atd
re 5 : Vaše vysvětlení vůbec neodpovídá okolnostem. Přečtěte si předchozí komentáře. Stejně tak je nesmysl, že stávkující “lezou” v pracovní době na internet. Stávkovat budou strojvůdci a řidiči autobusů.
Možná by nebylo špatné robotem zapisovat stav ankety třeba každou minutu a pak udělat graf v kterém by byl počet hlasu za minutu a procenta jednotlivých možností. Mám takový pocit že by byl výsledek velice vypovídající a to nejen na novinky.cz
re 7 : Uvažoval jsem, že na podobné téma napíšu v budoucnu zápisek. V zápisku bych předvedl výhody a fektivitu skriptování v Bashi. Technicky minutová frekvence vzorkování je moc velká (výsledek hlasování se zaokrouhluje na desetinu procenta, stránka se tahá z cache…).
Tip : Téma “Statistická charakteristika chování anket na českých zpravodajských serverech” by mohlo být vypsáno jako zadání nějaké diplomové práce na VŠ nebo středoškolské odborné činnosti.
Ta minuta byl jenom příklad, ale určitě bych si takovou práci rád přečetl
A co když naopak robot naklikával hlasy odpovědi “nepřijatelné - stávka musí být”, na noc byl vypnut a ráno zase zapnut?
Každopádně, graf by byl docela zajímavý ![]()
A co to má společného s Linuxem? ![]()
Linux zblízka využívá WordPress MU a běží na Blog.zive.cz. Vytvořte si svůj vlastní blog
Sledování přes RSS: články
a komentáře
Partnerská sekce pro IT profesionály:
Microsoft TechNet/MSDN