|
|
Na jednom velkém českém zpravodajském serveru jsem ve středu odpoledne zaregistroval anketu, jejíž průběžný výsledek mi připadal (mírně řečeno) pozoruhodný. Začal jsem si ve volných chvílích poznamenávat stav ankety. Pokračoval jsem i následují den ráno a během dopoledne, kdy byla zveřejněna nová anketní otázka. Naměřená data jsem chtěl porovnat proti modelu vycházejícího z předpokladu, že pravděpodobnost jednotlivých odpovědí se v čase nemění.
Možné odpovědi na anketní otázku byly “ano”, “ne”. V reálném čase byl zveřejňován aktuální počet hlasujících a procentuální podíl jednotlivých odpovědí zaokrouhlený na jedno desetinné místo. Výsledky měření jsou vyneseny v následujícím grafu.
Mezi prvními přibližně 23000 respondenty, kteří hlasovali před započetím monitorování ankety, se pro odpověď “ne” vyslovilo přibližně 18% hlasujících. Mezi prvními přibližně 28000 respondenty se pro odpověď “ne” vyslovilo již přibližně 24% hlasujících. Tedy mezi posledními přibližně 5000 respondenty se pro odpověď “ne” vyslovilo přibližně 55% hlasujících.
Pro čtenáře, kteří nejsou zběhlý ve statistice, jsem připravil čtyři ukázkové simulace stochastického procesu za předpokladu, že pravděpodobnost odpovědi “ne” je 20%. Podle následujících grafů výsledků simulací si mohou udělat představu, v jakém řádu lze očekávat fluktuace.
Diskuse výsledků měření
Rozdíly v preferencích mezi skupinou prvních 23000 respondentů a skupinou následujících 5000 respondentů zjevně nelze vysvětlit jako statistickou chybu v důsledku malých souborů. Změnu trendu lze interpretovat jako:
Závěrem lze říci, že i přes značný rozsah statistického souboru nebyla anketa relevantní. Výsledek totiž zjevně nekonvergoval k žádné limitní hodnotě. Navíc změna trendu vyvolává důvodné podezření, že anketa byla záměrně někým manipulována.
Štítky: Nesouvisí s Linuxem
btw, mám problém s captchou ve firefoxu 4.0. Rámeček s obrázkem zůstane prázdný (bez obrázku). Je chyba u mě? (s Operou je to ok)
re pepa z depa : Takže flagrantní manipulace anket na novinky.cz si všimlo víc lidí. Oproti odkazovanému článku můj článek ukazuje metodu, jak tuto manipulaci matematicky důkázat.
K problému kompatibility Firefoxu 4.0 a capcha testu se nedokáži vyjádřit.
Ta anketa na novinkách byla směšná. Člověk při smyslech přece neuvěří, že Vítu Bártovi fandí 80% veřejnosti!!!
Chybí mi tady anketa s otázkou “Lze věřit anketám na internetu?”!
Jinak je zajímavé, že někomu tohle vůbec stojí za námahu (mám na mysli ovlivňování anket, nikoliv tento článek)
To ovlivňování je celkem jasné. Vždy se najde někdo, kdo se snaží výsledky ovlivnit k obrazu svému. A dělá to v rámci celých svých možností. Takže sežene celou svoji komunitu a přesvědčí ji, aby hlasovala v jeho prospěch. No a každá komunita má svoji míru loajality a svoji velikost. Takže je snadné ovlivnit relativně malou anketu, těžší je výrazně ovlivnit nějakou opravdu rozsáhlou.
Jinak ovlivňování anket může mít smysl. Lidi jsou stádo, které je snadné manipulovat. No a co je lepší podklad pro manipulaci než čísla. Je to prostě další argument a existuje nemalé stádo lidí, kteří i takovýmto prakticky nesmyslným výsledkům budou věřit.
re Luboš : Myslím, že to není aktivní komunitou příznivců. Tyhle podvody jsou téměř určitě prováděny strojově speciálním robotem. (Stačí vytvořit skript a anonymizovat provoz generovaný robotem prostřednictvím Tor nebo jiné anonymizační služby.)
Ono je dost možné, že takovou anketu mohl zmanipulovat sám provozovatel a mohl k tomu mít různé důvody. Každý jistě na pár přijde.
lze verit zenam na internetu? ano reknou zeny ze muzum se neda verit, ale kdyz ty hloupe a naivni zenske veri jen lzim a pravdy se stiti.
Každý, kdo si přečetl alespoň jednu knihu o metodologii sociálněvědního výzkumu, ví, že anketa není věrohodný zdroj informací a to bez ohledu na počet respondentů…
re uzivatel2: Ono těch způsobů je povícero. A ve své podstatě je naprosto jedno, jakým způsobem k té úpravě hlasů dojde, ať to je strojově, ručně nebo třeba zásahem vyšší moci (resp. toho, kdo tu anketu vyhlásil). Podstatné je to, že ankety prakticky nemají žádnou zásadní vypovídací hodnotu, pokud není zcela bez pochyb potvrzena totožnost veškerých účastníků. Ale stejně tak se anketa s vhodnými výsledky hodí, protože existuje značná skupina lidí, kteří i číslům vycucaným z prstu budou věřit. Vždyť je vlastně jedno jestli to je průzkum nebo anketa, hlavně že jsou příznivá čísla…
Otázka je, jak lze věřit průzkumům veřejného mínění vůbec. Kolikrát, na co a jakým způsobem se ptali vás co sem zabloudíte - například při předvolebních průzkumech? Mně nedávno kdosi volal co říkám poplatkům u lékaře. Ale na můj (slušný) názor tam asi neměl chlíveček. A nevzpomínám si, že by mi řekl kdo je a k čemu to potřebuje vědět.
Mno jak se rika: “Jsou 3 druhy lzi: lzi, zavrzenihodne lzi a statistiky.”
A jinak i ta 4ta varianta je mozna. Nevim proc predpokladas ze se struktura lidi nemenila. Protoze odpodledne prijde hromada lidi z prace, a muzou hlasovat, a klidne muzou hlasovat uplne jinak nez ti co hlasovali uz dopoledne.
Linux zblízka využívá WordPress MU a běží na Blog.zive.cz. Vytvořte si svůj vlastní blog
Sledování přes RSS: články
a komentáře
Partnerská sekce pro IT profesionály:
Microsoft TechNet/MSDN