Marko Junkkarin pääkirjoituskolumni viime kuntavaalien jälkimainingeista julisti että “Ehdokas paiskii hommia, ja sitten tulee joku Aaltonen ja menee valtuustoon – aakkosilla on väliä vaalikamppailussa.”. Sinänsä löydös - aakkosten alkupää haravoi hieman enemmän ääniä kuin loppu - on ihan mielenkiintoinen, mutta menetelmä vaikutti krouvilta kuin kruunukorkin avaus hampailla: Junkkari oli asettanut ehdokkaat aakkosjärjestykseen, puolittanut listan keskeltä ja summannut kummankin puolen äänimäärät. Kuinka alkeellista! Näytti siltä, että helpolla tästä saisi tehtyä sofistikoituneempaakin tulkintaa. Diletantti tarttuikin toimeen, ja lähti kehittämään sivistyneempää vaaliaakkosanalyysiä. Kuinka vaikeaa se voi olla!
Onnekkaasti oikeusministeriö tarjoaa kansalaisille vaalien tulokset näppärässä taulukkomuodossa. Tietue sisältää tiedon kuntavaaliehdokkaiden äänisaaliista äänestysalueittain ja kunnittain.
Junkkarin laskelmien mukaan aakkosten alkupään ehdokkaat saivat vuonna 2015 ja 2012 kuntavaaleissa noin 30 000 ääntä enemmän kuin loppupään ehdokkaat. Kokonaisäänimäärästä tämä erotus on noin 1,4 prosenttia. Junkkarin hypoteesin mukaan tämä voisi johtua siitä, että ehdokkaita tuntemattomat äänestäjät valitsevat jonkin ehdokkaan listan alkupäästä. Tämän vuoden kunnallisvaaleissa ero on revennyt 96942 ääneen, liki neljään prosenttiin kaikista äänistä. Jos hypoteesi pitäisi paikkansa, sama ilmiö pitäisi olla havaittavissa äänimäärien lisäksi keskimääräisissä ääniosuuksissa: tällöin ei ylipainota huomaamattaan väkirikkaiden kuntien ehdokkaita, prosenteillahan vaaleissa pelataan. Sama ilmiö toistuukin ääniosuuksissa: aakkosjärjestyksen alkupuolen mediaaniehdokas sai keskimäärin 0.36 % kuntansa äänistä, kun taas loppuaakkoisten keskiehdokas sai vain 0.34%. Aakkosten alkupään ehdokas voi siis odottaa ääniosuutensa olevan noin kaksi prosenttiyksikön sadasosaa loppupään ehdokasta suurempi. Erotus vaikuttaa pieneltä, mutta kuitenkin noin viisi prosenttia keskiäänisaaliista, samaa suuruusluokkaa kuin koko maan äänien suhde. Sama kuvio toistuu myös keskiarvoääniosuuden kanssa. Mikäli oletuksena on, että aakkosten alkupää saa hieman muttei hirveästi enemmän ääniä kuin loppupää, pitäisi pakkaa sekoittamasta ottaa terävin kärki vaalilistasta. Esimerkiksi äänekkäin 10% sai kuntavaaleissa 50% äänistä. Rajaamalla tarkastelusta pois kunkin kunnan äänikuninkaalliset voi kuitenkin vahvistaa ilmiön olevan varsin itsepintainen: eniten ääniä saaneiden ehdokkaiden rajauksella ei juuri saa vähennettyä yliedustusta, ellei karsi pois valtaosaa ehdokkaista. Sama toistuu rajatessa pois esimerkiksi pienimmät kunnat tai lyhyemmät puoluelistat. Riippumatta datan karsinnasta ja normalisoinnista aakkosten alkupää tuntuu siis keräävän enemmän ääniä. Junkkarin huomio vaikuttaisi siis pitävän paikkansa.
Kirjainkohtainen tarkastelu puolestaan tuottaa vain eri tavalla normalisoitua kohinaa. On toki järkeenkäypää että pilkkomalla ehdokkaat pienempiin karsinoihin tulee lisänneeksi kohinaisuutta, mutta tulos yllättää hyödyttömyydellään: riippuen mallin valinnoista vaikka A-kirjain voi olla joko yli- tai aliäänestetty. Vastaavia vahvoja vaikutuksia kuin Junkkarin tarkastelussa ei saa datasta puristettua. Ensireaktion vastaisesti vaikuttaakin siis ettei tarkemmalla nysväyksellä saavuta suurempaa hurskautta. Sofistikoituneemmat menetelmät ovat joko vaikeaselkoisia tai tulkinnanvaraisia ja niiden työstäminen kohinasta on turhauttavaa. Oli siis aika vaikeaa, selvisi.
|