Nimien tehtävä kautta aikain on ollut yksilöidä ihmisiä: Nimellä voi viitata ihmiseen, tai paremmin, viittaus tiettyyn ihmiseen on käytännössä nimi. Nykyisenkaltaiset nimiperinteet ovat vakiintuneet lopulta valtioiden voimistumisen myötä: keskitetyssä valtiollisessa kirjanpidossa oli tarve yksilöidä kaikki kansalaiset, ei esimerkiksi vain tiloja tai kyliä. Kuinka hyvin nykyinen nimikäytäntö tässä onnistuu?
Onnekkaasti informaatioteoria tarjoaa meille klassisen tavan mitata nimen yksilöivyyttä, jakauman entropian. Tarkalleen entropia on määritelty jakauman mahdollisten arvojen logaritmisen todennäköisyyden keskiarvon vastalukuna. Käytännössä kyseessä on kuitenkin yksinkertainen mittari: Entropia kertoo olennaisesti, kuinka harvinaista on saada jakaumasta kaksi samaa arvoa – nimien tapauksessa siis “kaimoja”. Esimerkiksi henkilötunnus on järjestelmänä erittäin yksilöivä: kenelläkään ei ole hetukaimaa. Henkilötunnusjakauma sisältää noin 22 “bittiä” informaatiota, joka on tarpeeksi yksilöimään jokaisen suomalaisen. Tämän voi tulkita niin että 22 merkin jono nollia ja ykkösiä riittäisi yksilöimään jokaisen suomalaisen. Tilastollinen sukupuoli puolestaan on kehnosti yksilöivä: jokaisella suomalaisella on tilastokeskuksen näkökulmasta noin 2,7 miljoonaa “sukupuolikaimaa”, ja sukupuoli sisältääkin vain yhden bitin edestä informaatiota. Vasen-/oikeakätisyys puolestaan tarjoaa vain puolikkaan bitin, koska keskimääräisellä suomalaisella on 4,5 miljoonaa "kätisyyskaimaa": sukupuoli on siis keskimäärin kätisyyttä parempi yksilöimään ihmisiä, koska kätisyysjakauma on niin epätasainen. Kyseessä on lopulta mielivaltainen mittari yksilöivyydelle, mutta suosittu ja näppärä sellainen. Koska asteikko on logaritminen, kahden keskenään korreloimattoman mittarin yhdistäminen on helppoa summausta: Vaikka kätisyyden ja sukupuolen yhteinen informaatiosisältö olisi 1,5 bittiä. Tämäkään ei ole vielä erityisen erottelevaa. Etu- ja sukunimitilastoista on helppo tarkistaa nimijakaumien informaatioarvo. Suomalaisten sukunimijakauma sisältää 12 bittiä informaatiota. Kaikki etunimet yhdessä sisältävät noin 10 bittiä, kun taas sekä miesten että naisten nimet yksinään 9 bittiä, sukupuoli lisää siis taas noin yhden bitin edestä tietoa. Sama jakauma toistuu esimerkiksi Ruotsissa. Taas nimien epätasaisella jakaumalla on suuri vaikutus tähän: jos kaikki nimet olisivat yhtä yleisiä, jokaisella suomalaisella, niin Timolla kuin Elspethilläkin, olisi noin 360 etunimikaimaa, ja etunimijakauma sisältäisi huimat 17 bittiä entropiaa. Yhdessä etu- ja sukunimijakaumat sisältäisivät siis noin 22 bittiä informaatiota – taas teoriassa tarpeeksi suomalaisten täydelliseen yksilöimiseen! Kokonimikaimojen olemassaolo kuitenkin todistaa, että toteutunut summa jää lopulta aavistuksen alhaisemmaksi. Kyky mitata ja vertailla nimijärjestelmien erottelukykyä tarjoaa meille kuitenkin mahdollisuuden vertailla eri vaihtoehtoja nimille: olisiko jokin toinen tapa nimetä ihmisiä parempi? Onnekkaasti tilastokeskus tarjoaa meille runsaasti vaihtoehtoja. “Sauli Väinönpoika”, “Sauli Hilkanpoika” tai “Jennin Sauli” Islannissa lasten “sukunimi” määräytyy näiden vanhempien mukaan. Tällaisia nimiä kutsutaan patronyymeiksi ja matronyymeiksi. Samaan sarjaan voisi lukea lisänimen puolison mukaan. Esimerkiksi Islannissa käytetään pääasiassa patronyymeja, jolloin nimen kokonaisinformaatio jää 19 bittiin: teoriassa 9 bittiä isän nimestä ja 10 omasta. Tosiasiassa ikäkausittaiset nimitrendit kuitenkin kaventavat tätä entisestään. “Sauli Väinämö” Suomessakin on käytössä useampia etunimiä. Muiden kuin etunimen informaatiosisältö on etunimiä vähäisempi, vain 7 bittiä. Jos haluaisi tulla toimeen siis pelkillä etunimillä, kolmaskin etunimi olisi todennäköisesti tarpeen. “Salon Sauli” tai “Sauli Salolainen” Syntymäpaikkakunta on yllättävän erottelukykyinen tunniste: 6 bittiä. Toimiakseen hyvin se kuitenkin vaatisi paljon liikkuvuutta ympäri Suomea: Samalla kylällä kotikunta ei ole erityisen hyvä tunniste. Syntymäpaikkakunta on myös jokseenkin mielenkiintoinen lisätieto ihmisestä, joten se palvelee yksilöimisen lisäksi toistakin tehtävää. Sauli-48 Syntymävuosi yltää samaan 6 bitin erottelykykyyn, joka on varsin hyvä suoritus vain kahdella numerolla! Syntymävuosi onkin usein käytössä nimimerkeissä, varsinkin silloin kun ikä on kanssakäynnin kannalta kiinnostava tieto. “Tasavallan Presidentti Sauli” Toimenkuvasta tai ammatista johdetut sukunimet ovat myös kansainvälisesti yleisiä. Ammattitilaston mukaan tästä voisi saada 8 bittiä lisää informaatiota – enemmänkin, jos jaottelua laajentaisi kattamaan useampia ammattinimikkeitä kuin käytössä oleva eurooppalainen ammattiluokittelu sisältää. “Tasavallan presidentti Salosta-48” Yhdessä syntymävuosi, -paikkakunta ja toimenkuva sisältäisivät kuitenkin nykyiselläänkin 20 bittiä informaatiota, melkein saman määrän kuin nykyinen etunimi-sukunimi yhdistelmä! Yksilöinnin vastakohtaNäppärästä lisäinformaatiosta huolimatta suuret muutokset nimijärjestelmään ovat harmillisen epätodennäköisiä.
Harmillisesti näitä tehokkaammin yksilöiviä nimikäytäntöjä ei todennäköisesti oteta käyttöön, eikä siirtyminen edes jokseenkin hyödyllistä lisäinformaatiota sisältäviin nimijärjestelmiin (ikä, syntypaikka, toimenkuva) vaikuta todennäköiseltä. Nimien tehtävä onkin usein ennemmin yhdistää kuin yksilöidä. Siinä missä sukunimi yhdistää ihmisen sukuunsa, etunimellä tavoitellaan usein tietynlaisia mielikuvia, konnotaatioita, tunnelmaa ja rytmitystä sukunimen kanssa. Nimijärjestelmän täytyy painotella käytännöllisen yksilöivyyden ja muiden arvojen kanssa. |