Dystopiakirjallisuuden klassikossa Vuonna 1984 George Orwell spekuloi generatiivisen tekoälyn vaikutuksia yhteiskuntaan: Kyky teollistaa viihdesisällön tuotanto tekee turhanpäiväisen massaviihteen valmistamisesta alaluokille (proleille) halvempaa ja helpompaa, ja teoksen isossa mittakaavassa kurjistaa kansalaisten elämänlaatua suhteellisen vähän.
Kirjassa mainitaan ohimennen nykyisten kielimallien vertaiset totuusministeriön kirjallisuusosaston propagandateknologiat, kaleidoskoopit ja värssytin: Niillä voidaan tuottaa helposti romaanijuonia, pornokertomuksia ja sanoituksia lurituksiin jopa “kokonaan ilman ihmisen myötävaikutusta.” Orwellin ja uuskielen sanoin niillä valmistetaan “prolerehua, eli massoille tarjottavaa roskaviihdettä”. Totuusministeriön fiktio-osastolla toki on töissä ihmisiä, mutta kirjailijoiden sijaan nämä ovat mekaanikkoja ja kustannustoimittajia. Luomistyön tekevät koneet. Muuhun kuin halvan massaviihteen tuotantoon Orwell ei ehdota generatiivista tekoälyä käytettävän: Se on siihen tarinassa tarpeetonta ja soveltumatonta. Isoveli ei ole teknologiaa vaan fasistista mytologiaa kaikkitietävästä isähahmosta. Ajatuspoliisit ovat ihmisiä pamppuineen ja valvonta lopulta pitkälti sosiaalista. Orwellin tarinassa teknologinen kehitys on pitkälti tyrehtynyt, koska toimiva totalitarismi tavoittelee pysyvyyttä, ei kehityksen tuomaa muutosta. Helpoin tapa varmistua tekoälyn kyvykkyydestä on tiedustella asiaa kielimallilta. Kysyttäessä generatiivisen tekoälyn rinnakkaisuuksista olisi odotettavaa että tämä ilmeinen yhteys nousisi päällimmäiseksi tekoälykkään mallin käsissä. Vaikka valvonta, ajatuspoliisi ja uuskieli ovat kirjassa mainittuja asioita, menee suora yhteys generatiiviseen tekoälyyn siltä itseltään täysin ohi. Kielimalli poimii ensin kirjasta useimmin mainitut asiat, sitten täydentää jonkin epätoivoisen yhteyden takaisin generatiiviseen tekoälyyn. Nämä yhteydet eivät kestä kriittistä tarkastelua laisinkaan.
Tekoälyvastausten ilmentämä ymmärryksen puute on perustavanlaatuista ja monikerroksista. Vastausten vääräksi osoittaminen on uuvuttavaa, koska ne puhuvat kaukaa asian vierestä ja silti väärin: Tekoälysovellukset eivät seuraa meitä jatkuvasti, eivät varsinkaan älykamerat, ja älykamerat ovat ylipäätään huono esimerkki generatiivisesta tekoälystä. Tarkoitus ei myöskään useimmiten ole hyväntahtoinen, eikä tämä kaikki mitenkään oikeastaan muistuta Isoveljen valvontaa. Lähes jokainen virke on joko väärässä tai oikeassa vain ilmeisellä tasolla, mutta ilman oikeaa yhteyttä kysymykseen. Viimeinen “Tekoäly on kuin uuskieli koska tekoälyssä on uusia sanoja” on oivalluksista ehdottomasti himmein. Sen saavuttama ymmärryksen puute on syvyydessään jo loukkaava, koska väitteen perkaaminen edellyttäisi noihin syvyyksiin sukeltamista. Mikä kielimalleja vaivaa, miksi puppugeneraattori generoi puppua? Kone joka yhdistelee tavanomaisesta roskasta ilmeistä roskaaIlman avointa kysymystä tarkempaa ohjausta generatiivinen tekoäly suoltaa yleisluontoista ja ilmeistä roskaa – tämä käytös on on suoraa seurausta koulutettujen kielimallien toimintaperiaatteesta, niiden erottamaton ominaisuus. Yksi keskeinen syy tähän on lähdemateriaali ja sen yhdistelyn logiikka.
Orwellin nimeä käytetään tiheään väärin: Orwellilaisesta on tullut synonyymi epämääräisesti ikävälle valvonnalle, pelottavan mutta viksun kuuloinen sana. Nopea google-haku osoittaa hakutermien “Vuonna 1984 + generatiivinen tekoäly” tuottavan ylivoimaisesti eniten artikkeleita, joissa Orwell on ängetty mukaan johtuen kirjoittajan ymmärtämättömyydestä, välinpitämättömyydestä tai molemmista. Tekoäly kirjoittaa kuin henkilö joka ei ole lukenut kirjaa, koska suurin osa aiheesta kirjoittavista henkilöistä ei ole todennäköisimmin lukenut kirjaa. Tusinauutisten ja -blogien joukossa merkittävä poikkeus on kulttuuritoimituksen mahtava artikkeli, joka purkaa juuri tätä ilmiötä. Kielimallin näkökulmasta tällainen omaperäinen ja oivaltava näkökulma on tilastollinen poikkeama, joten se ei ole todennäköinen tai tyypillinen vastaus. Malli aktiivisesti suodattaa tuloksista pois omaperäisen ja oivaltavan. Lopputulos on pintapuolisin ja ilmeisin mahdollinen yhdistelmä internetin antia aihepiirin tiimoilta. Mitä useampi kirjoittaja on suoltanut saman sanayhdistelmän, sitä houkuttelevammalta se näyttää, kun taas ymmärrys, oivallus ja tekstin tuntemus karsitaan pois. Mallin näkökulmasta tietämättömyys on voimaa. Suodattimen läpi turistuu truistista tuubaa, itsestäänselvyyksiä ja helppoja totuuksia. “Algoritmit voivat suodattaa sisältöä ja vaikuttaa siihen mitä näemme ja ajattelemme” ei ole väittämänä varsinaisesti väärin, mutta ei myöskään kirjoittamisen väärti. Ilmeisyys voi olla hyödyksi vaikka helposti ymmärrettävää koodia kirjoittaessa, mutta tekstiä tuottaessa se on synti: Ilmeisyyksien yksinomainen listailu on lukijan ajan hukkaamista.
Hallusinoitu yhteys avainsanoihin
Esimerkki uuskielen ja tekoälyn välisestä yhteydestä on malliesimerkki tekoälyn hallusinaatiosta. Vetäessään väkinäisiä yhteyksiä käsitteiden välille malli keksii omiaan paikkaamaan aukot. Vaikka selkeitä faktavirheitä ei ympäripyöreään selittelyyn osunutkaan, vastauksen logiikka on silti vajavainen.
Kysymys kirjan Vuonna 1984 ja tekoälyn yhteyksistä tarkoittaa automaattisesti, että niitä pitää löytää. Koska Orwellin yhteydessä erityisesti yleisimmin mainittuja konsepteja ovat Isoveli, ajatuspoliisi ja uuskieli, kielimalli yrittää luoda jonkin yhteyden näiden ja tekoälyn välille: “Generatiivinen tekoäly → ??? → Uuskieli” Tätä prosessia toistetaan kunnes koossa on kolmiportainen lista. Malli ei osaa varsinaisesti arvioida mitkä kirjan käsitteet liittyisivät erityisesti tekoälyyn, vain mitkä ovat suosituimpia ja merkittäviä. Juuri koska värssytin on tarinan kannalta toissijainen, malli näkee sen myös vastauksen kannalta toissijaisena, vaikka se on merkittävin yksittäinen samankaltaisuus.
Kelvoton kehoteMatalalaatuisen lähdeaineiston ja tasapäistävän toimintaperiaatteen lisäksi edellisessä esimerkissä myös kielimallille annettu syöte oli kehno. Yksi tapa parantaa syötettä on tarjota tekoälylle tueksi kirja luettavaksi: Nineteen Eighty-four onkin onnekkaasti vapaasti saatavilla netistä. Kielimallin päälle rakennettu tekoälykerros osaa avata linkin ja luettaa sen kielimallilla. Vastaavilla kikoilla voi auttaa mallia vastaamaan tarkemmin tai eri näkökulmasta.
Tässä tapauksessa lähdetekstin tarjoileminenkaan ei auta tekoälyä huomaamaan värssyttimen yhteyttä generatiiviseen tekoälyyn. Vasta lisäämällä syötteeseen maininnan nimenomaan romaanien ja laulujen automaattisesta generoinnista kielimalli saa kiinni vastauksesta jota kaivataan, ja keksiikin pintapuolisia rinnakkaisuuksia värssyttimeen. Vaatimalla vielä tarkemmin asenteita, avainsanoja ja alkusointuja saa tarkalleen mitä tilaa. Haluamansa oivallukset sille pitää siis syöttää itse, mutta niiden ympärillä malli osaa tuottaa sisältöä. Kielimalli kykenee rakentelemaan lauseita valmiiden ajatusten ympärille: Kielellisten tehtävien kanssa se on haka. Kyky ratkoa vaikeitakin kielellisiä tehtäviä johtaa myös kohtalaiseen kykyyn järjestää ainakin yleistä ja ilmeistä tietoa: Kielelliset ongelmat ovat myös tiedollisia ongelmia.
Ajattelutyössä mallit vaikuttavat olevan kuitenkin kelvottomia. Kielimallien perustava logiikka vaikeuttaa oivaltavien lähteiden arvottamista yli toisten. Kielimallin ymmärrys on väistämättä kapea, koska se on kaiken aiheesta kirjoitetun leikkaus, ei unioni. Kielimallien dystopia ei ole valvonta-autoritarismi vaan propaganda ja prolerehuGeneratiiviset kielimallit soveltuvat erinomaisesti propagandan tuotantoon: Niiden avulla voi vaikka tuottaa suuria määriä mielipiteitä sosiaaliseen mediaan, hukuttaen kriittisemmät kannat. Käytännössä valtiollisilla toimijoilla on kuitenkin ollut vastaavaan vaikuttamiseen vaadittavat resurssit jo aiemminkin, ja tekoäly vain tehostaa prosessia: Ennen liukuhihnalla käsin tehty somevaikuttaminen saadaan viimein koneistettua, kielimalli on trollitehtaan Kehruu-Jenny. Röllitehtaalla pidetään YT-neuvottelut.
Kielimallit eivät helposti sovellu ajatuspoliisiksi, teleruuduksi tai uuskielen kehittäjäksi. Tärkein Vuonna 1984:n autoritarismin työkaluista oli kuitenkin perinteinen väkivalta, teknologia on tarinan kannalta varsin toissijaista. Kansan kurissapito vaati ihmisen kosketusta. Pelottelusta huolimatta kielimallit eivät siis ole merkittävä askel kohti Orwellin valvontadystopiaa. Orwellin oikea ennustus niiden merkityksestä onkin varsin kaukonäköinen, kielimallit voivat syytää loputtomasti prolerehua, ja siinä onkin niiden oikea dystopia. Generatiivinen tekoäly voi tuottaa proosaa nopeammin kuin kirjailija, kuvituskuvia halvemmalla kuin taiteilija ja luontodokumentteja helpommalla kuin kokonainen kuvausryhmä. Sisältö on keskinkertaista, mutta ei ehkä ratkaisevasti huonompaa, joten se on houkutteleva vaihtoehto tehokkuuteen panostavalle tuottajalle. Isossa kuvassa tämä kaikki kurjistaa elämänlaatua suhteellisen vähän. |