Käytännön Rauhankone, osa 2: Mitä voisimme rakentaa nyt?

Ensimmäisessä osassa käsittelimme koneälyä yleisesti. Nyt voimme hypätä suoraan Rauhankoneeseen.

Timo Honkela esittelee kirjassaan Rauhankone kolme eri konseptia. Jokainen niistä kuvailee tavan, jolla koneäly voisi parantaa ihmisten välistä kommunikaatiota.

  1. Tarkoitusneuvottelevakone tunnistaa, kun ihmiset puhuvat samasta asiasta eri sanoin, ja opastaa keskustelijoita tunnistamaan merkityserot.
  2. Tunnekone analysoi ihmisten puheesta heidän tunnetilojaan ja auttaa sitä kautta ihmisiä ymmärtämään paremmin niin itseään kuin toisiaan.
  3. Miljoonan ihmisen kokous jakaa massakokoukset pienemmiksi yhdenaikaisiksi keskusteluiksi, joista kone hakee ja tiivistää suurten massojen osaamista ja mielipiteitä ymmärrettäväksi kokonaisuudeksi.

On kaksi asiaa, joista Honkela on kirjassaan erittäin selkeä. Ensinnäkin, Rauhankone ei ole mustalaatikko, joka tuodaan neuvottelupöytään, kun ratkotaan konflikteja. Ja toiseksi, mitään kolmesta konseptista ei voida rakentaa kokonaisuudessaan tämän päivän teknologioilla. Mutta kuinka pitkälle voisimme päästä juuri nyt?

Merkitysneuvottelu

Merkitysneuvottelun idea tukee tensorianalyysiin. Tensorit ovat moniulotteisia taulukoita, jotka tässä tapauksessa sisältäisi konsepteja ja niiden välisiä yhteyksiä.

Merkitysneuvottelun käyttö yleisessä keskustelussa vaatisi tietoa keskustelijoista, heidän tietotaidostaan, kielestään ja mahdollisesti jopa arvoistaan. Näiden tietojen avulla koneen tulisi tulkita, miten yhden keskustelijan tapa puhua asiasta X eroaa toisen keskustelijan tavasta.

Tarvittava määrä tietoa ja laskentatehoa on yksinkertaisesti mahdotonta tänä päivänä. Mutta ehkäpä voisimme katsoa jotain rajattua tapausta? Kuten osassa 1 mainittiin, koneäly toimii parhaiten rajatuissa tapauksissa. Yksi tapa muuttaa lähestymistä on live-keskustelun sijasta käsitellä ennakkoon käytyä keskustelua.

Honkela kuvaa kirjassaan tutkimusta, jossa oli vertailtu, millaisia sanoja Yhdysvaltain demokraatit ja republikaanit puhuvat terveydestä. Kun tulkitaan tarpeeksi suurta määrää puheita, nähdään, että nämä kaksi puoluetta yhdistävät hyvin erilaisia ajatuksia ja termejä samoihin sanoihin.

Vaikka tällainen analyysi onkin melko kaukana yleisestä merkitysneuvottelusta, sillä voi olla käytännön sovelluksia. Ennen kaikkea politiikassa on tärkeää nähdä sanojen ja retoriikan taakse, jotta puolueiden todelliset erot tulevat esille.

Tunneanalyysi

Tunneanalyysi on yhtä aikaa kaikista eniten ja vähiten valmis Rauhankoneen konsepteista. Tunneanalyysille (tai sentimenttianalyysille) on saatavilla lukuisia työkaluja, joiden päälle voisi helposti rakentaa käytännönsovelluksia. Hyödyllisiä kulmia sovelluksille on kuitenkin hankala löytää.

Saatavilla olevat palvelut hyödyntävät koneoppimista. Järjestelmille on tarjottu suuri määrä tekstiä, joka on merkitty tunnetiedolla. Tämän opetusdatan pohjalta järjestelmä osaa arvioida tunnetta tekstistä.

Tämä lähestyminen on kuitenkin kaikkea muuta kuin täydellinen. Tunnetilan arviointi tekstistä on haastavaa jopa ihmiselle. Tekstistä puuttuu kaikki non-verbaalinen kommunikaatio, kuten äänen rytmi ja sävy. Tämän takia esimerkiksi sarkasmin ja ironian tunnistaminen muuttuu mahdottomaksi.

Koneälyllä ei myöskään ole asiayhteyttä. Jos opetusdata on ollut liian yleistä, jotkin aiheet voivat yhdistyä algoritmin mielestä suoraan tiettyihin tunteisiin, vaikka teksti itsessään ei sitä indikoisikaan.

Otetaan esimerkiksi sana ”sota”. Yleisessä keskustelussa sota mainitaan yleensä surullisten tai turhautuneiden kommenttien yhteydessä. Jos analysoimme tekstiä, jossa puhutaan nimenomaan sodasta ja rauhasta, sana ”sota” voi esiintyä myös toiveikkaassa tai iloisessa lauseessa. Koneäly todennäköisesti tulkitsisi lauseen surulliseksi tai turhautuneeksi pelkästään ”sota” -sanan perusteella.

Tähän mennessä olemme kattaneet teknisiä rajoituksia. Mutta kun puhutaan tunteista, emme voi unohtaa ihmisten tuomia rajoituksia. Ihmiset eivät pidä siitä, että heidän tunteitaan nimetään. Kuvittele kone, joka kertoisi sinulle: ”Näyttää siltä, että olet suuttumassa”. Tämä tekisi sinusta todennäköisesti vihaisemman.

Kun Honkela puhuu tunneanalysistä, hän puhuu oppimisesta. Opimme itsestämme ja reaktioistamme sekä siitä, millaisia reaktioita aiheutamme muille. Rauhanteknologian kannalta tämä on tunneanalyysin tärkein sovelluskohta. Reflektiotyökaluna.

Reflektio ei ole helppoa kenellekään. Se pakottaa ihmisen kyseenalaistamaan omat tunteensa ja päätöksensä. Siinä kone neutraalina osapuolena voisi auttaa. Siihe, jopa nykyisiä palveluita voisi hyvinkin soveltaa.

Miljoonan ihmisen kokous

Ajatuksena miljoonan ihmisen kokous on yksinkertainen. Poliittinen järjestelmämme pohjautuu harvojen ja valittujen mielipiteeseen. Jos ihmiset voisivat käydä keskusteluja pienissä ryhmissä, voisimme hyödyntää näitä keskusteluja kollektiivisen tiedon ja osaamisen keräämiseen.

Kone hakisi keskusteluista yhteisiä teemoja sekä mielipiteitä ja yrittäisi niiden pohjalta kerätä tiivistyksen keskustelusta. Kone voisi myös syöttää näitä tietoja takaisin keskusteluihin.

Kuinka mahdollinen tällainen idea on? Miljoonan ihmisen saaminen keskustelemaan samasta aiheesta on jo sinänsä haastavaa. Varsinkin, jos keskustelu tulisi käydä yhdellä ja samalla alustalla.

Kuulostaa vaikealta, mutta tätä tapahtuu joka päivä. Twitterin ja Facebookin eniten keskustellut aiheet keräävät miljoonia yhtäaikaisia keskusteluja ympäri maailman. Teknologia datan keräämiseen on siis olemassa.

Tarvitsemme tiedonlouhintaa, johon yleisesti viitataan myös suomeksi sen englanninkielisellä nimellä data mining. Se on yhdistelmä koneoppimista ja statistiikkaa, joiden avulla haetaan datamassoista tunnistettavia kaavoja.

Yksi esimerkki on etsiä keskustelumassoista eniten käytettyjä sanoja ja niiden yhteyksiä. Käsittelimme tensoreita merkitysneuvottelun yhteydessä. Puhumme jälleen aika samoista ideoista.

Sanojen ja niiden välisten yhteyksien kautta voisimme saada visualisoinnin, joka kertoo, mistä on keskusteltu. Tästä eteen päin tarvitaan ihmistä tekemään tarkempia tulkintoja keskustelun sisällöistä. Kone voi siis visualisoida keskustelua, muttei osaa muodostaa mielipiteitä tai ehdotuksia.

Toinen vaihtoehto olisi käyttää automaattista yhteenvetoa. Ongelmaksi muodostuisi kuitenkin todennäköisesti se, että sisältöä syntyy niin paljon, ettei kone kykenisi tiivistämään sitä järkevällä tavalla luettavaksi kokonaisuudeksi. Asiantuntija pystyisi todennäköisesti tulkitsemaan hyvin visualisoitua sisältöä tehokkaammin.

 

Yhteenveto

Timo Honkela kuvaa kirjassaan utopian. Rauhankone voi hyvinkin toimia tulevaisuudessa, mutta koneiden liittäminen osaksi ihmisten välistä keskustelua sisältää myös merkittäviä riskejä.

Tämän päivän koneäly toimii parhaiten rajatuissa ongelmissa. Jos voimme määritellä kysymyksen tarpeeksi tarkasti, koneäly tuottaa hyviä tuloksia. Yleisessä tapauksessa, ihminen on vielä konetta etevämpi.

Käytännön Rauhankone, osa 1: Koneälyä, lyhyesti.

Futuricen Rauhankone-hanke on tutkinut tekoälyä ja rauhaa eri kulmista. Rauhankoneen isä, professori Timo Honkela, on kuvaillut konseptiaan tulevaisuuden teknologiaksi. Joksikin, mitä ei tänä päivänä voida rakentaa. Me halusimme kuitenkin ymmärtää, kuinka lähelle voisimme päästä tämän päivän teknologialla.

Tämä blogiteksti on jaettu kahteen osaan. Tässä ensimmäisessä osassa käymme läpi lyhyesti koneälyn perusteet. Toisessa osassa syvennymme lähemmin Honkelan konsepteihin, ja arvioimme, mitä niistä voisimme toteuttaa.

Mitä koneäly on?

Koneäly (engl. artificial intelligence, AI) tarkoittaa koneiden tekemiä dataan perustuvia autonomisia päätöksiä. Data voi olla peräisin toisesta tietojärjestelmästä, ihmiskäyttäjältä tai sensoreilta, jotka tarkkailevat koneen fyysistä ympäristöä.

Usein ihmiset viittaavat koneälyyn algoritmeina, ja sanasta onkin muodostunut lähes synonyymi koneälylle. Mutta kaikki algoritmit eivät ole älykkäitä. Yleisesti ottaen algoritmi on vain perättäisiä ohjeita.

Kokeile: Käden heiluttaminen algoritmina.

  1. Nosta kätesi
  2. Siirrä kättä vasemmalle
  3. Siirrä kättä oikealle
  4. Toista kohdasta 2

Ollakseen älykäs, algoritmin pitää olla muutakin kuin samanlaisena toistuvat ohjeet. Algoritmin tulee tulkita ympäristöään, eli dataa, ja valita toimintansa sen perusteella.

Koneälyä voi lähestyä kahdella tapaa. Joko asettamalla sääntöjä, joiden mukaan tulkinta tehdään, tai opettamalla algoritmi aiemmin mitatun datan perusteella. Jälkimmäistä tapaa kutsutaan koneoppimiseksi (engl. mahcine learning, ML).

Jos esimerkiksi haluaisimme luoda järjestelmän, joka ennustaa lapsen silmien värin, voimme määritellä yksinkertaisen säännön: Jos molemmilla vanhemmilla on siniset silmät, lapsella on todennäköisesti myös siniset silmät. Muissa tapauksissa lapsella on todennäköisesti ruskeat silmät. (Toim. huom. Totuus ei ole aivan näin yksinkertainen.)

Jos taas käyttäisimme koneoppimista, tarvitsisimme joukon esimerkkejä vanhempien ja heidän lastensa silmien väreistä. Näiden esimerkkien pohjalta laskettaisiin todennäköisyydet lasten silmien värille perustuen vanhempien silmien väriin.

Lähestymistavan valinta

Molemmissa lähestymistavoissa on hyvät ja huonot puolensa. Jotkin ilmiöt ovat niin monimutkaisia, että niiden kuvaileminen pelkillä säännöillä on äärimmäisen vaikeaa tai mahdotonta. Puhuttu kieli on hyvä esimerkki tällaisesta ilmiöstä. Siksi luonnollisen kielen käsittely (engl. natural language processing, NLP) käyttääkin yleensä koneoppimista.

Toisaalta, koneoppiminen on kaikkea muuta kuin täydellistä. Tulokset ovat parhaimillaankin vain yhtä hyviä kuin opetusdata. Onko dataa riittävästi? Onko datassa jokin systemaattinen virhe? Mitä sensitiivisempää dataa järjestelmä käyttää, sitä tärkeämpää näiden kysymysten esittäminen on.

Otetaan esimerkiksi pankkijärjestelmä, joka määrittelee, myönnetäänkö hakijalle laina vai ei. Järjestelmä opetetaan aiemmilla lainapäätöksillä. Jos pankki on historiassaan myöntänyt lainoja harvemmin jollain tietyllä postinumeroalueella, algoritmi ei osaa tulkita, mistä ero johtuu. Se tekisi oletuksen, että postinumero on lainan kannalta olennainen tieto ja hylkäisi uudet hakemukset pelkän postinumeron perusteella.

Tällaiset vääristymät eivät ole ollenkaan harvinaisia koneoppimisjärjestelmissä.

Järjestelmien rakentajat vastaavat siitä, ettei tällaisia vääristymiä synny. Kun puhutaan rauhanteknologiasta, on äärimmäisen tärkeää, ettei ihmisiä jaotella epäoikeudenmukaisesti. Huono opetusdata voi johtaa tilanteeseen, jossa uusi järjestelmä vähentää rauhaa sen lisäämisen sijaan.

Koneälyn kaksi lähestymistapaa voidaan myös yhdistää. Sensitiivisen datan käsittelyyn voidaan valita sääntöpohjainen järjestelmän, joka yhdistetään epäsensitiivistä dataa tai monimutkaista ilmiötä kuvaavaan koneoppimisjärjestelmään. Lopputulos voi hyvin olla parempi kuin se, että käytettäisiin vain yhtä järjestelmää tai lähestymistapaa.

Esitä tarkkoja kysymyksiä, saadaksesi tuloksia

Koneälyutopiat voivat antaa ihmisille kuvan siitä, että koneäly olisi jo todella lähellä ihmisten älykkyyttä. Tämä on kaukana totuudesta. Tosiasassa koneäly toimii parhaiten (tai pelkästään) hyvin rajatuissa tehtävissä.

Koneet eivät toimi kuin ihmiset. Ihmisen aivot ovat erikoistuneet konsepteihin, jotka liittyvät toisiinsa. Koneet eivät ymmärrä konsepteja lainkaan. Koneet näkevät datapisteitä, kuten lukuja, kirjaimia tai lauseita. Kone voi tulkita datapisteiden yhteyksiä, muttei ymmärrä miksi yhteydet syntyvät.

Kun koneälyjärjestelmälle annetaan tarpeeksi dataa, se voi vastata kysymyksiin kuten ”Tyttö on kuningattarelle sama kuin mikä on kuninkaalle?” Järjestelmän pitäisi löytää yhteys datasta ja vastata ”Poika on kuninkaalle sama kuin tyttö on kuningattarelle”. Kone kuitenkin näkee vain sanoja, joita käytetään samalla tavalla. Ihminen puolestaan yhdistää sanat sukupuolen ja yhteiskunnallisen aseman perusteella.

 

Rauhankoneen kannalta on tärkeää ymmärtää, että koneälyyn on erilaisia lähestymistapoja, että koneäly pärjää parhaiten rajatuissa ympäristöissä, ja että koneen on helpompi nähdä tiedossa yksityiskohtia kuin kuvailla dataa yleisesti. Osassa 2 syvennymme tarkemmin Rauhankoneeseen, ja siihen, miten koneälyn teoria näyttäisi käytännössä.

Podcast: Koneiden opettaminen rauhanteknologiaan

Rauhankone-projektin Tuomas Paasonen ja Niina Mäki keskustelevat 17.5.2018 järjestetyn ”Teaching the machines” -workshopin tuloksista. Kuten aiemmassa blogikirjoituksessa Kuinka löytää luotettavaa tietoa myös tässä podcastissa puhuttavat datan laatu, luotettavuus ja eettisyys. Aiheessa päästään nyt syvemmälle ja pohdiskellaan seurauksia.

Tämä podcast on osa kolmen podcastin sarjaa, jonka aiemmat osat voit kuunnella täältä:
Podcast: Mitä on rauhanteknologia?
Podcast: Koneiden ja ihmisten välinen yhteistyö

Kuinka löytää luotettavaa tietoa?

Torstaina 17.5. projektimme sukelsi koneälyn maailmaan. Antti Rauhala Aito.ai:sta avasi workshopin kertomalla siitä, mitä koneäly oikeastaan on, ja miten sitä voidaan hyödyntää. Sen jälkeen ryhmät jatkoivat edellisen workshopin case-esimerkistä, Etelä-Sudanista.

Tiivistäen, Rauhala kertoi siitä, kuinka koneälyyn liittyy aina päätös. Järjestelmillä voidaan etsiä toistuvia asioita, tehdä ennusteita tai matkia asiantuntijaa, mutta loppujen lopuksi kyse on aina päätöksien tekemisestä. Ihminen kantaa vastuun päätöksestä, mutta se tehdään koneen tukemana.

Ryhmätyöosuus sisälsi kaksi esimerkki-ideaa kriisialueella käytettävästä koneälystä. Toinen oli varoitusjärjestelmä ja toinen järjestelmä, jolla voitaisiin kerätä ja esittää ajantasaista tietoa kriisialueista.

Esimerkkejä yhdisti dataan liittyvät kolme huolta:

1) Laadukasta dataa voi olla vaikea löytää jopa täydellisissä olosuhteissa. Puuttuvat tiedon palat ja epäyhtenäinen muoto voivat aiheuttaa ongelmia, joita on vaikea korjata.

2) Datan luotettavuus täytyy aina kyseenalaistaa kriisialueilla. Luotettavia lähteitä on yleensä vähän, jos lainkaan. Tietoisesti vääristetyn datan välttämiseksi, lähteet on valikoitava erityisen tarkasti.

3) Datan etiikka on trenditermi, mutta myös erittäin tärkeä keskustelunaihe. Mitä dataa käytetään? Kuinka yksityisyydestä huolehditaan? Nämä ovat kysymyksiä, joihin IT-alalla ei ole yhteisesti hyväksyttyjä vastauksia.

Aihe herätti paljon keskustelua. Konfliktialueilla mikään ei ole itsestäänselvää. Esimerkiksi muistiinpanot eivät ole niin yksinkertainen asia kuin jokapäiväisissä toimistopalavereissa. Joissain keskusteluissa jopa kynä ja paperi voivat olla kiellettyjä.

Paljon puhuttiin myös infrastruktuurin saatavuudesta. Jos rauhanteknologian ratkaisu rakennetaan esimerkiksi sille oletukselle, että sähkö on saatavilla, päädytään nopeasti tilanteeseen, jossa ratkaisu on käyttökelvoton.

Keskustelujen yhteenvedoista nousi kaksi ajatusta yli muiden.

Live-tilanteet seurantaan ideoitiin puhelinlinjaa, johon raportit voitaisiin sanella. Rauhanrakentajien paikallistieto eri keskusteluista siirtyy usein hitaasti muiden saataville. Koneet voisivat kerätä muistiinpanot puheluista, tehdä automaattiset lyhennykset ja jakaa ne niille, jotka tietoa tarvitsevat.

Teknologian näkökulmasta perinteisessä puhelinlinjassa on paljon etuja. Ensinnäkin, puhelimet ovat äärimmäisen luotettavia. Toki on tilanteita, kun edes lankapuhelin ei toimi, mutta on paljon todennäköisempää onnistua avaamaan puhelinyhteys kuin laadukas internet-yhteys. Toisaalta, tietoturvan kannalta puhelin toimii erinomaisena yksisuuntaisena kanavana tiedon syöttämiseen. Vastaanottava järjestelmä voidaan sulkea pois verkosta ja pääsy dataan rajoittaa vaikkapa vain sisäverkkoon.

Toinen löytö keskusteluista oli, ettei tiedon etsimisessä tarvitse rajoittua vain siihen tietoon, mitä meillä on saatavilla. Voimme hyvin seurata myös tietoa, joka puuttuu. Esimerkiksi voimme tunnistaa tiettyjä avainhenkilöitä, jotka ovat aktiivisia sosiaalisessa mediassa. Jos tällainen henkilö yllättäen lakkaa julkaisemasta, tai jos julkaisujen tyyli muuttuu, voimme päätellä, että jotain on tekeillä.

Kuten aina, molemmissa ideoissa tulee huomioida paikalliset erot, ja toteutukset saattavat näyttää erilaisilta konfliktista tai alueesta riippuen.

 

Laajempaa pohdintaa samasta aiheestaa löytyy myös täältä: Podcast: Koneiden opettaminen rauhanteknologiaan

Projektimme viimeinen tapahtuma järjestetään 31. toukokuuta. Testaamme silloin rauhanteknologiatyökaluja, joita olemme kehittäneet kevään aikana. Tulokset tulevat näkyville tähän blogiin workshopin jälkeen.

Podcast: Koneiden ja ihmisten välinen yhteistyö

Rauhankone-projektin Tuomas Paasonen ja Niina Mäki istuivat vielä alas ja kertasivat 19.4. järjestetyn Co-operating with machines -workshopin tuloksia. Mitkä ovat koneiden vahvuudet? Entä ihmisten? Miten rauhantyö voisi hyötyä eri vahvuuksista?

Aihetta käsitellään myös aiemmassa blogipostauksessa. Se löytyy nimellä Ihminen ja kone. Yhdessä.

Tämä podcast on osa sarjaa, jonka muut osat löydät täältä:
Podcast: Mitä on rauhanteknologia?
Podcast: Koneiden opettaminen rauhanteknologiaan

Podcast: Timo Honkelan haastattelu osa 2/2

Professori Timo Honkela on Rauhankone-kirjan kirjoittaja ja koko ajatuksen isä. Digitalents Helsingin Sampo Saikkonen istui hänen kanssaan alas keskustelemaan koneälystä ja sen mahdollisuuksista rauhan rakentamisessa.

Ja kun asiaa on paljon, materiaalia syntyy reilusti. Tässä tapauksessa noin kaksi ja puoli tuntia. Tiedon jakamisen hengessä päätimme laittaa haastattelusta puolitoista tuntisen version jakoon kahdessa kuuntelemisen mittaisessa jaksossa.

Jatka lukemista ”Podcast: Timo Honkelan haastattelu osa 2/2”

Ihminen ja kone. Yhdessä.

Lääkärin diagnoosi on yleensä melko tarkka. Koneen tekemä diagnoosi ei ole aivan niin tarkka. Mutta lääkärin ja koneen yhdessä tekemä diagnoosi on tarkempi kuin lääkärin yksin tekemä diagnoosi.

Tätä esimerkkiä käytti Futuricen Minna Mustakallio alustuksessaan ihmisten ja koneiden yhteistyötä käsittelevään workshoppiimme. Hänen pääviestinsä oli, että meillä, ihmisillä ja koneilla, on erilaiset vahvuudet ja heikkoudet. Siksi meidän ei pitäisi pelätä koneiden varastavan töitämme tai planeettaamme, vaan pohtia, miten voisimme rakentaa maailmaa yhdessä.

Jatka lukemista ”Ihminen ja kone. Yhdessä.”

Podcast: Timo Honkelan haastattelu 1/2

Professori Timo Honkela on Rauhankone-kirjan kirjoittaja ja koko ajatuksen isä. Digitalents Helsingin Sampo Saikkonen istui hänen kanssaan alas keskustelemaan koneälystä ja sen mahdollisuuksista rauhan rakentamisessa.

Ja kun asiaa on paljon, materiaalia syntyy reilusti. Tässä tapauksessa noin kaksi ja puoli tuntia. Tiedon jakamisen hengessä päätimme laittaa haastattelusta puolitoista tuntisen version jakoon kahdessa kuuntelemisen mittaisessa jaksossa.

Jatka lukemista ”Podcast: Timo Honkelan haastattelu 1/2”

Podcast: Mitä on rauhanteknologia?

Tässä podcastissa Rauhankone-hankkeen Tuomas Paasonen ja Niina Mäki kertaavat 23.3.2018 järjestetyn ”Mitä on rauhanteknologia?” -workshopin tuloksia ja keskusteluja.

Tuloksista löytyy myös blogimuotoinen kirjoitus: ”Rauhanteknologia on työkalu. Rauhan rakentavat ihmiset.”

Podcast on nauhoitettu 24.3.2018.

Tämä podcast on osa sarjaa, jonka muut osat löydät täältä:
Podcast: Koneiden ja ihmisten välinen yhteistyö
Podcast: Koneiden opettaminen rauhanteknologiaan