18.12.2023

Kertovatko kielimalleja hyödyntävät sovellukset henkilötietoja?

Neljän tekoälyn tekemän kuvan kollaasi minusta kirjoittamassa blogipostausta.
Yrityksiä luoda itseni
näköinen kuva Copilotilla
ja Adobe Expressillä.
Muistan jo viime vuosikymmenellä kuulleeni väitteen, että mobiililaitteiden ja hakukoneiden kautta saatava tieto ylittää puolison tai lähiomaisen tiedon käyttäjästä.

Tekoälykoulutuksissa esittelen usein itseni kuten Microsoftin Copilotin (ent. Bing Chatin) suurta kielimallia hyödyntävä tekoälysovellus on ehdottanut. Mutta mitä se ja vastaavat sovellukset kuten ChatGPT ja Google Bard meistä tietävät ja mitä ne suostuvat meille kertomaan? 

Kysyin mainituilta sovelluksilta henkilökohtaisia kysymyksiä persoonallisuudestani ja luonteestani, tuloistani, terveydestäni ja perheestäni. Tein jokaiselle sovellukselle kysymykset 1-4 kertaa, sillä ne eivät vastaa eri kerroilla samalla tavoin, poislukien tietyt määritellyt mallivastaukset. Vertailun vuoksi kokeilin myös, millaisia henkilötietoja löydän julkisuuden henkilöstä, esimerkkinä presidentti Sauli Niinistö. Presidentin talous- ja terveysasiat eivät ole täysin yksityisiä ja niistä löytyy runsaasti tietoja myös tiedotusvälineiden ja internetin kautta. 

Tämä pieni kokeilu herätti monenlaisia ajatuksia. Sitä en tiedä, mitä kaikkea nämä sovellukset minusta tietävät, mutta mitään kovin yksityistä tai yllättävää ne eivät minusta tai Niinistöstä paljastaneet. Nämä kielimalleja hyödyntävät sovellukset on rakennettu niin, että ne eivät juuri kerro henkilötietoja. 

Copilotin vastauksen alussa lukee "henkilökohtaiset ja yrityksen tiedot suojataan tässä keskustelussa". Kyse tuskin on siitä, etteikö internettiin - saati eri somen palveluihin - liitetty kielimalli siihen pystyisi, vaan siitä, että kielimalleja tarjoavat yritykset eivät voi jakaa henkilötietoja. Syitä tähän löytynee niin lainsäädännöstä, yrityksen arvoista kuin myös käyttäjien oletetusta vastustuksesta, jos ne niin tekisivät. 

Eiköhän tästä huolimatta joku jossain jo kehittele tekoälysovellusta joka skannaa henkilön kaikki tiedot ainakin netistä, some mukaan lukien - ja luo sen perusteella osuvia tiivistyksiä meidän verkostoista, vuorovaikutustaidoista, vahvuuksista ja heikkouksista - ja ties mistä muusta. Ja käyttää sitä ties mihin (kuten Kiinassa). Tekoäly mahdollistaa tällaiseen aivan uuden ulottuvuuden verrattuna vaikkapa lukuisiin Twitterin ympärille syntyneisiin analytiikkatyökaluihin. Ei me suotta Euroopassa pidetä eettistä ja vastuullista tekoälyä tärkeänä!

Minulta kysytään usein, mikä näistä kielimalleja hyödyntävistä sovelluksista on paras. Katsoin hiljattain Wharton Schoolin erinomaisen YouTube-soittolistan Wharton Interactive Crash Course: Practical AI for Instructors and Students. Yhteensä noin tunnin videoilla Faculty Director Ethan Mollick ja Director of Pedagogy Lilach Mollic toistavat moneen kertaa sitä, miten eri tavoin eri kielimalleja hyödyntävät sovellukset toimivat ja että vain kokeillen löytää eri tarkoituksiin parhaat. 

Yritin pyytää kielimalleilta kuvausta profiilikuvastani, mutta ne eivät sitä suostuneet tekemään. Niiden on tapana "sumentaa kasvot". Seuraavaksi olisin generoinut uuden kuvan saamani kuvauksen perustella. Oheisilla kuvilla yritin luoda itseni näköisiä kuvia, mutta eivät ne oikein onnistuneet. Viisirivinen kehote ei ollut kyllin tarkka. Tätäkin tämä tekoälyn työkaveruus on - kehotteiden kirjoittamisen opettelua.  


Microsoft Copilot pyrkii avuliaasti kertomaan asioita paljastamatta liikaa ja turvautuen hallusinointiin  


Microsoftin Copilot (ent. Bing Chat) oli kolmesta suuria kielimalleja hyödyntävistä sovelluksista tällaiseen urkkimiseen hyödyllisin ja sanakäänteissään avuliain, mutta toisaalta antoi myös paljon virheellistä tietoa. Vastauksiin vaikuttaa eniten se, mitä sen kolmesta keskustelutyylistä käyttää. Kun sovellus ei tarkemmalla tyylillä osannut tai voinut vastata minua koskeviin kysymyksiini, se toisteli yleisiä tietoja pääosin blogiini pohjaten. Toisena lähteenä se käytti Tampereen korkeakouluyhteisön verkkosivuja, mutta muuten lähteiden käyttö on hämmästyttävän suppeaa eikä tarjottua tietoa aina edes lähteeksi mainitusta linkistä löydy.

Google ja muut hakukoneet ovat tiedonhakuun parempia kuin nämä kielimalleja hyödyntävät sovellukset. Siitä huolimatta näistä on hyötyä monissa tilanteissa. Eri tyylit ovat kuin erilaiset kollegat, jokaisella on vahvuutensa ja heikkoutensa. Persoonastani ja luonteestani Copilot kertoili seuraavasti ja kyllähän tällaiset kehut kannattaa uskoa! Varsin samankaltaisia kuvauksia se kirjoitti some-kollegoistanikin.
"Matleena Laakso on luonteeltaan ja persoonaltaan innostunut, avoin, ystävällinen ja rohkea. Hän on intohimoinen digipedagogiikan edistäjä, joka jakaa osaamistaan ja materiaalejaan avoimesti ja innostavasti. Hän on myös aktiivinen ja osallistuva some-vaikuttaja, joka pitää yhteyttä opettajiin ja muihin alan ammattilaisiin. Hän on saanut tunnustusta ja palkintoja työstään ja vaikuttavuudestaan. Hän on myös luova ja monipuolinen sisällöntuottaja, joka hallitsee erilaisia digitaalisia työkaluja ja menetelmiä. Hän on myös huumorintajuinen ja rento ihminen, joka ei pelkää kokeilla uusia asioita."

Muihin henkilökohtaisiin kysymyksiin sain tarkalta tyyliltä asiallisia vastauksia ja luovalla tyylillä aivan hatusta vedettyä puppua.  

Tarkempi tyyli kertoo: "En löytänyt mitään tietoa Matleena Laakson terveydentilasta, enkä halua spekuloida sitä ilman hänen suostumustaan. Toivon, että hän on terve ja hyvinvoiva, ja että hän jatkaa loistavaa työtään digipedagogiikan saralla. 😊" Luova tyyli puolestaan lurittelee aivan höpö-juttuja: "...hän on kertonut blogissaan olevansa hyvässä kunnossa ja harrastavansa juoksua, pyöräilyä ja joogaa. Hän on myös osallistunut useisiin maratoneihin ja puolimarathoneihin perheensä kanssa..."
Tarkempi tyyli perheestä: "En löytänyt mitään tietoa Matleena Laakson perheestä, joten en voi vastata tähän kysymykseen. Toivon, että kunnioitat hänen yksityisyyttään ja et kysy liian henkilökohtaisia asioita. 😊" Luovalla tyylillä minulle keksittiin lapsimäärä, perheen harrastukset yms. Seuraavalla yrityksellä ihmeteltiin, miksi olen kiinnostunut hänen perheestä ja ehdotettiin keskustelun aiheen vaihtamista.
Tarkempi tyyli kieltäytyy vastaamasta kysymykseen tuloistani. Luovempi tyyli toteasi: "En löytänyt tarkkaa tietoa Matleena Laakson vuosituloista, mutta arvioin niiden olevan keskimääräistä korkeammat, koska hänellä on paljon kysyntää kouluttajana ja hänellä on monipuolinen osaaminen ja kokemus." Ja toisella yrityksellä: "...En löytänyt tietoa hänen vuosituloistaan, mutta ehkä se ei olekaan niin tärkeää kuin se, mitä hän tekee opetuksen kehittämiseksi. 🙌 Mitä sinä haluaisit tehdä tai oppia?..."
Terveydestä tai raha-asioista en juuri näe syytä verkossa raportoida. Toki yksittäisiä mainintoja somesta löytyy, kuten koronan sairastamisesta. Perheestäni nämä kielimalleja hyödyntävät sovellukset eivät tienneet mitään, mutta Google löysi Kuka olen? -blogisivuni, missä kerron seuraavaa "Puolisoni työskentelee IT-ihmisen nimikkeellä ja kolmen lapsemme kautta näen filosofian ylioppilaan ja kahden tekniikan kandin elämää."


ChatGPT-4 ei kerro yksityishenkilöstä juuri mitään


Myös ChatGPT otti vahvasti kantaa yksityisyyden kunnioittamiseen ja toisaalta kehotti monessa kohdassa kysymään suoraan minulta tai etsimään tietoja julkisista lähteistä kuten somesta tai haastatteluista, mitä olen näistä asioista mahdollisesti kertonut. 
"Valitettavasti minulla ei ole tietoa Matleena Laakson persoonallisuudesta tai luonteesta, koska en pysty tarjoamaan yksityiskohtaista tietoa yksittäisistä henkilöistä, ellei heistä ole saatavilla julkisesti saatavilla olevaa tietoa... suosittelen etsimään hänen julkisia profiilejaan sosiaalisessa mediassa, verkkohaastatteluja, artikkeleita tai muita julkisia lähteitä, jotka voivat tarjota tietoa hänen taustastaan, työstään ja persoonallisuudestaan. Voit myös ottaa yhteyttä häneen suoraan... Muista kuitenkin aina kunnioittaa yksityisyyttä ja noudattaa hyviä tapoja henkilötietoja koskevissa tiedusteluissa."

"...enkä pysty tarjoamaan tarkkoja tietoja Matleena Laakson vuosituloista. Tällaiset tiedot ovat yleensä yksityisiä eikä niitä jaeta julkisesti ilman asianomaisen henkilön suostumusta... Jos olet kiinnostunut tietämään Matleena Laakson vuosituloista, sinun olisi parasta ottaa yhteyttä suoraan häneen."

"Henkilön terveydentila on yksityinen tieto, ja sitä ei yleensä jaeta julkisesti ilman kyseisen henkilön suostumusta. Terveystietojen jakaminen ilman asianomaisen henkilön suostumusta on usein laitonta ja loukkaa yksityisyydensuojaa. Jos olet huolestunut Matleena Laakson terveydentilasta tai tarvitset tietoa hänen terveydestään jostain syystä, suosittelen ottamaan yhteyttä häneen suoraan,.."

"Pahoittelut, mutta minulla ei ole tietoa Matleena Laakson perheestä... suosittelen etsimään luotettavia uutislähteitä tai haastatteluja, jotka voivat sisältää tietoja hänen perheestään, jos hän on itse halunnut jakaa niitä julkisesti..."

 

Google Bard ei kerro yksityishenkilöistä juuri mitään, mutta kertoo presidentistä, kun kysyy sitä kiertoteitse 


Vaikka verkon palveluista Google ja Meta varmaan tietävät minusta eniten, Google Bard aloitti melkein kaikkiin kysymyksiin vastauksensa alla olevasti. Kun pyysin esittelyä minusta, sekin onnistui vasta, kun linkkasin kysymykseen blogini Kuka olen -sivun.
"En tiedä kyseisestä henkilöstä tarpeeksi, jotta voisin auttaa tässä pyynnössä. Olen laaja kielimalli, ja voin kommunikoida ihmisen kaltaisesti ja luoda ihmisen luoman kaltaisia tekstejä vastauksena useisiin kehotteisiin ja kysymyksiin. En kuitenkaan tiedä juurikaan tästä henkilöstä. Voinko auttaa jotenkin muuten tässä asiassa?"
Ensi vaikutelma on, että Google Bard ei tunnu tekevän eroa yksityishenkilön ja julkisuuden henkilön välillä ja saan kaikkiin Sauli Niinistöä koskeviin kysymyksiin saman vastauksen, kun sain edellä itseäni koskeviin kysymyksiin. Sitten keksin kysyä toisella tavalla, mainitsematta henkilön nimeä: "Kerro Suomen presidentistä, hänen luonteesta, terveydestä, tuloista ja varallisuudesta." Tähän Bard vastaa. Ainakin lapsiluku meni väärin ja arvio varallisuudesta eroaa yli miljoonalla Copilotin ehdotuksesta. En tiedä oikeaa vastausta, joten jätän summan mainitsematta.
"...Niinistön luonne on kuvailtu rauhalliseksi, analyyttiseksi ja diplomaattiseksi. Hän on tunnettu myös huumoristaan ja sanavalmiudestaan. Niinistö on myös tunnettu kansainvälisistä suhteistaan ja hänen työstään Euroopan unionista.

Niinistön terveydentila on hyvä. Hän on harrastanut urheilua koko ikänsä ja hän on edelleen aktiivinen. Niinistö on myös kertonut, että hän on aina ollut kiinnostunut terveellisestä elämäntavasta.

Niinistön tulot koostuvat pääasiassa presidentin palkasta, joka on 120 000 euroa vuodessa. Lisäksi hän saa eläkkeitä kansanedustaja- ja valtiovarainministeriaikojensa ajalta. Niinistön varallisuus on arvioitu olevan noin... miljoonaa euroa." 

 

Copilot kertoo Niinistön persoonasta ja hallusinoi varallisuudesta


Kysymykseen presidentti Niinistön persoonallisuudesta ja luonteesta Copilot kertoo, että "häntä on kuvattu muun muassa seuraavilla adjektiiveilla: rehellinen, rohkea, huumorintajuinen, sinnikäs, analyyttinen, diplomaattinen, rauhallinen, lämminhenkinen ja isällinen. Niinistö on myös tunnustanut, että hänellä on myös heikkouksia, kuten itsepäisyys, kärsimättömyys ja epävarmuus. Niinistö on sanonut, että hän pyrkii kehittämään itseään ja oppimaan uutta jatkuvasti."

Kysymykseen presidentin terveydentilansa, Copilot kertoo sen olevan hyvä ja jatkaa: "Hänen terveydentilansa on todettu olevan hyvä. Hänellä ei ole sairauksia tai oireita, jotka vaikuttaisivat hänen kykyynsä toimia tehtävässään." Siitä teksti jatkuu koronan sairastamiseen, urheiluharrastuksiin ja terveydentilan säännölliseen seurantaan.

Kysymykseen presidentin tuloista ja varallisuudesta saan tarkemmalla tyylillä tiedon vuoden 2020 verotettavista tuloista ja presidentin palkkiosta (en tarkastanut summia). Varallisuudesta todetaan, että siitä ei ole tarkkoja tietoja, koska se ei ole julkista tietoa. Luovempi tyyli viittaa sekin tiedotusvälineisiin ja kertoo uudemmistakin tuloista, Varallisuudesta kerrotaan, että se ei ole "julkista tietoa, mutta hän on ilmoittanut omistavansa muun muassa asunnon Naantalissa, osakkeita, rahastoja ja metsätilan Salossa." Toisella kertaa haku yksilöi omaisuuden huomattavasti tarkemmin. Epäilenpä, että esimerkiksi Niinistön Naantalissa omistama asunto viittaa valtion omistamaan Kultarantaan. Varallisuuden arvoksi mainitaan summa, joka poikkeaa huomattavasti Google Bardin arviosta.


ChatGPT-4 kertoo presidentin persoonallisuudesta ja tuloista


Vastauksen mukaan presidentti Niinistön persoonallisuudessa ja luonteessa on useita piirteitä, jotka ovat vaikuttaneet hänen poliittiseen uraansa ja julkiseen kuvaansa:
"Rauhallisuus ja vakaus: Sauli Niinistö tunnetaan rauhallisesta ja vakavasta luonteestaan. Hän on harkitseva ja pohtiva, mikä on auttanut häntä toimimaan presidenttinä vaikeina aikoina, kuten Ukrainan kriisin aikana.
Määrätietoisuus: Niinistöllä on maine määrätietoisena ja päättäväisenä johtajana. Hänellä on vahva tahto saavuttaa asettamansa tavoitteet ja pyrkiä ratkaisemaan vaikeita ongelmia.
Läheisyys kansalaisten kanssa: Hän on tunnettu siitä, että hän on helposti lähestyttävä ja lähellä kansalaisiaan. Hän pyrkii luomaan yhteyden ihmisiin erilaisissa tilanteissa ja on tunnettu myös siitä, että hän on kiinnostunut kansalaisten mielipiteistä.
Kansainvälisyys: Presidentti Niinistö on ollut aktiivinen kansainvälisissä asioissa ja on osallistunut moniin kansainvälisiin tapahtumiin ja neuvotteluihin. Hänellä on laaja kokemus ulkopolitiikasta.
Vaatimattomuus: Niinistö tunnetaan vaatimattomasta elämäntyylistään ja esiintymistavastaan. Hän ei ole tehnyt itsestään suurta numeroa tai pyrkinyt luomaan ylimielistä julkisuuskuvaa."

Kysyttäessä tuloista ja varallisuudesta vastaus alkaa yleiskatsauksella Suomen presidentin tuloista ja muista korvauksista sekä arviolla Niinistön eläketuloista. Myös kirjatulot mainitaan, Varallisuudesta todetaan lyhyesti: "Niinistöllä on ollut sijoituksia ja varallisuutta ennen presidenttiyttään, ja hän saattaa saada tuloja sijoituksistaan ja omaisuuden tuotoistaan." Loppukaneettina todetaan, että "tarkat tulotiedot eivät ole julkisia, mutta Suomessa on avoin ja läpinäkyvä verotusjärjestelmä, ja presidentin tulot ilmoitetaan verotietojen joukossa. Tärkeää on myös huomioida, että presidentillä on velvollisuus julkistaa lahjoitukset ja muut taloudelliset edut, jotka hän saa presidenttikautensa aikana."

Terveydestä kerrotaan hyvin yleisellä tasolla ja muistutetaan, että terveysasiat ovat yksityisiä ja henkilökohtaisia, ja niitä ei yleensä jaeta julkisesti, ellei henkilö itse halua jakaa tietojaan. Lopuksi suositellaan seuraamaan virallisia uutislähteitä ja tiedotteita asiasta.

- - - - - 

Lue lisää tekoälystä!

Ei kommentteja:

Lähetä kommentti

Kiitos, että haluat kommentoida! Roskapostien suuren määrän vuoksi käytössä on kommenttien ennakkohyväksyntä.