Data liikkuu digipalveluiden kulisseissa – nuorten tietoisuutta kasvattamassa
Elämme näkökulmasta riippuen informaatio- tai tietoyhteiskunnassa – informaatiota meillä on paljon, mutta aina sitä ei onnistuta jalostamaan inhimillisesti arvokkaaksi tiedoksi. Oheisessa klassisessa mallissa informaation, tiedon ja viisaudenkin kivijalkana toimii data, joka koostuu lopulta digitaalisessa muodossa olevista merkkien ja symboleiden jonoista. Esimerkiksi työsuoritteet, puhelimen sijaintitiedot, sosiaalisen median tykkäykset ja älysormukset tuottavat jatkuvasti dataa, josta yksilöt ja yritykset ovat eri tavoin kiinnostuneita.
Data on paitsi tiedon pyramidin kivijalka, myös monen mediakasvatuksen ilmiön ytimessä. Nuorten on entistä tärkeämpää oppia ymmärtämään sitä, miten ja miksi meitä koskevaa dataa kerätään ja miten dataa käytetään tekoälyn kouluttamiseen. Toisaalta tulee ymmärtää, miten tätä dataa voi suojata ja hyödyntää myös itse.
Somen algoritmit ja tekoälyn koulutusdata
Sosiaalisen median algoritmit suosittelevat käyttäjilleen sisältöä heidän klikkauksistaan ja muusta toiminnastaan kerätyn datan perusteella. Maailman arvokkaimpien yhtiöitä ei suotta kutsuta datajäteksi, sillä niiden liiketoiminta perustuu pitkälti käyttäjistä kerättyyn dataan. Sitran (2021) Digiprofiilitestin tulosten mukaan nuoret ovat olleet muita ikäryhmiä tietämättömämpiä siitä, miten verkkopalvelut keräävät dataa ja käyttävät sitä.
Generatiivisen tekoäly muodostaa vastauksensa sille syötetyn koulutusdatan pohjalta, joka sisältää käytännössä valtavan määrän netissä julkaistua sisältöä. Tämä aineisto on valikoitunut tai vinoutunut vastaamaan niitä ajatuksia ja representaatioita, joita ihmiset ovat netissä julkaisseet. Koulutusdatan yksipuolisuus voi nousta esiin esimerkiksi silloin, jos pyytää tekoälyltä kuvia pankkiirista tai opettajasta, ja saa tulokseksi yleisiä sukupuolistereotypioita sisältäviä kuvia. Teemaa käsitellään mm. Mediakasvatusseuran Miltä näytän -oppimateriaalissa.
Tekoälyn koulutusdatan laatu heijastuu aina myös lopputuotoksiin, ja siksi dataymmärrys on avain tekoälyn ymmärtämiseen. Kuten Generation AI -hankkeen opetusvideolla Mitä tekoäly on? todetaan: ”Vaikka tekoälyn toimintaa voi olla vaikeaa ymmärtää, on helppoa ymmärtää, mihin sen toiminta perustuu: dataan.”
Henkilötieto ja sen suojaaminen
Iso osa arvokkaasta datasta on henkilötietoa eli tietoa, jonka pohjalta henkilö voidaan tunnistaa. Henkilötieto on kaupallisesti kiinnostavaa, koska se mahdollistaa henkilön profiloinnin ja tähän profiiliin sopivien sisältöjen, palveluiden tai tuotteiden suosittelun.
Jokaisella on lainsäädännöllinen oikeus henkilötietojensa suojaan eli tietosuojaan ja siksi verkkopalveluiden on noudatettava tiettyjä pelisääntöjä henkilötietojen käsittelyssä. Omia ja kavereiden henkilötietoja voi suojata myös itse kiinnittämällä huomiota siihen, miten niitä jakaa ja pohtimalla, minkälaisia palveluita ylipäätään ottaa käyttöön. Jos palveluiden keräämä henkilödata alkaa mietityttämään jälkikäteen, voi hyödyntää EU:n tietosuojalainsäädännön turvaamia oikeuksia ja pyytää palvelua esimerkiksi poistamaan omat henkilötiedot.
Tietosuojavaltuutetun toimiston ja TIEKEn GDPR4CHLDRN-hankkeessa (2022– 2024) kehitetyltä tietosuojaharrastuksissa.fi -sivustolta löydät lapsille ja nuorille sekä vanhemmille suunnatut oppaat tietosuojasta. Voit myös testata oman tietosuojaosaamisensa ja saada suosituksia sen kehittämiseen.
Nuorten dataymmärrystä kasvattamassa
TIEKEn DatatAitaja-hankkeessa (2024) on lisätty nuorten ymmärrystä neljästä teemasta:
tietosuojasta, tietoturvasta, tekoälystä ja algoritmeista. Hanke on Microsoftin rahoittama.
- TIEKEn Instagramista löydät paljon nuorille suunnattuja vinkkejä ja vaikuttajien kanssa yhteistyössä tuotettuja sisältöjä.
- Hankkeen työpajoissa nuoret ovat mm. harjoitelleet omien kuvia luokittelevien tekoälysovellusten luomista Generation AI -materiaalien pohjalta.
Teksti: Mikko Eloholma. Kirjoittaja toimii TIEKEllä digiosaamisen vauhdittajana ja DatatAItaja-hankkeen projektipäällikkönä.
Kuva: Pexels