Datatiede

erilaisten aineistojen analysointimenetelmiä käsittelevä tieteenala

Datatiede (engl. data science) on erilaisten aineistojen analysointimenetelmiä käsittelevä tieteenala.[1] Datatiede yhdistää ongelman määrittelyn, algoritmien ja prosessien joukon, jolla voidaan analysoida aineistoa käytännöllisten näkemysten eristämiseksi suurista aineistojoukoista. Datatiede käsittelee sekä rakenteellista että rakenteetonta aineistoa ja omaksuu periaatteita monilta aloilta kuten koneoppimisesta, tilastotieteestä, dataetiikasta ja -sääntelystä ja suurteholaskennasta.[2]

Helsingin yliopistossa on datatieteen maisteriohjelma.[3]

Datatieteen käyttökohteisiin kuuluu sen selvittäminen, voiko ongelmaan vastata olemassa olevalla tiedolla, eikä se kohdistu niinkään tiedon määrään tai käytettäviin työkaluihin.[4] Eräät suosituimmat datatieteen menetelmät tulevat koneoppimisesta.[5]

Datatiede ei ole sama kuin informaatiotutkimus.

Tutkimusala

Datatiede käsittää joukon periaatteita, ongelman määrittelyjä ja prosesseja, joilla eristetään ilmeisistä poikkeavia ja hyödyllisiä hahmoja suurista tietoaineistoista. Datatiede liittyy läheisesti tiedonlouhintaan ja koneoppimiseen, mutta on näitä laajempi. Datatieteen tavoite on parantaa päätöksentekoa perustamalla päätökset suurista tietoaineistoista eristettyihin näkemyksiin.[6]

Lähteet

  • Kelleher, John D. & Tierney, Brendan (suom. Pietiläinen, Kimmo): Datascience (suom. Datatiede), s. 7. Terra Cognita, 2018 (2021). ISBN 978-952-7367-11-7.

Viitteet

Aiheesta muualla

Commons
Wikimedia Commonsissa on kuvia tai muita tiedostoja aiheesta Datatiede.
🔥 Top keywords: