Tietovarasto on tosiseikkojen ja tietojen keskitetty tietovarasto, joka hankkii ja ylläpitää historiallisia ja kumulatiivisia tietoja eri sisäisistä ja ulkoisista järjestelmistä. Tietovarastointi koostuu yhdistelmästä teknologioita, joiden avulla käyttäjät voivat muuntaa hajallaan olevat, raa’at tiedot käyttökelpoisiksi tiedoiksi, saada yhden version totuudesta ja parantaa yleistä päätöksentekoprosessia.
Tietovaraston päätarkoitus on tallentaa valtavia tietomääriä kyselyjä ja analyysejä varten. Se helpottaa analyysi- ja raportointiprosesseja, jotka auttavat käyttäjiä tekemään tietoon perustuvia rutiini- ja strategisia liiketoimintapäätöksiä.
Datavaratalon arkkitehtuuri
Tietovarasto koostuu useista komponenteista. Tiedot eri operatiivisista järjestelmistä poimitaan, muunnetaan ja ladataan välivarastoon, jossa tiedot standardoidaan ja profiloidaan. Integrointikerroksessa ”puhdistetut” tiedot integroidaan yhtenäiseen muotoon ja lähetetään tietovarastoon tallennettavaksi. Analyyttisen käsittelyn avulla tiedot segmentoidaan osajoukkoihin ja siirretään erilaisiin data marteihin tiettyjen käyttäjien raportointitarkoituksiin tarvitsemien tietojen perusteella.
Tietokannan ja tietovaraston ero
Tietovarasto sekoitetaan usein tietokantaan. Pohjimmiltaan transaktiojärjestelmä, tietokanta valvoo ja päivittää tietoja reaaliaikaisesti ja tarjoaa käyttäjille uusimman version tiedoista. Sen sijaan tietovarasto koostuu aggregoidusta strukturoidusta datasta, joka on poimittu ETL-prosessin (extract, transform, load) avulla. Toisin kuin tietokannassa, tiedot eivät ole peräisin tietovarastosta, vaan ne hankitaan eri tieto- ja hallintajärjestelmistä.
Tietovarastoympäristö koostuu relaatiotietokannasta, ETL-ratkaisusta, OLAP-moottorista ja data-analyysityökalusta sekä muista sovelluksista, joita käytetään tietojen keräämiseen ja hyödyllisten oivallusten tuottamiseen liiketoiminnan käyttäjille.
Tietovaraston merkitys
Organisaatioissa tieto on hajautettu erilaisiin sisäisiin ja ulkoisiin järjestelmiin, jotka sisältävät tietoa eri muodoissa, suunnissa ja tiedostotyypeissä. Lisäksi jotkin näistä järjestelmistä sisältävät samankaltaista tietosisältöä, mikä aiheuttaa päällekkäisyyksiä, jotka voivat aiheuttaa epäjohdonmukaisuuksia analytiikka- ja raportointiprosesseissa.
Päätöksentekijät tarvitsevat täsmällisen, yhden ainoan tietoversion ilman päällekkäisyyksiä, jotta he voivat arvioida liiketoimintatekijöitä, markkinaolosuhteita, kuluttajakäyttäytymistä ja muita seikkoja. Käyttäjät voivat hankkia tietoa kaikilla tasoilla aina täydellisestä yritysasiakkaiden luettelosta kuukauden suurimpaan myyntimäärään ja transaktioiden yksityiskohtiin.
Tietovarastoinnin tavoitteena on tuottaa täydellisiä, tarkkaan määriteltyjä raportteja, jotka takaavat korkean tarkkuuden tason. Näin yritysjohtajat ja analyytikot voivat syventyä tiettyihin yksityiskohtiin, joita he eivät ehkä pysty ymmärtämään yksittäisiin tietokantoihin tallennettujen tietojen palasten avulla. Lisäksi se auttaa suorittamaan tiedonlouhintaa nykyisistä ja historiallisista trendeistä tärkeiden mallien tunnistamiseksi ja älykkäiden oivallusten poimimiseksi ennakoivaa analytiikkaa varten.
Tietovarastot parantavat operatiivisten järjestelmien ja tietokantojen suorituskykyä, jotka on suunniteltu käsittelemään suhteellisen pienempiä tietomääriä, ottamalla niistä pois tallennukseen ja saatavuuteen liittyvää kuormaa. Yleensä organisaatioilla on miljoonia tietueita, jotka ovat kertyneet ajan mittaan ja jotka voivat olla teratavun tai petatavun kokoisia. Tietovaraston avulla kaikki tiedot voidaan helposti tallentaa kuormittamatta yksittäisiä järjestelmiä.
Loppujen lopuksi tietovarasto on välttämätön, jotta voidaan hyödyntää liiketoimintatiedustelun (Business Intelligence, BI) mahdollisuuksia. Tiedot, jotka on profiloitu, puhdistettu ja tarkistettu laadunvarmistusta varten, syötetään BI-työkaluihin, jotta voidaan tarjota analytiikkaa ja faktojen ja lukujen visuaalista esittämistä perusteltujen päätösten tekemistä varten. Lisäksi käyttäjät voivat vertailla tietoja tietyillä aikaväleillä suorittaakseen kuluttajamarkkinoiden ja toimialan trendianalyysin.