Az adattárház a tények és információk központi tárháza, amely különböző belső és külső rendszerekből származó historikus és kumulatív adatokat gyűjt és tárol. Az adattárház olyan technológiák kombinációjából áll, amelyek lehetővé teszik a felhasználók számára, hogy a szétszórt, nyers adatokat használható információvá alakítsák, az igazság egyetlen verzióját kapják meg, és javítsák a teljes döntéshozatali folyamatot.
Az adattárház fő célja, hogy hatalmas mennyiségű adatot tároljon lekérdezések és elemzések céljából. Megkönnyíti az elemzési és jelentési folyamatokat, amelyek segítségével a felhasználók adatokkal alátámasztott rutinszerű és stratégiai üzleti döntéseket hozhatnak.
Az adattárház architektúra
Az adattárház több összetevőből áll. A különböző operatív rendszerekből származó adatokat kivonják, átalakítják és betöltik az előkészítő területre, ahol az adatok szabványosításon és profilozáson esnek át. Az integrációs rétegben a “megtisztított” adatokat egységes formába integrálják, és tárolásra elküldik az adattárházba. Az analitikus feldolgozás révén az adatokat részhalmazokra szegmentálják, és az egyes felhasználók által jelentéskészítés céljából igényelt információk alapján különböző adatmárkákba továbbítják.
Az adatbázis és az adattárház közötti különbség
Az adattárházat gyakran összekeverik az adatbázissal. Lényegében egy tranzakciós rendszer, az adatbázis valós időben felügyeli és frissíti az adatokat, és a felhasználók számára az adatok legfrissebb verzióját biztosítja. Ezzel szemben az adattárház olyan összesített strukturált adatokból áll, amelyeket az ETL (extract, transform, and load) folyamat segítségével nyernek ki. Az adatbázissal ellentétben az adatok nem az adattárházból származnak, hanem különböző információs és irányítási rendszerekből származnak.
Az adattárházi környezet egy relációs adatbázisból, egy ETL-megoldásból, egy OLAP-motorból és egy adatelemző eszközből áll, valamint egyéb alkalmazásokból, amelyeket az adatok gyűjtésére és az üzleti felhasználók számára hasznos információk szolgáltatására használnak.
Az adattárház jelentősége
A szervezetekben az adatok számos belső és külső rendszerben szétszóródnak, amelyek különböző formátumú, irányultságú és fájltípusú információkat tartalmaznak. Ráadásul e rendszerek némelyike hasonló adattartalmat hordoz, ami duplikációt okoz, ami következetlenségeket okozhat az elemzési és jelentési folyamatokban.
A döntéshozóknak pontos, egyetlen, redundanciák nélküli információváltozatra van szükségük az üzleti tényezők, a piaci feltételek, a fogyasztói magatartás és egyéb szempontok felméréséhez. A vállalati ügyfelek teljes listájától a tranzakciók részleteit tartalmazó havi legmagasabb eladásszámig a felhasználók minden szinten szerezhetnek információt.
Az adattárházak célja a teljes, jól definiált jelentések előállítása, amelyek magas szintű pontosságot biztosítanak. Ez lehetővé teszi az üzleti vezetők és az elemzők számára, hogy olyan konkrét részletekbe fúródjanak bele, amelyeket az egyes adatbázisokban tárolt információk darabkáin keresztül esetleg nem értenének meg. Ezenkívül segít az adatbányászat elvégzésében a jelenlegi és a múltbeli trendeken a fontos minták azonosítása és a prediktív elemzéshez szükséges értelmes meglátások kinyerése érdekében.
Az adattárházak növelik a viszonylag kisebb adatmennyiségek kezelésére tervezett operatív rendszerek és adatbázisok teljesítményét azáltal, hogy leveszik róluk a tárolás és a hozzáférhetőség terhét. A szervezetek általában több millió rekordot halmoznak fel az idők során, amelyek terabájt vagy petabájt méretűek lehetnek. Egy adattárház segítségével az összes adat könnyen tárolható anélkül, hogy az egyes rendszereket terhelné.
Végezetül, az adattárház megléte elengedhetetlen az üzleti intelligencia (BI) erejének kiaknázásához. A profilozott, tisztított és minőségbiztosítási szempontból ellenőrzött adatokat a BI-eszközökbe táplálják, hogy analitikát és a tények és számok vizuális megjelenítését biztosítsák a megalapozott döntések meghozatalához. Emellett a felhasználók összehasonlíthatják az adatokat meghatározott időkeretekben, hogy a fogyasztói piac és az ipar trendelemzését elvégezhessék.