În timp ce mass-media dezbate dacă datele sunt sau nu noul petrol, un lucru este clar: ca și petrolul, datele au nevoie de multă procesare. De la Facebook la startup-uri în creștere, orice organizație de succes care gestionează un volum tot mai mare de date, trebuie să fie capabilă să organizeze, să acceseze, să securizeze și să proceseze datele pentru a le converti în perspective și decizii.
Există multe instrumente și furnizori de luat în considerare, în special în ceea ce privește nevoile afacerii și sarcina în cauză. Cu toate acestea, indiferent de sarcină, obiectivul este de a găsi în cele din urmă un produs de gestionare a datelor pentru a face datele cât mai utile posibil, minimizând în același timp costurile, riscurile și consumul de resurse.
Aceasta este o listă de software de gestionare a datelor, însă nu este exhaustivă. Am pregătit o listă actualizată în mod regulat, cuprinzătoare, care poate fi sortată/filtrată, a principalilor furnizori de software de gestionare a datelor, nu ezitați să o consultați.
- Software de gestionare a datelor
- Software de gestionare a datelor cu sursă deschisă
- Arhitectura datelor și proiectarea modelului de date
- Managementul datelor de referință și al datelor principale
- Managementul bazelor de date
- Managementul documentelor, înregistrărilor, conținutului
- Managementul metadatelor
- Managementul calității datelor
- Managementul depozitelor de date și al BI
- Analiza datelor
Software de gestionare a datelor
Gestionarea datelor este o disciplină vastă, cu multe focare și instrumente diferite pentru a gestiona aceste focare. Software-ul de gestionare a datelor (DMS) fuzionează înregistrările din mai multe baze de date, extrage, filtrează, rezumă datele fără pierderi de integritate și interferențe.
Câțiva vânzători și softuri conțin mai multe funcționalități și pot elimina necesitatea unui instrument dedicat. Dacă sunteți în căutare de mai multe informații despre gestionarea datelor, nu uitați să consultați postarea noastră de pe blog pe această temă.
Puteți structura software-ul de gestionare a datelor în jurul acestor subiecte
- Software de gestionare a datelor cu sursă deschisă: Există numeroase instrumente de gestionare a datelor open source care servesc o varietate de funcții de mai jos.
- Proiectarea datelor:
- Software de proiectare a arhitecturii de date și a modelului de date: În primul rând, companiile trebuie să își modeleze structurile de date
- Managementul datelor principale și de referință: Acestea sunt fundamentele celor mai bune practici de gestionare a bazelor de date și ajută organizațiile să își gestioneze datele în diferite unități de afaceri
- Managementul bazelor de date: Aceste structuri de date modelate trebuie să fie create în baze de date
- Colectarea și analiza documentelor: Documentele și alte conținuturi nestructurate reprezintă o provocare în special pentru bazele de date tradiționale. Diverse soluții de colectare a documentelor facilitează gestionarea conținutului nestructurat
- Gestionarea metadatelor: Metadatele sunt valoroase, deoarece cele mai simple câmpuri de metadate, cum ar fi orele de actualizare și de creare, permit companiilor să identifice problemele din datele lor și să analizeze procesele de creare și actualizare a datelor
- Managementul calității datelor: Odată ce începe federația de date (colectarea), calitatea datelor trebuie monitorizată și există numeroase soluții pentru a măsura și a crește calitatea datelor
- Analiza datelor: În cele din urmă, numeroase soluții de complexitate diferită permit companiilor să analizeze aceste date
Software de gestionare a datelor cu sursă deschisă
Înainte de a clasifica instrumentele de gestionare a datelor pe baza caracteristicilor lor, ne-am gândit că ați putea prefera soluțiile cu sursă deschisă pentru transparența lor și pentru lipsa taxelor de licențiere. Prin urmare, vom începe cu tabelul de gestionare a datelor open source:
Nume | Fondat | Status | Note |
---|---|---|---|
Airtable | 2012 | Privat | -Airtable este un software de baze de date bazat pe cloud Planul gratuit oferă tabele de date nelimitate, 1.200 de înregistrări pe bază, 2 GB de spațiu de atașare a fișierelor pe bază și până la 2 săptămâni de istoric al revizuirilor și instantaneelor. |
GraphDB-Ontotext | 2000 | Private | -GraphDB este o bază de date grafice care oferă implementare în cloud și la fața locului. |
MariaDB | 2009 | Private | MariaDB acoperă caracteristici similare cu MySQL, cu unele extensii adăugate. -Fortune 500 companii care folosesc MariaDB: Deutsche Bank, DBS Bank, Nasdaq, Red Hat, ServiceNow, Verizon și Walgreens |
Cubrid | 2008 | Private | CUBRID este un SGBD open source optimizat pentru OLTP. |
FirebirdSQL | 2005 | Private | -CouchDB este o bază de date de documente online și o soluție de stocare pentru întreprinderi. Unitatea oferă o semantică ACID prin controlul simultaneității cu mai multe versiuni. |
Arhitectura datelor și proiectarea modelului de date
Arhitectura datelor reprezintă modelele, politicile sau regulile care guvernează ce date sunt colectate, cum sunt stocate și cum sunt utilizate. Ea se împarte apoi în arhitectură de întreprindere sau arhitectură de soluții.
Modelarea datelor definește și analizează cerințele de date necesare pentru procesele de afaceri din cadrul sistemelor informatice. Există trei tipuri diferite de modele de date produse, care progresează de la modelul conceptual, la modelul logic de date și, în final, se ajunge la modelul fizic de date.
Toate aceste categorii ajută la organizarea și cartografierea datelor, îmbunătățind fiabilitatea și, de asemenea, transparența acestora în cadrul unei organizații.
Câteva instrumente utile legate de aceste produse includ:
Nume | Fondat | Statut | Note | |
---|---|---|---|---|
Idera | 2004 | Privat | Modelarea datelor -Gestionarea bazelor de date pentru a reduce redundanța |
|
Teradata | 1979 | Public | -Big Data architecture that can be built from multiple data platforms | |
Looker | 2011 | Private | -Analiza datelor fără SQL | |
Tableau | 2003 | Public | -Analiză rapidă ad hoc fără programare -Actualizări automate sau conexiune live |
Managementul datelor de referință și al datelor principale
Datele de referință sunt un subset de date principale care pot fi utilizate pentru clasificare în cadrul unei organizații. Unele dintre cele mai comune date de referință includ codurile poștale, moneda, codurile și alte clasificări – dar pot fi, de asemenea, date „agreate” în cadrul unei organizații. Gestionarea acestui tip de date este importantă, deoarece deseori servește ca referință pentru un număr de sisteme.
Există o serie de instrumente disponibile pentru a ajuta la gestionarea datelor de referință, iată câteva:
Nume | Fondat | Statut | Note |
---|---|---|---|
ASG metaRDM | 1986 | Privat | -.Accent pe suportul de conformitate |
Collibra Reference Data Accelerator | 2008 | Private | -Dezvoltare și implementare ușoară |
Informatica Cloud -. MDM Reference 360 | 1993 | Public | -Utilizează fundația INFA Cloud MDM |
Kalido by Magnitude Reference Data Management | 2014 | Private | -.Motor de flux de lucru încorporat pentru administrare și guvernanță |
Master Data Management (MDM) este o metodă cuprinzătoare de definire și gestionare a datelor esențiale ale unei organizații pentru a oferi un punct de referință. Software-ul pentru acest domeniu sprijină identificarea, corelarea și sincronizarea informațiilor despre clienți din surse de date disparate. Aceste informații sunt utilizate pentru a sprijini o serie de inițiative legate de administrarea și guvernanța datelor.
Câteva instrumente și furnizori de MDM populare includ:
Nume | Fondat | Statut | Note | |
---|---|---|---|---|
Orchestra Networks EBX | 2000 | Privat | Include funcționalități pentru date principale, meta, și date de referință | |
Dell Boomi | 1984 | Public | Funcționalități precum „Boomi Suggest” și „Boomi Assure” pentru a ajuta la dezvoltare și testare | |
Stibo Systems | 1976 | Private | Private | …Accent pe MDM multidomeniu |
Profisee | 2007 | Private | Soluții construite de industrie |
Pentru a învăța peste 100 de furnizori și instrumente de management al datelor master, nu ezitați să consultați lista noastră ordonabilă și transparentă de furnizori, în care am sortat furnizorii în funcție de popularitate, maturitatea afacerii și satisfacția utilizatorilor.
Managementul bazelor de date
Managementul bazelor de date are o varietate de obiective care variază de la performanță, la stocare, la securitate și multe altele. Instrumentele urmăresc să controleze datele pe parcursul întregului ciclu de viață al acestora, ceea ce duce la o mai bună inteligență de afaceri și la o mai bună luare a deciziilor.
Câteva sarcini generale care ar trebui îndeplinite cu ajutorul unui software de gestionare a bazelor de date potrivit includ:
- Tuningul aplicației
- Testarea timpului de răspuns
- Testarea randamentului
- Managementul performanței
Este important să se țină cont de diferența dintre SGBD și SGBD. SGBD este un termen general pentru diferite tipuri de tehnologii de gestionare a bazelor de date care au fost dezvoltate în ultimii 50 de ani. În anii 1970, s-a născut sistemul de gestionare a bazelor de date relaționale (RDBMS), care a devenit rapid tehnologia dominantă în domeniu. Cel mai important factor al RDBMS este structura tabelară bazată pe rânduri, care poate conecta elemente de date conexe, ceea ce se realizează prin normalizarea bazei de date. Începând cu anii 2000, bazele de date non-relaționale sau no-SQL, cum ar fi MongoDB, au început să câștige popularitate, dar bazele de date relaționale sunt încă importante pentru stocarea datelor structurate.
Câțiva furnizori care lucrează în cadrul acestei discipline includ:
Nume | Fondat | Statut | Note |
---|---|---|---|
Oracle Enterprise Manager | 1977 | Public | Capacități de autogestiune încorporate în nucleul bazei de date -Pentru Linux, Windows, Solaris, IBM AIX, UP-UX |
IBM DB2 | 1983 | Public | Pentru Linux, Unix, și Windows -Compatibilitate SQL |
MongoDB | 2007 | Public | Funcționează cu AWS, Azure și Google Cloud -Dispune de mai multe versiuni: Enterprise Advanced, Stitch, Atlas, Cloud Manager |
Managementul documentelor, înregistrărilor, conținutului
Managementul conținutului întreprinderii, denumit uneori managementul documentelor, este procesul de stocare, gestionare și monitorizare a documentelor din activitățile zilnice de afaceri.
Câteva funcționalități generale pe care orice soluție ar trebui să le includă sunt:
- Scaner de documente pentru a face copii digitale ale textelor pe hârtie
- Recunoașterea optică a caracterelor (OCK) pentru a converti documentele scanate
- Acces bazat pe utilizator
- Asamblare de documente pentru a crea cu ajutorul unui cabinet și…structură de dosare
- Convertor PDF
- Stocarea și salvarea documentelor
- Opțiuni de integrare
- Instrumente de colaborare și control al versiunilor
.
Managementul metadatelor
Managementul metadatelor este administrarea datelor care descriu alte date. Aceasta presupune, de asemenea, procese pentru a se asigura că datele pot fi integrate și utilizate în întreaga organizație. Este important pentru menținerea consecvenței definițiilor, a clarității relațiilor și a filiației datelor.
Câteva sarcini comune asociate cu gestionarea metadatelor care ar trebui îndeplinite cu orice software sau instrument includ:
- Rezervații de metadate pentru documentare și gestionare și pentru a efectua analize
- Liniația datelor pentru a specifica originea datelor și unde s-au mutat în timp
- Glosar de afaceri pentru a comunica și reglementa termenii cheie
- Gestionarea regulilor pentru a automatiza aplicarea regulilor de afaceri
Analiză de impact care să detalieze orice dependență a informațiilor
Nume | Fondată | Status | Note |
---|---|---|---|
Adaptive Metadata Manager | 1997 | Private | …Peste 20 de ani de experiență cu o serie de parteneriate |
Data Advantage Group | 1999 | Private | Cunoscut pentru ușurința implementării |
Informatica Metadata Manager | 1993 | Public | –Concentrare pe guvernanța și analiza informațiilor |
Smartlogic Semaphore | 2005 | Privat | -Captură metadatele incoerente și incomplete legate de activele informaționale |
Cataloagele de date automatizează managementul metadatelor și îl face colaborativ. Pentru a afla mai multe despre tehnologia cataloagelor de date, nu ezitați să citiți articolul nostru.
Managementul calității datelor
Potrivit IBM, economia americană pierde anual 3,1 trilioane de dolari din cauza calității slabe a datelor. Când vorbim despre starea și capacitatea de utilizare a datelor pentru funcția pentru care sunt destinate, vorbim despre calitatea datelor. Unele procese majore asociate cu asigurarea unei calități ridicate a datelor includ:
- Parsarea și standardizarea: Descompunerea câmpurilor de text în componentele lor și formatarea valorilor lor în prezentări coerente pe baza criteriilor alese. Unele machete comune sunt definite de standarde industriale, reguli de afaceri definite de utilizator sau baze de cunoștințe de valori și modele.
- „Curățare” generală: Actualizarea valorilor datelor pentru a se încadra în restricții de domeniu, constrângeri de integritate sau alte reguli de afaceri care determină calitatea minimă a datelor pentru organizație
- Profilare: Analiza datelor pentru a capta statistici (metadate) pentru a obține o perspectivă asupra calității datelor și a localiza problemele de calitate a datelor
- Monitorizare: Procesul de asigurare a conformității datelor cu regulile de calitate stabilite pentru organizație
- Îmbogățire: Creșterea valorii datelor deținute la nivel intern prin adăugarea de atribute conexe din surse externe
Care instrument de calitate a datelor pe care îl luați în considerare ar trebui să includă funcționalități pentru toate cele de mai sus și nu numai. Câțiva furnizori importanți includ:
Nume | Fondat | Statut | Note | |
---|---|---|---|---|
Talend Open Studio for Data Quality | 2005 | Public | -.Open source cu peste 400 de conectori de date încorporați | |
Ataccma | 2007 | Privat | -Învățare mecanică, preparare de date în regim de autoservire, catalog de date | |
BackOffice Associates (BOA) | 1996 | Privat | -Gama de rapoarte preambalate disponibile | |
Innovative Systems: Enlighten | 1968 | Privat | -Funcția de validare a adreselor și de geocodificare |
Managementul depozitelor de date și al BI
Un depozit de date este consolidarea datelor dintr-o gamă largă de surse care pune bazele pentru Business Intelligence (BI). Toate datele de aici sunt stocate în același format, dar algoritmii inteligenți, cum ar fi indexarea, permit o analiză eficientă.
Business Intelligence este setul de metode și instrumente utilizate de organizații pentru a prelua date și a lua decizii mai bine informate pe baza acestora. Platformele BI descriu fie ceea ce se întâmplă cu afacerea dvs. la momentul exact, fie ceea ce s-a întâmplat – de preferință în timp real.
Pentru a înțelege mai bine instrumentele pentru fiecare dintre acestea, tabelul următor compară diferențele majore:
Ce este | Sursa | Sursa | Lovitura | Audiența | |
---|---|---|---|---|---|
Business Intelligence | Sistem pentru a obține informații de afaceri | Date din depozitul de date | Raporturi, diagrame, grafice | Executivi, management | |
Depozit de date | Stocarea datelor, istorice și curente | Date din diferite surse | Date în format coerent pentru instrumentele BI | Inginerii de date, analiștii de date și de afaceri. |
Câteva exemple de instrumente pentru aceste procese:
Nume | Utilizare | Fondat | Status | Note | ||
---|---|---|---|---|---|---|
Microsoft Power BI | BI | 2013* | Public | …Interfață similară cu Excel | ||
QlikView | BI | 1993 | Privat | -Include data mining și analiză de date | ||
Cognos | BI | 1969 | Private | -.Surse de date multidimensionale și relaționale | ||
Tableau | BI | 2003 | Public | -Considerată pe scară largă ca fiind una dintre cele mai bune opțiuni în ceea ce privește vizualizările | ||
Teradata Data Warehouse | DW* | 1979 | Public | -Utilizează AMP (Access Module Processors) pentru a crește viteza de procesare a datelor | ||
Amazon Redshift | DW | 2012* | Public | -.Instrument complet gestionat – nu este nevoie de DBA | ||
Oracle Data Warehouse | DW | 1977 | Public | -Include unele funcționalități BI |
*DW = data warehousing
*Anul de înființare a produsului, not company founding
Depozitele de date există adesea în strânsă legătură cu o soluție ETL (Extract, Transform, Load) care preia date din mai multe surse diferite și le „transformă” într-un format unic, utilizabil pentru depozitul de date. Pentru a afla mai multe, consultați postările noastre de pe blog despre ETL și despre instrumentele ETL.
Analiza datelor
Analiza datelor este rezultatul tuturor acestor prelucrări de date. Analiza datelor este procesul de inspectare, curățare, transformare și modelare a datelor pentru a găsi informații utile. Analiza datelor include, de asemenea, mineritul de date, aplicațiile statistice (statistici descriptive, analiza exploratorie a datelor) și o gamă largă de tehnici de analiză a datelor statistice, cum ar fi testarea ipotezelor sau analiza de regresie.
Vă interesează să aflați mai multe despre tehnologiile și furnizorii care schimbă modul în care organizațiile fac lucrurile? Consultați blogul nostru pentru postări pe o gamă largă de subiecte legate de AI/tehnologie.