Während die Medien darüber debattieren, ob Daten das neue Öl sind oder nicht, ist eines klar: Wie Öl benötigen auch Daten eine Menge Verarbeitung. Von Facebook bis hin zu wachsenden Startups muss jedes erfolgreiche Unternehmen, das eine wachsende Datenmenge verarbeitet, in der Lage sein, Daten zu organisieren, darauf zuzugreifen, sie zu sichern und zu verarbeiten, um sie in Erkenntnisse und Entscheidungen umzuwandeln.
Es gibt viele Tools und Anbieter, die in Betracht gezogen werden müssen, insbesondere im Hinblick auf die Bedürfnisse des Unternehmens und die anstehende Aufgabe. Unabhängig von der Aufgabe besteht das Ziel jedoch darin, ein Datenmanagement-Produkt zu finden, das Daten so nützlich wie möglich macht und gleichzeitig Kosten, Risiken und Ressourcenverbrauch minimiert.
Dies ist eine Liste von Datenmanagement-Software, die jedoch nicht vollständig ist. Wir haben eine regelmäßig aktualisierte, umfassende, sortierbare/filterbare Liste der führenden Anbieter von Datenmanagement-Software erstellt, die Sie sich gerne ansehen können.
Datenmanagement-Software
Datenmanagement ist ein weites Feld mit vielen verschiedenen Schwerpunkten und Tools zur Verwaltung dieser Schwerpunkte. Datenverwaltungssoftware (DMS) führt Datensätze aus mehreren Datenbanken zusammen, extrahiert, filtert und fasst die Daten zusammen, ohne dass die Integrität der Daten verloren geht und Störungen auftreten.
Einige Anbieter und Softwares enthalten mehrere Funktionen und können den Bedarf an einem speziellen Tool überflüssig machen. Wenn Sie auf der Suche nach mehr Hintergrundwissen zum Thema Datenmanagement sind, sollten Sie sich unseren Blogbeitrag zu diesem Thema ansehen.
Wir können Datenmanagement-Software rund um diese Themen strukturieren
- Open-Source-Datenmanagement-Software: Es gibt zahlreiche Open-Source-Datenmanagement-Tools, die eine Vielzahl der unten genannten Funktionen erfüllen.
- Datenentwurf:
- Datenarchitektur- und Datenmodell-Design-Software: Zunächst müssen Unternehmen ihre Datenstrukturen modellieren
- Stamm- und Referenzdatenmanagement: Diese bilden die Grundlage für ein optimales Datenbankmanagement und helfen Unternehmen, ihre Daten über verschiedene Geschäftsbereiche hinweg zu verwalten
- Datenbankmanagement: Diese modellierten Datenstrukturen müssen in Datenbanken erstellt werden
- Dokumentenerfassung und -analyse: Dokumente und andere unstrukturierte Inhalte stellen vor allem für traditionelle Datenbanken eine Herausforderung dar. Verschiedene Lösungen zur Dokumentensammlung erleichtern das Management unstrukturierter Inhalte
- Metadatenmanagement: Metadaten sind wertvoll, da die einfachsten Metadatenfelder wie Aktualisierungs- und Erstellungszeiten es Unternehmen ermöglichen, Probleme in ihren Daten zu erkennen und die Datenerstellungs- und Aktualisierungsprozesse zu analysieren
- Datenqualitätsmanagement: Sobald die Datenföderation (Sammlung) beginnt, muss die Datenqualität überwacht werden, und es gibt zahlreiche Lösungen zur Messung und Verbesserung der Datenqualität
- Datenanalyse: Schließlich ermöglichen zahlreiche Lösungen unterschiedlicher Komplexität den Unternehmen die Analyse dieser Daten
Open-Source-Datenmanagement-Software
Bevor wir die Datenmanagement-Tools anhand ihrer Funktionen kategorisieren, dachten wir, dass Sie Open-Source-Lösungen aufgrund ihrer Transparenz und der fehlenden Lizenzgebühren bevorzugen könnten. Daher beginnen wir mit der Open-Source-Datenverwaltungstabelle:
Name | Gründung | Status | Notizen |
---|---|---|---|
Airtable | 2012 | Privat | -Airtable ist eine Cloud-basierte Datenbanksoftware Der kostenlose Plan bietet unbegrenzte Datentabellen, 1.200 Datensätze pro Basis, 2 GB Speicherplatz für Dateianhänge pro Basis und bis zu 2 Wochen Revisions- und Snapshot-Historie. |
GraphDB-Ontotext | 2000 | Private | -GraphDB ist eine grafische Datenbank, die in der Cloud und vor Ort eingesetzt werden kann. |
MariaDB | 2009 | Privat | -MariaDB bietet ähnliche Funktionen wie MySQL mit einigen zusätzlichen Erweiterungen. -Fortune 500-Unternehmen nutzen MariaDB: Deutsche Bank, DBS Bank, Nasdaq, Red Hat, ServiceNow, Verizon und Walgreens |
Cubrid | 2008 | Private | -CUBRID ist ein für OLTP optimiertes Open Source DBMS. |
FirebirdSQL | 2005 | Private | -CouchDB ist eine Online-Dokumentendatenbank und Speicherlösung für Unternehmen. -Das Tool bietet ACID-Semantik durch Multiversions-Gleichzeitigkeitskontrolle. |
Datenarchitektur und Datenmodellentwurf
Datenarchitektur sind die Modelle, Richtlinien oder Regeln, die bestimmen, welche Daten gesammelt, wie sie gespeichert und wie sie verwendet werden. Sie wird dann weiter unterteilt in Unternehmensarchitektur oder Lösungsarchitektur.
Datenmodellierung definiert und analysiert Datenanforderungen, die für Geschäftsprozesse innerhalb von Informationssystemen erforderlich sind. Es gibt drei verschiedene Arten von Datenmodellen, die vom konzeptionellen Modell über das logische Datenmodell bis hin zum physischen Datenmodell reichen.
Alle diese Kategorien helfen, Daten zu organisieren und abzubilden, was ihre Zuverlässigkeit und auch die Transparenz innerhalb einer Organisation verbessert.
Einige nützliche Tools, die mit diesen Produkten zusammenhängen, sind:
Name | Gründung | Status | Hinweise |
---|---|---|---|
Idera | 2004 | Private | -Datenmodellierung -Datenbankmanagement zur Reduzierung von Redundanzen |
Teradata | 1979 | Öffentlich | -Big-Data-Architektur, die aus mehreren Datenplattformen aufgebaut werden kann |
Looker | 2011 | Privat | -Datenanalyse ohne SQL |
Tableau | 2003 | Öffentlich | -Schnelle Ad-hoc-Analyse ohne Programmierung -Automatische Aktualisierungen oder Live-Verbindung |
Referenz- und Stammdatenmanagement
Referenzdaten sind eine Teilmenge von Stammdaten, die für die Klassifizierung in einem Unternehmen verwendet werden können. Zu den gebräuchlichsten Referenzdaten gehören Postleitzahlen, Währungen, Codes und andere Klassifizierungen – es kann sich aber auch um „vereinbarte“ Daten innerhalb einer Organisation handeln. Die Verwaltung dieser Art von Daten ist wichtig, da sie oft als Referenz für eine Reihe von Systemen dienen.
Es gibt eine Reihe von Tools, die bei der Verwaltung von Referenzdaten helfen, hier einige davon:
Name | Gründung | Status | Notizen |
---|---|---|---|
ASG metaRDM | 1986 | Privat | -Fokus auf Compliance-Unterstützung |
Collibra Reference Data Accelerator | 2008 | Privat | – Einfache Bereitstellung und Implementierung |
Informatica Cloud – MDM Reference 360 | 1993 | Öffentlich | -Nutzt die MDM-Grundlage der INFA Cloud |
Kalido von Magnitude Reference Data Management | 2014 | Privat | -Eingebettete Workflow-Engine für Stewardship und Governance |
Master Data Management (MDM) ist eine umfassende Methode zur Definition und Verwaltung der wesentlichen Daten einer Organisation, um einen Bezugspunkt zu schaffen. Software für diesen Bereich unterstützt die Identifizierung, Verknüpfung und Synchronisierung von Kundeninformationen über unterschiedliche Datenquellen hinweg. Diese Informationen werden zur Unterstützung einer Reihe von Initiativen im Zusammenhang mit Data Stewardship und Governance verwendet.
Zu den gängigen MDM-Tools und -Anbietern gehören:
Name | Gründung | Status | Notizen |
---|---|---|---|
Orchestra Networks EBX | 2000 | Private | -Enthält Funktionen für Stamm-, Meta, und Referenzdaten |
Dell Boomi | 1984 | Öffentlich | -Funktionen wie ‚Boomi Suggest‘ und ‚Boomi Assure‘ zur Unterstützung von Entwicklung und Tests |
Stibo Systems | 1976 | Privat | -Schwerpunkt auf Multidomain-MDM |
Profisee | 2007 | Private | -Lösungen, die von der Industrie entwickelt wurden |
Um mehr als 100 Stammdatenmanagement-Anbieter und -Tools kennenzulernen, Schauen Sie sich unsere sortierbare und transparente Anbieterliste an, in der wir die Anbieter nach Beliebtheit, Reifegrad des Unternehmens und Nutzerzufriedenheit sortiert haben.
Datenbankmanagement
Das Datenbankmanagement hat eine Vielzahl von Zielen, die von der Leistung über die Speicherung bis hin zur Sicherheit und mehr reichen. Die Tools zielen darauf ab, die Daten während ihres gesamten Lebenszyklus zu kontrollieren, was zu besseren Geschäftsinformationen und einer besseren Entscheidungsfindung führt.
Zu den allgemeinen Aufgaben, die mit der richtigen Datenbankverwaltungssoftware erfüllt werden sollten, gehören:
- Anwendungstuning
- Antwortzeittests
- Durchsatztests
- Leistungsmanagement
Es ist wichtig, sich den Unterschied zwischen DBMS und RDBMS vor Augen zu halten. DBMS ist ein allgemeiner Begriff für verschiedene Arten von Datenbankverwaltungstechnologien, die in den letzten 50 Jahren entwickelt wurden. In den 1970er Jahren entstand das relationale Datenbankmanagementsystem (RDBMS), das sich schnell zur dominierenden Technologie in diesem Bereich entwickelte. Der wichtigste Faktor bei RDBMS ist die zeilenbasierte Tabellenstruktur, die verwandte Datenelemente miteinander verbinden kann, was durch Datenbanknormalisierung erreicht wird. Seit den 2000er Jahren gewinnen nicht-relationale oder No-SQL-Datenbanken wie MongoDB an Popularität, aber relationale Datenbanken sind immer noch wichtig für die Speicherung strukturierter Daten.
Zu den Anbietern, die in diesem Bereich arbeiten, gehören:
Name | Gegründet | Status | Hinweise |
---|---|---|---|
Oracle Enterprise Manager | 1977 | Öffentlich | -Selbstverwaltungsfunktionen im Datenbankkernel -Für Linux, Windows, Solaris, IBM AIX, UP-UX |
IBM DB2 | 1983 | Public | -Für Linux, Unix, und Windows -SQL-Kompatibilität |
MongoDB | 2007 | Public | -Works with AWS, Azure, and Google Cloud -Several versions: Enterprise Advanced, Stitch, Atlas, Cloud Manager |
Document, Record, Content Management
Enterprise Content Management, manchmal auch Dokumentenmanagement genannt, ist der Prozess des Speicherns, Verwaltens und Überwachens von Dokumenten aus dem täglichen Geschäftsleben.
Einige allgemeine Funktionalitäten, die jede Lösung beinhalten sollte, sind:
- Dokumentenscanner zur Erstellung digitaler Kopien von Papiertexten
- Optische Zeichenerkennung (OCK) zur Konvertierung gescannter Dokumente
- Benutzerbasierter Zugriff
- Dokumentenzusammenstellung unter Verwendung einer Schrank- undOrdnerstruktur
- PDF-Konverter
- Dokumentenspeicherung und Backup
- Integrationsmöglichkeiten
- Kollaborationswerkzeuge und Versionskontrolle
Name | Gründung | Status | Noten |
---|---|---|---|
Alfresco | 2005 | Privat | -Eine Reihe von Workflow- und Zusammenarbeitsoptionen |
Dokmee/Office Gemini | 2006 | Privat | – Eine kostengünstigere Option als einige |
Maxxvault | 2008 | Privat | -Unkomplizierte Schnittstelle |
eFileCabinet | 2001 | Private | – Eine starke Option für Remote-Teams |
Metadatenmanagement
Metadatenmanagement ist die Verwaltung von Daten, die andere Daten beschreiben. Es umfasst auch Prozesse, die sicherstellen, dass Daten in der gesamten Organisation integriert und genutzt werden können. Es ist wichtig, um die Konsistenz der Definitionen, die Klarheit der Beziehungen und die Abstammung der Daten zu gewährleisten.
Zu den allgemeinen Aufgaben im Zusammenhang mit dem Metadatenmanagement, die mit jeder Software oder jedem Tool erfüllt werden sollten, gehören:
- Metadaten-Repositories zur Dokumentation und Verwaltung sowie zur Durchführung von Analysen
- Datenabfolge, um den Ursprung der Daten zu spezifizieren und festzustellen, wohin sie sich im Laufe der Zeit bewegt haben
- Geschäftsglossar, um Schlüsselbegriffe zu kommunizieren und zu regeln
- Regelmanagement, um die Durchsetzung von Geschäftsregeln zu automatisieren
- Auswirkungsanalyse, die alle Informationsabhängigkeiten aufzeigt
Name | Gründung | Status | Hinweise |
---|---|---|---|
Adaptive Metadata Manager | 1997 | Privat | -Über 20 Jahre Erfahrung mit einer Reihe von Partnerschaften |
Data Advantage Group | 1999 | Privat | – Bekannt für einfache Implementierung |
Informatica Metadata Manager | 1993 | Öffentlich | -Konzentration auf Information Governance und Analytik |
Smartlogic Semaphore | 2005 | Privat | -Erfasst inkonsistente und unvollständige Metadaten im Zusammenhang mit Informationsbeständen |
Datenkataloge automatisieren das Metadatenmanagement und machen es kollaborativ. Wenn Sie mehr über die Datenkatalogtechnologie erfahren möchten, lesen Sie unseren Artikel.
Datenqualitätsmanagement
Nach Angaben von IBM verliert die US-Wirtschaft jährlich 3,1 Billionen Dollar durch schlechte Datenqualität. Wenn wir über den Zustand und die Verwendbarkeit der Daten für ihre beabsichtigte Funktion sprechen, sprechen wir von Datenqualität. Zu den wichtigsten Prozessen zur Gewährleistung einer hohen Datenqualität gehören:
- Parsing und Standardisierung: Zerlegen von Textfeldern in ihre Komponenten und Formatieren ihrer Werte in konsistente Layouts auf der Grundlage der gewählten Kriterien. Einige gängige Layouts sind durch Industriestandards, benutzerdefinierte Geschäftsregeln oder Wissensdatenbanken mit Werten und Mustern definiert.
- Allgemeine „Bereinigung“: Aktualisierung von Datenwerten, damit sie den Domäneneinschränkungen, Integritätsbeschränkungen oder anderen Geschäftsregeln entsprechen, die die Mindestdatenqualität für das Unternehmen festlegen
- Profiling: Datenanalyse zur Erfassung von Statistiken (Metadaten), um einen Einblick in die Qualität der Daten zu erhalten und Datenqualitätsprobleme zu lokalisieren
- Überwachung: Prozess zur Sicherstellung der Konformität der Daten mit den für die Organisation festgelegten Qualitätsregeln
- Anreicherung: Erhöhung des Wertes interner Daten durch Hinzufügen von Attributen aus externen Quellen
Jedes Datenqualitätstool, das Sie in Betracht ziehen, sollte Funktionen für alle oben genannten Punkte und mehr enthalten. Zu den wichtigsten Anbietern gehören:
Name | Gründung | Status | Notizen |
---|---|---|---|
Talend Open Studio for Data Quality | 2005 | Public | -Open Source mit über 400 integrierten Datenkonnektoren |
Ataccma | 2007 | Private | -Maschinelles Lernen, Self-Service-Datenaufbereitung, Datenkatalog |
BackOffice Associates (BOA) | 1996 | Privat | -Reihe von vorgefertigten Berichten verfügbar |
Innovative Systeme: Enlighten | 1968 | Privat | -Adressvalidierung und Geokodierungsfunktion |
Data Warehousing und BI Management
Ein Data Warehouse ist die Konsolidierung von Daten aus einer Vielzahl von Quellen und bildet die Grundlage für Business Intelligence (BI). Alle Daten werden hier im gleichen Format gespeichert, aber intelligente Algorithmen wie die Indizierung ermöglichen eine effektive Analyse.
Business Intelligence ist eine Reihe von Methoden und Werkzeugen, die von Unternehmen eingesetzt werden, um Daten zu nutzen und auf dieser Grundlage fundiertere Entscheidungen zu treffen. BI-Plattformen beschreiben entweder, was im Unternehmen gerade passiert oder was passiert ist – vorzugsweise in Echtzeit.
Zum besseren Verständnis der einzelnen Tools werden in der folgenden Tabelle die wichtigsten Unterschiede gegenübergestellt:
Was es ist | Quelle | Output | Zielgruppe | |
---|---|---|---|---|
Business Intelligence | System zur Ableitung von Geschäftseinblicken | Daten aus Data Warehouse | Berichte, Diagramme, Grafiken | Führungskräfte, Management |
Data Warehouse | Datenspeicherung, historische und aktuelle | Daten aus verschiedenen Quellen | Daten in einheitlichem Format für BI-Tools | Dateningenieure, Daten- und Geschäftsanalysten. |
Einige Beispiele von Tools für diese Prozesse:
Name | Verwendung | Gründung | Status | Notizen |
---|---|---|---|---|
Microsoft Power BI | BI | 2013* | Public | -Ähnliche Schnittstelle zu Excel |
QlikView | BI | 1993 | Privat | -Umfasst Data Mining und Analytik |
Cognos | BI | 1969 | Privat | -Multidimensionale und relationale Datenquellen |
Tableau | BI | 2003 | Öffentlich | -Gilt weithin als eine der besten Optionen in Bezug auf Visualisierungen |
Teradata Data Warehouse | DW* | 1979 | Public | -Verwendet AMPs (Access Module Processors) zur Erhöhung der Datenverarbeitungsgeschwindigkeit |
Amazon Redshift | DW | 2012* | Public | -Vollständig verwaltetes Tool – kein DBA erforderlich |
Oracle Data Warehouse | DW | 1977 | Public | – Beinhaltet einige BI-Funktionen |
*DW = Data Warehousing
*Jahr der Produktgründung, nicht Unternehmensgründung
Data Warehouses existieren oft in enger Verbindung mit einer ETL-Lösung (Extract, Transform, Load), die Daten aus vielen verschiedenen Quellen in ein einziges, für das Data Warehouse nutzbares Format „umwandelt“. Weitere Informationen finden Sie in unseren Blogbeiträgen über ETL und ETL-Tools.
Datenanalyse
Die Datenanalyse ist das Ergebnis all dieser Datenverarbeitung. Datenanalyse ist der Prozess der Inspektion, Bereinigung, Umwandlung und Modellierung von Daten, um nützliche Informationen zu finden. Zur Datenanalyse gehören auch Data Mining, statistische Anwendungen (deskriptive Statistik, explorative Datenanalyse) und eine breite Palette von Techniken zur Analyse statistischer Daten, wie Hypothesentests oder Regressionsanalysen.
Sind Sie daran interessiert, mehr über die Technologien und Anbieter zu erfahren, die die Art und Weise verändern, wie Unternehmen ihre Arbeit erledigen? In unserem Blog finden Sie Beiträge zu einer breiten Palette von KI-/Technologiethemen.