Alors que les médias débattent de la question de savoir si les données sont le nouveau pétrole ou non, une chose est claire : comme le pétrole, les données ont besoin de beaucoup de traitement. De Facebook aux startups en pleine croissance, toute organisation prospère qui gère un volume croissant de données, doit être capable d’organiser, d’accéder, de sécuriser et de traiter les données pour les convertir en idées et en décisions.
Il existe de nombreux outils et fournisseurs à prendre en compte, notamment en fonction des besoins de l’entreprise et de la tâche à accomplir. Cependant, quelle que soit la tâche, l’objectif est de trouver en fin de compte un produit de gestion des données pour rendre les données aussi utiles que possible tout en minimisant les coûts, les risques et la consommation de ressources.
Ceci est une liste de logiciels de gestion des données, cependant, elle n’est pas exhaustive. Nous avons préparé une liste triable/filtrable complète et régulièrement mise à jour des principaux fournisseurs de logiciels de gestion de données, n’hésitez pas à la consulter.
- Les logiciels de gestion de données
- Logiciel de gestion de données open source
- Architecture de données et conception de modèles de données
- Gestion des données de référence et des données de base
- Gestion des bases de données
- Gestion de documents, d’enregistrements, de contenus
- Gestion des métadonnées
- Gestion de la qualité des données
- Entreposage de données et gestion de la BI
- Analyse des données
Les logiciels de gestion de données
La gestion des données est une vaste discipline, avec de nombreux centres d’intérêt différents et des outils pour gérer ces centres d’intérêt. Le logiciel de gestion des données (DMS) fusionne les enregistrements de plusieurs bases de données, extrait, filtre, résume les données sans perte d’intégrité et sans interférence.
Certains fournisseurs et logiciels contiennent de multiples fonctionnalités et peuvent éliminer le besoin d’un outil dédié. Si vous êtes à la recherche d’un peu plus de contexte sur la gestion des données, assurez-vous de consulter notre article de blog sur le sujet.
Nous pouvons structurer les logiciels de gestion des données autour de ces sujets
- Les logiciels de gestion des données open source : Il existe de nombreux outils de gestion de données open source qui servent une variété des fonctions ci-dessous.
- Conception des données :
- Les logiciels d’architecture de données et de conception de modèles de données : Tout d’abord, les entreprises doivent modéliser leurs structures de données
- Gestion des données de base et de référence : Ce sont les fondements de la gestion des bases de données des meilleures pratiques et aident les organisations à gérer leurs données à travers différentes unités commerciales
- Gestion des bases de données : Ces structures de données modélisées doivent être créées dans des bases de données
- Collecte et analyse de documents : Les documents et autres contenus non structurés posent des problèmes aux bases de données particulièrement traditionnelles. Diverses solutions de collecte de documents facilitent la gestion du contenu non structuré
- Gestion des métadonnées : Les métadonnées sont précieuses car les champs de métadonnées les plus simples tels que les heures de mise à jour et de création permettent aux entreprises d’identifier les problèmes dans leurs données et d’analyser les processus de création et de mise à jour des données
- Gestion de la qualité des données : Une fois que la fédération (collecte) des données commence, la qualité des données doit être surveillée et il existe de nombreuses solutions pour mesurer et augmenter la qualité des données
- Analyse des données : Enfin, de nombreuses solutions de complexité différente permettent aux entreprises d’analyser ces données
Logiciel de gestion de données open source
Avant de classer les outils de gestion de données en fonction de leur fonctionnalité, nous avons pensé que vous pourriez préférer les solutions open source pour leur transparence et l’absence de frais de licence. Par conséquent, nous commençons par le tableau de gestion des données open source :
Nom | Fondé | Statut | Notes |
---|---|---|---|
Airtable | 2012 | Privé | -Airtable est un logiciel de base de données basé sur le cloud Le plan gratuit offre des tables de données illimitées, 1 200 enregistrements par base, 2 Go d’espace d’attachement de fichiers par base, et jusqu’à 2 semaines d’historique de révision et d’instantané. |
GraphDB-Ontotext | 2000 | Privé | -GraphDB est une base de données graphique qui offre un déploiement dans le cloud et sur site. |
MariaDB | 2009 | Privé | -MariaDB couvre des fonctionnalités similaires à MySQL avec quelques extensions ajoutées. -Les entreprises du Fortune 500 utilisant MariaDB : Deutsche Bank, DBS Bank, Nasdaq, Red Hat, ServiceNow, Verizon et Walgreens |
Cubrid | 2008 | Privé | -CUBRID est un SGBD open source optimisé pour l’OLTP. |
FirebirdSQL | 2005 | Privé | -CouchDB est une base de données et une solution de stockage de documents en ligne pour les entreprises. -L’outil fournit une sémantique ACID grâce au contrôle de la concurrence multi-version. |
Architecture de données et conception de modèles de données
L’architecture de données est les modèles, les politiques ou les règles qui régissent quelles données sont collectées, comment elles sont stockées et comment elles sont utilisées. Elle est ensuite divisée en architecture d’entreprise ou en architecture de solution.
La modélisation des données définit et analyse les besoins en données nécessaires aux processus métier au sein des systèmes d’information. Il existe trois différents types de modèles de données produits, qui progressent du modèle conceptuel, au modèle logique de données, et arrivent finalement avec le modèle physique de données.
Toutes ces catégories aident à organiser et à cartographier les données, améliorant leur fiabilité et aussi la transparence au sein d’une organisation.
Certains outils utiles liés à ces produits comprennent :
Nom | Fondé | Statut | Notes |
---|---|---|---|
Idera | 2004 | Privé | -Modélisation des données -.Gestion des bases de données pour réduire la redondance |
Teradata | 1979 | Public | -Architecture Big Data qui peut être construite à partir de plusieurs plateformes de données |
Looker | 2011 | Privé | -.Analyse de données sans SQL |
Tableau | 2003 | Public | – Analyse ad hoc rapide sans programmation -.Mises à jour automatiques ou connexion en direct |
Gestion des données de référence et des données de base
Les données de référence sont un sous-ensemble de données de base qui peuvent être utilisées pour la classification à travers une organisation. Certaines des données de référence les plus courantes comprennent les codes postaux, les devises, les codes et d’autres classifications – mais il peut également s’agir de données » convenues » au sein d’une organisation. La gestion de ce type de données est importante car elles servent souvent de référence pour un certain nombre de systèmes.
Il existe un certain nombre d’outils disponibles pour aider à la gestion des données de référence, en voici quelques-uns :
Nom | Fondé | Statut | Notes |
---|---|---|---|
ASG metaRDM | 1986 | Privé | -.Focus sur le support de la conformité |
Collibra Reference Data Accelerator | 2008 | Privé | -Déploiement et mise en œuvre faciles |
Informatica Cloud -. MDM Reference 360 | 1993 | Public | -Utilisation de la fondation MDM INFA Cloud |
Kalido by Magnitude Reference Data Management | 2014 | Privé | -.Moteur de workflow embarqué pour l’intendance et la gouvernance |
La gestion des données de référence (MDM) est une méthode complète pour définir et gérer les données essentielles d’une organisation afin de fournir un point de référence. Les logiciels de ce domaine prennent en charge l’identification, la liaison et la synchronisation des informations sur les clients à travers des sources de données disparates. Ces informations sont utilisées à l’appui d’un certain nombre d’initiatives liées à la gérance et à la gouvernance des données.
Certains outils et fournisseurs de MDM populaires comprennent :
Nom | Fondé | Statut | Notes |
---|---|---|---|
Orchestra Networks EBX | 2000 | Privé | -Inclut des fonctionnalités pour les données maîtres, méta, et de référence |
Dell Boomi | 1984 | Public | -Des fonctionnalités telles que ‘Boomi Suggest’ et ‘Boomi Assure’ pour aider au développement et aux tests |
Stibo Systems | 1976 | Privé | -.Accent sur le MDM multidomaine |
Profitee | 2007 | Privé | -Solutions construites par l’industrie |
Pour apprendre plus de 100 vendeurs et outils de gestion des données de référence, n’hésitez pas à consulter notre liste de fournisseurs triable et transparente où nous avons trié les fournisseurs en fonction de leur popularité, de la maturité de l’entreprise et de la satisfaction des utilisateurs.
Gestion des bases de données
La gestion des bases de données a une variété d’objectifs allant de la performance, au stockage, à la sécurité et plus encore. Les outils visent à contrôler les données tout au long de leur cycle de vie, ce qui conduit à une meilleure intelligence économique et à une meilleure prise de décision.
Certaines tâches générales qui devraient être satisfaites avec le bon logiciel de gestion de base de données comprennent :
- Mise au point de l’application
- Test du temps de réponse
- Test du débit
- Gestion des performances
Il est important de garder à l’esprit la différence entre SGBD et SGBDR. SGBD est un terme général pour différents types de technologies de gestion de bases de données qui ont été développées au cours des 50 dernières années. Dans les années 1970, un système de gestion de base de données relationnel (SGBDR) a vu le jour et est rapidement devenu la technologie dominante dans le domaine. Le facteur le plus important du SGBDR est sa structure de table basée sur les lignes qui permet de relier des éléments de données connexes, ce qui est réalisé par la normalisation de la base de données. Depuis les années 2000, les bases de données non relationnelles ou no-SQL comme MongoDB ont commencé à gagner en popularité, mais les bases de données relationnelles restent importantes pour le stockage de données structurées.
Certains fournisseurs qui travaillent dans cette discipline comprennent :
Nom | Fondé | Statut | Notes |
---|---|---|---|
Oracle Enterprise Manager | 1977 | Public | -Capacités d’autogestion intégrées au noyau de base de données -Pour Linux, Windows, Solaris, IBM AIX, UP-UX |
IBM DB2 | 1983 | Public | -Pour Linux, Unix, et Windows -Compatibilité SQL |
MongoDB | 2007 | Public | -Fonctionne avec AWS, Azure et Google Cloud -Plusieurs versions : Enterprise Advanced, Stitch, Atlas, Cloud Manager |
Gestion de documents, d’enregistrements, de contenus
La gestion de contenu d’entreprise, parfois appelée gestion de documents, est le processus de stockage, de gestion et de surveillance des documents provenant des activités commerciales quotidiennes.
Certaines fonctionnalités générales que toute solution devrait inclure sont :
- Scanner de documents pour faire des copies numériques de textes papier
- Reconnaissance optique de caractères (OCK) pour convertir les documents numérisés
- Accès basé sur l’utilisateur
- Assemblage de documents pour créer à l’aide d’une armoire-et-.dossier
- Convertisseur PDF
- Stockage et sauvegarde de documents
- Options d’intégration
- Outils de collaboration et contrôle de version
.
Nom | Fondé | Statut | Notes |
---|---|---|---|
Alfresco | 2005 | Privé | -Gamme d’options de flux de travail et de collaboration |
Dokmee/Office Gemini | 2006 | Privé | -Une option moins coûteuse que certaines |
Maxxvault | 2008 | Privé | -Interface simple |
eFileCabinet | 2001 | Privé | -Une option solide pour les équipes distantes |
Gestion des métadonnées
La gestion des métadonnées est l’administration des données décrivant d’autres données. Elle implique également des processus visant à garantir que les données peuvent être intégrées et utilisées dans l’ensemble de l’organisation. Elle est importante pour maintenir la cohérence des définitions, la clarté des relations et le lignage des données.
Certaines tâches communes associées à la gestion des métadonnées qui devraient être remplies par tout logiciel ou outil comprennent :
- Les référentiels de métadonnées pour la documentation et la gestion et pour effectuer des analyses
- La lignée des données pour spécifier l’origine des données et où elles se sont déplacées au fil du temps
- Lexique métier pour communiquer et régir les termes clés
- Gestion des règles pour automatiser l’application des règles métier
- Analyse d’impact détaillant toute dépendance d’information
Nom | Fondé | Status | Notes |
---|---|---|---|
Adaptive Metadata Manager | 1997 | Privé | -Plus de 20 ans d’expérience avec de nombreux partenariats |
Data Advantage Group | 1999 | Privé | -Reconnu pour sa facilité de mise en œuvre |
Informatica Metadata Manager | 1993 | Public | -.Concentration sur la gouvernance de l’information et l’analytique |
Smartlogic Semaphore | 2005 | Privé | -Capture les métadonnées incohérentes et incomplètes liées aux actifs informationnels |
Les catalogues de données automatisent la gestion des métadonnées et la rendent collaborative. Pour en savoir plus sur la technologie des catalogues de données, n’hésitez pas à lire notre article.
Gestion de la qualité des données
Selon IBM, l’économie américaine perd 3,1 trillions de dollars par an en raison de la mauvaise qualité des données. Lorsque nous parlons de l’état et de l’utilisabilité des données pour leur fonction prévue, nous parlons de la qualité des données. Parmi les principaux processus associés à la garantie d’une qualité élevée des données figurent :
- Parsing et normalisation : Décomposer les champs de texte en leurs composants et formater leurs valeurs dans des mises en page cohérentes en fonction des critères choisis. Certaines mises en page courantes sont définies par des normes industrielles, des règles métier définies par l’utilisateur ou des bases de connaissances de valeurs et de modèles.
- « Nettoyage » général : Mise à jour des valeurs de données pour qu’elles entrent dans les restrictions de domaine, les contraintes d’intégrité ou d’autres règles métier qui déterminent la qualité minimale des données pour l’organisation
- Profilage : Analyse des données pour capturer des statistiques (métadonnées) afin d’obtenir un aperçu de la qualité des données et de localiser les problèmes de qualité des données
- Surveillance : Processus visant à garantir la conformité des données aux règles de qualité fixées pour l’organisation.
- Enrichissement : Augmenter la valeur des données détenues en interne en ajoutant des attributs connexes provenant de sources externes
Tout outil de qualité des données que vous envisagez devrait inclure des fonctionnalités pour tous les éléments ci-dessus et plus encore. Parmi les principaux fournisseurs, citons :
Nom | Fondé | Statut | Notes |
---|---|---|---|
Talend Open Studio for Data Quality | 2005 | Public | -.Open source avec plus de 400 connecteurs de données intégrés |
Ataccma | 2007 | Privé | -Machine learning, préparation des données en libre-service, catalogue de données |
BackOffice Associates (BOA) | 1996 | Privé | -Gamme de rapports préemballés disponibles |
Innovative Systems : Enlighten | 1968 | Privé | -Fonction de validation d’adresse et de géocodage |
Entreposage de données et gestion de la BI
Un entrepôt de données est la consolidation de données provenant d’un large éventail de sources qui établit les bases de la Business Intelligence (BI). Toutes les données y sont stockées dans le même format, mais des algorithmes intelligents tels que l’indexation permettent une analyse efficace.
La Business Intelligence est l’ensemble des méthodes et des outils utilisés par les organisations pour prendre des données et prendre des décisions plus éclairées à partir de celles-ci. Les plateformes de BI décrivent soit ce qui se passe avec votre entreprise au moment précis, soit ce qui s’est passé – de préférence en temps réel.
Pour mieux comprendre les outils de chacune d’entre elles, le tableau suivant compare les principales différences :
Ce que c’est | Source | Sortie | Audience | |
---|---|---|---|---|
Business Intelligence | Système permettant de tirer des enseignements commerciaux | Données provenant d’un entrepôt de données | Rapports, tableaux, graphiques | Exécutifs, direction |
Entrepôt de données | Stockage de données, historiques et actuelles | Données provenant de différentes sources | Données dans un format cohérent pour les outils de BI | Ingénieurs de données, analystes de données et d’affaires. |
Plusieurs exemples d’outils pour ces processus :
Nom | Utilisation | Fondé | Statut | Notes |
---|---|---|---|---|
Microsoft Power BI | BI | 2013* | Public | -.Interface similaire à Excel |
QlikView | BI | 1993 | Privé | -Comprend l’exploration et l’analyse des données |
Cognos | BI | 1969 | Privé | -Les sources de données multidimensionnelles et relationnelles |
Tableau | BI | 2003 | Public | -.Largement considéré comme l’une des meilleures options en termes de visualisations |
Teradata Data Warehouse | DW* | 1979 | Public | -.Utilise des AMP (processeurs de modules d’accès) pour augmenter la vitesse de traitement des données |
Amazon Redshift | DW | 2012* | Public | -Outil entièrement géré – pas besoin de DBA |
Oracle Data Warehouse | DW | 1977 | Public | -Inclut certaines fonctionnalités de BI |
*DW = data warehousing
*Année de fondation du produit, pas la fondation de l’entreprise
Les entrepôts de données existent souvent en étroite relation avec une solution ETL (Extract, Transform, Load) qui prend les données de nombreuses sources différentes et les » transforme » en un format unique et utilisable pour l’entrepôt de données. Pour en savoir plus, consultez nos articles de blog sur l’ETL et les outils ETL.
Analyse des données
L’analyse des données est le résultat de tout ce traitement des données. L’analyse des données est le processus d’inspection, de nettoyage, de transformation et de modélisation des données afin de trouver des informations utiles. L’analyse des données comprend également l’exploration des données, les applications statistiques (statistiques descriptives, analyse exploratoire des données) et un large éventail de techniques d’analyse des données statistiques, telles que les tests d’hypothèse ou l’analyse de régression.
Vous souhaitez en savoir plus sur les technologies et les fournisseurs qui changent la façon dont les organisations font les choses ? Consultez notre blog pour des articles sur un large éventail de sujets liés à l’IA/aux technologies.