Définition de consolidation de données

La consolidation des données est un processus de capture des données provenant de sources multiples et l'intégration de l'information dans une source unique, de données persistantes pour l'utilisation par les abonnés dans une entreprise. La consolidation des données est une partie de trois techniques d'intégration de données - les deux autres étant la propagation des données et fédération. la propagation des données est le processus de réplication des données provenant de sources différentes dans des endroits différents, et la fédération de données permet une vue virtuelle unifiée des fichiers de données source. technologies de consolidation de données comprennent ELT et ETL.

ELT

  • Extract, Load Transform (ELT) définit un processus dans lequel l'architecture du système transforme une quantité en vrac des données après que les données ont été chargées dans une base de données cible. Après les données brutes est chargé, il est transformé et envoyé aux tables où ils peuvent être accessibles par les utilisateurs finaux individuels. Systèmes ELT sont classés comme des «systèmes pull" parce que la transformation de données est initiée à la demande, par des instructions de l'utilisateur final ou par les horaires de publication prédéfinis. ELT permet aux utilisateurs de travailler sur les données transformées et publiés, lorsque l'information est "tiré" après le cycle de chargement.

ETL




  • Extract, Transform, Load (ETL) est une autre technique de consolidation des données qui extrait des données d'une ou plusieurs sources, transforme les données selon des règles prescrites et puis charge les données obtenues dans les systèmes cibles ou des formats de fichiers spécifiés. ETL, distincte de ELT, transforme les données avant le cycle de chargement, ce qui signifie que les données est simplifiée, reformaté, standardisé, agrégée ou soumis à toute autre règle de manipulation de données prévue par la direction, avant d'être envoyé à une interface utilisateur final.

Extraction



  • Extraction est la première étape dans les deux technologies de consolidation des données. L'extraction de données peut être de volumes très élevés, à partir de plusieurs sources hétérogènes. L'extraction peut être de bases de données relationnelles, hiérarchiques et objets, les systèmes RFID, des documents XML, les services Web et applications packagées incluant SAP et PeopleSoft. En outre, l'extraction peut être effectuée sur des fichiers avec des informations structurées et non structurées, et les données externes achetés auprès de sources extérieures peut également être inclus, selon l'industrie et la pertinence des données.

Transformation



  • Dans les systèmes ETL et ELT, l'étape de transformation peut être très varié, allant de procédures simples, tels que les conversions de fichier ou le type, à des opérations complexes, telles que la manipulation et de l'intégration basée sur la logique. la transformation des données est une fonctionnalité très robuste de systèmes ETL et ELT, permettant aux entreprises de transmettre en temps opportun, des informations pertinentes à leurs gestionnaires et les superviseurs pour une meilleure prise de décision. La transformation permet aux entreprises de personnaliser les données et produire de l'information sur-mesure pour un usage interne. Selon l'industrie, et la portée et le volume des affaires, les entreprises peuvent rationaliser le processus de transformation ou de mener des opérations complètes sur les données recueillies.

Chargement

  • En cours de chargement se réfère à transférer des données vers une application cible. Dans le cas d'ELT, les données chargées est non traité, mais dans ETL, les données sont chargées après avoir été traité. L'étape de chargement dans les deux systèmes peut être modifiée en fonction de paramètres de réception de données, ce qui permet les deux modes en vrac et trickle pour chaque élément de données dans chaque cycle de chargement. Le choix d'un mode de vrac ou filet dans le chargement de données dépend de l'accent sur la latence des données pour le processus d'intégration, où le mode de filet suggère une plus grande importance à minimiser la latence.

éditerdans sélectionnéimprimer

» » » » Définition de consolidation de données