Apache Atlas est un projet open source généré par la communauté Hadoop pour résoudre le problème de gouvernance des métadonnées de l'écosystème Hadoop. Il fournit des métadonnées comprenant la classification des données, un moteur de politique centralisé, le lignage des données, la sécurité et la gestion du cycle de vie pour le cluster Hadoop. Capacités de base de gouvernance des données.
Apache Atlas est un projet d'incubation de la Fondation Apache et constitue le cadre de gouvernance des données et de métadonnées de l'écosystème Hadoop. Atlas est un ensemble de services de gouvernance de base de base qui ont une bonne évolutivité et évolutivité, peuvent répondre aux divers besoins des entreprises pour l'écosystème Hadoop et peuvent être intégrés à l'écosystème de données de l'entreprise.
L'architecture d'Apache Atlas est présentée dans la figure ci-dessous :
Fonctionnalités de base
Apache Atlas est l'élément de gouvernance des données Hadoop offre les fonctionnalités suivantes :
1. Classification des données
● Importer ou définir des annotations de classification orientées métier pour les métadonnées
● Définir, annoter et capturer automatiquement les données Relations entre les ensembles et les éléments sous-jacents
● Exporter les métadonnées vers des systèmes tiers
2. Audit centralisé
● Capturer toutes les interactions avec toutes les applications, processus et données Accès sécurisé aux informations
● Capturer des informations sur l'exécution, les étapes, les activités et autres opérations
3. Recherche et traçage
● Chemins de navigation prédéfinis pour explorer la classification et l'audit des données Informations
● Fonctionnalités de recherche textuelle pour localiser rapidement et précisément les données associées et les événements d'audit
● La navigation visuelle de la lignée des ensembles de données permet aux utilisateurs d'accéder aux opérations, en toute sécurité et aux informations liées aux données origin
4. Moteur de sécurité et de politique
● Basé sur le mode de classification des données, les attributs et la politique de conformité raisonnable d'exécution basée sur les rôles
● Basé sur la classification - Définition de stratégie avancée pour prédiction pour empêcher la dérivation des données
● Masquage au niveau des lignes/colonnes basé sur les attributs et les valeurs des cellules
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!