Quelles sont les six étapes du data mining ?
L'exploration de données est le processus non trivial permettant d'obtenir des modèles efficaces, nouveaux, potentiellement utiles et finalement compréhensibles à partir de grandes quantités de données. Les étapes sont :
4. Générez le modèle ;
5. Parcourez et vérifiez le modèle
6.
L'exploration de données nécessite généralement la collecte de données, l'intégration de données, la spécification des données, le nettoyage des données, la transformation des données, le processus de mise en œuvre de l'exploration de données, l'évaluation de modèles et la représentation des connaissances
2. Intégration des données : classer les données de différentes sources et formats
3. data Lorsque la valeur est relativement grande, nous pouvons utiliser la technologie de réduction pour obtenir la représentation réduite de l'ensemble de données, telle que (valeur des données - moyenne des données) / variance des données. Cela signifie que les données deviennent beaucoup plus petites mais proches de l'intégrité de. les données originales.Après réductionLes résultats de l'exploration de données sont fondamentalement cohérents avec les résultats avant spécification.
4. Nettoyage des données : Certaines données sont incomplètes, telles que : certaines ont des valeurs manquantes (les valeurs n'existent pas), certaines contiennent du bruit (erreurs, points isolés), et certaines sont incohérentes (comme comme différentes unités, etc.), nous pouvons utiliser des outils pour nettoyer les données et obtenir des données complètes, correctes et cohérentes.
5. Transformation des données : convertissez les données en un ensemble de données adapté à l'exploration de données grâce à une agrégation fluide, une généralisation des données, une standardisation, etc.
6. Extraction de fonctionnalités ou sélection de fonctionnalités : l'extraction de fonctionnalités est principalement utilisée dans la vision par ordinateur et le traitement d'images. La sélection de fonctionnalités consiste à proposer des fonctionnalités non pertinentes et redondantes pour éviter un ajustement excessif et améliorer la précision du modèle. et ainsi de suite.
7. Processus d'exploration de données : analysez les informations sur les données dans l'entrepôt de données, sélectionnez les outils d'exploration de données appropriés, appliquez des méthodes statistiques et utilisez les algorithmes d'exploration de données correspondants. .
8. D'un point de vue commercial, vérifier l'exactitude des résultats de l'analyse des données et de l'exploration de données.
9. Représentation des connaissances, présentant les résultats de l'exploration de données aux utilisateurs de manière visuelle.
Tutoriel recommandé : "
PHP"
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!