Filtrage intelligent des informations de Jiuyan : la technologie Big Data favorise les mises à niveau des produits

phpcn_u1852
Libérer: 2017-09-11 16:34:51
original
1795 Les gens l'ont consulté

Diverses plateformes telles que les réseaux sociaux, la diffusion en direct, les forums et le commerce électronique génèrent chaque jour d'énormes quantités d'UGC, qui sont inévitablement mélangées à une grande quantité de texte indésirable. Ces contenus affectent non seulement sérieusement l'expérience utilisateur, mais peuvent également entraîner des risques opérationnels de violations.

L'embarras du mauvais filtrage des informations et de l'examen du contenu sur Internet a finalement ouvert la voie à une solution possible avec le développement de la technologie Internet, à savoir l'intelligence artificielle ; Administration chinoise en 2016 》Encourager et soutenir explicitement la recherche, le développement, la production et la promotion de logiciels de protection en ligne pour adultes. Grâce au développement technologique et au soutien politique, le développement de la technologie de révision de contenu a finalement marqué le début du printemps.

La méthode d'examen du contenu de l'intelligence artificielle consiste à permettre à la machine d'apprendre en profondeur sous les données massives d'images, de textes et de vidéos, et d'améliorer continuellement la quantité de reconnaissance et la précision du jugement du système pour différents types de contenu. , il s’agit d’utiliser l’apprentissage profond pour les techniques appliquées à l’information linguistique textuelle. Jusqu'à présent, dans l'industrie nationale de l'intelligence artificielle, le nombre d'entreprises utilisant « l'exploration de texte intelligente » comme technologie de base a atteint des centaines, et il a été subdivisé en un lien de « mauvais filtrage des informations », qui peut être étroitement intégré aux activités commerciales. scénarios et Il n'existe pas beaucoup de systèmes nationaux pour identifier et filtrer les informations textuelles illégales telles que le « terrorisme violent », les « informations sensibles » et les « petites publicités », et le système de filtrage intelligent Jiuyan en fait partie. Il intègre pleinement la compréhension du langage naturel. , l'intelligence artificielle, les technologies de pointe dans les domaines de l'analyse du Big Data et d'autres domaines présentent les trois caractéristiques de l'intelligence, de la sémantique et du temps réel.

Le système de filtrage intelligent Jiuyan est un système de filtrage intelligent de contenu pour les mégadonnées de textes complexes. Il peut identifier intelligemment les variantes courantes de mots-clés telles que la prononciation, la déformation et la division des mots en temps réel, et obtenir une désambiguïsation sémantique précise. a intégré Il dispose d'une base de connaissances complète et en temps réel en Chine, adaptée au filtrage intelligent et à la découverte de contenus d'informations non civilisés dans plusieurs scénarios.

Les trois technologies de base du filtrage intelligent de Jiuyan : variante intelligente, désambiguïsation sémantique et temps réel rapide

1. Identification intelligente des variantes : le filtrage intelligent de Jiuyan utilise la gestion de dictionnaire d'arbre TRIE à double tableau américain et Méthode de récupération, le système identifie automatiquement les variations telles que les mots déformés, les mots phonétiques, les divisions de mots, le bruit, le chinois traditionnel et simplifié, la pleine largeur et la demi-largeur, ainsi que divers bruits d'interférence au milieu en même temps, le système prend en charge ; lexique personnalisé et ajoute progressivement des millions de lexiques.

2. Désambiguïsation sémantique : le filtrage intelligent Jiuyan utilise le système de segmentation sémantique précise des mots NLPIR et le système d'analyse des sentiments pour identifier et filtrer avec précision, exclure les informations positives et inoffensives et réduire considérablement le taux d'erreur de jugement.

3. Rapide et en temps réel : le filtrage intelligent Jiuyan utilise un algorithme breveté, une analyse rapide, une vitesse de machine unique de 30 Mo/s ; prend en charge le multithreading sur une seule machine, la parallélisation multi-machine, le mode de service cloud Hadoop, permettant d'obtenir un fonctionnement parallèle. et traitement efficace du contenu d'information au niveau PB Vérifiez en ligne.

En tant qu'orientation future du développement des applications ou des plates-formes Internet, le contenu joue un rôle essentiel dans tous les domaines de la vie. Un meilleur mécanisme d'examen devrait être introduit pour établir un environnement de contenu sain lorsque les mauvaises informations sont répandues, même aujourd'hui. , il est imminent que cela devienne un moyen pour les produits concurrents de s'auto-cadrer. Cela nécessite également que la mauvaise technologie de filtrage des informations ait besoin d'une plus grande précision pour répondre à ses besoins.


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal