Les patrons recherchent des compétences, une expertise et des flux de travail spécifiques, indépendants de la plateforme.
L'image ci-dessous montre 20 compétences recherchées, y compris les fondamentaux de la PNL et une expertise plus large en science des données.
Comme le montre le tableau, la compétence PNL que les patrons apprécient le plus est la connaissance de base en PNL. La demande des employeurs pour des personnes possédant des compétences en analyse de données a augmenté par rapport à l’année dernière.
Cela signifie que nous ne pouvons pas seulement comprendre la plateforme, mais comprendre comment la PNL fonctionne en tant que compétence de base. Si vous ne savez pas comment appliquer les compétences de base de la PNL telles que le transformateur, la classification, la linguistique, la réponse aux questions, l'analyse des sentiments, la modélisation de sujets, la traduction automatique, la reconnaissance vocale, la reconnaissance d'entités nommées, etc., alors il ne sert à rien de savoir comment spaCy fonctionne.
Machine Learning et Deep Learning
Le Machine Learning est une compétence de base en science des données, tandis que le Deep Learning est le fondement de la PNL.
Maîtriser ces deux-là prouvera que vous comprenez la science des données et, par extension, la PNL. Parce que la plupart des employeurs espèrent que les talents pourront utiliser des modèles et des Transformers pré-formés.
Research
NLP doit se tenir au courant des derniers articles et modèles. Les entreprises considèrent la PNL comme l’une des meilleures applications de l’IA, quel que soit le secteur.
Par conséquent, comprendre ou trouver les bons modèles, outils et cadres à appliquer aux nombreux cas d'utilisation différents de la PNL nécessite une forte concentration de recherche.
Fondamentaux de la science des données
Après avoir compris la compétence de base de l'apprentissage automatique, comprendre les bases de la programmation et de l'informatique montrera que vous disposez de bases solides dans le domaine. L'informatique, les mathématiques, les statistiques, la programmation et le développement de logiciels sont autant de compétences requises dans les projets PNL.
Cloud Computing, API et ingénierie des données
Les experts NLP ne font pas d'analyse des sentiments directement sur leurs ordinateurs portables personnels. Les employeurs recherchent des experts en PNL capables de gérer une plus grande partie de l'ingénierie des données, comme l'utilisation d'API, la création de pipelines de données, la gestion des flux de travail et tout cela sur une plate-forme basée sur le cloud.
En plus des compétences et de l'expertise, il existe également des plateformes, des outils et des langages spécifiques que les patrons apprécient particulièrement. Le tableau ci-dessous montre les plateformes les plus populaires actuellement. Cette liste ne couvre pas toutes les plates-formes, il est donc préférable de mettre à jour et de rechercher de nouveaux outils et frameworks populaires.
Machine Learning Framework
En plus de l'apprentissage automatique général et de l'apprentissage profond, certains frameworks sont au cœur des projets PNL.
TensorFlow est populaire pour sa flexibilité dans le ML et les réseaux de neurones, PyTorch est populaire pour sa facilité d'utilisation et sa conception innée en PNL, et scikit-learn est largement utilisé pour la classification et le clustering.
Bien que connaître une seule plateforme soit déjà très puissant, en comprenant ces trois plateformes ou plus, nous pouvons devenir plus flexibles et adaptables, et donc plus compétitifs.
Par rapport à l'année dernière, PyTorch est désormais le framework d'apprentissage automatique le plus populaire et a lentement dépassé TensorFlow/Keras pour devenir le premier choix pour les tâches de ML.
Pour comprendre la PNL plus spécifiquement, voici quelques cadres utiles à ceux qui souhaitent devenir des professionnels de la PNL.
NLTK est apprécié pour sa nature plus large car il est capable d'extraire le bon algorithme pour presque n'importe quelle tâche.
Pendant ce temps, spaCy est apprécié pour sa capacité à gérer plusieurs langues et sa capacité à prendre en charge les vecteurs de mots.
Le nouvel ajout est Apache OpenNLP, qui est principalement utilisé pour les tâches NLP courantes et les opérations simples, et CoreNLP est utilisé pour Java.
Étonnamment, les transformateurs HuggingFace dotés d'une architecture d'apprentissage profond ne figuraient pas sur la liste de l'année dernière.
BERT est resté extrêmement populaire au cours des dernières années, et même si la dernière mise à jour de Google remonte à fin 2019, il est toujours largement utilisé.
BERT se distingue par sa forte affinité pour les recherches de questions-réponses et de similarité basées sur le contexte, ce qui lui permet de fonctionner de manière fiable dans les chatbots et autres applications connexes.
BERT prend même en compte le contexte du mot, permettant des résultats plus précis et pertinents pour les requêtes et tâches individuelles.
Les pipelines de données facilitent le flux de données textuelles, en particulier pour le streaming de données en temps réel et les applications basées sur le cloud. Et dans ce domaine, même si d’autres plateformes continuent de croître, Spark reste le leader des pipelines de données.
Il existe même une version plus spécifique, Spark NLP. Il s'agit d'une bibliothèque spécialement conçue pour les tâches linguistiques. Spark NLP est largement utilisé, en particulier dans le domaine de la santé – un domaine gourmand en données avec de nombreux dossiers médicaux et données médicales.
Python, en tant que langage de programmation préféré pour la PNL, a toujours été loin en avance, ce qui ne devrait surprendre personne.
De nombreux frameworks NLP populaires, tels que NLTK et spaCy, sont basés sur Python, il est donc logique de devenir un expert du langage compagnon Python.
Connaître un peu de SQL est également indispensable. Java possède de nombreuses bibliothèques conçues pour le langage, notamment CoreNLP, OpenNLP, etc.
Les services cloud sont la norme en 2022, nous voyons donc certains fournisseurs de services devenir de plus en plus populaires.
AWS Cloud, Azure Cloud et autres sont compatibles avec de nombreux autres frameworks et langages, ce qui en fait un incontournable pour toutes les compétences en PNL. Au même moment, Google Cloud commençait à s’imposer.
Dans l'ensemble, si vous souhaitez développer un nouveau point de compétence et acquérir une compétence rare, intemporelle et largement utilisée, alors c'est peut-être le moment d'apprendre la PNL ou d'autres compétences de base en science des données !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!