Le traitement du langage naturel ou PNL est une branche de l'intelligence artificielle qui a de nombreuses implications importantes sur les interactions entre ordinateurs et humains. Le langage humain, développé au cours de milliers et de milliers d’années, est devenu une forme de communication nuancée qui recèle une mine d’informations qui transcende souvent les mots. La PNL deviendra une technologie importante pour combler le fossé entre la communication humaine et les données numériques. Voici 5 façons dont le traitement du langage naturel sera utilisé dans les années à venir.
Traduction automatique
L'information étant en ligne dans le monde entier, il devient de plus en plus important de rendre ces données plus utiles. Le défi de rendre les informations mondiales accessibles à tous, indépendamment des barrières linguistiques, a tout simplement dépassé la capacité de traduction humaine. Des entreprises innovantes comme Duolingo cherchent à recruter un grand nombre de personnes, en faisant coïncider les efforts de traduction et l’apprentissage d’une nouvelle langue. Mais la traduction automatique offre une alternative encore plus évolutive à l’harmonisation des informations du monde. Google est une entreprise à la pointe de la traduction automatique qui utilise un moteur statistique exclusif pour son service de traduction Google. Le défi des technologies de traduction automatique ne réside pas dans la traduction de mots, mais dans la préservation du sens des phrases, un problème technologique complexe au cœur de la PNL.
Combattre le spam
Les filtres anti-spams sont devenus la première ligne de défense contre le problème croissant des e-mails indésirables. Mais presque toutes les personnes qui utilisent beaucoup le courrier électronique ont été prises au dépourvu par des courriels indésirables encore reçus ou des courriels importants pris accidentellement dans le filtre. Les problèmes de faux-positifs et de faux-négatifs des filtres anti-spam sont au cœur de la technologie de la PNL, et se résument à nouveau au défi d'extraire le sens des chaînes de texte. Le filtrage bayésien contre le spam est une technologie qui a beaucoup retenu l'attention. Cette technique statistique consiste à mesurer l'incidence des mots dans un courrier électronique par rapport à son occurrence typique dans un corpus de courrier indésirable et non courrier indésirable.
Extraction de l'information
De nombreuses décisions importantes sur les marchés financiers s'éloignent de plus en plus de la surveillance et du contrôle humains. Le trading algorithmique gagne en popularité, une forme d'investissement financier entièrement contrôlée par la technologie. Mais beaucoup de ces décisions financières sont influencées par les nouvelles, par le journalisme, qui est toujours présenté principalement en anglais. La tâche principale de la PNL consiste donc à prendre ces annonces en texte clair et à extraire les informations pertinentes dans un format pouvant être pris en compte dans les décisions de négociation algorithmique. Par exemple, l'annonce d'une fusion entre entreprises peut avoir un impact important sur les décisions commerciales et la rapidité avec laquelle les détails de la fusion, les joueurs, les prix, les acquéreurs qui peuvent être incorporés dans un algorithme de négociation peuvent avoir des implications en termes de profit. des millions de dollars.
Récapitulation
La surcharge d'informations est un phénomène réel à l'ère numérique et notre accès aux connaissances et aux informations dépasse de loin notre capacité à les comprendre. Cette tendance ne montre aucun signe de ralentissement. Il est donc de plus en plus important de pouvoir résumer le sens des documents et des informations. Ceci est important non seulement pour nous permettre de reconnaître et d’absorber les informations pertinentes à partir de vastes quantités de données. Un autre résultat souhaité est de comprendre les significations émotionnelles plus profondes, par exemple, sur la base de données agrégées provenant de médias sociaux, une entreprise peut-elle déterminer le sentiment général à l'égard de sa dernière offre de produits? Cette branche de la PNL deviendra de plus en plus utile en tant qu’atout marketing précieux.
Question répondre
Les moteurs de recherche nous donnent accès à la richesse mondiale des informations, mais restent généralement assez primitifs pour répondre aux questions spécifiques posées par les humains. Google a constaté la frustration des utilisateurs, qui doivent souvent essayer plusieurs résultats de recherche pour trouver la réponse qu'ils recherchent. Les efforts de Google en PNL ont été principalement axés sur la reconnaissance des questions en langage naturel, l'extraction du sens et la réponse, et l'évolution de la page de résultats de Google a montré cet objectif. Même s’il s’améliore certes, cela reste un défi majeur pour les moteurs de recherche et l’une des principales applications de la recherche sur le traitement du langage naturel.




