24 juni 2021 20:15

Natuurlijke taalverwerking (NLP)

Natural Language Processing (NLP) is een gebied van kunstmatige intelligentie waarmee computers menselijke taal kunnen analyseren en begrijpen. Het is ontwikkeld om software te bouwen die natuurlijke talen genereert en begrijpt, zodat een gebruiker natuurlijke gesprekken kan voeren met een computer in plaats van via programmeren of kunstmatige talen zoals Java of C.

Natuurlijke taalverwerking (NLP) doorbreken

Natural Language Processing (NLP) is een stap in een grotere missie voor de technologiesector – namelijk het gebruik van  kunstmatige intelligentie (AI) om de manier waarop de wereld werkt te vereenvoudigen. De digitale wereld is voor veel bedrijven een game-changer gebleken, aangezien een steeds technologischer wordende bevolking nieuwe manieren vindt om online met elkaar en met bedrijven om te gaan. Sociale media hebben de betekenis van gemeenschap opnieuw gedefinieerd; cryptocurrency heeft de digitale betalingsnorm veranderd; e-commerce heeft een nieuwe betekenis van het woord gemak gecreëerd, en cloudopslag heeft een nieuw niveau van dataretentie voor de massa geïntroduceerd.

Door AI openen velden als machine learning en deep learning de ogen voor een wereld van alle mogelijkheden. Machine learning wordt steeds vaker gebruikt in data-analyse om betekenis te geven aan big data. Het wordt ook gebruikt om chatbots te programmeren om menselijke gesprekken met klanten te simuleren. Deze voorwaartse toepassingen van machine learning zouden echter niet mogelijk zijn zonder de improvisatie van Natural Language Processing (NLP).

Hoe werkt NLP eigenlijk?

NLP combineert AI met computationele taalkunde en informatica om menselijke of natuurlijke talen en spraak te verwerken. Het proces kan in drie delen worden opgesplitst. De eerste taak van NLP is het begrijpen van de natuurlijke taal die de computer ontvangt. De computer gebruikt een ingebouwd statistisch model om een ​​spraakherkenningsroutine uit te voeren die de natuurlijke taal omzet in een programmeertaal. Het doet dit door een recente toespraak die het hoort op te splitsen in kleine eenheden, en deze eenheden vervolgens te vergelijken met eerdere eenheden uit een vorige toespraak. De output of het resultaat in tekstformaat bepaalt statistisch de woorden en zinnen die het meest waarschijnlijk werden gezegd. Deze eerste taak wordt het spraak-naar-tekstproces genoemd.

De volgende taak wordt de part-of-speech (POS) tagging of woordcategorie ondubbelzinnig genoemd. Dit proces identificeert elementair woorden in hun grammaticale vormen als zelfstandige naamwoorden, werkwoorden, bijvoeglijke naamwoorden, verleden tijd, enz. Met behulp van een reeks lexiconregels die in de computer zijn gecodeerd. Na deze twee processen begrijpt de computer nu waarschijnlijk de betekenis van de gesproken toespraak.

De derde stap die door een NLP wordt gezet, is de conversie van tekst naar spraak. In dit stadium wordt de computerprogrammeertaal omgezet in een hoorbaar of tekstueel formaat voor de gebruiker. Een chatbot voor financieel nieuws, bijvoorbeeld, die een vraag krijgt als ‘Hoe doet Google het vandaag?’ zal hoogstwaarschijnlijk online financiële sites scannen op Google-aandelen en kan besluiten om alleen informatie zoals prijs en volume als antwoord te selecteren.

NLP probeert computers intelligent te maken door mensen te laten geloven dat ze met een ander mens omgaan. De Turing-test, voorgesteld door Alan Turing in 1950, stelt dat een computer volledig intelligent kan zijn als hij kan denken en een gesprek kan voeren als een mens zonder dat de mens weet dat ze daadwerkelijk met een machine praten. Eén computer in 2014 slaagde er achteraf voor de test: een chatbot met de persoonlijkheid van een 13-jarige jongen. Dit wil niet zeggen dat een intelligente machine onmogelijk te bouwen is, maar het beschrijft wel de moeilijkheden die inherent zijn aan het laten denken of converseren van een computer als een mens. Omdat woorden in verschillende contexten kunnen worden gebruikt en machines niet de echte ervaring hebben die mensen hebben om entiteiten in woorden over te brengen en te beschrijven, kan het wat langer duren voordat de wereld de computerprogrammeertaal volledig kan afschaffen.