Låt oss förstå NLP!
Under 2018 har vi arbetat med att utveckla vår NLP (Natural Language Processing) för att ta itu med de utmaningar som företag idag försöker övervinna, till exempel att möta och hantera kundbeteende, samla marknadsinsikter via sentimentanalys samt förbättra kundupplevelsen med hjälp av Chatbots.
Vad som skiljer oss från andra gällande våra ML (Machine Learning) och NLP-utvecklingsinsatser är att vi täcker språk som inte är världsomspännande. Detta inkluderar Balkan språk (slaviska språk) och även skandinaviska språk.
För de stora språken är det mycket lättare att samla in stora mängder data för träning av NLP algoritmer. Å andra sidan finns det mycket mindre för svenska och det är en utmaning!
En sak som gör datahanteringen kring NLP mer komplex är det faktum att språk ständigt utvecklas och det är svårt att hålla takten. Det skiljer sig en del i hur ett språk är strukturerat och i hur en maskin tänker/struktureras.
Maskiner förstår siffror och syftet med NLP-ramverken är att lära maskinerna att förstå språk. Eller, med andra ord, att översätta ett mänskligt språk till ett datorspråk.
En utmaning som finns är att via NLP görs språket begripligt för datorer men inte längre begripligt för människor. Det blir en delikat uppgift att validera testresultaten eftersom du behöver en mänsklig faktor för att kunna bekräfta om testresultaten är giltiga eller inte.
Resultatens noggrannhet beror på träningsdatat som kan hämtas från exempelvis tweets, artiklar, filmrecensioner, akademiska tidskrifter och så vidare. Detsamma gäller för graden av noggrannhet på genererade sammanställningar. För närvarande har vi över 90% noggrannhet.
Seavus har utvecklat verktyget Media Intelligence Platform som arbetar med sentimentanalys, textjämförelse, sammanställning av och identifiering av huvudfrågor i texter. Det här verktyget går att använda för alla språk.
Det är ett mycket användbart verktyg för personer som behöver sammanställa en given textmassa, klassificera dokument och så vidare. Vem har användning av detta? Alla som utför textbehandling, nyhetssammanställningar, artikelkategorisering, jämför texter, nyhetstrovärdighet etc. Verktyget kan extrahera viktiga sökord, taggar, se tematiska nyanser – alla viktiga inslag i en textanalys.
NLP kunskap är också viktig i utvecklingen av Chatbots. Seavus Smart ChatBot har skapats med hjälp av NLP och NLU (natural-language understanding). Det första steget är naturlig språkförståelse, NLU, följt av textgenerering för att ge återkoppling på utfallet. Det sista steget är att skapa en virtuell assistent, eller en samtalsbot, med vilken du kan interagera. Samtalsbotar är oerhört NLP-drivna. Och eftersom det är språkagnostiskt kan ramverket också arbeta med översättning.
Under 2019 fortsätter vi att arbeta med ML och NLP-utveckling och skapa mer avancerade lösningar som kommer att få större inverkan på affärsutveckling och tillväxt.