Spændende ny teknologi som Talegenkendelse er på vej ind i de danske kontaktcentre.

En  særdeles værdifuld måde at få endnu mere viden om kundernes adfærd og behov.

RECORDIT.NU indgik allerede i slutningen 2017 et samarbejde med Mirsk Digital ApS om at udvikle en dansk sprogmodel for telefonsamtaler til brug for talegenkendelse i danske virksomheder.

På den baggrund afholdte RECORDIT.NU og Mirsk Digital i fællesskab et seminar fredag den 5. oktober 2018 med fokus på de muligheder, der ligger i disse løsninger, men også hvilke udfordringer der i den forbindelse ligger i det danske sprog.

Seminaret havde 5 indlægsholdere og det var:

  • Peter Juel Henrichsen, seniorforsker ved Dansk Sprognævn
  • Klaus Akselsen, CTO hos Mirsk
  • Peder Nørgaard, RECORDIT.NU
  • Christian Vinter, Ph.d. i astrofysik og seniorkonsulent hos Innofactor
  • Mikkel Høgenhaug, forretningsspecialist hos ATP

Peter Juel Henrichsen fra Dansk Sprognævn redegjorde i sit indlæg for, hvilke store udfordringer man står overfor, når man skal udarbejde en sprogmodel med base i dansk sprog.

Helt grundlæggende er der ikke tale om talegenkendelse men ORD genkendelse, idet modellen skal kunne genkende hvert enkelt ord, også ud fra i hvilken sammenhæng det bliver brugt, da mange danske ord har flere forskellige betydninger afhængig af sammenhæng.

Det betyder, at man først skal udarbejde en generel akustisk model, som skal kunne genkende og vurdere de lyde, som en given optagelse indeholder.

Derefter skal man lave en – ofte fagspecifik – sprogmodel med et tilstrækkeligt stort ordforråd og sammensætninger af ord.

Først til sidst kan man så lave en søgemaskine der sammenholder begge modeller for, derved at kunne lave et kvalificeret bud på, hvad der er blevet sagt.

En af udfordringerne med det danske sprog er ifølge Peter Juel Henrichsen, at vi har utallige udtaler og variationer af vores vokaler. Alene i forhold til svensk har vi på dansk op til 4 gange så mange variationer, hvilket gør det meget kompliceret at lave en valid akustisk model.

Det er udviklingen af disse modeller som Mirsk i en årrække har arbejdet med og Klaus Akselsen var i sit indlæg inde på, hvor stor betydning det har at både den akustiske model og sprogmodellen taler sammen.

En væsentlig del af dette er, at få etableret et udtaleleksikon som kan tage højde for de udsving, der kan være i lokale og regionale dialekter. Derfor anvender Mirsk en metode, hvor den akustiske model ikke tager udgangspunkt i klassiske studieoptagelser, men i materiale fra optagede telefonsamtaler. Det sikrer en større robusthed i modellen og dermed en højere genkendelsesrate.

For at sikre en endnu højere genkendelsesgrad fokuserer Mirsk også på, at der udarbejdes fagspecifikke sprogmodeller, hvor relevant tekst med millioner af ord ligger til grund for modeller.
 

Men hvordan kan det så bruges i praksis ?

Her præsenterede Peder Nørgaard fra RECORDIT.NU en løsning, hvor talegenkendelsen kan bruges som overbygning på en allerede eksisterende RECORDIT Voice Recording løsning.

Forudsætning for at anvende talegenkendelse er naturligvis, at virksomheder optager og lagrer kundesamtalerne. Herefter skal der ske en transskribering, hvor det talte ord bliver oversat til en tekst, der så kan danne grundlag for relevante søgninger.

Herefter vil det være muligt at søge på udvalgte ord i alle de optagede samtaler fremfor som i dag, hvor mange virksomheder kun anvender få procent af de optagede samtaler i træningsmæssig sammenhæng. Nu er det en reel mulighed at søge efter alle de samtaler, hvor kunder nævner ordet ”opsige”, ”flytte” eller ”utilfreds”.

Derfor får virksomheden et langt bedre billede af samtalernes indhold og har dermed mulighed for at iværksætte de nødvendige tiltag som skal fastholde en eksisterende kunde.

Kan udnytte data endnu bedre? 

Ja, var svaret fra Christian Vinter fra Innofactors. Han præsenterede et analyseværktøj, der kan håndtere og bearbejde store mængder af data, herunder tekst.

Men det står også klart, at de mange tekstlinjer ikke kan stå alene. De bør naturligvis kombineres med de øvrige oplysninger som virksomheden har om den enkelte kunde. Og man skal være indstillet på, at denne proces tager tid.

Som eksempel nævnte Christian Vinter en analyseopgave, de havde udført for Københavns Universitet med henblik på at spotte de studerende, der ville falde fra efter 1. semester. På baggrund af de data som universitet kunne give på de nye studerende, fandt man ingen signifikante parametre som var afgørende for frafaldet efter 1. semester. Men ved fortsat analyse af de studerendes adfærd på 1. semester sammen med de data, der var kendt fra deres ansøgning, kunne Innofactors på 86% nøjagtighed spotte de studerende, der ville falde fra på 2. og 3. semester.

Dermed åbner der sig store muligheder for virksomheder, der begynder at anvende talegenkendelse, for netop disse data kan være med til at give store indsigter i kundernes fremtidige adfærd, og dermed bliver det muligt, at sætte ind med tiltag i tide, der kan fastholde kunden, reagere tidligere på nye trends og udvikling i markedet, eller opnå effektiviseringer.

Til slut kunne Mikkel Høgenhaug fortælle om den store transformation som ATP i øjeblikket er i gang med for at sikre, at de mange kunder får den rigtige betjening på det rigtige tidspunkt.

I den forbindelse bruger ATP en lang række forskellige metoder og input lige fra de klassiske kundeundersøgelser, tilfredshedsmålinger, Customer Journey Mapping men også ved hjælp af talegenkendelse.

For ATP handler det om at give kunderne den bedste, men også mest effektive betjening når de henvender sig. Derfor er det vigtigt, at man i alle kontaktpunkter anvender den kommunikationsform, som passer bedst til kunden.

Det kan talegenkendelse være med til at afklare og kan også give indsigt i, hvad kunderne i øvrigt spørger om. Hvilket ofte kan være noget helt andet end den oprindelige årsag til deres henvendelse.

Relaterede udgivelser: