Večina projektov glasovne umetne inteligence ne propade zaradi tehnologije. Propade pri prvem vprašanju, ki ga uprava postavi. “Dobro, Igor, povejte mi naravnost - koliko ljudi v klicnem centru lahko s tem odpustimo?” To vprašanje mi je pred kratkim postavil finančni direktor na sestanku o uvedbi glasovne umetne inteligence v podporo strankam. Ne pri nas - pri stranki. Za mizo so sedeli še vodja podpore in dva človeka iz IT-ja.
Pol ure smo bili zelo konkretni. Kaj mora glasovni agent znati, katere sisteme mora poznati, kje se pogovor zaključi, kdaj mora vključiti človeka, kje je tveganje in kje poslovna priložnost. Potem je prišlo vprašanje, zaradi katerega sem za trenutek zajel sapo. Vprašanje je bilo pošteno. Tudi pričakovano. In popolnoma napačno - ne zato, ker bi bilo neetično, ampak zato, ker bi napačen odgovor skoraj zagotovo ubil projekt. Če glasovno umetno inteligenco začnete uvajati z vprašanjem, koliko ljudi lahko odpustite, boste zelo verjetno zgradili slabšo storitev. Morda bo cenejša, morda bo v Excelu videti odlično. Stranka pa bo precej hitro začutila, da na drugi strani ni pomočnik, ampak ovira. In pri podpori strankam je ovira smrtni greh.
Tole me je presenetilo, ko sem kasneje gledal podatke. Mislil sem, da gre pri odporu ljudi do botov za odpor do tehnologije. Pa ne gre. Gre za nekaj precej bolj neprijetnega za vse nas, ki to tehnologijo prodajamo in uvajamo. Ljudje ne zavračajo umetne inteligence. Zavračajo občutek, da jih nihče ne posluša. Pred nekaj tedni sem klical dostavno službo. Bot mi je trikrat zaporedoma rekel, naj “prosim, povem svojo težavo v eni povedi”. Pri četrtem poskusu sem zarjul “operater” in čakal devet minut. Tega ni le pri meni - SurveyMonkey poroča, da 79% vprašanih pri podpori strankam močno raje komunicira s človekom kot z AI agentom. Še bolj zgovorno: YouGov je v Veliki Britaniji ugotovil, da je samo 1 % ljudi kot najljubši kanal za podporo izbral chatbot - čeprav ga 18 % uporablja. Ta razkorak med “uporabljam” in “želim” pove skoraj vse. Ljudi pogosto rinemo v kanal, ki si ga sami nikoli ne bi izbrali. Potem pogledaš drugo tabelo in vidiš nekaj zanimivega. V Veliki Britaniji je 74 % ljudi AI uporabilo v zadnjih šestih mesecih. Isti človek, ki doma brez težav uporabi AI, lahko dopoldne še vedno besni nad botom svoje banke. Ne gre za strah pred stroji. Gre za slabo izkušnjo.
Povejmo naravnost, kar vsi vemo, pa neradi izrečemo na sestankih. Velika večina projektov glasovne umetne inteligence v podpori strankam se začne kot vaja v varčevanju. 91% vodij podpore je pod pritiskom uprave, naj uvedejo AI. To je kontekst. Zato vprašanje finančnega direktorja ni nobeno presenečenje. Koliko dela lahko prestavimo na stroj? Koliko klicev lahko zadržimo? Koliko ljudi bomo potrebovali manj?
Težava je, da stranke to začutijo. 81 % potrošnikov verjame, da je glavni cilj uvedbe AI prihranek podjetja, ne boljša storitev. Tu se projekt pogosto zalomi, še preden se zares začne. Ko stranka začuti, da je bot pravzaprav pregrada, postavljena zato, da varuje vaš proračun pred njo, je zaupanje izgubljeno. Tehnično lahko vse deluje. Občutek pa bo vseeno slab.
Klarna je dober opomin. Februarja 2024 so ponosno sporočili, da njihov AI pomočnik opravlja delo 700 agentov. Leto kasneje so se pojavila poročila, da podjetje zaradi kakovosti storitve spet dodaja ljudi v podporo. Bot je tehnično deloval. Na kompleksnih primerih pa je bil prepogosto generičen. Tehnologija tu ni bila glavni problem. Začeli so z napačnim vprašanjem.
Pri človeškem agentu se zgodi nekaj zanimivega. Ko reče “samo trenutek, da preverim vaš primer”, in v ozadju slišimo tipkanje, dobimo občutek, da se nekdo ukvarja z nami. Da naš primer ni samo še ena vrstica v sistemu. Mogoče je občutek varljiv, ampak je pomemben. Ko bot v pol sekunde izstreli tehnično pravilen odgovor, pogosto začutimo ravno nasprotno - da nas je sistem stisnil v obrazec, da je naš problem prepoznal kot kategorijo, ne kot situacijo.
Še slabša je lažna empatija. Stranka napiše: “Nujno moram prestaviti let, mama je v bolnišnici.” Slab bot prepozna besedi “prestaviti let” in izpiše politiko doplačil, potem pa doda še: “Žal mi je za vašo situacijo.” To ni empatija, to je avtomatizirana vljudnost brez vsebine. In ljudje jo zaznajo takoj. Stranka ne potrebuje, da se bot pretvarja, da čuti. Potrebuje, da jo dovolj dobro razume in pripelje do rešitve - ali pa da jo dovolj hitro, z vsem kontekstom, preda človeku. Tu je bistvena razlika. Podjetje, ki sprašuje “kako bomo prihranili”, oblikuje bota, ki minimizira strošek interakcije. Podjetje, ki sprašuje “kako bomo izboljšali izkušnjo”, oblikuje bota, ki rešuje strankin problem. Na papirju sta si lahko podobna. V praksi nista isti stroj.
V naši praksi se ta razlika hitro pokaže. Pri FrodXu z glasovnimi agenti delamo vsak dan. Naša storitev Kinetara je aprila prvič presegla mejnik 10.000 obdelanih produkcijskih klicev - pri dvanajstih strankah v šestih panogah. To ni laboratorijski demo, to so resnični klici resničnih ljudi. Rezervacije, termini, spremembe, vprašanja, reklamacije. Tudi slaba volja, ker ljudje v podporo ne kličejo zato, ker imajo preveč časa. Iz tega vzorca smo potegnili tri ugotovitve.
Novembra 2025 je 27 % klicateljev odložilo slušalko v prvih petnajstih sekundah - takoj ko so zaslišali, da je na drugi strani stroj. Aprila 2026 je bilo takih samo še 8,5 %, torej trikrat manj. To ni kozmetika. Pomeni, da se ljudje učijo: če izkušnja nekajkrat deluje, odpor pade. Ne zato, ker bi se ljudje nenadoma zaljubili v bote, ampak zato, ker ugotovijo, da pogovor z dobrim glasovnim agentom ni izguba časa.
Ko glasovni agent doseže cilj klica, je 76 % pogovorov pozitivnih; ko cilja ne doseže, samo 50 %. Pri rezervacijah in terminih dosega med 78 in 90 % uspešnosti, pri preprostih transakcijah tudi do 100 %. Recimo takole: ljudi ne moti stroj zato, ker je stroj. Moti jih stroj, ki jih zadrži, zmede ali vrti v krogu.
Na prvi pogled bi kdo rekel: aha, torej ljudje nočejo predaje. Ampak to ni prava interpretacija. Problem ni predaja človeku, problem je slaba predaja. Ko mora stranka človeku še enkrat razložiti vse, kar je že povedala stroju, niste naredili hibridne storitve - naredili ste dve slabi izkušnji zapored.
Točno to se je zgodilo meni pri klicu zavarovalnici. Najprej sem vse razložil avtomatskemu sistemu, potem sem prišel do gospe, potem sem moral začeti od začetka. V tistem trenutku me ni več zanimalo, ali imajo dober sistem. Zanimalo me je samo še, zakaj sem moral isto stvar povedati dvakrat.
Iz teh podatkov je precej jasno, kje glasovna umetna inteligenca deluje dobro. Deluje pri strukturiranih, predvidljivih, ponavljajočih se klicih - pri rezervacijah, preverjanju terminov, potrditvah, spremembah podatkov, osnovnih vprašanjih, statusih naročil, preprostih transakcijah. In teh klicev je v vsakem podjetju več, kot vodstvo običajno misli. Ne deluje pa povsod. Ne deluje, kadar je večina klicev unikatnih in kompleksnih, kadar je politika podjetja, da mora stranka vedno govoriti s človekom, pri nujnih primerih, kjer ne sme biti niti sekunde zamika, in kadar podjetje nima urejenih podatkov, procesov in pravil odločanja.
In tu je poanta, ki si jo velja zapomniti. Glasovni agent ni slabša, cenejša različica človeka, ki jo nekam stlačite, da prihranite pri plači. Je nekaj drugega - zelo dober izvajalec jasno definiranih nalog, z drugačnimi močmi in drugačnimi mejami kot človek. Kdor ga uvaja, kot da je poceni človek, ga uvaja na napačno mesto. Zato s Kinetaro ne prodajamo zadržanih klicev in ne odpuščenih ljudi. Prodajamo izid: koliko vhodnih klicev je dejansko rešenih, ob kakšnem zadovoljstvu - in kako čista je predaja za tisti del, ki mora naprej k človeku. Glasovni agent naj prevzame dolgočasne, ponavljajoče se klice, tudi tistih 27 %, ki pridejo izven delovnega časa in bi sicer ostali neodgovorjeni. Človek pa naj dobi nazaj čas za pogovore, kjer se zares splača biti človek - za jezno stranko, za izjemo, za zapleten primer, za situacijo, kjer pravila ne zadoščajo in je treba presoditi.
Vprašanje za upravo
Finančnemu direktorju s tistega sestanka zato nisem odgovoril na vprašanje, koliko ljudi lahko odpusti. Odgovoril sem mu na vprašanje, ki ga je pozabil postaviti: katere klice lahko rešimo bolje, hitreje in bolj dosledno - in pri katerih mora človek ostati človek?
To je razlika med slabim in dobrim projektom glasovne umetne inteligence. Slab projekt začne pri strošku, dober pri izkušnji. Kdor začne z vprašanjem “koliko ljudi lahko odpustimo”, bo skoraj vedno naredil slabšega bota. Kdor začne z vprašanjem “katero izkušnjo lahko izboljšamo”, bo na koncu pogosto tudi prihranil. Prihranek pride šele takrat, ko stranko nehate obravnavati kot strošek.
Več o tem, kaj glasovni AI lahko prinese vašemu projetku preberite tukaj.