Następna generacja chatbotów wykorzystujących sztuczną inteligencję może być tak dobra w odpowiadaniu na Twoje pytania, że nie będziesz w stanie odróżnić ich od rzeczywistych odpowiedników.
Five9, firma stojąca za nową automatyczną sekretarką, uważa, że jej nowa technologia, która wykorzystuje sztuczną inteligencję do dzielenia fraz na dźwięki i tony, zaoszczędzi firmom pieniądze na wydatkach na pracę.
Wykorzystanie ludzkiego głosu do uczenia sztucznej inteligencji ma kluczowe znaczenie dla zapewnienia pozytywnego doświadczenia rozmówcy.
Jaki mechanizm za tym stoi?
Five9 przesłuchało wykonawców w Londynie, aby uzyskać najnowszy głos i wybrało Josepha Vaughna do nagrania serii scenariuszy dla firmy.
Komputer AI był wtedy w stanie odtworzyć nie tylko frazy, ale także różne emocje, rozkładając dźwięk na dźwięki i tony, a nie słowa.
Program został przeszkolony do rozpoznawania kombinacji słów i tonów w mowie rozmówcy, a także jego stanu emocjonalnego.
„Przechwytujemy wszystkie dane dźwiękowe i całą kombinację częstotliwości i wibracji, które są nieodłącznie związane z głosem, które jako człowiek rozpoznalibyśmy jako głos, ale maszyna po prostu zgaduje dźwięki” – Rhyan Johnson, inżynier z laboratoriów Wellsaid, które są zaangażowane w projekt.
„W końcu dźwięki i wzory łączą się, tworząc coś, co rozpoznajemy jako ludzki głos. Możemy dążyć do perfekcji, ale ponieważ ludzki głos jest niedoskonały, zadowolimy się ludzką naturalnością” – dodał.
Five9 twierdzi, że jego agenci AI obsłużyli ponad 82 miliony telefonów do dostawców opieki zdrowotnej, takich jak Covid Clinic, dużych sprzedawców, takich jak Pizza Hut, firmy ubezpieczeniowe, banki, małe przedsiębiorstwa oraz rządy stanowe i miejskie.
W przyszłym roku ich rewolucyjna technologia Virtual Voiceover będzie dostępna.