Einen Voice-Bot zu bauen unterscheidet sich maßgeblich von der Entwicklung eines chatbasierten Pendants. Die Sprachverarbeitung muss präzise sein, und die Stimme sowie die Persönlichkeit des Voice-Bots müssen zur Marke passen. Zusätzlich muss der Voice UX Designer das Fehlen von visuellen Hinweisen und Gesprächsverläufen ausgleichen.
Viele entscheiden sich der Einfachheit wegen für eine chatbasierte Lösung, doch nur eine plattformnative Voice-Lösung kann Sprachdienste hervorragend gestalten und unvergessliche Anruferlebnisse schaffen. Voice steht bei Cognigy an erster Stelle. Wir unterstützen Unternehmen dabei, hochmoderne virtuelle Agenten für Telefonservices zu entwickeln und bereitzustellen – so unkompliziert und effizient wie möglich.
In diesem Blogeintrag zeigen wir dir 15 fortschrittliche Funktionen, die Cognigy.AI zur ersten Wahl für die Automatisierung von Sprachdiensten im Kundenservice machen.
Hyper-realistisches VUX
3. Atmosphere Sounds und Silence Overlay
Intelligente Interaktionen
5. Integriertes Abweichungs- und Eskalationsmanagement
6. Spracherkennung und Echtzeitübersetzung
Einzigartiges Voice Design und Testing
7. KI-Stimmen perfektionieren mit Low Code SSML
8. Click-and-call Softphone für Live-Tests
9. Voice Preview für detaillierte Erlebnisüberprüfung
10. Live Follow
Erweiterte Anrufsteuerung
11. Barge-in und automatische Spracherkennung (ASR)
13. Call Recording und Quality Management
Nahtlose Contact Center Integration
Hyper-realistisches VUX
1. Natürliche Stimmen
Stimme ist mehr als nur ein Kommunikationsmittel – sie ist entscheidend für emotionale Verbindungen, den Ausdruck von Empathie und den Aufbau von Vertrauen. Eine menschliche Stimme kann die einzigartige Identität und Werte einer Marke hervorheben.
Zur Bereitstellung realistischer Gespräche, integriert Cognigy.AI über 1.000 synthetische Stimmen, darunter führende GenAI-gestützte Stimmen von ElevenLabs, Deepgram, Microsoft und AWS. Weiterhin ist das Hosten eigener Sprachdienste und angepasster Stimmen möglich, beispielsweise geklonter Stimmen. Hör's dir an.
2. Best-in-Class STT
Die Spracherkennung (Speech-to-Text, STT) bestimmt, wie genau dein KI-Agent Kundenanfragen verarbeiten kann, und hat damit direkten Einfluss auf die Servicequalität. Cognigy integriert führende STT-Anbieter nahtlos, darunter Deepgram, Microsoft, AWS, Google, Nuance und Soniox und ermöglicht zudem die Einbindung beliebiger Drittanbieter-STT-Lösungen, einschließlich On-Premise-Implementierungen. Außerdem können spezialisierte Sprachmodelle für bestimmte Anwendungsfälle konfiguriert werden. Diese Modelle passen sich je nach Kontext dynamisch an, um die Erkennungsgenauigkeit zu verbessern.
3. Atmosphere Sounds und Silence Overlay
Latenzzeiten in Voice-AI-Systemen sind aufgrund technischer Faktoren unvermeidbar. Dazu zählen unter anderem die Sprach-zu-Text- (STT) und Text-zu-Sprach-Konvertierung (TTS), die Datenabfrage im Backend sowie die Nutzung externer APIs wie etwa von LLMs. Obwohl sich diese Latenzen technisch nicht vollständig eliminieren lassen, können sie durch den gezielten Einsatz von Psycholinguistik und bewährte Methoden im Konversationsdesign effektiv gemanagt werden.
Silence Overlay von Cognigy.AI ermöglicht es, Gesprächspausen mit vorprogrammierten Geräuschen wie beispielsweise dem von Tippbewegungen auf einer Tastatur, zu überbrücken. Dadurch entsteht der Eindruck, dass die KI sofort reagiert und das Gespräch dynamisch führt. Noch einen Schritt weiter geht die Integration von Atmosphere Sounds, die realistische Hintergrundgeräusche eines Contact Centers ergänzen. So entsteht eine hyperrealistische Voice User Experience (VUX), die Usern ein authentisches und lebendiges Erlebnis bietet.
Intelligente Interaktionen
4. Erstklassige KI
Cognigy kombiniert eine leistungsstarke NLU-Engine mit modernsten LLMs, um präzises Verständnis und kontextgerechte Antworten zu ermöglichen. Dabei werden auch komplexe Aspekte wie Emotionen, Sarkasmus oder Umgangssprache erkannt und in passende Reaktionen umgesetzt. Das Ergebnis ist eine natürliche und kohärente Kommunikation. Dabei bleiben Cognigys LLMs in klar definierten Grenzen. Fehler oder manipulative Eingaben (z. B. durch prompt injections) werden von der Orchestrierungsschicht gezielt erkannt, so dass die Kontrolle über Inhalte gewahrt bleibt.
Ergänzend zur Sprachinteraktion bietet Cognigy xApps einen zusätzlichen Kommunikationskanal. Dieser ist nahtlos integriert, gleicht fehlende visuelle Reize aus und erweitert die Funktionalität, um ein konsistentes und effizientes Nutzererlebnis zu schaffen.
5. Integriertes Abweichungs- und Eskalationsmanagement
Eine durchdachte Strategie für den Umgang mit Fehlern und die Weitergabe von Fällen an Mitarbeitende ist besonders auf Sprachkanälen von entscheidender Bedeutung, da visuelle Hilfsmittel oft fehlen. Um Fehler effektiv zu managen und Gesprächsabbrüche zu vermeiden, bietet Cognigy verschiedene Eskalationsverfahren – darunter das Umformulieren von Nachrichten, das Überspringen einer Frage oder fortgeschrittene Maßnahmen, wie die Initiierung eines alternativen Flows oder die Weiterleitung an Mitarbeitende.
6. Spracherkennung und Echtzeitübersetzung
Wenn deine Kundenstrategie lokalisierte Sprachdienste umfasst, haben wir gute Nachrichten:
Mit Cognigy.AI ist das Entwickeln und Bereitstellen von mehrsprachigen Telefonbots besonders einfach. Dazu stehen mehrere Ansätze zur Verfügung. Mit nur wenigen Klicks können Inhalte und Modelle zur effektiven Absichtserkennung vorab übersetzt und lokalisiert werden. Alternativ kann der Voice Agent die Sprache von Gesprächspartner:innen erkennen und das Gespräch in Echtzeit übersetzen.
Einzigartiges Voice Design und Testing
7. KI-Stimmen perfektionieren mit Low-Code SSML
Eine natürliche Stimme ist die Grundlage für intuitive Konversationen. Betonung, Pausen, Stimmlage, Lautstärke etc. tragen alle zu einem authentischen Erlebnis bei. Pausen zwischen Sätzen oder die Betonung bestimmter Begriffe mögen zwar unwesentlich wirken, doch sie sind die Grundlage eines menschlich klingenden KI-Agenten.
Cognigys SSML-Editor bietet dabei präzise Kontrolle über Stimmelemente. Die integrierten Markup-Vorlagen machen den Editor für nicht-technische User zugänglich und bieten für Voice UX-Entwickler eine solide Grundlage.
8. Click-and-call Softphone für Live-Tests
Häufige und kontinuierliche Tests sind entscheidend, um eine effektive und zuverlässige KI-Performance zu gewährleisten. Das integrierte Softphone von Cognigy ermöglicht es, Anrufe direkt aus dem Interaktionspanel mit nur einem Klick zu tätigen. So kann das Erlebnis bei der Entwicklung von KI-Agenten kontinuierlich überprüft werden, was die Qualitätssicherung und Wartung deutlich erleichtert. Das Softphone greift auf dasselbe Telefonsystem wie Endkund:innen zu und repliziert das Verhalten von Bots mit 100% Genauigkeit.
9. Voice Preview für detaillierte Erlebnisüberprüfung
Zumal sich Kundenbedürfnisse und Geschäftsangebote ständig weiterentwickeln, sind die schnelle Umsetzung von Änderungen und kontinuierliche Verbesserungen nötig, um den Voice-Service auf dem neuesten Stand zu halten. Bei großen und komplexen KI-Agenten-Workflows müssen spezifische Teile von Gesprächen oft schnell überprüft und aktualisiert werden.
Cognigy.AI ermöglicht die Änderung von Anrufeinstellungen zu jedem Zeitpunkt des Gesprächsflusses und die Überprüfung von Audioausgaben ohne Latenz. Die einzigartige Voice Preview Funktion ermöglicht eine detaillierte Untersuchung des Sprachflusses, bis hin zu einzelnen Antworten.
10. Live Follow
Nach der Fertigstellung deines KI-Agenten Workflows muss die ganze Nutzererfahrung getestet werden. Am besten ruft man mit einem externen Mobilgerät an. Die Funktion Live Follow erlaubt dann, das gesamte Gespräch in Echtzeit über den Flow Editor abzurufen, um Fehler und Ungereimtheiten zu erkennen und zu debuggen.
Erweiterte Anrufsteuerung
11. Barge-in und automatische Spracherkennung (ASR)
Gelungene Sprachinteraktionen erfordern die Anpassung an unterschiedliche Sprechgeschwindigkeiten und -stile der User. Mit Cognigys Barge-in-Funktion können Anrufende das System unterbrechen, während es spricht und das Gespräch damit lenken. Die automatische Spracherkennung (ASR) ordnet den Sprachstil von Personen ein und sorgt dafür, dass Pausen nicht als Ende einer Äußerung interpretiert werden, insbesondere bei langen und komplexen Ausführungen.
12. Ausgehende Anrufe
Die moderne KI-Workforce geht über reaktiven Support hinaus und erkennt Kundenbedürfnisse proaktiv. Personalisierte Follow-ups, Produktempfehlungen, Vertragsverlängerungen, Terminvereinbarungen und viel mehr fallen in diesen Bereich. Cognigys KI-Workforce initiiert ausgehende Anrufe unkompliziert und fördert die proaktive Kundeninteraktion, um Kommunikationseffizienz und Kundenbindung zu stärken.
13. Call Recording und Quality Management
Die Anrufaufzeichnung ist entscheiden für das Monitoring und die Verbesserung der Servicequalität im Contact Center. Das Cognigy Voice Gateway ermöglicht die Aufzeichnung aller Gespräche und Überprüfung der Leistung von Voice KI-Agenten. Call Tracing bietet die Möglichkeit, Anrufaktivitäten visuell darzustellen, darunter Spracherkennung und Wellenformen der Audiospur. So erhält man tiefgehende Einblicke in Sprachinteraktionen, optimiert die Reaktionszeiten, löst sich überschneidende Gespräche und stellt eine hochwertige KI-Sprachausgabe sicher.
Nahtlose Contact Center Integration
14. Plug-and-Play Contact Center Konnektivität
Cognigy.AI unterstützt die Integration mit nahezu jeder Voice-Infrastruktur, sei es CCaaS, CPaaS, lokale Contact-Center oder PSTN- und PBX-Telefonnetzwerke – entweder durch vorgefertigte APIs oder generische SIP- und WebRTC-Schnittstellen. Diese Flexibilität deckt das gesamte Spektrum von Voice-Anwendungsfällen, Conversational IVR, Self-Service, ausgehenden Anrufen, Mitarbeiter-Support, und Echtzeitübersetzungen ab. Darüber hinaus wird der Integrationsaufwand zugunsten der Kundenerfahrung minimiert und die Marketinführungszeit verkürzt.
15. Echtzeit-Mitarbeitersupport
In manchen Fällen ist es vorteilhaft, wenn der KI-Agent den Fall an einen Mitarbeitenden übergibt. Agent Copilot gestaltet dies nahtlos und unter fortbestehendem Beisein des KI-Agenten, der weiterhin zuhört und Mitarbeitende proaktiv unterstützt (z.B. durch Antwortvorschläge, Live-Übersetzung, Sentiment-Analyse oder Dokumentensuche). Im Anschluss daran bearbeitet der KI-Agent den Fall eigenständig nach und legt die erfassten Daten korrekt ab. So bringt Agent Copilot herausragende Erlebnisse in den Kundenservice – für alle: Mitarbeitende UND Kund:innen.
Noch mehr technische Details zu Cognigys Voice-Technologie, gibt's hier.