Voice Agent
Voice Agents sind KI-gesteuerte Sprachsysteme, die natürliche Telefon- oder Voice-Gespräche autonom führen – von Outbound-Calls bis zu Kundenservice-Hotlines.
Voice Agents führen autonome KI-Telefonate – mit Echtzeit-STT, LLM-Reasoning und TTS für Kundenservice, Sales und Terminbuchung.
Erklärung
Moderne Voice Agents kombinieren Real-Time STT (Whisper, Deepgram), LLM-Reasoning (GPT, Gemini) und Low-Latency TTS (ElevenLabs) in einer Pipeline. End-to-End-Latenz unter 500ms ist entscheidend für natürliche Gespräche.
Relevanz für Marketing
Revolutionieren Call Center, Terminvereinbarung, Outbound Sales und After-Hours-Support. Skalierbar und kosteneffizienter als menschliche Agenten.
Beispiel
Ein KI-Voice-Agent ruft Leads an, qualifiziert sie mit 3 Fragen, bucht Termine im CRM und sendet eine Bestätigung per E-Mail.
Häufige Fallstricke
Latenz über 1s bricht die Illusion. Hintergrundgeräusche degradieren STT. Regulatorische Anforderungen (TCPA, DSGVO) für automatisierte Anrufe. Uncanny Valley bei synthetischen Stimmen.
Entstehung & Geschichte
IVR-Systeme (1990er) boten starre Telefonmenüs. Google Duplex (2018) demonstrierte erstmals natürliche KI-Telefonate. Bland AI, Vapi und Retell (2023-2024) demokratisierten Voice Agent-Plattformen. 2025 sind Sub-500ms-Latenz und emotionale Stimmen Standard.
Abgrenzung & Vergleiche
Voice Agent vs. Voice Assistant (Alexa, Siri)
Voice Assistants warten auf Befehle; Voice Agents führen proaktiv zielgerichtete Gespräche und Aktionen aus.
Voice Agent vs. Chatbot
Chatbots kommunizieren per Text; Voice Agents per Sprache mit Echtzeit-STT/TTS-Pipeline.