Übersicht
Voice Mode ermöglicht Echtzeit-Sprachgespräche mit Apollo Brain. Es nutzt die GPT-4o Realtime API von OpenAI für die Sprachverarbeitung, wobei die Tools von Apollo Brain als Funktionsaufrufe verfügbar sind — so können Sie Fragen stellen, Aufgaben erstellen und Ihren Workspace vollständig per Sprache verwalten.Funktionsweise
Modi
- Push-to-Talk (PTT)
- Freisprechend
Halten Sie einen Button gedrückt, um zu sprechen, lassen Sie los, um zu senden. Ideal für laute Umgebungen.
Audioverarbeitung
- Echo Gate — verhindert, dass die Lautsprecherausgabe vom Mikrofon aufgenommen wird und vermeidet Rückkopplungsschleifen
- Stummschaltung — schalten Sie Ihr Mikrofon schnell stumm
- Echtzeit-Indikatoren — visuelles Feedback, das anzeigt, ob das System zuhört, verarbeitet oder spricht
Beispielgespräche
Sie: “Was sind meine Aufgaben für heute?” Brain: “Sie haben 5 Aufgaben für heute. Zwei haben hohe Priorität: die API-Endpoint-Migration und der Login-Bugfix. Soll ich sie durchgehen?”
Sie: “Erstelle eine Aufgabe zur Überprüfung der Deployment-Pipeline, weise sie mir zu, hohe Priorität, bis Ende der Woche” Brain: “Ich möchte eine Aufgabe erstellen: ‘Deployment-Pipeline überprüfen’, Ihnen zugewiesen, hohe Priorität, bis Freitag. Soll ich fortfahren?”
Sie: “Zeig mir die AWS-Kosten für diesen Monat” Brain: “Ihre gesamten AWS-Kosten für Februar betragen 2.100 und RDS mit $890. Möchten Sie eine detaillierte Aufschlüsselung?”