Zum Hauptinhalt springen

Übersicht

Voice Mode ermöglicht Echtzeit-Sprachgespräche mit Apollo Brain. Es nutzt die GPT-4o Realtime API von OpenAI für die Sprachverarbeitung, wobei die Tools von Apollo Brain als Funktionsaufrufe verfügbar sind — so können Sie Fragen stellen, Aufgaben erstellen und Ihren Workspace vollständig per Sprache verwalten.

Funktionsweise

Modi

Halten Sie einen Button gedrückt, um zu sprechen, lassen Sie los, um zu senden. Ideal für laute Umgebungen.

Audioverarbeitung

  • Echo Gate — verhindert, dass die Lautsprecherausgabe vom Mikrofon aufgenommen wird und vermeidet Rückkopplungsschleifen
  • Stummschaltung — schalten Sie Ihr Mikrofon schnell stumm
  • Echtzeit-Indikatoren — visuelles Feedback, das anzeigt, ob das System zuhört, verarbeitet oder spricht

Beispielgespräche

Sie: “Was sind meine Aufgaben für heute?” Brain: “Sie haben 5 Aufgaben für heute. Zwei haben hohe Priorität: die API-Endpoint-Migration und der Login-Bugfix. Soll ich sie durchgehen?”
Sie: “Erstelle eine Aufgabe zur Überprüfung der Deployment-Pipeline, weise sie mir zu, hohe Priorität, bis Ende der Woche” Brain: “Ich möchte eine Aufgabe erstellen: ‘Deployment-Pipeline überprüfen’, Ihnen zugewiesen, hohe Priorität, bis Freitag. Soll ich fortfahren?”
Sie: “Zeig mir die AWS-Kosten für diesen Monat” Brain: “Ihre gesamten AWS-Kosten für Februar betragen 4.230.Diegro¨ßtenPostensindECSmit4.230. Die größten Posten sind ECS mit 2.100 und RDS mit $890. Möchten Sie eine detaillierte Aufschlüsselung?”
Voice Mode erfordert eine stabile Internetverbindung für WebRTC-Streaming. Die Audioqualität hängt von Ihrer Mikrofon-Hardware ab.