Voice Mode - Apollo

Übersicht

Voice Mode ermöglicht Echtzeit-Sprachgespräche mit Apollo Brain. Es nutzt die GPT-4o Realtime API von OpenAI für die Sprachverarbeitung, wobei die Tools von Apollo Brain als Funktionsaufrufe verfügbar sind — so können Sie Fragen stellen, Aufgaben erstellen und Ihren Workspace vollständig per Sprache verwalten.

Funktionsweise

Modi

Push-to-Talk (PTT)
Freisprechend

Halten Sie einen Button gedrückt, um zu sprechen, lassen Sie los, um zu senden. Ideal für laute Umgebungen.

Audioverarbeitung

Echo Gate — verhindert, dass die Lautsprecherausgabe vom Mikrofon aufgenommen wird und vermeidet Rückkopplungsschleifen
Stummschaltung — schalten Sie Ihr Mikrofon schnell stumm
Echtzeit-Indikatoren — visuelles Feedback, das anzeigt, ob das System zuhört, verarbeitet oder spricht

Beispielgespräche

Sie: “Was sind meine Aufgaben für heute?” Brain: “Sie haben 5 Aufgaben für heute. Zwei haben hohe Priorität: die API-Endpoint-Migration und der Login-Bugfix. Soll ich sie durchgehen?”

Sie: “Erstelle eine Aufgabe zur Überprüfung der Deployment-Pipeline, weise sie mir zu, hohe Priorität, bis Ende der Woche” Brain: “Ich möchte eine Aufgabe erstellen: ‘Deployment-Pipeline überprüfen’, Ihnen zugewiesen, hohe Priorität, bis Freitag. Soll ich fortfahren?”

Sie: “Zeig mir die AWS-Kosten für diesen Monat” Brain: “Ihre gesamten AWS-Kosten für Februar betragen $4.230. Die größten Posten sind ECS mit$ 2.100 und RDS mit $890. Möchten Sie eine detaillierte Aufschlüsselung?”

Voice Mode erfordert eine stabile Internetverbindung für WebRTC-Streaming. Die Audioqualität hängt von Ihrer Mikrofon-Hardware ab.

Apollo Brain

Zurück

Project Spec Engine (PSE)

Weiter

​Übersicht

​Funktionsweise

​Modi

​Audioverarbeitung

​Beispielgespräche

Übersicht

Funktionsweise

Modi

Audioverarbeitung

Beispielgespräche