Zum Hauptinhalt springen

Endpoints

Sprachsitzung Erstellen

POST /api/v1/voice/session
Stellt ein temporäres OpenAI Realtime API-Token für eine WebRTC-Sprachverbindung bereit. Antwort:
{
  "token": "ephemeral-openai-token",
  "expires_at": "2026-02-18T12:00:00Z",
  "model": "gpt-4o-realtime-preview"
}
Das Frontend verwendet dieses Token, um eine direkte WebRTC-Verbindung zur OpenAI Realtime API herzustellen. Apollo Brain-Tools werden als Funktionsaufrufe innerhalb der Sprachsitzung registriert.

Audio-Transkription

POST /audio/transcribe
Transkribiert Audio mithilfe der OpenAI Whisper API. Anfrage: Multipart-Form-Daten mit Audiodatei. Antwort:
{
  "text": "Create a high priority task for the API migration",
  "language": "en",
  "duration": 3.5
}