Saltar al contenido principal

Vision General

Voice Mode permite conversaciones por voz en tiempo real con Apollo Brain. Utiliza la API GPT-4o Realtime de OpenAI para el procesamiento de voz, con las herramientas de Apollo Brain disponibles como llamadas de función — para que puedas hacer preguntas, crear tareas y gestionar tu espacio de trabajo completamente por voz.

Cómo Funciona

Modos

Manten presionado un botón para hablar, suelta para enviar. Ideal para entornos ruidosos.

Procesamiento de Audio

  • Echo Gate — evita que la salida del altavoz sea captada por el micrófono, previniendo bucles de retroalimentación
  • Control de Silencio — silencia rápidamente tu micrófono
  • Indicadores en tiempo real — retroalimentación visual que muestra cuando el sistema está escuchando, procesando o hablando

Ejemplos de Conversaciones

Tu: “¿Cuáles son mis tareas para hoy?” Brain: “Tienes 5 tareas para hoy. Dos son de alta prioridad: la migración del endpoint de la API y la corrección del bug de login. ¿Quieres que las repase?”
Tu: “Crea una tarea para revisar el pipeline de despliegue, asígnamela, alta prioridad, para el viernes” Brain: “Me gustaría crear una tarea: ‘Revisar pipeline de despliegue’, asignada a ti, alta prioridad, para el viernes. ¿Procedo?”
Tu: “Muestrame los costos de AWS de este mes” Brain: “Tus costos totales de AWS en febrero son 4.230.LosmayorescontribuyentessonECScon4.230. Los mayores contribuyentes son ECS con 2.100 y RDS con $890. Quieres un desglose detallado?”
Voice Mode requiere una conexión estable a internet para streaming vía WebRTC. La calidad del audio depende del hardware de tu micrófono.