Voice Mode

Vision General

Voice Mode permite conversaciones por voz en tiempo real con Apollo Brain. Utiliza la API GPT-4o Realtime de OpenAI para el procesamiento de voz, con las herramientas de Apollo Brain disponibles como llamadas de función — para que puedas hacer preguntas, crear tareas y gestionar tu espacio de trabajo completamente por voz.

Procesamiento de Audio

Echo Gate — evita que la salida del altavoz sea captada por el micrófono, previniendo bucles de retroalimentación

Control de Silencio — silencia rápidamente tu micrófono

Indicadores en tiempo real — retroalimentación visual que muestra cuando el sistema está escuchando, procesando o hablando

Ejemplos de Conversaciones

Tu: “¿Cuáles son mis tareas para hoy?” Brain: “Tienes 5 tareas para hoy. Dos son de alta prioridad: la migración del endpoint de la API y la corrección del bug de login. ¿Quieres que las repase?”

Tu: “Crea una tarea para revisar el pipeline de despliegue, asígnamela, alta prioridad, para el viernes” Brain: “Me gustaría crear una tarea: ‘Revisar pipeline de despliegue’, asignada a ti, alta prioridad, para el viernes. ¿Procedo?”

Tu: “Muestrame los costos de AWS de este mes” Brain: “Tus costos totales de AWS en febrero son

4.230. Los mayores contribuyentes son ECS con

2.100 y RDS con $890. Quieres un desglose detallado?”

Voice Mode requiere una conexión estable a internet para streaming vía WebRTC. La calidad del audio depende del hardware de tu micrófono.

Vision General

Cómo Funciona

Modos

Procesamiento de Audio

Ejemplos de Conversaciones

​Vision General

​Cómo Funciona

​Modos

​Procesamiento de Audio

​Ejemplos de Conversaciones

Vision General

Cómo Funciona

Modos

Procesamiento de Audio

Ejemplos de Conversaciones