Saltar al contenido principal

SaaS B2B · Conversacional · 2 meses · CTO + Builder · 12 abril 2026

Agentes de voz por WhatsApp: ventas y soporte que atienden a cualquier hora

Agente de voz IA sobre WhatsApp con ElevenLabs y memoria persistente: ventas, onboarding y soporte atendidos 24/7 con conexión directa al CRM.

Arquitectura

Usuario en WhatsApp (audio/texto) Agente IA + memoria vectorial Síntesis de voz ElevenLabs CRM + resumen automático

El problema: soporte y ventas por WhatsApp sin cobertura 24/7

El equipo comercial y de onboarding de trainingym — el SaaS B2B con 1.200+ gimnasios en 21 países donde soy cofundador y CTO — atendía cientos de conversaciones de WhatsApp al día: consultas de precios, dudas de configuración, renovaciones, primeras llamadas. En horario laboral se hacía justo. Fuera de horario, las consultas se acumulaban y llegaban respondidas al día siguiente, cuando el cliente ya se había enfriado o había buscado otra opción.

Contratar equipo 24/7 no era viable económicamente para el volumen real. Un bot de texto plano tampoco — los clientes de este sector están acostumbrados a escuchar, no a leer respuestas largas. Hacía falta algo que hablara, no que escribiera.

La decisión: agentes de voz en WhatsApp con ElevenLabs y memoria persistente

Construir agentes conversacionales con voz natural conectados a WhatsApp. El cliente envía un audio o un texto, el agente responde en audio generado con ElevenLabs — calidad humana — usando contexto persistente para recordar la conversación entre sesiones.

Decisiones clave:

  1. Un agente por caso de uso, no un único bot generalista: uno para ventas, uno para onboarding, uno para soporte. Cada uno con su personalidad, sus datos y sus límites.
  2. Memoria persistente entre sesiones: si el cliente vuelve tres días después, el agente recuerda de qué hablaron.
  3. Siempre con opción de escalar a humano: el agente sabe cuándo la conversación necesita a una persona real y hace la transferencia sin fricción.

Qué construí: un agente de voz IA sobre WhatsApp Business

Un sistema en producción con:

  • Agentes especializados por vertical (ventas, onboarding, soporte, QA).
  • Integración WhatsApp Business + webhooks propios.
  • Generación de voz con ElevenLabs en tiempo real — respuesta natural, con inflexiones, sin el típico “tono de bot”.
  • Memoria conversacional que persiste entre llamadas, soportada por una base vectorial propia.
  • Grabación de cada conversación con resumen automático para que el equipo humano lea lo importante en 30 segundos si hay que dar seguimiento.
  • Conexión directa al CRM: cuando el agente cierra una cita o cualifica un lead, aparece en la pipeline del SDR correcto — sin intervención manual.

Toda la orquestación corre sobre n8n, la infraestructura de voz y memoria en Azure (FastAPI + SQL + Qdrant vectorial). Esta combinación permite escalar horizontalmente sin que el coste se dispare.

Resultado: cobertura 24/7 y pipeline comercial alimentada desde WhatsApp

  • Cobertura 24/7 real en ventas, onboarding y soporte — sin contratar equipo nocturno.
  • Tiempo de primera respuesta que pasó de horas a segundos, cualquier día de la semana.
  • Pipeline comercial alimentada automáticamente: los leads cualificados por los agentes aparecen en el CRM listos para que el equipo humano cierre.
  • Conversaciones archivadas con resumen — insumo para detectar patrones, mejorar el producto y entrenar al equipo humano con casos reales.

Lección: cuando la voz es el canal natural del negocio

La clave no era “hacer un bot mejor”. Era tratar la voz como el canal natural del negocio, no como un extra. Los clientes de este sector prefieren escuchar 30 segundos a leer un párrafo. Cuando el canal se adapta a su forma de comunicar, la fricción desaparece.

Mensaje para el CEO: la pregunta no es “¿me sustituye un agente a mi equipo?”. Es “¿qué conversaciones preferiría que mi equipo tuviera, si no tuviera que hacer las otras cien repetidas?”.

Casos relacionados

← Volver a casos