Un caso real de implementación de S8 Lead Scoring: webhook, scraping de la web del prospecto, análisis con LLM y cold email con aprobación humana. Los números, el proceso y lo que aprendimos.
Una empresa de distribución con 12 comerciales recibía entre 40 y 60 solicitudes de información al mes a través de su web. Cada solicitud llegaba por email al responsable comercial, que abría el formulario, buscaba la empresa en Google, revisaba la web, miraba el tamaño aparente, evaluaba si el perfil encajaba con su catálogo y decidía si llamar o ignorar. Todo ese proceso le llevaba entre 30 y 45 minutos por lead. En los meses de mayor volumen, eso eran casi 45 horas de trabajo comercial dedicadas únicamente a clasificar solicitudes antes de hacer nada.
El problema no era que el proceso fuera complicado. Era que era perfectamente estructurado y perfectamente repetible —lo que significa que era perfectamente automatizable. Lo implementamos en dos semanas. Aquí está el detalle técnico y los resultados.
El comercial hacía, en esencia, cinco preguntas para cada lead: ¿La empresa existe y tiene web? ¿A qué se dedica exactamente? ¿Cuál es su tamaño aproximado (empleados, facturación visible)? ¿Encaja con nuestros productos? ¿Tiene señales de capacidad de compra (catálogo de productos en su web, presencia consolidada, antigüedad)?
Esas cinco preguntas, respondidas con criterio comercial, generaban una decisión: prioridad alta (llamar hoy), prioridad media (entrar en secuencia de email), descartar. La lógica era consistente entre los distintos comerciales porque el responsable la había documentado en una guía interna. Esa consistencia fue la clave que hizo posible la automatización.
El flujo que construimos sigue el patrón de cuatro capas que aplicamos en todos nuestros sistemas: ingesta asíncrona, procesamiento cognitivo, acción y fallback.
La primera capa es el webhook. Cuando alguien rellena el formulario de contacto de la web, la solicitud llega a un endpoint de n8n que responde con 200 OK en menos de 50 milisegundos y encola el payload en Redis. No procesa nada en ese momento. Esto garantiza que el usuario nunca espera y que la web no depende del procesamiento posterior para responder.
La segunda capa es la cognitiva. Un worker de n8n —un nodo Cron que se ejecuta cada 30 segundos— extrae la solicitud de Redis y lanza el procesamiento. Primero, usa Jina Reader para hacer scraping de la web de la empresa que ha rellenado el formulario: extrae el texto visible de la homepage y de la página "sobre nosotros" si existe. El resultado es texto limpio, sin HTML, listo para ser analizado.
Con ese texto, se construye un prompt estructurado para Groq (Llama-3.3-70b-versatile) que pide al modelo evaluar el perfil de la empresa en cinco dimensiones: relevancia sectorial (¿encaja con los productos?), tamaño estimado (señales en el texto que indican el volumen del negocio), madurez comercial (¿parece una empresa establecida o un proyecto en fase inicial?), urgencia aparente (¿hay señales en el texto del formulario que indiquen una necesidad inmediata?) y adecuación geográfica. El modelo devuelve una puntuación del 1 al 10 para cada dimensión y una puntuación global, junto con un resumen de dos párrafos que explica el razonamiento.
La tercera capa es la acción. Dependiendo de la puntuación global, el sistema toma caminos diferentes. Si la puntuación es 8 o superior, el sistema genera automáticamente un borrador de cold email personalizado usando el contexto de la empresa y lo coloca en una cola de aprobación. El responsable comercial recibe un mensaje en Telegram con el resumen del lead, la puntuación, las razones del score y el borrador del email. Con un comando de respuesta —literalmente un texto con el identificador del lead— aprueba el envío. El email sale via SMTP en segundos.
Si la puntuación está entre 5 y 7, el lead entra en la base de datos con estado "medium priority" para revisión posterior. Si está por debajo de 5, se registra pero no se genera ninguna acción automática.
La cuarta capa, el fallback, garantiza que cualquier fallo —Jina no puede acceder a la web, Groq devuelve un error, la base de datos no responde— genera una alerta al S2 Sentinel y escala a revisión manual. Ningún lead se pierde silenciosamente.
El tiempo de procesamiento por lead pasó de 35-45 minutos a 28 segundos de media. El 100% de los leads reciben respuesta (clasificación) en menos de 5 minutos desde que rellenan el formulario, independientemente de la hora del día o el día de la semana. Los leads de alta prioridad reciben el primer email en menos de 10 minutos.
En el primer mes de operación, el sistema procesó 53 leads. De esos, 14 recibieron puntuación de alta prioridad y el borrador de email fue aprobado para todos ellos —el comercial tardaba menos de 30 segundos en revisar el mensaje de Telegram y aprobar. De los 14, 6 convirtieron en reunión cualificada en las dos semanas siguientes, lo que representa una tasa de conversión de lead a reunión del 43% para el segmento de alta prioridad, frente al 22% histórico cuando el proceso era manual.
La diferencia de conversión no se debe solo a la velocidad de respuesta, aunque eso tiene un impacto documentado. Se debe también a que el email está personalizado con contexto real de la empresa del prospecto, no es un template genérico. Y se debe a que el comercial, al no tener que hacer la investigación inicial, dedica el tiempo de la llamada de cualificación a hablar de necesidades en lugar de hacer las mismas preguntas que ya respondería el scraping.
Tres cosas que no estaban en el diseño inicial pero que aparecieron durante las pruebas.
La calidad del scraping depende de la web del prospecto. Cuando la empresa tiene una web bien estructurada, el análisis del LLM es preciso. Cuando la web es un PDF escaneado o tiene todo el contenido en JavaScript renderizado en cliente, Jina no puede extraer texto útil. Añadimos un fallback: si el scraping falla o devuelve menos de 200 caracteres, el sistema hace score solo con los datos del formulario y añade una nota al resumen indicando que la web no fue accesible.
El modelo de scoring necesita calibración por sector. Las cinco dimensiones funcionan bien en general, pero los umbrales de "alta prioridad" son diferentes según el tipo de empresa. En sectores B2B con ciclos de venta largos, un score de 7 puede ser más relevante que en sectores con compras más transaccionales. Añadimos un parámetro de configuración por cliente que ajusta los umbrales sin cambiar el flujo.
La aprobación humana es más rápida de lo esperado cuando el contexto está bien presentado. El mensaje de Telegram que recibe el comercial incluye: nombre de la empresa, URL, puntuación, dos frases de resumen y el borrador del email. El comercial tarda entre 15 y 45 segundos en decidir. Eso es más rápido que abrir el email original y googlear la empresa.
La infraestructura corre en el mismo VPS que usamos para todos los sistemas de la empresa: 20-30€ al mes de coste compartido. El coste de las llamadas a la API de Groq para 53 leads fue de aproximadamente 0,80€. El coste de Jina Reader para los scrapings fue de 0€ —la capa gratuita de Jina cubre el volumen de una empresa de este tamaño. El retainer mensual de mantenimiento y monitoreo corre por nuestra parte como parte del contrato.
El ROI del sistema se calculó antes de la implementación en un breakeven de menos de dos meses considerando solo el tiempo comercial ahorrado. Con la mejora de conversión documentada en el primer mes, el retorno real fue considerablemente mayor.
Si tu empresa tiene un proceso de cualificación de leads que consume tiempo comercial y sigue un patrón estructurado, el sistema que describimos aquí es adaptable en menos de dos semanas. El punto de partida es siempre el mismo: documentar la lógica de scoring que ya tienes en la cabeza de tus mejores comerciales.
¿Quieres aplicar esto en tu empresa?
En RAXAR auditamos procesos, calculamos el ROI real y construimos sistemas que funcionan en producción. Sin proyectos piloto eternos.
Hablar con un especialista