Metodología del
Motor PREDIKTOR
Documentación técnica completa del sistema de análisis estadístico que genera predicciones diarias basadas en datos reales, modelo probabilístico Poisson, y evaluación de valor esperado frente al mercado de apuestas.
1. Filosofía del sistema
PREDIKTOR no es un tipster. No genera predicciones basadas en intuición, corazonadas, o información privilegiada. Es un motor automatizado que cada mañana descarga estadísticas actualizadas de ligas de fútbol y de la NBA, las procesa a través de un modelo probabilístico, las compara contra las cuotas reales de los bookmakers, y publica únicamente aquellos picks donde existe un valor esperado positivo después de ajustar por la confianza del modelo y la liquidez del mercado.
La diferencia fundamental entre este enfoque y el de un tipster tradicional es la ausencia de sesgo emocional. El motor no sabe quién es el equipo favorito del público, no tiene preferencias regionales, y no intenta justificar un pick con narrativas posteriores al resultado. Solo calcula probabilidades y las contrasta con el mercado.
2. Fuentes de datos
El motor se alimenta de tres fuentes independientes, cada una con un propósito distinto:
2.1 Fixtures (calendario de partidos)
Los partidos programados se obtienen a través de la API pública de ESPN. Esta API cubre las principales ligas europeas (Premier League, La Liga, Serie A, Bundesliga, Ligue 1), fútbol sudamericano (Liga Colombiana, Liga Argentina, Brasileirão), la Champions League, la Copa Libertadores, la Copa Sudamericana, la Süper Lig turca y la NBA. Se filtran los partidos del día en hora Colombia y se descartan aquellos ya finalizados.
2.2 Estadísticas de equipos
Para cada liga se mantiene un archivo JSON con la tabla de posiciones actualizada, el número de partidos jugados, victorias, empates y derrotas, goles a favor y en contra, y porcentajes de Over 1.5 y Over 2.5 por equipo. Estas estadísticas se actualizan diariamente mediante scrapers dedicados por liga.
2.3 Cuotas de bookmakers
Las cuotas reales se obtienen de The Odds API, que agrega precios de múltiples casas de apuestas europeas. Para cada partido se extraen las cuotas del mejor bookmaker disponible (line shopping) para los mercados de victoria local, empate, victoria visitante, Over 1.5 goles y Over 2.5 goles. Los mercados derivados (Doble Oportunidad, Apuesta Sin Empate) se calculan a partir de estos tres outcomes básicos.
3. El modelo probabilístico
El motor combina dos modelos complementarios: un modelo de resultado (victoria, empate, derrota) basado en variables de rendimiento histórico, y un modelo de goles basado en distribución de Poisson.
3.1 Modelo de resultado (fútbol)
La probabilidad de victoria de cada equipo se calcula combinando ponderadamente cuatro variables:
- Posición en la tabla (peso 40%): cuanto mejor la posición, mayor la fortaleza estimada del equipo.
- Porcentaje de victorias (peso 30%): ratio de partidos ganados sobre total jugado.
- Diferencia de goles (peso 20%): goles a favor menos goles en contra.
- Ventaja de local (10% adicional): bonificación para el equipo que juega en casa.
La probabilidad resultante se acota entre un mínimo del 15% y un máximo del 85%: no se admiten extremos porque el fútbol introduce varianza que ningún modelo puede eliminar. Cuando la diferencia entre equipos es pequeña, el motor declara un empate técnico y reparte la probabilidad en un modelo de tres resultados con un componente de empate entre el 20% y el 30% según competitividad.
3.2 Modelo de goles (distribución de Poisson)
La probabilidad de que un partido supere una línea de goles (Over 1.5, Over 2.5) se calcula con el modelo Poisson clásico:
P(X ≤ k) = Σ (λ^i · e^-λ) / i! para i = 0, 1, ..., k
P(Over k.5) = 1 − P(X ≤ k)
El parámetro lambda se estima a partir del promedio de goles por partido de cada equipo en su liga, sumando su producción ofensiva y la producción ofensiva del rival ajustada por su defensa. El modelo Poisson es apropiado porque los goles son eventos discretos, relativamente raros e independientes dentro de un partido.
4. El factor de confianza (confidence_factor)
La probabilidad cruda del modelo se ajusta a la baja mediante un factor de confianza entre 0.85 y 1.00 que refleja cuánto debe confiarse el sistema en su propia estimación para esa liga y ese mercado específico.
Los factores que reducen la confianza son acumulativos:
| Factor | Aplica cuando | Penalización |
|---|---|---|
| Tier de liga | Liga con menos historia o datos incompletos | ×0.95 a ×0.97 |
| Frecuencia del mercado | Mercado con baja liquidez | ×0.95 a ×0.98 |
| Tipo de mercado | Over/Under (varianza alta) | ×0.97 |
La probabilidad ajustada se calcula como:
Este ajuste es solo reductor: nunca aumenta la probabilidad estimada. Es una capa de prudencia diseñada para que el motor no sobreestime su propia precisión en contextos donde los datos son escasos o el mercado es poco eficiente.
5. Cálculo del valor esperado (EV)
El valor esperado es la métrica fundamental que determina si una apuesta es rentable a largo plazo. Se calcula comparando la probabilidad estimada del modelo con la cuota ofrecida por el bookmaker:
Un EV positivo significa que, apostando repetidamente en situaciones similares, el resultado esperado en el largo plazo es de ganancia. Un EV negativo implica pérdida esperada, sin importar si el apostante acierta o falla un pick individual.
Tras el EV crudo, el motor aplica una penalización por liquidez adicional para mercados poco frecuentes: si un tipo de mercado aparece en menos del 30% de los partidos, se descuenta entre 3 y 6 puntos porcentuales al EV final. Esta penalización absorbe el spread real de la casa y la varianza estadística mayor que producen las muestras pequeñas.
6. Filtros de publicación
Un pick solo se publica si pasa todos los filtros simultáneamente:
| Filtro | Umbral | Motivo |
|---|---|---|
| Probabilidad ajustada mínima | 50% a 70% | Señal clara del modelo |
| EV ajustado mínimo | +8% a +15% | Absorber el vig de la casa |
| EV ajustado máximo | +20% a +50% | Evitar sobreajuste del modelo |
| Factor de confianza | ≥ 0.90 o ≥ 0.95 | Liga y mercado confiables |
| Cuota mínima del bookmaker | ≥ 1.20 a 1.60 | Margen de ganancia real |
El cap superior de EV (20% a 50% según el mercado) es tan importante como el mínimo: un valor esperado extremadamente alto usualmente indica que el modelo y el mercado están en desacuerdo fuerte, y el mercado tiene razón más veces que el modelo. El motor descarta estos casos por sospecha de sobreajuste.
7. Clasificación en tres niveles
Los picks que superan los filtros se clasifican en tres niveles según la calidad de la señal:
7.1 Pick del Día (Premium)
Un solo pick por día, el de mayor value score entre los que cumplen los umbrales más estrictos: probabilidad ajustada ≥ 70%, EV ajustado ≥ 15%, factor de confianza ≥ 0.95, y estadísticas disponibles para ambos equipos. El Pick del Día solo se publica si hay al menos dos picks adicionales que califiquen como Suscripción (regla de seguridad para evitar destacar un pick aislado sin contexto).
7.2 Picks Suscripción
De dos a cuatro picks adicionales con umbrales más flexibles: probabilidad ajustada ≥ 50%, EV ajustado ≥ 8%, factor de confianza ≥ 0.90. Estos picks incluyen oportunidades donde el modelo tiene señal parcial pero la casa está ofreciendo una cuota favorable.
7.3 Pick Gratuito
El más estable de los picks de Suscripción (mayor probabilidad, mercado entendible). Se publica libremente en el canal de Telegram y en el home del sitio.
8. Métrica de ranking: value score
Cuando varios picks califican, el motor los ordena mediante la métrica value score:
Cada componente tiene un rol: el EV ajustado es el factor dominante, el factor de confianza prioriza ligas y mercados donde el modelo es más fiable, y el logaritmo de la cuota modera los picks con cuotas extremas sin descartar el upside de las cuotas altas.
9. Análisis de goles complementario
Cuando el pick principal de un partido es un mercado de resultado (1X2, DNB, DC) pero el mercado Over 2.5 también presenta valor, el motor publica ese Over como análisis complementario, no como pick oficial. Es información adicional para el lector, claramente etiquetada como insight.
10. Limitaciones honestas
Ningún modelo estadístico de apuestas deportivas es infalible. Las limitaciones principales del motor son:
- Eventos no modelados: lesiones de último momento, expulsiones tempranas, motivación atípica (eliminatorias, derbis). El motor no lee noticias.
- Calidad de las estadísticas: en ligas menores o competiciones cortas (CONMEBOL), los datos disponibles son limitados y el modelo se apoya en ligas locales como fallback.
- Eficiencia del mercado: los bookmakers ajustan sus cuotas con equipos de analistas y algoritmos. Encontrar valor real es cada vez más difícil, especialmente en las ligas grandes.
- Varianza a corto plazo: un pick con EV positivo puede perder varias veces seguidas. El valor solo se materializa a lo largo de decenas o cientos de apuestas.
11. Transparencia y track record
Cada predicción publicada se registra con su probabilidad, cuota, EV, resultado esperado y resultado real tras el partido. Estas bitácoras permiten verificar si el rendimiento histórico del motor está dentro de las expectativas estadísticas derivadas de su diseño.
El sitio publica su tasa de acierto global, la tasa por tipo de mercado, y el listado de las últimas predicciones con su desenlace. Esta transparencia es condición necesaria para que cualquier sistema de predicciones sea evaluable por terceros.