Modelos de predicción MLB para apuestas: ELO y sistemas basados en datos

Fjdsncueiijacw8cen junio 10, 2026 Tiempo de lectura: 7 min

Persona trabajando en un portátil con hojas de cálculo y datos de béisbol MLB abiertos junto a una libreta con anotaciones

Cargando...

Índice de contenidos

Un modelo no necesita ser perfecto — solo más preciso que las cuotas del mercado
Qué es ELO y cómo se adapta al béisbol
Fuentes de proyecciones y cómo integrarlas en un sistema propio
Un sistema básico puede generar ventaja medible

Un modelo no necesita ser perfecto — solo más preciso que las cuotas del mercado

La idea de construir un modelo de predicción puede intimidar al apostador que no tiene formación en estadística. Pero la realidad es que un modelo útil para apuestas en la MLB no necesita ser sofisticado — necesita ser consistentemente un poco mejor que las cuotas del operador. Si tu modelo estima que un equipo tiene un 56 % de probabilidad de ganar y la cuota implica un 52 %, tienes un margen de 4 puntos. Eso, repetido durante 200 apuestas a lo largo de una temporada, se traduce en rentabilidad.

Los modelos de predicción en el béisbol tienen una ventaja sobre los de otros deportes: la cantidad y calidad de datos disponibles es extraordinaria. Cada lanzamiento, cada batazo, cada resultado se registra con granularidad milimétrica. Plataformas como FanGraphs, Baseball Reference y Baseball Savant ofrecen acceso gratuito a décadas de estadísticas que cubren todo lo que un modelo básico necesita. El reto no es encontrar datos — es saber cuáles importan.

Este artículo introduce los modelos ELO aplicados al béisbol y las fuentes de proyecciones que permiten al apostador construir un sistema propio sin necesidad de programar algoritmos complejos. Tu modelo, tu ventaja.

Qué es ELO y cómo se adapta al béisbol

El sistema de rating ELO fue creado originalmente para clasificar jugadores de ajedrez. Su lógica es simple: cada participante tiene una puntuación numérica que sube cuando gana y baja cuando pierde, con la magnitud del cambio determinada por la diferencia de rating entre los oponentes. Si un equipo con rating alto pierde contra uno con rating bajo, su puntuación cae más que si hubiera perdido contra un rival de nivel similar.

Aplicado a la MLB, el sistema ELO asigna un rating a cada equipo que se actualiza después de cada partido. FiveThirtyEight popularizó este enfoque con su modelo de predicción de MLB, que combinaba el ELO base con ajustes por abridor, descanso y factor local. Aunque FiveThirtyEight dejó de operar como sitio independiente, la metodología sigue siendo referencia para los modelos amateur.

La construcción de un ELO básico para MLB requiere tres componentes. Primero, un rating inicial para cada equipo al comienzo de la temporada — habitualmente basado en las proyecciones de victorias de pretemporada. Segundo, un factor K que determina cuánto se ajusta el rating después de cada partido. Un factor K alto hace que el rating reaccione rápidamente a resultados recientes; un factor K bajo suaviza las fluctuaciones y prioriza la tendencia a largo plazo. Para la MLB, un factor K entre 4 y 6 suele funcionar bien, dado que la temporada de 162 partidos ofrece suficiente muestra para estabilizar los ratings sin necesidad de reacciones extremas. Tercero, la conversión del rating a probabilidad: la diferencia de ELO entre dos equipos se traduce en una probabilidad de victoria mediante una fórmula logística estándar.

La predictibilidad del béisbol establece un techo para cualquier modelo. Los mejores modelos públicos de predicción MLB aciertan alrededor del 57-58 % de los partidos — apenas por encima del nivel base de los favoritos. Métricas como SIERA, con un R² de 0.197 para predecir ERA futuro, ilustran que incluso las mejores herramientas analíticas explican una fracción modesta de la varianza. Eso no invalida los modelos — significa que la ventaja se mide en puntos porcentuales, no en certezas. Un modelo que acierta el 55 % cuando la cuota implica un 52 % genera rentabilidad sostenida.

Un ajuste que mejora significativamente el ELO base es incorporar al abridor. El rating del equipo se modifica según quién lanza: si el ace está en el montículo, el rating efectivo sube; si lanza el quinto abridor, baja. Ese ajuste captura entre el 60 y el 70 % del movimiento de la línea pregame y convierte al ELO genérico en un modelo con sensibilidad al contexto del partido.

Fuentes de proyecciones y cómo integrarlas en un sistema propio

El apostador que no quiere construir un modelo desde cero puede utilizar proyecciones existentes como base de su sistema. FanGraphs publica proyecciones de rendimiento para cada jugador de la MLB a través de sus sistemas ZiPS y Steamer, y las actualiza durante toda la temporada con datos en tiempo real. Estas proyecciones cubren métricas de bateo y pitcheo que pueden usarse como inputs para estimar probabilidades de victoria.

El proceso básico para construir un sistema sobre proyecciones existentes tiene cuatro pasos. Primero, obtener las proyecciones de rendimiento del abridor de cada equipo para el partido en cuestión — SIERA o FIP proyectado. Segundo, obtener las proyecciones ofensivas de las alineaciones — wOBA o wRC+ proyectado. Tercero, ajustar por park factor y factor local. Cuarto, convertir la estimación resultante en una probabilidad y compararla con la cuota del operador.

El factor local en la MLB de la década de 2020 se sitúa en torno al .534 para temporada regular, lo que equivale a un ajuste de aproximadamente 2 puntos porcentuales a favor del equipo de casa. Incorporar ese ajuste como una constante en el modelo es una aproximación válida, aunque los apostadores más avanzados pueden modularlo según el estadio específico — Coors Field merece un ajuste diferente al de un estadio neutral.

El backtesting es el paso que valida o invalida el modelo. Consiste en aplicar el sistema a partidos pasados — idealmente una temporada completa — y medir si las apuestas que el modelo habría recomendado habrían sido rentables. Sin backtesting, un modelo es una hipótesis. Con backtesting positivo, es una herramienta con evidencia preliminar. Un modelo que genera ROI positivo en backtesting sobre 500 o más partidos tiene una base razonable para operar en tiempo real, siempre con la cautela de que el rendimiento pasado no garantiza el futuro.

Un error común es sobreoptimizar el modelo con datos históricos — ajustar los parámetros hasta que el backtesting muestre resultados perfectos. Eso genera un modelo que describe el pasado con precisión pero predice el futuro con la misma precisión que el azar. La solución es dividir los datos en dos sets: uno para calibrar el modelo y otro para testarlo, nunca usando los mismos datos para ambas funciones.

Un sistema básico puede generar ventaja medible

Un modelo de predicción MLB no necesita ser una obra de ingeniería de datos. Un sistema ELO básico con ajuste por abridor y factor local, alimentado con proyecciones públicas de FanGraphs, puede generar estimaciones de probabilidad que, comparadas con las cuotas del mercado, identifiquen valor con consistencia suficiente para ser rentable.

La clave no es la sofisticación del modelo sino la disciplina de aplicarlo: generar la estimación antes de mirar la cuota, apostar solo cuando hay margen positivo y registrar cada apuesta para medir el rendimiento real. Tu modelo, tu ventaja.

Creado por la redacción de «mlb Apuestas».