Prediccion de Fugas de Clientes
Prediccion de Fugas de Clientes
Prediccion de Fugas de Clientes
Nuevas Tendencias en
Educación Física, Deporte y Recreación
ISSN: 1579-1726
[email protected]
Federación Española de Docentes de
Educación Física
España
Resumen. La sabermetría es reconocida actualmente como una tendencia novedosa en el estudio del juego de béisbol. Con mucho auge y utilización
en el análisis empírico, esta se basa en el estudio estadístico riguroso de la evidencia objetiva obtenida durante el juego. Teniendo en cuenta tanto sus
aportes teóricos como prácticos, la sabermetría se fundamenta en una constante búsqueda por comprender cómo jugar mejor y más eficientemente al
béisbol, lo cual se expresa y soporta mediante un tipo de análisis de actuación único entre todos los deportes colectivos. El presente trabajo aborda los
aspectos esenciales de la sabermetría, fundamentando la necesidad de su surgimiento y utilización, como una forma de perfeccionar la manera en que
tradicionalmente se ha llevado a cabo el análisis estadístico en el béisbol. Además, se brinda un resumen de los estadísticos sabermétricos más utilizados,
tanto de bateo y picheo como otros de valor individual para el equipo, con el propósito de hacer más clara su comprensión, estudio y posterior utilización
entre los seguidores de este deporte.
Palabras claves. Sabermetría, estadísticas, béisbol, análisis, estudio.
Abstract. Sabermetrics is recognized as a new trend in the study of baseball game. This is based on the rigorous statistical study of the objective evidence
obtained and has been used extensively in its empirical analysis. Considering both theoretical and practical contributions, sabermetrics involves the
constant quest of understanding how to play baseball better and more efficiently, which is expressed and supported by an exceptional type of analysis
performance unique among all team sports. This paper describes the essential aspects of sabermetrics, pointing in the necessity of its emergence and
use, as a way to improve the traditional statistical analysis of baseball. Moreover, a summary of the sabermetrics statistics most widely used is given.
Both batting and pitching, as well as others of individual value for the team are stated throughout this work in order to make sabermetrics understanding,
study and further use clearer among followers of this sport.
Keywords. Sabermetrics, statistics, baseball, analysis, study.
Estadístico de
¿Cómo se calcula? Descripción
Lanzadores
K Promedio de ponches de un lanzador por cada nueve entradas lanzadas.
K/9 ( )*9
IP Promedio de MLB: 6.8
BB Promedio de bases por bola de un lanzador por cada nueve entradas lanzadas.
BB/9 ( )*9
IP Promedio de MLB: 3.4
K Ponches por cada boleto.
K/BB
BB Promedio de MLB: 2
HR Promedio de jonrones permitidos por cada nueve entradas lanzadas.
HR/9 ( )*9
IP Promedio de MLB: 1.06
WHIP
(Walks plus
hits per inning
Mide el número de desplazamientos entre bases que un lanzador permite por entradas lanzada. Constituye uno de los
pitched, o
BB + H estadísticos más usados actualmente para evaluar la efectividad d e un lanzador. Valores cercanos a 1.00 o inferiores
Bases por
IP son considerados muy buenos.
bolas más hits
por innings
lanzados)
BABIP Es el promedio de bateo de los oponentes sin contar los ponches ni los jonrones; en otras palabras, dice cuántas
(Batting pelotas de las que le batearon al pitcher cayeron de hit. Los jonrones no los cuenta porque ellos no dependen de los
Average of fildeadores. Si un pitcher tiene un BABIP mucho menor a .300, ha tenido suerte y podemos esperar cierta regresión
Balls in Play, o H - HR a la norma en otros de sus estadísticos, como por ejemplo los de efectividad. Y viceversa, un pitcher con un BABIP
Promedio de AB – K – HR + SF mucho mayor a .300 ha tenido mala suerte, y lo más seguro es que en el futuro si sigue con la misma relación de
Pelotas en K/BB/IP su BABIP y su efectividad bajen.
Juego) Promedio de MLB: Entre .290 y .300.
LOB% Calcula, de todos los corredores que se le embasaron a un pitcher, cuántos de ellos quedaron en circulación cuando
(Left on Base se terminó el inning. Es un indicador parecido al BABIP, en el sentido que ayudan a predecir sin un lanzador ha
Percentage, o H + BB + HBP - R tenido suerte o no. Eso sí, los lanzadores buenos tiend en a tener un LOB% mayor a los lanzadores malos,
Porcentaje de H + BB + HBP – (1.4 * HR) simplemente porque permiten menos hits con hombres en base y les anotan menos carreras. No obstante, si esa cifra
Dejados en se aleja demasiado del 71%, es muy improbable que se pueda mantener.
Base) Promedio de MLB: 71.5%.
PR
Ajusta el promedio de carreras limpias de un pitcher atendiendo al rendimiento general de pitcheo en la liga. Un
(Pitching Runs, [Innings Lanzados * (lgERA /
valor de cero representa un rendimiento promedio, uno por encima de cero indica que el pitcher tiene un rendimiento
o Carreras 9)] – Carreras Permitid as
superior a la media de la liga, y si es menor de cero significa que su rendimiento es peor que el de la liga.
Lanzadas)
Es la relación entre los batazos de rolling que recibe un lanzador, en comparación con el total de batazos recibidos.
GB% Aparte de la relación de ponches y boletos por cada nueve innings, este es otro estadístico importante a la hora de
(Groundball evaluar a un lanzador, ya que sí depende por entero de su desempeño. Dependiendo de su repertorio y su forma de
Batazos de rolling
Percentage, o lanzar, un pitcher permitirá más o menos rollings que otro (batazo que va por el piso, que no puede ser cuadrangular,
Porcentaje de Batazos totales y que difícilmente sea un extrabase, además de producir más jugadas que permiten hacer dos outs, conocidas como
Rollings) dobleplays).
Promedio de MLB: 43%
FB%
(Fly Ba ll Relación entre los batazos de fly o elevados que recibe un lanzador, en comparación con el total de batazos
Percentage, o Batazos elevados recibidos. Es incluso mejor evaluador que los cuadrangulares permitidos.
Porcentaje de Batazos totales Promedio de MLB: 37%.
Elevados)
LD%
Relación entre los batazos de línea que recibe un lanzador, en comparación con el total de batazos recibidos. Cuando
(Line Drive
Batazos de línea es mucho mayor a 20%, se puede deducir que le están bateando demasiad o al pitcher, por lo que es explicable un
Percentage, o
BABIP mayor a .300.
Porcentaje de Batazos totales Promedio de MLB: 20%.
Líneas)
Se usa para medir, de todos los batazos elevados recibidos por un pitcher, cuántos de ellos fueron cuadran gulares. Al
igual que con el BABIP, y el LOB% (a menor escala), el pitcher no controla su HR/FB%. Mientras más crece la
HR/FB% HR muestra, más tiende la cifra a acercarse a un 11%. Sabiendo esto, para predecir cuadrangulares recibidos resu lta
Batazos elevados mejor tomar en cuenta el FB% en vez de otras de relaciones (como la comunmente usada HR/9).
Promedio de MLB: 11%.
Es un medidor de la efectividad del picheo calculado únicamente sobre la base de los ponches, boletos y
FIP cuadrangulares recibidos, que son las únicos estadístico s que no dependen de la defensa. En otras palabras, mide
(Fielding
cuántas carreras por cada nueve innings ha debido recibir un lanzador sobre la base de sus ponches, bases por bolas
Independet y cuadrangulares. La Constante FIP es un escalar utilizado para ajustar el valor del FIP al promedio de carreras
Pitching, o 13 * HR + 3 * BB – 2 * K
limpias, varía según la temporada pero ronda el valor de 3.10, puede calcularse de la siguiente manera:
Pitcheo IP + (Constante FIP)
Independiente (13 * lgHR) + (3 * (lgBB + lgHBP)) – (2 * lgK)
Promedio FIP de MLB: 4.40. Constante FIP = lgERA *
de Fildeo) lgIP
Simplemente se utilizan los “cuadrangulaes normalizados” en vez de los cuadrangulares recibidos. Los
xFIP
cuadrangulares normalizados se obtienen multiplicando los batazos elevados recibidos por 0.11. El xFIP ayuda en la
(Expected FIP, 13 * HR no rmalizados + 3 * BB – 2 * K determinación del efecto de cada estadio sobre la actuación del lanzador. Que a un pitcher la bateen más o menos
o FIP IP + (Constante FIP) rollings no depende del estadio donde lance, pero los cuadrangulares que le conecten sí.
Esperado)
Promedio de MLB: 4.40.
Propuesto por Bill James (James & Wirth, 1986), el FR parte de la premisa de que el número
FR
total de outs en los que participa un jugador en una posición determinada es un indicador
(Range outs realizados + asistencias
Factor, o defensivo más efectivo que el porcentaje de fildeo (F%). Sin embargo, cabe señalar que algunas
innings jugados en la p osición posiciones (especialmente la primera base) pueden acumular una mayor cantidad de outs
Factor de
realizados y de asistencias (sobre todo debido a jugadas de do blepay) lo que le permite
Rango)
conseguir valores mayores de FR.
En (Fangraphs, 2014) se define la estructura El UZR es una estadística defensiva avanzada mediante la cual se mide la contribución en
principal para el cálculo del UZR, la cual se basa en salvar carreras de un jugador, en una determinada posición, por encima o por debajo de otro
la suma de la totalidad de eventos en que participa un jugador promedio en su posición.
UZR
defensor, multiplicada por el valor positivo (en caso En el caso del UZR, los eventos que se toman en cuenta son los siguientes:
(Ultimate
de que realice un out) o negativo (en caso de que • Convertir la jugada en out.
Zone Rating, o
permita un hit o permita que un jugador consiga una • Permitir que una pelota se convierta en hit.
Resultado de
base por error), en comparación con la cantidad de • Hacer un error que permita que un jugador alcance una base.
Clasificación
veces que una jugada similar (en términos de Si un Center Fielder tiene un UZR de “cero”, su contribució n es neutra en comparación con los
por Zonas)
locación, velocidad y tipo de pelota bateada) es demás jugadores en el Center Field. Si este jugador cuenta con un UZR positivo esto implica
hecha por un jugador promedio en determinada que el jugador ha contribuido en salvar más carreras que el jugador promedio en su posición, y
posición del campo durante varios años. lo contrario sucederá en el caso de que el UZR sea negativo.
TZL Igual a como se lee el UZR, el resultado se obtiene a partir de las carreras salvadas por encima
Su cálculo varía dependiendo de las especificidades
(Total Zone de un jugador promedio. En este sentido un jugador promedio será igual a “cero”, uno por
de los datos brindados. En vista de que la fuente del
Location Data, encima del promedio tendrá un TZL positivo, y uno que le cueste carreras a su equipo tendrá un
Total Zone son los datos obtenidos de Retrosheet
o Zonas valor negativo. La comparación es realizada por posiciones por lo que un campo corto y un
(Smith, 2014), esto permite analizar la defensa de
Totales por jugador de tercera base no son comparables en la métrica, sino que lo son en comparación a
cualquier jugador en la historia del béisbol.
Posición) jugadores de su misma posición.
Tabla 4.
Estadísticos de valor individual para el equipo: de nada serviría saber qué tan bueno es un jugador si no podemos determinar qué tan importante es para su equipo
Estadístico de valor
¿Cómo se calcula? Descripción
para el equipo
Representa la verdadera diferencia que hizo un jugador X en el juego. Su cálculo varía según
la posición. Por ejemplo, en el caso de los lanzadores es el resultado de restar las carreras
permitidas de un pitcher en determinadas entradas, a las que hubiera permitido un
RAR reemplazante en la misma cantidad de innings. Generalmente se calcula el nivel de un jugador
(Runs Above de reemplazo su mándole 1 al promed io de carreras de la liga. Es decir, suponiendo que el
RAR del jugador X – RAR de su reemplazo
Replacement, o Carreras promedio de carreras es de 5.5 en la liga, entonces se diría que un reemplazante permitiría 6.5
Sobre el Reemplazo) carreras por cada nueve innings. Por ejemplo, si el pitcher X permite tres carreras en 18
entradas lanzadas, y suponiendo que el reemplazante permitiría 13 (6.5*2), el pitcher X
acumularía un valor RAR igual a 10.
Promedio de MLB (por temporada para un abridor): 30.
Es un estadístico no estand arizado. Se asume que por cada 10 carreras sobre el reemplazo que
aporte un jugador, eso equivale a una victoria más para su equipo a lo largo de una temporada.
WAR
RAR Por ejemplo, en la MLB Albert Pujols ha promediado unas 75-80 anotaciones sobre el
(Wins Above
reemplazo por temporada en su carrera, lo que ha equivalido a 7-8 victorias más por
Replacement, o Victorias 10
temp orada para el equipo de los Cardenales de San Luis. El costo en el mercado actual de
Sobre el Reemplazo)
MLB de una victoria sobre reemplazo para un equipo está estipulado entre $4.5 y $5 millones.
Promedio de MLB (por temporada): 2.
Win
1
Estima cuántos juegos debería ganar un equipo atendiendo a su número de carreras anotadas y
(Pythagorean
permitidas. Puede ser usado como un evaluador de la “suerte” que ha tenido un equipo en su
expectation, o 1 + (Carreras anotadas + Carreras
permitidas)
liga. El número esperado de victorias sería el resultado de multiplicar la Expectativa Pitagórica
Ex pectativa Pitagórica de
por el número de juegos jugados.
Victoria)