sábado, mayo 22, 2010

La liga más emocionante de los últimos eones

Esto se publica simultaneamente en Mococrispis

Este año, igual que el anterior, la liga ha sido más allá de las filias y fobias de cada uno un espectáculo grotesco. Este año la diferencia entre el primero (El FC Barcelona) y el tercero (el Valencia CF) ha sido de 25 puntos. El año pasado, del Barcelona con el tercero (El Sevilla FC) fue de 17 puntos. Estas diferencias no vienen sólo de la magia maravillosa que emana de las mentes y piernas mágicas del País de la Piruleta, si no de algo bastante más prosaico: La pasta, el vil metal. Empecemos ilustrando lo que digo con el siguiente cuadro sacado de Ensilicio:



El equipo con más presupuesto (el Real Madrid) tiene el triple que el tercero (el Valencia) y 47 veces más que el último (el Xerez) pero ligeramente más que el Barcelona (2º) La pregunta a responder es: ¿es esta diferencia de presupuesto una variable explicativa del rendimiento deportivo? La intuición económica es un rotundo sí, y la relación causal parece clara, pero vamos a ver qué dicen los datos. La clasificación este año ha sido:


Para comparar los presupuestos con los resultados lo más sencillo es hacer una regresión lineal, que nos dará un parámetro y un valor por el que multiplicar la variable explicativa (el presupuesto) para obtener los valores que intentamos explicar (los puntos y los goles)

El resultado es el siguiente:

Puntos en función del presupuesto

La ecuación nos da el una aproximación del precio corregido al que cada equipo ha pagado cada punto. R2 nos da una idea del error de la estimación (la distancia de los puntos a la recta que acabamos de trazar) En ciencias sociales y con modelos tan simples una R de 0,7 ya empieza a considerarse una aproximación buena. Si hacemos lo mismo para los goles obtenemos:

Goles en función del presupuesto

El resultado es bastante similar al anterior: El dinero compra goles.

A pesar de que los resultados dan a entender que hay muchas chances de que estemos en lo cierto y realmente casi todo sea cuestión de carteras, vamos a cotejar los datos con los del año anterior, que en principio no fueron tan abrumadores. A priori, las regresiones de 2008/2009 estarán sesgadas respecto a las del año 2009/2010 porque no disponía de información de los presupuestos de los tres descendidos (Betis, Numancia y Recreativo de Huelva) y me daba pereza buscarlos.



En realidad lo obtenido no es tan distinto de los resultados de este año.

La línea de regresión nos da también información sobre la eficiencia deportiva del dinero de los equipos. A priori podemos intuir que los que estén sobre la recta de regresión, habrán aprovechado mejor su dinero que los que estén por debajo de la misma, y que habrán sacado más ‘éxito deportivo’ por cada euro invertido que sus competidores. Podemos además hacer una clasificación midiendo la distancia de cada uno de los puntos a la recta. Cuanta mayor sea la distancia desde el norte, mejor.

Así, medido en puntos “eficientes”, la clasificación de la liga habría quedado así:


Felicidades a Mallorca y Getafe: No han ganado la Liga, pero en igualdad de condiciones han sido con mucha diferencia los mejores equipos del campeonato. (Y el Valencia seguiría tercero)

Y recuerden:

16 comentarios:

Folken dijo...

Nota para los interesados: El añadir una variable instrumental al Atlético de Madrid por haber ganado la Liga Intertoto no mejora el resultado y no es representativo. Las regresiones que incluyen presupuesto^2 mejoran la R^2 del año 2008/2009 y aproxima el valor de los estimadores a los de 2009/2010. No se me ocurre cómo corregir para el hecho de que la liga siempre tenga distribución de cola gorda. Todas las variables son representativas al 99%. Todos los F tienen valores estratosféricos.

Si quieren el fichero de datos:
http://www.megaupload.com/?d=41HHDCMT

Orayo dijo...

Muy interesante.

Folken dijo...

Creía que habías muerto o algo. No sé nada de ti desde hace 1k de siglos o así.

denke dijo...

Genialidoso, maestrífico, molamogollonístico!

Aunque, al final la pregunta es... ¿Como es que no somos todos del Barça? Mira a Villa, ya se ha decidido... ;)

Andreu dijo...

Muy buen trabajo, y el anterior también! Yo también conocía la web Ensilicio, hace buenos análisis. Cuidate!

nieh dijo...

¿Tú también vas a hablar de fútbol? Maldita plaga... tendré que hacerme fan del Mallorca ;O

Folken dijo...

Denke, tú lo que quieres es que España tenga una liga como la que tendría Mónaco si no les dejasen jugar en la francesa...

Andreu! creo que enlazaste a Ensilicio en el feisbuc tiempo ha.

Nié, era una obligación moral hacer esto. Además, esto habla de fronteras de eficiencia medias, ¿no?

dezaragoza dijo...

Pues jamás pensé que algo relacionado con el fútbol (fúrgol para los especialistas en España) me fuera a interesar lo más mínimo. Y me ha interesado levemente, aunque al final has demostrado matemáticamente lo que se sabe.

Igualmente gracias por el currelo realizado.

Folken dijo...

Me ha interesado levemente

Esa frase es genial.

De todas formas, siempre he pensado que la estadística más que demostrar, lo que hace es darte una idea posible de lo cerca o no que estás de probablemente estar en lo cierto. Probablemente.

Podrán comprarse ligas, pero no podrán comprar un dinosaurio (aún)

Cantarella dijo...

Otro muy buen post y eso que el fútbol me interesa bien poco. ¡Gracias por el excel!

pcbcarp dijo...

Has acabado de hundirme en la ciénaga del nihilismo. Resulta que el Pucela, no sólo no tiene pasta, sino que la que tiene le aprovecha de puta pena.

Joer...

foodgol dijo...

Que honor!
Gran analisis, si señor. Sería interesante hacer una análisis de cobertura mediática. Creo que sería (aún) más embarazoso...
Linkado en el facebook.

engelson dijo...

a mi también me ha interesado levemente, lo que más (aparte de los preciosos gráficos) ha sido el enlace wikipédico a la palabra "stronzata", observo que etimológicamente procede de "stronzo", y aqui viene lo bueno y lo que me temo que no me va a dejar dormir, la wiki describe "stronzo" como "cilindro solido di sterco", en vez de usar su definición más natural: "cilindro solido di merda"

lo que se aprende leyendo...

El chicharrero terrible dijo...

Me ha interesado superficialmente. (no se si es mas o menos que levemente):).

Lo que aportaría muchas luces sobre esta droga social, sería analizar esta clasificación en función de la deuda declarada de los clubs. No tengo idea de donde acceder a esos datos pero me ofrecería gustosamente a ayudar en el análisis. Mas allá del presupuesto la deuda nos ofrecería una idea de cuantos recuros futuros han destinados algunos golfos a hacer el tolete ante las masas.

Aun mi interes superficial como siempre consigue sorprenderme con sus enfoques.

Folken dijo...

El problema en estas cosas del fúmbol y su dinero es encontrar datos.

Alicia Liddell dijo...

¿Y a usted no le contratan para analizar la solvencia de los bancos, los países y las compañías de seguros?


Prohibido plagiar o hacer obras derivadas sin permiso. Prohibida su distribución comercial (¿realmente alguien podría sacar dinero de esto?) sin permiso.
I'm myself and I approve this message.