15 de diciembre de 2011

Tendencia central y dispersión: lo que sabemos antes de tirar los dados

Otra entrada introductoria sobre conceptos básicos de Estadística. Creo que a los legos les servirá para aclarar algunos conceptos que usaremos en entradas posteriores con más enjundia. Los más versados espero que no se aburran mucho. 

Para conocer cómo se va a comportar en la práctica la distribución de una variable aleatoria resulta práctico estudiar algunas de sus propiedades. Hay mucha información que se puede extraer de la distribución y que es útil a la hora de estudiar el comportamiento de un sistema de juego (por ejemplo la kurtosis o la simetría), pero en esta entrada voy a limitarme a hablar de tendencia central y variabilidad. Más adelante, ya veremos.

Los indicadores de tendencia central nos dicen en torno a qué puntuación (o puntuaciones) de la distribución se agrupan los valores posibles. Puedes pensar en estos indicadores como si fueran el punto de equilibrio: imagina los valores posibles ordenados en el listón de madera de un balancín, cada uno con un peso proporcional a su probabilidad. ¿Bajo qué valor de la distribución hay que poner el eje del balancín para que la tabla quede en equilibrio? Esa es un poco la idea. En otros términos, podemos pensar en la tendencia central como un indicador que resume la variable aleatoria en una única puntuación que describe lo que tiende a ocurrir con mayor frecuencia o de manera asintótica (cuando se repite algo infinitas veces). 

El indicador de tendencia central más conocido es la media, que cuando se refiere a un grupo de puntuaciones consiste en la suma de dichas puntuaciones dividida entre el número de casos. No os estoy contando nada nuevo, ¿verdad? Sigamos a ver. La media se calcula sobre una serie de puntuaciones empíricas, es decir que ya se han obtenido. Por ejemplo, puedes calcular la media de Destreza del grupo de personajes, o tirar 3d10 y calcular la media de los tres resultados obtenidos. Esto puede tener su utilidad, pero no me da la información que quiero sobre la distribución, es decir no me dice cuál es el resultado de Destreza más habitual o normal en el juego o cuáles son los resultados esperables cuando voy a lanzar 3d10. Esperable es la palabra clave, dado que la distribución de la variable aleatoria es un concepto teórico, universal, infinito. Al lanzar los 3d10 puedo sacar tres unos o tres dieces o cualquiera de los mil resultados posibles en una tirada concreta, pero ¿qué pasaría al lanzarlos infinitas veces? Eso es precisamente la distribución de la variable y la media de esas infinitas tiradas no se puede calcular de manera empírica (¡porque no se pueden hacer infinitas tiradas!). En su lugar, se puede calcular gracias al conocimiento que tenemos de la función de probabilidad de la variable: eso es el valor esperado (o esperanza matemática) de la variable, que en una variable aleatoria discreta se calcula multiplicando cada valor posible de la variable por la probabilidad de obtener dicho valor, y sumando estos productos. En una variable aleatoria continua su cálculo requiere el uso de la integral (que no es, ni más ni menos, que una suma infinita), pero como en los juegos de rol sólo empleamos variables discretas, eso que nos ahorramos.

El valor esperado debe su nombre a que, a falta de otra información, sirve como... valor esperado. Es decir, que si tiro 2d6 (por ejemplo) espero sacar siete (calculadlo si os animáis). Naturalmente, puedo obtener cualquier resultado entre dos y doce, pero si repitiera la tirada infinitas veces y calculara la media de todos los resultados obtenidos dicha media sería siete, así que tiene sentido esperar un siete. Por cierto, que en una tirada de 2d6, siete es también el resultado más probable, lo que define otro indicador de tendencia central: la moda

La moda se refiere al valor de la variable que tiene una probabilidad mayor asociada. Si hay varios con máxima probabilidad, entonces hay varias modas en la distribución. La moda puede coincidir con el valor esperado, como en el caso de tirar 2d6, pero también pueden ser valores distintos. Por ejemplo, al lanzar 3d6, los resultados 10 y 11 son la moda, mientras que el valor esperado es 10,5.

Todavía hay otro indicador de tendencia central que nos interesa mencionar: la mediana. La mediana es el valor central de una distribución, que deja el mismo número de casos por debajo de sí y por encima. Dicho de otra manera, si se ordenan todos los valores obtenidos en la distribución de menor a mayor, la mediana es el valor que queda justo en el medio. Por ejemplo, si lanzo 3d10 (generando una distribución de tres valores) y ordeno los resultados de menor a mayor, la mediana es el resultado que queda en segundo lugar (o dicho de otro modo, el valor del dado central, que podría ser igual en algún caso al dado menor o mayor, no importa). En la distribución de una variable aleatoria discreta, la mediana es el primer valor cuya probabilidad acumulada (la probabilidad de obtener ese valor o cualquier otro menor a ese) es igual o mayor a 0,50.

Una de las utilidades de los indicadores de tendencia central es asignar valores sin disponer de más información. Por ejemplo, si aparece un PNJ y su Fuerza no es una característica en la que destaque, entonces parece buena idea asignarle el valor esperado de Fuerza (o la moda). Otro ejemplo, si al calcular la defensa de un personaje no queremos que haya tirada de dados, podemos usar el valor esperado de la tirada de dados de nuestro sistema como un valor fijo que se suma a los valores de juego del personaje. Esto último seria como suponer que cada vez que el personaje hace una tirada de defensa (esquivar, por ejemplo) obtiene el resultado promedio. Varios sistemas de juego hacen esto al calcular la defensa o los resultados de personajes no jugadores en tiradas opuestas.

En relación con esto, hay que tener en cuenta que lo que estamos hablando se refiere a la distribución de las puntuaciones en el juego, no en la "realidad del juego" (la ambientación, si queréis). Por ejemplo, la realidad del juego puede decir que la media humana es 5, pero si los personajes, como héroes que son, generan sus características con 2d6, éste será el dato generalmente relevante para estudiar el funcionamiento de sistema de juego, aunque todavía puede utilizarse esa otra información como valor esperado para los PNJs, por ejemplo: recordemos que una distribución de probabilidad puede ser desconocida, de manera que a veces saber cuál es la media de los PNJs, de los PJs, etc. es conocer directamente cuales son los valores esperados para unos y otros en ausencia de más información sobre la forma de la distribución.

De la variabilidad voy a hablar menos, y de manera más general. Baste decir que los valores posibles de la variable pueden estar muy agrupados en torno al valor esperado o pueden estar muy dispersos. La máxima agrupación seria precisamente que la variable sólo tuviera un valor posible: el valor esperado. En un caso más realista se obtendría un baja variabilidad si los valores que están cerca del esperado son muy probables y la probabilidad de obtener los valores más alejados cae rápidamente. Por ejemplo, imaginad que hacemos las tiradas con 99 monedas (las caras valen uno y las cruces cero en este ejemplo). Podemos obtener resultados entre 0 y 99 si hacemos esto, pero en la práctica la mayoría de los resultados estarán en torno a 50, siendo muy improbable obtener los valores extremos. En cambio, si tiramos 1d100 (pero consideramos 00 como 0, para seguir obteniendo resultados entre 0 y 99), todos los valores posibles son igual de probables (es igual de probable sacar 99 que 50 o que 0), con lo que existe una gran dispersión de las puntuaciones. Ocurre lo mismo en los sistemas en los que se compran puntuaciones, aunque en estos la función de probabilidad sea desconocida: la dispersión será mayor cuando los puntos se reparten directamente (como en Mundo de Tienieblas o Hitos) que cuando hay un coste escalonado de las puntuaciones (como en sLAng o Ars Magica) ¿Qué es mejor? Pues en principio depende si consideras que los valores extremos deberían ser infrecuentes o no... Aunque sobre esto me voy a despachar a gusto más adelante hablando de tirada lineales y no lineales y sobre la costumbre habitual (y errónea a mi entender) de concentrarse en estudiar la distribución de los resultados de los dados, cuando lo importante es la distribución de los resultados de la acción.

Todo eso y alguna cosa más, en próximas entradas.


3 comentarios:

  1. Felicidades por el blog, lo estoy disfrutando mucho.

    Muy de acuerdo con tu última frase:"¿Qué es mejor? Pues en principio depende si consideras que los valores extremos deberían ser infrecuentes o no... Aunque sobre esto me voy a despachar a gusto más adelante hablando de tirada lineales y no lineales y sobre la costumbre habitual (y errónea a mi entender) de concentrarse en estudiar la distribución de los resultados de los dados, cuando lo importante es la distribución de los resultados de la acción."

    ... y esperando leer más sobre este punto.

    ResponderEliminar
  2. Excelente aporte...Muy util para el análisis de sistemas de rol

    ResponderEliminar
  3. Para mí, la entrada más interesante hasta el momento. Espero tener que decirlo de la siguiente también :)

    ResponderEliminar