22 de marzo de 2012

Algo latente

Las limitaciones del modelo lineal en Psicometría llevan a desarrollar, a partir de la década de los 50, un nuevo paradigma dentro de la medición psicológica. Este nuevo paradigma, la Teoría de la Respuesta al Ítem (TRI), se centra en la consideración de lo medido como "latente" o inobservable, haciendo un énfasis especial en este punto, por lo que también se conoce como modelo fuerte de la puntuación verdadera (por contraposición al modelo débil que sería el modelo lineal del que hablamos en el post anterior).

En TRI, un modelo matemático relaciona la probabilidad de tener éxito en una tarea con el rasgo latente del sujeto (el equivalente a la puntuación verdadera y, en términos roleros, la característica o habilidad apropiada para la acción). El modelo matemático puede tener, en principio, cualquier forma, siempre que cumpla las siguientes condiciones:


  • Estar acotado en 0 y 1, es decir que la probabilidad mínima de tener éxito es 0 y la máxima es 1 (vamos, lo que viene siendo los límites propios de la probabilidad.
  • Ser monótono creciente, es decir, que conforme aumente el rasgo latente, aumente la probabilidad de tener éxito. Esto tiene todo el sentido: a mayor fuerza, mayor probabilidad de levantar un cierto peso, a mayor habilidad disparando, mayor probabilidad de acertar un blanco, etc.
  • Estar caracterizado por determinados parámetros de la tarea (esto, en realidad, no es cierto, ya que hay modelos de TRI no paramétricos, pero para nuestros fines interesa que sea así). Es decir, que la probabilidad de tener éxito depende del nivel de rasgo del sujeto y también de alguna propiedad de la tarea. Para nuestros fines, la dificultad de la tarea debería ser tenida en cuenta, así que perfecto.


De esta forma, sabiendo cuál es el nivel de habilidad del sujeto y la dificultad de la tarea puede calcularse la probabilidad de éxito usando el modelo matemático correspondiente. Si ahora quiero saber que es lo que pasa finalmente solo tendría que generar un número aleatorio de una distribución uniforme entre 0 y 1 y compararlo con la probabilidad de éxito: si el número es menor o igual que la probabilidad, la acción tiene éxito. Si el número es mayor, la acción falla.

Nótese que un número aleatorio generado de la distribución uniforme (0, 1) sigue una distribución lineal, pero eso no significa que un sistema de resolución de tareas así planteado sea lineal. Por contra, dependerá realmente de cuál sea modelo matemático que relaciona la habilidad del sujeto con la probabilidad de éxito en la tarea. Si dicho modelo es lineal, entonces sí, será un sistema lineal, pero esto no es lo normal.

De hecho, los primeros modelos de TRI presentados eran modelos gaussianos. Sí, se trata de un enfoque perfecto para las condiciones planteadas, ya que la función de distribución de probabilidad de la curva de Gauss es asíntotica en 0 y 1, es monótona creciente y admite parámetros para determinar su localización, su tasa de crecimiento, etc.

Los modelos gaussianos se abandonaron rápidamente porque eran matemáticamente difíciles de tratar (requieren cálculo integral, son difíciles de derivar... en fin, un chocho) y se propusieron en su lugar modelos logísticos, con la singularidad de que usando una constante de escalamiento se producía una aproximación casi perfecta a los modelos gaussianos.

El modelo logístico más sencillo es el de un parámetro (precisamente, la dificultad), también llamado modelo de Rasch y tiene la siguiente expresión:

Donde:
D es la constante que aproxima el modelo logístico al normal, cuando D = 1.701
z es el rasgo latente del sujeto (su puntuación en la característica o habilidad) expresada en puntuaciones típicas (media 0 y desviación típica 1)
b es la dificultad de la acción, expresada en las mismas unidades que z

La función tiene, por cierto, esta pinta:

Donde las dos curvas representarían acciones con distinta dificultad (es decir, distinto valor de b). Como puede verse, la probabilidad de éxito crece en función del nivel de habilidad z (en el gráfico aparece como Ability). La línea continua representa una acción más compleja, mientras que la línea punteada representa una acción de dificultad media.

¿Nos sirve esto para nuestro sistema de juego "perfecto"? En la próxima entrega veremos como.

6 de febrero de 2012

Con el Modelo Lineal General hemos topado

El Modelo Lineal General (MLG) es uno de los más utilizados en Ciencias Sociales y de la Salud para explicar la variabilidad de la conducta. Sus aplicaciones son diversas, pero en lo que a nosotros nos interesa, se expresa para explicar la medida del comportamiento de una persona de la siguiente manera:

X = V + E

Dónde X es el comportamiento observado o exhibido por la persona, V una expresión auténtica e invariable de dicho comportamiento y E un error aleatorio. Por ejemplo, un señor tiene una Fuerza que le permite levantar 300 kg (V) como máximo, sin embargo, intenta levantar 290 kg y no lo consigue. mientras que en otro momento intenta levantar 310 kg y si lo consigue. Estas diferencias entre la expresión de la Fuerza de este señor tan musculoso en cada momento están debidas a los errores aleatorios, es decir E: con un E positivo el señor levanta más peso del que debiera, con un E negativo, levanta menos.

La cosa en la realidad es que rara vez sabemos cuales son los valores V de las personas, sino que precisamente lo que tratamos es de estimarlos a partir de los valores X demostrados en diversos momentos, usando indicadores de tendencia central y esas cosas. El MLG, apoyado sobre una serie de supuestos, nos permite dar el salto de los observado (X) a lo latente (V).

Pero volvamos a los juegos de rol. En los juegos de rol, los valores V son conocidos, ya que son las puntuaciones de los personajes en sus características, habilidades, etc. ¿Qué separa entonces los valores V de los X? El error aleatorio E que en los juegos de rol es... efectivamente, el resultado de una tirada de dados.

Como estaréis viendo ya, el quid de la cuestión está en los errores, ya que las puntuaciones V son intrínsecas de los sujetos y las X son simplemente la suma de X más E... por eso se llama modelo lineal general, vaya. Por esa razón se establecen una serie de supuestos sobre los errores, que quizás puedan darnos ideas en nuestra búsqueda del sistema de juego perfecto.

El primer supuesto, es que el valor esperado de los errores es cero. Es decir, hay errores por defecto y por exceso y estos tienden a anularse entre sí. Rolearamente, esto nos obligaría a tener dados que suman y dados que restan (por ejemplo, la solución 1d6 - 1d6 que usan Feng Shui, sLAng y Eyes Only, o cualquier combinación de dados Fudge). Daos que si no hacemos esto, es decir, si el valor esperado de los errores es distinto a cero, entonces X y V estarán expresados en escalas distintas (concretamente, en escalas centradas en valores distintos). Esto último no es un problema si lo tenemos en cuenta.

El segundo supuesto es que la distribución de los errores es normal, es decir sigue la forma de la campana de Gauss, nuestra vieja amiga. Esto es porque los errores son variables aleatorias continuas y, realmente, son la suma de muchas pequeñas causas diferentes: Teoría del Caos pura y dura. Al ser la suma de muchas variables aleatorias continuas, el Teorema Central del Límite nos lleva a suponer que seguirán una distribución normal. En el caso rolero, como no son infinitas las causas, sino que simulamos con un puñado de dados ese efecto y, además, son discretas, pues no podrán seguir la deseada distribución gaussiana, pero no importa. Posiblemente nos satisfaga igualmente cualquier otra distribución no lineal.

Y llegamos al tercer punto, que es la relación que existe entre los errores y las puntuaciones verdaderas. Esta relación puede existir (es decir puede que las personas con puntuaciones más altas puedan hacer proezas más separadas de su propia fuerza) o puede no existir (el error varía igual para ratones, hombres y elefantes). Lo más realista es lo primero, pero lo segundo es lo que los juegos de rol tienden a suponer... y algunos modelos científicos también (estos vienen a llamarse modelos débiles de la puntuación verdadera).

Voy a explicar esto un poco mejor con un ejemplo. Supongamos que dos personas tienen fuerza suficiente para levantar, en condiciones normales, 50 y 250 kilos, respectivamente (es decir, sus puntuaciones Verdaderas, expresadas en kilogramos que pueden levantar, son 50 y 250). Ahora las dos tratan de levantar 50 kg más de lo que debieran (100 y 300 kg, luego las dos necesitan un E de 50 kg para lograr su objetivo). ¿Cuál es más probable que lo consiga? Si asumimos que no hay relación entre V y E, entonces las dos tienen las mismas probabilidades de levantar esos 50 kg extra. Sin embargo, el sentido común (y la experiencia empírica) nos dicen que esos 50 kg extra suponen un reto mayor para la primera persona (¡tiene que levantar el doble de su fuerza!) que para la segunda. La mayoría de los sistemas de juego no tienen en cuenta esto, es decir asumen que no hay relación entre V y E y son por tanto modelos débiles de la puntuación verdadera.

No pasa nada, hablaremos de modelos fuertes de la puntuación verdadera en otra entrada posterior, por ahora vamos a conformarnos con estos modelos, que si han servido a la Psicometría durante la tira de años no veo porque no van a valernos a nosotros.

En realidad, sólo nos queda determinar una cosa y es la relación que existe entre X y E, es decir, que grado o proporción de X se debe a V y que parte a E. Si queréis, es como decir que parte de la ejecución de la acción (X) es talento o capacidad de la persona (V) y que parte se debe a la suerte (E). Esto podría llevarnos al concepto de fiabilidad, expresado como cociente de varianzas... pero igual nos metemos en un jardín que escapa de las modestas pretensiones de este blog. Así que digámoslo llanamente: se trata de determinar el grado en que los dados intervienen en el juego.

Para esto, un consejo práctico: construye tablas de probabilidad de los resultados que pueden obtener dos personajes, uno con la puntuación mínima (humana o equivalente en el juego), otro con la puntuación media y otro con la puntuación máxima (todas humanas o de lo sean los personajes). ¿Cuántas veces debería superar el personaje con la puntuación menor al de la puntuación media? ¿Cuántas veces al de la puntuación mayor? No hay respuesta única para esto, y dependerá del nivel de epicidad que quieras darle a tu sistema (en un sistema épico, aquellos con puntuaciones bajas deberían tener probabilidades decentes de superar a los que tienen puntuaciones altas), pero en un sistema de realismo medio, podríamos suponer que una puntuación baja sólo debe superar a una media en torno al 10% de las veces, mientras que una baja a una alta solo debería superarla el 1% de las veces.

Buscar la combinación de dados que haga esto dependerá de la escala en la que estemos expresado las puntuaciones V y de una cierta maña con la combinatoria. ¿Os animáis a buscar ejemplos que cumplan estas condiciones? Un consejo: usar dados de 10 facilita los cálculos.

7 de enero de 2012

¿Gaussiano? Me temo que no

Pasada la resaca navideña, estoy de vuelta para compartir algunas de mis ideas e inquietudes sobre sistemas de juego y, sobre todo, la estadística subyacente. Hoy quiero hablar un poco sobre funciones de probabilidad lineales y no lineales en las tiradas de dados.

Ya sabemos que la función de probabilidad relaciona los valores de la variable aleatoria (en este caso el resultado de los dados) con su probabilidad de obtenerlos. Además, la función de distribución de probabilidad relaciona esos valores con la probabilidad de obtener un valor igual o menor (es decir, es la función de probabilidad acumulada). Pues bien, una función de probabilidad es lineal si la probabilidad de todos los valores posibles es la misma o, lo que es equivalente, si la función de distribución traza una linea recta. 

En los juegos de rol, son lineales todos los sistemas que utilizan un único dado (incluyendo un dado de cien, los clásicos sistemas de percentiles). Pero en el momento en que empezamos a sumar dados o escoger la mediana de una distribución generada lanzando varios dados (escoger el valor central de los dados, vaya) las leyes de la combinatoria entran en nuestras vidas retorciendo la funciones de probabilidad y distribución. Estos son los sistemas no lineales.

Hay en el mundillo de los juegos de rol una tendencia desmedida y profundamente errónea de llamar gaussianos a los sistemas no lineales. Sería algo así como llamar coche a todo lo que tenga ruedas o coca-cola a todas las bebidas. Es más, en realidad sería como llamar coca-cola a todos los líquidos comestibles que no son bebidas (como el vinagre o el aceite). ¿De qué estoy hablando? Expliquemos que es realmente un modelo gaussiano para entenderlo.

Estudiando diversas variables físicas (como la estatura o el peso) y otras de carácter psicosocial (como la inteligencia o la extroversión), se comprueba que existe una forma característica para dichas distribuciones. Es una forma de campana, simétrica que viene a tener esta pinta:



El descubrimiento de esta función se atribuye a Gauss (y por eso se lleva su nombre) y está relacionado con que las variables descritas pueden definirse por la suma de causas independientes y, por tanto, ser explicadas por el teorema central del límite. Pero no voy a seguir por este camino. Quedémonos con que es una forma muy frecuente para ciertas variables.

Ahora bien, la forma de la campana de Gauss (también llamada distribución normal) sigue una determinada expresión matemática (que nos vamos a ahorrar aquí) y, lo más importante de todo, se aplica únicamente a variables aleatorias continuas. De hecho, no es una función de probabilidad (ya que las variables aleatorias no tienen función de probabilidad: si hay infinitos valores, no puede calcularse la probabilidad de obtener un valor concreto, ya que seria necesariamente cero), sino que es una función de densidad de probabilidad: representa la probabilidad con el área que hay bajo la curva, no con su altura. Si escogemos dos valores cualquiera y comprobamos cuál es el área encerrado entre ellos (calculando la correspondiente integral definida) estaremos obteniendo la probabilidad de obtener un valor entre esos dos puntos.

Como nuestras tiradas de dados son necesariamente discretas, no pueden seguir la curva de Gauss, aunque pueden aproximarse a ella mediante polígonos, habitualmente histogramas... Pero esa es otra historia. La cuestión es que esa aproximación sólo se consigue sumando muchos dados (¡por el teorema central del límite!), tantos que la suma de valores empieza a parecer infinita y por tanto puede tratarse como continua... Vamos, que es un caso hipotético que en nuestra mesa de juego no tiene ninguna cabida.

Y ahora viene la traca final: cuando diseñamos un sistema de juego, normalmente nos preocupa esa aproximación a lo gaussiano por cuestiones de realismo. Si en la realidad hay tantos procesos que siguen la distribución normal, entonces parece que obtendremos un realismo mayor si nuestro sistema de juego se aproxima a la distribución gaussiana. Esto es cierto, en espíritu. Porque en la realidad no hay tiradas de dados y lo que se distribuye siguiendo la campana de Gauss son los procesos o sucesos propiamente dichos, no un valor que se les añada o compare. Donde quiero ir a parar es que realmente es la resolución de éxito o fracaso la que debería tener una función de probabilidad no lineal, no necesariamente la tirada de dados. 

En ciencia, lo más parecido que hay a una tirada de dados es la generación de números aleatorios en estudios de simulación. Pues bien, cuando se quiere comprobar en un estudio de simulación si un suceso ocurre o no, lo que se hace es generar un número aleatorio entre 0 y 1 (siguiendo la llamada distribución uniforme, una distribución lineal para variables continuas) y comparar el valor obtenido con la probabilidad del suceso. Si la probabilidad es menor o igual, el suceso ocurre. ¿A qué os suena esto? Efectivamente, amigos, esto se parece bastante a los sistemas de percentiles (que usan como sabemos 1d100 y son, por tanto, lineales). Y entonces, ¿dónde queda el asunto gaussiano que tanto nos preocupaba hace un párrafo? ¿Qué pensáis?

19 de diciembre de 2011

Anatomía de un sistema de juego

No hay, que yo sepa, una teoría sobre sistemas de juego que indique qué elementos deben constituir de manera necesaria o suficiente un conjunto de reglas para que puedan ser consideradas un sistema de juego.  Tenemos, sin embargo, una idea bastante intuitiva de lo que es y, partiendo de ella, voy a intentar extraer los elementos que componen un sistema de juego que nos servirán en futuras entregas para diseñar los nuestros propios de una manera más estructurada.

Vaya por delante decir que no todos los sistemas de juego requieren de todos los elementos que voy a mencionar (por lo tanto, no todos son necesarios), pero sí están presentes en la mayoría de ellos, así que merece la pena comentarlos y ver qué aportan al sistema.

El primer constituyente de un sistema de juego son, sin discusión, los personajes. En realidad, los personajes son un conjunto de elementos, pero tienen la cohesión suficiente y la importancia indiscutible para mencionarlos en primer lugar. A pesar de ello, para abordar de manera práctica su papel en el sistema hay dividirlos en sus componentes fundamentales: características, habilidades, nivel, clase, ventajas, desventajas, aspectos, etc. De todos estos hay dos que aparecen en prácticamente todos los juegos: características y habilidades.

Características y habilidades están representados por puntuaciones numéricas (incluso los que los sistemas que utilizan adjetivos para describirlas terminan teniendo un equivalente numérico que es más práctico). Es decir, son puntuaciones y así nos vamos a referir a ellas genéricamente. De manera que el primer elementos que vamos a observar son las puntuaciones: valores numéricos que reflejan capacidades innatas o aprendidas de los personajes. Las puntuaciones se pueden caracterizar fundamentalmente por dos elementos: cuáles son (incluso si se trata de una lista abierta nos estaríamos refiriendo a esto) y, lo que es más relevante para nuestro objetivo actual, su escala.

Las puntuaciones en todo juego de rol están expresadas en una determinada escala. En ocasiones, un tipo de puntuaciones se expresa en una escala y otras en otro (como ocurre con características y habilidades en La llamada de Cthulhu, por ejemplo). A mi esto me parece poco práctico, nada intuitivo y muy poco elegante, pero no me quiero despistar ahora con eso.

En la mayoría de los juegos, hay más cosas con puntuaciones además de los personajes: dificultades, armas, vehículos, etc. Todos tienen puntuaciones y las puntuaciones se expresan en escalas, iguales o diferentes. En general, nos encontramos con una escala diferente por cada subsistema de resolución que haya: uno para las acciones, otro para el daño, etc. Pero no nos adelantemos.

El siguiente elemento de los personajes son los rasgos cualitativos. Algunos, como los niveles, pueden ser ordinales, mientras que otros, como los aspectos o las clases de personaje, serán claramente nominales. Todos ellos se caracterizan por no aplicarse como números directamente, sino que tienen asociada otra información (que puede incluir, paradójicamente, modificaciones numéricas sobre las puntuaciones).

Lo cuál nos lleva a la mecánica de resolución de acciones. Esto se refiere a de qué manera se introduce la variación aleatoria sobre las puntuaciones durante el juego: recordemos que la ejecución de acciones es una variable aleatoria y que, por tanto, un componente azaroso debe interaccionar con los valores fijos de las puntuaciones para simular esto y determinar el éxito o fallo de una acción. ¿Y los sistemas sin azar? Que no te engañe la ausencia de dados, gestionar recursos como contadores, etc. es un componente aleatorio... pero no puede ser determinado a priori (y en la práctica posiblemente tampoco a posteriori).

La mecánica de resolución tiene que tener en cuenta la escala de las puntuaciones e introducir el grado de variabilidad necesario para que la resolución de acciones sea emocionante. Esto último es indiscutiblemente una cuestión de gustos, pero sería bastante ingenuo pensar que el realismo es más importante que la diversión. ¿No os parece? En todo caso sí, un cierto grado de realismo parece una condición deseable también. Con tener en cuenta la escala de puntuaciones me refiero a que exista un equilibrio entre lo determinante que es el azar y lo importantes que son las puntuaciones. Si la escala de las características va de 1 a 5 no parece muy sensato que la resolución consista en sumar 1d100 a dichas puntuaciones... Cómo combinar puntuaciones y azar parece la proporción áurea de los sistemas de juego. 

En realidad, y esto es posiblemente lo más relevante que voy a decir aquí, la mecánica de resolución es un procedimiento para simular el comportamiento de la función que relaciona las puntuaciones del personaje (y ocasionalmente sus rasgos cualitativos), las circunstancias (dificultades normalmente) y otros elementos (modificadores por objetos o similar) con la probabilidad de obtener éxito o fracaso en una acción. Esto es cierto incluso si la función no ha sido estudiada previamente... ¿No sería mejor entonces conocerla? Claro que sí, nos pondremos a ello en el futuro. El procedimiento en cuestión suele consistir en sumar puntuaciones e introducir un componente aleatorio mediante comparación o adición. 

Idealmente, la mecánica de resolución debería ser lo más exhaustiva posible. Sin embargo, habrá aspectos el juego que requieran subsistemas. Magia, salud y combate son los ejemplos paradigmáticos de subsistemas que pueden ser necesarios. A mi entender, cuanto más universal sea la mecánica de resolución y más pueda extenderse a los subsistemas, mejor que mejor. Y cuando los subsistemas son inevitables, mejor que se parezcan entre sí que diferenciarlos totalmente: si la salud física y la mental pueden emplear el mismo mecanismo, eso que gana en coherencia y robustez el sistema.

Hagamos un poco de balance entonces. ¿Qué es un sistema de juego? Es un listado de componentes cuantitativos y cualitativos usados para representar los aspectos de la realidad simulada por el juego (personajes, circunstancias, objetos), que están expresados en una cierta escala y relacionados con la probabilidad de ocurrencia de sucesos (éxito o fracaso en acciones) mediante una mecánica aleatoria que puede incluir variaciones (subsistemas) destinados a cubrir áreas singulares del juego.

Con esto me quedo. ¿Ha sido muy caótico? Intentaremos aclarar lo que sea más confuso en el futuro. De momento me quedo con las ganas de hablar más en profundidad sobre escalas y, por encima de todo, de funciones de probabilidad. Pero eso será otro día.

15 de diciembre de 2011

Tendencia central y dispersión: lo que sabemos antes de tirar los dados

Otra entrada introductoria sobre conceptos básicos de Estadística. Creo que a los legos les servirá para aclarar algunos conceptos que usaremos en entradas posteriores con más enjundia. Los más versados espero que no se aburran mucho. 

Para conocer cómo se va a comportar en la práctica la distribución de una variable aleatoria resulta práctico estudiar algunas de sus propiedades. Hay mucha información que se puede extraer de la distribución y que es útil a la hora de estudiar el comportamiento de un sistema de juego (por ejemplo la kurtosis o la simetría), pero en esta entrada voy a limitarme a hablar de tendencia central y variabilidad. Más adelante, ya veremos.

Los indicadores de tendencia central nos dicen en torno a qué puntuación (o puntuaciones) de la distribución se agrupan los valores posibles. Puedes pensar en estos indicadores como si fueran el punto de equilibrio: imagina los valores posibles ordenados en el listón de madera de un balancín, cada uno con un peso proporcional a su probabilidad. ¿Bajo qué valor de la distribución hay que poner el eje del balancín para que la tabla quede en equilibrio? Esa es un poco la idea. En otros términos, podemos pensar en la tendencia central como un indicador que resume la variable aleatoria en una única puntuación que describe lo que tiende a ocurrir con mayor frecuencia o de manera asintótica (cuando se repite algo infinitas veces). 

El indicador de tendencia central más conocido es la media, que cuando se refiere a un grupo de puntuaciones consiste en la suma de dichas puntuaciones dividida entre el número de casos. No os estoy contando nada nuevo, ¿verdad? Sigamos a ver. La media se calcula sobre una serie de puntuaciones empíricas, es decir que ya se han obtenido. Por ejemplo, puedes calcular la media de Destreza del grupo de personajes, o tirar 3d10 y calcular la media de los tres resultados obtenidos. Esto puede tener su utilidad, pero no me da la información que quiero sobre la distribución, es decir no me dice cuál es el resultado de Destreza más habitual o normal en el juego o cuáles son los resultados esperables cuando voy a lanzar 3d10. Esperable es la palabra clave, dado que la distribución de la variable aleatoria es un concepto teórico, universal, infinito. Al lanzar los 3d10 puedo sacar tres unos o tres dieces o cualquiera de los mil resultados posibles en una tirada concreta, pero ¿qué pasaría al lanzarlos infinitas veces? Eso es precisamente la distribución de la variable y la media de esas infinitas tiradas no se puede calcular de manera empírica (¡porque no se pueden hacer infinitas tiradas!). En su lugar, se puede calcular gracias al conocimiento que tenemos de la función de probabilidad de la variable: eso es el valor esperado (o esperanza matemática) de la variable, que en una variable aleatoria discreta se calcula multiplicando cada valor posible de la variable por la probabilidad de obtener dicho valor, y sumando estos productos. En una variable aleatoria continua su cálculo requiere el uso de la integral (que no es, ni más ni menos, que una suma infinita), pero como en los juegos de rol sólo empleamos variables discretas, eso que nos ahorramos.

El valor esperado debe su nombre a que, a falta de otra información, sirve como... valor esperado. Es decir, que si tiro 2d6 (por ejemplo) espero sacar siete (calculadlo si os animáis). Naturalmente, puedo obtener cualquier resultado entre dos y doce, pero si repitiera la tirada infinitas veces y calculara la media de todos los resultados obtenidos dicha media sería siete, así que tiene sentido esperar un siete. Por cierto, que en una tirada de 2d6, siete es también el resultado más probable, lo que define otro indicador de tendencia central: la moda

La moda se refiere al valor de la variable que tiene una probabilidad mayor asociada. Si hay varios con máxima probabilidad, entonces hay varias modas en la distribución. La moda puede coincidir con el valor esperado, como en el caso de tirar 2d6, pero también pueden ser valores distintos. Por ejemplo, al lanzar 3d6, los resultados 10 y 11 son la moda, mientras que el valor esperado es 10,5.

Todavía hay otro indicador de tendencia central que nos interesa mencionar: la mediana. La mediana es el valor central de una distribución, que deja el mismo número de casos por debajo de sí y por encima. Dicho de otra manera, si se ordenan todos los valores obtenidos en la distribución de menor a mayor, la mediana es el valor que queda justo en el medio. Por ejemplo, si lanzo 3d10 (generando una distribución de tres valores) y ordeno los resultados de menor a mayor, la mediana es el resultado que queda en segundo lugar (o dicho de otro modo, el valor del dado central, que podría ser igual en algún caso al dado menor o mayor, no importa). En la distribución de una variable aleatoria discreta, la mediana es el primer valor cuya probabilidad acumulada (la probabilidad de obtener ese valor o cualquier otro menor a ese) es igual o mayor a 0,50.

Una de las utilidades de los indicadores de tendencia central es asignar valores sin disponer de más información. Por ejemplo, si aparece un PNJ y su Fuerza no es una característica en la que destaque, entonces parece buena idea asignarle el valor esperado de Fuerza (o la moda). Otro ejemplo, si al calcular la defensa de un personaje no queremos que haya tirada de dados, podemos usar el valor esperado de la tirada de dados de nuestro sistema como un valor fijo que se suma a los valores de juego del personaje. Esto último seria como suponer que cada vez que el personaje hace una tirada de defensa (esquivar, por ejemplo) obtiene el resultado promedio. Varios sistemas de juego hacen esto al calcular la defensa o los resultados de personajes no jugadores en tiradas opuestas.

En relación con esto, hay que tener en cuenta que lo que estamos hablando se refiere a la distribución de las puntuaciones en el juego, no en la "realidad del juego" (la ambientación, si queréis). Por ejemplo, la realidad del juego puede decir que la media humana es 5, pero si los personajes, como héroes que son, generan sus características con 2d6, éste será el dato generalmente relevante para estudiar el funcionamiento de sistema de juego, aunque todavía puede utilizarse esa otra información como valor esperado para los PNJs, por ejemplo: recordemos que una distribución de probabilidad puede ser desconocida, de manera que a veces saber cuál es la media de los PNJs, de los PJs, etc. es conocer directamente cuales son los valores esperados para unos y otros en ausencia de más información sobre la forma de la distribución.

De la variabilidad voy a hablar menos, y de manera más general. Baste decir que los valores posibles de la variable pueden estar muy agrupados en torno al valor esperado o pueden estar muy dispersos. La máxima agrupación seria precisamente que la variable sólo tuviera un valor posible: el valor esperado. En un caso más realista se obtendría un baja variabilidad si los valores que están cerca del esperado son muy probables y la probabilidad de obtener los valores más alejados cae rápidamente. Por ejemplo, imaginad que hacemos las tiradas con 99 monedas (las caras valen uno y las cruces cero en este ejemplo). Podemos obtener resultados entre 0 y 99 si hacemos esto, pero en la práctica la mayoría de los resultados estarán en torno a 50, siendo muy improbable obtener los valores extremos. En cambio, si tiramos 1d100 (pero consideramos 00 como 0, para seguir obteniendo resultados entre 0 y 99), todos los valores posibles son igual de probables (es igual de probable sacar 99 que 50 o que 0), con lo que existe una gran dispersión de las puntuaciones. Ocurre lo mismo en los sistemas en los que se compran puntuaciones, aunque en estos la función de probabilidad sea desconocida: la dispersión será mayor cuando los puntos se reparten directamente (como en Mundo de Tienieblas o Hitos) que cuando hay un coste escalonado de las puntuaciones (como en sLAng o Ars Magica) ¿Qué es mejor? Pues en principio depende si consideras que los valores extremos deberían ser infrecuentes o no... Aunque sobre esto me voy a despachar a gusto más adelante hablando de tirada lineales y no lineales y sobre la costumbre habitual (y errónea a mi entender) de concentrarse en estudiar la distribución de los resultados de los dados, cuando lo importante es la distribución de los resultados de la acción.

Todo eso y alguna cosa más, en próximas entradas.


13 de diciembre de 2011

Características y demás constructos

La Psicología (como ciencia de la mente y la conducta) y el rol se parecen más de lo que puede parecer a simple vista. El paralelismo puede ser, en ocasiones, hasta inquietante: cuando estudiaba la licenciatura, un compañero y yo siempre hacíamos la broma de que las hojas de respuesta de los tests (o más concretamente las hojas de resultados o perfiles) eran como fichas de personaje... A día de hoy sigo dándole vueltas a un sistema de creación de personajes que consista en responder a un cuestionario sobre el personaje (lo que queremos que sepa hacer o no hacer) y que una vez corregido nos de los valores de las características, habilidades, etc. Una prueba de este tipo sería necesariamente ipsativa o de elección forzosa, que es una forma en la se controla en los tests la deseabilidad social (para entendernos, el munchkinismo). Pero bueno, seguiré dándole vueltas e igual presento algo por aquí sobre esto en el futuro.

En realidad, de lo que yo quería hablar es de constructos. No, no me refiero a golems ni seres mecánicos, sino a constructos tal y como los entendemos en ciencia: variables inobservables, cuya existencia se supone (en el marco de una teoría) sobre sus manifestaciones físicas y que resulta útil para explicar fenómenos que de otra manera parecerían inconexos. El ejemplo típico es la inteligencia: no puede ser observada (ni medida) directamente, pero sí determinados comportamientos como la capacidad para realizar operaciones matemáticas, realizar inferencias lógicas, comprender textos o realizar rotaciones mentales de figuras. Y resulta que todos estos comportamientos tienden a estar relacionados: la gente que es buena en unas de estas tareas tiende a ser buena en otras (lo sé, hay gente muy buena con los números y mala con las rotaciones de figuras, etc., pero observando grupos grandes de personas se ve que estas tareas están relacionadas, por eso digo tiende). 

De manera que tenemos esas tareas que parecen tener cosas en común y que son claramente diferentes de otras (como de la capacidad de entender las emociones de las personas o de la capacidad para levantar peso). Tiene sentido entonces pensar que esas tareas están relacionadas porque hay un mecanismo común, estable y diferente para cada persona, implicado (al menos en parte) en su desempeño. Eso es la inteligencia.

Pensemos ahora en otro conjunto de tareas con elementos comunes: levantar peso, derribar objetos, vencer en pulsos, hacer dominadas, saltar... Efectivamente, podemos asumir que hay un constructo tras todas estas tareas y llamarlo "fuerza". Hay otras tareas también relacionadas, aunque quizás menos, como correr, mantener el equilibrio, aguantar la respiración... Esto podría llevarnos a buscar un constructo más amplio o general y llamarlo "físico".

Si estuviéramos construyendo una teoría, probablemente nos preocupara si nuestro constructo es unidimensional (si realmente tiene una entidad cohesionada) o si en realidad necesitamos dividirlo en varios para conseguir la adecuada capacidad explicativa. Porque al final no se trata de saber si los constructos existen o no, sino de saber si explican y predicen lo bastante bien la realidad. Como estamos haciendo un sistema de juego, nuestra preocupación posiblemente no será esa, sino más bien si existe un equilibrio entre la importancia que tienen los diferentes constructos en su aplicación práctica en el juego... Hablo de esto unas líneas más abajo.

A estas alturas ya os habréis dado cuenta de que en un juego de rol las características de los personajes son constructos: variables entre individuos, estables para un mismo sujeto, inobservables directamente y que se manifiestan en la realización de diferentes tareas relacionadas. Pues bien, hecho este paralelismo, podemos aprovecharnos de las directrices para definir constructos y utilizarlas para seleccionar las características de nuestro juego.

En primer lugar, hay que tener en cuenta que los constructos surgen en el marco de una teoría que determina cómo se relacionan entre sí y cuál será su alcance explicativo. Dicho de otro modo, hay que pensar en las características de manera global, o nos encontraremos con áreas sin cubrir o con solapamientos.

Dicho esto, lo primero es hacer una definición operativa del constructo. Esto se refiere a seleccionar las tareas o conductas en las que se expresa el constructo. En la vida real hay una cantidad virtualmente infinita de tareas, acciones, funciones, así que la labor exige seleccionar las más representativas. En un juego de rol la cosa está un poco más acotada, ya que aunque los personajes podrán hacer tantas cosas como en la realidad (en teoría al menos) en la práctica sólo nos interesan las que son mecánicamente relevantes para el juego que estemos diseñando. 

De modo que sí, la primera cosa sería hacer una lista de las cosas importantes para nuestro juego que los personajes van a tener que hacer. Si hay naves espaciales, por ejemplo, habrá que pilotarlas, repararlas y puede que construirlas... A no ser que pertenezcan a una antigua y olvidada civilización y nadie sepa como hacer nuevas. Si los protagonistas del juego son soldados, posiblemente tengan que manejar y mantener listas para usar diversas armas, utilizar aparatos de comunicaciones, etc. Procura que tu lista sea lo más exhaustiva posible y procura pensar especialmente en las áreas que hacen diferente tu juego. Ahora clasifica las cosas que creas que tienen una característica común. Dependiendo de si prefieres un sistema con características más generales (y escasas) o más específicas (o concretas) deberás ser más o menos estricto a la hora de clasificar juntas las acciones. Por cierto, digo acciones de una manera laxa: resistir el daño, memorizar conjuros o la velocidad de movimiento me sirven como acciones para este propósito.

Cuando hayas terminado, revisa como de equilibradas han quedado las listas. Si una característica tiene asociadas muy pocas acciones posiblemente quieras fusionarla con otra, a no ser que las acciones en cuestión sean vitales o frecuentes en el juego. Ahora es cuando deberías ponerle nombre a la característica, de manera que refleje el contenido. Vaya, pensabais hacerlo al revés, ¿verdad?

Con nuestro constructo definido, ahora podemos evaluar su validez, es decir, el grado en el que representa lo que pretendíamos. Y lo podemos hacer de varias maneras. Por ejemplo, mediante comparación de grupos. Piensa en dos tipos (clases, arquetipos, lo que corresponda) de personaje paradigmáticos en tu juego y que a priori se diferencien claramente en la característica cuya validez estés evaluando. Por ejemplo, magos y guerreros en fuerza. Comprueba que la característica aporta diferencialmente a cada tipo de manera que, efectivamente, la suposición de diferencia a priori tenga sentido: efectivamente, la fuerza será útil para los guerreros y no servirá a penas para nada a los magos. Ahora imagina que la característica hubiera sido una más general "fortaleza" y que la magia fatigue o consuma salud en tu mundo de juego. De pronto a magos y guerreros les interesa tener fortaleza alta por igual y eso contradice nuestra idea a priori de que guerreros son más fornidos que magos... Y ese es un problema de validez. Si quieres guerreros fuertes y magos débiles tendrás que separar fuerza y constitución.

Otra forma de estudiar la validez consiste en dar la listas de tareas, acciones y demás a otras personas y pedirles que nombren las características que las aglutinan. Comprueba entonces en qué grado se corresponden con los nombres que les pusiste tú. Esto permite comprobar hasta que punto el constructo atrapa semánticamente el contenido que le quieres dar. Y puede hacerse a la inversa: dile los nombres de las características a otra persona y pídele que mencione una lista de acciones que le parezca que se corresponden con ella o que clasifique las acciones de tu lista. ¿Ha aparecido algo raro o inesperado? Quizás alguna denominación sea más imprecisa de lo que pensabas...

¿Y qué pasa con las habilidades? ¿Son también constructos? Hablaremos de ello en una futura entrada.


9 de diciembre de 2011

Variables aleatorias o por qué si soy más rápido que tú no te gano siempre en las carreras

Voy a comenzar el blog con un serie de entradas introductorias sobre conceptos básicos de Estadística. Sí, va a ser la forma más fácil de disuadir a posibles lectores de que esto no es coñazo, pero me va hacer falta para hablar de cuestiones más aplicadas a los sistemas de juego para no dar por cosas por sabidas, así que allá vamos...

Una variable es cualquier atributo pueda variar de un sujeto (u objeto) a otro: el color de pelo, la estatura, el peso, la fuerza física, la inteligencia, la habilidad disparando... De modo que sí, las características y habilidades de los juegos de rol (y otros atributos) son lo que en Estadística llamamos variables. Una variable es aleatoria cuando su valor está determinado por un cierta distribución o dicho de otro modo, cuando a cada valor posible de la variable le corresponde una cierta probabilidad. Efectivamente, las anteriormente citadas características, habilidades, etc. son variables aleatorias.

Una variable aleatoria puede ser discreta, si sólo adopta un número finito de resultados posibles, o continua, si entre dos resultados cualesquiera siempre podríamos encontrar un tercer resultado (si dispusiéramos de un instrumento de medición suficientemente preciso). Por ejemplo, la estatura es una variable aleatoria continua: una persona puede medir 1,70 y otra 1,71 y si tenemos un metro lo bastante preciso encontraríamos una persona que midiera 1,705 y otra que midiera 1,7005, etc. En cambio, el número de hijos que tiene tu personaje de Pendragón es una variable aleatoria discreta: o tiene 2 o tiene 3 (o más o menos), pero no puede tener 2,5, etc. Todavía hay un caso posible más y es que una variable aleatoria sea continua, pero se mida o aproxime de manera discreta. Esto es lo que pasa con los valores de juego de los personajes: o tienes fuerza 16 o fuerza 17, no hay fuerza 16,5, aunque nos damos cuenta de que realmente hay un continuo de fuerza que subyace a las puntuaciones que estamos asignando. O dicho de otro modo, que sí hay personajes de fuerza 16,5 en teoría, pero en la práctica tendrán fuerza 16 ó 17. En la vida real un buen ejemplo sería la edad: teóricamente podríamos medirla en días, segundos, nanosegundos o lo que fuera, pero en la práctica la medimos en años sin contar (habitualmente) las fracciones: tienes 19, 26 ó 38 años, y se ignora la cantidad fraccionaria.

De las variables aleatorias continuas no voy a hablar aquí, porque tienen poca o nula aplicación en la mayoría de los sistemas de juego, pero seguramente en una entrada posterior os hable de una idea que tengo para introducirlas en un sistema de juego... si yo mismo consigo aclararme primero. Así que vamos a centrarnos en las discretas, que al fin y al cabo son las que llevan nuestras mesas de juego ¿o habéis visto algún dado que tenga infinitos resultados posibles? Porque sí, efectivamente, los resultados de los dados también son variables aleatorias discretas.

Y hablar de los dados nos viene muy bien para introducir el siguiente concepto: la función de probabilidad. La función de probabilidad establece una correspondencia entre los valores de la variables aleatoria y su probabilidad de ocurrencia. Es decir, asigna un valor de probabilidad (entre 0 y 1) a cada posible valor de la variable. Si queréis verlo así, la probabilidad es como un porcentaje teórico, de manera que un cierto valor tiene una probabilidad de 0,25 eso quiere decir que, en teoría (o, en términos estadísticos, en la población, es decir en todos los casos posibles) el 25% de los casos tienen ese valor de la variable. Pensemos en un dado de seis caras, perfectamente nivelado y sin trucar. Hay seis resultados posibles y cada uno aparece en una sola de las caras del dado, luego tienen la misma probabilidad de ocurrencia. Ya que al lanzar el dado tiene que salir algún resultado (vamos a obviar que el dado quede "borracho" o se caiga de la mesa y un hurón lo robe y lo esconda bajo el sillón), la probabilidad de cada resultado será la misma y será 1/6, es decir 0,17 aproximadamente. Hay que darse cuenta que las probabilidades de todos los valores posibles de la variable tienen que sumar 1, ya que alguno de esos valores tiene que ser el asignado (¡son todos los posibles!). Fijémonos ahora en un dado de seis caras que no tenga seis y en su lugar tenga otro tres. Ahora hay solo cinco resultados posibles, luego sólo cinco posibles valores de la variable. ¿La probabilidad de cada uno es 1/5? Noooo. El resultado del tres está en dos de las caras, así que es el doble de probable que salga que el resto, luego su probabilidad es 2/6 (0,33) y la de los demás 1/6 (0,17). Con esto quiero ilustrar que los diferentes valores pueden tener probabilidades diferentes, así que recordad: que haya dos opciones no significa que cada una tenga un 50% de posibilidades.

Esto de las variables aleatorias tiene en realidad dos facetas y ambas se aplican a los juegos de rol. Por un lado, en lo que seguramente ya estéis pensando, es en que la asignación de valores de juego (poner las características al personaje, vaya). En muchos juegos sea realiza lanzando dados (por ejemplo en D&D o La llamada de Cthulhu), así que es inmediato pensar en la función de probabilidad correspondiente. Esto viene a decir que los valores concretos de las características son variables aleatorias que siguen una determinada distribución. Por otro lado, está la mecánica de resolución de acciones, que suele implicar lanzar dados, sumar puntuaciones, etc. Esto viene a representar que la ejecución de acciones es también una variable aleatoria discreta. Pensemos en la vida real y pensemos en la fuerza física. Un determinado levantador de pesas quiere levantar cierto peso en un campeonato, después de haberlo conseguido en los entrenamientos correspondientes. Y el campeonato falla. ¿Estaba debilitado? No, sencillamente la ejecución se manifiesta como una variable aleatoria y por tanto en la práctica su fuerza fluctúa dentro de ciertos parámetros al realizar una acción. Pensemos en los tiempos de reacción. Está claro que hay gente que es más rápida de reflejos que otra (es decir, la velocidad de reacción de las personas es una variable aleatoria). Ahora bien, cuando tomamos a una persona determinada (con unos reflejos determinados) y medimos su tiempo de reacción repetidas veces, cada medida fluctúa: la ejecución de la tarea también es una variable aleatoria (es decir, el tiempo de reacción de una persona concreta también es una variable aleatoria). Y ahora un ejemplo de juego de rol: determinamos la Fuerza de nuestro personaje tirando 4d6 y escogiendo los tres resultados mejores (luego la Fuerza del personaje es una variable aleatoria discreta que sigue una determinada función de probabilidad). Cuando nuestro personaje quiere tirar una puerta, se nos pide que obtengamos un resultado igual o inferior a su Fuerza x3 en 1d100, luego la ejecución de la tarea "tirar una puerta" también es una variable aleatoria (con dos resultados, lo consigues o no) que sigue su propia distribución de probabilidad.

Estaréis pensando que en muchos juegos las características no se generan lanzando dados sino asignado puntos. ¿Significa eso que no son variables aleatorias? Pues no, no significa eso. Lo que significa es que sus probabilidades no pueden ser determinadas a priori. En su lugar, podríamos dejar que todos los jugadores de rol del mundo generaran todos los personajes que quisieran de ese juego (o que, al menos, una muestra de jugadores de rol lo bastante grande y representativa generaran muchos personajes del juego) y estudiar las frecuencias de cada puntuación. Es decir, para cada valor posible de característica, habilidad y demás, que porcentaje de personajes tiene dicho valor (por ejemplo, si la Destreza es muy importante en el juego y la Fuerza no, es fácil pensar que habrá más personajes con Destreza alta que con Fuerza alta, aunque los costes de distribuir los puntos sean los mismos). Pues bien, este proceso es determinar la probabilidad a posteriori y es llamado enfoque frecuentalista de la probabilidad. Y aquí va otra perla: que en la práctica no se pueda hacer este estudio de qué porcentaje de personajes tienen tal o cual valor de juego no significa que la función de probabilidad correspondiente no exista. Significa sencillamente que es desconocida. E incluso de una función de probabilidad desconocida se pueden hacer ciertas asunciones.

Y yo creo que ya es bastante información para un día. Me dejo en el tintero hablar de tendencia central y de variabilidad, que vendrían bastante al caso, pero creo que merecen una entrada para ellos solitos, así que ¡hasta la próxima entrada!