En TRI, un modelo matemático relaciona la probabilidad de tener éxito en una tarea con el rasgo latente del sujeto (el equivalente a la puntuación verdadera y, en términos roleros, la característica o habilidad apropiada para la acción). El modelo matemático puede tener, en principio, cualquier forma, siempre que cumpla las siguientes condiciones:
- Estar acotado en 0 y 1, es decir que la probabilidad mínima de tener éxito es 0 y la máxima es 1 (vamos, lo que viene siendo los límites propios de la probabilidad.
- Ser monótono creciente, es decir, que conforme aumente el rasgo latente, aumente la probabilidad de tener éxito. Esto tiene todo el sentido: a mayor fuerza, mayor probabilidad de levantar un cierto peso, a mayor habilidad disparando, mayor probabilidad de acertar un blanco, etc.
- Estar caracterizado por determinados parámetros de la tarea (esto, en realidad, no es cierto, ya que hay modelos de TRI no paramétricos, pero para nuestros fines interesa que sea así). Es decir, que la probabilidad de tener éxito depende del nivel de rasgo del sujeto y también de alguna propiedad de la tarea. Para nuestros fines, la dificultad de la tarea debería ser tenida en cuenta, así que perfecto.
De esta forma, sabiendo cuál es el nivel de habilidad del sujeto y la dificultad de la tarea puede calcularse la probabilidad de éxito usando el modelo matemático correspondiente. Si ahora quiero saber que es lo que pasa finalmente solo tendría que generar un número aleatorio de una distribución uniforme entre 0 y 1 y compararlo con la probabilidad de éxito: si el número es menor o igual que la probabilidad, la acción tiene éxito. Si el número es mayor, la acción falla.
Nótese que un número aleatorio generado de la distribución uniforme (0, 1) sigue una distribución lineal, pero eso no significa que un sistema de resolución de tareas así planteado sea lineal. Por contra, dependerá realmente de cuál sea modelo matemático que relaciona la habilidad del sujeto con la probabilidad de éxito en la tarea. Si dicho modelo es lineal, entonces sí, será un sistema lineal, pero esto no es lo normal.
De hecho, los primeros modelos de TRI presentados eran modelos gaussianos. Sí, se trata de un enfoque perfecto para las condiciones planteadas, ya que la función de distribución de probabilidad de la curva de Gauss es asíntotica en 0 y 1, es monótona creciente y admite parámetros para determinar su localización, su tasa de crecimiento, etc.
Los modelos gaussianos se abandonaron rápidamente porque eran matemáticamente difíciles de tratar (requieren cálculo integral, son difíciles de derivar... en fin, un chocho) y se propusieron en su lugar modelos logísticos, con la singularidad de que usando una constante de escalamiento se producía una aproximación casi perfecta a los modelos gaussianos.
El modelo logístico más sencillo es el de un parámetro (precisamente, la dificultad), también llamado modelo de Rasch y tiene la siguiente expresión:
Donde:
D es la constante que aproxima el modelo logístico al normal, cuando D = 1.701
z es el rasgo latente del sujeto (su puntuación en la característica o habilidad) expresada en puntuaciones típicas (media 0 y desviación típica 1)
b es la dificultad de la acción, expresada en las mismas unidades que z
La función tiene, por cierto, esta pinta:
Donde las dos curvas representarían acciones con distinta dificultad (es decir, distinto valor de b). Como puede verse, la probabilidad de éxito crece en función del nivel de habilidad z (en el gráfico aparece como Ability). La línea continua representa una acción más compleja, mientras que la línea punteada representa una acción de dificultad media.
¿Nos sirve esto para nuestro sistema de juego "perfecto"? En la próxima entrega veremos como.





Vale. Hasta aquí han llegado mis conocimientos de estadística y epidemiología. No me he enterado ni choppe de este post ^_^U
ResponderEliminarNo me lo creo, seguro que una segunda lectura más atenta y lo entiendes todo... En todo caso, si hay alguna pregunta, yo encantado de responderla.
ResponderEliminarLa funcion de Rasch, me recuerda sospechosamente a la probabilidad acumulada de una Normal...
ResponderEliminarYa digo en el texto que las funciones logísticas se aproximan a la normal cuando D=1.701, pero son matemáticamente más fáciles de tratar. Efectivamente, su forma es parecida, pero la expresión no tiene nada que ver, claro.
ResponderEliminarPerdón la ignorancia, pero no sé lo que es "e". Y me gustaría algo que quizá resulte mucho trabajo para usted: que explique por qué los elementos de la función están así distribuidos y relacionados entre sí, es decir, su correspondencia con la realidad.
ResponderEliminarEn todo caso, ¡mil gracias por continuar!
:D
Ignorancia ninguna, nada que disculpar... "e" es el número "e" que es la base de los logaritmos naturales. Es un número como "pi", es decir irracional (no entero que no que puede expresarse como una función) y de gran importancia en matemáticas. Tiene infinitos decimales, pero su valor puede aproximarse a 2,718. En las calculadoras (y en los programas informáticos) "e elevado a" suele aparece como "EXP".
ResponderEliminarSobre la función en sí, hay abundante evidencia de que muchos fenómenos en la naturaleza siguen una función sigmoide: con una asíntota superior, otra inferior, crecimiento acelerado hasta un punto de inflexión y decelerado a partir de ese punto. Por ejemplo, la famosa "curva de aprendizaje": al principio te cuesta aprender, hasta que cada vez más aprendiendo más, hasta un punto, en el cada vez es más difícil aprender algo nuevo.
La relación entre la capacidad de los sujetos y el rendimiento en las tareas (la probabilidad de éxito en función del nivel de habilidad) es uno de estos fenómenos que tienen una forma sigmoide. Lo más probable es que dicha forma se deba a la distribución normal (cuya función de distribución, es decir cuando se representa acumulada) tiene esa forma. Pero la función normal es matemáticamente difícil de tratar (ya que cuenta con una integral), así que la función logística pretende aproximarla:
f(x)=1/(1+exp(-x))
El signo menos permite que, a mayor x, mayor f(x). Si x es la habilidad de un sujeto (llamémosla z) y f(x) es la probabilidad de tener éxito en una tarea (P(z)) tendríamos una función logística que relaciona la probabilidad de éxito con el nivel de habilidad:
P(z)=1/1(1+exp(-z))
Sin embargo esto no tiene en cuenta la dificultad de la tarea, que se introduce como b:
P(z)=1/1(1+exp(-(z-b))
Ahora sí, la dificultad de la tarea incluye en la probabilidad, de manera que cuanto mayor sea la dificultad de la tarea, es como si la habilidad del sujeto fuera menor (porque se resta), lo que conceptualmente tiene bastante que ver con lo que pasa en la realidad. Por último, si asumimos que la función normal es la que mejor se aproxima a modelar este fenómeno, esta curva logística por comparación crece más despacio, lo que podemos solucionar con una constante que le haga crecer más deprisa. Esta es D. Para el valor 1.702 se consigue la mejor aproximación de la función logística a la forma exacta de la curva normal, con lo que la cosa quedaría:
P(z))1/(1+exp(-D(z-b))
Espero que esta explicación te haya servido de algo. Un saludo y nos leemos por aquí.
Por supuesto que me sirvió, pero no todo lo que debiera; ahora mismo me gustaría haber prestado más atención en clase cuando me intentaban enseñar logaritmos, :P.
ResponderEliminarCon respecto a una función normal y su verosimilitud, no entiendo la primera pero só la segunda cuestión.
Muchas gracias por tu explicación, :). Investigaré un poco sobre estas cosas. Saludos, :D.
Estaba revisando la entrada y si me aclaras una cosa, mejor. El grafico que pones de Z ¿es una representacion grafica de funcion de probabilidad o una funcion de probablidad acumulada? Ando bastante mal de memoria... ¿donde tendre los apuntes para repasar estas cosas? Jejeje
ResponderEliminarSaludos
Desde La Torre de Ámbar (www.latorredeambar.blogspot.com) he hecho una mención del blog premiándolo con un premio Liebster Blog.
ResponderEliminarUn saludo
@PoBa, muchas gracias por la mención, me siento muy honrado.
ResponderEliminar@Alberto Hinojosa, la gráfica que aparece es una función de probabilidad, no de distribución de probabilidad (que sería la acumulada).
Este comentario ha sido eliminado por el autor.
ResponderEliminarGenial el blog. Lo he encontrado precisamente gracias a la mención de PoBa, y ya ardo en deseos de que continúe.
ResponderEliminarBuen trabajo =)