22 de marzo de 2012

Algo latente

Las limitaciones del modelo lineal en Psicometría llevan a desarrollar, a partir de la década de los 50, un nuevo paradigma dentro de la medición psicológica. Este nuevo paradigma, la Teoría de la Respuesta al Ítem (TRI), se centra en la consideración de lo medido como "latente" o inobservable, haciendo un énfasis especial en este punto, por lo que también se conoce como modelo fuerte de la puntuación verdadera (por contraposición al modelo débil que sería el modelo lineal del que hablamos en el post anterior).

En TRI, un modelo matemático relaciona la probabilidad de tener éxito en una tarea con el rasgo latente del sujeto (el equivalente a la puntuación verdadera y, en términos roleros, la característica o habilidad apropiada para la acción). El modelo matemático puede tener, en principio, cualquier forma, siempre que cumpla las siguientes condiciones:


  • Estar acotado en 0 y 1, es decir que la probabilidad mínima de tener éxito es 0 y la máxima es 1 (vamos, lo que viene siendo los límites propios de la probabilidad.
  • Ser monótono creciente, es decir, que conforme aumente el rasgo latente, aumente la probabilidad de tener éxito. Esto tiene todo el sentido: a mayor fuerza, mayor probabilidad de levantar un cierto peso, a mayor habilidad disparando, mayor probabilidad de acertar un blanco, etc.
  • Estar caracterizado por determinados parámetros de la tarea (esto, en realidad, no es cierto, ya que hay modelos de TRI no paramétricos, pero para nuestros fines interesa que sea así). Es decir, que la probabilidad de tener éxito depende del nivel de rasgo del sujeto y también de alguna propiedad de la tarea. Para nuestros fines, la dificultad de la tarea debería ser tenida en cuenta, así que perfecto.


De esta forma, sabiendo cuál es el nivel de habilidad del sujeto y la dificultad de la tarea puede calcularse la probabilidad de éxito usando el modelo matemático correspondiente. Si ahora quiero saber que es lo que pasa finalmente solo tendría que generar un número aleatorio de una distribución uniforme entre 0 y 1 y compararlo con la probabilidad de éxito: si el número es menor o igual que la probabilidad, la acción tiene éxito. Si el número es mayor, la acción falla.

Nótese que un número aleatorio generado de la distribución uniforme (0, 1) sigue una distribución lineal, pero eso no significa que un sistema de resolución de tareas así planteado sea lineal. Por contra, dependerá realmente de cuál sea modelo matemático que relaciona la habilidad del sujeto con la probabilidad de éxito en la tarea. Si dicho modelo es lineal, entonces sí, será un sistema lineal, pero esto no es lo normal.

De hecho, los primeros modelos de TRI presentados eran modelos gaussianos. Sí, se trata de un enfoque perfecto para las condiciones planteadas, ya que la función de distribución de probabilidad de la curva de Gauss es asíntotica en 0 y 1, es monótona creciente y admite parámetros para determinar su localización, su tasa de crecimiento, etc.

Los modelos gaussianos se abandonaron rápidamente porque eran matemáticamente difíciles de tratar (requieren cálculo integral, son difíciles de derivar... en fin, un chocho) y se propusieron en su lugar modelos logísticos, con la singularidad de que usando una constante de escalamiento se producía una aproximación casi perfecta a los modelos gaussianos.

El modelo logístico más sencillo es el de un parámetro (precisamente, la dificultad), también llamado modelo de Rasch y tiene la siguiente expresión:

Donde:
D es la constante que aproxima el modelo logístico al normal, cuando D = 1.701
z es el rasgo latente del sujeto (su puntuación en la característica o habilidad) expresada en puntuaciones típicas (media 0 y desviación típica 1)
b es la dificultad de la acción, expresada en las mismas unidades que z

La función tiene, por cierto, esta pinta:

Donde las dos curvas representarían acciones con distinta dificultad (es decir, distinto valor de b). Como puede verse, la probabilidad de éxito crece en función del nivel de habilidad z (en el gráfico aparece como Ability). La línea continua representa una acción más compleja, mientras que la línea punteada representa una acción de dificultad media.

¿Nos sirve esto para nuestro sistema de juego "perfecto"? En la próxima entrega veremos como.

16 comentarios:

  1. Vale. Hasta aquí han llegado mis conocimientos de estadística y epidemiología. No me he enterado ni choppe de este post ^_^U

    ResponderEliminar
  2. No me lo creo, seguro que una segunda lectura más atenta y lo entiendes todo... En todo caso, si hay alguna pregunta, yo encantado de responderla.

    ResponderEliminar
  3. La funcion de Rasch, me recuerda sospechosamente a la probabilidad acumulada de una Normal...

    ResponderEliminar
  4. Ya digo en el texto que las funciones logísticas se aproximan a la normal cuando D=1.701, pero son matemáticamente más fáciles de tratar. Efectivamente, su forma es parecida, pero la expresión no tiene nada que ver, claro.

    ResponderEliminar
  5. Perdón la ignorancia, pero no sé lo que es "e". Y me gustaría algo que quizá resulte mucho trabajo para usted: que explique por qué los elementos de la función están así distribuidos y relacionados entre sí, es decir, su correspondencia con la realidad.

    En todo caso, ¡mil gracias por continuar!
    :D

    ResponderEliminar
  6. Ignorancia ninguna, nada que disculpar... "e" es el número "e" que es la base de los logaritmos naturales. Es un número como "pi", es decir irracional (no entero que no que puede expresarse como una función) y de gran importancia en matemáticas. Tiene infinitos decimales, pero su valor puede aproximarse a 2,718. En las calculadoras (y en los programas informáticos) "e elevado a" suele aparece como "EXP".

    Sobre la función en sí, hay abundante evidencia de que muchos fenómenos en la naturaleza siguen una función sigmoide: con una asíntota superior, otra inferior, crecimiento acelerado hasta un punto de inflexión y decelerado a partir de ese punto. Por ejemplo, la famosa "curva de aprendizaje": al principio te cuesta aprender, hasta que cada vez más aprendiendo más, hasta un punto, en el cada vez es más difícil aprender algo nuevo.

    La relación entre la capacidad de los sujetos y el rendimiento en las tareas (la probabilidad de éxito en función del nivel de habilidad) es uno de estos fenómenos que tienen una forma sigmoide. Lo más probable es que dicha forma se deba a la distribución normal (cuya función de distribución, es decir cuando se representa acumulada) tiene esa forma. Pero la función normal es matemáticamente difícil de tratar (ya que cuenta con una integral), así que la función logística pretende aproximarla:

    f(x)=1/(1+exp(-x))

    El signo menos permite que, a mayor x, mayor f(x). Si x es la habilidad de un sujeto (llamémosla z) y f(x) es la probabilidad de tener éxito en una tarea (P(z)) tendríamos una función logística que relaciona la probabilidad de éxito con el nivel de habilidad:

    P(z)=1/1(1+exp(-z))

    Sin embargo esto no tiene en cuenta la dificultad de la tarea, que se introduce como b:

    P(z)=1/1(1+exp(-(z-b))

    Ahora sí, la dificultad de la tarea incluye en la probabilidad, de manera que cuanto mayor sea la dificultad de la tarea, es como si la habilidad del sujeto fuera menor (porque se resta), lo que conceptualmente tiene bastante que ver con lo que pasa en la realidad. Por último, si asumimos que la función normal es la que mejor se aproxima a modelar este fenómeno, esta curva logística por comparación crece más despacio, lo que podemos solucionar con una constante que le haga crecer más deprisa. Esta es D. Para el valor 1.702 se consigue la mejor aproximación de la función logística a la forma exacta de la curva normal, con lo que la cosa quedaría:

    P(z))1/(1+exp(-D(z-b))

    Espero que esta explicación te haya servido de algo. Un saludo y nos leemos por aquí.

    ResponderEliminar
  7. Por supuesto que me sirvió, pero no todo lo que debiera; ahora mismo me gustaría haber prestado más atención en clase cuando me intentaban enseñar logaritmos, :P.

    Con respecto a una función normal y su verosimilitud, no entiendo la primera pero só la segunda cuestión.

    Muchas gracias por tu explicación, :). Investigaré un poco sobre estas cosas. Saludos, :D.

    ResponderEliminar
  8. Estaba revisando la entrada y si me aclaras una cosa, mejor. El grafico que pones de Z ¿es una representacion grafica de funcion de probabilidad o una funcion de probablidad acumulada? Ando bastante mal de memoria... ¿donde tendre los apuntes para repasar estas cosas? Jejeje

    Saludos

    ResponderEliminar
  9. Desde La Torre de Ámbar (www.latorredeambar.blogspot.com) he hecho una mención del blog premiándolo con un premio Liebster Blog.
    Un saludo

    ResponderEliminar
  10. @PoBa, muchas gracias por la mención, me siento muy honrado.
    @Alberto Hinojosa, la gráfica que aparece es una función de probabilidad, no de distribución de probabilidad (que sería la acumulada).

    ResponderEliminar
  11. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  12. Genial el blog. Lo he encontrado precisamente gracias a la mención de PoBa, y ya ardo en deseos de que continúe.
    Buen trabajo =)

    ResponderEliminar
  13. Hace mucho tiempo que el blog no tiene entradas. ¿Sigues revisándolo? Bueno, por si acaso me presento. Me llamo Javier, soy ingeniero mecánico y trabajo con sistemas de gestión, especialmente con estadísticas de fiabilidad, mantenibilidad y operatividad de flotas. Soy rolero desde los 12 años, cuando no eran todavía tristemente famosos los asesinos "roleros" y una tía mía me regaló por mi cumpleaños el JdR del Señor de los Anillos (el de la tapa roja).

    Me han surgido unas dudas acerca de los modelos de TRI:

    - Los parámetros de habilidad considerados parecen ser constructos asimilables a los atributos de juegos como "Canción de Hielo y Fuego", que aglutinan lo que en los juegos tradicionales separaban en características y habilidades. Sin embargo el modelo de TRI de tres parámetros incluye un término que hace relación a la experiencia de quien realiza el test en la habilidad considerada. ¿Podrías explicar la aplicación práctica de dicho parámetro?

    - Estos modelos parecen no medir las capacidades inherentes de las personas sino las habilidades a través de las cuales se manifiestan. Es decir, si el test está midiendo la capacidad espacial o de comprensión escrita, no está midiendo la propia inteligencia sino unas habilidades concretas. ¿Cómo se llega de la habilidad particular al constructo general?

    - Todas estas teorías hacen referencia a constructos psicosociales. Sin embargo para la aplicación de estas fórmulas a la resolución general de tareas hace falta tener en cuenta también los constructos físicos. ¿Estas teorías son aplicables a la ejecución de actividades físicas o fisico-mentales? ¿Y cómo podrían aplicarse a la ejecución de tareas complejas en las que intervienen dos constructos diferentes?

    ResponderEliminar
  14. Hola Franciaco

    Tengo el blog abandonadísimo, pero te contrato encantado.

    En el modelo de tres parámetros el tercer parámetro hace referencia a la probabilidad de acertar al azar. Es decir es un parámetro de la tarea, no del sujeto. Este parámetro indica que probabilidad tienen de resolver la tarea correctamente los sujetos con un nivel de habilidad extremadamente bajo. En los modelos de uno y dos parámetros esa probabilidad es cero.

    Los modelos TRI pretenden medir capacidades no observables directamente, es decir aquellas en las que no se puede aplicar una medida patrón y ver cuantas veces se repite. Esto sirve para la capacidad espacial, pero también para la inteligencia e igualmente para la destreza, la fuerza u otras capacidades físicas que se nos ocurran.

    Además de los mencionados en la entrada, hay modelos más complejos que buscan otras aproximaciones a la realidad. Entre ellos hay modelos multidimensionales, en los que el éxito en la resolución de una tarea puede depender de dos o más rasgos latentes.

    Espero haber sido de ayuda.

    Un saludo y gracias por comentar.

    ResponderEliminar
  15. Gracias a ti por responder tan rápido.

    He estado leyendo un poco y me he enterado de que existen unos modelos que se llaman "Lineales y de medidas repetidas [...]" (¿Hoijtink, 1995?) que modelan el cambio en el rasgo de habilidad de los sujetos, pero todavía no he encontrado un texto sobre ellos. ¿Estos modelos permitirían considerar las ganancias de experiencia y el incremento de las habilidades de los personajes? Porque me parece que están diseñados para usos similares.

    Así podrían tenerse características y habilidades diferenciadas, o tener en cuenta especializaciones para bonificar personajes muy dirigidos a un fin concreto. Lo que no veo es que estas teorías dividan entre estas capacidades inherentes al sujeto de las adquiridas a través de la experiencia. Como los test del tipo de los psicotécnicos se entrenan, me preguntaba si se ha desarrollado algún modelo que discrimine entre el rasgo y la experiencia. Me preguntaba si los "Lineales y de medidas repetidas [...]" realizan esta distinción.

    ResponderEliminar
  16. Estos modelos son para determinar la probabilidad de acierto en la tarea en un determinado momento. La evolución del rasgo debería ser contemplada idealmente por otro modelo, aunque es verdad que modelos de tipo cadenas de Markov o similares (los empleados en Psicología del Aprendizaje) podrían dar cuenta de ambas circunstancias: probabilidad de acierto y aprendizaje en función del resultado.

    ResponderEliminar