Capítulo seis
Pruebas de inteligencia Desde el momento de su introducción durante la primera década de este siglo, los tests de inteligencia se han utilizado con mucha frecuencia en Estados Unidos y otros países, no sólo como una ayuda en la toma de decisiones académicas, vocacionales y clínicas respecto a las personas, sino también para estudiar diferencias de grupo en las capacidades mentales. Estos usos de los tests de inteligencia han dado lugar a gran cantidad de controversias respecto de la naturaleza y significado de la inteligencia y las consecuencias personales y sociales que se confía dependen de estas pruebas. En los libros de psicología diferencial (Minton y Schneider, 1980; Willerman, 1979), se han revisado adecuadamente las investigaciones sobre las diferencias en inteligencia individual y de grupo, de modo que en este capítulo no abordamos este tema extensamente. En su lugar, se presenta al estudiante una variedad de tests de inteligencia inteligencia y la forma en que se utilizan. Los tests de inteligencia no constituyen la ocupación exclusiva de muchos psicólogos practicantes, como sucedía a principios de siglo, siglo, sino que la evaluación evaluación de las capacidades capacidades mentales mentales es todavía parte de de las actividades actividades de los psicólogos en en varios escenarios. escenarios.
HISTORIA Y TERMINOLOGÍA El término inteligencia, que en la actualidad es muy común, era casi desconocido en el lenguaje cotidiano de hace un siglo. Durante la última parte del siglo xix, el filósofo Herbert Spencer y el caballero científico Francis Galton, motivados por los escritos de Charles Darwin acerca del origen de las diferencias entre las especies, volvieron a introducir el término latín inteligencia para referirse referirse a las diferencias diferencias individuales individuales en la capacidad capacidad mental. Estos hombres y sus seguidores creían que en los seres humanos existe un grado innato de inteligencia general, que se distingue de las capacidades especiales. A diferencia de Spencer, Galton no se conformaba con filosofar sobre la naturaleza de la inteligencia. Intentaba demostrar sus fundamentos hereditarios por medio del estudio de árboles genealógicos y desarrolló varias pruebas de discriminación sensorial y tiempo de reacción que esperaba midieran los componentes de la inteligencia. El psicólogo estadounidense James McKeen Cattell estudió en forma extensa éstas y otras pruebas sensoriomotrices (medidas de la velocidad del movimiento, fuerza muscular, sensibilidad al dolor, discriminación de pesos y aspectos similares), pero probaron ser relativamente inútiles como indicadores del logro en el trabajo escolar y otras tareas que se supone requieren de inteligencia.
Por completo diferente del procedimiento analítico para tratar de medir los componentes de la inteligencia era el planteamiento que adoptó el psicólogo francés Alfred Binet. Al definir la inteligencia como "la capacidad para juzgar bien, razonar bien y entender bien", Binet y Simón (1916, página 192) sostuvieron que la inteligencia de una persona se manifiesta en su desempeño en una variedad de tareas y puede medirse por medio de las respuestas a una muestra de esas tareas. Ya que su trabajo al diseñar las primeras pruebas de inteligencia estaba motivado por el problema para identificar a los niños con retraso mental en el sistema escolar de París, es natural que el grupo de pruebas que eligió Binet presentaba muchas tareas del tipo escolar. Binet y su socio, Simón, publicaron su primer grupo de pruebas de inteligencia (30 pruebas cortas dispuestas en orden desde la más fácil hasta la más difícil) en 1905. Su trabajo posterior llevó a la publicación en 1908 de una escala de Binet-Simon revisada que consistía en 58 tareas ordenadas por niveles de edad desde los 3 hasta los 13 años. Las tareas estaban agrupadas por niveles de edad y correspondían a lo que la investigación por parte de Binet señalaba que podían hacer los niños normales de una edad determinada. La edad mental (EM) de un niño se determinaba por la cantidad de pruebas que resolvía satisfactoriamente en cada nivel; una edad mental bastante menor que la edad cronológica del niño indicaba retraso mental. Una revisión final de la escala se publicó en 1911 (cuadro 6-1), pero después de la muerte prematura de Binet durante ese mismo año, Estados Unidos se convirtió en el escenario para el desarrollo posterior de la prueba de Binet.
lefiniciones de inteligencia Desde los primeros trabajos de Binet, se han desarrollado muchas pruebas de inteligencia nuevas y han tenido lugar muchas investigaciones y teorías sobre la naturaleza de la inteligencia. Los educadores han considerado a la inteligencia como la capacidad para aprender, los biólogos como la capacidad para adaptarse al entorno, los psicólogos como la capacidad para deducir las relaciones entre los objetos y eventos y los teóricos de la información como la capacidad para procesar información (Wechsler, 1975). Ciertos escritores se oponen al término inteligencia con sus connotaciones respecto a que la capacidad mental general es innata y proponen que se remplace con un término como capacidad académica general o capacidad educativa general. No todas las pruebas que se estudian en este capítulo se denominan de manera específica tests de inteligencia; en vez de ello, se proponen como medidas de la capacidad mental general. En este sentido, deben diferenciarse de las medidas de capacidades especiales que se analizan en el capítulo 7. Sin embargo, la diferencia entre las pruebas de capacidad mental general (inteligencia) y las pruebas de capacidades especiales no es muy marcada y ciertas pruebas de capacidad académica descritas en este capítulo podrían corresponder también las que se mencionan en el capítulo 7. Los reactivos de las pruebas de inteligencia representan un intento por evaluar las diferencias individuales en los efectos de las experiencias comunes para casi todas las personas, sobre todo en la cultura occidental. Se supone que, cuando se exponen a las mismas experiencias, las personas que tienen inteligencia más elevada se beneficiarán más de éstas que los individuos con inteligencia más baja. Como consecuencia, en la medida en que las personas que elaboran las pruebas tienen éxito, las diferencias entre las calificaciones que obtienen los individuos en las pruebas de inteligencia deben ser más una cuestión de variaciones en la capacidad mental básica que de variaciones en la experiencia.
existe un solo límite de tiempo; en otras pruebas los reactivos se agrupan como conjuntos de subpruebas con límites de tiempo separados. La forma más común de clasificar las pruebas de inteligencia es por medio de la dicotomía individual en comparación con la de grupo. Las pruebas de inteligencia, individuales, son de alguna manera diferentes en su punto central a las pruebas de inteligencia de grupo, que pueden aplicarse simultáneamente a muchos sujetos. El punto central de las pruebas individuales es más global o general; su propósito principal es evaluar una característica general (Tyler y Walsh, 1979). Por otra parte, el punto central de las pruebas de grupo tiende a ser más limitado: predecir el desempeño académico u ocupacional. Además, aplicar una prueba de inteligencia individual, por lo general, toma más tiempo que la aplicación de una prueba de grupo. Sin embargo, el examinador que aplica una prueba individual puede prestar mayor atención al sujeto y, como consecuencia, alentarlo y observarlo mejor. Además, las calificaciones de las pruebas individuales no son tan dependientes de la capacidad para leer como aquellas de grupo. Las ventajas en la aplicación de una prueba de grupo se hacen evidentes en el hecho de que se aplican muchas más pruebas de grupo que individuales. También, a pesar de lo que han declarado algunos de los seguidores de las pruebas individuales, las pruebas de grupo no necesariamente son menos confiables y válidas que las individuales. Cuando el criterio es el aprovechamiento en el trabajo escolar (notas o calificaciones de pruebas de aprovechamiento), ocasionalmente las pruebas de inteligencia de grupo tienen incluso coeficientes de validez más altos que las individuales, variando entre .50 y .70. Las pruebas de inteligencia de grupo se utilizan con más frecuencia para la observación inicial en escuelas y negocios, para continuar con las pruebas individuales en los casos en que las calificaciones del sujeto son bajas y/o se requiere mayor información sobre sus fortalezas y debilidades. Los psicólogos prefieren las pruebas de inteligencia individuales en clínicas, hospitales y otros escenarios donde se realizan diagnósticos clínicos y donde sirven no sólo como medidas de la capacidad mental general, sino además como medio para obtener un panorama del funcionamiento de la personalidad y las incapacidades.
TESTS ADMINISTRADOS INDIVIDUALMENTE Los instrumentos que se derivan del trabajo de Alfred Binet, Lewis Terman y David Wechsler son las pruebas de inteligencia que se aplican de forma individual más populares. A través de los años, las pruebas que desarrollaron Terman y Wechsler se han utilizado para evaluar las capacidades intelectuales de niños y adultos en amplia variedad de circunstancias. Otras pruebas individuales, algunas que representan variaciones o extensiones de las series de Stanford-Binet y Wechsler, están diseñadas específicamente para evaluar capacidades mentales de niños y personas con incapacidades lingüísticas y/o físicas.
Antiguas ediciones de la Escala de Inteligencia de Stanford-Binet En Estados Unidos, se publicaron tres traducciones al inglés y adaptaciones de la escala de Simon-Binet. H. H. Goddard de la Vineland Training School preparó una, Frederic Kuhlmann de la Universidad de Minnesota preparó otra y Lewis Terman de la Stanford University la tercera. Terman publicó la más popular de estas revisiones, la Escala de Inteligencia de Stanford-Binet, en 1916.
La escala de 1916. Al igual que las escalas de Binet-Simon anteriores, la escala de Stanford-Binet de 1916 era una escala de edades en la cual las pruebas se agrupaban en niveles de edad cronológica. Terman seleccionó reactivos de las escalas de Binet-Simon, así como reactivos por completo nuevos que representaban una amplia muestra de tareas que presumiblemente requieren inteligencia. Los esfuerzos también se hicieron para incluir tareas que no eran tan dependientes de las experiencias escolares específicas de aprendizaje. Un criterio para incluir un reactivo en la escala de Stanford-Binet era que un porcentaje cada vez mayor de niños en niveles de edad sucesivos debían ser capaces de responderlo correctamente. Por ciertas razones estadísticas relacionadas con la conservación de una escala de cociente de inteligencia (CI) constante en todos los niveles de edad, el requerimiento del porcentaje para el pase era más bajo para los reactivos que se incluían en las subpruebas en los niveles más avanzados que para los reactivos en los niveles inferiores. En cualquier caso, el criterio del porcentaje de pase servía como medio objetivo para asegurar que cada reactivo de la prueba se ubicara en los niveles de edad apropiados. En la escala de Stanford-Binet la edad mental (EM) y el cociente de inteligencia de un sujeto dependía de la cantidad de subpruebas que se aprobaban en niveles de edad sucesivos. El CI se determinaba dividiendo la edad mental (EM) del sujeto, el número total de meses de crédito que obtenía en la prueba, por su edad cronológica (EC) en meses y después multiplicando el cociente resultante por 100. En símbolos, el porcentaje de CI se calculaba como
Durante muchos años, la Escala de Inteligencia de Stanford-Binet constituyó un estándar contra el cual se evaluaban otras pruebas de inteligencia. No obstante la prueba tenía varias desventajas. Por ejemplo, la versión de la escala de 1916 se estandarizó con base sólo en 1,000 niños y 400 adultos. De acuerdo con los estándares actuales, la muestra no se seleccionó con detenimiento y no era representativa de la población estadounidense de esa época. Dos desventajas más de la escala de 1916 fueron la insuficiencia para someter a prueba a los adultos y los niños muy pequeños y la falta de una segunda forma para permitir otra aplicación de la prueba. Por tanto, en 1937, Terman y su socio, Maud Merrill, publicaron una versión revisada y actualizada de la escala de Stanford-Binet.
La escala de 1937. La versión de la Escala de Inteligencia de Stanford-Binet de 1937 tenía más suelo y techo que la escala de 1916, dos formas paralelas (L y M) y una estandarización más adecuada. La escala de 1937 se estandarizó de modo estratificado en 100 niños en cada intervalo de edad de medio año desde la edad de 1 Vi hasta 5 Vi, 200 niños de cada intervalo de nivel de edad de 6 a 14 años y 100 personas de cada intervalo de edad de 15 a 18 años. Se sometieron a la prueba igual cantidad de niños y niñas en 17 comunidades de 11 estados, pero el muestreo se li mitó a individuos blancos nacidos en Estados Unidos quienes, como grupo, tenían una condición socieconómica arriba del promedio. Como consecuencia, la muestra no era realmente representativa de toda la población estadounidense. Se utilizaron tres criterios para incluir un reactivo en la escala: 1) se juzgaba si el reactivo era una medida del comportamiento inteligente, 2) el porcentaje de niños que respondía de manera correcta al reactivo aumentaba con la edad cronológica y 3) los niños que aprobaban el reactivo tenían una edad mental media bastante más alta que aquellos que no lo pasaban. Los reactivos se agruparon en intervalos (niveles) de medio año desde el Año II hasta el Año V y en intervalos de un año a partir
del Año VI hasta el Año XIV; había también un nivel de Adulto Promedio y tres niveles de Adulto Superior (Adulto Superior I, II y III). Las seis subpruebas en cada nivel del Año II al Año V otorgaban un crédito de un mes cada una; del Año VI al Año XIV, las subpruebas otorgaban un crédito de 2 meses cada una y a las seis subpruebas en los niveles de Adulto Superior I, II y III se les asignaba un crédito de 4, 5 y 6 meses, respectivamente. Al someter a prueba a un niño con la escala de Stanford-Binet, el examinador establecía primero la edad básica en la prueba. La edad basal era el nivel más alto en el cual el niño aprobaba todas las subpruebas. Después, las pruebas continuaban hasta que se alcanzaba la edad tope, el nivel más bajo en el cual el niño reprobaba todas las pruebas. La edad mental se calculaba sumando la edad base a la cantidad de créditos que se recibían por pasar cada subprueba hasta la edad tope. Después, el CI se calculaba mediante la fórmula 6.1.
La escala de 1960. La tercera edición de la Escala de Inteligencia de Stanford-Binet, publicada en 1960, consistía en una actualización de los mejores reactivos de las formas L y M de la escala de 1937. Al igual que las anteriores, la tercera edición se utilizaba para medir la inteligencia de individuos desde 2 años hasta la edad adulta. El procedimiento para aplicar la prueba era similar al de la escala de 1937, aunque se introdujeron ciertos cambios. Había una subprueba alterna en cada nivel de edad para emplearse cuando no se aplicaban subpruebas particualares o se aplicaban de manera incorrecta. El tiempo de aplicación también podía reducirse en ciertos casos al aplicar sólo cuatro pruebas seleccionadas en lugar de seis en cada nivel. Otro cambio fue que se proporcionaron CIs de desviación. El CI promedio, como cualquier otra norma de edad, no satisfacía los requerimientos de igualdad de las undidades de edad. Además, no tenía ningún significado cuando se aplicaba a adultos porque no había una respuesta satisfactoria a la pregunta sobre qué edad cronológica debía utilizarse como denominador del promedio de EM/EC/ al someter a prueba a los adultos. Se sugirió que los 14,16 y 18 años constituían la edad en la cual cesa el crecimiento mental y, por tanto, es apropiado utilizarlas como denominador al calcular el CI. Debido a esos problemas para determinar el CI, se decidió cambiar de un CI de razón a una escala de CI de desviación con una media de 100 y desviación estándar de 16. En ocasiones, se seguía reportando la razón CI y en el manual de la escala de Stanford-Binet de 1960 se proporcionaban los cuadros para calcularlo. El grupo de estandarización para las Formas L-M de la escala de Stanford-Binet de 1960 consistía en 4,500 niños de edades entre 2 Vi y 18 años que presentaron la Forma L o M de la escala de 1937 entre 1950 y 1954. Al darse cuenta de la necesidad de normas actualizadas, el editor logró que la prueba se aplicara en 1972 a una muestra nacional estratificada de 2,100 niños (100 niños en cada intervalo de medio año de 2 a 5 Vi años y en cada intervalo de un año de 6 a 18 años). La muestra fue más representativa de la población general de Estados Unidos que las muestras normativas anteriores. Con base en la estandarización de 1972, en 1973 se publicó un manual revisado de la tercera edición (Terman y Merrill, 1973). En este manual se reportaron los coeficientes de confiabilidad test-retest de más de .90, así como en las primeras dos ediciones, se proporcionaron correlaciones moderadas con los grados escolares y las calificaciones de las pruebas de aprovechamiento (.40 a .75).
Cuarta edición de la escala Stanford-Binet Los autores de la cuarta edición de la Escala de Inteligencia de Stanford-Binet (SB-IV) son R. L. Thorndike, E. Hagen y J. Sattler y la publicó Riverside Publishing Company en 1986. Este instrumento se elaboró tomando en cuenta las necesidades de los psicólogos clínicos, escolares y de otras áreas, quienes utilizan la información obtenida de las pruebas de inteligencia. Esta versión más
reciente de la escala de Stanford-Binet conserva una continuidad histórica con las versiones anteriores, pero en términos de sus bases teóricas y psicométricas, contenido y procedimiento de prueba, presenta una diferencia comparada con sus predecesoras. Como muchas pruebas modernas, la SB-IV se elaboró mediante el uso de procedimientos psicométricos avanzados, como la teoría de las respuestas de reactivos (escala de Rasch) y un análisis que tiene una influencia étnica. Además, se diseñó no sólo para ayudar en la identificación de los individuos con retraso mental y superdotados, sino también para proporcionar información de diagnóstico con respecto de incapacidades de aprendizaje específicas. Con respecto de los prejuicios sexuales y étnicos, se omitieron aquellos reactivos que se juzgó injustos o que mostraban diferencias estadísticas atípicas entre los sexos o los grupos étnicos.
El modelo teórico y las pruebas Un modelo jerárquico de tres niveles forma la base teórica de la SB-IV. El modelo consiste en un factor de inteligencia general ( g ) en el primer nivel, tres factores amplios (capacidades cristalizadas, fluidez en las capacidades analíticas y razonamiento verbal abstracto) en el segundo nivel. Los factores de razonamiento verbal y cuantitativo en el tercer nivel, comprenden el factor de las capacidades cristalizadas en el segundo nivel y el factor visual abstracto en el tercer nivel comprende el factor de fluidez en las capacidades analíticas en el segundo nivel. Así como las anteriores, la cuarta edición de la escala de Stanford-Binet intenta medir la inteligencia desde los 2 años hasta la edad adulta. Existen 15 pruebas: de tres a cuatro pruebas en cada una de las tres categorías más amplias del Nivel 3 (Razonamiento Verbal, Razonamiento Visual/ Abstracto, Razonamiento Cuantitativo), además de tres pruebas de Memoria a Corto Plazo. Cada prueba está organizada en una serie de niveles que consisten en dos reactivos cada uno; casi todas las pruebas incluyen reactivos muestra para que los sujetos se familiaricen con la naturaleza de la tarea específica de la prueba. Aplicación. El tiempo total de prueba para la escala completa es de 75 minutos aproximadamente, con variaciones de acuerdo con la edad del sujeto y, por tanto, de la cantidad de pruebas que presenta. La naturaleza adaptativa o de etapas múltiples de la escala requiere la aplicación de la Prueba de Guía (Vocabulario) en primer lugar a fin de determinar el nivel de entrada en las otras pruebas. El nivel de entrada en la Prueba de Guía se determina por la edad cronológica (EC) del sujeto y el nivel básico es el nivel más alto en el cual el sujeto aprueba ambos reactivos en dos niveles consecutivos. La aplicación de la Prueba de Ruta continúa hasta que el sujeto reprueba tres o cuatro reactivos en dos niveles consecutivos, el más alto de los cuales es el nivel crítico. El nivel de entrada para las 14 pruebas restantes se determina a partir de un cuadro mediante una combinación del nivel crítico en la Prueba de Guía y la EC del sujeto. La aplicación de la prueba comienza en el nivel de entrada y continúa hacia abajo hasta que el sujeto aprueba ambos reactivos en dos niveles consecutivos y hacia arriba hasta que reprueba tres o cuatro reactivos en dos niveles consecutivos. El más alto de estos niveles es la edad tope del sujeto para esa prueba. Calificación. Las calificaciones brutas en cada una de las 15 pruebas consiste en la cantidad de reactivos aprobados. Las calificaciones en cada prueba se convierten, en cada grupo de edad, en calificaciones de edad estándar que tienen una media de 50 y una desviación estándar de 8. Las calificaciones brutas en las cuatro áreas (Razonamiento Verbal, Razonamiento Visual/Abstracto, Razonamiento Cuantitativo, Memoria a Corto Plazo), que son la suma de las calificaciones brutas en tres de las cuatro pruebas que comprenden esa área, se convierten en calificaciones de edad estándar que tienen una media de 100 y una desviación estándar de 16. Por último, una calificación general compuesta, que consiste en la suma de las calificaciones de las cuatro áreas, se convierte en
escala de calificaciones de edad estándar con una media de 100 y una desviación estándar de 16. El rango de las calificaciones de edad estándar generales compuestas es de 36 a 164, que equivale a un rango de calificación ! de - 4 a + 4 (véase la figura 6-1).
Estandarización. La cuarta edición de la escala de Stanford-Binet se estandarizó en 5,013 individuos entre los 2 y 23 años 11 meses de edad en 47 estados y el Distrito de Columbia. La muestra de estandarización estaba formada por48 % de hombres y 52 % de mujeres, 75 % eran de raza blanca, 4 % negros 6 % eran hispanos, 3 % asiáticos y de las islas del Pacífico y 2 % pertenecían a otros grupos étnicos. Los sujetos que eran estudiantes se estratificaron también de acuerdo con su posición relativa a su grupo escolar. A pesar de los esfuerzos por seleccionar una muestra de estandarización que fuera verdaderamente representativa de la población de Estados Unidos, la muestra contenía cantidades desproporcionadas de individuos con niveles socioeconómicos y educativos muy elevados. Al calificar la prueba, se hizo el intento de corregir este problema, pero no se logró del todo. Otros problemas son que los factores que mide la escala no son uniformes en todos los niveles de edad y la información sobre la confiabilidad que proporciona el manual es insuficiente. Sin embargo, los coeficientes de división por mitades y test-retest, que se calcularon con base en las medidas obtenidas durante un intervalo de 2 a 8 meses, indican que la confiabilidad de las 15 pruebas, las cuatro áreas y la combinación es satisfactoria.
Pruebas de Wechsler A pesar de que, desde la revisión de 1937, en la escala de Stanford-Binet se han incluido subpruebas en el nivel de los adultos, la prueba no era una medida muy satisfactoria de la inteligencia en los adultos. Como consecuencia, en 1939, David Wechsler, psicólogo del Bellevue Hospital en Nueva York, diseñó una prueba de inteligencia individual específica para adultos. A esta primera versión de la prueba (la Forma I de la Escala de Wechsler-Bellevue), Wechsler agregó una segunda forma en 1947 (la Forma II de la Escala de Wechsler-Bellevue). En 1955, The Psychological Corporation publicó una versión completa y reestandarizada de la Forma I de la Escala de Wechsler-Bellevue con el nombre de Escala de Inteligencia para Adultos de Wechsler (WAIS). La WAIS se revisó, se volvió a estandarizar y se publicó una vez más en 1981, con el nombre de Escala de Inteligencia para Adultos de Wechsler, Revisada (WAIS-R), para evaluar la inteligencia de adultos entre 16 y 74 años de edad.
Escala de Inteligencia para Adultos de Wechsler, Revisada (WAIS -R). Como se describe en el cuadro 6-2, las seis subpruebas verbales (V) y cinco de ejecución (P) de la WAIS-R son Información (V), Completamiento de Dibujos (P), Retención de Dígitos (V), Ordenamiento de Figuras (P), Vocabulario (V), Diseño con Cubos (P), Aritmética (V), Ensamble de Objetos (P), Comprensión (P), Símbolos en Dígitos (P) y Semejanzas (V). Al aplicar la WAIS-R, las subpruebas verbales y de ejecución se alternan en el orden antes mencionado. En cada subprueba, los reactivos se organizan en orden de dificultad ascendente y una subprueba en particular se interrumpe cuando el sujeto reprueba una cantidad específica de reactivos en forma sucesiva. La aplicación de las 11 subpruebas se lleva aproximadamente 75 minutos. La calificación bruta de un sujeto en cada subprueba de la WAIS-R se convierte en una escala de calificación estándar que tiene una media de 10 y una desviación estándar de 3. Se llevan acabo sumas separadas de las seis calificaciones en escala que se obtienen en las subpruebas verbales, las cinco calificaciones en escala de las subpruebas de ejecución y las calificaciones en escala de las 11
Cuadro 6-2 Descripciones de las subpruebas de la Escala de Inteligencia para Adultos de
Wechsler, Revisada (WAIS-R) Información. Treinta y tres preguntas de información general que deben responderse con pocas palabras o números. Las preguntas se organizan en orden de fácil a difícil. La prueba empieza con el reactivo 5; los reactivos del 1 al 4 se aplican si el sujeto reprueba ya sea el reactivo 5 o el 6. La prueba se interrumpe cuando el sujeto reprueba siete reactivos consecutivos. Las respuestas se califican con 0 o 1. Los antecedentes familiares y culturales afectan las respuestas. Figuras incompletas. Veintisiete figuras en tarjetas, a cada una le falta una parte. Al sujeto se le dan 20 segundos por figura para indicar qué falta. La prueba empieza con ei reactivo 1 y se interrumpe cuando el sujeto reprueba siete reactivos consecutivos. Las respuestas se califican con 0 o 1. La prueba se diseñó para medir la agudeza visual, memoria y atención a los detalles. Retención de dígitos. Siete series de dígitos que deben repetirse hacia adelante y siete series que deben repetirse hacia atrás. La prueba de los "dígitos que se recitan hacia adelante" empieza con tres dígitos que el examinador lee en voz alta (un dígito por segundo). Se pide al sujeto que repita cada serie en el momento en que termina el examinador. Se dan dos oportunidades en cada extensión de la serie (dos conjuntos de dígitos diferentes). La prueba de los "dígitos que se repiten hacia adelante" continúa hasta que el sujeto reprueba las dos oportunidades de una serie o tiene éxito en nueve dígitos hacia adelante. En la prueba de los "dígitos que se repiten hacia atrás" se pide al sujeto que repitá los dígitos hacia atrás después de que el examinador termina de decirlos hacia adelante. La prueba empieza con dos dígitos que deben repetirse hacia atrás y continúa hasta que el sujeto reprueba ambas oportunidades en una serie o tiene éxito en ocho dígitos hacia atrás. La calificación en cada conjunto de "dígitos que se repiten hacia adelante" o "dígitos que se repiten hacia atrás" es 0,1 o 2; la calificación total es la suma de las calificaciones parciales de los "dígitos hacia adelante" y los "dígitos hacia atrás". La prueba está diseñada para medir la memoria inmediata, pero los intervalos de atención y la comprensión afectan las calificaciones. Ordenamiento de figuras. Diez grupos de tarjetas, cada tarjeta contiene una pequeña figura. Se pide al sujeto que ordene las figuras en cada conjunto de tarjetas para formar una historia. El límite de tiempo es de 60 segundos en los conjuntos del 1 al 4,90 segundos en los conjuntos del 5 al 8 y 120 segundos en los conjuntos 9 y 10. La prueba se interrumpe cuando el sujeto reprueba cinco conjuntos consecutivos. Las respuestas se califican con 0,1 o 2, dependiendo de la precisión. La prueba mide la capacidad para ordenar en secuencia, así como la planeación social, el humory la capacidad para anticipar. Vocabulario. Treinta y siete palabras que deben definirse, en orden de dificultad ascendente. La prueba empieza con el reactivo 1 para los sujetos que tienen poca capacidad verbal, de otra forma comienza con el reactivo 4. La prueba se interrumpe cuando el sujeto reprueba seis palabras seguidas. Las respuestas a cada palabra se califican con 0,1 o 2 dependiendo del grado de comprensión de la palabra que se expresa. La prueba está diseñada para medir el conocimiento de las palabras, una habilidad que está muy relacionada con la capacidad mental general. Diseño con cubos. Diez diseños geométricos rojos y blancos se presentan en tarjetas; se pide al sujeto que copie cada diseño con cuatro o nueve cubos. En los primeros dos diseños se permiten dos intentos y en cada diseño sucesivo se permite un intento. La prueba se interrumpe cuando se reprueban cuatro diseños seguidos. La calificación de base es 0, 1 o 2 puntos en los diseños 1 y 2 y 0 o 2 puntos en los diseños del 3 al 10, con puntos extra por un desempeño rápido y perfecto. La prueba está diseñada para medir la capacidad de percibir y analizar un patrón visual en las partes que lo componen. En términos de sus correlaciones con las calificaciones totales en la Escala de Ejecución y las calificaciones de la prueba en general, el "Diseño con cubos" se considera una de las mejores pruebas de ejecución.
#$%&'( )*+ (concluye)
Aritmética. Quince problemas aritméticos en orden de dificultad ascendente. La prueba empieza con el reactivo 3 y se interrumpe después de cinco fallas consecutivas; los reactivos 1 y 2 se presentan en caso de reprobar los reactivos 3 y 4. Se permiten quince segundos en los reactivos del 1 al 4, 30 segundos en los problemas del 5 al 10,60 segundos en los problemas del 11 al 14 y 120 segundos en el problema 15. Las respuestas se califican con 0 o 1, además de puntos extra por un desempeño rápido y perfecto en ciertos problemas. La prueba mide el conocimiento elemental de la aritmética, y la capacidad para concentrarse y razonar en f orma cuantitativa. Ensamble de objetos. Cuatro rompecabezas de figuras de cartón se presentan al sujeto en un formato previamente ordenado, con instrucciones de que una las piezas se utiliza para formar algún objeto. Se presentan los cuatro rompecabezas, el limite de tiempo es de 120 segundos para los rompecabezas 1 y 2 y 180 segundos para los rompecabezas 3 y 4. La calificación para cada rompecabezas se determina por el número de "cortes" que se unen de manera correcta; se dan puntos extra por un desempeño rápido y perfecto. La prueba está diseñada para medir el pensamiento, los hábitos de trabajo, la atención, la persistencia y la capacidad para visualizar una forma final con base en sus partes. Comprensión. Dieciocho preguntas en orden de dificultad ascendente que requieren respuestas detalladas. Las preguntas se presentan hasta que el sujeto reprueba seis reactivos consecutivos. Las respuestas se califican con 0,1 o 2 dependiendo de la calidad y el grado de comprensión que se expresa. La prueba mide el conocimiento práctico, el juicio social y la capacidad para organizar la información. Símbolos en dígitos. Se pide al sujeto que llene cada uno de los 93 cuadros con el símbolo del código apropiado para el número que aparece en el cuadro superior. La prueba empieza con una serie de práctica, después de la cual se dan al sujeto 90 segundos para llenar los 93 cuadros en blanco con los símbolos correctos que copia de unas claves que se presentan antes. El rango de calificaciones es de 0 a 93 puntos. La prueba está diseñada para medir la atención y persistencia en una tarea perceptual motriz sencilla. Semejanzas. Catorce reactivos del tipo "¿En qué se parecen A y B?" Los reactivos se presentan en orden de dificultad ascendente hasta que el sujeto reprueba cinco reactivos seguidos. Las respuestas se califican con 0, 1 o 2, dependiendo de la calidad y el grado de comprensión que se expresa. Esta prueba está diseñada para medir el pensamiento lógico o abstracto; la capacidad para ordenar en categorías y generalizar.
Importancia del diagnóstico de las calificaciones de la WAIS y la WAIS-R. Al diseñar el WAIS, Wechsler planeaba obtener algo más que sólo un estimado de la "capacidad agregada o global de un sujeto, para actuar en forma intencional, pensar de manera racional y manejar con eficiencia su entorno". Se pensó que una diferencia significativa entre los CIs verbales y de ejecución de una persona y el patrón de calificaciones (dispersión) en las 11 subpruebas era una característica de ciertos tipos de trastornos mentales y, por tanto, resultaba potencialmente útil en un diagnóstico clínico. Por desgracia, los resultados de la investigación no confirmaron ninguna de las hipótesis de Wechsler con respecto de la importancia del diagnóstico en la dispersión de subpruebas. Un problema que se enfrenta al tratar de analizar la dispersión de las subpruebas de la WAIS-R es el hecho de que las calificaciones en las subpruebas no son muy confiables y, en algunos casos, tienen correlaciones sustanciales entre sí. Como consecuencia, la diferencia entre las calificaciones que obtiene una persona en dos subpruebas determinadas deben ser muy grandes antes de considerarse significativas. Sin embargo, las grandes diferencias entre las calificaciones en escala de las subpruebas y entre los CIs verbales y de ejecución son de cierta utilidad en el diagnóstico de daño cerebral orgánico y psicopatología y para diferenciar entre la inteligencia y la oportunidad. Por ejemplo, un CI verbal bastante más bajo que un CI de ejecución puede ser el resultado de una experiencia lingüística limitada o de "restricciones culturales". Escala de Inteligencia de Wechsler para Niños, tercera edición (WISC-lll). En 1949, se publicó la Escala de Inteligencia de Wechsler para Niños (WISC), una extensión hacia abajo de la Forma I de la Escala de Wechsler-Bellevue. En 1974, The Psychological Corporation publicó una revisión de la WISC, la WISC-R, y en 1991, se publicó una segunda revisión, la Escala de Inteligencia de Wechsler para Niños, tercera edición (WISC-III). La WISC-III, que está diseñada para niños entre 6 y 16 años y 11 meses de edad, consiste en las seis subpruebas verbales y las siete subpruebas de ejecución que se mencionan en el cuadro 6-3. Las 10 subpruebas centrales pueden aplicarse en un periodo de 50 a 70 minutos y las pruebas complementarias en 10 a 15 minutos. Como en el caso de la WAIS-R, las supruebas verbales y de ejecución de la WISC-III se aplican alternadas. Los CIs Verbal, de Ejecución y de Escala Completa, con base en la misma escala de calificaciones estándar que la WAIS-R, se determinan sumando las calificaciones en escala equivalentes a las calificaciones brutas obtenidas en las cinco pruebas verbales y cinco pruebas de ejecución aplicadas. Además, en la WISC-III se puede calificar cuatro factores: Comprensión Verbal, Organización Perceptual, Libertad de la Distracción y Velocidad de Procesamiento.
La WISC-III se estandarizó en muestras representativas de 100 niños y 100 niñas estadounidenses en cada uno de los 11 grupos de edad de entre 6 y 16 años. Las muestras también se estratificaron por región geográfica, nivel de educación de los padres y raza. Otras muestras de niños presentaron tanto la WISC-III como con la WAIS-R o la WPPSI-R, dependiendo de su edad. La confiabilidad test-retest prueba de la WISC-III, obtenida al volver a aplicar la escala después de un periodo de 4 a 8 semanas, es satisfactoria. Además, se han realizado varios estudios de validación con distintos grupos clínicos de niños.
Escala de Inteligencia para Edad Preescolar y Primaria de Wechsler, Revisada (WPPSI-R). El tercer miembro de la familia de pruebas de Wechsler, la Escala de Inteligencia para Preescolar y Primaria, se publicó por primera vez en 1967 y una revisión de ésta, la WPPSI-R, en 1989. Las seis subpruebas verbales y seis subpruebas de ejecución de la WPPSI-R son, en orden de aplicación. Armado de Objetos (P), Información (V), Diseño Geométrico (P), Comprensión (V), Diseño con Cubos (P), Aritmética (V), Laberintos (P), Vocabulario (V), Completamiento de Figuras (P), Semejanzas (V), Clavijas de Animales (P) y Enunciados (V). Las dos últimas son subpruebas complementarias. Diseñada para niños que tienen entre 3 y 7 años de edad, la WPPSI-R se estandarizó durante 1987-1989 en una muestra nacional de niños estadounidenses de 3 a 7 años. Otras variables de estratificación que se emplearon para hacer la muestra más representativa de la población en Estados Unidos de entre 3 y 7 años de edad fueron sexo, etnicidad y niveles educativo y ocupacional de los padres. Al igual que la WAIS-R y la WISC-III, la WPPSI-R da como resultado CIs Verbal,
de Ejecución y de Escala Completa separados con base en una escala de calificaciones estándar con una media de 100 y desviación estándar de 15.
SOMPA. La WISC-R o la WPPSI se aplican como parte del Sistema de Evaluación Pluralista Multicultural (SOMPA) (de The Psychological Corporation). El SOMPA es un planteamiento, que tiene dos componentes, para evaluar las capacidades cognoscitivas, capacidades sensoriomotrices y comportamiento adaptativo de niños de entre 5 y 11 años de edad. El primer componente del SOMPA, Entrevista con los Padres, consiste en tres medidas (Inventario de Comportamiento Adaptativo para Niños, Escalas Socioculturales, Inventario de Historia de la Salud) y puede realizarse en inglés o en español. El segundo componente del SOMPA, Materiales de Evaluación del Estudiante, incluyen Tareas de Destreza Física, medidas de Peso por Estatura, Agudeza Visual y Agudeza Auditiva, así como el Test Gestáltico Visomotorde Bender y la WISC-R o la WPPSI. En conjunto, los dos componentes del SOMPA representan tres modelos de evaluación psicológica: un modelo médico, un modelo de sistema social y un modelo pluralista. Con base en la información que se obtiene de las distintas evaluaciones, se determina el potencial estimado de aprendizaje (ELP) de un niño, que toma en cuenta los antecedentes familiares, el nivel socioeconómico y otros factores culturales. Están disponibles formas separadas para niños anglosajones, negros e hispanos de entre 5 y 11 años de edad. 1 Sin embargo, el planteamiento del SOMPA no se utiliza tanto como antes y quizá pronto tenga sobre todo un interés histórico.
Otras pruebas de inteligencia individuales de amplio rango A pesar de ser las pruebas de inteligencia individuales más populares en Estados Unidos, las series de pruebas de Stanford-Binet y Wechsler no son, de ninguna manera, las únicas baterías de amplio rango para evaluar la capacidad mental general. Tampoco son las pruebas de capacidad mental más populares en otros países. En el Reino Unido, merecen mención las Escalas Británicas de Capacidades (B AS), que se revisaron y volvieron a estandarizar en Estados Unidos como las Escalas de Capacidades Diferenciales (DAS) (de The Psychological Corporation). El propósito básico de la DAS, al igual que las B AS, es proporcionar perfiles de las capacidades a fin de analizar y diagnosticar las dificultades de aprendizaje en los niños, evaluar cambios en las capacidades a través de los años e identificar, seleccionar y clasificar a los niños (de 2 Vz a 17 años de edad) con incapacidad mental. Las DAS consisten en 19 pruebas: Semejanzas, Matrices, Razonamiento Secuencial y Cuantitativo, Semejanzas de Figuras, Elaboración de Patrones, Construcción con Bloques, Copiado, Comparación de Formas Parecidas a las Letras, Memoria de Dígitos, Memoria de Diseños, Reconocimiento de Figuras, Memoria de Objetos, Vocabulario, Definiciones de Palabras, Comprensión Verbal, Lectura de Palabras, Ortografía, Habilidades Numéricas Básicas y Velocidad de Procesamiento de la Información. Estas pruebas se agrupan en cuatro áreas de capacidad: verbal, no verbal, espacial y de diagnóstico. Se aplican de ocho a doce subpruebas en cada nivel de edad, con un tiempo total de 45 a 65 minutos. Además, se incluyen en la batería tres subpruebas de aprovechamiento (Lectura de Palabras, Ortografía y Habilidades Numéricas Básicas), que requieren de un tiempo total de prueba de 15 a 20 minutos. Las calificaciones brutas de cada prueba se convierten en calificaciones de capacidad independientes de la edad del sujeto. Las calificaciones de capacidad entonces pueden convertirse en calificaciones T y rangos percentilares con base en las calificaciones que obtuvo una