1. VALIDEZ DE
CONTENIDO
Se refiere al grado en que el
test presenta una muestra adecuada de los contenidos a
los que se refiere, sin omisiones
y sin desequilibrios de contenido.
La validez de contenido se
utiliza principalmente con tests de rendimiento, y
especialmente con los tests
educativos y tests referidos al criterio. En este tipo de tests
se trata de comprobar los
conocimientos respecto a una materia o un curso.
La validez de contenido descansa
generalmente en el juicio de expertos (métodos de
juicio). Se define como el grado
en que los ítems que componen el test representan el
contenido que el test trata de
evaluar. Por tanto, la validez de contenido se basa en (a) la
definición precisa del dominio y
(b) en el juicio sobre el grado de suficiencia con que
ese dominio se evalúa.
A pesar de que no se utiliza un
índice de correlación para expresar la validez de
contenido, existen procedimientos
para cuantificarlo. Algunos de estos procedimientos
son:
a) Cálculo de
descriptivos: Consiste
en calcular la media y la desviación típica de
todos los ítems. A continuación,
se determinará una puntuación de corte (o
índice de validez de contenido)
que refleje, en base a la evaluación de los
expertos (método de juicio), que
la puntuación del ítem es demasiado baja en
relevancia como para ser incluido
en la escala. No hay reglas. La decisión
dependerá del juicio propio. Por
este motivo, se han de tener en cuenta las
siguientes cuestiones:
Ser capaz de justificar la
decisión sobre la puntuación corte.
· Usar la misma puntuación de
corte para todos los ítems de la escala,
incluso si la escala es
multidimensional.
· No poner una puntuación de
corte tan alta que implique eliminar muchos
ítems. (Se podrán eliminar más
ítems con el cálculo de la fiabilidad y el
análisis factorial).
b) Índice de
validez de contenido (IVC): Lawshe (1975) propuso un índice de
validez basado en la valoración
de un grupo de expertos de cada uno de los
ítems del test como innecesario,
útil y esencial. El índice se calcula a través de la
siguiente fórmula:
ne - N/2
IVC= -----------------
N/2
Donde ne es el número de
expertos que han valorado el ítem como esencial y N es el
número total de expertos que han
evaluado el ítem.
El IVC oscila entre +1 y -1,
siendo las puntuaciones positivas las que indican una
mejor validez de contenido. Un
índice IVC = 0 indica que la mitad de los expertos
han evaluado el ítems como
esencial. Los ítems con una bajo IVC serán eliminados.
Lawshe (1975) sugiere que un IVC
= .29 será adecuado cuando se hayan utilizado 40 expertos, un IVC = .51 será
suficiente con 14 expertos, pero un IVC de, al
menos, .99 será necesario cuando el número de
expertos sea 7 o inferior.
2. VALIDEZ DE
CRITERIO O CRITERIAL
Se refiere al grado en que el
test correlaciona con variables ajenas al test (criterios)
con lo que se espera por
hipótesis que debe correlacionar de determinado modo. Un
criterio es una variable
distinta del test que se toma como referencia, que se sabe que es
un indicador de aquello que el
test pretende medir o que se sabe que debe presentar una
relación determinada con lo que
el test pretende medir. Se denomina coeficiente de
validez a la correlación
del test con un criterio externo.
La elección del criterio es el
aspecto crítico en este procedimiento de determinación
de la validez, ya que es muy
difícil obtener buenos criterios. Un mismo test puede tener
más de un tipo de validez, es
decir puede estar validado con respecto a varios criterios y
los diferentes coeficientes de
validez que resultan pueden tener valores diferentes.
Dentro del concepto de validez de
criterio cabe distinguir a su vez entre:
- Validez externa y validez interna
- Validez concurrente y
validez predictiva
a) Hablamos de validez
externa si el test se ha validado con respecto a un criterio
externo, como por ejemplo, una
evaluación de rendimiento. La correlación del test
con el criterio da lugar al
coeficiente de validez externa. Hace referencia a la
posibilidad de generalización.
Sin embargo, hablaremos de validez
interna si se correlaciona un test con otro
con validez reconocida que mide
el mismo rasgo; los coeficientes de validez interna
suelen ser menores que los de
validez externa y su interpretación es difícil. Para
evitar errores de interpretación
se suele correlacionar un test con todos los tests ya
validados que miden lo mismo y
calcular un coeficiente de correlación múltiple.
Este coeficiente de validez interna
suele alcanzar el valor del coeficiente de validez
externa. Hace referencia a la
validez del resultado de la investigación para los
sujetos estudiados.
b) La distinción entre validez
concurrente y predictiva se emplea según se utilice un
criterio disponible en el momento
(validez concurrente) o cuando se pretenda
predecir la conducta futura de un
individuo (validez predictiva). Este tipo de validez
se exige especialmente para los
instrumentos que se utilizan en selección y
orientación académica o
profesional.
Cálculo del
coeficiente de validez
Los procedimientos estadísticos
utilizados en la validación referida a un criterio
varían según el número de
predictores utilizados (uno o más tests) y el número de
criterios empleados (criterio
único y criterio compuesto o múltiple). Martínez Arias
(1995) distingue los siguientes
casos:
1. Un único test y un solo
criterio: se emplearían los procedimientos de correlación y
regresión lineal simple.
2. Varios predictores (tests)
y un solo criterio: se emplea la correlación y regresión
lineal múltiple o el análisis
discriminante.
3. Varios predictores y varios
criterios: regresión lineal multivariante y la correlación
canónica.
4. VALIDEZ DE
CONSTRUCTO
Es un concepto más complejo. Se
refiere al grado en que el instrumento de medida
cumple con las hipótesis que
cabría esperar para un instrumento de medida diseñado
para medir precisamente aquello
que deseaba medir. Se puede considerar un concepto
general que abarcaría los otros
tipos de validez.
El término constructo hace
referencia a un concepto teórico psicológico
inobservable (ej. la
inteligencia, cada factor de personalidad, las aptitudes, las actitudes,
etc.) La definición operativa de
estos constructos presenta considerables dificultades en
la práctica, ya que no son
directamente observables. Debido a esto, la validación de un
constructo es un proceso
laborioso y difícil.
Para la estimación de la validez
de constructo se utiliza una metodología variada.
Algunos de los métodos más
utilizados son:
1) Métodos
correlacionales
Los coeficientes de correlación
nos indican la relación del test con el conjunto de
instrumentos de medida y
criterios posibles, así como la relación entre el test y el
constructo.
- Correlación del test con un
criterio externo
- Correlación test con otros
tests que pretenden medir los mismos aspectos o aspectos
semejantes.
- Correlación del test con otros
tests que miden características, que nada tienen que
ver con el constructo que subyace
al test.
Campbell y Fiske (1959) proponen
que se calcule dos tipos de validez:
a) Validez convergente:
indica las correlaciones positivas con otros tests que miden lo
mismo.
b) Validez discriminante:
indica las correlaciones nulas con tests que miden aspectos
diferentes.
A través de estos dos tipos de
validez se podría ir definiendo un constructo
psicológico.
2) Análisis
Factorial del test
El análisis factorial permite
ordenar los datos y facilitar la interpretación de las
correlaciones. Se espera un
factor explicativo del constructo con saturaciones altas del
test y los tests que miden
aspectos parecidos, y con saturaciones bajas de aquellos tests
que miden aspectos diferentes.
Con frecuencia se habla de la
estructura factorial de un test como validez
estructural o
validez factorial
3) Análisis de
las diferencias individuales que pone de manifiesto un test
Se refiere al análisis de la
distribución de las puntuaciones de test y a comparaciones
de estos aspectos en distintas
muestras. Diferentes edades, sexos, niveles profesionales,
etc. Estas comparaciones no son
arbitrarias, sino que se derivan de hipótesis que se
hacen en función de los
conocimientos que se tiene del constructo.
4) Análisis de
los cambios en las diferencias individuales
Se refiere a la investigación
diacrónica de los mismos sujetos con el mismo test.
Este tipo de estudios permite
conocer la estabilidad del rasgo a lo largo del tiempo y a
través de situaciones.
5) Análisis
lógico de los elementos del test
Se refiere al análisis de ítems
del test en relación con el constructo. Aquellos ítems
que correlacionan positivamente
entre sí, pertenecen al mismo constructo. Esto significa
que el análisis de consistencia
interna de un test no sólo aporta datos respecto a su
fiabilidad, sino a su validez. Si
se obtiene un coeficiente de consistencia interna bajo,
significa que el test no mide un
único constructo.
Todos estos métodos enumerados se
complementan entre sí. Se trata de ver el
constructo que trata de medir el
test desde diferentes ángulos. Por tanto, no existe una
única medida de la validez de
constructo.
5. CUESTIONES
RELATIVAS A LA ESTIMACIÓN DE LA VALIDEZ
1. Valor máximo
del coeficiente de validez
El valor máximo que puede
alcanzar un coeficiente de validez, estimado
mediante la correlación entre el
test y el criterio, es menor o igual que su índice de
fiabilidad. Cuanto peor medido
esté el criterio, o menos fiables sean las puntuaciones
obtenidas en el criterio, la prueba de rendimiento,
peor va a ser la predicción.
2. Validez y
longitud del test
Del mismo modo que la fiabilidad
de un test mejora aumentando su longitud, con la
validez también ocurre lo mismo.
Es decir, cuanto mayor sea el número de ítems, mayor
será la validez del test.
3. Validez y
variabilidad del grupo
La correlación entre dos
variables aumenta conforme lo hace la variabilidad de la
muestra. Si restringimos el rango
de variabilidad de las puntuaciones de una muestra de
sujetos, el coeficiente de
validez (la correlación del test con el criterio) será menor de lo
que debería.