Por: Delgado de Smith, Yamile, Colombo Leyda y Rosmel Orfila (2002). Conduciendo la Investigación. Editorial Comala. Caracas.
HECHO CON
DEPÓSITO DE LEY
Depósito legal: If 74520020011017
ISBN:
980-390-022-6
Confiabilidad y validez de los
instrumentos
La confiabilidad y la validez son
cualidades esenciales que deben estar presentes en todos los instrumentos de
carácter científico para la recogida de datos. En palabras de Pérez (1998:71),
si el instrumento o instrumentos reúnen estos requisitos habrá cierta garantía
de los resultados obtenidos en un determinado estudio y, por lo tanto, las
conclusiones pueden ser creíbles y merecedoras de una mayor confianza.
Uno de los mayores problemas que se
debe evitar, es que la información
obtenida no le permita responder a los objetivos de la investigación. Si
los instrumentos no son validados, podrá encontrar una variada información pero
sin ninguna articulación con los propósitos y compromisos asumidos en la
investigación.
Expertos (Fendel, Kurt, Taylomir,
Wintther) aseguran que la información
insuficiente obtenida en las investigaciones está vinculada a la elaboración
incoherente e inconsistente de los instrumentos de recopilación de datos. Muy
probablemente, no fueron diseñados con agudeza y pensando en todo momento en
los objetivos y propósitos de la investigación
Ante tal situación, deberá realizar nuevos instrumentos de
recolección de datos que responda a sus objetivos, y la información que ya
tiene de su primer esfuerzo no se pierde y con seguridad serán un apoyo o
refuerzo.
Un buen instrumento de recolección
de datos o medición debe tener las siguientes cualidades: confiabilidad y
validez.
La confiabilidad se refiere al
nivel de exactitud y consistencia de los resultados obtenidos al aplicar el
instrumento por segunda vez en condiciones tan parecida como sea posible.
Bernal (2000:218) afirma que la
pregunta clave para determinar la confiabilidad de un instrumento de medición
es:
Si se miden fenómenos o eventos una
y otra vez con el mismo instrumento de medición, ¿Se obtienen los mismos
resultados u otros muy similares? Si la respuesta es afirmativa, se puede decir
que el instrumento es confiable.
Es importante lograr la elaboración
de un instrumento que sea confiable.
Para ello, existen muchas vías para lograrlo. Si se tratara de un cuestionario,
se puede aplicar dos veces a la misma persona en un corto período de tiempo, y
seguidamente se utiliza el índice de Bellack:
Indice: S de los acuerdos
x 100___
S (acuerdos + desacuerdos)
Se considera que el instrumento
es confiable si el índice de Bellack
resultante es superior al umbral arbitrario de 80. Pourtois, J., Desmet,
H.(1992:187)
Esta prueba se aplica a cualquier
tipo de variable o dimensión objeto de estudio.
Otra manera para poder determinar
si un instrumento es confiable es a
través del cálculo de la medida de estabilidad por la vía del test-retest.
En este procedimiento un mismo instrumento es aplicado en dos oportunidades o más a un
mismo grupo de personas, después de cierto período de tiempo. Si la correlación
entre los resultados de las diferentes aplicaciones es altamente positiva, el
instrumento se considera confiable. El valor de la correlación es un valor
ubicado entre el –1 y 1.
muy baja (0) baja regular aceptable elevado(1)
No
hay confiabilidad
100% de confiabilidad
El cálculo de este coeficiente se
utiliza para mediciones de variables o dimensiones que responden a una escala
de medición de intervalo o razón.
Es importante que para la
aplicación de esta prueba, se tome un lapso de tiempo lo suficientemente largo
para que los sujetos se olviden de lo que contestaron y, por el otro, no tanto
que se produzcan cambios importantes. (Pérez 1998:72). Este tipo de medición se
utiliza en investigaciones cuantitativas.
También el Coeficiente alfa de Cronbach
permite determinar la confiabilidad; utilizando la fórmula si el resultado es
0.80 o más se considera aceptable el instrumento.
a = N p*
1+p* (N-1)
en donde N es el número de items y
p* el promedio de las correlaciones entre ítems.
Para el cálculo de p*, deberá aplicar:
P*= SP
NP
En donde, SP
es la sumatoria de las correlaciones y NP el número de correlaciones no
repetidas o no excluidas.
El cálculo del coeficiente de
confiabilidad Alfa de Cronbach se utiliza para mediciones de variables o
dimensiones que responden a una escala de medición de intervalo o razón.
La confiabilidad también se puede
calcular mediante la aplicación de las ecuaciones de Rulon, Guttman,
Sperman-Brown, Kuder-Richardson (KD20) para elementeos dicotómicos y (KD21) en
el caso de elementos con dificultad similar.
Adicionalmente a la confiabilidad
de un instrumento, se debe buscar la validez
del mismo. En este sentido, el investigador realizará un esfuerzo dirigido a la
elaboración de un instrumento que mida lo que se desea medir.
Salkind (1998:126); Hernández (1998:242) clasifican la validez
en: validez de contenido, validez de criterio y la validez de constructo.
La
validez de contenido está
representada por el grado en que una
prueba representa el universo de estudio. Por tal motivo, deberán seleccionarse
los indicadores e items de tal manera que estos respondan a las características
peculiares del objeto de estudio.
La
validez de criterio,
llamada también validez concurrente es más fácil de estimar, lo único que se
debe hacer es correlacionar su medición con el criterio, y este coeficiente se
toma como coeficiente de validez. La validez de criterio es una medida del
grado en que una prueba está relacionada con algún criterio. Es de suponer que
el criterio con el que se está comparando la prueba tiene un valor intrínseco
como medida de algún rasgo o característica.
La
validez de constructo
determina a través del procedimiento de análisis de factores en que medida los
resultados de una prueba se relacionan
con constructos. Un constructo es un atributo para explicar un fenómeno.
En el análisis de factores se
generan “variables artificiales”, denominadas factores que representan
constructos, los factores se obtienen de las variables originales y deben ser
interpretadas de acuerdo con éstas. Se trata, de una técnica para explicar un
fenómeno completo complejo en atención de unas cuantas variables.
Todos los
instrumentos de recolección de datos (cuestionarios, test, escalas, guías de
observación, pruebas de conocimiento, etc.) debe precisar de la validez de
contenido, y ésta consiste en hacer una revisión profunda de cada ítem que
estructuran el instrumento.
Para Aroca, A.
(1999: 29), la validez de contenido,
denominada
también “lógica” o de “muestreo”. Se
refiere básicamente al contenido del instrumento, al hecho de que el
instrumento contenga en sus elementos o ítem
todos y sólo los aspectos que, de acuerdo a los objetivos de la
investigación, sea necesario (sic) averiguar para el logro de los mismos.
Este procedimiento de
carácter lógico-racional es determinante en la configuración del instrumento,
pues a través del mismo se desechan ítem o aspectos irrelevantes que de una u
otra manera restan sentido razonado a la intención concreta de búsqueda de
datos; por otra parte, la validez de contenido permite redimensionar aquellos
ítem que en su primera versión se consideran confuso o presentan errores de
sintaxis y/o semántica y que, una vez corregidos las disyuntivas a las que
diera lugar, permitan obtener los datos e informaciones que se encuentran
especificada en cada uno de los propósitos de la investigación.
De esta manera, la
validez de contenido es un procedimiento al que no puede obviarse cuando se
tiene el objetivo certero de realizar una investigación de gran envergadura, y
en el caso muy particular de la Gerencia de Recursos Humanos, los instrumentos
de recolección de datos han de condensar
suficientes ítem como para poder
apreciar de una manera totalizadora los aspectos, factores y variables que se
conjugan para estructurar el fenómeno objeto de estudio.
Debe tenerse siempre
presente que el investigador del área de Recursos Humanos tiene ante su mirada
de inquisidor científico un universo de sujetos cuyas actuaciones se
corresponden con representaciones subjetivas y las mismas son objetivadas en
actos y redes de actos los cuales se constituyen en los posibles escenarios
susceptibles de ser captados a través de medios instrumentales diseñados para
fines bien definidos.
Así, de lo que se trata
es de advertir que los fenómenos sociales son de una complejidad tal que todo
investigador que se aventure a su aprehensión debe disponer de instrumentos de
recolección de datos bien construidos, y es por ello que la validez de
contenido está destinada a darle coherencia y sistematicidad a los ítems que
conforman el instrumento diseñado.
Al decir de Aroca, A.
(1999: 269), El método que más se utiliza para estimar la validez de contenido
es el denominado Juicio de Expertos, el cual consiste en seleccionar un número
impar (3 o 5) de jueces (personas expertas o muy conocedoras del problema o
asunto que se investiga). quienes tienen la labor de leer, evaluar y corregir
cada uno de los ítems del instrumento so
pretexto de que los mismos se adecuen directamente con cada uno de los
objetivos de la investigación propuestos.
De acuerdo con las
reflexiones de la autora antes citada, se consideran expertos o jueces aquellos
sujetos que reúnan las siguientes consideraciones:
a.- Formación académica
en el área y rama del quehacer científico al que diera lugar;
b.- Comprobada
trayectoria experiencial de investigaciones realizadas en institutos y centros
destinados para fines bien definidos;
c.- Desarrollo de una
línea (o líneas) de investigación relacionada a intereses académicos;
d.- Poseer una amplia
concepción epistemológica de la ciencia y de la investigación; y,
e.- Demostrar pleno
dominio de la lengua castellana, pues la sintaxis, la semántica y la sindéresis
son aspectos determinantes para dar forma interna y externa al instrumento.
Tomando como base estas
características que se consideran las más deseables que debe tener un experto
encargado de validar los instrumentos de recolección de datos, se hace saber
que la validez de contenido permite al sujeto investigador lograr la
aprehensión lo más objetiva posible de la esencia de los hechos y fenómenos que
estudia, es decir, se establece un perfecto relacionamiento entre los
propósitos de la investigación y el alcance en el campo real donde se
experimentan los acontecimientos.
Ahora bien, ¿de qué manera
procede un experto para validar los instrumentos de recolección de datos?
Una vez que se diseña
el instrumento de recolección de datos a partir del desglosamiento de los
objetivos específicos en su factor, definición, dimensiones e indicadores, el
producto materializado en dicha herramienta se corresponde con lo que muy bien
puede llamarse una primera versión, pues como se ha especificado antes debe
procederse con la “calibración” donde el juicio de experto se corresponde con
una de ellas.
En manos del experto,
la primera versión del instrumento sufrirá cambios superficiales o profundos,
los cuales son importantes que sean considerados por el investigador so
pretexto de que el instrumento de recolección de datos alcance la configuración
y calidad deseada. Dichos cambios pueden
ser de índole de contenido, de redacción-semántica, sindéresis, correspondencia
con los objetivos planteados, pertinencia con el tipo de investigación,
relación estrecha con una realidad concreta.
Para proceder a la
validación por juicio de expertos, es importante tener a la mano un instrumento
/ formato diseñado exclusivamente para servir de guía operativa a los
especialistas, quienes lo emplearán para evaluar y valorar la primera versión
del instrumento de recolección de datos.
Los autores de la presente obra
sugieren tomar en cuenta los siguientes aspectos a los fines de realizar el
formato guía para validación por parte del experto:
1.-
Elaborar una carta dirigida al experto,
a continuación un ejemplo:
Respetado
experto, a continuación se le está proporcionando un instrumento cuyo propósito
consiste en que Usted lea, evalúe y corrija cada ítem que conforma el
instrumento de recolección de datos.
Dichas correcciones son de vital importancia para dar la configuración y
calidad definitiva al mismo antes de su aplicación a la muestra de sujetos
seleccionados para los fines específicos de la investigación.
Sin más a que
hacer referencia, y confiados en que sus observaciones serán de gran utilidad,
se suscriben de Usted,
2.- Solicitar datos del experto, a continuación un
ejemplo:
Nombre y Apellido
Cédula de Identidad
Institución donde
trabaja
Título (s) de Pregrado
Título (s) de Postgrado
Publicaciones
3.- Suministrar al experto los datos básicos de la
investigación, a saber:
Título de la
Investigación
Objetivo General
Objetivos Específicos
Variables o
dimensiones que se pretenden medir
Tipo de Investigación
Población objeto de Estudio
4.- Especificar los aspectos a considerar para la
valoración de cada Ítem:
Redacción
Pertinencia con los
objetivos
Pertinencia con el tipo
de investigación
5.- Retroalimentación del Experto:
Solicitar al experto
que por escrito, emita sus opiniones en torno aquellos aspectos que se deben mantener y los que sugiere modificar y/o incorporar, indicando lugar y fecha de realización.
Anteriormente se explicó que el
investigador que pretender validar el instrumento a través de Juicio de Experto
debe proceder con 3 o 5 jueces. Una vez que los jueces proceden a examinar y
evaluar cada ítem, se comparan los resultados; realizado este procedimiento, se
integran las correcciones y sugerencias a través de las cuales se determina el
instrumento definitivo el cual se aplicará a la muestra de sujetos
seleccionados.
Para quienes elaboran instrumento,
Thomas Kuhn (1971:73) señala que el hombre que
construye un instrumento para determinar las longitudes de ondas ópticas
no deberá estar satisfecho con un equipo que se limite a atribuir números
determinados a líneas espectrales particulares. No es solo un explorador o un
medidor, sino que por el contrario, mediante el análisis de su aparato, deberá
mostrar en términos del cuerpo establecido de teoría óptica, que los números
que muestra su instrumento son los que corresponden en la teoría como los de
longitud de ondas.
En Ciencias Sociales,
la investigación de carácter cualitativo ha adquirido una gran
relevancia desde la mitad del siglo XX, y son muchos los investigadores sociales que se suman por
esta vía de acercamiento a la realidad, por considerarla una mejor opción para
la compresión de la realidad.
La aceptación de la investigación
cualitativa, ha tenido acogida por su carácter flexible, adaptativo y de
apertura a los cambios conforme se avanza
en la investigación.
No obstante, esta investigación
tiene planteado un conjunto de interrogantes, entre ellos la confiabilidad y la
validez. Estos problemas pueden que estén
muy arraigados en la mente de muchos investigadores por la mentalidad
positiva de la que ha sido difícil desprenderse.
Ambos enfoques son validos y
rigurosos; se puede optar por un determinado paradigma o por la
complementariedad de ambos. Lo preciso es que con independencia de la elección
hay que acometerla con rigor.
En el caso de las investigaciones
cualitativas, se pueden utilizar diversas técnicas para obtener la convergencia
de tipo metodológico, sin embargo, exige también sistematización y rigor
metodológico.
La confiabilidad en una
investigación cualitativa depende fundamentalmente de la estandarización de los
registros, en los que se debe partir de una categorización ya elaborada. Kirk y
Miller (1986:7) señalan que existen tres tipos de confiabilidad en la
investigación cualitativa: confiabilidad quijostesca, confiabilidad diacrónica
y confiabilidad sincrónica.
Pérez (1998:78) al referirse a la
clasificación de Kirk y Miller (1986) las define de la siguiente manera:
Confiabilidad quijotesca: se
refiere a las circunstancias en las que un único método de observación da lugar
de forma continuada a una medida invariable. La originan al convertir en
rituales determinadas frases y hechos.
Confiabilidad diacrónica: consiste
en la estabilidad de una observación a través del tiempo que puede comprobarse
al repetir las medidas, pero teniendo en cuenta que sólo tendría utilidad en
aspectos inalterable de un determinado período.
Confiabilidad sincrónica: implica
la semejanza de las observaciones dentro del mismo período de tiempo. Raramente
implica observaciones identificas, sino el hecho de que sean consistentes
respecto a rasgos relevantes. La investigación cualitativa, para lograr altos
índices de confiabilidad, exige la elaboración de registros descriptivos que,
sin caer en la estandarización, ayudan a regular los procesos.
En torno a la validez, esta exige,
según Hansen (1979): Estimación de la medida en que las conclusiones
representan tan efectivamente la realidad empírica y estimación de si los
constructos diseñados representan o miden categorías reales de la experiencia
humana.
En la investigación cualitativa tal
estimación, en opinión de Aguilera (1986) se logra a través de la triangulación, saturación y el contraste con
otros colegas.
La
triangulación implica reunir
una variedad de datos y métodos, para referirlos al mismo tema o problema,
implica que los datos de recojan desde puntos de vista distintos y realizar
comparaciones múltiples de un fenómeno único, de un grupo utilizando
perspectivas diversas y múltiples procedimiento.
Denzin (1979:281), define la
triangulación como la combinación de metodologías en el estudio de un mismo
fenómeno, Denzin (1979:281) destaca en la triangulación el control cruzado
entre diferentes fuentes de datos: personas, instrumentos, documentos o la
combinación de éstos, y Elliott (1990) indica que el principio básico
subyacente en la idea de triangulación es el de recoger observaciones y
apreciaciones de una situación o algún aspecto de ella desde una variedad de
ángulos o perspectivas.
Para recoger la información el
registro de observaciones en fundamental, y ello según lo expresa Delgado y
Polanco (1996:21) es un cuerpo de notas
que permite ir identificando debilidades, fortalezas, inquietudes, confusiones
y/o irregularidades.
Como muy bien lo plantea Le Boterf
(1981), en esta etapa se trata de pasar de un conocimiento cotidiano a un
conocimiento científico y crítico, razón por la cual después de obtener la
información registrada en el cuerpo de notas, se debe proceder a agrupar las
distintas opiniones, comentarios, expresiones y los elementos concretos de la
situación vivida, según las dimensiones categoriales definidas.
Se trata de un esfuerzo dirigido a
facilitar las reflexiones, descubrir relaciones, buscar constantes y
estructuras esenciales del fenómeno objeto de estudio.
En este proceso de búsqueda de
información, existe consenso entre los investigadores en reconocer las bondades
de las técnicas triangulares, en tanto ellas intentan señalar o explicar más
concretamente la riqueza y complejidad del comportamiento humano con el fin de
estudiarlo desde diferentes perspectivas, haciendo uso de datos cualitativos y
cuantitativos.
La triangulación implica un
acercamiento a un problema a través de distintos medios, a continuación las de
mayor uso según Pérez (1998:82):
Triangulación de tiempo: intenta
considerar el factor de cambio y el proceso mediante la utilización de diseño de
cortes a través de secciones y mediante diseños longitudinales para analizar
tendencias a lo largo del tiempo.
Triangulación de espacio: con
técnicas transculturales, trata de vencer el parroquialismo de estudios
efectuando en el mismo país o dentro de la misma subcultura, utilizando
técnicas a través de varias culturas.
Triangulación por niveles de
combinación: emplea más de un nivel de análisis de los tres principales
utilizados en las ciencias sociales, es decir, el nivel individual, el nivel
interactivo (grupos) y el nivel de colectividades y organizacional, cultural o
social.
Triangulación teórica: se basa en
la preferencia de teorías alternativas o competitivas sobre la utilización de
un solo punto de vista. Se emplean diferentes perspectivas coincidentes de un
mismo objetivo.
Triangulación de investigador:
cuando existen varios investigadores para realizar una misma investigación. A
este tipo de triangulación también se le ha denominado como verificación
intersubjetiva. Esta verificación se lleva a cabo por medio del contraste de la
información, pues en la investigación cualitativa un grupo o equipo suele
participar en todo el proceso de investigación; por lo tanto, a través del
debate, el análisis de los datos y el contraste y discusión sobre los mismos,
se logra un cierto grado de credibilidad de la información obtenida. Por
consiguiente, el nivel de objetividad logrado será muy superior al que
caracterizaría un investigador aislado.
Triangulación
de metodología: utiliza el mismo método en diferentes ocasiones o bien
diferentes métodos sobre un mismo objeto de estudio. La triangulación
metodológica se realiza dentro de una colección de instrumentos o entre
métodos.