Seguidores

lunes, 9 de diciembre de 2013

Confiabilidad y validez de los instrumentos


 Por: Delgado de Smith, Yamile, Colombo Leyda y Rosmel Orfila (2002). Conduciendo la Investigación. Editorial Comala. Caracas. 

HECHO CON DEPÓSITO DE LEY
Depósito  legal: If 74520020011017
ISBN: 980-390-022-6

Confiabilidad y validez  de los instrumentos

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en todos los instrumentos de carácter científico para la recogida de datos. En palabras de Pérez (1998:71), si el instrumento o instrumentos reúnen estos requisitos habrá cierta garantía de los resultados obtenidos en un determinado estudio y, por lo tanto, las conclusiones pueden ser creíbles y merecedoras de una mayor confianza.
                                 
Uno de los mayores problemas que se debe evitar, es que la información   obtenida no le permita responder a los objetivos de la investigación. Si los instrumentos no son validados, podrá encontrar una variada información pero sin ninguna articulación con los propósitos y compromisos asumidos en la investigación.

Expertos (Fendel, Kurt, Taylomir, Wintther) aseguran  que la información insuficiente obtenida en las investigaciones está vinculada a la elaboración incoherente e inconsistente de los instrumentos de recopilación de datos. Muy probablemente, no fueron diseñados con agudeza y pensando en todo momento en los objetivos y propósitos de la investigación

Ante tal situación,  deberá realizar nuevos instrumentos de recolección de datos que responda a sus objetivos, y la información que ya tiene de su primer esfuerzo no se pierde y con seguridad serán un apoyo o refuerzo.

Un buen instrumento de recolección de datos o medición debe tener las siguientes cualidades: confiabilidad y validez.

La confiabilidad se refiere al nivel de exactitud y consistencia de los resultados obtenidos al aplicar el instrumento por segunda vez en condiciones tan parecida como sea posible.

Bernal (2000:218) afirma que la pregunta clave para determinar la confiabilidad de un instrumento de medición es:
Si se miden fenómenos o eventos una y otra vez con el mismo instrumento de medición, ¿Se obtienen los mismos resultados u otros muy similares? Si la respuesta es afirmativa, se puede decir que el instrumento es confiable.

Es importante lograr la elaboración de un instrumento que sea confiable. Para ello, existen muchas vías para lograrlo. Si se tratara de un cuestionario, se puede aplicar dos veces a la misma persona en un corto período de tiempo, y seguidamente se utiliza el índice de Bellack:


Indice:      S de los acuerdos x 100___    
             S (acuerdos + desacuerdos)


Se considera que el instrumento es  confiable si el índice de Bellack resultante es superior al umbral arbitrario de 80. Pourtois, J., Desmet, H.(1992:187)   

Esta prueba se aplica a cualquier tipo de variable o dimensión objeto de estudio.

Otra manera para poder determinar si un instrumento es confiable es a  través del cálculo de la medida de estabilidad por la vía del test-retest. En este procedimiento un mismo instrumento es  aplicado en dos oportunidades o más a un mismo grupo de personas, después de cierto período de tiempo. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. El valor de la correlación es un valor ubicado entre el –1 y 1.


            muy baja (0)       baja        regular       aceptable        elevado(1)
            

            No hay confiabilidad                          100% de confiabilidad  


El cálculo de este coeficiente se utiliza para mediciones de variables o dimensiones que responden a una escala de medición de intervalo o razón.

Es importante que para la aplicación de esta prueba, se tome un lapso de tiempo lo suficientemente largo para que los sujetos se olviden de lo que contestaron y, por el otro, no tanto que se produzcan cambios importantes. (Pérez 1998:72). Este tipo de medición se utiliza en investigaciones cuantitativas.

También el Coeficiente alfa de Cronbach permite determinar la confiabilidad; utilizando la fórmula si el resultado es 0.80 o más se considera aceptable el instrumento.



               a = N p*
                       1+p* (N-1)


en donde N es el número de items y p* el promedio de las correlaciones entre ítems.

Para el cálculo de  p*, deberá aplicar:
         
             P*=  SP
                     NP

En donde, SP es la sumatoria de las correlaciones y NP el número de correlaciones no repetidas o no excluidas.

El cálculo del coeficiente de confiabilidad Alfa de Cronbach se utiliza para mediciones de variables o dimensiones que responden a una escala de medición de intervalo o razón.

La confiabilidad también se puede calcular mediante la aplicación de las ecuaciones de Rulon, Guttman, Sperman-Brown, Kuder-Richardson (KD20) para elementeos dicotómicos y (KD21) en el caso de elementos con dificultad similar.

Adicionalmente a la confiabilidad de un instrumento, se debe buscar la validez del mismo. En este sentido, el investigador realizará un esfuerzo dirigido a la elaboración de un instrumento que mida lo que se desea medir.

Salkind (1998:126);  Hernández (1998:242) clasifican la validez en: validez de contenido, validez de criterio y la validez de constructo.

La validez de contenido está representada por  el grado en que una prueba representa el universo de estudio. Por tal motivo, deberán seleccionarse los indicadores e items de tal manera que estos respondan a las características peculiares del objeto de estudio.

La validez de criterio, llamada también validez concurrente es más fácil de estimar, lo único que se debe hacer es correlacionar su medición con el criterio, y este coeficiente se toma como coeficiente de validez. La validez de criterio es una medida del grado en que una prueba está relacionada con algún criterio. Es de suponer que el criterio con el que se está comparando la prueba tiene un valor intrínseco como medida de algún rasgo o característica.

La validez de constructo determina a través del procedimiento de análisis de factores en que medida los resultados de una prueba se  relacionan con constructos. Un constructo es un atributo para explicar un fenómeno.

En el análisis de factores se generan “variables artificiales”, denominadas factores que representan constructos, los factores se obtienen de las variables originales y deben ser interpretadas de acuerdo con éstas. Se trata, de una técnica para explicar un fenómeno completo complejo en atención de unas cuantas variables.

Todos los instrumentos de recolección de datos (cuestionarios, test, escalas, guías de observación, pruebas de conocimiento, etc.) debe precisar de la validez de contenido, y ésta consiste en hacer una revisión profunda de cada ítem que estructuran el instrumento.

Para Aroca, A. (1999: 29), la validez de contenido,


denominada también “lógica” o de “muestreo”.  Se refiere básicamente al contenido del instrumento, al hecho de que el instrumento contenga en sus elementos o ítem  todos y sólo los aspectos que, de acuerdo a los objetivos de la investigación, sea necesario (sic) averiguar para el logro de los mismos.

Este procedimiento de carácter lógico-racional es determinante en la configuración del instrumento, pues a través del mismo se desechan ítem o aspectos irrelevantes que de una u otra manera restan sentido razonado a la intención concreta de búsqueda de datos; por otra parte, la validez de contenido permite redimensionar aquellos ítem que en su primera versión se consideran confuso o presentan errores de sintaxis y/o semántica y que, una vez corregidos las disyuntivas a las que diera lugar, permitan obtener los datos e informaciones que se encuentran especificada en cada uno de los propósitos de la investigación.

De esta manera, la validez de contenido es un procedimiento al que no puede obviarse cuando se tiene el objetivo certero de realizar una investigación de gran envergadura, y en el caso muy particular de la Gerencia de Recursos Humanos, los instrumentos de recolección de datos  han de condensar suficientes ítem  como para poder apreciar de una manera totalizadora los aspectos, factores y variables que se conjugan para estructurar el fenómeno objeto de estudio.
Debe tenerse siempre presente que el investigador del área de Recursos Humanos tiene ante su mirada de inquisidor científico un universo de sujetos cuyas actuaciones se corresponden con representaciones subjetivas y las mismas son objetivadas en actos y redes de actos los cuales se constituyen en los posibles escenarios susceptibles de ser captados a través de medios instrumentales diseñados para fines bien definidos.

Así, de lo que se trata es de advertir que los fenómenos sociales son de una complejidad tal que todo investigador que se aventure a su aprehensión debe disponer de instrumentos de recolección de datos bien construidos, y es por ello que la validez de contenido está destinada a darle coherencia y sistematicidad a los ítems que conforman el instrumento diseñado.

Al decir de Aroca, A. (1999: 269), El método que más se utiliza para estimar la validez de contenido es el denominado Juicio de Expertos, el cual consiste en seleccionar un número impar (3 o 5) de jueces (personas expertas o muy conocedoras del problema o asunto que se investiga). quienes tienen la labor de leer, evaluar y corregir cada uno de los ítems  del instrumento so pretexto de que los mismos se adecuen directamente con cada uno de los objetivos de la investigación propuestos.

De acuerdo con las reflexiones de la autora antes citada, se consideran expertos o jueces aquellos sujetos que reúnan las siguientes consideraciones:

a.- Formación académica en el área y rama del quehacer científico al que diera lugar;
b.- Comprobada trayectoria experiencial de investigaciones realizadas en institutos y centros destinados para fines bien definidos;
c.- Desarrollo de una línea (o líneas) de investigación relacionada a intereses académicos;
d.- Poseer una amplia concepción epistemológica de la ciencia y de la investigación; y,
e.- Demostrar pleno dominio de la lengua castellana, pues la sintaxis, la semántica y la sindéresis son aspectos determinantes para dar forma interna y externa al instrumento.

Tomando como base estas características que se consideran las más deseables que debe tener un experto encargado de validar los instrumentos de recolección de datos, se hace saber que la validez de contenido permite al sujeto investigador lograr la aprehensión lo más objetiva posible de la esencia de los hechos y fenómenos que estudia, es decir, se establece un perfecto relacionamiento entre los propósitos de la investigación y el alcance en el campo real donde se experimentan los acontecimientos.
Ahora bien, ¿de qué manera procede un experto para validar los instrumentos de recolección de datos?

Una vez que se diseña el instrumento de recolección de datos a partir del desglosamiento de los objetivos específicos en su factor, definición, dimensiones e indicadores, el producto materializado en dicha herramienta se corresponde con lo que muy bien puede llamarse una primera versión, pues como se ha especificado antes debe procederse con la “calibración” donde el juicio de experto se corresponde con una de ellas.

En manos del experto, la primera versión del instrumento sufrirá cambios superficiales o profundos, los cuales son importantes que sean considerados por el investigador so pretexto de que el instrumento de recolección de datos alcance la configuración y calidad deseada.  Dichos cambios pueden ser de índole de contenido, de redacción-semántica, sindéresis, correspondencia con los objetivos planteados, pertinencia con el tipo de investigación, relación estrecha con una realidad concreta.

Para proceder a la validación por juicio de expertos, es importante tener a la mano un instrumento / formato diseñado exclusivamente para servir de guía operativa a los especialistas, quienes lo emplearán para evaluar y valorar la primera versión del instrumento de recolección de datos.

Los autores de la presente obra sugieren tomar en cuenta los siguientes aspectos a los fines de realizar el formato guía para validación por parte del experto:

1.- Elaborar una carta dirigida al experto,  a continuación un ejemplo:

Respetado experto, a continuación se le está proporcionando un instrumento cuyo propósito consiste en que Usted lea, evalúe y corrija cada ítem que conforma el instrumento de recolección de datos.  Dichas correcciones son de vital importancia para dar la configuración y calidad definitiva al mismo antes de su aplicación a la muestra de sujetos seleccionados para los fines específicos de la investigación.

Sin más a que hacer referencia, y confiados en que sus observaciones serán de gran utilidad, se suscriben de Usted,

2.- Solicitar datos del experto, a continuación un ejemplo:

Nombre y Apellido
Cédula de Identidad
Institución donde trabaja
Título (s) de Pregrado
Título (s) de Postgrado
Publicaciones

3.- Suministrar al experto los datos básicos de la investigación, a saber:

Título de la Investigación
Objetivo General
Objetivos Específicos
Variables o dimensiones  que se pretenden medir
Tipo de Investigación
Población  objeto de Estudio

4.- Especificar los aspectos a considerar para la valoración de cada Ítem:

Redacción
Pertinencia con los objetivos
Pertinencia con el tipo de investigación

5.- Retroalimentación del Experto:

Solicitar al experto que por escrito, emita sus opiniones en torno aquellos aspectos que se deben mantener y los que sugiere modificar y/o incorporar, indicando lugar y fecha de realización.


Anteriormente se explicó que el investigador que pretender validar el instrumento a través de Juicio de Experto debe proceder con 3 o 5 jueces. Una vez que los jueces proceden a examinar y evaluar cada ítem, se comparan los resultados; realizado este procedimiento, se integran las correcciones y sugerencias a través de las cuales se determina el instrumento definitivo el cual se aplicará a la muestra de sujetos seleccionados.

Para quienes elaboran instrumento, Thomas Kuhn (1971:73) señala que el hombre que  construye un instrumento para determinar las longitudes de ondas ópticas no deberá estar satisfecho con un equipo que se limite a atribuir números determinados a líneas espectrales particulares. No es solo un explorador o un medidor, sino que por el contrario, mediante el análisis de su aparato, deberá mostrar en términos del cuerpo establecido de teoría óptica, que los números que muestra su instrumento son los que corresponden en la teoría como los de longitud de ondas.

En Ciencias Sociales,  la investigación de carácter cualitativo ha adquirido una gran relevancia desde la mitad del siglo XX, y son muchos los   investigadores sociales que se suman por esta vía de acercamiento a la realidad, por considerarla una mejor opción para la compresión de la realidad.

La aceptación de la investigación cualitativa, ha tenido acogida por su carácter flexible, adaptativo y de apertura a los cambios conforme se avanza  en la investigación.

No obstante, esta investigación tiene planteado un conjunto de interrogantes, entre ellos la confiabilidad y la validez. Estos problemas pueden que estén  muy arraigados en la mente de muchos investigadores por la mentalidad positiva de la que ha sido difícil desprenderse.
Ambos enfoques son validos y rigurosos; se puede optar por un determinado paradigma o por la complementariedad de ambos. Lo preciso es que con independencia de la elección hay que acometerla con rigor.

En el caso de las investigaciones cualitativas, se pueden utilizar diversas técnicas para obtener la convergencia de tipo metodológico, sin embargo, exige también sistematización y rigor metodológico.

La confiabilidad en una investigación cualitativa depende fundamentalmente de la estandarización de los registros, en los que se debe partir de una categorización ya elaborada. Kirk y Miller (1986:7) señalan que existen tres tipos de confiabilidad en la investigación cualitativa: confiabilidad quijostesca, confiabilidad diacrónica y confiabilidad sincrónica.

Pérez (1998:78) al referirse a la clasificación de Kirk y Miller (1986) las define de la siguiente manera:

Confiabilidad quijotesca: se refiere a las circunstancias en las que un único método de observación da lugar de forma continuada a una medida invariable. La originan al convertir en rituales determinadas frases y hechos.

Confiabilidad diacrónica: consiste en la estabilidad de una observación a través del tiempo que puede comprobarse al repetir las medidas, pero teniendo en cuenta que sólo tendría utilidad en aspectos inalterable de un determinado período.

Confiabilidad sincrónica: implica la semejanza de las observaciones dentro del mismo período de tiempo. Raramente implica observaciones identificas, sino el hecho de que sean consistentes respecto a rasgos relevantes. La investigación cualitativa, para lograr altos índices de confiabilidad, exige la elaboración de registros descriptivos que, sin caer en la estandarización, ayudan a regular los procesos.

En torno a la validez, esta exige, según Hansen (1979): Estimación de la medida en que las conclusiones representan tan efectivamente la realidad empírica y estimación de si los constructos diseñados representan o miden categorías reales de la experiencia humana.

En la investigación cualitativa tal estimación, en opinión de Aguilera (1986) se logra a través de la triangulación, saturación y el contraste con otros colegas.

La triangulación implica reunir una variedad de datos y métodos, para referirlos al mismo tema o problema, implica que los datos de recojan desde puntos de vista distintos y realizar comparaciones múltiples de un fenómeno único, de un grupo utilizando perspectivas diversas y múltiples procedimiento.

Denzin (1979:281), define la triangulación como la combinación de metodologías en el estudio de un mismo fenómeno, Denzin (1979:281) destaca en la triangulación el control cruzado entre diferentes fuentes de datos: personas, instrumentos, documentos o la combinación de éstos, y Elliott (1990) indica que el principio básico subyacente en la idea de triangulación es el de recoger observaciones y apreciaciones de una situación o algún aspecto de ella desde una variedad de ángulos o perspectivas.

Para recoger la información el registro de observaciones en fundamental, y ello según lo expresa Delgado y Polanco (1996:21)  es un cuerpo de notas que permite ir identificando debilidades, fortalezas, inquietudes, confusiones y/o irregularidades.

Como muy bien lo plantea Le Boterf (1981), en esta etapa se trata de pasar de un conocimiento cotidiano a un conocimiento científico y crítico, razón por la cual después de obtener la información registrada en el cuerpo de notas, se debe proceder a agrupar las distintas opiniones, comentarios, expresiones y los elementos concretos de la situación vivida, según las dimensiones categoriales definidas.

Se trata de un esfuerzo dirigido a facilitar las reflexiones, descubrir relaciones, buscar constantes y estructuras esenciales del fenómeno objeto de estudio.

En este proceso de búsqueda de información, existe consenso entre los investigadores en reconocer las bondades de las técnicas triangulares, en tanto ellas intentan señalar o explicar más concretamente la riqueza y complejidad del comportamiento humano con el fin de estudiarlo desde diferentes perspectivas, haciendo uso de datos cualitativos y cuantitativos.

La triangulación implica un acercamiento a un problema a través de distintos medios, a continuación las de mayor uso según Pérez (1998:82):

Triangulación de tiempo: intenta considerar el factor de cambio y el proceso mediante la utilización de diseño de cortes a través de secciones y mediante diseños longitudinales para analizar tendencias a lo largo del tiempo.

Triangulación de espacio: con técnicas transculturales, trata de vencer el parroquialismo de estudios efectuando en el mismo país o dentro de la misma subcultura, utilizando técnicas a través de varias culturas.

Triangulación por niveles de combinación: emplea más de un nivel de análisis de los tres principales utilizados en las ciencias sociales, es decir, el nivel individual, el nivel interactivo (grupos) y el nivel de colectividades y organizacional, cultural o social.

Triangulación teórica: se basa en la preferencia de teorías alternativas o competitivas sobre la utilización de un solo punto de vista. Se emplean diferentes perspectivas coincidentes de un mismo objetivo.

Triangulación de investigador: cuando existen varios investigadores para realizar una misma investigación. A este tipo de triangulación también se le ha denominado como verificación intersubjetiva. Esta verificación se lleva a cabo por medio del contraste de la información, pues en la investigación cualitativa un grupo o equipo suele participar en todo el proceso de investigación; por lo tanto, a través del debate, el análisis de los datos y el contraste y discusión sobre los mismos, se logra un cierto grado de credibilidad de la información obtenida. Por consiguiente, el nivel de objetividad logrado será muy superior al que caracterizaría un investigador aislado. 

Triangulación de metodología: utiliza el mismo método en diferentes ocasiones o bien diferentes métodos sobre un mismo objeto de estudio. La triangulación metodológica se realiza dentro de una colección de instrumentos o entre métodos.


Fuente:  Delgado de Smith, Yamile, Colombo Leyda y Rosmel Orfila (2002). Conduciendo la Investigación. Editorial Comala. Caracas.