martes, 15 de abril de 2008

INVESTIGACIÓN (5) El trabajo de la investigación

IV El trabajo de la investigación[1]

“El buen investigador ha de tener a la vez ideas nuevas, buena información y buena técnica de trabajo. A los malos investigadores les falta siempre uno por lo menos de esos tres requisitos”.

Pedro Laín Entralgo

4.1. Lo que es y que no es investigación

La investigación es un quehacer difícil, pero como cualquier tarea desafiante bien realizada, tanto el proceso como los resultados aportan una inmensa satisfacción personal. Además, la investigación y su comunicación son también actos sociales que requieren que reflexione profundamente acerca de la manera en que su trabajo se vincula con sus lectores, acerca de su responsabilidad no sólo hacia su tema y usted mismo, sino también hacia ellos, en especial si cree que tiene algo que decir lo suficientemente importante como para hacer que los lectores modifiquen su vida al cambiar lo que piensan y cómo lo hacen.

La investigación es un proceso por el cual se descubren nuevos conocimientos. Una teoría de la motivación o el desarrollo local, por ejemplo, nos ayuda a organizar información nueva en un cuerpo coherente, un conjunto de ideas relacionadas que explican sucesos que han ocurrido y predicen eventos que ocurrirán.

La investigación se caracteriza por varios atributos distintos:

a) Se basa en el trabajo de otros

b) Se puede repetir

c) Se puede generalizar a otras situaciones

d) Se basa en algún razonamiento lógico y está vinculado a una teoría

e) Genera nuevas preguntas o es de naturaleza cíclica

f) Es incremental

En primer lugar, la investigación es una actividad basada en el trabajo de otros investigadores. Esto no quiere decir que debemos copiar el trabajo de otros, sino que siempre debemos examinar los trabajos que ya se han hecho para tener una base sobre la cual realizar nuestro propio trabajo. Por ejemplo, si se han realizado 200 estudios sobre el impacto de las tecnologías de información y comunicación en municipalidades, no debemos hacer caso omiso de esos estudios. Quizá no queremos repetir ninguno de esos estudios, pero ciertamente debemos tener en cuenta las metodologías que se utilizaron y los resultados que se obtuvieron al planear nuestras propias investigaciones en el área.

En segundo lugar, la investigación es una actividad que puede repetirse. Si alguien realiza un estudio de investigación que examina la relación entre la capacidad para resolver problemas y el talento musical, los resultados del experimento deberán repetirse por dos razones. Uno de los rasgos distintivos de cualquier hallazgo científico es que puede repetirse. Segundo, si los resultados de un experimento puede repetirse, esto significa que pueden servir como base para investigaciones adicionales en la misma área.

En tercer lugar, la buena investigación se puede generalizar a otras situaciones. Esto significa por ejemplo, que si se averigua que el electorado son especialmente susceptibles a la presión de los medios, especialmente de los noticiarios, los resultados probablemente seguirán siendo válidos en una situación diferente, pero relacionada con lo anterior. Es decir, los resultados de casi todas las investigaciones pueden aportar al menos algo a otras situaciones.

Cuarto, la investigación se basa en algún razonamiento lógico y está vinculado a una teoría. Las ideas de investigación no son autosuficientes, tan sólo como preguntas interesantes. Más bien, la actividad de investigación proporciona respuestas a preguntas que ayudan a llenar los huecos de lo que puede ser un gran rompecabezas grande y complejo.

Quinto, la investigación genera nuevas preguntas y es de naturaleza cíclica. Las experiencias de los investigadores, que las respuestas a las preguntas de investigación que se hicieron en un primer momento fueron la base para las preguntas de diversas investigaciones realizadas posteriormente.

Sexto, la investigación es incremental (es decir, que va creciendo con base en lo que ya se tiene) Ningún científico se para solo; todos se paran sobre los hombros de otros. Las contribuciones por lo regular se hacen en fragmentos pequeños, fáciles de definir. El primer estudio sobre desarrollo local no contestó todas las preguntas, ni tampoco el último. Más bien, todos los estudios en un área dada se unen para producir un cuerpo de conocimiento que diferentes investigadores comparten y que proporcionan las bases para investigaciones subsecuentes.

Sí estos atributos generales que hemos planteado que caracterizan a la buena investigación ¿qué es una mala investigación? Esta respuesta se la dejamos a usted...

4.2. Un modelo de investigación

Todas las buenas investigaciones tienen algo en común. El trabajo se llevó a cabo ajustándose a pautas que permitieron a los investigadores ir del punto A al punto Z sin perder la confianza de que estaban en el camino correcto para encontrar una respuesta adecuada a las preguntas que habían planteado. Lo que comparten es una secuencia estándar de pasos para formular y contestar una pregunta. Dicha secuencia recibe el nombre de método científico.

Para graficar utilizaremos un interesante y estimulante tema que actualmente está desarrollando Filomena Urbina, candidata a Magíster en Educación de la Universidad ARCIS, de la ciudad de Graneros.[2] Ella está trabajando el tema “los efectos de la televisión sobre los niños y niñas”, como ejemplo de los distintos pasos del modelo.

4.2.1. Planteamiento de la pregunta

Es común el dicho que dice “Casi todo el mundo comienza por el principio...”, que también se puede aplicar a casi cualquier empresa científica. Entonces nuestro primer paso, y el más importante, es hacer una pregunta “Me pregunto qué sucedería si... o identificar una necesidad (Tenemos que encontrar una manera de ...) Por ejemplo, podría intrigarnos la forma en que ver televisión afecta el desarrollo de las habilidades de lenguaje de los niños y niñas. También podríamos sentir la necesidad de averiguar cuál sería la forma más eficaz de utilizar la televisión para educar a niños y adultos acerca de los peligros de la violencia. Las preguntas pueden ser tan amplias como indagar acerca de los efectos de la televisión sobre el desarrollo del lenguaje, o tan específicas como la relación entre el contenido de ciertos anuncios de televisión y los hábitos de compra de los adolescentes. Sea cual sea su contenido y su profundidad, las preguntas son el primer paso en cualquier investigación.

4.2.2. Identificar los factores importantes

Una vez planteada la pregunta, el siguiente paso es identificar los factores que habría que examinar para contestar la pregunta. Los factores podrían ser muy sencillos como la edad de los niños y niñas o su condición socioeconómica, o medidas más complicadas de los efectos que los dibujos animados violentos tienen sobre el comportamiento del niño.

El revisar las diversas investigaciones del Consejo Nacional de Televisión (www.cntv.cl) implementadas en los últimos años y los revisados por la alumna candidata a magíster nos encontramos con los siguientes factores:

a) Edades de los niños y niñas

b) Grado de violencia en los programas

c) Etapa del desarrollo cognoscitivo del niño y niña

d) Actitudes del productor

e) Expresión facial

f) Toma de decisiones

g) Descripción de los patrones de ver televisión, hecha por la madre

h) Estimulación emocional

i) Diferencias sociales en la respuesta a los diversos programas de televisión

j) Patrones de comunicación familiar

Y, eso es sólo el 10% de los temas que podrían explorarse, cada uno de los cuales definen factores importantes. Pero, de todos los factores que podrían ser importantes y que nos ayuden a entender mejor los efectos de la Televisión, ¿Cuáles deberíamos escoger como foco? En general, conviene seleccionar factores que:

a) No se hayan investigado antes

b) Contribuyan al entendimiento de la pregunta planteada

c) Sean susceptibles de investigarse

d) El investigador tenga una experiencia o sustento teórico sobre lo que va a investigar. A parte de tener algún interés personal

e) ¡Conduzcan a otras preguntas!

Si ya de por sí es difícil definir la naturaleza del problema que se desea estudiar, no hablemos de generar preguntas que lleven a nuevas preguntas.

4.2.3. Formulación de una hipótesis

Surge una hipótesis cuando las preguntas se transforman en declaraciones que expresan las relaciones entre variables como un enunciado del tipo “Si... entonces”

Por ejemplo, si la pregunta es “¿Qué efectos tienen sobre los niños y niñas ver violencia en la televisión?, la hipótesis podría ser. “Los muchachos que ven actos agresivos en los dibujos animados durante las horas de mayor audiencia tienen una probabilidad más alta de exhibir comportamientos agresivos inmediatamente después de la sesión de televisión, que los niños y niñas que ven actos no agresivos en los programas del horario de mayor audiencia”. Varias características hacen que algunas hipótesis sean mejores que otras, ya profundizaremos más adelante. Por ahora, debemos tener presente que una hipótesis es una extensión objetiva de la pregunta que se planteó originalmente.

4.2.4. Recopilación de la información pertinente

La hipótesis deben plantear una relación clara entre diferentes factores como ver televisión y un comportamiento agresivo en los hombres. Esa es la tarea de la hipótesis. Una vez formulada una hipótesis, el siguiente paso es obtener información o datos empíricos que confirmen o refuten la hipótesis. Si estamos interesados en saber si ver programas violentos de televisión causa o no causa un comportamiento agresivo, es necesario recabar datos de tal índoles que permitan probar la hipótesis. Por ejemplo, podríamos recopilar dos tipos de datos para probar la hipótesis antes mencionada. El primero podría ser el número de actos violentos en un segmento de una hora del horario televisivo de máxima audiencia. El segundo podría ser el número de comportamientos agresivos observados en niños y niñas que miraron el programa y el número de tales actos en niños que no miraron el programa. Un punto importante respecto a someter a prueba la hipótesis es que un buen científico busca probarlas, no necesariamente demostrarlas. Otro punto importante, que no encontrar apoyo para una hipótesis sólo significa que hay más preguntas que hacer o que es preciso reformular las preguntas que se hicieron.

4.2.5. Prueba de la hipótesis

¿Basta simplemente con recabar datos relacionados con los fenómenos que se estudian? De ninguna manera. ¿Qué tal si usted ya terminó de recopilar datos y encuentra que los niños y niñas que vieron programas de televisión agresivos durante el horario de máxima audiencia exhiben 4,8 actos agresivos en el periodo de una hora después de la exposición, y que los niños y niñas que miraron el programa no agresivo exhibieron en promedio 2,2 actos? ¿Cuál sería su conclusión? Por un lado, podría decir que los niños y niñas que miraron los programas agresivos mostraron más del doble de agresividad. Por otra parte, podríamos decir que la diferencia entre los dos promedios no es lo bastante significativa como para llegar a una conclusión. Para afirmar que ver el segmento de televisión agresivo fue en verdad determinante, tendríamos que observar una diferencia mucho mayor. ¿Es esto un dilema insoluble? De ninguna manera. Aquí entra en acción la estadística que tiene un conjunto de herramientas que permiten a los investigadores separar los efectos de un factor aislado (como ver televisión agresiva o no agresiva) de las diferencias entre grupos que podrían deberse a algún otro factor o sencillamente al azar. Por ejemplo: ¿Qué tal si uno de los niños que no miró el segmento agresivo anda de malas ese día y decide darle un golpe a su mejor amigo? ¿O si uno de los muchachos que miró el segmento agresivo está cansado y simplemente no tiene ganas de jugar? Lo que hacen las herramientas es ayudarnos a separar los efectos de los factores que estamos estudiando de otros factores no relacionados.

4.2.6. Trabajo con las hipótesis:

Ahora bien, la recopilación de los datos podrían confirmar o refutar la hipótesis. En cualquier caso el camino está claro. Si se obtuvo confirmación, ya sabe que, como se había sugerido, los factores tienen una relación entre sí y son conceptualmente importantes. Si la hipótesis no se confirmó, bien puede ser una oportunidad para aprender algo que antes no se sabía. En el ejemplo que usamos antes, esto significaría que mirar segmentos televisivos con modelos agresivos por sí sólo no causa un comportamiento agresivo por parte de los niños y niñas.

4.2.7. Reconsideración de la teoría

La teoría es una serie de enunciados que predicen cosas que ocurrirán en el futuro y explican cosas que han ocurrido en el pasado. Pero la naturaleza misma de las teorías es que pueden modificarse según los resultados de investigaciones basadas en los mismos supuestos en los que se basa la teoría. Por ejemplo, un enfoque específico para entender el desarrollo de niños y adultos se denomina teoría del aprendizaje social, que da especial importancia al papel del modelamiento y del aprendizaje vicario o indirecto. Según esta teoría, la exposición a un comportamiento agresivo daría pie a un comportamiento agresivo, una vez que el entorno contiene los mismos tipos de indicios que estaban presentes cuando se observó el modelo agresivo inicial (como personajes agresivos de dibujos animados). Si se confirma la hipótesis de que observar tales modelos aumenta la agresión, habremos añadido otro bloque de construcción, otra prueba a la teoría del aprendizaje social.

4.2.8. Hacer nuevas preguntas

En todo caso, el último paso de este modelo simplificado de investigación científica es hacer una nueva pregunta. Ésta podría ser una sencilla variación sobre el tema. Por ejemplo: ¿Qué tanta exposición a los modelos agresivos es necesaria para los niños y niñas comiencen a modelar el comportamiento?

4.3. Diferentes tipos de investigación

Más o menos sabemos qué es la investigación y cómo funciona el proceso de investigar. Es hora de poner nuestra atención en una descripción y en ejemplos de diferentes tipos de métodos de investigación y de la clase de preguntas que plantean. Planteamos que los métodos de investigación difieren principalmente en dos dimensiones: la naturaleza de la pregunta que se hace y el método empleado para contestarla. Siguiendo con nuestro ejemplo: Si lo que nos interesa son los efectos de la televisión en los niños, su investigación puede ser no experimental, reseñando los hábitos de ver televisión, o experimental, exponiendo niños a ciertos modelos y observando el efecto de la exposición sobre su comportamiento.

4.3.1. Investigación no-experimental

La investigación no experimental incluye diversos métodos que describen relaciones entre variables. La distinción importante entre los métodos no experimentales y los demás que mencionaremos posteriormente es que los métodos de investigación no experimentales no establecen, ni pueden probar, relaciones causales entre variables. Por ejemplo, si quisiéramos reseñar el comportamiento de ver televisión de los niños y niñas, podríamos hacerlo pidiéndoles mantener un diario en el que anotaran lo que ven y con quién lo ven. Semejante estudio descriptivo proporcionaría información acerca de sus hábitos de ver televisión pero nada dice acerca de por qué ven lo que ven. No estamos tratando de influir de manera alguna sobre su comportamiento al ver televisión ni investigar por qué podrían ver ciertos programas. La naturaleza de esta investigación es no experimental porque no se están haciendo hipótesis respecto a relaciones de causa y efecto de ningún tipo.

4.3.2 Investigación descriptiva

La investigación reseña las características de un fenómeno existente. Los censos nacionales son investigaciones descriptivas, lo mismo que cualquier encuesta que evalúe la situación actual de cualquier aspecto, desde el número de TV en las casas de una comuna hasta el número de adultos de más de 60 años que tienen bisnietos. ¿Qué puede hacerse con esta información? Obtener una imagen más amplia de un fenómeno que nos podría interesar explorar. Por ejemplo, si a usted le interesa aprender más acerca del proceso de lectura en los niños, podría consultar documentos publicados por las autoridades de educación u organismos del ramo. Por ejemplo, podría existir un documento que resuma el aprovechamiento en cuanto a la lectura de niños de diferentes grupos de edades. O bien, las estadísticas para conocer la tasa desempleo actual y cuántos padres o madres que trabajan y no tienen cónyuges tienen hijos de menos de 5 años de edad. La investigación descriptiva exige este tipo de información.

4.3.3. Investigación histórica

La investigación histórica relaciona sucesos del pasado con otros acontecimientos de la época o con sucesos actuales. Básicamente, la información histórica contesta la pregunta ¿Cuál es la naturaleza de los acontecimientos que han ocurrido en el pasado? Todo esto requiere el trabajo de detective de un historiador para hallar y recopilar datos pertinentes y luego, al igual que en cualquier otro empeño de investigación, probar una hipótesis. De hecho, lo mismo que cualquier otro investigador, recaba datos, los analiza y llega a conclusiones acerca de qué tan defendible es su hipótesis. Una diferencia significativa entre la investigación histórica y otros tipos de investigaciones está en el tipo de datos recabados y le método para recopilarlo.

4.3.4. Investigación correlacional

Las investigaciones descriptiva e histórica proporcionan una imagen de los sucesos que están ocurriendo o que han ocurrido en el pasado. En muchos casos los investigadores desean ir más allá de la mera descripción para analizar la relación que podría existir entre ciertos sucesos. El tipo de investigación que con mayor probabilidad respondería a preguntas a acera de la relación que podrían existir entre ciertos sucesos. Una diferencia de la investigación correlacional respecto de las investigaciones descriptivas e históricas, es que proporciona indicios de la relación que podría existir entre dos o más cosas, o de qué tan bien uno o más datos podrían predecir un resultado especifico. Sí a usted le interesara encontrar la relación entre el número de horas que los estudiantes de primer año del magíster a distancia estudian y su promedio de calificaciones, estaría realizando una investigación correlacional porque lo que le interesa es la relación entre estos dos factores. Uno de los puntos centrales de la investigación correlacional es que examina relaciones entre variables pero de ningún modo implica que una es la causa de la otra.

4.3.5. Investigación experimental

Ya sabemos que la investigación correlacional puede ayudar a establecer la presencia de una relación entre variables pero sin darnos alguna razón para creer que existe una relación causal entre ellas. ¿Cómo averiguamos si ciertas características, comportamientos o sucesos están relacionados de tal manera que la relación es causal? Hay dos tipos de investigación que pueden contestar esa pregunta. La primera es la investigación cuasiexperimental y la segunda es la investigación experimental. La única forma de establecer una verdadera relación de causa y efecto en cualquier estudio es aislar y eliminar todos los factores que podrían ser la causa de un resultado en particular y probar tan sólo los que se quiere medir directamente.

La investigación experimental es aquella en la que los participantes se asignan a un grupo con base en algún criterio determinado que suele llamarse variable de tratamiento. Por ejemplo, supongamos que a usted le interesa comparar los efectos de dos técnicas distintas de intervención social. La primera técnica incluye la intervención y la segunda no. Una vez que se han asignado los adultos a grupos y que han concluido los programas, usted querrá buscar cualesquier diferencia entre los dos grupos en cuanto a los efectos de la intervención social. Este es el entorno ideal para establecer una relación de causa y efecto, porque se ha definido con claridad la posible causa (si en realidad produce efecto) y se puede vigilar lo que ésta sucediendo. Pero lo más importante es que se tiene el control total sobre la intervención. En un estudio cuasiexperimental, no se tiene un grado tan alto de control, porque la gente ya se ha asignado indirectamente a los grupos (por clase social, abuso, género, y tipo de daño) para los cuales se están probando los efectos. En la investigación cuasiexperimental los participantes se asignan a grupos con base en alguna característica o cualidad que estas personas aportan al estudio. Ejemplo de ello es la diferencias de sexo, edad, grado escolar, vecindario, tipo de trabo e incluso experiencias. Estas asignaciones a grupos ocurren antes de iniciarse el experimento, y el investigador no puede controlar quién pertenece a cada grupo.

Digamos que a usted le interesa la intención de votos en función de una comuna. No es posible cambiar a la comuna en el que la gente vive, pero sí podemos usar el método cuasiexperimental para establecer una relación causal entre el lugar de residencia y las intenciones de voto. Dicho de otro modo, si averiguamos que el patrón de voto y el lugar de residencia están relacionados, podemos decir con cierto grado de confianza que el lugar en que alguien reside tiene cierta relación causal con la forma en que esa persona vota.

4.4. El proceso de investigación

4.4.1. Las variables

La palabra variable tiene varios sinónimos, como cambiante o inestable. Una variable es un sustantivo, no un adjetivo, y representa una clase de resultados que pueden asumir más de un valor. Por ejemplo, el color del pelo es una variable que pueden adoptar los valores de castaño, negro, rubio, y en nuestros días verde, anaranjado, morado. Otras variables serían las alturas (alto o bajo), peso (60 kilos o 70 kilos), edad de vacunación (6 semanas o 18 meses), número de palabras recordadas, ausencia del trabajo, afiliación a un partido, etc. Lo único que estos rasgos tienen en común es que la variable (como afiliación a un partido) puede tomar cualquiera de varios valores (demócrata cristiano, radical, socialistas, comunista, de renovación nacional, etc.)

Resulta interesante destacar que variables que podrían tener el mismo nombre no sólo pueden asumir valores distintos, podríamos medir la estatura en centímetros (170 cm) o por rango (el más alto), sino también definirse de diferente manera, dependiendo de muchos factores, como el propósito de la investigación o las características de los participantes. Por ejemplo, la variable llamada inteligencia. Para unos investigadores la definición podría ser los porcentajes del SIMCE, para otros podría el puntaje obtenido en la Batería de Evaluaciones Kaufmann. También otros utilizarían la definición de Howard Gardner, quien cree en la existencia de inteligencia múltiples, etc. Todas estas variables representan el mismo constructo general de inteligencia, evaluado de diferentes maneras.

4.4.2. Variables dependientes

Una variable dependiente es la que refleja los resultados de un estudio de investigación. Por ejemplo. Si estamos examinando el efecto, el grado de participación escolar de los padres sobre las calificaciones de los niños, las calificaciones recibidas por los niños y niñas se considerarían una variable dependiente. Podemos pensar en las variables dependientes como los resultados que podrían depender del tratamiento experimental o de lo que el investigador modifica.

4.4.3. Variables independientes

Una variable independiente representa los tratamientos o condiciones que el investigador controla para probar sus efectos sobre algún resultado. Las variables independientes también se denomina variables de tratamiento, y es tal vez dentro de este contexto que más se usa el término. Una variable independiente se manipula en el curso de la investigación a fin de entender los efectos de tal manipulación sobre la variable dependiente. Por ejemplo, podríamos probar la efectividad de tres diferentes programas de lectura sobre habilidades de lectura de los niños.

Método para enseñar a leer

(variable independiente)

Método a Método b Método c

(con psicopedagoga) (con psicopedagoga (sin psicopedagoga

y recompensa) ni recompensa)

Calificaciones calificaciones calificaciones

De lectura de lectura de lectura

Variable dep. Variable dep. Variable depen.

Este esquema nos está planteando que el experimento incluye tres niveles de una variable independiente y una variable dependiente.

Demos otro ejemplo ¿Qué tal si quisiéramos investigar si existe o no una diferencia entre hombres y mujeres en sus calificaciones de Métodos Cuantitativos y Cualitativos en el Magíster de Ciencia Sociales? En este ejemplo, la variable independiente es el género masculino o femenino. Y la variable resultante o dependiente es la calificación de la asignatura. La regla general a seguir es cuando el investigador manipula algo o asigna participantes a grupos con base en alguna características, como edad, grupo étnico o tratamiento, es la variable independiente. Cuando el investigador examina algún resultado para determinar si el agrupamiento tuvo algún efecto, está examinando la variable dependiente. En algunos casos, cuando el investigador no le interesa determinar los efectos de una cosa en otra, sino sólo las relaciones entre variables, no hay variables independientes. Por ejemplo, si sólo nos interesa la relación entre la cantidad de tiempo que un padre separado dedica a estar con sus hijos y su desempeño en el trabajo, no estamos manipulando nada. Puesto que las variables independientes deben asumir más de un valor (pues son variables), cada una debe tener por lo menos dos niveles o valores. Por ejemplo, si estudia los efectos de las diferencias de género (variable independiente) sobre el desarrollo del lenguaje (la variable dependiente), la variable independiente tiene dos niveles: masculino y femenino.

¿Qué sucede si tenemos más de una variable independiente? Examine el siguiente esquema que representa un diseño factorial en el que el género, la edad y la clase social son variables independiente. Los diseños factoriales son experimento que incluyen más de una variable independiente. Aquí hay dos niveles de género, tres niveles de edad, y tres niveles de clase social, para dar un diseño de 2 por 3 por 3, o un total de 18 combinaciones de distintas celdas, de niveles de variables independientes. Es evidente que a medida que se añaden variables independientes a un diseño de investigación, el número total de celdas puede aumentar rápidamente.

Género

Masculino

Femenino

Edad Clase Social

Baja

Media

Alta

Baja

Media

Alta

20-29

30-49

50-59

4.4.4. Otros tipos de variables

Las variables independientes y dependientes son los dos tipos de variables que manejaremos con mayor frecuencia. Sin embargo, existen otras variables que es importante que conozca, porque el entendimiento de qué son y cómo aportan al proceso de investigación:

a) Variable de control: Es una que podría tener influencia sobre la variable dependiente. Por tanto, es necesario eliminar o controlar tal influencia. Por ejemplo, si nos interesa examinar la relación entre la velocidad de lectura y la comprensión de la lectura, podríamos querer controlar las diferencias en inteligencias, ya que esta tiene relación tanto con la velocidad de la lectura como en la comprensión de la lectura. Así es preciso mantener constantemente la inteligencia para tener una buena idea de la naturaleza de la relación entre variables de interés.

b) Variables extraña: Es aquella que tiene un impacto impredecible sobre la variable dependiente. Por ejemplo, si nos interesa examinar los efectos de ver televisión en el aprovechamiento del tiempo, podríamos encontrar que el tipo de programas de televisión que se miran es una variable extraña que podría afectar el aprovechamiento, ya que programas y documentales del tipo educativo o científico podrían tener un impacto positivo sobre el aprovechamiento del tiempo, mientras que otros programas podrían tener un efecto negativo.

c) Una variable moderadora: Es aquella que está relacionada con las variables de interés (como la variable dependiente y la independiente) y enmascara la verdadera relación entre la variable independiente y la dependiente. Por ejemplo, si estamos examinando la relación entre la tasa de delitos y el consumo de helados, más vale que incluyamos la temperatura, que modera esa relación.

Tipo de variable

Definición

Sinónimos

Dependiente

Variable que indica si el tratamiento de manipulación de la variable independiente tuvo algún efecto.

Variable resultante

Variable de efecto

Variable de criterio

Independiente

Variable que se manipula para examinar su impacto en una variable dependiente o resultante.

Variable de tratamiento

Variable de factor

Variable predictiva

De control

Variable relacionada con la variable dependiente y cuya influencia es preciso eliminar

Variable restrictora

Extraña

Variable relacionada con la variable dependiente o independiente pero que no forma parte del experimento.

Variable amenazadora

Moderadora

Variable relacionada con las variables independiente y dependiente y que tiene un impacto en la variable dependiente

Variable de interacción

4.5. Las hipótesis

Etimológicamente, la palabra hipótesis tiene su origen en los términos griegos thesis, que significa lo que se pone, e hipo, partícula que equivale a debajo. Entonces literalmente es lo que se pone debajo, o se supone. Etimológicamente, por tanto, las hipótesis no son otra cosa que suposiciones. De acuerdo con esta noción las hipótesis presentan una gran generalidad.

Si bien una hipótesis refleja muchas otras cosas, tal vez su papel más importante es reflejar el planteamiento general del problema o pregunta que motivó que se emprendiera el estudio de investigación. Es por eso que es de vital importancia plantear esa pregunta inicial con cuidado y detenimiento, pues nos guiará durante la creación de una hipótesis, la que a su vez ayudará a determinar los tipos de técnicas que usaremos para probar la hipótesis y contestar la pregunta original.

Por ejemplo, la etapa de “¿Qué tal sí...” se convierte en la etapa de planteamiento del problema, que luego conduce a la hipótesis del estudio. He aquí un ejemplo de cada etapa.

¿Qué tal si...?

Me parece que hay varias cosas que podrían hacerse para ayudar a las madres trabajadoras a disminuir su elevada tasa de ausencias. Después de hablar con varias de ellas mi di cuenta de que les preocupa el cuidado de sus niños después de la escuela. ¿Qué tal si se iniciara un programa aquí en la empresa que pudiera proporcionar actividades educativas para los niños y niñas?

La hipótesis

Las madres que inscriben a sus hijos en programas después de la escuela faltan menos días al trabajo en un año y tienen una actitud más positiva hacia el trabajo, medida según alguna técnica de encuesta laboral estandarizada, que las madres que no inscriben a sus hijos en tales programas.

4.5.1. Las hipótesis nulas

Es uno de los temas interesante a tener en cuenta cuando se elabora las hipótesis. Es la ausencia de una relación entre las variables que se están estudiando. En otras palabras, las hipótesis nulas son expresiones de igualdad como lo expresan estos ejemplos:

a) No habrá diferencias en la calificación promedio de los alumnos de la tercera promoción del Magíster a Distancia en Ciencias Sociales y la de los alumnos de la cuarta promoción en la asignatura de Epistemología

b) No existe relación entre el tipo de personalidad y el éxito en el trabajo

c) No hay diferencias entre las intenciones de voto en función del partido político

d) La marca de helado preferida es independiente de la edad, género e ingresos del comprador

Lo que estas cuatro hipótesis nulas tienen en común es que dicen que dos o más cosas son iguales o no están relacionadas entre sí.

¿Para qué sirven básicamente una hipótesis nulas? Esta hipótesis actúa como punto de partida y también como marca de referencia contra la cual se medirán os resultados reales de un estudio.

a) En primer lugar, la hipótesis nula actúa como punto de partida porque es la situación que se acepta como cierta en ausencia de otra información. Por ejemplo examinemos la primera de la hipótesis nulas anteriores: No habrá diferencias en las calificaciones promedio de los alumnos dela primera promoción del Magíster a Distancia en Ciencia Sociales y la de los alumnos de la Tercera Promoción en la asignatura de Epistemología. Si no tenemos un conocimiento ulterior de las habilidades de los alumnos de la tercera y cuarta promoción, no tendremos razón para creer que habrá diferencias entre los dos grupos. Podríamos especular acerca de por qué uno de los grupos podría tener un mejor desempeño, pero si no tenemos pruebas a priori (antes del hecho) no tenemos más opción que suponer que ambos grupos son iguales. Esta falta de relación, a menos que se demuestre otra cosa, es una característica distintiva del método que estamos estudiando. En otras palabras hasta que no se demuestre que existe una diferencia, hay que suponer que no hay diferencia. La pregunta, ¿Sí hay diferencias entre los dos grupos?, tenemos que suponer que las diferencias se deben a la explicación más atractiva para las diferencias entre grupos respecto a cualquier variable ¡El azar! Así, es si no contamos con otra información, el azar siempre es la explicación más probable para las diferencias entre dos grupos. Y ¿qué es el azar? Es la variabilidad aleatoria que se introduce en todo estudio en función de los individuos que participan en él y de muchos factores imprevistos, como la forma en que se mide el comportamiento. Por ejemplo, podríamos tomar un grupo de jugadores de fútbol de Colo-Colo y de Universidad de Chile y comparar las velocidades con que corren. Pero ¿cómo vamos a saber si algunos jugadores de un equipo practican más, o si alguno del otro equipo son más fuertes o están recibiendo un entrenamiento adicional? Es más, tal vez la forma en que se está midiendo su velocidad deja lugar para el azar; un cronómetro defectuoso, un día con viento puede contribuir a diferencias que no tienen relación con la verdadera velocidad de carrera. De ahí, que nuestra tarea es eliminar el azar como factor y evaluar otros factores que podrían contribuir a las diferencias entre grupos como los que se identifican como variables independientes.

b) El segundo propósito de la hipótesis nula es tener una marca de referencia con la cual comparar los resultados observados para ver si las diferencias se deben al azar o algún otro factor. La hipótesis nula ayuda a definir un intervalo dentro del cual cualesquier diferencias que se observen entre los grupos se pueden atribuir al azar (que es lo que propone la hipótesis nula) o otra cosa (que tal vez sería el resultado de la manipulación de la variable independiente). La mayor parte de los estudios correlacionales, cuasiexperimentales y experimentales tienen una hipótesis nula implícita; no así los estudios descriptivos e históricos.

4.5.2. La hipótesis de investigación

Mientras que una hipótesis nula es una expresión de la ausencia de relación entre variables, una hipótesis de investigación es una expresión definida de la relación entre dos variables. Por ejemplo, para cada una de las hipótesis nulas que planteamos antes, presentaremos ahora una hipótesis de investigación correspondiente. Dejamos en claro que puede haber más de una hipótesis de investigación para cualquier hipótesis nula. He aquí algunas hipótesis de investigación que corresponden a las hipótesis nulas antes mencionadas.

a) La calificación promedio de los alumnos de la tercera promoción del Magíster a Distancia en Ciencias Sociales es diferente de la de los alumnos de la cuarta promoción en la asignatura de Epistemología.

b) Hay una relación entre el tipo de personalidad y el éxito en el trabajo

c) Las intenciones de voto en función del partido político

d) La marca de helado preferida está relacionada con la edad, género y los ingresos del comprador

Todas estas hipótesis de investigación tienen algo en común: son expresiones de desigualdad. Las hipótesis plantean una relación entre variables y no una igualdad, como hace la hipótesis nula. La naturaleza de esta igualdad puede adoptar dos formas distintas: direccional y no direccional. Si las hipótesis de investigación no plantea un sentido para la desigualdad (sólo dice que hay diferencia), es no direccional; si plantea un sentido para la desigualdad (como más que o menos que) se trata de una hipótesis de investigación direccional.

¿Para qué sirve la hipótesis de investigación? Es esta hipótesis la que se prueba directamente en un paso del proceso de investigación. Los resultados de esta prueba se comparan con lo que esperaría exclusivamente del azar (que refleja la hipótesis nula) para determinar cuál de las dos es la explicación más atractiva de cualesquier diferencias que pudiéramos observar entre los grupos.

4.5.3. Diferencia entre la hipótesis nula y la hipótesis de investigación

Además de la hipótesis nula representa una igualdad y la hipótesis de investigación representa una desigualdad, hay otras diferencias importantes entre los dos tipos de hipótesis.

a) En primer lugar, una hipótesis dice no que existe relación entre ciertas variables (igualdad) mientras que la hipótesis de investigación dice que existe una relación (una desigualdad. Esta es la diferencia primaria).

b) En segundo lugar, las hipótesis nulas siempre se refieren a la población, mientas que la hipótesis de investigación siempre se refieren a la muestra.

c) En tercer lugar, dado que no se puede someter toda la población a la prueba (por ser poco práctico, costoso y a menudo imposible), nunca podemos asegurar que no existe una diferencia real entre grupos en cuanto a una variable dependiente dada (si aceptamos la hipótesis nula). Más bien tenemos que inferir (indirectamente) de los resultados de la prueba de la hipótesis de investigación, que se basa en la muestra. Por tanto, la hipótesis nula se debe probar en forma indirecta, mientras que la de la investigación se prueba directamente.

4.5.4. ¿Qué hace que una hipótesis sea buena?

Sabemos que las hipótesis son suposiciones. Al igual que todas las suposiciones, algunas son mejoras que otras desde el principio. No podemos hacer demasiado hincapié en lo importante que es hacer la pregunta cuya respuesta se desea y tener presente que cualquier hipótesis que presentemos es una extensión directa de la pregunta original que nos hicimos. Esta pregunta refleja nuestros intereses personales y las investigaciones que se han efectuado anteriormente. Con esto en mente, he aquí algunos criterios que podríamos usar para decidir si una hipótesis es aceptable. Como ilustración, utilicemos un ejemplo de un estudio que examina los efectos de los programas de guardería después de la escuela para madres que trabajan tarde, sobre la forma como las madres se ajustan al trabajo.

Las madres que inscriben a sus hijos e hijas en programas después de la escuela faltarán menos al trabajo en un año y tendrán una actitud más positiva hacia su actividad laboral, medida según la encuesta de Actitud Hacia el Trabajo, que las madres que no inscriben a sus hijos e hijas en tales programas.

a) Primero, una buena hipótesis se expresa en forma declarativa y no como pregunta. En el ejemplo anterior no se planteo: ¿“Cree usted que las madres y la empresa para las que trabajan se beneficiarán...”?, pues las hipótesis son más efectivas cuando se expresan como una afirmación clara y categórica.

b) Segundo, una buena hipótesis plantea una relación esperada entre variables. La hipótesis que estamos usando como ejemplo describe claramente la relación entre el cuidado de los niños y niñas después de la escuela, la actitud de las madres y la tasa de la ausencia. Estas variables se están probando para ver si una de ellas (inscripción en le programa después de la escuela) afecta las otras (tasa de ausencia y actitud).

c) Tercero, la hipótesis reflejan la teoría o los estudios publicados (bibliografía) en los que se basan. Como vimos anteriormente, los logros científicos casi nunca pueden atribuirse únicamente a un investigador. Una buena hipótesis refleja esto, en cuanto a que tiene un vínculo sustancial con los estudios publicados (la bibliografía) y las teorías existentes. En el ejemplo, supongamos que hay trabajos publicados que indican que las madres se sientan más a gusto sabiendo que sus hijos están recibiendo atención en un entorno estructurado, y así pueden ser más productivos en su trabajo. Saber esto nos permitiría plantear la hipótesis de que un programa después de la escuela proporcionaría a madres la seguridad que están buscando, y a su vez les permitiría concentrarse en el trabajo y no en el teléfono para averiguar si Camelia o Rodrigo llegó sano y salvo a su casa.

d) Cuarto, una hipótesis debe ser breve y concisa. Queremos que la hipótesis describa la relación entre las variables en una forma declarativa y que sea lo más concisa posible.

e) Quinto, la buenas hipótesis se pueden probar. Esto significa que en realidad se puede poner en práctica la intención de la pregunta que se refleja en la hipótesis. En la hipótesis de ejemplo podemos ver que la comparación importante es entre las madres que han inscrito a su hijo en un programa para después de la escuela y aquellas que no lo han hecho. Luego, se medirán la actitud hacia el trabajo y la ausencia. Las dos cosas son objetivos razonables. La actitud se mide según la encuesta de Actitud Hacia el Trabajo (un título ficticio, para tener una idea), y el ausentismo (el número de días que la mamá faltó al trabajo) es una medida fácil registrar y que no admite ambigüedades.

En síntesis, la hipótesis deben:

Cuadro de texto: v Expresarse en forma declarativa v Postular una relación entre variables v Reflejar una teoría o cuerpo de bibliografía sobre el que se basan v Ser breves y concisas y  v Poder probarse

4.6. Muestras y poblaciones

Dadas las restricciones bajo las cuales viven casi todos los investigadores, de que nunca hay suficiente tiempo ni fondos, para la investigación. La mejor estrategia es tomar una porción de un grupo mayor de participante y realizar la investigación con ese grupo menor. En este contexto, el grupo mayor se llama población y el más pequeño seleccionado de una población, se llama muestra.

Deben seleccionarse muestras de poblaciones a modo de maximizar la probabilidad de que la muestra represente la población de la forma más fiel posible. El objetivo es tener una muestra que se parezca lo más posible a la población. La implicancia más importante de asegurar la similitud entre las dos es que una vez que se finalice la investigación los resultados basados en la muestra se pueden generalizar a la población. Si la muestra representa fielmente a la población, se dice que los resultados del estudio son generalizables o que tiene generalizabilidad.

Por ejemplo, supongamos que desea averiguar qué actitudes tienen los estudiantes universitarios de la región sobre la contingencia política regional y nacional. Se podría administrar el cuestionario a un grupo de estudiantes del último año. Pero, ¿qué tanto se parecen a la población general de estudiantes que asisten a la universidad en toda la región? Probablemente no mucho. O bien, podríamos hacer las preguntas a 10% de los estudiantes de sexo femenino de primer y segundo año de las universidades que existen en la región. Esta selección abarca un grupo mucho más grande que los 60 o 100 alumnos del último año, pero, ¿qué tan representativa son ellas? Nuestra tarea, entonces, es idear un plan que asegure que la muestra de estudiantes que seleccionemos sea representativa de todos los estudiantes de la región. Si logramos este objetivo podremos generalizar los resultados de toda la población con un alto grado de confianza, incluso si sólo usamos un porcentaje pequeño de los cientos de estudiantes universitario de la región.

Para entender el proceso de muestreo, primero necesitamos distinguir entre dos tipos generales de estrategias de muestreo: probabilística y no probabilística. El muestreo probabilístico es un tipo de muestreo en el que se conoce la probabilidad de seleccionar un miembro individual de la población. Si hay 4.500 estudiantes en todas las universidades de la región, y si 1000 de ellos están en el último año, la probabilidad de seleccionar un estudiante de último año como parte de la muestra es 1000:4500=0.22. En cambio, el muestreo no probabilístico es aquel en el que se desconoce la probabilidad de seleccionar cualquier miembro individual de la población. Por ejemplo, si no sabemos cuantos estudiantes están inscritos en las universidades regionales, no podremos calcular la probalidad de seleccionar cualquiera de ellos.

4.6.1. Estrategias de muestreo probabilístico

Las estrategias de muestreo probabilístico son las más utilizadas porque la selección de los participante está determinada por el azar. Puesto que la decisión de quién entra y quien no entra en la muestra está regida por reglas sistemáticas y aleatorias, hay una buena posibilidad de que la muestra represente verdaderamente a la población.

4.6.2. Muestreo aleatorio simple

El tipo más común de procedimiento de muestreo probabilístico es el muestreo aleatorio simple. Aquí cada miembro de la población tiene una probabilidad igual e independiente de ser seleccionado como parte de la muestra. Las palabras clave aquí son igual e independiente. Igual, porque no existe alguna predisposición a escoger una persona en lugar de otra. Independiente porque el hecho de escoger una persona no predispone al investigador a favor o en contra de escoger otra persona dada. Si se muestrea aleatoriamente, las características de la muestra deberán ser muy parecidas a las de la población. Por ejemplo, ¿estaríamos realizando un muestreo aleatorio simple si escogiéramos cada quinto el nombre del directorio telefónico? No, porque estaríamos violando ambos criterios de igualdad e independencia. En primer lugar, si comenzamos con el quinto nombre de la página 234 del directorio, los nombres 1, 2, 3 y 4 nunca tuvieron una probabilidad igual de ser escogidos. Segundo, si escogemos el número 5 de la lista y luego cada quinto nombre de ahí en adelante, sólo los nombres 10, 15, 20, etc., tendrían la posibilidad de ser escogidos. En otras palabras, el proceso de selección ya no es independiente.

El proceso de muestreo aleatorio simple consta de cuatro pasos:

1. Definir la población de la cual se desea seleccionar una muestra

2. Listar todos los miembros de la población

3. Asignar números a cada miembro de la población

4. Aplicar un criterio para seleccionar la muestra deseada

Por ejemplo, en la tabla que a continuación se muestra una lista de 50 nombres a los que ya se han asignado números (pasos 1, 2 y 3). No es una población muy grande pero sí excelente para fines ilustrativos. De esta población seleccionaremos una muestra de 10 individuos utilizando una tabla de números aleatorios. Veamos cómo funciona esto.

1.Soledad

11. Ximena

21.Juan

30. Esteban

40. Verónica

2. Paola

12. Sandra

22. Carlos

31. Alberto

41. Mercedes

3. Ofelia

13. Berenice

23. Javier

32. Pedro

42. Samuel

4. Beatriz

14. Violeta

24. Matías

33.Luis

43. Fabián

5. Marcela

15.Paula

25. Rodolfo

34. José

44. Marcos

6. Bernardita

16. Emilio

26. Roberto

35. Ignacia

45. Israel

7. Ana

17. Álvaro

27. Yahir

36. Zulema

46. Ismael

8. Claudia

18. Miguel

28. Alejandro

37. Sara

48. Soledad

9. Susana

19. Eduardo

29. Iván

38. Marta

49. Oscar

10.Mirza

20. Raúl

29. Sebastián

39. María

50. Cristian

Tabla 1. He aquí un grupo de 50 nombres que constituye una “población” para nuestros fines. Observe cada uno está enumerado y listo para seleccionarse.

4.6.3. Cómo usar una tabla de números aleatorios

Una tabla de números aleatorios es un criterio magnífico, ya que la forma como se generan los números de la tabla carece totalmente de predisposición. Por ejemplo, en la tabla 2º hay cantidades casi iguales de dígitos 1, 2, 3, 4, 5, etc. En consecuencia, la probabilidad de seleccionar un número que termine en 1 o en 2 o en 3, etc., es igual. Esto implica que si se relacionan nombres con los números la probabilidad de seleccionar cualquier nombre dado es también igual.

23157

48559

01837

25993

05545

50430

10537

43508

14871

03650

32404

36223

38976

49751

94051

75853

97312

17618

99755

30870

11742

69183

44339

47512

43361

82859

11016

45623

93806

04338

38268

04491

49540

31191

08429

84187

36768

76233

37948

21569

Teniendo lo anterior en mente, seleccionemos un grupo de diez nombres utilizando la tabla de números aleatorios de la tabla 2º. Siga estos pasos.

1. Escoja un punto de partida en algún lugar de la tabla cerrando los ojos y colocando su dedo (o la punta de un lápiz) en cualquier parte de la tabla. Al seleccionar el punto de partida de este modo aseguramos que no se escogerá algún punto de partida (o nombre) específico.

Para este ejemplo, el punto de partida fue la primera columna de números, en la Ultima fila (36768); la punta del lápiz quedo en el cuarto digito, el número 6.

2. El primer número de dos dígitos, entonces es 68 (en negritas en la tabla 4.3). Puesto que la población llega hasta 50, y no hay un nombre en el lugar 68, pasamos por alto este número y consideramos el siguiente número de dos dígitos. Ya que no podemos bajar más en la tabla, pasamos al tope de la siguiente columna y leemos hacia abajo, una vez más seleccionando los primeros dos dígitos. Por comodidad, hemos separado los pares de dígitos en la tabla 2º.

23157

48559

01837

25993

05545

50430

10537

43508

14871

03650

32404

36223

38976

49751

94051

75853

97312

17618

99755

30870

11742

69183

44339

47512

43361

82859

11016

45623

93806

04338

38268

04491

49540

31191

08429

84187

36768

76233

37948

21569

Tabla 2º Punto de partida para la selección de 10 casos utilizando la tabla de números aleatorios. Se puede comenzar en cualquier punto, en tanto ese punto se determine al azar y no se escoja intencionalmente.

3. La persona 48 de la lista es Soledad, y ella se convierte en la primera de la muestra de 10 miembros.

4. Si seguimos seleccionando números de dos dígitos hasta haber hallado 10 valores entre 01 y 50, habremos seleccionado los nombres de la tabla que corresponden a los números que aparecen en negritas en la tabla 2º. He aquí un desglose de cuáles números funcionaron y cuáles no para los fines de escoger una muestra aleatoria de 10 personas de la población de 50.

a) Leyendo hacia abajo en la primera columna de números de dos dígitos, 48, 50, 03, 49 y 17 están bien, porque quedan dentro del intervalo de 01 a 50 (el tamaño de la población) y no se han seleccionado antes,

b) 69 y 82 están fuera del intervalo,

c) 04 y 31 están bien, y

d) 76 está fuera del intervalo

Puesto que no podemos bajar más por la primera columna de números de dos dígitos, hay que subir al siguiente conjunto de números de dos dígitos (en la misma columna de cinco dígitos) en la parte superior de la columna, que comienza con el numero 55.

a) 55 no está dentro del intervalo,

b) 43 está bien,

c) 65, 75 y 61 no son aceptables,

d) 18 sí,

e) 85 no, y

f) 33 sí, y ya tenemos las 10 personas.

Aquí están:

1) 8 Soledad

2) 50 Cristian

3) 03 Ofelia

4) 49 Oscar

5) 17 Álvaro

6) 04 Beatriz

7) 31 Alberto

8) 43 Fabián

9) 18 Miguel

10) 33 Luis

Ahora ya tiene usted una muestra de 10 nombres de una población de 50, seleccionados totalmente al azar. Su muestra se escogió al azar porque la distribución de los números en la tabla parcial de números aleatorios de la tabla 2º se generó al azar. ¿Esa una simple coincidencia que tres de los primeros cinco números (48,50,03,49,17) de la tabla parcial de números aleatorios estén agrupados? Este grupo de cinco es la mejor aproximación y la más representativa de cualquier muestra de cinco de toda la población, dado que cada miembro de la población tiene la misma probabilidad independiente de ser escogido.

23157

48559

01837

25993

05545

50430

10537

43508

14871

03650

32404

36223

38976

49751

94051

75853

97312

17618

99755

30870

11742

69183

44339

47512

43361

82859

11016

45623

93806

04338

38268

04491

49540

31191

08429

84187

36768

76233

37948

21569

Tabla 2º Selección de los números de la tabla de números aleatorios que corresponde a los 10 nombres seleccionados como muestra. Observe que los pares de números individuales están en negritas para poder distinguirlos de los que no se seleccionaron.

El gran supuesto, desde luego, es que los nombres de la población (tabla 1º) se listaron de manera aleatoria. En otras palabras, los nombres del 01 al 20 no se listaron como los primeros 20 de los 50 porque provienen de un vecindario distinto, tienen mucho dinero, no tienen hermanos, o tienen alguna otra característica que pudiera predisponer de alguna forma la selección. La regla general es usar un criterio que no tenga relación con lo que se está estudiando. Por ejemplo, si va a realizar un estudio sobre el voluntariado no va a pedir voluntarios

4.6.4. Muestreo sistemático

Otro tipo de muestreo aleatorio se denomina muestreo sistemático, en el cual se escoge cada k-esimo nombre de la lista. El término k-esimo representa un número entre 0 y el tamaño de la muestra que usted quiere seleccionar. Por ejemplo. He aquí cómo se usaría un muestreo sistemático para escoger 10 nombres de la lista de 50 que aparece en la tabla 1º.

Para hacerlo, siga estos pasos.

1. Divida el tamaño de la población entre el tamaño de la muestra deseada. En este caso, 50 dividido entre 10 es 5. Por tanto, se escogerá cada quinto nombre de la lista.

2. Como punto de partida, escoja un nombre de la lista al azar. Haga esto usando el método de “apuntar con los ojos cerrados” o, si la lista está numerada, utilice cualquier digito o par de dígitos del número de serie de un billete que traiga en su cartera. El billete que usamos en este ejemplo tenía como sus dos primeros dígitos 43, y éste será nuestro punto de partida.

3. Una vez determinado el punto de partida, seleccione cada quinto nombre. En este ejemplo, si usamos los nombres de la tabla 1º y comenzamos con Fabián (#43), la muestra consistirá en Soledad (#48), Ofelia (#3), Claudia (#8), Susana, (#13), Berenice, (#18), Miguel (#23), Alejandro(#28), Luis (#33) y Marta (#38).

El muestreo sistemático es más fácil y menos problemático que el aleatorio, y esta es una razón por la que muchas veces se prefiere. El muestreo sistemático también es un poco menos deseable. Es evidente que se viola el supuesto de que cada miembro de la población tiene la misma probabilidad de ser seleccionado. Por ejemplo, dado que el punto de partida es Fabián (#43), sería imposible seleccionar a Marcos (#44).

4.6.5. Muestreo estratificado

Los dos tipos de muestreo aleatorio que acabamos de ver funcionan bien si no nos interesan características específicas de la población (como edad, sexo, grupo étnico, grupo de habilidad, etc.). En otras palabras, si se seleccionara otro conjunto de 10 nombres, supondríamos que; como ambos grupos se escogieron al azar, son efectivamente iguales. Pero, ¿qué sucede si desde un principio los individuos de la población no son “iguales”? En tal caso, querremos asegurarnos de que el perfil de la muestra coincida con el perfil de la población, y esto se hace creando una muestra estratificada.

La teoría en que se basa el muestreo (y todo el proceso de inferencia) es a grandes rasgos la siguiente: si usted puede seleccionar una muestra lo más representativa posible de una población, cualesquier observaciones que pueda hacer sobre esa muestra se deberán cumplir también para la población. Hasta aquí vamos bien, sin embargo, hay ocasiones en que el muestreo aleatorio deja demasiado al azar, sobre todo si no hay garantía de que las distribuciones de los miembros de la población dentro de la muestra sean iguales. En esos casos se utiliza un muestreo estratificado.

Por ejemplo, si la población es 82% católicos, 14% protestantes y 4% judíos, la muestra deberá tener las mismas características si la religión es una variable importante. Es crucial entender la última parte del enunciado anterior. Si ésta o aquella característica de la población no tiene relación alguna con lo que se está estudiando, no hay razón para preocuparse por obtener una muestra que siga el mismo patrón de la población y esté estratificada según una de esas variables.

Supongamos que la lista de nombres de la tabla 1º representa una población estratificada (hombres y mujeres), y que el tema del estudio son las actitudes hacia el aborto. Puesto que las diferencias de sexo o género podrían ser importantes, usted quiere una muestra que refleje las diferencias de género de la población. La lista de 50 nombres consiste en 20 mujeres y 30 hombres, o sea, es 40% mujeres y 60% hombres. La muestra de lo deberá reflejar esa distribución y tener 4 mujeres y 6 hombres. He aquí cómo se seleccionaría semejante muestra utilizando muestreo aleatorio estratificado.

1. Los hombres y las mujeres se listan por separado.

2. Cada miembro de cada grupo recibe un número. En este caso, los hombres se enumerarían del 01 al 30 y las mujeres del 01 al 20.

3. Usando una tabla de números aleatorios, se seleccionan 4 mujeres al azar de la lista de 20.

4. Usando una tabla de números aleatorios, se seleccionan 6 hombres al azar de la lista de 30.

Aunque podrían presentarse ejemplos sencillos (con un solo estrato) como éste, en muchos casos será necesario estratificar según más de una variable. Por ejemplo, en la tabla 3 una población de 10.000 niños se estratifica según las variables de año (40% de primer año, 40% de tercer año, 20% de quinto año) y lugar de residencia (30% rural, 70% urbano). Se utiliza la misma estrategia: seleccionar 10% (puesto que 1000 es 10% de 10000) de cada una de las capas estratificadas para producir la muestra de la tabla 3º. Por ejemplo, de los 1200 niños rurales de primer años, se seleccionó aleatoriamente 10%, o 120 niños. De forma similar, se escogieron 140 niños urbanos de quinto años.

Residencia

Año

Total

1

3

5

Rural

1200

(120)

1200

(120)

600

(60)

3000

(300)

Urbana

2800

(280)

2800

(280)

1400

(140)

7000

(700)

Total

4000

(400)

4000

(400)

2000

(200)

10000

(1000)

Tabla 3º La selección de una muestra cuando hay más de un estrato consiste en tomar una proporción de cada nivel. Aquí el tamaño de la muestra se indica entre paréntesis debajo del tamaño de cada grupo de la población.

4.6.6. Muestreo por cúmulos

El último tipo de muestreo probabilístico es el muestreo por cúmulos, en el que se seleccionan unidades de individuos y no los individuos mismos. Por ejemplo, usted podría estar realizando una encuesta de las actitudes de los padres hacia la vacunación. En lugar de asignar aleatoriamente padres individuales a dos grupos (digamos, aquellos a los que se le enviara material informativo y aquellos a los que no se les enviara), usted podría simplemente identificar 30 consultorios pediátricos de la ciudad y luego, utilizando una tabla de números aleatorios, seleccionar 15 para un grupo y designar 15 para el segundo grupo.

El muestreo por cúmulos ahorra mucho tiempo, pero hay que tener la seguridad de que las “unidades” (en este caso los padres que acuden a cada pediatra) sean lo suficientemente homogéneas como para que cualesquier diferencias que haya dentro de la unidad misma no contribuyan a una predisposición. Por ejemplo, si un pediatra se niega a vacunar a los niños antes de cierta edad, eso introduciría una predisposición que usted querría evitar.

4.6.7. Estrategia de muestreo no probabilístico

La segunda categoría principal de estrategias de muestreo, el muestreo no probabilístico, comprende aquellas en las que se desconoce la probabilidad de escoger un solo individuo. En este caso, hay que suponer que los miembros en potencia de la muestra no tienen una probabilidad igual e independiente de ser seleccionados. Examinemos algunos de estos métodos de muestreo.

4.6.8. Muestreo de conveniencia

El muestreo de conveniencia es justo lo que indica su nombre. Un entrenador de fútbol da a cada miembro de su equipo un cuestionario. El público (el equipo) es cautivo, y es una forma muy cómoda de generar una muestra. ¿Fácil? ¿Aleatoria? No. ¿Representativa? Tal vez, pero hasta cierto grado. Quizás usted reconozca este método de muestreo en algunas investigaciones utilizando un público cautivo. Por ejemplo, si un empleador, realiza una encuesta o cuestionario sobre las nuevas políticas de la empresa, los trabajadores deben participar, para no recibir posteriormente represalias. De esto hay miles de ejemplos. Por lo tanto, al utilizar este muestreo hay que tomar ciertas precauciones. Hace un tiempo, una alumna del Magíster de Educación que era directora, elaboró una encuesta para los docentes de su escuelas, sobre la gestión directiva, las respuestas fueron obvias...

4.6.9. Muestreo por cuotas

Usted podría encontrarse en una situación en la que necesitara obtener una muestra estratificada según ciertas variables, pero por alguna razón no es posible efectuar un muestreo estratificado. En este caso, el muestreo por cuotas podría ser lo mejor.

En el muestreo por cuotas se escogen personas con las características deseadas (digamos, niños rurales de primer años) pero no se selecciona aleatoriamente de la población un subconjunto de todos esos niños, como ocurriría en un muestreo estratificado proporcional. Mas bien, el investigador continuaría reclutando niños hasta cumplir con la cuota de 120. El 176 niño rural de primer año no tiene posibilidad de ser escogido, y ésta es la principal razón por la que esta técnica de muestreo es no probabilística.

He aquí otro ejemplo de sistema por cuotas. Digamos que usted tiene que entrevistar 20 estudiantes universitarios de primer año de ambos sexos. Primero usted podría entrevistar 10 hombres y, sabiendo que la distribución de hombres y mujeres está dividida aproximadamente 50/50, usted entrevistaría las siguientes 10 mujeres que llegaran, y con ello habría acabado. Si bien el muestreo por cuotas es mucho más fácil que el estratificado, también es menos preciso. Imagine cuánto más fácil sería encontrar 10 estudiantes de primer año de sexo masculino que 10 hombres específicos, que es 10 que usted tendría que hacer si realizara un muestreo estratificado.

4.6.9.1. Muestras y error de muestreo

Por más que se esfuerce el investigador, es imposible seleccionar una muestra que represente perfectamente a la población. Desde luego, el investigador podría seleccionar toda la población como muestra, pero esto elimina el propósito del muestreo: hacer una inferencia a una población con base en una muestra más pequeña.

Una forma de expresar la falta de congruencia entre la muestra y la población se expresa como el error de muestreo. Este error es la diferencia entre las características de la muestra y las características de la población de la cual se seleccionó la muestra. Por ejemplo, la estatura promedio de 10.000 alumnos de quinto año es 102 cm. Si usted toma 25 muestras de 100 alumnos de quinto año y calcula la estatura promedio para cada grupo de 100 alumnos, tendrá un promedio para cada grupo, es decir, 25 promedios. Si todos esos promedios son exactamente 102 cm, no habrá error de muestreo. Sin embargo, es casi seguro que no se obtendrá tal resultado. Lo más probable es que usted obtenga valores como 102.5, 102.2, 101.6, 100.1 cm, etc. La cantidad de variabilidad, o la dispersión, de estos valores nos da una idea de la magnitud del error de muestreo.

El proceso exacto para calcular el error de muestreo, que se expresa como un valor numérico, rebasa el alcance de este manual, pero el lector debe tener presente que su propósito al seleccionar una buena muestra es minimizar ese valor. Cuanto más pequeño sea el valor, menor discrepancia habrá entre la muestra y la población.

Pero hay más. Ya sabemos que cuanto más grande es una muestra, más representativa es de una población. Digamos que llega el momento de probar si hay una diferencia entre muestras. Resulta que, cuanto mejor las muestras representan su respectiva población, más exacta es la prueba de las diferencias. En otras palabras, un mejor muestreo da lugar a pruebas más exactas y verdaderas de las diferencias entre poblaciones.

¿Cómo minimizamos el error de muestreo? Sencillo. Utilizamos buenos procedimientos de selección y aumentamos el tamaño de la muestra hasta donde es posible y razonable. Usted ya sabe que una muestra demasiado pequeña no es representativa de la población, y que una demasiado grande es una exageración. Muestrear demasiados estudiantes de educación media anularía el propósito del muestreo, pues ya no se estaría aprovechando la utilidad de la inferencia. Hay quienes piensan que cuanto más grande es una muestra, mejor, pero tal estrategia no es lógica desde un punto de vista económico o científico. Una muestra demasiado grande no aumenta la precisión de la prueba de la pregunta en un grado que justifique el costo y el trabajo de obtener una muestra de ese tamaño. Necesitamos un método para calcular el número real de estudiantes de educación media que conviene seleccionar para la muestra. Recuerde, cuanto menos representativa de la población sea la muestra, mayor será el error de muestreo presente. Además, cuanto mayor sea el error de muestreo, menos generalizables a la población serán los resultados y menos precisa será la prueba de la hipótesis nula.

Tipo de Muestreo

Cuándo debe usarse

Ventajas

Desventajas

Estrategias probabilística

Muestreo aleatorio simple

Cuando los miembros de la población son similares

Asegura un alto grado de representatividad

Tediosa

Muestreo Sistemático

Cuando los miembros de la población son todos similares

Asegura un alto grado de representatividad; no hay que usar una tabla de números aleatorio

Menos verdaderamente aleatorio que el muestreo aleatorio simple

Muestreo aleatorio estratificado

Cuando la población es de naturaleza heterogénea y contiene varios grupos distintos.

Asegura un alto grado de representatividad de todos los estratos de la población

Tedioso

Muestreo por cúmulo

Cuando la población consiste en unidades más que en individuos.

Fácil y cómodo

Posibilidad de que los miembros de las unidades difieren ente sí y reduzcan la efectividad del muestreo

Estrategia de muestreo no probabilístico

Muestreo por conveniencia

Cuando la muestra es cautiva

Cómodo y económica

La representatividad es dudosa

Muestreo por cuotas

Cuando hay estratos pero no es posible un muestreo estratificado

Asegura ciertos grado de representatividad de todos los estratos de la población

La representatividad es dudosa

4.7. El concepto de significancia

Es probable que no haya término o concepto que produzca más confusión en el estudiante principiante que el de significancia estadística. Para una mayor comprensión utilizaremos un ejemplo donde dos investigadores examinaron las diferencias entre los adolescentes cuyas madres trabajan y adolescentes cuyas madres no trabajan (además de la situación familiar; pero para este ejemplo a los grupos que trabajan y los que no trabajan)

Modifiquemos el significado de la palabra diferencia por medio del adjetivo significativo. Lo que queremos decir con diferencias significativas es que las diferencias que se observan entre los adolescentes cuyas madres trabajan y aquellos cuyas madres no trabajan se deben a algunas influencias y no aparecen simplemente por casualidad. En el presente ejemplo, dicha influencia o factor es el hecho de que la madre trabaje o no trabaje. Supongamos que hemos controlado todos los demás factores que podrían causar alguna diferencia. Entonces, lo único que puede explicar las diferencias entre los grupos de adolescentes es el hecho de que sus madres trabajen o no ¿Correcto? Sí. ¿Ya terminamos? Todavía no.

Dado que el mundo y usted y nosotros y el proceso de investigación no somos perfectos, es preciso considerar cierto margen. En otras palabras, necesitamos poder decir que, si bien estamos bastante seguros de que la diferencia entre los dos grupos de adolescentes se debe a que la madre trabaje o no, no podemos estar absolutamente, 100% positivamente, inequívocamente, indiscutiblemente seguros.

¿Por qué? Por muchas razones distintas. Por ejemplo, podría ser que simplemente estemos equivocados. Quizá, durante este experimento en particular, las diferencias no se debieran al grupo al que pertenecen los adolescentes sino a algún otro factor que por descuido no se tomó en cuenta, como las experiencias fuera del hogar. ¿Qué tal si los miembros de un grupo eran en su mayoría hombres y reaccionaron de manera muy diferente de cómo lo hicieron los miembros del otro grupo, que eran en su mayoría mujeres? Tales diferencias son pocos probables, pero no por ellas imposibles. Este factor (género) y otros ciertamente podrían tener un impacto sobre la variable resultante o independiente y a su vez sobre los resultados finales y las conclusiones a la que usted haya llegado.

¿Qué hacer entonces? En la mayor parte de los proyectos de investigación que implican proponer hipótesis y examinar diferencias entre grupos, con toda seguridad habrá una cierta cantidad de error que es imposible controlar. El nivel de significancia es el riesgo asociado a no tener una certeza de 100% de que la diferencia se debe a lo que creemos que se debe, pues podría deberse a algún factor imprevisto. Entonces la tarea es reducir esta posibilidad hasta donde sea posible eliminando todas las razones que podrían competir, distintas de las que se están probando, para cualquier diferencias que usted haya observado. Puesto que no es posible eliminar plenamente dicha posibilidad, se le maneja asignándole un nivel de probabilidad e informando los resultados con esa salvedad.

Sugerencias bibliográficas

1. Ander-Egg, Ezequiel. Técnicas de investigación Social.(op. cit.); Métodos y Técnicas de Investigación Social. Cómo organizar el trabajo de investigación Ed. Lumen: Buenos Aires, 2000; Introducción a las Técnicas de Investigación Social Ed. Humanitas: Buenos Aires, 1977.

2. Babbie, Earl R. : Métodos de Investigación por encuesta Fondo de Cultura Económica: México, 1988.

3. Briones Guillermo: Evaluación de Programas Sociales. Teoría y Metodología de la investigación evaluativa. PIIE: Santiago, 1985.

4. Campbell, Donald T. y Stanley, Julian C.: Diseños experimentales y cuasi experimentales de investigación social. Ed. Amorrortu: Buenos Aires, 1978

5. Galtung, Johan: Teoría y Métodos de Investigación Social Ed. Universitaria: Buenos Aires, 1966

6. Goode, William J. y Hatt, Paul K. : Métodos de Investigación Social (op. cit)

7. Hardick, C. : Investigación en Ciencias Sociales Ed. Interamericana: México D.F. , 1977

8. Holzmann, Guillermo: Manual Básico de Investigación...(op. cit.)

9. Pick, Susan y López, Ana Luisa: Cómo Investigar en Ciencias Sociales Ed. Trillas: México D.F. , 1995.

10. Hernández Roberto, Fernández Carlos,Baptista Pilar. Metodología de la investigación. Ed. Mc Graw-Hill Interamericana. México 1998. (2ª Edición)

4.8. Sugerencias para utilizar informes de investigación que le sirvan a su proceso de investigación

Hasta el momento ya tiene ciertos criterios de lo que es un proceso de investigación. Le sugerimos algunos criterios para juzgar un estudio de investigación que tenga relación con lo que usted va a investigar. Nunca es fácil juzgar el trabajo de otra persona. Un buen punto de partida podría ser la lista de verificación siguiente, que está organizada con el fin de ayudarle a concentrarse en las características más importantes de cualquier informe de investigación.

Esta tabla le puede servir como base para la recolección de fuentes que va a utilizar en su Tesis.

Cuadro de texto: Autor (es)                                         Título                   Nº de Edición  Editorial                              Lugar                 Editorial                   Año

No hay comentarios: