lunes, 4 de diciembre de 2017

Nivel de Significancia y p-valor

En toda prueba de hipótesis, uno de los primeros pasos es escoger un nivel de significancia; α, para la prueba. Tradicionalmente se escoge un nivel de significancia de α = 10; 5 o 1%. ¿Pero por qué utilizar solamente esos valores?
Cuando se analiza los errores tipo I (rechazo incorrecto de Ho) y tipo II (aceptación incorrecta de Ho), la elección del nivel de significancia va a depender de un equilibrio entre los costos de cada uno de estos dos tipos de error. Si el costo de un error tipo I es relativamente alto, se evitará cometer este tipo de error y, en consecuencia, se escogerá un valor pequeño de α. Por otro lado, si un error de tipo II es relativamente más caro, es preferible cometer un error del tipo I, y se escogerá un valor alto de α. Sin embargo, entender la naturaleza del equilibrio no dice mucho de la forma de escoger un nivel de significancia.
Suponga que tomamos una muestra, calculamos la media (muestral) y luego preguntamos: "Suponiendo que Ho fuera verdadera, ¿cuál es la probabilidad de obtener un valor de la media a esta distancia de la media de la población?" A esta probabilidad se le conoce como p-valor. Mientras que antes nos hacíamos la pregunta: "¿Es la probabilidad que se ha observado menos que α?" Ahora se pregunta: "¿Qué tan improbable es el resultado que se ha observado?" Ya que se ha informado el p-valor de la prueba, entonces el tomador de decisiones puede evaluar los factores relevantes y decidir si acepta o rechaza Ho, sin verse limitado por un nivel de significancia dado de antemano.
El p-valor proporciona más información. Si se sabe que se ha rechazado Ho al nivel α = 0.05, solamente sabe que la media se encuentra al menos 1.96 errores estándar alejado de la media poblacional. Sin embargo, un p-valor de 0.05 nos dice que la media muestral está exactamente a 1.96 errores estándar de la media poblacional.
Desde que se tiene una muestra y se quiere inferir sobre la población, la teoría de la probabilidad ayuda a estimar las probabilidades que la muestra representa en la población. No se puede saber ciertamente, al menos que se tenga a la población entera, pero la teoría de la probabilidad permite establecer el nivel de confianza acerca de qué tan probable es que la muestra refleja algo que es cierto en la población.
La significancia estadística indica que los resultados no se deben al azar, pues las muestras probabilísticas involucran un proceso aleatorio, por lo que siempre es posible que los resultados de la muestra difieran del parámetro poblacional. El investigador estima las probabilidades con las que los resultados de una muestra son resultado del parámetro poblacional o el azar del muestreo aleatorio. La significancia estadística usa la teoría de la probabilidad y pruebas estadísticas específicas para decirle al investigador si los resultados, ya sea de asociación, de diferencia entre dos medias o un coeficiente de regresión, son producidos por un error aleatorio dentro de un muestreo aleatorio.
La significancia estadística sólo dice lo que es probable, no puede probar nada con absoluta certeza, establece si los resultados son o no menos probables.
Los investigadores expresan la significancia estadística en términos de niveles (de significancia), es decir una prueba es significativa estadísticamente a un nivel específico, mejor que especificar la probabilidad. El nivel de significancia estadística es una forma de expresar la probabilidad de que los resultados se deben al azar.
Si se quiere indicar que los resultados son significativos a un nivel de 0.05, se podría expresar cualquiera de las siguientes modos:
  • Resultados como éstos son debidos al azar únicamente de 5 en 100 veces.
  • Existe un 95% de posibilidades de que los resultados de la muestra no son debidos al azar, sino refleja lo que ocurre en la población.
  • Las probabilidades de que los resultados se basen exclusivamente en el azar son de 0.05 o de 5%.
  • Significa que existe un 95% de confianza de que los resultados se deben a un comportamiento en la población y no al azar.

La mayoría de los programas estadísticos dan como resultado el p-valor exacto, no solo para pruebas sobre medias basadas en la distribución normal, sino también para otras pruebas como ji-cuadrada y análisis de varianza y pruebas en el contexto de la regresión lineal. Aunque se tengan diferentes estadísticas y distribuciones, la idea del p-valor es la misma.

El uso de la computadora ha hecho a un lado mucho de lo tramposo de la prueba hipótesis, y mediante el uso de p-valores, se elimina la búsqueda de valores en una tabla. Puede ser un tanto desconcertante el hecho de que cuanto más pequeño sea el p-valor, más grande será la significancia de lo encontrado. Se puede evitar tener confusión en este punto si se recuerda que los p-valores son la posibilidad de que el resultado en cuestión haya podido ocurrir exclusivamente debido a un error de muestreo; en consecuencia, cuanto menor sea es mejor.

lunes, 27 de noviembre de 2017

La Discusión de los Resultados de una Investigación

En una investigación, casi siempre se obtiene más información de las que muestran los instrumentos usados. Esa información es muy valiosa para explicar, describir o analizar los datos que se presenta en los resultados. Los resultados suelen presentarse ordenados por cada objetivo. Sin embargo, muchas veces los datos están relacionados con información proveniente de una tabla, es comparable o analizable con la proveniente de otras tablas. En estos casos, es necesario triangular la información, es decir, cruzarla de tal forma que muestre una visión integrada y coherente, esa es la esencia de los resultados.

Los resultados se presentan en forma clara y breve. Se incluyen sólo los datos importantes resumidos en tablas o gráficas. Si la investigación se refiere a diferentes variables independientes, relacionadas con el efecto o variable dependiente, sólo se presentan las asociaciones significativas omitiendo las otras, que se pueden mencionar en caso aporten algo importante para el análisis.

La presentación de los resultados es un aspecto diferente de discusión de los resultados, y se presentan separados porque emplean procedimientos y categorías de análisis y síntesis distintos.

Es difícil explicar los datos crudos; primero se presentan y analizan los datos, luego se interpretan o discuten los resultados del análisis. Los resultados requieren la interpretación (discusión), explicación y el significado de dichos datos para entender el problema de investigación.

Discutir significa analizar la calidad de los resultados de la manera más objetiva posible. Una buena discusión de resultados exige mucho criterio, argumentos sólidos y conocimiento amplio del tema que se investiga.

La discusión de los resultados debe responder las siguientes preguntas:
·    ¿Por qué confiar en los resultados presentados en la investigación?
·    ¿Qué limitaciones de la investigación deben tenerse en cuenta en futuros estudios?
·    ¿Cómo afectan esas limitaciones a los resultados? (validez interna).
·    ¿Se puede generalizar los resultados a otros contextos, tiempos, productos o situaciones?
·    ¿Se puede aplicar los resultados en otros campos? ¿Por qué? (validez externa o generalización).
·    ¿En qué se diferencian o asemejan los resultados a los obtenidos por otros in­vestigadores?
·    ¿Por qué cree que ocurren esas semejanzas o diferencias?
·    ¿Qué aporte nuevo al conocimiento han traído los resultados?
·    ¿Se han contrastado las hipótesis?¿Se han aceptado o rechazado?
·    ¿Qué nuevas hipótesis o ideas de investigación han surgido de la investigación?

Si se responde a cada una de las preguntas anteriores, son los argumentos de la discusión de la investigación. Además se deben considerar los siguientes aspectos:

Realizar la discusión de todos los resultados: Plantear nuevas hipótesis desde los resultados. Comparar sus resultados con los antecedentes o el modelo teórico presentado. Discutir las contradicciones, semejanzas y diferencias de los resultados con investigaciones anteriores.

Analizar la validez y generalización de los resultados obtenidos: Argumentar la posibilidad de generalizar los resultados. Discutir cómo los resultados pueden ser aplicables a otras situaciones y contextos. Analizar la validez y generalización del método; analice sus limitaciones.

Contrastar las hipótesis con los resultados: Comparar las hipótesis iniciales con los resultados obtenidos. Indicar si se aceptan o se rechazan las hipótesis y explicar por qué se aceptaron o rechazaron

En resumen, la discusión, debe ser clara y consistente con los resultados. Sus características son:
·            Relaciones y generalizaciones según las tablas.
·            Señalar las excepciones o faltas de correlación y concretar aspectos no resueltos sin alterar los datos.
·            Señalar las concordancias o discordancias con investigaciones anteriores.
·            Describir las aplicaciones prácticas de los resultados.

domingo, 19 de noviembre de 2017

Validez de una Investigación


La validez de un diseño de investigación o tesis se compone de dos conceptos: la validez en la interpretación de los resultados y la generalización de los resultados a otros grupos de personas. La primera se denomina validez interna y la segunda, validez externa.


La validez interna de los resultados del estudio de investigación o tesis son producto de las variables manipuladas o medidas por el investigador; no se incluye el efecto de otras variables que no haya sido tratada sistemáticamente.

La validez externa de un estudio de investigación o tesis se refiere que los resultados obtenidos pueden generalizarse a otros grupos, diferentes de las observadas en el estudio; y, si los resultados obtenidos en el experimento, pueden extenderse al mundo real.

En general existe una situación complicada en optimizar la validez interna y externa. Cuando el investigador selecciona un diseño fuerte para controlar la validez interna, su trabajo lo desarrolla en situaciones que no están presentes en la realidad natural y por tanto los resultados producto de las variables que manipula no se pueden generalizar a otras poblaciones. Buscando aumentar la validez externa, el investigador trabaja en el mundo real y no en situaciones altamente controladas como el laboratorio; en consecuencia las conclusiones se ven afectadas por la validez interna.

La polémica de los investigadores se centra en cómo obtener un equilibrio, aumentar la validez interna sin disminuir la externa. Este equilibrio va depender en gran medida del conocimiento y experiencia del investigador y de su capacidad para encontrar el diseño apropiado de la investigación que realiza. Algunos estudios de laboratorio se pueden realizar en condiciones del mundo real como sucede en los estudios de campo, los cuales facilitan un control parcial de las variables qué afectan la validez interna del diseño.

La evaluación de toda investigación, además de la validez interna y externa, exige analizar la validez de construcción, para esto, se determina:
a.    la correcta representación de las definiciones operacionales;
b.    en qué medida el diseño permite alcanzar conclusiones de causalidad entre las variables independientes y dependientes, o sea, el análisis de la validez interna que ofrece el diseño;
c.    la extensión con que la muestra del estudio permite generalizar los resultados a otras poblaciones y situaciones, es decir, la validez externa.

lunes, 13 de noviembre de 2017

Al redactar el informe de tesis

El informe de tesis es el documento donde se presentan los resultados alcanzados por el tesista en su trabajo de investigación. Se debe presentar de forma sistematizada, lógica y objetiva, en correspondencia con el proyecto presentado, discutido y aprobado para la búsqueda de soluciones al problema planteado. En muchas ocasiones a pesar de tener resultados relevantes, la forma en que se presentan no los hace comprensibles y se pierda la calidad de la investigación; por tanto, el informe de la tesis debe tener en cuenta dos tipos de requisitos: de fondo y de forma.
En los requisitos de fondo, el informe de tesis debe contener unidad, demostración, profundidad y originalidad.

Unidad, es la armonía de las partes con el todo. Las ideas, tanto principales como secundarias deben estar en armonía. Aunque existan varias ideas, hay una que es la idea fundamental, la base de la investigación y el objeto final de la misma. Las otras ideas son secundarias con respecto a ella.

Demostración, la tesis debe ser demostrada mediante el razonamiento lógico de los resultados a través de los procesos análisis y discusión que debe llevar a conclusiones.

Profundidad, la tesis debe enfocarse en la esencia del problema, no debe limitarse a sus cualidades fenomenológicas.

Originalidad, la tesis tiene por objeto una materia que demostrable, y esto se logra mediante el análisis de los intentos realizados anteriormente por otros investigadores, o por el propio investigador, de resolver el problema.

En los requisitos de forma, se debe tener en cuenta el lenguaje, la organización del texto y la redacción del informe.

El lenguaje de la tesis debe ser adecuado al objeto de estudio y a la ciencia donde se desenvuelve la investigación. El tesista debe mostrar dominio de los términos empleados en la tesis, así como del área de investigación donde se desarrolla. La claridad es vital, la escritura debe ser accesible, explicar con pocas palabras y describir los conceptos difíciles de comprender. La sintaxis debe ser adecuada y el vocabulario al alcance de los lectores, no se deben usar palabras ambiguas o vagas. Se debe escribir en un estilo sobrio y mesurado.

La organización del texto, la redacción debe escribirse en forma impersonal, es decir, en tercera persona del singular. Escribir con mayúscula cuando sea necesario, sin abusar de su uso. Se debe revisar la versión impresa con el fin de constatar un correcto paginado, si las citas están entrecomilladas y referidas, si se corresponde el mero de las notas con la referencia y se aprecia correctamente en el texto; si la bibliografía está ordenada de acuerdo a la norma Vancouver o APA, y si cuenta con todos los datos necesarios, ya sea libro o artículo de revista.

La redacción del informe debe estar en tiempo pasado. La introducción, fundamentación y marco teórico se redacta en presente, ya que son aspectos válidos hasta el momento y que mantienen su vigencia. La metodología y los procedimientos se escriben en pasado, pues representan acciones ya realizadas. Los resultados se escriben en pasado, pues fueron encontrados antes de escribir la tesis. En la discusión al debatir y opinar sobre contenidos de otros autores se escribe  en  presente,  pues  son  conocimientos  actuales  que  se  usan  como referencia;  cuando  se  comentan  los  resultados  obtenidos, se  escriben  en pasado.

Es importante que el tesista sepa que debe utilizar todo lo mencionado en este post como modelo y no interpretarlas como documento normativo. Un trabajo de tesis, no debe juzgarse sólo por su forma sino principalmente por la calidad de su contenido. La  amplitud de temas en que podría desarrollarse una tesis de maestría o doctorado, para cualquier carrera, hace infructuoso cualquier esfuerzo por diseñar un patrón para el informe de la tesis.

lunes, 6 de noviembre de 2017

Criterio 6: El Comportamiento de los Datos

El sexto y último criterio para elegir un procedimiento estadístico para el análisis de datos es el comportamiento de los datos. Este criterio es el más desconocido de todos, la bibliografía habla muy poco, pero es un criterio real a tomar en cuenta. Pensemos en la prueba Chi cuadrado, que tiene una corrección que se llama la corrección de Yates, y se aplica cuando una de las casillas esperadas en la tabla de contingencia está por debajo de un valor esperado, sucede cuando se tiene muy pocos datos y la muestra es pequeña; entonces se hace una corrección, ya que no se sabía que esto iba a ocurrir desde el momento en que se planeó el estudio, en lugar de aplicar Chi Cuadrado, se aplica la corrección de Yates.

Otro ejemplo, cuando se comparar dos grupos y la variable aleatoria a comparar es numérica. Una variable aleatoria es aquella que cuando se realiza un estudio,  recién te enteras de su valor cuando la mides. Entonces en una comparación de dos grupos, se tiene dos variables, la variable de conformación de grupo (es fija) y la variable aleatoria que se va a medir, se aplica entonces t de Student para muestras independientes. Pero si la variable aleatoria no tiene distribución normal, entonces se decide aplicar la U de Mann-Whitney, que es su equivalente no paramétrico. A pesar de que el tipo, el nivel y diseño de investigación es el mismo, es la misma variable, el mismo atributo de la variable y el mismo objetivo del estudio; pero no cumple el criterio del comportamiento de los datos, ya que la variable aleatoria no presenta distribución de normalidad, se debe cambiar de prueba estadística, de la t de Student a la U de Mann-Whitney.

Las variables numéricas son continuas y discretas. El problema de la normalidad es para las variables continuas, ya que cuando se usa una variable continúa, se parte de la premisa de que tiene distribución normal.

Pero cuando se trabaja con variables discretas no se parte de esa premisa, porque la variable discreta es conteo, es número entero; por ejemplo, número de pacientes que llegan, número de clientes que se atiende, número de alumnos en un salón, el número de hijos en una familia.

Las variables discretas tienen distribución binomial o distribución Poisson, ¿Cuál es la diferencia?, la distribución binomial tiene un límite, mientras que la distribución de Poisson no tiene límite.

Entonces los procedimientos analíticos que se desarrollan para la distribución normal,  la distribución binomial y la distribución Poisson son distintos, muchas veces nos enfocados nada más en la distribución normal, pero la distribución normal es para las variables continuas y cuando de variables numéricas se trata, se tiene variables continuas y variables discretas y la diferencia entre las variables numéricas está precisamente ahí, no está en las escalas de medición: escala de intervalo y escala de razón, desde el punto de vista aleatorio se comportan de la misma manera.

En las variables categóricas, nos enfocamos en las escalas de medición nominal y ordinal porque los procedimientos estadísticos para una y otra escala, sí son distintos. Cuando se tiene una variable, no se conoce su distribución, hasta que no se realice una prueba de contraste, es decir la prueba de Kolmogórov-Smirnov, que pone a prueba o somete a contraste la distribución de una variable respecto de la distribución normal, pero Z de Kolmogórov-Smirnov es mucho más que eso; se puede someter a contraste la distribución de una variable a cualquier otra distribución y Kolmogórov-Smirnov es versátil frente a esa situación. Aspecto que no lo hace Shapiro-Wilks, ni Anderson-Darling, por eso es que esta prueba estadística es más difundida, porque es más versátil que los otros procedimientos, para demostrar no tanto la normalidad, sino el contraste con otros tipos de distribución.

Para estar seguros frente a qué distribución nos encontramos, se tiene que hacer una prueba de hipótesis, hacer un contraste, un procedimiento analítico; porque de eso va a depender el análisis estadístico más adelante.