Comentarios acerca de temas relacionados con los métodos y técnicas Estadísticas y de su aplicación en la Investigación Científica.
miércoles, 6 de diciembre de 2017
lunes, 4 de diciembre de 2017
Nivel de Significancia y p-valor
En toda prueba de hipótesis, uno de los primeros pasos es escoger un nivel de significancia; α, para la prueba. Tradicionalmente se escoge un nivel de
significancia de α = 10; 5 o 1%. ¿Pero por qué utilizar solamente
esos valores?
Cuando se analiza los errores tipo I (rechazo incorrecto de Ho) y tipo II (aceptación
incorrecta de Ho), la elección del
nivel de significancia va a depender de un equilibrio entre los costos de cada
uno de estos dos tipos de error. Si el costo de un error tipo I es relativamente
alto, se evitará cometer este tipo de error y, en consecuencia, se escogerá un
valor pequeño de α. Por otro lado, si un error de tipo II es relativamente más caro, es preferible cometer un error
del tipo I, y se escogerá un valor alto de α. Sin embargo, entender la naturaleza del
equilibrio no dice mucho de la forma de escoger un nivel de
significancia.
Suponga
que tomamos una muestra, calculamos la media (muestral) y luego preguntamos:
"Suponiendo que Ho
fuera verdadera, ¿cuál es la probabilidad de obtener un valor de la media a esta distancia de la media de la
población?" A esta probabilidad se le conoce como p-valor. Mientras que
antes nos hacíamos la pregunta: "¿Es la probabilidad que se ha observado
menos que α?" Ahora se pregunta:
"¿Qué tan improbable es el resultado que se ha observado?" Ya que se
ha informado el p-valor de la prueba, entonces el tomador de decisiones puede evaluar
los factores relevantes y decidir si acepta o rechaza Ho, sin verse
limitado por un nivel de significancia dado de antemano.
El p-valor proporciona más información. Si se sabe que se
ha rechazado Ho al nivel α
= 0.05, solamente sabe que la media se encuentra al menos 1.96 errores estándar
alejado de la media poblacional. Sin embargo, un p-valor de 0.05 nos dice que la
media muestral está exactamente a 1.96 errores estándar de la media poblacional.
Desde que se tiene una muestra y se quiere inferir sobre la
población, la teoría de la probabilidad ayuda a estimar las probabilidades que
la muestra representa en la población. No se puede saber ciertamente, al menos
que se tenga a la población entera, pero la teoría de la probabilidad permite
establecer el nivel de confianza acerca de qué tan probable es que la muestra
refleja algo que es cierto en la población.
La significancia estadística indica que los resultados no
se deben al azar, pues las muestras probabilísticas involucran un proceso
aleatorio, por lo que siempre es posible que los resultados de la muestra
difieran del parámetro poblacional. El investigador estima las probabilidades
con las que los resultados de una muestra son resultado del parámetro
poblacional o el azar del muestreo aleatorio. La significancia estadística usa
la teoría de la probabilidad y pruebas estadísticas específicas para decirle al
investigador si los resultados, ya sea de asociación, de diferencia entre dos
medias o un coeficiente de regresión, son producidos por un error aleatorio
dentro de un muestreo aleatorio.
La significancia estadística sólo dice lo que es
probable, no puede probar nada con absoluta certeza, establece si los
resultados son o no menos probables.
Los investigadores expresan la significancia estadística
en términos de niveles (de significancia), es decir una prueba es significativa
estadísticamente a un nivel específico, mejor que especificar la probabilidad.
El nivel de significancia estadística es una forma de expresar la probabilidad
de que los resultados se deben al azar.
Si se quiere indicar que los resultados son
significativos a un nivel de 0.05, se podría expresar cualquiera de las
siguientes modos:
- Resultados como éstos son debidos al azar únicamente de 5 en 100 veces.
- Existe un 95% de posibilidades de que los resultados de la muestra no son debidos al azar, sino refleja lo que ocurre en la población.
- Las probabilidades de que los resultados se basen exclusivamente en el azar son de 0.05 o de 5%.
- Significa que existe un 95% de confianza de que los resultados se deben a un comportamiento en la población y no al azar.
La mayoría de los programas estadísticos dan como
resultado el p-valor exacto, no solo para pruebas sobre medias basadas en la
distribución normal, sino también para otras pruebas como ji-cuadrada y
análisis de varianza y pruebas en el contexto de la regresión lineal. Aunque se
tengan diferentes estadísticas y distribuciones, la idea del p-valor es la
misma.
El uso de la computadora ha hecho a un lado mucho de lo tramposo de la prueba hipótesis, y mediante el uso de p-valores, se elimina la búsqueda de valores en una tabla. Puede ser un tanto desconcertante el hecho de que cuanto más pequeño sea el p-valor, más grande será la significancia de lo encontrado. Se puede evitar tener confusión en este punto si se recuerda que los p-valores son la posibilidad de que el resultado en cuestión haya podido ocurrir exclusivamente debido a un error de muestreo; en consecuencia, cuanto menor sea es mejor.
El uso de la computadora ha hecho a un lado mucho de lo tramposo de la prueba hipótesis, y mediante el uso de p-valores, se elimina la búsqueda de valores en una tabla. Puede ser un tanto desconcertante el hecho de que cuanto más pequeño sea el p-valor, más grande será la significancia de lo encontrado. Se puede evitar tener confusión en este punto si se recuerda que los p-valores son la posibilidad de que el resultado en cuestión haya podido ocurrir exclusivamente debido a un error de muestreo; en consecuencia, cuanto menor sea es mejor.
miércoles, 29 de noviembre de 2017
lunes, 27 de noviembre de 2017
La Discusión de los Resultados de una Investigación
En una investigación, casi siempre se
obtiene más información de las que muestran
los instrumentos usados. Esa información es muy valiosa para explicar, describir o analizar los datos que se presenta
en los resultados. Los resultados suelen
presentarse ordenados por cada objetivo. Sin embargo,
muchas veces los datos están relacionados con información proveniente de una tabla, es comparable o
analizable con la proveniente de otras tablas.
En estos casos, es necesario triangular la información, es decir, cruzarla de tal forma que muestre una visión integrada y coherente, esa es la
esencia de los resultados.
Los resultados se presentan en forma
clara y breve. Se incluyen sólo los datos
importantes resumidos en tablas o gráficas. Si la investigación se refiere a diferentes
variables independientes, relacionadas con el efecto o variable dependiente,
sólo se presentan las asociaciones
significativas omitiendo las otras, que se pueden mencionar en caso aporten
algo importante para el análisis.
La presentación de los resultados es
un aspecto diferente de discusión de los resultados,
y se presentan separados porque emplean
procedimientos y categorías de análisis y síntesis distintos.
Es difícil explicar los datos crudos;
primero se presentan y analizan los datos, luego
se interpretan o discuten los resultados del análisis. Los resultados requieren la interpretación (discusión), explicación y
el significado de dichos datos para entender el problema de investigación.
Discutir significa analizar la calidad de los resultados
de la manera más objetiva posible. Una buena discusión de resultados exige
mucho criterio, argumentos sólidos y
conocimiento amplio del tema que se investiga.
La
discusión de los resultados debe responder las siguientes preguntas:
·
¿Por qué confiar en los
resultados presentados en la investigación?
·
¿Qué limitaciones de la investigación
deben tenerse en cuenta en futuros estudios?
·
¿Cómo afectan esas
limitaciones a los resultados? (validez interna).
·
¿Se puede generalizar los
resultados a otros contextos, tiempos, productos o situaciones?
·
¿Se puede aplicar los resultados
en otros campos? ¿Por qué? (validez externa o generalización).
·
¿En qué se diferencian o
asemejan los resultados a los obtenidos por otros investigadores?
·
¿Por qué cree que
ocurren esas semejanzas o diferencias?
·
¿Qué aporte nuevo al
conocimiento han traído los resultados?
·
¿Se han contrastado las
hipótesis?¿Se han aceptado o rechazado?
·
¿Qué nuevas hipótesis o ideas de investigación han surgido de la investigación?
Si se responde a cada una de las preguntas anteriores, son
los argumentos de la discusión de la investigación. Además se deben considerar
los siguientes aspectos:
Realizar la discusión de todos los resultados: Plantear nuevas hipótesis desde los resultados. Comparar sus resultados con los
antecedentes o el modelo teórico presentado. Discutir las contradicciones,
semejanzas y diferencias de los resultados con
investigaciones anteriores.
Analizar la validez y generalización de los resultados
obtenidos: Argumentar la posibilidad de generalizar los resultados. Discutir
cómo los resultados pueden ser aplicables a otras situaciones y
contextos. Analizar la validez y generalización
del método; analice sus limitaciones.
Contrastar las hipótesis con los resultados: Comparar las hipótesis iniciales con los
resultados obtenidos. Indicar si se aceptan o se rechazan las hipótesis y explicar por qué se aceptaron o
rechazaron
En resumen, la discusión, debe ser clara y consistente con los
resultados. Sus características son:
·
Relaciones y generalizaciones según las tablas.
·
Señalar las excepciones
o faltas de correlación y concretar aspectos no
resueltos sin alterar los datos.
·
Señalar las
concordancias o discordancias con investigaciones anteriores.
·
Describir las
aplicaciones prácticas de los resultados.
jueves, 23 de noviembre de 2017
domingo, 19 de noviembre de 2017
Validez de una Investigación
La validez
de un diseño de investigación o tesis se compone de dos conceptos: la validez
en la interpretación de los resultados y la generalización de los resultados a
otros grupos de personas. La primera se denomina validez interna y la segunda,
validez externa.
La validez interna de los resultados del
estudio de investigación o tesis son producto de las variables manipuladas o
medidas por el investigador; no se incluye el efecto de otras variables que no
haya sido tratada sistemáticamente.
La validez externa de un estudio de
investigación o tesis se refiere que los resultados obtenidos pueden
generalizarse a otros grupos, diferentes de las observadas en el estudio; y, si
los resultados obtenidos en el experimento, pueden extenderse al mundo real.
En
general existe una situación complicada en optimizar la validez interna y
externa. Cuando el investigador selecciona un diseño fuerte para controlar la
validez interna, su trabajo lo desarrolla en situaciones que no están presentes
en la realidad natural y por tanto los resultados producto de las variables que
manipula no se pueden generalizar a otras poblaciones. Buscando aumentar la
validez externa, el investigador trabaja en el mundo real y no en situaciones
altamente controladas como el laboratorio; en consecuencia las conclusiones se
ven afectadas por la validez interna.
La
polémica de los investigadores se centra en cómo obtener un equilibrio, aumentar
la validez interna sin disminuir la externa. Este equilibrio va depender en
gran medida del conocimiento y experiencia del investigador y de su capacidad
para encontrar el diseño apropiado de la investigación que realiza. Algunos
estudios de laboratorio se pueden realizar en condiciones del mundo real como
sucede en los estudios de campo, los cuales facilitan un control parcial de las
variables qué afectan la validez interna del diseño.
La
evaluación de toda investigación, además de la validez interna y externa, exige
analizar la validez de construcción, para esto, se determina:
a.
la
correcta representación de las definiciones operacionales;
b.
en
qué medida el diseño permite alcanzar conclusiones de causalidad entre las variables
independientes y dependientes, o sea, el análisis de la validez interna que
ofrece el diseño;
c.
la
extensión con que la muestra del estudio permite generalizar los resultados a
otras poblaciones y situaciones, es decir, la validez externa.
lunes, 13 de noviembre de 2017
Al redactar el informe de tesis
El informe de tesis es el documento donde se presentan
los resultados alcanzados por el tesista en su trabajo de investigación. Se debe
presentar de forma sistematizada, lógica y objetiva, en correspondencia con el proyecto
presentado, discutido y
aprobado para la búsqueda de soluciones al problema
planteado. En muchas ocasiones a pesar de tener resultados relevantes, la forma en que se presentan no los hace comprensibles y
se pierda la calidad de la investigación; por tanto, el informe de la tesis debe tener en cuenta
dos
tipos de requisitos: de fondo y de forma.
En los requisitos de fondo, el informe de tesis debe contener unidad, demostración, profundidad y
originalidad.
Unidad, es la
armonía de las partes con el todo. Las ideas, tanto principales como secundarias
deben estar en armonía. Aunque existan varias ideas, hay una que es la idea fundamental, la base de la investigación
y el objeto final de la misma. Las otras ideas son secundarias
con respecto a ella.
Demostración, la
tesis debe ser demostrada
mediante el razonamiento lógico de los resultados a través de los procesos análisis
y discusión que debe llevar a conclusiones.
Profundidad, la tesis debe enfocarse
en la esencia del problema,
no debe limitarse a
sus cualidades
fenomenológicas.
Originalidad,
la tesis tiene por objeto una materia que demostrable, y esto se logra mediante el
análisis de los intentos realizados anteriormente por otros investigadores, o por el propio investigador, de resolver
el problema.
En los requisitos de forma, se debe tener en cuenta el
lenguaje, la organización del texto y la redacción del informe.
El lenguaje de la tesis debe ser adecuado
al objeto de estudio y a la ciencia donde se
desenvuelve la investigación.
El tesista debe mostrar dominio
de los términos empleados en la
tesis, así como del área de investigación donde se desarrolla. La claridad es vital, la escritura
debe ser accesible, explicar con pocas palabras
y describir los conceptos difíciles de comprender.
La sintaxis debe
ser adecuada y el vocabulario
al alcance de los lectores, no se
deben usar palabras ambiguas
o vagas. Se debe escribir en un
estilo sobrio y mesurado.
La organización del texto, la redacción debe escribirse en forma impersonal, es decir, en tercera persona del singular. Escribir con mayúscula cuando sea necesario, sin abusar de su uso. Se debe revisar la versión impresa con el fin de constatar
un correcto paginado,
si las citas están entrecomilladas y referidas,
si se corresponde el número de las notas con la referencia y se aprecia correctamente en el texto; si la bibliografía está ordenada
de acuerdo a la norma Vancouver o
APA, y si cuenta con todos
los datos necesarios, ya sea libro o artículo de revista.
La redacción del informe debe estar en tiempo pasado. La
introducción, fundamentación y marco teórico se redacta en presente, ya
que son aspectos válidos hasta el momento y que mantienen su vigencia. La metodología
y los
procedimientos se escriben
en pasado,
pues representan acciones ya
realizadas. Los resultados se escriben en pasado, pues fueron encontrados antes de escribir la tesis. En la discusión
al debatir y opinar sobre contenidos de otros autores se escribe
en
presente,
pues
son
conocimientos
actuales que se usan como
referencia; cuando se comentan
los
resultados obtenidos, se escriben en pasado.
Es importante que el tesista sepa que debe utilizar todo
lo mencionado en este post como modelo
y no
interpretarlas como documento normativo. Un trabajo de tesis, no debe juzgarse sólo por su forma sino principalmente por la calidad de su contenido. La amplitud de temas en que podría desarrollarse una tesis de maestría
o doctorado, para cualquier
carrera, hace
infructuoso cualquier esfuerzo por diseñar
un patrón para el
informe de la tesis.
martes, 7 de noviembre de 2017
lunes, 6 de noviembre de 2017
Criterio 6: El Comportamiento de los Datos
El sexto y último criterio para elegir un procedimiento
estadístico para el análisis de datos es el comportamiento de los datos. Este
criterio es el más desconocido de todos, la bibliografía habla muy poco, pero
es un criterio real a tomar en cuenta. Pensemos en la prueba Chi cuadrado, que tiene
una corrección que se llama la corrección de Yates, y se aplica cuando una de
las casillas esperadas en la tabla de contingencia está por debajo de un valor
esperado, sucede cuando se tiene muy pocos datos y la muestra es pequeña; entonces
se hace una corrección, ya que no se sabía que esto iba a ocurrir desde el
momento en que se planeó el estudio, en lugar de aplicar Chi Cuadrado, se aplica
la corrección de Yates.
Otro ejemplo, cuando se comparar dos grupos y
la variable aleatoria a comparar es numérica. Una variable aleatoria es aquella
que cuando se realiza un estudio, recién
te enteras de su valor cuando la mides. Entonces en una comparación de dos
grupos, se tiene dos variables, la variable de conformación de grupo (es fija)
y la variable aleatoria que se va a medir, se aplica entonces t de Student para
muestras independientes. Pero si la variable aleatoria no tiene distribución
normal, entonces se decide aplicar la U de Mann-Whitney, que es su equivalente
no paramétrico. A pesar de que el tipo, el nivel y diseño de investigación es el
mismo, es la misma variable, el mismo atributo de la variable y el mismo
objetivo del estudio; pero no cumple el criterio del comportamiento de los
datos, ya que la variable aleatoria no presenta distribución de normalidad, se debe
cambiar de prueba estadística, de la t de Student a la U de Mann-Whitney.
Las variables numéricas son continuas y
discretas. El problema de la normalidad es para las variables continuas, ya que
cuando se usa una variable continúa, se parte de la premisa de que tiene
distribución normal.
Pero cuando se trabaja con variables discretas
no se parte de esa premisa, porque la variable discreta es conteo, es número
entero; por ejemplo, número de pacientes que llegan, número de clientes que se atiende,
número de alumnos en un salón, el número de hijos en una familia.
Las variables discretas tienen distribución
binomial o distribución Poisson, ¿Cuál es la diferencia?, la distribución
binomial tiene un límite, mientras que la distribución de Poisson no tiene límite.
Entonces los procedimientos analíticos que se
desarrollan para la distribución normal, la distribución binomial y la distribución
Poisson son distintos, muchas veces nos enfocados nada más en la distribución
normal, pero la distribución normal es para las variables continuas y cuando de
variables numéricas se trata, se tiene variables continuas y variables
discretas y la diferencia entre las variables numéricas está precisamente ahí,
no está en las escalas de medición: escala de intervalo y escala de razón,
desde el punto de vista aleatorio se comportan de la misma manera.
En las variables categóricas, nos enfocamos en
las escalas de medición nominal y ordinal porque los procedimientos
estadísticos para una y otra escala, sí son distintos. Cuando se tiene una
variable, no se conoce su distribución, hasta que no se realice una prueba de
contraste, es decir la prueba de Kolmogórov-Smirnov, que pone a prueba o somete
a contraste la distribución de una variable respecto de la distribución normal,
pero Z de Kolmogórov-Smirnov es mucho más que eso; se puede someter a contraste
la distribución de una variable a cualquier otra distribución y Kolmogórov-Smirnov
es versátil frente a esa situación. Aspecto que no lo hace Shapiro-Wilks, ni Anderson-Darling,
por eso es que esta prueba estadística es más difundida, porque es más versátil
que los otros procedimientos, para demostrar no tanto la normalidad, sino el contraste
con otros tipos de distribución.
Para estar seguros frente a qué distribución
nos encontramos, se tiene que hacer una prueba de hipótesis, hacer un contraste,
un procedimiento analítico; porque de eso va a depender el análisis estadístico
más adelante.
Suscribirse a:
Entradas (Atom)




