CAPÍTULO I MÉTODOS NO PARAMÉTRICOS
La estadística puede definirse como un método de razonamiento para describir e interpretar información, cuya característica fundamental es la variabilidad de los datos.
En la estadística inferencial, sea ésta paramétrica o no paramétrica, realizamos pruebas de hipótesis; lo cual nos ayuda a decidir con un riesgo de error pre-establecido, la no aceptación de la hipótesis nula.
Las pruebas estadísticas paramétricas son aquellas que formulan hipótesis sobre la distribución de probabilidades y los parámetros de las poblaciones y que requieren por consiguiente, como requisitos básicos para su aplicación de la normalidad de la distribución de los datos y de la homogeneidad de las varianzas, mientras que las pruebas no paramétricas no requieren de este tipo de suposiciones, razón por la cual son también conocidas como de libre distribución. El termino no paramétrica fue propuesto por Wolfowitz en 1942, para indicar que la población bajo estudio no puede ser especificada por un número finito de parámetros y aunque "libre distribución" constituye una descripción mas ajustada, el termino no paramétrico por ser el mas comúnmente usado tiene el valor de uso.
Estas pruebas, a pesar de que son consideradas generalmente como menos potentes que sus equivalentes paramétricas (cuando los datos reúnen los requisitos), presentan varias ventajas, entre las cuales se encuentran las siguientes:
Ventajas de los métodos estadísticos no paramétricos
- Son menos exigentes que las pruebas paramétricas al no requerir del supuesto de distribución normal de los datos y son más eficientes cuando en la muestra hay datos atípicos o aberrantes.
- En general, las probabilidades obtenidas de la mayoría de las pruebas 'no paramétricas son probabilidades exactas, excepto cuando se usan aproximaciones para grandes muestras.
- Si los tamaños de las muestras son pequeños (n < 6), las pruebas no paramétricas son la única alternativa razonable a menos que se conozca la distribución exacta de la población. La eficiencia de los métodos no paramétricos es alta cuando se trabaja con muestras pequeñas.
- Constituyen una herramienta analítica de gran utilidad en aquellos casos en los que es difícil establecer una escala de valores cuantitativos para los datos, por ejemplo cuando estos se encuentran en un orden de clasificación como "mejor" o "peor" ,"mayor o menor que", "desagradable", "muy desagradable", "aceptable, entre otros, es decir, para el análisis de datos medidos en escala "nominal" y "ordinal", como ocurre con datos inherentes a rangos o a información numérica con fuerza de rangos.
- En algunos casos, aunque la población de la cual se extrajo la muestra este normalmente distribuida su eficiencia es levemente menor a la de la alternativa paramétrica correspondiente.
Desventajas de los métodos estadísticos no paramétricos
- Cuando las muestras son muy grandes y se cumplen los supuestos (ley del teorema central del limite), la eficiencia de la pruebas paramétricas es superior.
- Tienden a perder información, sobre todo cuando datos numéricos son expresados en forma cualitativa, ya que al no tomar en consideración la magnitud de los datos esto se traduce en un desperdicio de información.
- El análisis de varianza no paramétrico, sea este para muestras pareadas o independientes no permite la evaluación de las interacciones, lo cual es ampliamente utilizado en los métodos paramétricos.
- La diversidad de pruebas de rangos múltiples para la separación de medias a posteriori es mayor (Duncan, Student-Newman-Keuls (SNK), Tukey, Bonferoni, Scheffé, MDS) en las pruebas paramétricas que en las no paramétricas, ya que estas ultimas recurren básicamente a la Mínima Diferencia Significativa
Niveles de medida o escalas de medición de las variables
Medir consiste en asignar números o atributos a individuos de acuerdo con reglas establecidas a priori. Las variables pueden ser discretas o continuas. Las variables continuas son aquellas que pueden tomar cualquier valor en un intervalo real, por ejemplo cualquier valor entre O y 100 y puede tomar un número infinito de diferentes valores, así como valores entre cualesquiera dos valores. Una variable discreta es aquella que solo puede tomar un número finito de valores, por ejemplo O, 10,20, 100,1000....
Nominal: se realiza una medida nominal cuando el rasgo estudiado en los individuos es cualitativo y el uso de números es únicamente para darle un nombre a la categoría que los agrupa y en este caso números distintos lo único que significa es que las categorías son diferentes entre si, por ejemplo en un ensayo asignamos el número O a los individuos menores de un año y el numero 1 a los individuos mayores de 1 año de edad o viceversa. También podemos utilizados en lugar de la raza, así tendríamos por ejemplo: Pardo Suiza (1); Holstein (2), Gyr (3) y el hecho de cambiar la asignación de los números, es decir que Gyr sea 1, Holstein 3 y Pardo Suiza 1, es totalmente factible, ya que el uso de los mismos es meramente nominal.
Ordinal: en este caso el valor numérico es utilizado para indicar orden, tales como mayor que..., menor que …, igual que, por ejemplo cuando se ordenan los alumnos de un curso en base a sus calificaciones. La asignación de los números aunque arbitraria exige que se conserve la relación de orden.
Intervalo:La escala de intervalo involucra una unidad de medida y contiene un punto convencional de referencia, que es el cero, siendo por consiguiente una escala realmente cuantitativa y su ejemplo clásico lo constituye la escala de un termómetro. Esta escala permite interpretar la diferencia entre dos medidas, como por ejemplo el incremento de la temperatura en individuos inoculados experimentalmente con un agente patógeno, quienes antes de la inoculación tenían una temperatura corporal de 36°C. y 3 a los 5 días post inoculación su temperatura es de 39°C, decimos que la misma se incremento en 3°C.
Proporción: esta escala además de la información acerca de las relaciones de orden y de distancia, aporta información sobre la razón o proporción entre dos observaciones y puede asignarse al rasgo estudiado, números que, además de poseer las características de la medida de intervalo, tengan una escala de cero absoluto como por ejemplo el tiempo transcurrido entre la inoculación de un agente patógeno y la aparición de los síntomas en los individuos inoculados. Esta escala tiene una unidad de medida en el punto de referencia cero, pero este no es convencional ya que es una medida natural, como el peso, la altura etc.
POTENCIA - EFICIENCIA DE UNA PRUEBA ESTADÍSTICA
La confiabilidad en el uso de una prueba estadística no paramétrica con respecto a la alternativa paramétrica se establece a través del concepto de potencia - eficiencia de una prueba, que se refiere al aumento porcentual del tamaño de muestra que se necesita para obtener los mismos resultados con una prueba b, considerada no tan poderosa con respecto a otra prueba identificada como a, reconocida como la mas potente cuando se cumplen los supuestos teóricos para poder efectuar la misma. La potencia - eficiencia puede calcularse con la formula siguiente: P - E = (Na / Nb) 100, en la cual N, se refiere al tamaño de muestra requerido con la prueba a (Na) y la prueba b (Nb). Es decir la eficiencia de una prueba b relativa a otra prueba a, para una hipótesis alternativa simple, se define como la razón de tamaños muéstrales Na / Nb, tales que con ellos, ambas pruebas tienen la misma potencia contra la hipótesis alternativa, para un mismo nivel de significancia especificado previamente, esto significa que si la potencia eficiencia de una prueba b es del 80% con respecto a la prueba a, significa que se requieren 10 casos en la prueba b por cada 8 casos por la prueba a.
CRITERIOS PARA LA SELECCIÓN DE UNA PRUEBA ESTADÍSTICA NO PARAMÉTRICA
Con datos cuantitativos las pruebas no paramétricas generalmente se utilizan cuando el tamaño de los grupos es pequeño (n<30), debido a que para muestras grandes las distribuciones de las medias se consideran siempre como normales y por consiguiente pueden aplicarse las pruebas paramétricas, sin embargo no existe ningún impedimento en utilizar pruebas no paramétricas con muestras con n > 30, sobre todo ahora que disponemos de paquetes estadísticos comerciales que incluyen a estas pruebas y nos evitan los sencillos aunque tediosos cálculos aritméticos que requieren la mayoría de las pruebas no paramétricas.
En caso de disponer de un conjunto de datos cuantitativos o en escala ordinal y deseamos saber si los mismos se ajustan a un modelo de distribución teórica, recurrimos a la prueba de Kolmogorov - Smirnov.
Para evaluar el posible ajuste entre las frecuencias teóricas establecidas y las frecuencias observadas sobre una misma población se usa la prueba de bondad de ajuste de ji-cuadrado.
Si deseamos establecer la aleatoriedad de una muestra, tanto con datos cualitativos como cuantitativos u ordinales, la única prueba existente es la de las rachas y no existe ninguna alternativa paramétrica que permita establecer la aleatoriedad de una serie de eventos.
Al realizar comparaciones, debemos definir previamente si se trata de dos grupos pareados y si la información es de tipo cuantitativa o cualitativa. Las pruebas más comunes en estos casos son:
En caso de realizar las comparaciones entre 3 ó mas grupos con los mismos sujetos (pareadas), la prueba de Friedman es la recomendada.
Con 3 ó más grupos independientes, se utilizan de acuerdo al tipo de datos a analizar las siguientes pruebas:
Prueba de Ji- cuadrado con tablas de contingencia de NxK (cualitativa)
Análisis de varianza de una clasificación por rangos de Kruska1- Wallis (cuantitativa) En caso de desear evaluar la existencia de una posible correlación:
Coeficiente de Correlación de Rangos de Spearman (cuantitativa)
GUÍA PARA LA UTILIZACIÓN DE LOS MÉTODOS NO PARAMÉTRICOS
Pruebas para una muestra
PRUEBA DE KOLMOGOROV SMIRNOV DE UNA MUESTRA PRUEBA DE RACHAS PARA UNA MUESTRA
PRUEBA DE JI-CUADRADO DE BONDAD DE AJUSTE
PRUEBA DE RACHAS PARA UNA MUESTRA BASADA EN LA MEDIANA
Pruebas para dos muestras independientes
PRUEBA DE LAS RACHAS DE WALD WOLFOWITZ
PRUEBA DE LA MEDIANA
PRUEBA DE JI-CUADRADO CON TABLAS DE CONTINGENCIA DE 2 X 2.
PRUEBA U DE MANN Y WHITNEY
Pruebas para varias muestras independientes
ANÁLISIS DE VARIANZA DE UNA CLASIFICACIÓN POR RANGOS DE KRUSKAL- WALLIS.
PRUEBA DE JI - CUADRADO CON TABLAS DE CONTINGENCIA DE N x K
Pruebas para dos muestras relacionadas
PRUEBA DE MCNEMAR PARA LA SIGNIFICACIÓN DE LOS CAMBIOS PRUEBA DE LOS SIGNOS
PRUEBA DE RANGOS SEÑALADOS Y PARES IGUALADOS DE WILCOXON
Prueba para varias muestras relacionadas
ANÁLISIS DE VARIANZA DE UNA CLASIFICACIÓN POR RANGOS DE FRIEDMAN
Prueba de asociación para raneos ordenados
PRUEBA DE CORRELACIÓN DE SPEARMAN DE RANGOS ORDENADOS
PAQUETE ESTADÍSTICO INFOSTAT®
El software estadístico InfoStat® es una herramienta muy potente para el diseño experimental, el análisis exploratorio de los datos, así como para el análisis descriptivo, inferencial (univariado, bivariado, empleando tanto métodos paramétricos como de libre distribución) y para realizar análisis multivariados. En cuanto a la capacidad para graficar, se considera que tanto los gráficos como las herramientas para su edición son excelentes y potentes. Además, el manejo de la data es sencillo.
Es indudablemente una extraordinaria herramienta que debe ser bien conocida por todos nuestros investigadores.
CAPÍTULO II EL CASO DE UNA MUESTRA PRUEBA DE KOLMOGOROV SMIRNOV DE UNA MUESTRA
Permite probar si el conjunto de datos se ajusta a un modelo de distribución teórico, es decir, se determina si las observaciones de una muestra provienen de una población con distribución especificada. Las observaciones deben medirse, al menos en escala ordinal. Una de sus aplicaciones es verificar la hipótesis de normalidad de una variable cuantitativa continua en una población a partir de una muestra.
La distribución teórica debe ser completamente especificada (los parámetros deben ser conocidos), por lo cual el usuario debe ingresar el valor de cada parámetro que caracteriza a la distribución, en los campos dispuestos para tal fin.
Se puede probar si la distribución empírica se ajusta a alguna de las siguientes: Normal (media, varianza), T_Student (v), F_Snedecor (u, v), Chi-cuadrado (v), Gama (r, lambda), Beta (a, b), Weibull (a, b), Exponencial (lambda), Gumbel (a, b). La prueba es sensible a cualquier tipo de discrepancia entre las distribuciones. (Dispersión, posición, asimetría, etc.)
InfoStat produce valores p exactos para pruebas bilaterales, obtenidos desde la distribución del estadístico K. (Hollander y Wolfe, 1999)
Obtención de la Prueba
Elija: Estadísticas
Inferencia basada en una muestra
Bondad de ajuste (Kolmogorov)
En el Selector de variables indique la/s variable/s y la partición deseada. Presione Aceptar.
En la ventana de la prueba elija la distribución teórica e ingrese los parámetros en los campos correspondientes. Presione Aceptar.
La ventana Resultados mostrará la información solicitada.
Ejemplo: se desea probar si la distribución del generador de momentos aleatorios de una calculadora es uniforme en [0,1], usando la prueba de Kolmogorov–Smirnov. Para ello se generaron 10 números aleatorios (N. A ) que fueron. (Castillo y Ojeda, 1994):
N. A
0,29
0,51
0,58
0,84
0,23
0,88
0,96
0,75
0,59
0,08
Resultado: se acepta la Ho (p>0,05), por lo tanto puede concluirse que en la muestra no hay suficiente evidencia para afirmar que la distribución en estudio no es uniforme en [0,1]. Lo cual podemos confirmar gráficamente a través del Q-Q plots.
Prueba estadística alternativa
La prueba alternativa es la de ji – cuadrado, con cálculos manuales muy sencillos, pero es menos poderosa que la de Kolmogorov–Smirnov
PRUEBA DE RACHAS PARA UNA MUESTRA
Se define como racha a la sucesión de símbolos idénticos que pueden estar o no separados por otros símbolos. La prueba de rachas esta basada en el número de rachas de una muestra y es de utilidad para determinar la aleatoriedad de la misma. Una muestra es aleatoria si cada elemento de la población tiene igual oportunidad de ser incluido en la muestra , esta suposición es fundamental para todas las pruebas estadísticas, pero su cumplimiento es difícil en situaciones en las que tenemos poco o ningún control sobre la selección de los datos o cuando dependemos de registros , en estos casos es posible investigar la aleatoriedad de la muestra en base al orden en que se obtuvieron las observaciones individuales y no contempla ningún tipo de supuesto acerca de la distribución de los parámetros poblacionales .Esta prueba esta basada en el orden de los eventos y proporciona información que no esta indicada por la frecuencia de los eventos, aspecto este de gran importancia en pruebas como la ji-cuadrada. La formulación de hipótesis (dos colas) con esta prueba es la siguiente:
Ho= La secuencia es aleatoria.
H1= La secuencia no es aleatoria.
Potencia eficiencia: este concepto no se puede aplicar a la prueba de las rachas porque no existen pruebas paramétricas para la aleatoriedad de la serie de eventos de una muestra. El presente ejemplo se realizara con variables cualitativas en el cual los números tienen carácter nominal. (varón = 1; hembra= 2)
Ejemplo: En un hospital se evaluó la secuencia de nacimientos de niños y niñas en horas nocturnas con el fin de establecer si dicha secuencia era aleatoria, a tal efecto se formularon las siguientes hipótesis:
Ho= La secuencia de nacimientos en relación al sexo de los bebes es aleatoria.
H1= La secuencia de nacimientos en relación al sexo de los bebes no es aleatoria.
Obtención de la Prueba
Elija en la barra de herramientas: Estadísticas Inferencia basada en una muestra Prueba de Rachas
En el selector de VARIABLES indique la variable y partición deseada y luego presione ACEPTAR.
En la ventana de la prueba elija la hipótesis a probar activando alguna de las siguientes opciones: La secuencia dada es aleatoria, Tiene tendencia respecto de la mediana (activada por defecto), o Tiene tendencia respecto de...... Si elige la última opción debe ingresar el valor de referencia.
En Mostrar la siguiente información active las casillas correspondientes a la información que desea incluir en los resultados. Presione ACEPTAR.
Resultado: La serie de datos estudiados están distribuidos al azar, es decir se acepta la Ho (P> 0,05)
Calculo manual
Se establece el número de rachas de acuerdo a la secuencia observada
V : Varones (n1 =16) ; H : Hembras (n 2 = 14)
Número de Rachas Observadas: 13
Se calcula la media de las rachas: mr : ( 2 n1 n2 / n1 + n2 ) +1
y la Desviación Estándar de acuerdo a la formula siguiente:
Finalmente y con estos cálculos previos se procede a la realización de la Prueba de Z , de acuerdo a la formula siguiente : Z = rc - mr / sr
Z =( 13 – 15,93 / 2,68 ) = -1,09
1,09 < 1,96 Se acepta la Ho
Resultado: La serie de datos estudiados están distribuidos al azar, es decir se acepta la Ho (P> 0,05)
Uso de las tablas A y B
En las tablas anexas se suministran los valores críticos de r para diferentes valores de n1 y n2 .Para la prueba de las rachas de una muestra , cualquier valor de r que sea igual o menor que el que aparece en la tabla A o igual o mayor que el que aparece en la tabla B es significativo en el nivel 0,05.
En nuestro caso y usando la tabla A , tenemos:
Para n1= 16 y n2= 14, el numero de rachas tabuladas es 10 y el de rachas calculadas es 13, como 13 > 10, se acepta la Ho.
Si usamos la tabla B , el número de rachas tabuladas es 22 y como 13 < 22 , se acepta la Ho.
PRUEBA DE RACHAS PARA UNA MUESTRA BASADA EN LA MEDIANA
Esta prueba responde al mismo procedimiento, pero con la diferencia de que al disponer de información cuantitativa los datos se ordenan de menor a mayor y se establece el valor correspondiente a la mediana, pero para el establecimiento del número de rachas se conserva el orden original de los datos y luego para el análisis aquellos números que son iguales a la mediana se omiten. Para su ejecución se sigue la misma secuencia de pasos y se acepta la opción por defecto presentada en la caja de dialogo en vista de que esta considera a la mediana para la dicotomización de los datos (Por encima y por debajo de la mediana), y estructurar la secuencia de rachas, identificando a los valores superiores a la mediana con la letra A y a los menores con la letra B.
Ejemplo:
Con el fin de evaluar la eficacia de un antihelmíntico, se escogió en una escuela rural a un grupo de niños y a cada uno de ellos se le realizo una coproscopía cuantitativa para establecer la carga parasitaria de cada uno de ellos expresada en huevos por gramo de heces de Ascaris lumbricoides. Se dijo que dichos niños habían sido escogidos al azar ya que ellos serian su propio grupo control en el ensayo. Los resultados de los análisis coproscópicos son presentados a continuación:
Hpg de Ascaris lumbricoides
550
570
520
460
500
480
450
440
500
520
550
410
420
580
600
450
530
540
480
460
510
490
440
430
560
Ho= La selección se hizo al azar
H1= La selección no se hizo al azar
Obtención de la Prueba
Elija en la barra de herramientas: Estadísticas Inferencia basada en una muestra Prueba de Rachas
En el selector de VARIABLES indique la variable y partición deseada y luego presione ACEPTAR.
En la ventana de la prueba elija la hipótesis a probar: La secuencia dada es aleatoria, Tiene tendencia respecto de la mediana (activada por defecto). En Mostrar la siguiente información active las casillas correspondientes a la información que desea incluir en los resultados. Presione ACEPTAR
Resultado: Se acepta la Ho de que la selección fue realizada al azar ya que el valor de P= 0,12 > 0,05
Cálculo manual
Se emplean las mismas formulas que en el caso anterior, pero para el establecimiento de las rachas, se realiza la determinación de la mediana y de acuerdo al orden original de presentación de los datos, se clasifican como por debajo y por encima de la mediana, omitiéndose para la conformación de la secuencia de rachas aquellos datos cuyo valor es cero.
Mediana: 500
Valores > Mediana = A
Valores < Mediana = B
Valores = Mediana = 0 (omitidos), no interrumpen la secuencia de una racha.
Datos
550 570 520 460 500 480 450 440 500 540 550 410 420 580 600 450 530 540 480 460 510 490 440 430 560
Resultado: Como el valor de Z calculado es igual a 0,62 < 1,96, se acepta la Ho, de que la selección de los individuos fue realizada al azar. Debemos hacer notar que en los cálculos manuales, el número de rachas observadas es de 11 , mientras que con el programa es de 10, además el valor de n2 es de 12 en los cálculos manuales y de 14 el suministrado por el programa, ya que este ultimo incorpora el numero de datos correspondientes a la mediana. Al utilizar la tabla A de valores críticos con n1 =11 y n2 = 12 , tenemos que el numero de rachas tabuladas es de 7 < 11 , se acepta la Ho , en caso de utilizar la tabla B ,vemos que el número de rachas tabuladas es 18 >11, legando a la misma conclusión. Esto es debido a que en la prueba de las rachas de una muestra , cualquier valor de rc que sea igual o menor que el que aparece en la tabla “A” o igual o mayor que el que aparece en la tabla “B” , es significativo a un nivel α = 0,05. Si utilizamos la información de salida del programa InfoStat , con n1 = 11 y n2 = 14 y rc = 10 , tenemos para la Tabla A un valor de rt = 8 y para la tabla B , rt = 19 , entonces como 10 > 8 (Tabla A) y para la Tabla B 10 < 19 , se acepta la Ho
rc = rachas calculadas rt =rachas tabuladas
Prueba de Ji-Cuadrado ( X2)
La prueba de Ji-cuadrado es utilizada como prueba de comparación de una repartición observada a una teórica, es decir se utiliza para verificar si una muestra proviene de una población teórica dada, cuando se estudia un carácter cualitativo con K categorías. También se usa como prueba de comparación de varias reparticiones observadas y sirve para verificar si un conjunto de K muestras proceden de una misma población, cuando se estudia un carácter cualitativo con K categorías. Como prueba de independencia entre dos caracteres cualitativos, ya que nos permite estudiar la asociación entre dos caracteres cualitativos con K y L categorías respectivamente.
Las tablas de contingencia, son tablas de clasificación cruzada, elaboradas según diversos criterios de clasificación. Las filas y las columnas de la tabla representan los niveles de las variables usadas como criterios de clasificación. El estadístico para la prueba de hipótesis de independencia o de igualdad de proporciones según corresponda es Chi-cuadrado o Ji-cuadrado y en el caso de tablas de 2x2, InfoStat®, automáticamente calcula la probabilidad exacta de Irwin-Fisher.
Ejemplos:
Uso como Prueba de Bondad de Ajuste
Consiste en hacer comparaciones entre las frecuencias experimentales observadas y las frecuencias teóricas establecidas. A fin de facilitar la comprensión, consideremos el caso en el que los datos obtenidos mediante muestreos, han sido clasificados en categorías, para las cuales las frecuencias esperadas para algunas poblaciones relacionadas se conocen y se desea probar si la muestra puede ser considerada como sacada de esa población.
Ejemplo: Una compañía desea saber cuales son las preferencias de los programas de televisión de opinión y entrevistas trasmitidos a las 6 a.m., por los habitantes de una importante ciudad venezolana, obteniendo los siguientes porcentajes de televidentes por planta:
Luego y debido a que una de las plantas televisoras manifiesta no creer en esos resultados, se procede a realizar una nueva encuesta y se realiza la selección estrictamente al azar de 400 personas a ser entrevistadas, obteniéndose los siguientes resultados:
De acuerdo a los porcentajes suministrados inicialmente por la encuestadora, los resultados deberían ser los siguientes:
El grado de disparidad entre la distribución de frecuencias teóricas esperadas y la distribución de frecuencias observadas, se establece a través de la formula siguiente:
Resultado: para 3 grados de libertad (v = n-1 ; 4-1 = 3), la tabla de X2 , da un valor de 7,8 (P< 0,05), por consiguiente, al ser el valor calculado inferior al tabulado, concluimos que la hipótesis contrastada, o sea, que la distribución porcentual de las preferencias por las plantas televisoras, a las 6 de la mañana, es perfectamente admisible y que por lo tanto, los porcentajes de preferencias suministrados por la encuestadora en su sondeo inicial son validos. En caso de haber obtenido un valor de X2 calculado superior al tabulado, se pudiera concluir o que la muestra no era representativa de la población o que la misma no fue tomada al azar.
Ejemplo 2. Después de numerosos años de estudios clínicos , se constato que los enfermos de cáncer bronco pulmonar primitivo , una vez diagnosticado y sin tratamiento , la sobre vivencia de los pacientes se distribuye de la forma siguiente:
El registro de los tiempos de sobré vivencia de 60 pacientes sometidos a un tratamiento “ T “ que asocia una poli quimioterapia seguida de una radioterapia , permitió obtener la siguiente información:
En base a estos resultados se puede considerar a un nivel del 5% que el tratamiento “ T “ es eficaz?
De acuerdo a los porcentajes de sobrevivencia suministrados derivados de las observaciones clínicas , los resultados deberían ser los siguientes:
El grado de disparidad entre la distribución de frecuencias teóricas esperadas y la distribución de frecuencias observadas, se establece a través de la formula siguiente:
Como el último efectivo de las frecuencias esperadas es inferior a 5, se procede al reagrupamiento de las clases desde los 12 hasta > de 24 meses y obtenemos el siguiente cuadro:
Cálculos: X2 = (6 – 27)2/27 + (24 – 21)2/21 + (30-12)2/12 = 43,76
El valor de X2 suministrado por la tabla a un nivel α = 0,05 para 2 grados de libertad es 5,99.
Resultado: como 4,76 < 5,99, se rechaza la Ho, es decir que a un riesgo α = 0,05 se acepta que el tratamiento es eficaz
La prueba de ji- cuadrado( χ2 )como Prueba de Asociación
Esta prueba es frecuentemente empleada como prueba de asociación, lo cual estadísticamente implica una comparación.
Tablas de Contingencia de 2x2
Ejemplo:
Se desea establecer la posible relación (asociación) existente entre la presencia del antígeno leucocitario B8 y el riesgo de adquirir Diabetes juvenil.
Ho: No existe asociación entre la presencia del antígeno leucocitario B8 y la Diabetes juvenil.
H1: Si existe asociación.
Elija Estadísticas
Datos Categorizados
Tablas de Contingencia > Criterios de Clasificación > Antígeno B8
Diabetes
Frecuencias > Frecuencia observada
Selección de filas y columnas > Antígeno B8(columnas) y Diabetes (Filas) > ACEPTAR
Resultado: Como el valor calculado de X2 = 26,85 > 3,84, se rechaza la Ho de la independencia de la Diabetes y la presencia del antígeno leucocitario B8.
PRUEBA DE JI-CUADRADO CON TABLAS DE CONTINGENCIA DE N x K
Ejemplo:
Se desea evaluar si los tipos de tumores cerebrales tiene una localización especifica en el cerebro de los individuos afectados. Para tal fin se estudiaron las historias médicas de 141 pacientes. Los tumores fueron clasificados como Benignos, Malignos y Otros Tumores. Las localizaciones fueron: Lóbulos Frontales (L.F), Lóbulos temporales (LT) y Otras Áreas Cerebrales (OAC). Los resultados de las historias clínicas fueron los siguientes:
Ho: Los tipos de tumores cerebrales tienen una localización preferencia en el cerebro
H1: Los tipos de tumores cerebrales no tienen una localización preferencial en el cerebro
Disposición de los datos en la hoja de cálculo para la realización del análisis estadístico
Elija Estadísticas
Datos Categorizados
Tablas de Contingencia > Criterios de Clasificación > Localización
Tipos Tumores
Frecuencias > Frecuencia observada
Selección de filas y columnas > Localización (columnas) y Tipos Tumores(Filas) > ACEPTAR
Resultado: Como el valor de X2 calculado < X2 tabulado (7,84 < 9,48) para 4 grados de libertad y a un nivel de probabilidad de 0,05, se acepta la Ho y se descarta la asociación entre el tipo de tumor cerebral y la localización del mismo.
Otro Ejemplo (Tabla N x K)
La siguiente tabla corresponde a la clasificación de los empleados de una empresa, según la sucursal a la que pertenecen y su opinión sobre las oportunidades de ascenso en sus cargos. Los datos pertenecen al archivo Categorizados y fueron tomados de la base de datos de INFOSTAT®.
Forma de ingresar los datos para el análisis de Ji-Cuadrado (N x K)
Elija Estadísticas
Datos Categorizados
Tablas de Contingencia
En el Selector de variables, indique las variables de clasificación y si lo desea, una partición. Si una columna posee las frecuencias observadas, inclúyala en el cuadro Frecuencias. Presione Aceptar.
En la ventana de diálogo en la Etiqueta Selección de filas y columnas a la derecha hay una lista que muestra las variables que se declararon como clasificatorias; seleccione la que representa a las columnas y lo mismo para las filas. En la Etiqueta Opciones, elija la información que desea que contengan las celdas de la tabla (frecuencias absolutas, frecuencias relativas por fila, etc.) activando las casillas correspondientes. También deberá indicar el cálculo del estadístico.
Elija Estadísticas
Datos Categorizados
Tablas de Contingencia > Criterios de Clasificación > Sucursales y OpAscenso
Frecuencias > Frecuencia observada
Selección de filas y columnas > Sucursales (Filas) y OpAscenso (Columnas) > ACEPTAR
Resultado: Se rechaza la Ho de la expectativa de igualdad de oportunidades de ascenso entre las tres sucursales. (p< 0,0001)
CALCULO MANUAL
Luego de estructurar la tabla de contingencia, bien sea de 2x2 o de NxK, se procede a la obtención de los valores esperados correspondientes a cada uno de los valores observados, los cuales se calculan de la manera siguiente:
Total de la columna x total de la fila
Gran Total
Cada uno de los valores esperados se coloca en la tabla de contingencia al lado del valor observado correspondiente.
Para el calculo de χ2 se utiliza la formula siguiente:
χ2 = Σ (O – E )2 ÷ E
En la cual
O: Valores observados.
E: Valores esperados.
En el caso de que en alguna de las casillas tengamos valores esperados inferiores a 5, si se trata de una tabla de NxK, lo mejor seria proceder a reagrupar las casillas y en una tabla de 2x2, se aplicaría la corrección de Yates, con lo cual la formula anterior queda de la manera siguiente:
χ2 = Σ [(O – E)- 0,5]2 ÷ E
El número de grados de libertad será igual al número de filas menos 1, multiplicado por el número de columnas menos 1.
CAPÍTULO IV EL CASO DE DOS MUESTRAS INDEPENDIENTES
PRUEBA DE LAS RACHAS DE WALD WOLFOWITZ
(Prueba de las rachas para dos muestras independientes)
La prueba de las rachas de Wald Wolfowitz, es útil cuando deseamos probar una hipótesis de nulidad que supone dos muestras independientes recogidas de la misma población, frente a una hipótesis alterna que supone una diferencia total entre ellas. Con muestras suficientemente grandes esta prueba puede rechazar la Ho, si las dos poblaciones difieren de alguna manera: en tendencia central, variabilidad etc. Otras pruebas están dirigidas a clases particulares de diferencias entre dos grupos, la prueba de Wald Wolfowitz descubre cualquier clase de diferencia. El fundamento para la realización de esta prueba consiste en colocar los puntajes de N1 + N2, en una serie ordenada y se determina el número de rachas. La determinación de la significación del valor observado de r (número de rachas) depende del tamaño de N1 y N2.
Ejemplo: Con la finalidad de evaluar las posibles diferencias entre los niveles de albúmina serica en personas hospitalizadas y no hospitalizadas, se realizó la medición de la misma en dos grupos de individuos, unos hospitalizados y otros no hospitalizados, obteniéndose los siguientes resultados:
Obtención de la Prueba
Elija en la Barra de Herramientas: Estadísticas • Inferencia basada en dos muestras • Wald-Wolfowitz
En el selector de variables indique las variables a analizar en Variables, el Criterio de Clasificación y las Particiones deseadas. En la ventana de la prueba haga clic en los casilleros cuya información desea obtener. Presione Aceptar.
RESULTADO: Se observo la existencia de diferencias altamente significativas entre los valores de albúmina sérica entre individuos hospitalizados y no hospitalizados.
CALCULO MANUAL
Se ordenan de menor a mayor los valores de la Albúmina Sérica y se le coloca el correspondiente número de código. (0= no hospitalizado; 1= hospitalizado), luego se le coloca a cada valor el símbolo correspondiente a la condición de sano o de hospitalizado y de esta manera se conforman las respectivas rachas
RESULTADO: Se observó la existencia de diferencias altamente significativa entre los valores de albúmina serica entre individuos hospitalizados y no hospitalizados.
Uso de la tabla de valores críticos
Usando la tabla de valores críticos de r en la prueba de las rachas de Wald-Wolfowitz. tenemos:
El número de rachas observadas es de 8, mientras que el número de rachas tabuladas para n1= 17 y n2= 13 (P< 0,05), es de 10, como rc < rt, se rechaza la Ho a un nivel a= 5% y se acepta la H1 de la existencia de diferencias en la concentración de albúmina en el suero sanguíneo de sujetos sanos y hospitalizados. Esto es debido a que en la prueba de las rachas de dos muestras de Wald Wolfowitz , cualquier valor de r calculado que sea menor o igual al que aparece en la Tabla “ A” de valores críticos de "r" en la prueba de rachas es significativo en el nivel α = 0,05.
PRUEBA DE LA MEDIANA (2 grupos independientes)
La prueba de la mediana es un procedimiento estadístico no paramétrico para probar si dos grupos independientes difieren en sus tendencias centrales, en este caso con respecto a la mediana. La hipótesis nula supone que provienen de poblaciones con la misma mediana y la hipótesis alterna puede ser que la mediana de una población es diferente a la de la otra. Esta prueba requiere que los puntajes de los dos grupos estén por lo menos, en una escala ordinal de medición. Las pruebas paramétricas alternativas son la prueba t de student o la de z ( dependiendo de los tamaños de las muestras y/o si se desconocen las variancias de las poblaciones) para dos muestras independientes. Las dos muestras pueden ser de tamaño diferente , pero el nivel de medición debe ser al menos ordinal.
Obtención de la Prueba:
Elija en la Barra de Herramientas: Estadísticas • Inferencia basada en dos muestras • Prueba de la mediana
En el Selector de variables indique las variables a analizar en Variables, el o los Criterios de clasificación y las Particiones deseadas. En la ventana de la prueba haga clic en los casilleros cuya información desea obtener. Completada la información presione Aceptar.
Prueba de la mediana para dos grupos independientes
Estadística descriptiva del contenido de proteína
Resultado : puesto que 0,05 < 3,84 , el valor critico de Χ2 con = 0,5 y 1 grado de libertad, no puede rechazarse la Ho con base en estos datos y se concluye que las dos marcas de leche no difieren en la mediana del contenido de proteína
CALCULO MANUAL
Se ordenan los datos de menor a mayor sin considerar a que grupo pertenecen, pero sin perder su identidad. Se establece la mediana del conjunto combinado de observaciones, luego se clasifican las observaciones de cada grupo dicotomizandolas en mayores o menores que la mediana general, omitiéndose aquellos valores iguales a la mediana. Se elabora una tabla de 2x2 y se sustituyen dichos valores en la siguiente formula:
Χ2 = TG { [(axd) – (bxc) ]2 ÷ (a+c)(b+d)(a+b)(c+d) }
Para el análisis de los datos se puede recurrir tanto a la prueba de ji-cuadrado como a la de Fisher, ambas suministradas en este paquete estadístico.
POR ENCIMA DE LA MEDIANA
MI VAQUITA = 6
LA CUBANA = 3
POR DEBAJO DE LA MEDIANA
MI VAQUITA = 5
LA CUBANA = 4
Resultado: puesto que 0,05 < 3,84, el valor critico de Χ2 con α= 0,05 y 1 grado de libertad ( Tabla C) , no puede rechazarse la Ho con base en estos datos y se concluye que las dos marcas de leche no difieren en la mediana del contenido de proteína.
PRUEBA U DE MANN Y WHITNEY
(Dos Muestras Independientes)
Esta prueba es considerada una de las más poderosas entre las no paramétricas y constituye una alternativa útil frente a la prueba “t” de Student cuando la distribución de los datos no es normal (Doménech, 1981; Morales y Pino, 1977; 1995). Esta prueba permite comparar la tendencia central de las poblaciones origen de dos muestras independientes de tamaño respectivo n1 y n2.. La prueba t de Student para dos muestras, es la alternativa paramétrica de laU de Mann-Whitney. Requiere de la transformación de los valores cuantitativos en ordinales. Para su ejecución con InfoStat se requieren los siguientes pasos:
Ejemplo:
Dos lotes de corderos fueron sometidos a dos raciones diferentes, una cuya fuente proteica principal era la harina de soya (n= 11) y la otra torta de girasol (n= 9). Se desea dilucidar si el origen de la fuente proteica afecto la ganancia de peso de los corderos. (Rodríguez, 2000)
Ho= Las ganancias de pesos de los corderos son similares con ambas raciones.
H1= Las ganancias de peso de los corderos son diferentes con ambas raciones.
Obtención de la Prueba
Elija en la barra de herramientas: Estadísticas • Inferencia en dos muestras • Wilcoxon (Mann-Whitney U)
En el selector de VARIABLES indique las variables a analizar, el o los Criterios de clasificación y las Particiones deseadas, Presione ACEPTAR.
En la ventana de la prueba haga clic en los casilleros cuya información desea obtener. Completada la información presione ACEPTAR. En la ventana Resultados se visualizará la información solicitada.
Resultado: El valor de P<0,05 nos indica la no aceptación de la Ho, lo que se refleja perfectamente en la tabla de resultados, en la cual se observa que la ganancia de peso en los corderos cuya ración contenía harina de soya fue superior.
Pasos Para el Cálculo Manual
Se ordenan de menor a mayor el conjunto de los n1+n2 observaciones y se hallan las sumas R1 y R2 de los números de orden correspondientes a cada una de las muestras. Estas sumas deben satisfacer la propiedad.
R1 + R2 =(n1+n2)(n1+n2+1) / 2
A partir de estas sumas se obtienen los índices:
U1 = n1n2 + n1(n1+1) / 2 –R1
U2 = n1n2 + n2(n2+1) / 2 - R2
Estos valores de U (índices) deben satisfacer la propiedad U1 + U2 = n1n2
La prueba se efectúa con cualquiera de dichos índices, aunque es muy común el que se utilice el de mayor valor. La significación se evalúa mediante la tabla de la ley normal aplicando la formula siguiente:
Z = ( U- n1n2 / 2) /√n1n2(n1+n2+1 / 12
Si el valor de Z resulta igual o inferior a 1,96 se acepta la Ho
Calculo Manual
Se aplicó una prueba de matemática a niños de sexto grado de educación básica (10 del plantel “Arturo Uslar Pietri” y 11 del plantel “Arnoldo Gabaldón”), escogidos al azar. Los porcentajes de respuestas correctas de los niños de ambos planteles son los siguientes:
Plantel Arturo Uslar Pietri
70 ; 68 ; 73 ; 81 ; 66 ; 56 ; 62 ; 75 ; 83 ; 48 ( n1=10)
Plantel Arnoldo Gabaldón
72 ; 67 ; 74 ; 65 ; 63 ; 77 ; 71 ; 60 ; 76 ; 61 ; 64 (n2=11)
Ho: no existen diferencias entre los porcentajes de respuestas correctas entre los niños de ambos colegios.
H1: si existen diferencias entre los porcentajes de respuestas correctas entre los niños de ambos colegios.
R1 + R2 = (n1+n2)(n1+n2+1) / 2
R1 + R2 = 113 + 118 = 231
(n1+n2)(n1+n2+1) / 2 = (10 + 11)(10 + 11 + 1) / 2
(n1+n2)(n1+n2+1) / 2 = 231
231 = 231
Luego se procede a calcular los valores de U1 y U2
U1 : n1n2 + n1 (n1 + 1 ) / 2 – R1
U1 : (10)(11) + 10 (10 + 1) / 2 – R1
U1 : ( 110) + (55) – 113
U1 : 52 (U min)
U2 : n1n2 + n2 (n2 + 1) / 2 – R2
U2 : (110) + (66) – 118
U2 : 58 ( U max)
Estos valores de U (índices) deben satisfacer la propiedad U1 + U2 = n1n2
52 + 58 = (10) (11)
110 = 110
Uso de la Tabla de Valores Críticos (Umáx)
La prueba se efectúa con el mayor de los valores de U obtenidos U = máx (U1 , U2 ) , para entrar a la tabla se considera a n1 al menor de los dos grupos y si el valor de Umáx es superior al valor de U tabulado , se considera que la diferencia entre las dos distribuciones es estadísticamente significativa al nivel α pre establecido. En el presente ejemplo el valor de Umáx = 58 y tenemos n1 = 10 y n2 = 11.
Resultado:
Al consultar la tabla vemos que para n1: 10 y n2: 11, el valor de U, para una probabilidad de 0,05, es de 84 > 58, por consiguiente aceptamos la Ho, de un rendimiento similar entre ambos colegios.
Uso de la Tabla de Valores Críticos (Umin)
En caso de utilizar el menor de los valores de U (Umin) a un nivel α pre establecido , se procede de la manera siguiente : se considera al menor de los dos grupos como n1 , luego se establece la diferencia n2 – n1 y con esta información se entra a la tabla y se considera que la diferencia es significativa si el valor de Umin es inferior al valor de U suministrado por la tabla , por ejemplo para n1 = 5 y n2= 6 ; tenemos n2-n1 = 1 , la diferencia es significativa para un riesgo α < 5% a partir de U < 3 y U < 1 para un riesgo α < 1% ( Tablas D.1 y D.2)
Cálculos sin recurrir a la tabla de valores críticos
En vista de que tenemos mas de 10 datos por grupo, podemos admitir que la distribución muéstrall se aproxima a la distribución normal y por consiguiente podemos determinar si el valor de U se desvía significativamente de Uo.
Uo= valor esperado de U.
U= valor de U mas pequeño.
Su: desviación estándar de U.
La formula utilizada es la siguiente:
CALCULOS
U :( n1)(n2) / 2 = (11)(10)/ 2 = 55
Uo : puede ser cualquiera de los dos U (valores índices ) calculados anteriormente
Uo = 52 ò Uo = 58
Z = U – Uo ÷ Su
Z =58 – 55 ÷ 14,20 = 0,21 (0,21 < 1,96)
En caso de utilizar U min = 52
Z : 55 – 52 ÷ 14,20 = 0,21<1,96
Resultado: se acepta la Ho y se concluye que los resultados entre los niños de ambos colegios fueron similares.
AG: COLEGIO ARNOLDO GABALDON
AUP: COLEGIO ARTURO USLAR PIETRI
W: ESTADISTICO DE PRUEBA
P: PROBABILIDAD
Resultado: al igual que con los cálculos manuales , se acepta la Ho y se concluye que los resultados entre los niños de ambos colegios fueron similares.
ANÁLISIS DE VARIANZA DE UNA CLASIFICACIÓN POR RANGOS DE KRUSKAL–WALLIS (Varias Muestras Independientes)
La prueba de Kruskal-Wallis es una alternativa estadística al análisis de varianza de una via. Esta prueba constituye una extensión de la prueba U de Mann y Whitney y su diferencia con dicha prueba es que la prueba de Kruskal–Wallis permite la comparación simultánea de 3 ó más grupos independientes. Esta prueba estudia la hipótesis nula de que las K muestras proceden de la misma población. El tamaño de los grupos a comparar no debe ser inferior a cinco y la variable en estudio debe ser continua o medida en escala ordinal. La prueba paramétrica alternativa es el análisis de variancia con un solo criterio de clasificación . El archivo de datos debe tener, además de las variables respuesta, al menos una columna correspondiente al Criterio de clasificación que separa a los datos en tres o más muestras.
En la ventana de la prueba la Solapa General contiene las opciones cuyas casillas se deberán activar para obtener la información correspondiente.
La sub-ventana COMPARACIONES muestra las casillas para seleccionar las comparaciones a realizar: La casilla al pie de la ventana permite elegir el nivel de significación para las comparaciones o contrastes.
Para establecer el Nivel de significación active la casilla correspondiente al nivel deseado (0,01; 0,05 ó 0,10).
La ventana de RESULTADOS mostrará la información solicitada.
Ejemplo:
Con el fin de evaluar la patogenicidad de 4 cepas bacterianas se realizo la inoculación a 4 lotes de 10 ratones homocigotos seleccionados y distribuidos en cada uno de los grupos al azar. Se consideró como criterio además del estudio anatomopatológico de cada uno de ellos, el tiempo de sobre vivencia post-inoculación , el cual se suministra en el cuadro siguiente:
Obtención de la Prueba
Elija en la barra de herramientas: Estadísticas • Análisis de la varianza no paramétrico • Kruskal-Wallis
En el Selector de VARIABLES indique las variables respuesta y los factores que se toman como tratamientos en Variables de clasificación. Presione ACEPTAR.
Resultado: No se puede aceptar la Ho nula de que la patogenicidad de las 4 cepas bacterianas es similar. La prueba de la mínima diferencia significativa nos indica que las 4 cepas ocasionan diferentes tiempos de sobrevivencia en los ratones inoculado, conformándose 4 grupos, el correspondiente a la cepa 1(A) con el menor tiempo de sobrévivencia, el grupo 4(AB), luego el grupo 2(B) y por ultimo el de mayor tiempo de sobré vivencia identificado con la letra C y correspondiente a la cepa 3.
Cálculo Manual
Se reemplazan cada una de las “n” observaciones por su respectivo rango, lo cual implica el ordenamiento previo de los valores independientemente del grupo al cual pertenezcan.
Al valor más pequeño le corresponde el rango 1, al siguiente el rango 2 y así sucesivamente. Se construye una nueva tabla en la cual todos los valores observados son sustituidos por los rangos correspondientes.
Cuando ocurren ligas entre dos o más puntajes, se considera para cada una de las observaciones involucradas, el promedio de los rangos que hubieran tenido si no hubieran ocurrido las ligas. La corrección del efecto de las ligas resulta de un incremento del valor de “H”, sin embargo en la mayoría de los casos, dicho efecto es insignificante.
Se calcula el valor Rj, que es la sumatoria de los rangos correspondientes a cada muestra.
Luego se sustituyen los valores de Rj y de n en la formula siguiente.
Los grados de libertad se obtienen de la expresión siguiente g.l = K – 1
Cuando el valor de K es igual a 3 y el número de casos en cada una de las muestras es igual o menor de 5 , no se puede utilizar la aproximación de la distribución de probabilidades de χ2 a la distribución muestral y debemos recurrir a la tabla de probabilidades exactas.
Rangos del tiempo de sobrévivencia de 4 lotes de ratones inoculados experimentalmente con una cepa bacteriana diferente por cada lote.
Asumimos que la distribución muestral se corresponde , aproximadamente con la de ji – cuadrado con K – 1 grados de libertad. Por consiguiente se utiliza la tabla de valores críticos de ji2 , para evaluar la significación del valor calculado mediante la formula de “H”. Si la probabilidad asociada con dicho valor , es igual o menor que el nivel de significación tabulado , se rechaza la Ho y se acepta la H1. Los grados de libertad se determinan con la siguiente expresión g.l = K – 1, en este caso g.l = 4-1 = 3 y para un nivel α = 0,05 el valor tabulado es 7,815
Resultado: como 7,85 < 25,49 se rechaza la Ho nula de que la patogenicidad de las 4 cepas bacterianas es similar.
Comparaciones Múltiples
Cuando el valor del estadístico de prueba es significativo es indicativo de que al menos uno de los grupos es diferente de al menos otro de los grupos, pero este resultado llega hasta ahí sin indicar al investigador cuales grupos son diferentes y cuales no lo son entre si. La realización de las comparaciones múltiples es el procedimiento que nos permite establecer cuales pares de grupos son diferentes
Procedimiento
- Se establece el número de comparaciones que se pueden realizar mediante la formula siguiente: # c = K ( K – 1) / 2
- Se establecen las diferencias [Ri – Rj] para todos los pares de grupos o condiciones
- El número obtenido en 1, se utiliza para establecer el valor de “Z” a un nivel de probabilidad α igual al utilizado en el análisis de varianza que arrojo la existencia de diferencias estadísticamente significativas .
- La formula a utilizar para realizar las comparaciones múltiples entre tratamientos es la siguiente
Para establecer el número posible de comparaciones se recurre a la siguiente formula:
# C = K ( k – 1) ÷ 2 ; como en nuestro caso tenemos 4 cepas de bacterias el numero de comparaciones posibles sera : # C = 4(4 -1) ÷ 2 = 6 ;
Para #C = 6 y α = 0,05 el valor de Z es 2,638 (Tabla A)
Al sustituir en la formula tenemos:
Se considera que existen diferencias estadísticamente significativas entre un par de grupos cuando su diferencia es superior que el valor crítico, que en nuestro caso es 13,79
Diferencias entre los Rangos promedios
1 – 2 = 10,55 – 22,85 = 12,3 < 13,79 ( N.S)
1 – 3 = 10,55 - 33,20 = 22,65 > 13,79 (S)
1 – 4 =10,55 - 15,40 = 4,85 < 13,79 (N.S)
2 – 3 =22,85 - 33,20 = 10,35 < 13,79 (N.S)
2 – 4 = 22,85 – 15,40 = 7,45 < 13,79 (N.S)
3 – 4 = 33,20 – 15,40 = 17,8 > 13,79 (S)
Resultado : puesto que las diferencias entre las cepas bacterianas 1 y 3 ; 3 y 4 , fueron mayores al valor critico 13,79 , se puede concluir que la patogenicidad entre dichas cepas es diferente.
PRUEBA DE Mc NEMAR PARA LA SIGNIFICACIÒN DE LOS CAMBIOS
La comparación de dos proporciones observadas en grupos apareados (diseño experimental en el cual los mismos individuos son sometidos a dos tratamientos diferentes) se efectúa mediante la prueba de McNemar, que permite evaluar la significación de los cambios, como seria el caso evaluar si una técnica diagnostica es superior a otra, lo cual implica, que los sujetos del ensayo deben ser evaluados con los dos métodos diagnósticos. Al aplicar la formula se omiten de los cálculos aquellos individuos con resultados similares por ambas técnicas (++ y --), ya que no aportan información útil que permita la diferenciación.
La formula se calculo es la siguiente : χ2 = (a – b)2 ÷ ( a + b )
Esta prueba exige que el total de a + b de efectivos con resultados opuestos sea igual o superior a 10. Cuando esta suma es inferior a 10 puede utilizarse la corrección de Yates , aunque lo más correcto es calcular el grado exacto de significación mediante el empleo de la tabla correspondiente . La prueba de McNemar utiliza datos medidos en escala nominal y no existe una alternativa paramétrica, ya que la técnica paramétrica mas recomendada para analizar datos provenientes de dos muestras relacionadas es la prueba t , la cual requiere además del supuesto de normalidad , que las mediciones se realicen al menos en escala de intervalo. A continuación presentaremos un ejemplo con InfoStat y luego el desarrollo de los sencillos cálculos manuales.
Ejemplo: Con el fin de comparar dos métodos de diagnostico del Mal de Chagas o Tripanosomiasis americana, un lote de individuos provenientes de una zona endémica, fueron sometidos al examen directo en fresco y al xenodiagnóstico, obteniéndose los siguientes resultados:
Obtención de una Tabla de Contingencia (Ingreso de los datos para el análisis)
Elija Estadísticas
Datos Categorizados
Tablas de Contingencia
En el Selector de variables, indique las variables de clasificación .La columna que posee las frecuencias observadas, se incluye en el cuadro Frecuencias. Presione Aceptar. En la ventana de diálogo en la Etiqueta Selección de filas y columnas a la derecha hay una lista que muestra las variables que se declararon como clasificatorias; seleccione la que representa a las columnas y lo mismo para las filas. En la Etiqueta Opciones, elija la información que desea que contengan las celdas de la tabla (frecuencias absolutas, frecuencias relativas por fila, etc.) y la prueba que desea realizar, en este caso seleccione McNemar activando la casilla correspondiente. Presione “Aceptar”.
Resultado: Se acepta Ho de que no existen diferencias estadísticamente significativas entre ambas pruebas.
CALCULOS MANUALES
Esta prueba esta basada en la ley de ji – cuadrado y como se trata de una tabla de contingencia de 2 x 2 , se compara el valor deχ2, calculado con el valor critico suministrado por la tabla de χ2 , para 1 grado de libertad a un nivel de significación pre establecido (0,05 ; 0,01 ; 0,001).
χ2 = (a – b)2 ÷ ( a + b )
χ2 = (12 – 14 )2 ÷ (12 + 14 )
χ2 = 4 ÷ 16 = 0,15 < 3,84
Resultado: Se acepta Ho de que no existen diferencias estadísticamente significativas entre ambas pruebas , ya que el valor calculado es inferior al tabulado , a un nivel α = 0,05 ( 0,15 < 3,84).
Ejercicio con uso de la tabla
Cuando la suma de los efectivos a+b < 10 , se debe recurrir al calculo del grado exacto de significación para lo cual se debe emplear la tabla presentada en la siguiente pagina de acuerdo al procedimiento descrito a continuación :
Se designa por a al menor de los dos valores considerados para los cálculos, es decir a< b
Vamos a considerar el caso anterior de la comparación del examen directo con el Xenodiagnóstico utilizadas para el diagnostico del Mal de Chagas o Tripanosomosis americana, pero reduciremos a los casos con valores discordantes para cumplir con los requisitos del uso de la tabla
Examen directo positivo Xenodiagnóstico negativo 6 (b)
Examen directo negativo Xenodiagnóstico positivo 4 (a)
a + b = 4+6 = 10 ; buscamos en la primera columna de la tabla el valor correspondiente a la Σ a + b , que en nuestro caso es 10 , luego buscamos el numero de casos de a (4) y el numero de casos correspondiente a b (6) , asi tenemos que para a+b = 10 , con a = 4 y b = 6 , el grado de significación de P es 0,754 > 0,05 ( N.S ).
Conclusión: la diferencia entre la capacidad diagnosticas de ambas técnicas no es significativa.
PRUEBA DE LOS SIGNOS
(Datos pareados)
La prueba del signo esta basada en la dirección de la diferencia entre dos mediciones y se le conoce como prueba del signo debido a que la información contenida en una muestra puede transformarse a un conjunto de signos mas y menos en lugar de cantidades. Es útil cuando se trabaja con dos muestras relacionadas y se evalúa la hipótesis de que dos condiciones son diferentes y se desea conocer la significación de los cambios.
La prueba del signo cuenta el número de signos positivos y negativos entre las diferencias, omitiendo todas las diferencias con resultado cero. Se contrasta la hipótesis de que los N signos más (+) y menos (–) provienen de una población en la que los dos tipos de signos se presentan en las mismas proporciones, como pudiera esperarse si no hubiera verdadera diferencia entre las dos muestras apareadas. La prueba consiste en contrastar el número de signos positivos con el de signos negativos. En el caso de utilizar información cuantitativa los signos positivos corresponden a aquellos valores de la muestra que son mayores a una medida posicional y los negativos a los que resultan inferiores. Cuando hay cambios medibles en la escala ordinal, como al evaluar el efecto de un medicamento sobre la salud de los pacientes, en cuyo caso se utilizaría el signo + para todos aquellos casos en que se nota mejoría y el signo - , en aquellos casos en que se observa desmejoramiento. La prueba del signo es una alternativa no paramétrica de la prueba t de Student y de la prueba Z (datos pareados).
Ejemplo 1: Un grupo de 12 estudiantes fue sometido a una serie de exámenes previo al comienzo del periodo de vacaciones y al regreso de vacaciones, con el fin de evaluar el posible efecto de las vacaciones en el rendimiento escolar.
Obtención de la Prueba:
Elija en la barra de herramientas: Estadísticas • Inferencia basada en dos muestras • Prueba del signo
En el Selector de variables indique las variables que representan a cada muestra en Variables y las Particiones deseadas. En la ventana de la prueba haga clic en los casilleros cuya información desea obtener. Completada la información presione Aceptar. La ventana Resultados mostrará la información solicitada.
Resultado: no existen diferencias estadísticamente significativas en el rendimiento escolar entre ambos periodos, por consiguiente se acepta la Ho.
Ejemplo 2. Para determinar el efecto de un contraceptivo bucal sobre el aumento de peso, se pesaron ocho mujeres sanas antes de iniciar el tratamiento con el medicamento y una vez mas al concluir un periodo de tres meses, obteniéndose los siguientes pesos:
Resultado: Se acepta la Ho, de que el consumo del contraceptivo no afecta la ganancia de peso en las mujeres que lo consumen.
Cálculos Manuales
cuando el número de datos es mayor de 20 y el signo menos frecuente es mayor de 3, se obtiene una buena aproximación a la probabilidad real mediante la formula suministrada a continuación de la tabla de datos. Esa aproximación se considera excelente cuando se aplica la corrección por continuidad, similar a la de Yates usada en la prueba de ji – cuadrado, previa eliminación de las diferencias nulas, lo cual conlleva a que en estos casos el valor de N se reduce. A continuación presentaremos un ejercicio con los datos del ejemplo 1
Numero de pares que mostraron diferencias = 12
X = Símbolo menos frecuente: + = 4
Cuando x < ½ de N se utiliza en la formula x + 0,5
Cuando x >½ de N se utiliza en la formula x – 0,5
Como en este caso x = 4 < 6 (1/2 N ), se le suma 0,5
Resultado: para la interpretación del resultado a un nivel α = 0,05, rechazamos la Ho si el valor de Z calculado es mayor de 1,96, por consiguiente, en este caso concluimos que no existen diferencias estadísticamente significativas en el rendimiento escolar entre ambos periodos, por consiguiente se acepta la Ho. (p<0,05).
Con uso de la tabla de valores críticos
Ejemplo 1 (Rendimiento escolar)
Numero de pares que mostraron diferencias: 12
X = signo mas frecuente: (-) = 8
Como el valor correspondiente al signo mas frecuente fue inferior al suministrado por la tabla ( 8 < 10 para 12 pares de diferencias ) , se acepta la Ho y concluimos que no hubo diferencias en el rendimiento escolar entre ambos periodos.
Ejemplo 2 (Contraceptivo oral y ganancia de peso)
Numero de pares que mostraron diferencias: 9
X = signo mas frecuente: (+) = 7
Como el valor correspondiente al signo mas frecuente fue inferior al suministrado por la tabla ( 7 < 8 para 9 pares de diferencias ) , se acepta la Ho y concluimos que no hubo diferencias en el incremento de peso debido al consumo del anticonceptivo bucal.
El valor de X (signo mas frecuente) , debe ser igual o mayor que el valor tabulado para que sea significativo al nivel escogido. Los guiones indican que es imposible tomar una desición para n al nivel α dado (Prueba del Signo).
PRUEBA DEL RANGO CON SIGNO DE WILCOXON (Datos pareados)
La prueba de Wilcoxon es también conocida como prueba del rango con signo de Wilcoxon para dos grupos, dispuesto como observaciones apareadas. Esta prueba se inicia con el calculo de las diferencias entre los N pares de observaciones, las cuales se ordenan sin considerar el signo. En caso de presentarse filas ligadas se les asigna el valor promedio. Luego, se le asignan a los rangos los signos originales de las diferencias. Se procede a sumar los rangos positivos y negativos por separado y la que sea menor en valor absoluto se compara con el valor crítico de la tabla respectiva, lo cual no es necesario en el presente caso, en vista de que el paquete suministra en los resultados el valor de probabilidad correspondiente. La prueba de Wilcoxon además de la información sobre la dirección de la diferencia entre los pares de observaciones, considera la magnitud de dicha diferencia. Esta prueba es bastante sencilla, pero es menos eficiente que las correspondientes pruebas t de Student y Z para una muestra (pruebas paramétricas alternativas). Para los cálculos manuales se debe considerar que si n es superior a 25 , la significación se puede estudiar mediante la ley normal aplicando la prueba de Z correspondiente y que mostraremos a continuación de los resultados obtenidos con InfoStat.
Ejemplo: Con el fin de evaluar si las cantidades de cercarias de S. mansoni eran diferentes en relación con la hora de emisión, se realizó el conteo de cercarias emitidas a las 2 p.m. y a las 8 p.m. por un lote de 10 caracoles, obteniéndose las siguientes cantidades:
Ho: La cantidad de cercarias emitidas a las 2 p.m. y a las 8 p.m. es similar.
H1: La cantidad de cercarias emitidas a las 2 p.m. y a las 8 p.m. no es similar
Obtención de la Prueba:
Elija en la barra de herramientas: Estadísticas • Inferencia basada en dos muestras • Wilcoxon
En el Selector de variables indique las variables que representan a cada muestra en Variables y las Particiones deseadas. En la ventana de la prueba haga clic en los casilleros cuya información desea obtener. Completada la información presione Aceptar. La ventana Resultados mostrará la información solicitada
Resultado: Se acepta la Ho de emisión de un número de cercarías similar en ambas horas del día.
Resultado: Se acepta el Ho de emisión de un número de cercarias similar en ambas horas del día.
Uso la tabla de valores críticos ( Tmax)
Cuando n es igual o inferior a 25, la significación se puede evaluar comparando directamente el valor de T hallado con los de la tabla y si Tmax _> Tt (n,α ) , la diferencia entre las dos distribuciones es significativa . Para el ejemplo en consideración tenemos:
El valor de T máximo calculado es 35
Para 10 pares de datos el valor tabulado a un nivel α = 0,05 es de 47; como 35 < 47, se acepta la Ho de la no existencia de diferencias estadísticamente significativas entre los ritmos de emisión de cercarias a las 8 a.m. y las 2 p.m.
Resultado: Se rechaza la Ho y se evidencia que hay diferencias estadísticamente significativas en los valores del colesterol entre ambos muestreos. Si utilizamos la tabla de valores críticos, encontramos que el valor T calculado es de 268,50 > 257, que es el valor de T para n = 25; α = 0,01 (tabulado), por consiguiente rechazamos la Ho a un nivel de probabilidad del 1% , resultado compatible con el suministrado por InfoStat.
CAPÍTULO VII EL CASO DE VARIAS MUESTRAS RELACIONADAS
ANÁLISIS DE LA VARIANZA DE DOS CLASIFICACIONES POR RANGOS DE FRIEDMAN
Esta prueba se utiliza con datos provenientes de muestras pareadas o igualadas, medidas por lo menos en una escala ordinal. La información puede obtenerse del mismo grupo de sujetos en cada una de las K condiciones o de sujetos igualados en las variables pertinentes. Esta prueba permite realizar un análisis de varianza no paramétrico a dos vías de clasificación y se corresponde con un diseño en bloques completos aleatorizados con dos criterios de clasificación y representa una alternativa no paramétrica del análisis de varianza de dos vías, sin requerir de la verificación del supuesto de normalidad.
Ejemplo: Un grupo de 9 pacientes fue sometido a tratamiento con 3 diferentes tipos de electro estimulante y al final de cada sesión se le pedía que asignara un valor en una escala ascendente del 1 al 3, con cual se sentía mejor, obteniéndose los siguientes resultados:
A: Electro estimulante Japonés
B: Electro estimulante Americano
C: Electro estimulante Francés
Ho: No existen diferencias terapéuticas entre los electro estimulantes empleados
H1 : El efecto terapéutico de los electro estimulantes no es similar.
Obtención de la Prueba:
Elija en la barra de herramientas: Estadísticas • Análisis de la varianza no paramétrico • Friedman
En el Selector de variables en Variables que definen a los tratamientos, indique las variables que identifican a los tratamientos. Si lo desea, en Particiones indique una variable para establecer un criterio de partición. Presione Aceptar.
En la ventana de la prueba active la casilla Pruebas a posteriori si desea hacer comparaciones entre las medias. Elija el nivel de significación activando una casilla en el cuadro Nivel (alfa). Presione Aceptar.
Χ2r = { [ 12 ÷ n k (k +1) Σ (Rj)2 – 3 n (K + 1) ] }
Χ2r = { [ 12 ÷ 9 (3)(3+1) ] (225)+(625)+(196) – 3 (9) (3+1)
Χ2r = { [ 12 ÷ 108 ] (1046 ) – (108)
Χ2r =( 0,111) (1046) – 108
Χ2r = 116,10 – 108 = 8,10
Resultado: para K = 3 y n = 9, la tabla de valores críticos de Friedman (χ2r) da un valor de 6, 2 < 8,10, por lo tanto se rechaza la Ho a un nivel de de significación del 5% de la prueba de Friedman) y se concluye que los tres modelos de estimulador eléctrico no tienen la misma preferencia de parte de los terapistas.
La ventaja del programa es que suministra el nivel de probabilidad y realiza simultáneamente mediante la prueba de la mínima diferencia significativa, la separación de las medianas.
Comparaciones múltiples
Cuando el resultado indica el rechazo de la Ho, significa que al menos una de las condiciones o tratamientos difiere con respecto a las otras condiciones o tratamientos de forma estadísticamente significativa , sin embargo este resultado no especifica cual grupo es el diferente ni cuantos de los grupos difieren entre si . Mediante la prueba de las comparaciones múltiples se establece entre cuales pares de tratamientos existen dichas diferencias.
Procedimiento
Se establece el número de comparaciones que se pueden realizar mediante la formula siguiente: # c = K ( K – 1) / 2
Se establecen las diferencias [ Ri – Rj ] para todos los pares de grupos o condiciones
El número obtenido en 1, se utiliza para establecer el valor de “Z” a un nivel de probabilidad α igual al utilizado en el análisis de varianza que arrojo la existencia de diferencias estadísticamente significativas.
En caso de utilizar la suma de los rangos, recurrimos a la siguiente formula:
Cálculos
Se compararon tres modelos de electro estimulantes y en la evaluación participaron 9 terapistas, por consiguiente el número de comparaciones posibles es:
# C = K ( k – 1) ÷ 2 ; # C = 3(3 -1) ÷ 2 = 3 ;
Para #C = 3 y α = 0,05 el valor de Z es 2,394 (Tabla A)
Al sustituir en la formula los valores correspondientes a Z ; N y K , tenemos
Se establecen las diferencias entre la suma de rangos correspondientes a cada par de condiciones o tratamientos
Cuando la diferencia entre dos condiciones o tratamientos es superior al valor de la diferencia crítica se concluye que la diferencia entre dichas condiciones o tratamientos es significativa.
Diferencias
A – B = 25 – 15 = 10 < 10,15 (N.S)
A – C = 15 – 14 = 1 < 10,15 (N.S)
C – B = 25 - 14 = 11> 10,15 (p<0,05)
En caso de utilizar los valores promedios de los rangos se utiliza la formula siguiente:
Diferencias
A – B = 1,67 – 2,78 = 1,11 < 1,13 (N.S)
A – C = 1,67 – 1,56 = 0,11 < 1,13 (N.S)
B - C = 2,78 - 1,56 = 1,22 > 1,13 (p<0,05)
Resultado: como puede observarse se obtienen los mismos resultados con los rangos promedios y con la suma de rangos siempre y cuando se utilice la formula adecuada para cada caso.
Las entradas en la tabla para un # c dado y un nivel de significación α es el punto de la distribución normal estándar tal que la probabilidad del lado superior sea igual a ½ α / # c.
CAPITULO VIII CORRELACIÓN ENTRE DOS VARIABLES ORDINALES
COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPEARMAN
El coeficiente de correlación de rangos de Spearman, es una medida de asociación, que requiere que ambas variables sean medidas por lo menos en una escala ordinal, de tal manera, que dichas variables puedan colocarse en series ordenadas. Esta prueba de independencia entre dos variables es muy útil cuando existen muy pocos datos o estos están medidos en escala ordinal y constituye la alternativa no paramétrica del coeficiente de correlación de Pearson.
Ejemplo 1: Con el fin de establecer si existía asociación entre el porcentaje de individuos acumuladores de parásitos con la prevalencia de la infestación por Ascaris lumbricoides, se examinaron las poblaciones de 9 localidades y se determinó para cada una de ellas, la prevalencia (porcentaje de positivos) y el porcentaje de individuos con cargas superiores a 10.000 hpg, obteniéndose los siguientes resultados:
P: Prevalencia
W.P: Wormy Persons (Porcentaje de individuos con altos recuentos de hpg de A. lumbricoides)
Obtención de la Prueba:
Elija en la barra de herramientas: Estadísticas • Análisis de correlación
En la ventana de diálogo, en la etiqueta Variables indique las variables que participarán en el análisis (Variables Y). Si desea establecer una partición, criterio by, en la etiqueta Particiones indique la/s variable/s. Presione Aceptar. Seleccione el coeficiente a obtener, activando la casilla correspondiente. Puede excluir del análisis los registros incompletos si activa la casilla Eliminar los registros incompletos. Presione Aceptar
Coeficientes de correlación de rangos de Spearman
Resultado: La correlación entre la prevalencia de la infección por Ascaris lumbricoides y el porcentaje de individuos con cargas >10.000 hpg es altamente significativa y positiva, lo que indica que un mayor porcentaje de individuos infectados esta asociado con un mayor porcentaje de individuos con elevados conteos de huevos de Ascaris lumbricoides por gramo de heces.
Ejemplo 2: El fin de establecer si existía asociación entre los puntajes de autoritarismo y los del esfuerzo por alcanzar una posición social, se administraron encuestas indagatorias a 12 estudiantes, cuyos resultados son suministrados a continuación:
Obtención de la Prueba:
Elija en la barra de herramientas: Estadísticas Análisis de correlación
En la ventana de diálogo, en la etiqueta Variables indique las variables que participarán en el análisis (Variables Y). Si desea establecer una partición, criterio by, en la etiqueta Particiones indique la/s variable/s. Presione Aceptar. Seleccione el coeficiente a obtener, activando la casilla correspondiente. Puede excluir del análisis los registros incompletos si activa la casilla Eliminar los registros incompletos. Presione Aceptar
Coeficientes de correlación
Se observa que para estos 12 estudiantes la correlación entre autoritarismo y búsqueda de posición social es de 0,82 (P< 0,01)
CALCULOS MANUALES
Los datos de base son una serie de parejas. (X, Y)
Se ordenan separadamente por orden creciente tanto los valores de X como los de Y.
Se sustituye cada valor de X y cada valor de Y por su rango correspondiente.
Se hacen coincidir en una lista ordenada los rangos de X con los correspondientes rangos de Y.
Se establecen las diferencias entre los rangos (X – Y = di) y se elevan al cuadrado dichas diferencias (di)2, luego se realiza la sumatoria de dichos valores elevados al cuadrado. (Σ di2)
Los grados de libertad son iguales a N–2, por ejemplo para 10 pares de datos, los g.l son 8.
En caso de observaciones ligadas se le asigna a cada una el promedio de los rangos que se le habría asignado de no haber ocurrido dichas ligas. El efecto de estas últimas es insignificante en el valor del coeficiente “rs” ocasionado un ligero incremento en el valor de dicho coeficiente. Para el cálculo del Coeficiente de Correlación de Rangos de Spearman, se utiliza la formula siguiente:
rs = 1– (6 Σ di2 ÷ N3 – N )
En la cual:
rs = Coeficiente de Correlación de Rangos de Spearman
di = Xi – Yi
Xi , Yi = rangos correspondientes a los valores ordenados en orden creciente de las variables X y Y.
N = Tamaño de la muestra
Ejemplo: como ejemplo utilizaremos los datos referidos al porcentaje de individuos infestados por Ascaris lumbricoides y el porcentaje de individuos con > 10.000 Huevos del parasito por gramo de heces_
Prueba de significación sin uso de la tabla de valores críticos
Resultado: Existe una correlación altamente significativa y positiva entre el porcentaje de individuos con cargas de hpg de Ascaris lumbricoides igual o superiores a 10.000 y la prevalencia de la ascariasis en la comunidad.
Caso de la relación entre autoritarismo y búsqueda de posición social (Ejemplo 2)
Resultado: Se rechaza la Ho a un nivel α = 0,001 de la no existencia de correlación entre el autoritarismo y la búsqueda de posición social