sábado, 10 de mayo de 2008

DIAGRAMA DE CAJA (BOX PLOT)

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos.
En un gráfico que se suministra información sobre la mediana, El cuartil Q1 y Q3, sobre la existencia de atípicos y la simetría de la distribución.

Como dibujarlo:
Ordenar los datos y obtener el valor mínimo, el máximo, y los cuartiles Q1, Q2 y Q3.
Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.
Calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Considerar como atípicos los puntos localizados fuera del intervalo (Li, Ls).
Dibujar las líneas que van desde cada extremo del rectángulo central hasta el valor más alejado no atípico.
Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

Utilidades:
Proporcionan una visión general de la simetría de la distribución de los datos, si la media no está en el centro del rectángulo, la distribución no es simétrica.
Son útiles para ver la presencia de valores atípicos.

COMENTARIO PERSONAL:

El Diagrama de Caja también denominado (Box Plot) el cual sirve para determinar y o ubicar de que lado estan más concentrados los datos, la media, la mediana, Q1, Q2, Q3; el cual sirven para el calcular la dispersión de cada una de las medidas que se utilizan para la elaboración de un diagrama de caja.

VALORES ESTANDARIZADOS (Z)

Son el cociente entre la desviación de una calificación (X) respecto a la media aritmetica y la desviación estandar (S), será mayor a la media si se localiza a la derecha de la media y menor a la media si se localiza a la izquierda.

(Z) es el valor que corresponde a un valor X y nos permite conocer la distancia existente entre la media y el valor X; la cual se mide en desviaciones estandar, tambien se señala que los valores estandarizados permiten determinar el porcentaje de casos para las distancias entre dos ordenadas de un conjunto de datos de valor medio que se ha establecido.

COMENTARIO PERSONAL:

Sobre el eje (X) que constituye la línea base bajo la curva se nos presenta una serie de datos que se localizan a la derecha e izquierda de la media, los valores reducidos de (Z) los obtenemos cuando restamos la media con cualquiera de las variables en X y los dividimos con la desviación estandar, en el que estos valores pueden compararse entre de acuerdo a la distribución en X.

DISTRIBUCIÓN DE PORCENTAJES BAJO LA CURVA

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.
La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:
Caracteres morfológicos de individuos.
Caracteres fisiológicos como el efecto de un fármaco.
Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos.
Caracteres psicológicos como el cociente intelectual .
Nivel de ruido en Telecomunicaciones.
Errores cometidos al medir ciertas magnitudes.
Cuando la distribución se conoce con el nombre de normal estándar, dada una variable aleatoria normal X, con media (también llamada Esperanza matemática) y desviación típica , si definimos otra variable aleatoria entonces la variable aleatoria Z tendrá una distribución de porcentaje altamente normal aunque algunas veces muy estándar y a la vez pequeña , se dice que se ha tipificado o estandarizado la variable X.
valores estadísticos muestrales como la media .

COMENTARIO PERSONAL:
Al dividir simetricamente la línea base abajo la curva en tres partes ( 1,2,3,-1,-2,-3) en uno y otro sentido a partir de la media (y), tendremos que cualquier distancia a la derecha de la media tiene una proporción equivalente a la misma distancia a la izquierda de la media; de -3 a 3 presenta el 100% de los casos.