<%@ Language=Heredar de Web %> medidas de resumen
Site hosted by Angelfire.com: Build your free website today!

   

Hit Counter

 


 
DISTRIBUCIONES DE FRECUENCIAS  2 :     MEDIDAS DE RESUMEN
TEMAS RELACIONADOS 

VARIABLES ALEATORIAS 

TABULACIÓN  

INFERENCIA ESTADÍSTICA

ESCALAS DE MEDIDAS 

REPRESENTACIÓN GRAFICA 

 

CONTENIDO

 l Medidas de tendencia central
       lTipos de media ( media aritmética
        
media armónicamedia geométrica )

       l mediana
       l moda
 
l Medidas de posición
       l Cuantiles : Percentiles
 
l Medidas de dispersión
        l Amplitud
        l Varianza, desviación típica
        l Semirrecorrido intercuartílico
        l Coeficiente de variación
        l Desvío tipificado

 

l Medida  de formaasimetría
 
l Medida de apuntamiento : Kurtosis

 l ¿Cuál medida de tendencia central usar?

 
l ¿Cuál medida de dispersión usar?

 
l Regla de tchebycheff

 


Para describir un conjunto de datos, además de la tabulación y la representación gráfica , se utilizan valores numéricos de funciones de la variable llamadas medidas de resumen 

Las medidas de resumen aportan la información acerca de valores centrales, la dispersión y la forma de la distribución

Aquellas medidas de resumen utilizadas para describir valores centrales se llaman Medidas de tendencia central
MEDIDAS DE TENDENCIA CENTRAL
Para saber cuál medida de tendencia central utilizar, se debe tener en cuenta: 
la escala de medida y la forma de la distribución
MEDIA MEDIANA MODA
ARITMÉTICA ARMÓNICA GEOMÉTRICA

 Es útil sobretodo cuando :
  * Datos ordinales o numéricos
  *
la distribución de la variable es asimétrica y hay pocas observaciones

La moda se utiliza solamente cuando el investigador tenga interés en conocer el valor más frecuente
o en 
   * Datos nominales
   * Distribuciones
     bimodales

es la más utilizada, por su facilidad de cálculo, en muestras grandes es estable, fácil de entender y es de fácil uso en cálculos posteriores
    * Datos numéricos
    *distribuciones 
     simétricas

Es de poco uso en biología. No se va a ver aquí

Es útil en en general en  aquellos casos donde el logaritmo de la variable en estudio tiene distribución normal.

MEDIA ARITMÉTICA
Si consideramos las frecuencias relativas como pesos aplicados en el eje de las abscisas, el centro de gravedad es decir el punto de aplicación de la resultante de la distribución , se encontrará en la media aritmética o simplemente MEDIA  
La Media de una muestra se define por la fórmula:

En tablas de datos sin agrupar

En tablas de datos agrupados

x f
3 1
6 8
9 15
12 4
total 28
marca de
clase
 f
2 a 4 3 2
4 a 6 5 9
6 a 8 7 10
8 a 10 9 1
total   22
En este caso se usa el punto medio o marca de clase
media  =  3x1 + 6x8 + 9x15 + 12x4  =    8.35
                             28
media = 3x2 + 5x9 + 7x10 + 9x1  = 5.90
                               
22
 Cuando los datos están agrupados en clases se produce una pérdida de información que puede traducirse en pequeños errores en el verdadero valor de la media, por esa razón cuando es posible conviene promediar  los valores de la tabla de frecuencias sin agrupar , o bien los valores individuales tomados de 1 en 1 .

Por ejemplo la media de  { 5, 7, 8, 8, 9, 11 }

5+7+8+8+9+11  = 8
6


MEDIANA
Otra medida de tendencia central utilizada comúnmente es la Mediana . 
Recordemos que la mediana es el valor que deja por debajo y por encima de él el mismo  número de observaciones , es el percentil 50 
En una lista estadística ordenada, con los datos sin agrupar :
 número de observaciones es impar, la mediana corresponde al valor central el número de observaciones es par, la mediana corresponde al promedio entre los dos valores centrales

Cuando los datos están  agrupados, para calcular la mediana se requieren las frecuencias acumuladas
Pasos a seguir 
a.- Se determina la clase que contiene la observación de orden (n+1)/2 que corresponde a la clase mediana

(48+1)/2 = 24.5  (la mediana está entre los valores de las observaciones  24º y 25º)

b.- la mediana se calcula  de acuerdo a la fórmula

donde:
li :
límite inferior de la clase mediana
        ( en este caso li = 14)
Fa : frecuencia acumulada de la clase anterior a la clase mediana (16)
f : frecuencia absoluta de la clase mediana(15)
h : amplitud o extensión del intervalo de clase (6)

Forma gráfica de calcular la mediana
A partir de un gráfico de Fr (frecuencias  relativas acumuladas), se traza a la altura de 0.5 (o 50%)  una línea paralela al eje de la variable, en el punto de corte, se traza una perpendicular. El valor resultante en el eje de las x , ese será la mediana.

MODA
Una tercera medida es la Moda, o sea el valor más frecuente.
Cuando los datos están sin agrupar
La moda se determina por la simple inspección de la lista ordenada

x

10

10

11

12

12

12

12

16

   La moda es  12

Cuando los datos están  agrupados  una buena aproximación de la moda se consigue con la fórmula de Czuber
donde:
li:  límite inferior de la clase modal
D1: diferencia entre la frecuencia de la clase modal y la clase anterior a ella
D2:diferencia entre la clase modal y la clase siguiente a ella
h: extensión del intervalo

x

f

0a5

1

5a10

13

10a15

17

15a20

21

20a25

12

25a30

7

 

D1: 21 - 17 = 4
D2: 21 - 12 = 9

Mo = 15 +    4      x  5  = 16.54
                 4 + 9


MEDIDAS DE DISPERSIÓN
AMPLITUD 
TOTAL

A

La más inmediata medida de dispersión es la Amplitud total (rango, recorrido o intervalo)
La amplitud total (A) es la diferencia entre el límite real superior y el límite real inferior de la distribución

ej:  {  2, 5, 6, 6, 11 } en esta distribución  la amplitud A = 11.5 -1.5 =10
        |                   |
     
1.5              11.5

SEMIRRECORRIDO INTERCUARTILICO

Q

Semirrecorrido intercuartílico (Q) es la diferencia entre el percentil 75 (P75) y percentil 25 (P25) dividido 2.
Percentil de orden r es aquel valor que deja un  r% de observaciones por debajo de él . Por ejemplo la mediana, que deja el 50% de las observaciones por debajo de el es el percentil 50 ( mediana)
Cálculo de un Percentil de orden r :
VARIANZA Y
DESVIACIÓN TÍPICA

s2  s

la varianza y la desviación típica también se designan, en muestras,  con la letra  s2 y s  respectivamente 

La varianza es el promedio del cuadrado delos desvíos con respecto a la media

 

Como la varianza está expresada en cuadrados de las unidades empleadas en la distribución su interpretación se hace difícil, por lo tanto en la práctica se usa como medida de dispersión la raíz cuadrada positiva de la varianza, llamada desviación típica
COEFICIENTE DE VARIACIÓN

CV

En algunas aplicaciones, más que la dispersión absoluta, interesa la dispersión relativa. En esos casos suele usarse el coeficiente de variación
El CV puede expresarse también en porcentaje

Ej: media = 3;
    desv.típica = 0.15    
CV = 0.15/3 = 0.05  ó 5%

DESVIO TIPIFICADO

 

Z

 

 

ver distribución normal

El desvío tipificado de un valor x se define como :

 

CUAL MEDIDA  DE DISPERSIÓN USAR
DESVIACIÓN TIPICA SEMIRRECORRIDO INTERCUARTILICO AMPLITUD TOTAL COEFICIENTE DE VARIACIÓN

Se emplea cuando también es apropiado utilizar la media 

*Cuando se usa la mediana 
* Cuando se quiere comparar un individuo con el conjunto

*Cuando se usa la moda
*
Cuando se quiere poner énfasis en datos numéricos extremos

Cuando se quiere comparar distribuciones numéricas medidas en escalas o unidades diferentes


MEDIDAS DE ASIMETRIA O SESGO
Dos distribuciones pueden coincidir en tendencia central y dispersión pero diferir en asimetría.
Una de las formas de calcular el coeficiente de asimetría es :
(otras  formas) coeficiente de asimetría (2)
de Pearson
El signo del coeficiente de asimetría en términos bastante generales indica el sentido de la "cola" de la distribución

MEDIDAS DE APUNTAMIENTO O KURTOSIS
Dos distribuciones pueden diferir también en su apuntamiento o kurtosis. La referencia está dada por la distribución NORMAL, que es Mesocúrtica.
El alejamiento de este "modelo"
determina dos tipos más de distribuciones.

Aquellas que presentan frecuencias más altas, que la mesocúrtica, en los extremos y el centro de la distribución, se llaman Leptocúrticas
Aquellas que el exceso se da en los valores comprendidos entre los extremos y el centro, se llaman Platicúrticas. Un extremo de platicurtosis serían las distribuciones bimodales

Coeficiente del momento de Kurtosis :      g2 = m4 / s4 - 3


donde


 

REGLA DE TCHEBYCHEFF

l Se aplica a cualquier distribución de frecuencias
l Es posible que pocas medidas (datos) caigan dentro de la media + 1 desvío típico y - 1 desvío típico
l Al menos el 75% de las medidas caerán dentro de  2 desvíos típicos de la media para cada lado
l Al menos el 89.9% de las medidas caerán dentro de 3 desviaciones típicas de la media para cada lado
l La proporción  mínima de valores que se encuentra dentro de  k desviaciones típicas  de la media es 
      al menos
1-1/k2, para k>1.

 


 

Tus sugerencias  - Página principal -  

Escríbenos