Site hosted by Angelfire.com: Build your free website today!

 

Hit Counter

 
DESCRIPCIÓN DE DATOS  ejercicios

DISTRIBUCIONES DE FRECUENCIAS  1 :     TABLAS Y GRAFICOS

DISTRIBUCIONES DE FRECUENCIAS  2 :   MEDIDAS DE RESUMEN

DISTRIBUCIONES DE FRECUENCIAS  1 :     TABLAS Y GRAFICOS
TEMAS RELACIONADOS 

VARIABLES ALEATORIAS

MEDIDAS DE RESUMEN

ESCALAS DE MEDIDAS

INFERENCIA ESTADISTICA

CONTENIDO

      rol estadístico
     
amplitud total

    errores de agrupamiento
    tabla de datos sin agrupar
   
tabla de datos agrupados

frecuencias

  

gráfico de tallo y hojas
gráficos para variables numéricas discretas

gráficos para variables numéricas continuas

gráficos para variables categóricas


Los siguientes valores son datos recogidos para una determinada investigación
21 15 17 14 12
30 14 25 13 18
9 26 12 14 15
10 16 21 13 12

Como se ve, están en forma desordenada, por lo cual, lo primero que se debe hacer es ordenar los datos, generalmente en forma creciente confeccionando lo que se llama rol estadístico

9 10 12 12 12
13 13 14 14 14
15 15 16 17 18
21 21 25 26 30

Este listado da la posibilidad de rápidamente determinar la amplitud total, la diferencia entre los extremos, límite superior - límite inferior ( en este caso : 30 - 9 = 21)

Existen dos tipos de límites: Limites aparentes

ejemplo:  9 es el límite inferior y 30 el límite superior

Limites reales (1/2 unidad por encima y 1/2 unidad por debajo de los límites aparentes)

ejemplo: 8.5  (para límite aparente 9) y 30.5 (para el l.aparente 30)

Al tabular los datos , se puede simplemente contabilizar las veces que se repite cada valor individualmente  (datos sin agrupar) o se puede contabilizar las veces que se repiten los valores dentro de clases o categorías de extensión predeterminada (datos agrupados)

datos sin agrupar datos agrupados

 (valores de la variable)

         x        f     

 (frecuencia absoluta simple

(valores de la variable)    

         x                   f

(frecuencia absoluta simple)
    

          9

1       9 - 11  2   

        10

1     12 - 14 8  

        12

3   15 - 17  
        13 2   18 - 20 1  
        14 3   21 - 23 2  
        15 2   24 - 26 2  
        16 1   27 - 29 -  
        17 1   30 - 32 1  
        18 1  
    TOTAL ( S f )  20
 
        21 2      
        25 1    
        26 1    
        30 1
                 TOTAL ( Sf  )  20    

Muchas veces el número de datos que se recoge es lo suficientemente grande como para que sea necesario agruparlos en clases o categorías, aunque esto introduce un error de agrupamiento.

El agrupar en clases es necesario sobre todo para la representación gráfica de los datos, lo que da una idea más adecuada de la forma de la distribución  que si el gráfico se realizara conlos datos sin agrupar.

¿Cuántas clases es conveniente hacer?

En la práctica , para graficar, el óptimo es entre 5 y 14 clases, pero para los cálculos y para disminuir el error de agrupamiento, un número adecuado de clases está  entre 12 y 24

Con los datos anteriores se confeccionó una tabla de datos agrupados en 8 clases cerradas con una extensión de 3 unidades para el intervalo de clase

Dentro de los intervalos podemos encontrar
  • intervalos abiertos    No incluye ninguno de los límites 

NO SE USAN EN ESTADISTICA 

  • intervalos semiabiertos   se  incluye uno de los  límites (el inferior o el superior)

 UTILES  PARA VARIABLES CONTINUAS

  • intervalos cerrados  Se incluyen ambos límites

 UTILES  PARA VARIABLES DISCRETAS

CUIDADO  ! LA FORMA DE AGRUPAMIENTO INFLUYE EN LOS CALCULOS

Al cofeccionar una tabla  el número de observaciones (frecuencia absoluta simple ) para cada clase o valor de la variable se puede expresar de varias formas. Utilizando los datos anteriores, agrupados en  8 clases de intervalo semiabierto y de extensión 3 unidades, obtenemos una tabla con las distintas frecuencias:

 
x f (absoluta simple) fr (relativa simple) fr% F (frecuencia acumulada simple) Fr (frecuencia acumulada relativa) Fr%
8 - 11 2 2/20 = 0.10 10             2                   0.10 10
11 - 14 5 5/20 = 0.25 25 (2 +5)  = 7 0.10+0.25 = 0.35 35
14 - 17 6 6/20 = 0.30 30 (7+6)  = 13 0.35+0.30 = 0.65 65
17 - 20 2 2/20 = 0.10 10 (13+2) =15 0.65+0.10 = 0.75  75
20 - 23 2 2/20 = 0.10 10 (15 +2)=17 0.75+0.10 = 0.85 85
23 - 26 1 1/20 = 0.05 5 (17+1) =18 0.85+0.05 = 0.90 90
26 - 29 1 1/20 = 0.05 5 (18+1) =19 0.90+0.05 = 0.95 95
29 - 32 1 1/20 = 0.05 5 (19+1) = 20 0.95+0.05 =1.00 100
TOTAL 20 20/20=1 100      

La frecuencia relativa simple (fr) es el cociente entre la frecuencia absoluta (f) y el número total de observaciones (n), este cociente asume valores entre 0 y 1. La frecuencia relativa puede ser expresada en porcentaje ( fr%), multiplicando fr por 100
fr = f / n fr% = fr x 100

Además de las frecuencias absoluta simple y relativa simple, se calcula la frecuencia acumulada (F) que puede ser absoluta o relativa (Fr, Fr%)     

La frecuencia acumulada es simplemente la suma de las frecuencias anteriores a determinada clase inclusive. Así la  frecuencia acumulada (F) hasta x = 26 (clase 23- 26)  es 18

Para la Fr (frecuencia acumulada relativa) el cálculo es similar : la suma de las frecuencias relativas simples anteriores a determinada clase inclusive

Es posible hacer los cálculos sin tabular . Sila cantidad de datos de la variable es pequeña, no es conveniente  agrupar  debido a los errores de agrupamiento que se introduce
Por ejemplo, en la siguiente distribución de frecuencias :

Los valores agrupados en clase determinan superficies de frecuencia de forma rectangular. 

Así a menor número de clases ( a ) mayor es el error y a intervalos más pequeños (o sea, más clases) el error se reduce ( b )

 

Representación grafica
Los dos principales problemas al graficar son:    
1.- Representar distribuciones de frecuencias de 1 o más variables 2.- Asociar dos ( o más) variables .Por ejemplo peso y longitud
Diagrama de tallo y hoja    Diagrama de dispersión
Gráficos para variables discretas
Gráficos para variables continuas
Gráficos para variables categóricas


ejercicios

solución

1.- La ventaja de agrupar datos en clases consiste en 


a.- facilita los cálculos

b.- aumenta la precisión de las estimaciones

c.-facilita la representación gráfica

d.-ninguna de las anteriores


2.- La desventaja de agrupar datos en clases consiste en 

 

a.- dificulta los cálculos

b.- disminuye la precisión de las estimaciones

c.-dificulta la representación gráfica

d.-ninguna de las anteriores


3.- Por marca de clase se entiende 

 

a.- el promedio de sus límites reales

b.- el promedio de sus límites aparentes

c.-el límite inferior de cada clase

d.-ninguna de las anteriores


Tus sugerencias  - Página principal -  

Escríbenos