jueves, 27 de octubre de 2011

DISTRIBUCIÓN DE FRECUENCIAS TABLAS Y GRÁFICAS

DISTRIBUCIÓN DE FRECUENCIAS TABLAS Y GRÁFICAS
n: tamaño de la muestra
N: tamaño de la población
Xi: identificación para cada valor observado
Ni: frecuencias absolutas, es el número de veces que se repite cada valor de la variable.
Yi: simboliza los valores que toma la variable
hi: frecuencia relativa, valor porcentual obtenido al dividir la frecuencia absoluta por n EJEMPLO : la población o muestra es de 50 estas es la frecuencia absoluta  y n = 4 quedaría así 4/50=  0,08
Ni= frecuencia adsoluta acumulada
Hi: frecuencia relativa acumulada
Yi: marca  la clase de variable continua
m: el número de valores que toma la variable Yi, también se considera como número de intervalos o marcas de clase en variable continua




LA POBLACIÓN SE DIVIDE EN CARACTERES  CUALITATIVOS Y CUANTITATIVOS:
CARACTERES CUALITATIVOS: son denominados atributos descriptos cualitativamente mediante palabras ejemplo:
Clasificación de estudiantes de una universidad según origen de lugar, clasificación por sexo…
CARACTERES CUANTITATIVOS: son  número ejemplo: edad, peso, estatura, salarios etc…
Las variables se dividen en: discretas y continuas
DISCRETAS: Son aquellas que admiten valores enteros, es decir, no tienen valores intermedios, ejemplo: el número de hijos por familia ya que no se podría decir que una familia tienen 4 hijo y medio
CONTINUAS: son aquellas que admiten valores fraccionarios, pudiéndose establecer intervalos, Ejemplo: la estatura de una persona que mide un metro y medio.

 Supongamos que se tiene una población constituida por 2000 cajas y deseamos examinarlas con el fin de determinar el número de piezas defectuosas que contienen cada caja, por diferentes razones se desea que la investigación no se exhaustiva, es decir,  no examinar la totalidad de las 2000 cajas o universo, si no  por el tamaño 20 correspondiente a una investigación parcial.
N=2000
N= 20
El resultado de esta encuesta se anota a continuación siendo X1 = la primera caja examinada y 3 el número de piezas defectuosas encontradas en esa caja y así sucesivamente
X1=3   X2=  X3=0  X4=2   X5=3  X6=3   X7=   X8=1   X9=0  X10=1   X11=3   X12=3  X13=4  X14=4  X15=3   X16=2  X17=4  X18=2  X19=4   X20=2

En la anterior información o conjunto de datos se observa que no están ordenadas y se les denomina datos originales o no ordenados, quizás porque la muestra es muy pequeña podemos darnos cuenta en forma muy ligera del comportamiento de la característica, pero si en vez de tener 20 observaciones fueran 200 2000 es mucho lo que podemos decir o conocer de la variable;  Por lo tanto se hace necesario el ordenamiento o la clasificación de esos datos, mediante un proceso que llamaremos tabulación o procesamiento de datos.


En primer lugar se determina los valores que toman la variable en cuanto a la variable 0-1-2-4 . También se hubieran podido determinar los valores extremos (0-4)  y  luego los valores medios (1-2-3)  procedemos enseguida  al centro, A fin de determinar cuántas veces se repite cada valor de la variable, resultado que denominaremos frecuencias o  frecuencia absoluta.


Lo anterior se puede interpretar diciendo que la muestra de 20 cajas encontramos con ningunas piezas defectuosas.  3 cajas con una, 5 cajas con 2, 6 cajas con 3, 4 cajas con cuatro 4 piezas defectuosas. Sin embargo, a veces es mejor expresarlo en términos porcentuales diciendo que el 10% de las cajas examinadas no tenían piezas defectuosas que el 15% tenían una, que el 25% =2 , el 30%= 3, y el 20% con 4 piezas o unidades defectuosas, como se puede observar en el cuadro siguiente.


Las frecuencias relativas se obtienen de la siguiente forma:
hi=ni/n
hi=Ni/n   hi=2720=0.10
las frecuencias absolutas acumuladas las utilizamos para calcular se obtiene asi:
 Ni=n1
N2=n1+n2   N2=2+3=5
Las frecuencias relativas acumuladas resultan así:
H3= h1+h2+h3=0.25+0.25=0.50

PROPIEDADES DE LAS FRECUENCIAS
1Las frecuencias absolutas son siempre valores enteros
2 la suma de las frecuencias absolutas es igual a n
3 las frecuencias relativas son siempre  en valores de fraccionarios
4 la suma de las frecuencias relativas es igual a (1) el ultimo valor .
5 fraccionarios absolutos acumulados es igual a (n)
6 el ultimo valor correspondiente a las frecuencias relativas es igual a 1.
REPRESENTACIÓN GRAFICA
Diagrama de frecuencias


Diagrama de frecuencias acumuladas


Ejercicio
 Construir los 2 diagramas con la siguiente información
“Una vez recolectados los datos en forma ordenada es necesario presentarlos en forma tal ,que se facilite su comprensión y su posterior análisis y utilización. Para ello se ordenan en  cuadros números y luego se presentan  en graficas, para la variable discreta mediante   diagramas de frecuencias, Tanto para absolutas o relativas”
a)      Formar una tabla de frecuencias absolutas según el número de letras que componen cada palabra (( rr ll) se debe considerar una sola letra.
b)       Considerando  el número de letras por palabras ¿ qué valor tienen X4, X27, X12, X34, X2?
c)        En tablas de frecuencias del punto del valor que posee Y2, Y4, Y7 ?
d)      Análogamente que valores posee n2, n4, n7 ?
e)      valores posee h2, h4, h7 ?
f)       Calcular las frecuencias relativas acumuladas (H) y las frecuencias  absolutas
g)      H4 mayor h7 general
H4 menor h7


SOLUCIÓN
a)       Tabla de frecuencias
b)      X4=3
X27=3
X12=2
X34=5
X2=3
c)      
d)     
N=11
N=3
N=7
e)      H2=0.22
H4=0.06
H7=0.14

        F) frecuencias absolutas acumuladas = 50
            Frecuencias relativas acumuladas = 1.00
        g)h4  mayor h7 general sí, porque en la distribución de frecuencias
         h4 menor h7 si porque su frecuencia relativa es mayor porque en la distribución de  frecuencias
diagramas de frecuencias
Diagrama de frecuencias acumuladas
Una fábrica de gaseosa proyecta lanzar al mercado un nuevo sabor. Se realiza de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 101 p,  para medir el grado de aceptación los puntos obtenidos en los 30 niños fueron los siguientes:
2 6 8 7 4 5 10  6 6 7
6 7 3 8 7 6 8    6  5 4
7 8 5 7 6 7 2    7 2 7
La muestra estuvo compuestas por igual número de niños de ambos sexos, de 5 a 12 años de edad, residentes en el sector E del parque industrial de Pereira.
1)      Cual es la población
2)      Cual es la muestra
3)      Es cualitativa y cuantitativa
4)       Cual es la variable
5)       De que tipo  es la variable
6)      Que clase de escala se ha utilizado en la variable
7)      Construye una distribución de frecuencias
8)      Cuantas clases tiene la variable
SOLUCIÓN
1)      30 niños parque industrial
2)      30 niños de 5-12 años de edad, de ambos sexos del parque industrial del sector E
3)      Es cualitativo porque se basa en el sexo y un sector y es cuantitativo porque se habla de la edad
4)      La variable es la edad de 5-12 años
5)      El tipo de variable es discreta
6)      La clase de escala se ha utilizado en la medición  de la variable con números enteros (0-0)
7)     
8)      8 variables
EJERCICIO INVENTADO
Van 200 cajas de temperas en un camión con destino a la ciudad de Pereira, pero al llegar hubieron cajas con temperas regadas y se desea que la investigación no sea exhaustiva, es decir no revisar la totalidad de las cajas con las pinturas regadas, se toma la muestra de 50 cajas de temperas, con el fin de tener un promedio de mercancía no confiable.
1-      Realice su distribución de frecuencias
2-      Diagrama de frecuencias Y diagrama de frecuencias acumuladas
3-      Cuantas clases tiene la variable
4-      Que valores posee x15, x4 ,x7 ,x24 ,x36 ,x42?
5-      Piensa usted que de esta muestra que se tomo se puede decir que la mercancía es buena o mala?
Teniendo en cuenta los siguientes datos de las cajas que contienen temperas regadas:

SOLUCION:

1-      Realice su distribución de frecuencias
 















2. Diagrama de frecuencias


3.       Cuantas clases tiene la variable
R// la variable tiene 6 clases

4. Que valores posee x15, x4, x7, x24, x36, x42?

X15=1
X4=1
X7=2
X24=3
X36=4
X42=3


5.       Piensa usted que de esta muestra que se tomo se puede decir que la mercancía es buena o mala?

R// al no ser tan exhaustiva la investigación al tomar esta muestra se demuestra que el promedio de la mercancía es mala sus temperas no son cerradas correctamente y salieron de mala calidad.
MÉTODOS DE POSICIÓN O DE TENDENCIA CENTRAL
 Las medidas de posición o de tendencia central nos permiten determinar la posición de un valor respecto a un conjunto de datos el cual consideramos como  representativo para el total de las observaciones

Estas medidas aplicadas a las características  de las unidades en una muestra se les denomina estimadores y estadígrafos en cambio a aplicada a las características  de los elementos de una población se les conoce como parámetros o valores estadísticos de la población.
Cuando en una zona o barrio de la ciudad que el consumo promedio de leche por familia es 2 L por semana, estamos representando una gran variedad de consumos, que can desde familias que no consumen superior a 2L.
También el resultado puede ser comparado con el consumo promedio de otros barrios o el consumo promedio por persona o establecer la relación que hay entre el consumo y los niveles de ingreso.

Dentro de los promedios se consideran entre otros los siguientes:

1) media aritmética
2) mediana
3)modo o moda
4) media geométrica
5) media armónica
6) media cuadrática
7) media cubica
8) centro recorrido
9) cuartiles, deciles y percentiles

REGLAS PERA EL USO DE LOS PROMEDIOS
1) cuando la serie tenga forma de progresión   geométrica, debe usarcé el promedio geométrico.
2) para calcular la velocidad media debe usarcé la media armónica.
3) cuando la distribución sea muy asimétrica, debe considerarse la posibilidad de usar la median o modo.
4) cuando la distribución tenga forma de “u” ósea que pueda representarse con una curva cóncava de extremos iguales , debe usarse el modo.
5) cuando quiera darse la importancia a los valores pequeños de la variable, es aconsejable la media geométrica.
6) en una distribución cuyos valores extremos no están definidos es aconsejable el modo o la mediana
7) cuando  haiga alguna razón para pensar que el promedio aritmético no representa muy bien ala distribución debido a que los valores extremos lo afectan, o por  otras razones debe considerarse la posibilidad de usar la mediana o el modo.
8) cuando la amplitud de la distribución no es constante no debe usarce el modo, es decir, cuan se quiere p.
                                                remediar relaciones (tazas), se debe usar la media armónica.
 En los demás de los casos debe usarce.
MEDIA ARITMETICA
Es la medida de tendencia más utilizada, más conocida y más fácil de utilizar, de calcular, sus formulas admiten tratamientos algebraicos, su desventaja principal es el de ser muy sensible a los cambios que se haga en algunos de sus valores extremos son demasiados grandes o demasiados pequeños.

Se define como la suma de todos los valores observados dividido por el número total de observaciones.
 Y de esta forma se aplica en datos sin agruparse o datos originales
EJEMPLO:
 Encontrar la media aritmética del número de pares de zapatos por salón en el grupo 10ª 



encuentre la media aritmetica de los siguientes datos agrupados