Guia de estadistica

26
UNIVERSIDAD NACIONAL DE CHIMBORAZO INDICE 1

Transcript of Guia de estadistica

Page 1: Guia de estadistica

UNIVERSIDAD NACIONAL DE CHIMBORAZO

INDICE

1

Page 2: Guia de estadistica

Nº Tema Páginas1 Conceptos fundamentales de estadística 2,32 Tablas de frecuencia 4,5,63 Medidas de tendencia central 7,8,9

Evaluación 104 Gráficos estadísticos 11,125 Moda y Mediana para datos agrupados 14,156 Cuartiles para datos no agrupados 167 Cuartiles para datos agrupados 17

Evaluación 21

2

Page 3: Guia de estadistica

Tema: CONCEPTOS FUNDAMENTALES DE ESTADÍSTICA

Objetivo: Reconocer algunos conceptos fundamentales de la estadísticaMateriales: Recortes de periódicos y revistas que muestren datos estadísticosConceptos:

CONCEPTOS FUNDAMENTALES DE ESTADÍSTICA

ESTADÍSTICA. La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.En un sentido más estricto, el término se utiliza para denotar los mismos datos o números que se derivan de ellos, como, por ejemplo, promedios. Así se habla de estadística de empleo, estadística de accidentes etc.Ejercicio: De un periódico recorte datos que representen estadísticas

POBLACIÓN Y MUESTRAEn una colección de datos que atañen a las características de un grupo de individuos u objetos, tal como las alturas y pesos de los estudiantes de un colegio o el número de cerrojos defectuosos y no defectuosos producidos por una fábrica en un día determinado, es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todo si éstos son muchos. En lugar de examinar el grupo entero llamado POBLACIÓN o UNIVERSO, se examina una pequeña parte del grupo llamada MUESTRA.Una población puede ser finita o infinita. Por ejemplo, la población consistente en todos los cerrojos producidos por una fábrica en un día determinado es finita, mientras la población formada por todos los posibles sucesos (caras, sellos) en tiradas sucesivas de una moneda es infinita.Si una muestra es representativa de una población, se pueden deducir importantes conclusiones acerca de ésta, a partir del análisis de la misma.Ejercicio: Escriba 5 ejemplos de población y de muestras de las mismas.

ESTADÍSTICA DESCRIPTIVA E INDUCTIVAL aparte de la estadística que trata de las condiciones bajo las cuales tales inferencias son válidas se llama ESTADÍSTICA INDUCTIVA O ESTADÍSTICA INFERENCIAL.Al no poder estar absolutamente ciertos de la veracidad de tales inferencias, se ha de utilizar con frecuencia en estas conclusiones el término de PROBABILIDAD.La parte de la estadística que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor se llama ESTADÍSTICA DESCRIPTIVA o DEDUCTIVA.

VARIABLES DISCRETAS Y CONTINUASUna variable es un símbolo, tal como X, Y, H, x, B, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor se llama constante.Una variable que teóricamente puede tomar cualquier valor entre dos valores dados se llama variable CONTINUA, si no es así se llama DISCRETA.Ejemplo 1: En una familia el número N de hijos puede tomar cualquiera de los valores 0, 1, 2, 3, 4, 5, 6,…., pero no puede ser 2,5 o 3,842; es pues una VARIABLE DISCRETA.Ejemplo 2: La altura H de un individuo puede ser 1,6 m 1,62 metros o 1,625 metros, dependiendo de la exactitud e la medida; es una VARIABLE CONTINUA.

REDONDEO DE DATOS.

3

Page 4: Guia de estadistica

El resultado de redondear un número tal como 72,8 al entero próximo es 73, puesto que 72,8 está más cerca de 73 que 72. Análogamente, 72,8146 redondeado al número decimal con dos decimales será 72,81, puesto que 72,8146 está más cerca de 72,81 que de 72,82.En el redondeo de 72,465 a un decimal con aproximación de centésimas, nos encontramos con el dilema de que 72,465 está justamente a la mitad de recorrido entre 72,46 y 72,47. Se acostumbra en tales casos redondear al número par más próximo que antecede al cinco. Así, 72,465 se redondea a 72,46; 183,575 se redondea a 183,58; redondeando 116.500.000 con aproximación de millones será 116.000.000. Esta práctica es especialmente útil al minimizar la acumulación de errores de redondeo cuando se abarca un número grande de operaciones.Estadística Descriptiva thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-

indice.html -

Tema: TABLAS DE FRECUENCIASObjetivo: Construir una tabla de frecuenciasConocimientos previos: Conceptos fundamentales de estadísticaConceptos:TABLAS DE FRECUENCIAS

2.1 TOMA DE DATOS: La toma de datos es la obtención de una colección de los mismos que no han sido ordenados numéricamente. Un ejemplo es la edad de 50 estudiantes del grado 10º de la sección nocturna de la IE María Montessori.

2.2 ORDENACIÓN: Una ordenación es una colección de los datos numéricos tomados, en orden creciente o decreciente de magnitud. La diferencia entre el mayor y el menor de los números se llama Recorrido o Rango de los datos. Por ejemplo, si la mayor edad de los estudiantes es 60 años y la menor es 15 años entonces el rango es 60 - 15 = 45 años.

2.3 DISTRIBUCIONES DE FRECUENCIA. Cuando se dispone de gran número de datos, es útil el distribuirlos en clases o categorías y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenación tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una Distribución de frecuencias o Tabla de frecuencias.

La tabla de distribución de frecuencias se hace agrupando el conjunto de datos numéricos en clases o intervalos apropiados. Este procedimiento lo explicaremos mediante el desarrollo del siguiente ejercicio.

Los siguientes datos se recopilaron con el fin de determinar la edad de 50 estudiantes del grado 10º de la sección nocturna de la IE María Montessori. Así los datos obtenidos fueron los siguientes:

42302520312517251919

22426019181920171716

42202016151620191615

20154230152519151615

17201820151918171615

Organizando este conjunto de datos en forma ascendente y haciendo el correspondiente recuento (número de veces que se repite cada valor) obtenemos el registro indicado a continuación. Observemos que el valor máximo es 60 y el menor es 15.

Edades de 50 estudiantes del grado 10º de IE María montessori sección nocturna. Edad Nº de veces que se repite

4

Page 5: Guia de estadistica

15 8

16 6

17 5

18 3

19 7

20 8

22 1

25 4

30 2

31 1

42 4

60 1

→→→→→→→→→→→→

En la anterior ordenación la variable X toma muchos valores diferentes y algunos de ellos tienen una frecuencia tan pequeña que no se justifica considerarlos por separado. Además, no podemos visualizar claramente las medidas de tendencia central y su cálculo se dificulta por la cantidad de operaciones que deben realizarse. Por tanto, es necesario agrupar los datos en clases o intervalos.

Para agrupar este conjunto en clases o intervalos de datos debemos seguir los siguientes pasos:

1er paso: Rango o recorridoCalculamos el rango o recorrido que representamos por R y que es la diferencia entre el Xmáx y el Xmín.

R = Xmáx - Xmín

R = 60 – 15 = 45Un rango de 45 años significa que la diferencia entre la mayor edad y la menor es 45 años.

2º Paso: Elección del número de intervalos Determinamos el número K de clases o intervalos en que vamos a agrupar los datos. No existe una regla única para fijar el K, pero generalmente varía entre 5 y 20 ( 20k5 ≤≤ ) dependiendo del tamaño n de la muestra; su elección queda al criterio del lector. Elijamos para agrupar nuestra muestra un número K = 7 de clases o intervalos.

3er Paso: Amplitud de intervalos o clasesRepartimos el rango en clases o intervalos de la misma longitud o amplitud. Si a representa la amplitud de cada intervalo, entonces:

k

Ra = 4,6

7

45a ==→

Cuando los datos sean valores enteros de la variable, entonces el cociente k

R debe ser un

número entero. Si no ocurre que k

R es entero, como en nuestro ejemplo ( 6,4

k

R = ),

debemos aproximar a al número entero más próximo por encima, es decir a = 7.

4º Paso: Límite de intervalosSi K = 7 y a = 7, entonces el rango que vamos a repartir ya no es R = 45 sino 7 x 7 = 49. Este nuevo rango se representa por Ra y se llama rango ampliado.

Si Ra - R es la cantidad en que se amplía el rango, entonces en esta misma cantidad se debe ampliar el Xmáx o disminuir el Xmín ( o ambos) para que se cumpla:Ra = Xmáx – Xmín.En nuestro ejemplo: 49 = 64 – 15 ó 49 = 60 – 11 ó 49 = 62 - 13

5

Page 6: Guia de estadistica

Si aumentamos el Xmáx en 4, entonces el Xmáx = 64 es el límite superior del último intervalo.Si al límite inferior Li = 15 del primer intervalo se le adiciona la amplitud a = 7, el resultado Ls = 15 + 7 = 22 es el límite superior del primer intervalo, Así:

Li Xmín. 15Primera clase Ls = Xmín + Amplitud

Ls = Li + aLs = 15 + 7 = 22

La primera clase está formada por todos los valores de x entre 15 y 22 años.La segunda clase tiene como límite inferior el límite superior de la primera clase y como límite superior el inferior aumentado en la amplitud.Segunda clase 22 - 29Este procedimiento se repite hasta obtener un número (K = 7) de intervalos ya establecido que tiene a 64 como límite superior del último intervalo. (Ver tabla).

Clase Intervalo Marca de clase: Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa porcentual

100.n

fi =

%

Frecuencia porcentual acumulada %

Xi.fi

1º 15 - 22 18,5 37 37 0,74=74% 74% 684.52º 22 - 29 25,5 5 42 0,10=10% 84% 127.53º 29 - 36 32,5 3 45 0,06=6% 90% 97.54º 36 - 43 39,5 4 49 0,08=8% 98% 1585º 43 - 50 46,5 0 49 0,00=0% 98% 06º 50 - 57 53,5 0 49 0,00=0% 98% 07º 57 - 64 60,5 1 50 0;02=2% 100% 60.5

Total n=50 1,00=100%

Cuando el cociente k

R es exacto y no hay necesidad de ampliar el rango, tanto el límite inferior del primer

intervalo como el límite superior del último intervalo coinciden con los x mín. y x máx.

5º paso: Marcas de clase: Como en cada intervalo podemos considerar infinitos valores reales de la variable x, debemos tomar uno de ellos que nos represente la clase y nos permita hacer gráficas y cálculos(como la media aritmética). A cada uno de estos valores se le llama marca de clase y su mejor representante es el punto medio del intervalo (o valor central).

Si xi representa el punto medio del intervalo i-ésimo, entonces la primera marca de clase es:

5,182

22151 =+=x

Las otras marcas de clase se pueden obtener en forma similar, o sumando a la anterior la amplitud:

2x = 18,5 + 7 = 25,5

3x = 25,5 + 7 = 32,5

4x = 32,5 + 7 = 39,5

7X = 53,5 + 7 = 60,5

6º paso: Tabla de distribución de frecuencias: Si al elaborar la columna de las frecuencias absolutas, un valor muestral coincide con uno de los límites del intervalo, convenimos en tomar ese valor en aquella clase donde aparece como límite inferior del intervalo. Es decir, son intervalos cerrados –abiertos. Por ejemplo, el valor 22 que aparece como límite superior del primer intervalo pertenece a la segunda clase.El último intervalo lo tomamos cerrado para que el x máx. y los valores que coinciden con él no queden fuera de la tabla.

En la tabla anterior indicamos las frecuencias absolutas, acumuladas, relativas y acumuladas porcentuales.Un análisis de la tabla de distribución de frecuencias nos permite afirmar:

6

Page 7: Guia de estadistica

37 estudiantes de los grados 10º sección nocturna de la IE María Montessori tienen unan edad entre 15 y 22 años correspondientes al 74% de la muestra.De los 50 estudiantes 49 son menores de 43 años, lo cual corresponde al 98% de la muestra tomada.

Las edades más frecuentes están entre los 15 y 22 años, por tener esta clase la máxima frecuencia absoluta.www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

Tema: MEDIDAS DE TENDENCIA CENTRALObjetivo:

Reconocer la moda, la mediana y el promedio o media aritmética como medidas de tendencia central

Calcular la moda y la mediana de datos no agrupados Calcular el promedio o media aritmética de datos agrupados y no agrupados

Conocimientos previos: Tabla de frecuencias.Conceptos

MEDIDAS DE TENDENCIA CENTRAL

Permiten un mejor análisis de los datos estadísticos. Las medidas de tendencia central son: Moda, Mediana y Media.Aclaremos a través de un ejercicio cada uno de estos conceptos.

Ejercicio: Sea x la variable que representa el número de faltas de asistencia al colegio de los 50 alumnos de un curso durante un año escolar, x genera el siguiente conjunto de datos numéricos: 3,2,3,4,1,2,3,4,3,3,3,5,6,6,5,3,4,1,2,3,2,5,1,3,3,3,2,4,1,2,2,3,3,5,5,6,3,4,4,1,2,4,3,7,7,3,7,6,5,3.Ordenemos los datos, representándolos mediante una tabla de frecuencias y calculemos las medidas de tendencia central: Moda, Mediana, y Media.

Llene la siguiente tabla:

Xi = Nº de

faltas

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa porcentual

100.n

fi =

%

Frecuencia porcentual acumulada %

Xi.fi

1234567 50 100%Total n = 50 1,00 = 100% 175

7

Page 8: Guia de estadistica

3.1 LA MODA. La moda de una serie de datos estadísticos, ordenados en una tabla de frecuencias, es el valor de la variable que tiene la máxima frecuencia absoluta.

¿Cuál es la moda en el ejercicio realizado? __________

3.2 LA MEDIANA. La mediana de una serie de datos estadísticos numéricos, ordenados en una tabla de frecuencias, es el valor de la variable tal que entre él y sus menores cubren la mitad (50%) de la muestra.

Para determinar el valor de la mediana en el ejercicio dado podemos aplicar uno de los siguientes procedimientos:

1. Tomamos el valor de x que corresponde a la frecuencia acumulada inmediatamente

superior a 2

n.

Así: 2

n=

50

2 = 25. La Fi inmediatamente superior a 25 es 30, al cual le

corresponde el valor X3 = 3.

Luego, mediana = Me= 3 faltas significa que la mitad del grupo faltó tres días o más al colegio.

2. En la columna de frecuencias acumuladas porcentuales, leemos aquel porcentaje que es inmediatamente superior a 50% y tomamos como mediana el valor de X que le corresponde.

Así: 60% es la frecuencia acumulada porcentual inmediatamente superior al 50%; luego Me = 3 faltas.

Si 2

n coincide con una frecuencia acumulada, entonces tomamos como mediana la semisuma del valor

Xi correspondiente con el siguiente Xi+1 . Es decir: 1

2i ix x ++

.

3.3 PROMEDIO O MEDIA ARITMÉTICA. La media aritmética o simplemente Media de una serie de datos estadísticos numéricos es un numero que se obtiene sumando todos los datos y dividiendo la suma por el tamaño de la muestra.Para calcular la Media cuando los datos se encuentran ordenados en una tabla de frecuencias, procedemos de la siguiente manera:

Si los valores diferentes 1 2 3x , x , x ,..., ,kx se presentan con frecuencias absolutas 1 2 3 kf , f , f ,...f ,

entonces la media aritmética simbolizada por X es:

1 1 2 2 3 3 ...X n

k kx f x f x f x f+ + += Donde n es el tamaño de la muestra.

Observa la tabla y mira el encabezado de la última columna Xi.fi, cada uno de esos datos equivale a la variable multiplicada por su frecuencia absoluta, al sumar estos datos y dividirlos entre el tamaño de la muestra que en este caso es 50 obtenemos el promedio.

Aplica la fórmula y obtiene el promedio de los datos. Obtendrás 3,5 faltas.

X =

50=

X = 3,5 faltas nos indica que en promedio los estudiantes del grupo faltan 3,5 días durante el año escolar.

Ejercicios:

1. La tabla dada a continuación muestra la información sobre el número de casos de urgencias atendidos diariamente en un hospital durante un trimestre. Hallar la moda, mediana y media aritmética de la demanda del servicio de urgencias en ese hospital.

Xi . fi Fi % Acumulado Xi.fi15 3 3 3,33 4518 4 7 7,78 7219 10 17 18,89 19021 16 33 36,67 33622 12 45 50,00 26425 12 57 63,33 30028 16 73 81,11 448

8

Page 9: Guia de estadistica

31 8 81 90,00 24835 7 88 97,78 24540 2 90 100,00 80Total N = 90 2228

2. A una reunión asisten 6 personas con edades de15, 16, 18, 20, 12 y 14 años. ¿Cuál es la media aritmética? ¿Cuál es la mediana? ¿Cuál de estos valores es más representativo? ¿Por qué?

El tiempo en segundos registrado por un grupo de 40 atletas en los 100 metros planos, presenta el siguiente conjunto de datos estadísticos numéricos:

13 12 12 11 10 12 14 14 11 12

12 11 11 12 13 13 14 12 10 16

13 13 12 12 12 14 14 14 13 14

11 11 12 12 14 12 12 11 10 12

a. Elaborar una tabla de frecuencias

b. Establecer el número de atletas con un tiempo de 13 segundos.c. Establecer el porcentaje de atletas con un tiempo de 13 segundosd. ¿Cuántos atletas recorren los 100 metros en un tiempo inferior a 13 segundos?e. ¿Cuántos atletas recorren los 100 metros en un tiempo superior a 13 segundos?f. ¿Qué porcentaje de los atletas recorre los 100 metros en un tiempo máximo de 13

segundos?g. ¿Qué porcentaje de los atletas recorre los 100 metros en un tiempo mínimo de 13

segundos?h. Determinar el tiempo modal del grupo de atletasi. ¿Cuál es el tiempo promedio del grupo en los 100 metros?j. ¿El 25% del grupo hace los 100 metros en un tiempo inferior o igual a qué valor?k. ¿El 50% del grupo hace los 100 metros en un tiempo inferior o igual a qué valor?l. ¿El 75% del grupo hace los 100 metros en un tiempo inferior o igual a qué valor?

Ejercicios de Medidas de Tendencia Central

1. Un urbanista tiene los siguientes lotes: l1 = 85 m2 ; l2 = 120 m2 ; l3 = 205 m2 ; l4 = 186 m2 ; l5 = 150 m2 ; l6 = 136 m2 ; l7 = 142 m2. ¿Cuál es el área promedio de los lotes?

2. Las notas obtenidas por los alumnos de 10º grado en estadística fueron:4 alumnos obtuvieron 30; 5 alumnos obtuvieron 40; 7 alumnos obtuvieron 50; 10 alumnos obtuvieron 60; 8 obtuvieron 70; 6 obtuvieron 80, 3 obtuvieron 90; 1 obtuvo 100.

Con los datos anteriores, completa la tabla. Calcula la media aritmética o nota promedio obtenida por los alumnos.

Xi f i Xi . f i

30 4 12040 5 20050 7 35060 10 60070 8 56080 6 48090 3 270100 1 100TOTAL N=44 X=2680/44=60,90

3. Los tiempos en minutos empleados por un grupo de atletas en recorrer 15 Km. Están representados en la siguiente tabla. Calcula el tiempo promedio empleado por los atletas.

Tiempo Xi Frecuencia Absoluta f i Xi . f i

120 2

9

Page 10: Guia de estadistica

130 5135 4180 7200 10215 8230 4

4. Calcula la mediana y la moda en los ejercicios anteriores.5. Calcula la mediana de los números: 15, 6, 3, 8, 10.6. Calcula la mediana de los números: 3, 6, 7, 10, 15, 18.

Cibergrafía: Estadística es.wikipedia.org/wiki/Estad%C3%ADstica

EVALUACION

NOMBRE____________________________SEMESTRE___________FECHA______

1. Con los datos dados a continuación llene la tabla de frecuencias.

Las notas obtenidas por los alumnos de 10º grado en estadística fueron:3 alumnos obtuvieron 30; 6 alumnos obtuvieron 40; 9 alumnos obtuvieron 50; 10 alumnos obtuvieron 60; 7 obtuvieron 70; 5 obtuvieron 80, 2 obtuvieron 90; 3 obtuvieron 100.

Con los datos anteriores, completa la tabla. (Cada columna vale 5 puntos) Calcula la media aritmética o nota promedio obtenida por los alumnos. (Vale 5

puntos) Halla la Moda y la Mediana. (Vale 5 puntos cada una)

Notas = Xi Frecuencia Absoluta = fi

Frecuencia Absoluta Acumulada = Fi

Frecuencia Relativa o Porcentual = %

Frecuencia Porcentual Acumulada

Xi.fi

30405060708090100 45 100%Total 45 1,00 = 100%

Promedio =

45x =

Moda =

10

Page 11: Guia de estadistica

Mediana =

Tema: GRÁFICOS ESTADÍSTICOSObjetivo:

Reconocer algunos gráficos estadísticos Realizar gráficos estadísticos

Conocimientos previos: Tabla de frecuenciasConceptos:

GRÁFICOS ESTADÍSTICOS

Los gráficos estadísticos son formas vistosas de presentar los resultados organizados en las tablas de frecuencias.Existen muchos tipos de gráficos pero vamos a estudiar 3. Para ello tomaremos como referencia la tabla de datos correspondiente a los deportes preferidos de 50 estudiantes.

GRÁFICO DE SEGMENTOS: En este gráfico se representa con un punto la intersección entre la variable estudiada en este caso, el deporte preferido que se ubica en el eje X con su frecuencia que se representa en el eje Y que en este caso es la frecuencia absoluta. Luego se unen los puntos por medio de segmentos.

DeporteNº de estudiantes

Fútbol 20Basquet 15Bolybol 10Otros 5Total 50

11

Deporte preferido

0

5

10

15

20

25

Fútbol Basquet Bolybol Otros

de

estu

dia

nte

s

Nº de estudiantes

Page 12: Guia de estadistica

GRÁFICO DE BARRAS: En este gráfico se ubican en el eje horizontal la variable estudiada (Deporte preferido) y por medio de barras verticales se representa la frecuencia absoluta, dependiendo de la frecuencia es la altura de la barra, todas las bases de las barras son del mismo tamaño y lo que varía es la altura.

Cuando en el eje Y se ubica la frecuencia acumulada y en el gráfico se unen los puntos medios de la base superior de cada rectángulo por medio de segmentos obtenemos la Ojiva, la importancia de la cual radica en que en ella podemos ubicar la mediana.

GRÁFICO CIRCULAR: Para representar el gráfico circular se debe calcular que área del círculo en grados corresponde a la frecuencia absoluta de la variable estudiada. Así para saber qué área corresponde al fútbol que fue escogido como el deporte preferido por 20 estudiantes de un total de 50. Se realiza el siguiente procedimiento.

Nº de estudiantes Grados

50 360º

20 X

(20).(360º) X 144º

50

→→

= =

Luego el área que corresponde al fútbol es 144ºAsimismo se calcula el área para cada uno de los otros deportes.

Básquet

12

0

5

10

15

20

Nº de estudiantes

Fútbol Basquet Bolybol Otros

Deporte

Deportes preferidos

Page 13: Guia de estadistica

Nº de estudiantes Grados

50 360º

15 X

(15).(360º) X 108º

50

→→

= =

El área que corresponde a básquet es de 108º

Voleibol

Nº de estudiantes Grados

50 360º

10 X

(10).(360º) X 72º

50

→→

= =

El área que corresponde a voleibol es de 72º

OtrosNº de estudiantes Grados

50 360º

5 X

(5).(360º) X 36º

50

→→

= =

El área que corresponde a otros es de 36º

Nota: La suma de los grados de todos los deportes escogidos debe dar 360º que es el área total del círculo.

Veamos: Fútbol 144º Básquet 108º

Voleibol 72ºOtros 36º

Total 3 60º

Para representar el gráfico circular se hace necesario utilizar el transportador.

Ejercicios:

1. Dada la siguiente tabla de frecuencias correspondiente a los colores favoritos de 60 niños. Realizar los tres tipos de gráficos estudiados.

13

Deporte preferido

Fútbol; 20

Basquet; 15

Bolybol; 10

Otros; 5

Page 14: Guia de estadistica

2. Con la tabla de datos correspondiente al porcentaje de estudiantes que perdieron esa área, realizar los tres gráficos estudiados.

CIBERGRAFÍA. Comprensión y aplicación de la estadística www.cortland.edu/flteach/stats/stat-sp.html

Tema: Moda y Mediana para datos agrupados

Colores Favoritos

Frecuencia absoluta

Azul 15Verde 20Blanco 5Rojo 4Amarillo 16Total 60

Área perdida

Frecuencia porcentual

Español 30%Matemáticas 20%Sociales 15%Ciencias N 10%Otras 5%No pierden 20%Total 100%

14

Page 15: Guia de estadistica

Objetivo: Calcular la moda y la mediana para datos agrupadosConocimientos previos: Moda y mediana de datos no agrupados.Conceptos:LA MODA: Para datos agrupados se encuentra en la mayor frecuencia absoluta de los intervalos, asimismo se puede determinar en el gráfico de barras pues la barra más alta equivale a la moda.

LA MEDIANA: en datos agrupados equivale al dato que se encuentra en toda la mitad, y para encontrarlo se necesita el método estudiado anteriormente para datos no agrupados; y luego se requiere de aplicar la siguiente fórmula.

12 i

ii

na F

Me Lf

− − = + Donde

Me= MedianaLi = Límite inferior del intervalo donde se encuentra la medianaa = amplitudn = Número de datosFi-1 = frecuencia acumulada anterior al intervalo que contiene la medianafi = La frecuencia absoluta que corresponde al intervalo que contiene la mediana

Ejemplo: La tabla de datos correspondiente a las edades de 50 alumnos de la I.E. María Montessori sección nocturna está dada a continuación:

Clase Intervalo Marca de clase: Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa porcentual

100.n

f i =

%

Frecuencia porcentual acumulada %

Xi.fi

1º 15 - 22 18,5 37 37 0,74=74% 74% 684.52º 22 - 29 25,5 5 42 0,10=10% 84% 127.53º 29 - 36 32,5 3 45 0,06=6% 90% 97.54º 36 - 43 39,5 4 49 0,08=8% 98% 1585º 43 - 50 46,5 0 49 0,00=0% 98% 06º 50 - 57 53,5 0 49 0,00=0% 98% 07º 57 - 64 60,5 1 50 0;02=2% 100% 60.5

Total n=50 1,00=100%

La moda es la edad de 18,5 años que es la marca de clase que corresponde a la mayor frecuencia absoluta 37

La mediana es la edad que se encuentra en el centro de todas las edades para calcularla utilizaremos la fórmula

DondeMe= Mediana, la cual se encuentra ubicada en el primer intervalo

pues n 50

252 2

= = y este dato se encuentra en la frecuencia

acumulada del primer intervalo.

15

12 i

ii

na F

Me Lf

− − = +

Page 16: Guia de estadistica

Li = Límite inferior del intervalo que contiene la mediana, es decir, 15 a = amplitud = 7 porque 22 - 15 = 7n = Número de datos = 50Fi-1 = frecuencia acumulada anterior al intervalo que contiene la mediana = 0 porque antes de este primer intervalo no hay datos acumulados.fi = La frecuencia absoluta que corresponde al intervalo que contiene la mediana = 37

Por tanto: [ ]

507 0

215

377 25

1537

17515

3715 4,73

19,73

Me

Me

Me

Me

Me

− = +

= +

= +

= +=

Lo cual significa que la mediana o la edad que se encuentra en el centro de los datos recolectados son 19.

Ejercicios:

1. La tabla de frecuencias siguiente corresponde a la natalidad en una determinada ciudad.

Clase Intervalo Marca de clase: Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa o porcentual

100.n

fi =

%

Frecuencia porcentual acumulada %

Xi.fi

1º 44-51 47,5 16 16 10,67 10,67 7602º 51-58 54,5 19 35 12,67 23,33 1035,53º 58-65 61,5 24 59 16 39,33 14764º 65-72 68,5 31 90 20,67 60 2123,55º 72-79 75,5 23 113 15,33 75,33 1736,56º 79-86 82,5 15 128 10 85,33 1237,57º 86-93 89,5 13 141 8,67 94 1163,58º 93-100 96,5 9 150 6 100 868,5

150 10401

Hallar la moda, la mediana, la media o promedio aritmético y realizar un gráfico de barras y trazar la ojiva y ubicar la moda y la mediana en este gráfico.

Estadística. Monografías.comwww.monografias.com/trabajos15/estadistica/estadistica.shtml

16

Page 17: Guia de estadistica

Tema: Cuartiles.

Objetivo: Calcular los cuartiles de una serie de datos no agrupadosConocimientos previos: Tabla de frecuencias, mediana.Conceptos:

CUARTILES: Los cuartiles son tres números reales Q1, Q2, Q3

que separan el conjunto de datos en cuatro grupos de igual tamaño.

Cuartil Inferior Q1: es el valor de la variable x que cumple que

al menos un 25% 25

100 4

n n = ÷ de los datos ( u observaciones) son

menores o iguales a Q1 y al menos un 75% de los mismos, son mayores o iguales a Q1.

Cuartil Medio Q2: Es el valor de la variable x que cumple que al

menos un 50% 50

100 2

n n = ÷ de los datos son menores o iguales a

Q2 y al menos un 50% de los mismos son mayores o iguales a Q2 Observamos que Me = Q2 .

Cuartil Superior Q3: Es el valor de la variable x que cumple que

al menos un 75% 75 3

100 4

n n = ÷ de los datos son menores o

iguales a Q3 y al menos un 25% de los mismos son mayores o iguales a Q3.

Procedimiento para hallar los cuartiles: Para hallar Q1, Q2, Q3

cuando los datos están ordenados mediante una tabla de frecuencias, buscamos aquellos porcentajes en la columna de las frecuencias acumuladas porcentuales que son iguales o inmediatamente superiores a 25%, 50% y 75%, respectivamente y tomamos como Q1, Q2, Q3 los valores discretos Xi que corresponden a esas frecuencias acumuladas.

Ejemplo: Hallar los cuartiles: Inferior, medio y superior en la tabla de frecuencias que corresponde a los casos de urgencias atendidos diariamente en un hospital durante un trimestre.Xi . fi Fi % Acumulado Xi.fi15 3 3 3,33 4518 4 7 7,78 7219 10 17 18,89 19021 16 33 36,67 33622 12 45 50,00 26425 12 57 63,33 300

17

Page 18: Guia de estadistica

28 16 73 81,11 44831 8 81 90,00 24835 7 88 97,78 24540 2 90 100,00 80Total N = 90 2228

Solución: Cuartil Inferior Q1: 36,67 > 25% ⇒ Q1 = 21 urgenciasCuartil medioQ2: 50 = 50% ⇒ Q2 = 22 urgencias Cuartil superior Q3: 81,11 > 75% ⇒ Q3 = 28 urgencias

Estos resultados nos permiten concluir que el 25% de las urgencias atendidas son iguales o inferiores a 22 y que el 75% de las mismas es superior a 22.El 50% de las urgencias es igual o inferior a 22 y que el 75% de las urgencias atendidas es igual o está por debajo de 28 .

Ejercicios:

Hallar los cuartiles inferior medio y superior de la siguiente tabla correspondiente a las notas obtenidas por los alumnos de 10º grado en estadística.

Notas = Xi Número de alumnos= f i

Fi % % Acumulado

30 4 4 9,09 9,0940 5 9 11,36 20,4550 7 16 15,9 36,3660 10 26 22,73 59,0970 8 34 18,18 77,2780 6 40 13,64 90,9190 3 43 6,82 97,73100 1 44 2,72 100%Total 44 100%

Con base en los resultados obtenidos responder las siguientes preguntas:

1. ¿El 75% de los alumnos está por encima de qué calificación?

2. ¿El 25% de los alumnos está igual o debajo de cuál nota?3. ¿El 25% de los alumnos está por encima de cuál

calificación?4. ¿El 75% de los estudiantes tienen notas iguales o inferiores

a cuál?5. ¿La mitad del grupo está por debajo de cuál calificación?6. ¿Qué puede concluir de estos resultados?

Cibergrafía: Aulafácil.Curso gratis de Estadística. Estadística Descriptivawww.aulafacil.com/CursoEstadistica/CursoEstadistica

Tema: Cuartiles.

Objetivo: Calcular los cuartiles de una serie de datos agrupadosConocimientos previos: Cuartiles, mediana para datos agrupados.Conceptos:

18

Page 19: Guia de estadistica

Recordar: Los cuartiles son tres números reales Q1, Q2, Q3

que separan el conjunto de datos en cuatro grupos de igual tamaño.

Para hallar Q1, Q2 y Q3 cuando los datos están agrupados en clases, encontramos los intervalos que incluyen a Q1, Q2, Q3

y que corresponden a aquellas Fi (frecuencias absolutas acumuladas) que son iguales o inmediatamente superiores a n n n

, y 3 ,4 2 4

respectivamente.

Para hallar los valores Q1 y Q3 , utilizamos la misma fórmula de la mediana, tomando n n

y 3 4 4

en lugar de n

2 .

Cuartil inferior 1

1

4 i

ii

na F

Q Lf

− − = + donde

1Q = Cuartil inferiorLi = Límite inferior del intervalo donde se encuentra el cuartila = amplitudn = Número de datosFi-1 = frecuencia acumulada anterior al intervalo que contiene el cuartil inferior.fi = La frecuencia absoluta que corresponde al intervalo que contiene el cuartil inferior.

Cuartil medio 1

2

2 i

ii

na F

Q Lf

− − = + este cuartil es la misma

mediana

Cuartil superior 1

3

34 i

ii

na F

Q Lf

− − = +

Ejemplo: La tabla de frecuencias siguiente corresponde a la natalidad en una determinada ciudad. Los datos se tomaron entre 1979 y 1994 de los archivos de los diferentes hospitales de la ciudad donde se reporta el número de nacimientos por mes. Hallar los tres cuartiles.Clase Intervalo Marca

de clase: Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa porcentual

100.n

fi =

%

Frecuencia porcentual acumulada %

Xi.fi

1º 44-51 47,5 16 16 10,67 10,67 7602º 51-58 54,5 19 35 12,67 23,33 1035,53º 58-65 61,5 24 59 16 39,33 14764º 65-72 68,5 31 90 20,67 60 2123,55º 72-79 75,5 23 113 15,33 75,33 1736,56º 79-86 82,5 15 128 10 85,33 1237,57º 86-93 89,5 13 141 8,67 94 1163,58º 93-100 96,5 9 150 6 100 868,5

150 10401

19

Page 20: Guia de estadistica

Cuartil inferior 1

1

4 i

ii

na F

Q Lf

− − = +

n

4=

15037,5

4= La cuarta parte de los datos es 37,5.

59iF = es la frecuencia absoluta acumulada que contiene el cuartil inferior que es 37,5

1 35iF − = es la frecuencia absoluta acumulada anterior.

iL =58 límite inferior del intervalo que contiene el cuartil inferiora = 7 porque al restar el límite superior y el inferior de cualquier intervalo obtenemos una amplitud de 7.

if =24 Frecuencia absoluta del intervalo en donde se encuentra el cuartil inferior.Reemplazando y desarrollando tenemos:

[ ]

[ ]1

1

1

1

1

7 37,5 3558

247 2,5

5824

17,558

2458 0,73

58,73

Q

Q

Q

Q

Q

−= +

= +

= +

= +=

Esto significa que la cuarta parte (25%) de los bebés que nacieron durante el mes es máximo de 58,73.

Cuartil medio 1

2

2 i

ii

na F

Q Lf

− − = + este cuartil es la misma

medianan 150

752 2

= = La mitad de los datos es 75.

90iF = es la frecuencia acumulada que contiene el cuartil medio que es 75

1 59iF − = es la frecuencia acumulada anterior.

65iL = límite inferior del intervalo que contiene el cuartil medio

31if = Frecuencia absoluta del intervalo en donde se encuentra el cuartil medio.Reemplazando y desarrollando tenemos:

[ ]

[ ]2

2

2

2

2

7 75 5965

317 16

6531

11265

3165 3,61

68,61

Q

Q

Q

Q

Q

−= +

= +

= +

= +=

Lo cual significa que en la ciudad investigada la mitad (50%) de los nacimientos mensuales es inferior a 68,61 bebés .

Cuartil superior 1

3

34 i

ii

na F

Q Lf

− − = +

20

Page 21: Guia de estadistica

n 1503 3 112,5

4 4= = Las tres cuartas partes de los datos es

112,5.113iF = es la frecuencia acumulada que contiene el cuartil

superior que es 75

1 90iF − = es la frecuencia acumulada anterior.

72iL = límite inferior del intervalo que contiene el cuartil superior

23if = Frecuencia absoluta del intervalo en donde se encuentra el cuartil superior.

Reemplazando y desarrollando tenemos:[ ]

[ ]4

4

4

4

4

7 112,5 9072

237 22,5

7223

157,572

2372 6,85

78,85

Q

Q

Q

Q

Q

−= +

= +

= +

= +=

Aquí vemos que el 75% de los nacimientos durante el mes es inferior a 78,85 bebés.

Ejercicio: La siguiente tabla muestra las 178 calificaciones obtenidas por los estudiantes del grado décimo en la prueba final de matemáticas (escala de 1 a 10).Intervalos Marca de clase:

Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia porcentual acumulada %

Xi.fi

0,5-1,5 31,5-2,5 72,5-3,5 203,5-4,5 254,5-5,5 305,5-6,5 406,5-7,5 227,5-8,5 208,5-9,5 89,5-10,5 3

1. Completar la tabla de distribución de frecuencias2. Construir un histograma, un polígono de frecuencias y una

ojiva3. Hallar la moda, mediana y media.4. Determinar Q1, Q2, y Q3.

Cibergrafía: Comprensión y aplicación de la estadísticawww.cortland.edu/flteach/stats/stat-sp.html

21

Page 22: Guia de estadistica

EVALUACION

NOMBRE_____________________________SEMESTRE___________FECHA______

Marque la respuesta correcta:

Las preguntas 1 a la 3 se responden con base en el

siguiente gráfico1. El deporte preferido es:

22

0

5

10

15

20

Nº de estudiantes

Fútbol Basquet Voleybol Atletismo

Deporte

Deportes preferidos

Page 23: Guia de estadistica

a. Fútbolb. Básquetc. Voleibold. Atletismo

2. El deporte que menos gusta es:

a. Fútbolb. Básquetc. Voleibold. Atletismo

3. La moda en ese grupo de alumnos es:

a. Fútbolb. Básquetc. Voleibold. Atletismo

Las preguntas 4 a la 6 se responden con base en el gráfico

4. El mayor número de materias perdidas es:

a. Tresb. Dosc. Cerod. Cuatro

5. El menor número de materias perdidas es:

a. Tresb. Dosc. Cerod. Cuatro

6. La moda es:a. Tresb. Dosc. Cerod. Cuatro

7. Con los datos de la tabla dada a

continuación realizar:

a. Un gráfico. (Con la variable que es la estatura y la Frecuencia absoluta) Señalar en el gráfico la moda.

b. Trazar la ojiva

c. (Gráfico de barras que se realiza con la variable y frecuencia absoluta acumulada), Ubicar la mediana en la Ojiva.

23

Materias pérdidas por alumnos de 10º

Cero

Una

dosTres

Cuatro

Cinco

Seis

Page 24: Guia de estadistica

Tema: Cuartiles. Objetivo: Calcular los cuartiles de una serie de datos agrupados

La tabla de frecuencias siguiente corresponde a la natalidad en una determinada ciudad. Los datos se tomaron entre 1979 y 1994 de los archivos de los diferentes hospitales de la ciudad donde se reporta el número de nacimientos por mes. Hallar los tres cuartiles.

Clase Intervalo Marca de clase: Xi

Frecuencia absoluta: fi

Frecuencia absoluta acumulada: Fi

Frecuencia relativa porcentual

100.n

fi =

%

Frecuencia porcentual acumulada %

Xi.fi

1º 44-51 47,5 16 16 10,67 10,67 7602º 51-58 54,5 19 35 12,67 23,33 1035,53º 58-65 61,5 24 59 16 39,33 14764º 65-72 68,5 31 90 20,67 60 2123,55º 72-79 75,5 23 113 15,33 75,33 1736,56º 79-86 82,5 15 128 10 85,33 1237,57º 86-93 89,5 13 141 8,67 94 1163,58º 93-100 96,5 9 150 6 100 868,5

150 10401

Recordar:

Para hallar Q1, Q2 y Q3 cuando los datos están agrupados en clases, encontramos los intervalos que incluyen a Q1, Q2, Q3

y que corresponden a aquellas Fi (frecuencias absolutas acumuladas) que son iguales o inmediatamente superiores a n n n

, y 3 ,4 2 4

respectivamente.

Cuartil inferior 1

1

4 i

ii

na F

Q Lf

− − = + donde

1Q = Cuartil inferior

EstaturaNº de estudiantesfi Fi

1,55 5 51, 60 12 171,65 15 321,7 13 451,75 2 471,8 5 521,85 3 55 n=55

24

Page 25: Guia de estadistica

Li = Límite inferior del intervalo donde se encuentra el cuartila = amplitudn = Número de datosFi-1 = frecuencia acumulada anterior al intervalo que contiene el cuartil inferior.fi = La frecuencia absoluta que corresponde al intervalo que contiene el cuartil inferior.

Cuartil medio 1

2

2 i

ii

na F

Q Lf

− − = + este cuartil es la misma

mediana

Cuartil superior 1

3

34 i

ii

na F

Q Lf

− − = +

SOLUCIONES

25

Page 26: Guia de estadistica

26