INTRODUCCIÓN A LA ESTADÍSTICA
Transcript of INTRODUCCIÓN A LA ESTADÍSTICA
¿Qué significa estadística?
Estadística es la ciencia que seencarga de recolectar,organizar, presentar, analizare interpretar datos con elpropósito de ayudar a unatoma de decisiones másefectiva.
1-2
¿Quién usa estadística?
Las técnicas estadísticas se usanampliamente por personas enáreas de ingenieríacomercialización, contabilidad,control de calidad, consumidores,deportes, administración dehospitales, educación, política,medicina, etcétera...
1-3
Tipos de estadísticas Estadística descriptiva: métodos para organizar,
resumir y presentar datos de manera informativa. EJEMPLO 1: un sondeo de opinión encontró que
49% de las personas en una encuesta sabían elnombre del primer libro en la Biblia. La estadística“49” describe el número de cada 100 personasque saben la respuesta. EXAMPLE 2: según el Consumer Reports, los
dueños de lavadoras de ropa Whirlpoolreportaron 9 problemas por cada 100 máquinasdurante 1995. La estadística “9” describe elnúmero de problemas por cada 100 máquinas.
1-4
Tipos de estadísticas Estadística inferencial: una decisión,
estimación, predicción o generalizaciónsobre una población, con base en unamuestra. Una población es un conjunto de todos
los posibles individuos, objetos omedidas de interés. Una muestra es una porción, o parte, de
la población de interés.
1-5
Tipos de estadísticas(Ejemplos de inferencia estadística)
EJEMPLO 1: las cadenas de TV monitorean lapopularidad de sus programas contratando aNielsen y otras organizaciones para muestrearlas preferencias de televidentes. EJEMPLO 2: el departamento de contabilidad
de una empresa elegirá una muestra defacturas para verificar la exactitud de todas lasfacturas de la compañía. EJEMPLO 3: los catadores de vino prueban unas
cuantas gotas para tomar la decisión de liberartodo el vino para la venta.
1-6
Tipos de variablesVariable cualitativa o de
atributos: la característica ovariable que se estudia no esnumérica.EJEMPLOS: sexo, afiliación
religiosa, tipo de automóvil quese posee, lugar de nacimiento,color de los ojos.
1-7
Tipos de variablesVariable cuantitativa: la
variable se puede registrarnuméricamente.EJEMPLO: saldo en una cuenta
de cheques, minutos quefaltan para que termine laclase, número de niños en unafamilia.
1-8
Tipos de variables Las variables cuantitativas se pueden
clasificar como discretas o continuas.Variables discretas: sólo pueden
adquirir ciertos valores y casisiempre hay “brechas” entre esosvalores. EJEMPLO: el número de
habitaciones en una casa (1,2,3,...,etc.).
1-9
Tipos de variablesLas variables cuantitativas se
pueden clasificar como discretas ocontinuas.Variables continuas: pueden tomar
cualquier valor dentro de unintervalo específico.EJEMPLO: el tiempo que toma volar
de Quito a Nueva York.
1-10
Resumen de tipos de variables
Cualitativos o de atributos(tipo de auto que posee)
discretos(número de hijos)
continuos(tiempo para resolver el examen)
Cuantitativos o numéricos
DATOS
1-11
Fuentes de datos estadísticos Los problemas de investigación suelen
requerir datos publicados. Se puedenencontrar estadísticas relacionadas enartículos publicados, revistas yperiódicos. No todos los temas disponen de datos
publicados. En esos casos, lainformación deberá recolectarse yanalizarse. Una manera de recolectar datos es
mediante encuestas.
1-12
Niveles de medición
Nivel nominal: los datos sólose puede clasificar encategorías, no se puedenordenar.ELEMPLOS: color de los ojos,
sexo, afiliación religiosa.
1-13
Niveles de mediciónMutuamente excluyente: un
individuo, objeto o artículo, al serincluido en una categoría, debeexcluirse de las demás. EJEMPLO: color de los ojos. Exhaustivo: cada persona, objeto o
artículo debe clasificarse en al menosuna categoría. ELEMPLO: afiliación religiosa.
1-14
Niveles de mediciónNivel ordinal: involucra datos que se
pueden ordenar, pero no es posibledeterminar las diferencias entre losvalores de los datos o no tienensignificado.EJEMPLO: en una prueba de sabor de 4
refrescos de cola, el C se clasificó comonúmero 1, el B como número 2, el Acomo 3 y el D como número 4.
1-15
Niveles de mediciónNivel de intervalo: similar al nivel
ordinal, con la propiedad adicionalde que se pueden determinarcantidades significativas de lasdiferencias entre los valores. Noexiste un punto cero natural.EJEMPLO: temperatura en la escala
de grados Fahrenheit.
1-16
Niveles de mediciónNivel de razón: el nivel de
intervalo con un punto ceroinicial inherente. Las diferenciasy razones son significativas paraeste nivel de medición.EJEMPLOS: dinero, altura de los
jugadores de basquetbol de laNBA.
1-17
Niveles de medición Reglas:
1-17
a) Puede decirse que un valor es igual odiferente del de otro valor de la variable.b) Puede decirse que un valor es igual,mayor o menor que otro.c) Puede decirse que la diferencia entredos valores de la variable es igual, mayoro menos que la diferencia entre losvalores de otros dos pares de valores dela variable. O sea pueden efectuarseválidamente divisiones entre intervalos.
Niveles de medición Reglas:
1-17
d) Puede decirse que un valor estantas veces mayor o menor queotro. O sea pueden dividirse conválidamente valores de la variable.
Distribución de frecuencias
Agrupamiento de datos encategorías que muestranel número deobservaciones en cadacategoría mutuamenteexcluyente.
2-2
Elaboración de una distribución de frecuencias
pregunta quese desearesponder
recolecciónde datos
(datos originales)
distribuciónde frecuencias
organizaciónde datos
presentaciónde datos(gráfica)
obtenciónde
conclusiones
2-3
Distribución de frecuencias
Marca de clase (punto medio): punto quedivide a la clase en dos partes iguales. Es elpromedio entre los límites superior einferior de la clase. Intervalo de clase: para una distribución
de frecuencias que tiene clases del mismotamaño, el intervalo de clase se obtienerestando el límite inferior de una clase dellímite inferior de la siguiente.
2-4
EJEMPLO 1 Dr. Acosta es el director de la escuela de
ingeniería y desea determinar cuánto estudian losalumnos en ella. Selecciona una muestra aleatoriade 30 estudiantes y determina el número de horaspor semana que estudia cada uno: 15.0, 23.7, 19.7,15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9,20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7,14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
Organice los datos en una distribución defrecuencias.
2-5
EJEMPLO 1 continuación
Horas de estudio Frecuencia, f 8-12 1 13-17 12 18-22 10 23-27 5 28-32 1 33-37 1
2-6
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).
Sugerencias para elaborar una distribución de frecuencias
Los intervalos de clase usados enla distribución de frecuenciasdeben ser iguales.Determine un intervalo de clase
sugerido con la fórmula: i = (valormás alto - valor más bajo)/númerode clases.
2-7
Sugerencias para elaboraruna distribución de frecuencias
Use el intervalo de clase calculadosugerido para construir la distribuciónde frecuencias.Nota: este es un intervalo de clasesugerido; si el intervalo de clasecalculado es 97, puede ser mejor usar100. Cuente el número de valores en cada
clase.
2-8
Distribución de frecuencia relativa La frecuencia relativa de una clase se obtiene dividiendo
la frecuencia de clase entre la frecuencia total.
2-9
F r e c u e n c i a ,f
F r e c u e n c i ar e l a t i v a
8 - 1 2 1 1 / 3 0 = . 0 3 3 3
1 3 - 1 7 1 2 1 2 / 3 0 = . 4 0 0
1 8 - 2 2 1 0 1 0 / 3 0 = . 3 3 3
2 3 - 2 7 5 5 / 3 0 = . 1 6 6 7
2 8 - 3 2 1 1 / 3 0 = . 0 3 3 3
3 3 - 3 7 1 1 / 3 0 = . 0 3 3 3
T O T A L 3 0 3 0 / 3 0 = 1
T
Horas
Representaciones de tallo y hoja Representaciones de tallo y hoja:
técnica estadística para representar unconjunto de datos. Cada valor numéricose divide en dos partes: los dígitosprincipales son el tallo y el dígitosiguiente es la hoja. Nota: una ventaja de la representación
de tallo y hoja comparado con ladistribución de frecuencias es que no sepierde la identidad de cada observación.
2-10
EJEMPLO 2 Pedro logró las siguientes calificaciones en el
doceavo examen de contabilidad del semestre: 86,79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construyauna representación de tallo y hoja para los datos.
tallo hoja
6 9
7 8 9
8 2 3 4 5 6 8
9 1 2 6
2-11
Presentación gráfica de una distribución de frecuencias
Las tres formas de gráficas más usadas sonhistogramas, polígonos de frecuencia ydistribuciones de frecuencias acumuladas(ogiva). Histograma: gráfica donde las clases se
marcan en el eje horizontal y las frecuenciasde clase en el eje vertical. Las frecuencias declase se representan por las alturas de lasbarras y éstas se trazan adyacentes entre sí.
2-12
Presentation gráfica de una distribución de frecuencias
Un polígono de frecuencias consiste ensegmentos de línea que conectan lospuntos formados por el punto medio dela clase y la frecuencia de clase. Una distribución de frecuencias
acumulada (ogiva) se usa paradeterminar cuántos o qué proporción delos valores de los datos es menor omayor que cierto valor.
2-13
Histograma para las horas de estudio
02468101214
10 15 20 25 30 35Horas de estudio
Frec
uenc
ia
2-14
Polígono de frecuencias para las horas de estudio
2-15
02
46810
1214
10 15 20 25 30 35Horas de estudio
Frec
uenc
ia
Distribución de frecuencias acumuladas menor que para las
horas de estudio
05
1015
2025
3035
10 15 20 25 30 35Horas de estudio
Frec
uenc
ia
2-16
Gráfica de barrasUna gráfica de barras se puede usar
para describir cualquier nivel demedición (nominal, ordinal, deintervalo o de razón).EJEMPLO 3: construya una gráfica
de barras para el número depersonas desempleadas por cada100.000 habitantes de ciertasciudades en 2005.
2-17
EJEMPLO 3 continuación
Ciudad Número de desempleados por 100 000 habitantes
Quito 7300 Guayaquil 5400
Cuenca 6700 Machala 8900 Tulcán 8200 Ambato 8900
2-18
Gráfica de barras para los datos de desempleados
7300
54006700
89008200
8900
0
2000
4000
6000
8000
10000
1 2 3 4 5 6Ciudades
# de
sem
plea
dos/
100
000
QuitoGuayaquilMachalaMachalaTulcánAmbato
2-19
Gráfica circular Una gráfica circular es en especial útil
para desplegar una distribución defrecuencias relativas. Se divide un círculode manera proporcional a la frecuenciarelativa y las rebanadas representan losdiferentes grupos. EJEMPLO 4: se pidió a una muestra de
200 corredores que indicaran su tipofavorito de zapatos para correr.
2-20
EJEMPLO 4 continuación Dibuje una gráfica circular basada en la siguiente
información.
Tipo de zapato # de corredores
Nike 92
Adidas 49
Reebok 37
Asics 13
Otros 9
2-21