INTRODUCCIÓN A LA ESTADÍSTICA

41
INTRODUCCIÓN A LA ESTADÍSTICA Ing. Raúl Acurio del Pino

Transcript of INTRODUCCIÓN A LA ESTADÍSTICA

INTRODUCCIÓN A LA ESTADÍSTICA

Ing. Raúl Acurio del Pino

¿Qué significa estadística?

Estadística es la ciencia que seencarga de recolectar,organizar, presentar, analizare interpretar datos con elpropósito de ayudar a unatoma de decisiones másefectiva.

1-2

¿Quién usa estadística?

Las técnicas estadísticas se usanampliamente por personas enáreas de ingenieríacomercialización, contabilidad,control de calidad, consumidores,deportes, administración dehospitales, educación, política,medicina, etcétera...

1-3

Tipos de estadísticas Estadística descriptiva: métodos para organizar,

resumir y presentar datos de manera informativa. EJEMPLO 1: un sondeo de opinión encontró que

49% de las personas en una encuesta sabían elnombre del primer libro en la Biblia. La estadística“49” describe el número de cada 100 personasque saben la respuesta. EXAMPLE 2: según el Consumer Reports, los

dueños de lavadoras de ropa Whirlpoolreportaron 9 problemas por cada 100 máquinasdurante 1995. La estadística “9” describe elnúmero de problemas por cada 100 máquinas.

1-4

Tipos de estadísticas Estadística inferencial: una decisión,

estimación, predicción o generalizaciónsobre una población, con base en unamuestra. Una población es un conjunto de todos

los posibles individuos, objetos omedidas de interés. Una muestra es una porción, o parte, de

la población de interés.

1-5

Tipos de estadísticas(Ejemplos de inferencia estadística)

EJEMPLO 1: las cadenas de TV monitorean lapopularidad de sus programas contratando aNielsen y otras organizaciones para muestrearlas preferencias de televidentes. EJEMPLO 2: el departamento de contabilidad

de una empresa elegirá una muestra defacturas para verificar la exactitud de todas lasfacturas de la compañía. EJEMPLO 3: los catadores de vino prueban unas

cuantas gotas para tomar la decisión de liberartodo el vino para la venta.

1-6

Tipos de variablesVariable cualitativa o de

atributos: la característica ovariable que se estudia no esnumérica.EJEMPLOS: sexo, afiliación

religiosa, tipo de automóvil quese posee, lugar de nacimiento,color de los ojos.

1-7

Tipos de variablesVariable cuantitativa: la

variable se puede registrarnuméricamente.EJEMPLO: saldo en una cuenta

de cheques, minutos quefaltan para que termine laclase, número de niños en unafamilia.

1-8

Tipos de variables Las variables cuantitativas se pueden

clasificar como discretas o continuas.Variables discretas: sólo pueden

adquirir ciertos valores y casisiempre hay “brechas” entre esosvalores. EJEMPLO: el número de

habitaciones en una casa (1,2,3,...,etc.).

1-9

Tipos de variablesLas variables cuantitativas se

pueden clasificar como discretas ocontinuas.Variables continuas: pueden tomar

cualquier valor dentro de unintervalo específico.EJEMPLO: el tiempo que toma volar

de Quito a Nueva York.

1-10

Resumen de tipos de variables

Cualitativos o de atributos(tipo de auto que posee)

discretos(número de hijos)

continuos(tiempo para resolver el examen)

Cuantitativos o numéricos

DATOS

1-11

Fuentes de datos estadísticos Los problemas de investigación suelen

requerir datos publicados. Se puedenencontrar estadísticas relacionadas enartículos publicados, revistas yperiódicos. No todos los temas disponen de datos

publicados. En esos casos, lainformación deberá recolectarse yanalizarse. Una manera de recolectar datos es

mediante encuestas.

1-12

Niveles de medición

Nivel nominal: los datos sólose puede clasificar encategorías, no se puedenordenar.ELEMPLOS: color de los ojos,

sexo, afiliación religiosa.

1-13

Niveles de mediciónMutuamente excluyente: un

individuo, objeto o artículo, al serincluido en una categoría, debeexcluirse de las demás. EJEMPLO: color de los ojos. Exhaustivo: cada persona, objeto o

artículo debe clasificarse en al menosuna categoría. ELEMPLO: afiliación religiosa.

1-14

Niveles de mediciónNivel ordinal: involucra datos que se

pueden ordenar, pero no es posibledeterminar las diferencias entre losvalores de los datos o no tienensignificado.EJEMPLO: en una prueba de sabor de 4

refrescos de cola, el C se clasificó comonúmero 1, el B como número 2, el Acomo 3 y el D como número 4.

1-15

Niveles de mediciónNivel de intervalo: similar al nivel

ordinal, con la propiedad adicionalde que se pueden determinarcantidades significativas de lasdiferencias entre los valores. Noexiste un punto cero natural.EJEMPLO: temperatura en la escala

de grados Fahrenheit.

1-16

Niveles de mediciónNivel de razón: el nivel de

intervalo con un punto ceroinicial inherente. Las diferenciasy razones son significativas paraeste nivel de medición.EJEMPLOS: dinero, altura de los

jugadores de basquetbol de laNBA.

1-17

Niveles de medición Reglas:

1-17

a) Puede decirse que un valor es igual odiferente del de otro valor de la variable.b) Puede decirse que un valor es igual,mayor o menor que otro.c) Puede decirse que la diferencia entredos valores de la variable es igual, mayoro menos que la diferencia entre losvalores de otros dos pares de valores dela variable. O sea pueden efectuarseválidamente divisiones entre intervalos.

Niveles de medición Reglas:

1-17

d) Puede decirse que un valor estantas veces mayor o menor queotro. O sea pueden dividirse conválidamente valores de la variable.

Ejercicios

1-17

Distribución de frecuencias

Agrupamiento de datos encategorías que muestranel número deobservaciones en cadacategoría mutuamenteexcluyente.

2-2

Elaboración de una distribución de frecuencias

pregunta quese desearesponder

recolecciónde datos

(datos originales)

distribuciónde frecuencias

organizaciónde datos

presentaciónde datos(gráfica)

obtenciónde

conclusiones

2-3

Distribución de frecuencias

Marca de clase (punto medio): punto quedivide a la clase en dos partes iguales. Es elpromedio entre los límites superior einferior de la clase. Intervalo de clase: para una distribución

de frecuencias que tiene clases del mismotamaño, el intervalo de clase se obtienerestando el límite inferior de una clase dellímite inferior de la siguiente.

2-4

EJEMPLO 1 Dr. Acosta es el director de la escuela de

ingeniería y desea determinar cuánto estudian losalumnos en ella. Selecciona una muestra aleatoriade 30 estudiantes y determina el número de horaspor semana que estudia cada uno: 15.0, 23.7, 19.7,15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9,20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7,14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

Organice los datos en una distribución defrecuencias.

2-5

EJEMPLO 1 continuación

Horas de estudio Frecuencia, f 8-12 1 13-17 12 18-22 10 23-27 5 28-32 1 33-37 1

2-6

Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).

Sugerencias para elaborar una distribución de frecuencias

Los intervalos de clase usados enla distribución de frecuenciasdeben ser iguales.Determine un intervalo de clase

sugerido con la fórmula: i = (valormás alto - valor más bajo)/númerode clases.

2-7

Sugerencias para elaboraruna distribución de frecuencias

Use el intervalo de clase calculadosugerido para construir la distribuciónde frecuencias.Nota: este es un intervalo de clasesugerido; si el intervalo de clasecalculado es 97, puede ser mejor usar100. Cuente el número de valores en cada

clase.

2-8

Distribución de frecuencia relativa La frecuencia relativa de una clase se obtiene dividiendo

la frecuencia de clase entre la frecuencia total.

2-9

F r e c u e n c i a ,f

F r e c u e n c i ar e l a t i v a

8 - 1 2 1 1 / 3 0 = . 0 3 3 3

1 3 - 1 7 1 2 1 2 / 3 0 = . 4 0 0

1 8 - 2 2 1 0 1 0 / 3 0 = . 3 3 3

2 3 - 2 7 5 5 / 3 0 = . 1 6 6 7

2 8 - 3 2 1 1 / 3 0 = . 0 3 3 3

3 3 - 3 7 1 1 / 3 0 = . 0 3 3 3

T O T A L 3 0 3 0 / 3 0 = 1

T

Horas

Representaciones de tallo y hoja Representaciones de tallo y hoja:

técnica estadística para representar unconjunto de datos. Cada valor numéricose divide en dos partes: los dígitosprincipales son el tallo y el dígitosiguiente es la hoja. Nota: una ventaja de la representación

de tallo y hoja comparado con ladistribución de frecuencias es que no sepierde la identidad de cada observación.

2-10

EJEMPLO 2 Pedro logró las siguientes calificaciones en el

doceavo examen de contabilidad del semestre: 86,79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construyauna representación de tallo y hoja para los datos.

tallo hoja

6 9

7 8 9

8 2 3 4 5 6 8

9 1 2 6

2-11

Presentación gráfica de una distribución de frecuencias

Las tres formas de gráficas más usadas sonhistogramas, polígonos de frecuencia ydistribuciones de frecuencias acumuladas(ogiva). Histograma: gráfica donde las clases se

marcan en el eje horizontal y las frecuenciasde clase en el eje vertical. Las frecuencias declase se representan por las alturas de lasbarras y éstas se trazan adyacentes entre sí.

2-12

Presentation gráfica de una distribución de frecuencias

Un polígono de frecuencias consiste ensegmentos de línea que conectan lospuntos formados por el punto medio dela clase y la frecuencia de clase. Una distribución de frecuencias

acumulada (ogiva) se usa paradeterminar cuántos o qué proporción delos valores de los datos es menor omayor que cierto valor.

2-13

Histograma para las horas de estudio

02468101214

10 15 20 25 30 35Horas de estudio

Frec

uenc

ia

2-14

Polígono de frecuencias para las horas de estudio

2-15

02

46810

1214

10 15 20 25 30 35Horas de estudio

Frec

uenc

ia

Distribución de frecuencias acumuladas menor que para las

horas de estudio

05

1015

2025

3035

10 15 20 25 30 35Horas de estudio

Frec

uenc

ia

2-16

Gráfica de barrasUna gráfica de barras se puede usar

para describir cualquier nivel demedición (nominal, ordinal, deintervalo o de razón).EJEMPLO 3: construya una gráfica

de barras para el número depersonas desempleadas por cada100.000 habitantes de ciertasciudades en 2005.

2-17

EJEMPLO 3 continuación

Ciudad Número de desempleados por 100 000 habitantes

Quito 7300 Guayaquil 5400

Cuenca 6700 Machala 8900 Tulcán 8200 Ambato 8900

2-18

Gráfica de barras para los datos de desempleados

7300

54006700

89008200

8900

0

2000

4000

6000

8000

10000

1 2 3 4 5 6Ciudades

# de

sem

plea

dos/

100

000

QuitoGuayaquilMachalaMachalaTulcánAmbato

2-19

Gráfica circular Una gráfica circular es en especial útil

para desplegar una distribución defrecuencias relativas. Se divide un círculode manera proporcional a la frecuenciarelativa y las rebanadas representan losdiferentes grupos. EJEMPLO 4: se pidió a una muestra de

200 corredores que indicaran su tipofavorito de zapatos para correr.

2-20

EJEMPLO 4 continuación Dibuje una gráfica circular basada en la siguiente

información.

Tipo de zapato # de corredores

Nike 92

Adidas 49

Reebok 37

Asics 13

Otros 9

2-21

Gráfica cicular para tipos de zapatos

Nike

Adidas

ReebokAsics

OtrosNikeAdidasReebokAsicsOtros

2-22