Estadistica y pronostico para la toma de decisiones ma13202

32
Maestros Online www.maestronline.com Solicita una cotización a través de nuestros correos La Maestros Online Estadística y pronóstico para la toma de decisiones Grupo de problemas Servicio de asesorías y solución de ejercicios Envía tus actividades a [email protected]

Transcript of Estadistica y pronostico para la toma de decisiones ma13202

Maestros Online www.maestronline.com

Solicita una cotización a través de nuestros

correos

La

Maestros Online

Estadística y pronóstico para la

toma de decisiones Grupo de

problemas

Servicio de asesorías y solución de ejercicios

Envía tus actividades a [email protected]

Maestros Online www.maestronline.com

estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en

términos generales, que a mayor estatura de una persona, esta tendrá más peso. Para tener

una idea de cómo es esta relación, realiza lo siguiente:

Parte 1

1. De manera individual, pregunta a 10 personas diferentes la siguiente información:

a. Su género

b. Su estatura en centímetros

c. Su peso en kilogramos

2. Con base en la información recolectada, determina:

a. ¿Quiénes presentan mayor estatura, hombres o mujeres?

b. ¿Quiénes presentan mayor peso, hombres o mujeres?

c. ¿Cuál es la mayor estatura? ¿La menor?

d. ¿Cuál es el promedio de las estaturas? ¿Cuál es el promedio del peso?

Parte 2

En equipo de dos personas:

3. Hagan comentarios en el foro de grupo sobre la forma en que recolectaron los datos, y

cómo los van a organizar.

4. Utilicen Excel para elaborar una base de datos, donde se incluya la información de todos

los miembros del equipo.

5. Con una calculadora de bolsillo, determinen los siguiente:

a. El promedio general tanto de estatura como de peso

b. Para ambas variables determinar la mediana

c. La varianza y la desviación estándar

6. Verifiquen lo anterior, utilizando herramientas de análisis de Excel.

Parte 3

7. Al finalizar, reflexionen sobre las siguientes preguntas, y preparen un documento que

integre las respuestas de todo el equipo a manera de conclusiones:

a. ¿Cuál es el promedio general, tanto para peso como para estatura?

b. ¿Cuál es el promedio por género?

c. ¿Cuál es la desviación estándar para todo el conjunto de datos?

d. ¿Cuál es la desviación estándar por género?

e. ¿Cuál de los dos géneros es el de mayor estatura? ¿Cuál de los dos géneros es el de

mayor peso?

f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)?

g. ¿En qué otras áreas podrían aplicar estos conceptos?

Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y

fundamentada.

Maestros Online www.maestronline.com

1. Escribe con tus propias palabras por qué se les llama medidas de tendencia central o

medidas de dispersión o variabilidad.

2. Lee y resuelve el siguiente ejercicio:

Se registraron las edades de una muestra de 25 empleados.

Los resultados se encuentran enseguida:

3. Determina lo siguiente:

a. Media

b. Mediana

c. Varianza y desviación estándar

4. Construye una tabla de frecuencias y un histograma.

5. Describe brevemente cuál es el papel de la probabilidad en la estadística.

6. Durante una reciente promoción, un banco ofrece hipotecas de 1, 2 y 3 con un interés

reducido. Los clientes también pueden elegir entre las hipotecas abiertas y cerradas.

Supón que 300 solicitudes de hipotecas y que el número de hipotecas de cada tipo

son como se presentan en la siguiente tabla. El gerente selecciona una solicitud de

hipoteca al azar, y los eventos relevantes se definen como sigue.

L: la solicitud es por una hipoteca de 1 año

M: la solicitud es por una hipoteca de 2 años

S: la solicitud es por una hipoteca de 3 años

C: la solicitud es de una hipoteca cerrada

7. Encuentra: P (L), P (M), P(S), P(C) y P ( ).

Maestros Online www.maestronline.com

8. Si se selecciona una hipoteca de 3 años, ¿cuál es la probabilidad de que sea una

solicitud por hipoteca cerrada?

9. Si la solicitud es de una hipoteca cerrada, ¿cuál es la probabilidad de que sea una

hipoteca de 3 años?

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

Parte 1

1. Escribe el proceso de la prueba de hipótesis.

2. Reúnanse en equipos de trabajo, y expongan lo que se pide en el foro de discusión.

3. Comenten sobre el proceso de las pruebas de hipótesis.

4. Busquen información sobre el consumo diario en promedio que tienen los mexicanos de

cigarrillos, y relacionen esta información con los decesos por cáncer de pulmón en México

5. Realicen sus conclusiones de la información analizada

Parte 2

6. Respondan al siguiente ejercicio, a través de foro que se destinó para esta actividad.

Análisis de un problema del contenido de nicotina en cigarrillos

La empresa de cierta marca de cigarrillos asegura que el contenido promedio de nicotina

en su producto es de 0.65 miligramos por cigarrillo. La Procuraduría Federal del

Consumidor asevera que µ ≠ 0.65. Para corroborar esto, toma una muestra de 10

cigarrillos y se registra el contenido de nicotina. Los resultados, en miligramos por

cigarrillo, se presentan enseguida:

Fuente: Miller, W. y Freund, J. E. (1986). Probabilidad y estadística para ingenieros (3ª ed.). Prentice-Hall

Hispanoamericana, S. A.

7. Realicen lo siguiente:

a. La media y desviación estándar

b. En el siguiente inciso se va a utilizar la prueba de t. Respondan: ¿por qué va a

utilizarse esta prueba y no la prueba de z?

c. Prueben la hipótesis de que H0: µ = 0.65 contra Ha: µ ≠ 0.65 contra Utilicen α = 0.05.

d. Concluyan en el contexto del problema, es decir, contesten la pregunta: ¿hay

suficiente evidencia para asegurar que el contenido medio de nicotina es diferente de

0.65 miligramos?

e. Construyan un intervalo de confianza al 95%, para la media de la población .

Parte 3

Maestros Online www.maestronline.com

8. Respondan:

a. ¿Para qué sirven las pruebas de hipótesis?

b. ¿Qué es la estadística de prueba?

c. ¿Qué significa región de rechazo?

d. ¿Cuál es la relación del intervalo de confianza con las pruebas de hipótesis?

e. ¿Cómo podrían relacionar este análisis con la información que analizaron en la

primera parte de esta actividad?

1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no

sea función de probabilidad, explicar por qué no lo es.

a.

b.

c.

d.

2. El gerente de una planta utiliza datos históricos para construir una función de distribución

de probabilidad de X, el número de empleados ausentes en un día dado; los datos se

presentan a continuación:

Determina lo siguiente:

1. P(X=1)

2. P(X>5)

3. P(X≥5)

4. P(X=6)

3. Supón que X representa el número de personas en una vivienda. La distribución de

probabilidad es como sigue:

a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3

personas?

b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5

personas?

Maestros Online www.maestronline.com

c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4

(inclusive) personas? Determínese P(2≤X≤4).

1. Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de

confianza.

2. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos

son los siguientes:

3 6 3 5 6 2 6 5 5 4

3. En parejas, establezcan lo siguiente:

a. Un intervalo de confianza al 90%

b. Un intervalo de confianza al 95%

c. Un intervalo de confianza al 99%

4. En un experimento para determinar los grados centígrados necesarios para llevar al punto

de ebullición un litro de agua, se obtuvieron los siguientes resultados:

100.0 100.2 99.7 99.5 99.5 100.3

99.0 99.4 99.9 100.2 100.1 99.8

5.

a. Prueben la hipótesis de que la media es igual a 100 (H0: µ =100) contra la alternativa

de que la media poblacional es diferente a 100 (Ha: µ ≠ 100). El nivel de significancia

es del 1% (α = 0.01).

Realicen todas las etapas de una prueba de hipótesis.

b. Establezcan interprete el intervalo de confianza al 99% para la media de ebullición, µ.

6. Por un periodo de varios años, un dentífrico ha recibido una puntuación media de 5.9, en

una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto.

Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás

haya cambiado la satisfacción del cliente. Supóngase que las puntuaciones para una

muestra de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87.

¿Indican estos datos que la satisfacción del cliente es diferente de 5.9?

a. Prueben la hipótesis con α = 0.05.

b. Obtengan un intervalo de confianza al 95% para la media µ.

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

1. Describe con tus propias palabras qué significa una serie de tiempo.

2. Enlista y define los componentes de una serie de tiempo.

3. Responde:

Maestros Online www.maestronline.com

a. ¿Cuál de los cuatro componentes de una serie de tiempo se utilizaría para describir el

efecto de las ventas navideñas de una tienda departamental de menudeo?

b. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un

componente estacional que uno que posee un componente cíclico?

4. Los datos que se presentan a continuación corresponden al número de autos de

pasajeros (en miles) en Francia, durante los años 1970 a 2006.

a. Grafica el número de autos contra los años (utilícese Excel o cualquier paquete

estadístico como Minitab).

b. Responde: ¿Qué componentes de la series de tiempo parecen estar presentes en

esta serie?

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

nstrucción para el alumno:

¿Cuánto tiempo dedica una persona en promedio a Internet?

Para tener una idea de esto, realiza lo siguiente:

1. Pregunta, de manera individual, a 10 personas del género masculino y a 10 personas del

género femenino la siguiente información:

a. Su edad

b. Tiempo que dedica diariamente a Internet

2. Con una calculadora de bolsillo y con base en esta información, determina:

a. En promedio, ¿quién dedica más tiempo a Internet: hombres o mujeres?

b. ¿Cuál es el promedio de edad de las mujeres? ¿Cuál es el promedio de edad de los

hombres?

c. Para los géneros por separado, determina la mediana de la edad y del tiempo

dedicado a Internet.

d. Para el total de datos, determina la varianza y la desviación estándar del tiempo que

dedican a Internet y de la edad.

Maestros Online www.maestronline.com

3. Utiliza Excel para elaborar una base de datos, en la que incluyas toda la información. Con

una calculadora de bolsillo contesta lo siguiente:

a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a

Internet como de la edad?

c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo

dedicado a Internet y para la edad?

4. Verifica lo anterior, utilizando herramientas de análisis de Excel.

5. Para finalizar, reflexiona sobre las siguientes preguntas, y prepara un documento con

respuestas a manera de conclusiones:

Para el total del conjunto de datos:

a. ¿Cuál es el promedio general, tanto del el tiempo dedicado a Internet como de la edad?

b. ¿Cuál es la desviación estándar para todo el conjunto de datos?

c. Supón que se tiene información de que el promedio que dedica una persona (sin importar

su género) es de 7 horas diarias. Con los datos anteriores, prueba las siguientes

hipótesis:

H0 : µ = 7 contra la alternativa de que Ha : µ ≠ 7 con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a Internet diferente de 7?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Realiza un resumen de los hallazgos.

Para los datos del género masculino:

a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la desviación estándar para estos datos del género masculino?

c. Supón que se tiene información de que el promedio que dedican los hombres a Internet es

de 5 horas diarias. Con los datos para este género, prueba las siguientes hipótesis:

H0 : µ = 5 contra la alternativa de que Ha : µ ≠ 5 con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a Internet diferente de 5 horas diarias?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Realiza un resumen de los hallazgos.

Para los datos del género femenino:

a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la desviación estándar para estos datos del género femenino?

c. Supón que se tiene información de que el promedio que dedican los mujeres a Internet es

de 8 horas diarias. Con los datos para este género, prueba las siguientes hipótesis:

Maestros Online www.maestronline.com

H0 : µ = 8 contra la alternativa de que Ha : µ ≠8 con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a Internet diferente de 8 horas diarias?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Realiza un resumen de los hallazgos.

f. Reúnanse en grupos de dos personas a través de un chat (MSN, Skype, foro de

equipo, etc.) y definan lo que significa los términos de

a. Serie de tiempo

b. Componentes de una serie de tiempo

c. Correlación

d. Autocorrelación

e. Promedio móvil

f. Suavizamiento exponencial

En equipos lleguen a una definición común e indiquen en qué situaciones de la vida diaria

se pueden aplicar estos conceptos den un ejemplo de cada término

2. Busquen información de 20 casas en venta en donde las variables son: Y (metros de

construcción) y X (metros de terreno); y realicen lo que se indica

a. Realicen y describan el diagrama de dispersión.

b. Calculen e interpreten el coeficiente de correlación muestral r.

c. Respondan a la siguiente cuestión en un terreno urbano ¿a mayor cantidad en metros

de construcción es mayor el precio de la vivienda?

3. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del

Banco de México, consideren las últimas 20 cotizaciones de los CETES y realicen lo que

se indica:

a. Determinen el coeficiente de autocorrelación r1

b. Determinen la prueba de hipótesis de que:

i. Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)

ii. Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero).

iii. Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k.

c. Respondan: ¿Qué significa el término autocorrelación? ¿Existe autocorrelación entre

los rendimientos de los CETES a 28 días?

4. Las llamadas de emergencia a un teléfono durante las últimas 24 semanas son:

Semana Llamadas Semana Llamadas Semana llamadas

1 50 9 35 17 55

2 35 10 20 18 40

3 24 11 15 19 35

4 40 12 40 20 60

5 44 13 55 21 75

Maestros Online www.maestronline.com

6 34 14 35 22 50

7 20 15 25 23 40

8 30 16 55 24 65

a. Realicen y describan un diagrama de dispersión.

b. Determinen un promedio móvil con k=3 periodos y pronostiquen el valor para la

semana 25.

c. Consideren un pronóstico inicial de 50 llamadas durante la primera semana y

utilizando un suavizamiento exponencial con α = 0.10, desarrollen los pronósticos para

el periodo comprendido entre las semanas 1 a 24. ¿Cuál es el pronóstico para la

semana 25?

d. Pronostiquen nuevamente cada periodo utilizando α = 0.6.Obtengan el valor para la

semana 25.

e. Las llamadas reales durante la semana 25 fueron 85. ¿Cuál de los tres métodos

anteriores se acerca más?

5. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una

de las siguientes cuestiones

a. ¿Qué significa el coeficiente de correlación?

b. ¿Cómo se interpreta el coeficiente de correlación?

c. ¿Para qué sirve el coeficiente de autocorrelación?

d. ¿Cuándo utilizarías el método de promedios móviles?

e. ¿Cómo elegirías la constante suavizamiento en el método de suavización

exponencial?

Ejercicio 1

1. Una empresa refresquera está estudiando el efecto de su última campaña publicitaria. Se

eligieron personas al azar y se les llamó para preguntarles cuantas latas de su refresco

habían comprado la semana anterior y cuántos anuncios de su refresco habían leído o

visto durante el periodo. Los datos se presentan a continuación:

X (número de anuncios) 3 7 4 2 0 4 1 2

Y (latas compradas) 11 18 9 4 7 6 3 8

Determina el coeficiente de correlación.

Ejercicio 2

2. Enseguida se presentan los precios diarios al cierre (en dólares por acción).

Periodo

t

Precio

Yt

Maestros Online www.maestronline.com

1 82.87

2 83.00

3 83.61

4 83.15

5 82.84

6 83.99

7 84.55

8 84.36

9 85.53

10 86.54

11 86.89

12 87.77

13 87.29

14 87.99

15 88.80

16 88.80

17 89.11

18 89.10

19 88.90

20 89.21

Prueba si existe autocorrelación en estos datos. Utiliza: α = 0.05

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

esponde la siguiente pregunta:

¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?

Ejercicio 1

1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se

muestran en la siguiente tabla.

Año

t

Demanda de

Fertilizante

(miles de bolsas) Yt

Pronóstico

Ŷt

1 4 -

2 6 -

3 4 -

4 5 4.7

5 10

6 8

7 7

8 9

9 12

10 14

Maestros Online www.maestronline.com

11 15

a. Grafica la serie de tiempo.

b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año,

comenzando por el año 4 por medio de un promedio móvil de k=3 años.

2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un

valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos.

Periodo

t

Yt Ŷt

1 38 38

2 43

3 42

4 45

5 46

6 48

7 50

8 49

9 46

10 45

Ejercicio 2

3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años.

Año Ventas Yt Ŷt

1 400 360

2 455

3 468

4 513

5 534

6

El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer año

serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial conα = 0.40 ,

desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6.

Ejercicio 3

4. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los

años 1986-1989:

Maestros Online www.maestronline.com

Año Trimestre Ventas

(millones)

Yt

Pronóstico

Ŷt

1986 1 18 18

2 33

3 25

4 41

1987 1 22

2 20

3 36

4 33

1988 1 27

2 38

3 44

4 52

1989 1 31

2 26

3 29

4 45

1990 1

Utiliza el suavizamiento exponencial con una constante de suavizamiento de 0.4 y un valor

inicial de 18 para pronosticar las ventas para el primer trimestre de 1990.

1. Reúnanse en grupos de dos personas a través de un chat (MSN, Skype, foro de equipo,

etc.) y definan los términos de:

a. Criterios de estimación de la precisión de un pronóstico (desviación absoluta media,

error cuadrático medio, error porcentual absoluto medio y error porcentual medio).

b. Análisis de la regresión simple.

c. Estimadores de mínimos cuadrados.

d. Intervalo de confianza.

e. Coeficiente de regresión.

f. Coeficiente de correlación.

g. Coeficiente de determinación.

En equipos lleguen a una definición común e indiquen en qué situaciones de la vida diaria se

pueden aplicar estos conceptos den un ejemplo de cada término.

2. Busquen información de 20 casas en venta en donde las variables son: Y (metros de

construcción) y X (metros de terreno); y realicen lo que se indica

a. Realicen el diagrama de dispersión y describe el comportamiento de ambas variables.

¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor cantidad

de metros de construcción es mayor el precio?

b. Calculen la recta de regresión de mínimos cuadrados.

Maestros Online www.maestronline.com

c. ¿Existe evidencia que indique que a mayor cantidad de metros de construcción es

mayor el precio de venta? Prueben la significancia de la recta de regresión con un

nivel de significancia α = 0.01.¿Es significativa esta regresión? Realicen todas las

etapas de una prueba de hipótesis. Concluye en el contexto del problema.

d. Pronostiquen el precio de la vivienda si la cantidad de metros de construcción es de

90, 105 y 120 metros de construcción.

e. Calculen el coeficiente de correlación.

f. Determinen e interpreten el coeficiente de determinación en el contexto del problema.

g. Realicen un breve resumen de los hallazgos.

h. En un terreno urbano ¿a mayor cantidad en metros de construcción es mayor el precio

de la vivienda?

3. Los datos de la siguiente tabla representan los pronósticos Ŷt para las series de tiempo en

los periodos t = 1, 2, 3, 4, y 5 junto con los valores observados Yt.

t Yt Ŷt

1 32.8 33.1

2 35.6 32.4

3 33.6 30.6

4 29.3 29.9

5 31.5 33.7

a. Grafiquen los datos en una misma gráfica.

b. Calculen la DAM, el ECM, el EPAM y el EPM.

4. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de

tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales

observados (Yt).

Valores de pronóstico

Ŷt

Mes Valor observado

Yt

Modelo 1 Modelo 2

1 70 71 69

2 89 85 87

3 94 90 92

4 80 84 98

5 68 70 74

6 72 68 70

7 60 61 59

Maestros Online www.maestronline.com

8 75 71 75

9 86 84 88

10 90 88 88

5. Calculen el ECM y la DAM para cada pronóstico. ¿Parece alguno de los dos métodos

superior? Explíquese.

6. En una compañía fabricante de helados se sospecha que el almacenar el

helado temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de

peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los

siguientes datos:

Pérdida de peso (gr) Y 28 37 36 30 28 36 35

Tiempo (semanas) X 26 32 35 27 25 31 30

a. Ajusten e interprétese un modelo de regresión lineal simple a los datos.

b. Prueben la significancia de la pendiente β1.

c. Calculen e interprétese R2.

d. Elaboren un intervalo de confianza del 90% para β1.

e. Pronostiquen la pérdida cuando el tiempo es de 33 semanas.

b. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada

una de las siguientes cuestiones

a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu

especialidad?

b. ¿Qué relación tiene con la correlación?

c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?

d. ¿Qué es el coeficiente de determinación?

e. ¿Por qué crees que se llama regresión lineal?

f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en

la regresión?

Resuelve los siguientes ejercicios:

1. Para los siguientes valores de Yt y Ŷt de la siguiente tabla calcula la DAM, el ECM, el

EPAM y EPM.

Valor

observado

Yt

Pronóstico

Ŷt

166 173

179 186

Maestros Online www.maestronline.com

195 192

214 211

220 223

2. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de

tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales

observados (Yt).

Valores de pronóstico

Ŷt

Valor observado Yt Modelo 1

Modelo 2

6.0 7.5 6.3

6.6 6.3 6.7

7.3 5.4 7.1

9.4 8.2 7.5

Calcula el DAM y el ECM para determinar cuál es más preciso.

3. Determina DAM y ECM para los siguientes pronósticos.

Valor

observado

Yt

Pronóstico Ŷt

57 63

60 72

70 86

75 71

70 60

4. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo.

Estos valores se dan en la siguiente tabla. Calcula el DAM y el ECM para cada técnica

para determinar cuál es el más preciso.

Valores de pronóstico Ŷt

Valor observado Yt Técnica

1

Técnica 2 Técnica 3

19 21 22 17

24 27 24 20

28 29 26 25

32 31 28 31

38 35 30 39

Maestros Online www.maestronline.com

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

1. Realizar un resumen del método de mínimos cuadrados.

2. Resuelve el siguiente ejercicio:

Una empresa de bienes raíces ha recopilado datos para ayudar a determinar cómo el

número de ventas de viviendas en la región está relacionado con los niveles de tasas de

interés de la hipoteca. El número de viviendas vendidas en la región y tasas de interés de

la hipoteca para 12 meses seleccionados al azar se muestran en la siguiente tabla.

Interés

(%)

Número de

viviendas vendidas

Interés

(%)

Número de

viviendas vendidas

8.0 188 10.5 140

9.5 145 7.0 203

7.5 181 7.5 188

11.0 137 11.0 144

8.5 157 9.0 150

10.0 148 8.0 166

a. Realiza un diagrama de dispersión para estos datos con el número de casas vendidas

en el eje vertical.

b. Describe la relación entre el interés de la hipoteca y el número de viviendas vendidas.

c. Determina la recta de regresión que describa como las tasas de interés (X) afectan el

número de viviendas vendidas (Y). ¿Qué indica el coeficiente de regresión acerca de

esta relación?

d. Pronostica el número de viviendas vendidas si la tasa de interés es del 10%.

e. Determina el coeficiente de correlación.

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

Ejercicio 1

1. Las ventas de línea blanca varían según el estado del mercado de casas nuevas: cuando

las ventas de casas nuevas son buenas, también se reflejan éstas en las cifras de

lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociación de comercio

compiló los siguientes datos históricos (en miles de unidades) de las ventas de línea

blanca y construcción de casas.

Construcción de

casas (miles)

Ventas de

línea blanca (miles)

Maestros Online www.maestronline.com

X Y

2.0 5.0

2.5 5.5

3.2 6.0

3.6 7.0

3.3 7.2

4.0 7.7

4.2 8.4

4.6 9.0

4.8 9.7

5.0 10.0

a. Realiza un diagrama de dispersión para estos datos.

b. Desarrolla una ecuación para la relación entre las ventas de línea blanca (en miles) y

la construcción de casas (miles).

c. Interpreta la pendiente de la recta de regresión.

d. Calcula e interpreta el coeficiente de determinación de la muestra, r2 , para estos

datos.

e. Determina e interpreta el error estándar de estimación.

f. La construcción de casas durante el año próximo puede ser mayor que el intervalo

registrado; se han pronosticado estimaciones hasta de 8000 (en miles) unidades.

Calcula un intervalo de predicción de 90% de confianza para las ventas de línea

blanca, con base en los datos anteriores y el nuevo pronóstico de construcción de

casas.

Ejercicio 2

2. En un problema de regresión con tamaño de muestra 17, se encontró que la pendiente era

de 3.73 y el error estándar de 28.654. La cantidad:

a. Encuentra el error estándar del coeficiente de la pendiente de regresión.

b. Construye un intervalo de confianza del 95% para la pendiente de la población.

c. Interpreta el intervalo de confianza de la parte b).

Ejercicio 3

1. Una compañía de productos químicos desea estudiar los efectos que el tiempo de

extracción tiene en la eficiencia de una operación de extracción, obteniéndose los datos

que aparecen en la siguiente tabla:

Eficiencia de extracción Tiempo de extracción

Maestros Online www.maestronline.com

(minutos)

X

(%)

Y

27 57

45 64

41 80

19 46

35 62

39 72

19 52

49 77

15 57

31 68

1. Realiza un diagrama de dispersión para verificar que una línea recta se ajustará bien a los

datos.

2. Obtén una línea de regresión estimada.

3. Utiliza la ecuación estimada de regresión para predecir la eficiencia de extracción cuando

el tiempo de extracción es de 35 minutos.

4. Prueba la hipótesis de que:

H0 : β1 = 0 en oposición a Ha: β1 ≠ 0. Utiliza α = 0.01.

5. Obten un intervalo de confianza al 99% para β1.

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

Analiza y resuelve los siguientes ejercicios sin olvidar incluir los procedimientos utilizados que

te llevaron a la respuesta.

Concluye con una reflexión sobre la utilización de la regresión, correlación y autocorrelación

en la vida cotidiana ¿Qué tipo de problemas pudieras resolver con los conocimientos

adquiridos en este módulo?

1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar al campus

y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros de tu

Campus y pregúntales el tiempo que tardan en llegar al Campus y la distancia a su casa.

Después denomina a la variable tiempo en minutos como (Y) y a la distancia en km como

(X).

Contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.

¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor

distancia es mayor el tiempo?

Maestros Online www.maestronline.com

b. Calcula la recta de regresión de mínimos cuadrados.

c. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en llegar?

Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.

¿Es significativa esta regresión? Realiza todas las etapas de una prueba de

hipótesis. Concluye en el contexto del problema.

d. Pronostica el tiempo en llegar al campus si la distancia es de 3, 4 y 6 kilómetros de

distancia.

e. Calcula el coeficiente de correlación.

f. Determina e interpreta el coeficiente de determinación en el contexto del problema.

g. Realiza un breve resumen de los hallazgos.

2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros?

Selecciona 10 personas del género masculino y 10 personas del género femenino y

pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros.

Posteriormente denomina a la variable peso como (Y) y a la medida de la cintura como (X)

y contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.

¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor medida

de la cintura es mayor el peso?

b. Calcula la recta de regresión de mínimos cuadrados.

c. ¿Existe evidencia que indique que a mayor medida de la cintura es mayor el peso?

Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.

¿Es significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.

Concluye en el contexto del problema.

d. Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros.

e. Calcula el coeficiente de correlación.

f. Determina e interpreta el coeficiente de determinación en el contexto del problema.

g. Realiza un breve resumen de los hallazgos.

3. Busca información de 20 casas en venta en donde las variables son: Y (metros de

construcción) y X (metros de terreno); y realiza lo que se te indica.

Contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.

b. ¿Qué clase de relación crees que existe entre estas dos variables?

c. Calcula la recta de regresión de mínimos cuadrados.

d. Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.

e. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.

Realiza todas las etapas de una prueba de hipótesis.

f. Pronostica los metros de construcción cuando los metros de terreno son de 90, 100 y

150 metros.

g. Calcula el coeficiente de correlación.

Maestros Online www.maestronline.com

h. Determina e interpreta el coeficiente de determinación en el contexto del problema.

i. Realiza un breve resumen de los hallazgos.

4. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco

de México y realiza lo que se indica,

a. Considera las últimas 12 cotizaciones de la TIIE

b. Determina el coeficiente de autocorrelación

c. Determina la prueba la hipótesis de que:

Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)

Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero).

Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k.

5. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco

de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica,

a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to

periodo, por medio de un promedio móvil de k= 3 meses.

b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,

comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.

c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un

valor inicial igual a la primera lectura del TIIE 28 DÍAS.

d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM),

Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error

Porcentual Medio (EPM).

e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.

Parte 1

1. Entrevista a 25 personas y obtén los siguientes datos:

1. Y: Peso en kg

2. X1: Estatura en cm

3. X2: Cintura en cm

4. X3: Medida de los bíceps en cm

2. Utiliza Excel o cualquier otro paquete estadístico como Minitab y establece la ecuación de

regresión múltiple ajustada.

Parte 2a

3. Reúnanse en equipos (Skype, Google Docs, chat, foto, etc.).

4. Interpreten los coeficientes de la ecuación de regresión lineal múltiple.

5. Calculen el error estándar de estimación.

6. Establezcan los intervalos de confianza para los parámetros poblacionales β1, β2 y β3.

Utilicen α = 0.05.

Maestros Online www.maestronline.com

Parte 2b

Cantidad de

alimento, g

X

Colesterol,

mg

Y

Cantidad de

alimento, g

X

Colesterol,

mg

Y

10 313 33 677

15 370 35 151

18 424 36 280

19 356 37 245

20 310 39 396

21 349 42 278

21 365 45 297

24 245 54 224

25 373 56 346

27 395 56 141

28 156 59 139

30 243 59 424

30 150 60 316

31 463 64 379

a. Estimen la ecuación de regresión.

b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30,

35.5, 39, 45, 60, 70, 80, 90.

c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los

diferentes valores de X0.

d. Compartan sus resultados en el foro.

Parte 3

7. Para la ecuación de regresión múltiple (de la parte 2a) pronostiquen el peso con los

siguientes datos:

Estatura, cm Cintura, cm Bíceps, cm

165 79 17

160 80 19

180 75 18

175 85 21

159 90 22

8. Calculen e interpreten R2 en el contexto del problema.

9. Calculen R2ajustada.

Maestros Online www.maestronline.com

10. Manifiesten, a través del foro, sus conclusiones para este análisis sobre el ajuste de la

ecuación y también sobre las contribuciones de las variables independientes.

Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y

fundamentada.

Entregable(s): Resultado de ejercicio y problema.

1. En un experimento con conejos se tomaron en cuenta las siguientes variables:

Y: Proporción del peso final al peso inicial.

X: Gramos diarios de alimento por kg de peso inicial.

Proporción de Peso

final al

peso inicial

Y

Gramos diarios

de alimento por kg de

peso inicial

X

Proporción de peso

final al

peso inicial

Y

Gramos diarios de alimento

por kg de peso

inicial

X

0.91 10 1.16 33

0.88 15 0.96 35

0.90 18 1.08 36

0.79 19 1.13 37

0.94 20 1.00 39

0.88 21 1.10 42

0.95 21 1.11 45

0.97 24 1.18 54

0.88 25 1.26 56

1.01 27 1.29 56

0.95 28 1.36 59

0.95 30 1.40 59

1.05 30 1.32 60

1.05 31 1.47 64

a. Realiza un diagrama de dispersión de los datos para Y contra X.

b. Calcula las rectas de mínimos cuadrados para Y contra X.

c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la prueba

de hipótesis (α = 0.01).

d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25, 30, 35.5, 39,

45, 60, 70, 80, 90.

e. Calcula el intervalo de confianza de los valores particulares de Y para los valores

dados de X0 del inciso anterior.

Ejercicio 1

Maestros Online www.maestronline.com

1. Una empresa ha estado buscando los factores que influyen en la cantidad de acero (en

millones de toneladas) que puede vender cada año. La administración sospecha que los

siguientes son los factores principales: la tasa anual de inflación del país, el precio

promedio por tonelada de acero importado que acota los precios (en dólares) y el número

de automóviles (en millones) que los fabricantes de autos planean producir ese año. Se

recolectaron los datos de los últimos siete años:

Millones

de tons.

vendidas

Y

Tasa de inflación

X1

Cota de

importaciones

X2

Número de

automóviles

(millones)

X3

4.2 3.1 3.10 6.2

3.1 3.9 5.00 5.1

4.0 7.5 2.20 5.7

4.7 10.7 4.50 7.1

4.3 15.5 4.35 6.5

3.7 13.0 2.60 6.1

3.5 11.0 3.05 5.9

a. Estima la ecuación de regresión múltiple.

b. Interpreta los coeficientes de regresión estimados.

Ejercicio 2

2. Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de

predecir el tiempo de cocimiento en minutos (Y) a varios niveles de amplitud del horno,

pies (X1) y temperatura de cocción, grados Celsius (X2). Los datos obtenidos fueron

registrados como se muestra a continuación:

Tiempo de

Cocimiento

Y

Niveles de amplitud

del horno, pies

X1

Temperatura

en grados C

X2

6.40 1.32 1.15

15.05 2.69 3.40

18.75 3.56 4.10

30.25 4.41 8.75

44.85 5.35 14.82

48.94 6.20 15.15

51.55 7.12 15.32

61.50 8.87 18.18

100.44 9.80 35.19

111.42 10.65 40.40

Maestros Online www.maestronline.com

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5 pies

y la temperatura de cocción es de 20 grados Celsius.

Ejercicio 3

3. El supervisor de una empresa está examinando la relación existente entre la calificación

que obtiene un empleado en una prueba de aptitud, su experiencia previa y el éxito en el

trabajo. Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y

se obtiene una calificación entre 2 y 12. La medida del éxito en el empleo se basa en un

sistema de puntuación que incluye producción total y eficiencia, con valor máximo posible

de 50. El supervisor tomó una muestra de seis empleados con menos de un año de

antigüedad y obtuvo lo siguiente:

Y

Evaluación del

desempeño

X1

Resultado de la

prueba de aptitud

X2

Experiencia en

trabajos anteriores

(años)

28 74 5

33 87 11

21 69 4

40 93 9

38 71 7

46 97 10

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia en

trabajos anteriores de 7 años ¿qué evaluación de desempeño puede esperar?

Ejercicio 4

4. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y),

caballos de fuerza X1 y peso total en kg X2.

Kilómetros por litro,

Y

Caballos de

fuerza, X1 Peso en kg X2

19 67 1844

19 50 1998

17 62 1752

16 69 1980

16 66 1797

15 63 2199

15 90 2404

Maestros Online www.maestronline.com

14 99 2611

13 63 3236

12 91 2606

11 94 2580

11 88 2507

11 124 2922

10 97 2434

9 114 3248

9 102 2812

8 114 3382

8 142 3197

7 153 4380

7 139 4036

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Si un vehículo tiene 92 caballos de fuerza y un peso de 1750 kg ¿cuál será el número

de kilómetros por litro que se esperaría?

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

Parte 1

1. Reúnanse en equipos (usen Skype, Google Docs, chats, foro, etc.) y revisen la siguiente

información nutricional, de las ensaladas.Enseguida se presentan las siguientes variables

que se registraron en diferentes tipos de ensaladas. Las variables son

a. Y: Calorías

b. X1: Grasa (g)

c. X2:Carbohidratos (g)

d. X3: Proteínas (g)

Ensalada

(porciones

de 100 g)

Grasa (g) Carbohidratos (g) Proteínas (g) Calorías

Y

César 14.7 6.52 5.03 170

Atún 11.02 6.96 14.27 184

Atún con Queso 14.72 6.87 14.44 217

Atún con huevo 12.93 6.96 13.71 196

Macarrones o pasta 10.63 22.98 3.76 202

Macarrones u otra pasta con pollo 13.34 15.00 10.11 221

Macarrones u otra pasta con atún 9.14 19.49 7.07 18.9

Ensalada de huevo 30.26 1.93 9.20 318

Ensalada de papas 8.20 11.17 2.68 143

Ensalada de papas con huevo 7.05 15.96 2.77 136

Maestros Online www.maestronline.com

Ensalada de papas estilo alemán 1.24 16.66 2.52 88

Información obtenida de:

http://www.fatsecret.cl Solo para fines educativos

2. Estos datos se deben ingresar a Excel o Minitab.

3. Estimen e interpreten en el contexto del problema los coeficientes de la ecuación de

regresión múltiple.

4. Prueben la significancia del modelo de regresión múltiple; realicen todas las etapas de una

prueba de hipótesis.

Parte 2

5. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

6. Calculen e interpreten R2 en el contexto del problema.

7. Calculen el error estándar de estimación.

Parte 3

8. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la

cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g.

9. Calculen R2ajustada.

10. Construyan un intervalo de confianza para las pendientes de la población (β1, β2 y β3).

11. Compartan sus resultados en el foro.

Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y

fundamentada.

Ejercicio 1

1. La energía eléctrica consumida (Y) cada mes por una planta química se considera

relacionada con la temperatura ambiente promedio, grados Fahrenheit (X1), número de

días al mes (X2), la pureza promedio del producto, en porciento (X3) y las toneladas

obtenidas del producto (X4). Haz clic aquí para revisarlos.

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

Maestros Online www.maestronline.com

g. Pronostica la energía eléctrica consumida (Y) cuando la temperatura ambiente

promedio (X1) es de 30, el número de días al mes (X2) es de 25 grados Fahrenheit, la

pureza promedio del producto, en porciento (X3), es de 92 y las toneladas obtenidas

del producto (X4) es de 95.

h. Calcula R2ajustada.

i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β3 y β4.

Ejercicio 2

1. Un negocio de ventas por catálogo de computadoras

personales, software y hardware mantiene un almacén centralizado para la distribución de

los productos ordenados. La administración examina el proceso de distribución y está

interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una

pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos

de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y el

número de órdenes recibidas (X2). Haz clic aquí para ver los resultados.

Con base en los resultados obtenidos:

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las

ventas son de 400,000 dólares y el número de órdenes es de 4500.

h. Calcula R2ajustada.

i. Construye un intervalo de confianza para las pendientes de la población ( β1 y β2).

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

En equipos de dos, realicen los siguientes ejercicios:

Ejercicio 1

1. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas

como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia

ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se

recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.

Tiempo Ventas

Maestros Online www.maestronline.com

Semanas

(X)

(miles de dólares)

(Y)

1 4618

2 3741

3 5836

4 4367

5 5118

6 8887

7 19746

8 34215

9 50306

10 65717

11 86434

12 105464

a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.

b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.

c. ¿Estás satisfecho con el modelo como pronosticador de ventas (Y)? Explica. Realiza

todas las etapas de una prueba de hipótesis con α = 0.05.

d. Transforma la variable independiente (X2) y ahora corre de nuevo el modelo con X y

X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los

datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.

e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.

Compáralo con el obtenido en el inciso b ¿Cuál modelo prefieres? ¿Por qué?

Ejercicio 2

2. Un editor de libros de texto universitarios realizó un estudio para relacionar la ganancia

por libro (Y) con el costo de venta (X) para un periodo de seis años. Se obtuvieron los

siguientes datos (en miles de dólares, ajustados por la inflación):

Utilidad por libro dólares,

(Y)

16.5 22.4 24.9 28.8 31.5 35.8

Costo de venta por libro en dólares, (X) 5.0 5.6 6.1 6.8 7.4 8.6

a. Ajusta un modelo cuadrático.

b. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre (Y) y

(X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.

c. Encuentra el coeficiente de determinación en la salida de Excel e interpreta su valor

en el contexto del problema.

d. Utiliza la ecuación de predicción para estimar la utilidad media del libro cuando el

costo de venta por libro es de 6500 (expresa dicho costo en miles de dólares antes de

sustituirlo en la ecuación).

Maestros Online www.maestronline.com

Ejercicio 3

3. Un agrónomo está interesado en la producción de algodón recopilada en los siguientes

datos referentes al número de bellotas por planta durante la estación de crecimiento. Aquí

Y es la media del número de bellotas por planta y X es el tiempo medido en semanas.

Y, bellotas 110 470 1040 1100 1000 820

X, semanas 1 4 7 9 12 15

a. Utiliza Excel o cualquier otro paquete estadístico como Minitab para obtener un

diagrama de dispersión.

b. Ajusta un modelo cuadrático, es decir X y X2. ¿Proporcionan los datos suficiente

evidencia para indicar una curvatura entre el número de bellotas (Y) y el tiempo en

semanas (X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.

c. Encuentra el coeficiente de determinación en la salida del software que elegiste e

interpreta su valor en el contexto del problema.

d. Utiliza la ecuación de predicción para estimar el número de bellotas cuando el número

de semanas es de 8, 10 y 14.

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

Ejercicio 1

1. Si el coeficiente de determinación entre dos variables independientes es 0.20, ¿cuál es el

valor del Factor de Inflación de Varianza VIF?

2. Si el coeficiente de determinación entre dos variables independientes es 0.50, ¿cuál es el

valor del Factor de Inflación de Varianza VIF?

3. Un negocio de ventas por catálogo de computadoras

personales, software y hardware mantiene un almacén centralizado para la distribución de

los productos ordenados. La administración examina el proceso de distribución y está

interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una

pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos

de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y el

número de órdenes recibidas (X2). Haz clic aquí para ver los resultados.

a. Realiza una regresión múltiple y determina el VIF para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Ejercicio 2

Maestros Online www.maestronline.com

4. Una organización de consumidores desea desarrollar un modelo para predecir el

rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por

galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto Kg. Se

seleccionó una muestra de 50 modelos. Haz clic aquí para ver los resultados.

a. Realiza un modelo de regresión lineal múltiple.

b. Determina el Factor de Inflación de Varianza VIF para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Ejercicio 3

5. El director de operaciones de transmisión de una estación de televisión desea estudiar el

aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga

por no realizar actividades. Las variables a considerar son:

a. Horas de espera (Y): número total de horas por semana.

b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana.

c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la

planta central.

d. Haz clic aquí para ver los resultados de un periodo de 26 semanas.

e. Ajusta un modelo de regresión lineal múltiple.

f. Determina el Factor de Inflación de Varianza VIF para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y

fundamentado.

1. Revisa la siguiente información tomada de la sección de avisos de ocasión.

2. Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:

a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de

regresión lineal múltiple.

b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

c. Pronostica el precio para los siguientes datos.

Metros de

terreno

(X1)

Metros de

construcción

(X2)

Número de

recámaras

(X3)

180 390 4

200 250 3

230 200 4

250 180 2

100 120 3

Maestros Online www.maestronline.com

3. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

4. Calcula el error estándar de estimación.

5. Construye un intervalo de confianza para las pendientes de la población ( β1, β2 y β3).

6. Calcula e interpreta R2 en el contexto del problema.

7. Calcula R2ajustada.

8. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

9. Finalmente prepara un documento presentando un resumen de tus hallazgos.