Antologia

117
FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II UNIVERSIDAD DE SOTAVENTO, A.C INTRODUCCIÓN n esta Antología se presenta la parte de las reglas para inferir ciertas características de una población a partir de muestras extraídas de ella, junto con indicaciones probabilísticas de la veracidad de tales inferencias. E En la inferencia estadística se estudian las relaciones existentes entre una población, las muestras obtenidas de ella, y las técnicas para estimar parámetros, tales como la media y la varianza, o bien para determinar si las diferencias entre dos muestras son debidas al azar, etc. 1

Transcript of Antologia

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

INTRODUCCIÓN

n esta Antología se presenta la parte de las

reglas para inferir ciertas características

de una población a partir de muestras

extraídas de ella, junto con indicaciones

probabilísticas de la veracidad de tales

inferencias.

EEn la inferencia estadística se estudian las

relaciones existentes entre una población, las

muestras obtenidas de ella, y las técnicas para

estimar parámetros, tales como la media y la

varianza, o bien para determinar si las diferencias

entre dos muestras son debidas al azar, etc.

1

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

INDICE

UNIDAD I. PRINCIPIOS DE LAS TÉCNICAS DEL MUESTREO

1.1 Muestreo Aleatorio1.2 Muestreo Aleatorio con reposición.1.3 Muestreo aleatorio sin reposición1.4 Muestreo aleatorio estratificado 1.4.1 Ejemplo1.4.2 Asignación proporcional1.4.3 Asignación óptima 1.5 Muestreo Sistemático1.5.1 Ejemplo1.6 Muestreo por conglomerados1.7 Ejercicios

UNIDAD II. TEORÍA DE LA ESTIMACION

2.1. Estimación y propiedades de los estimadores2.2. Estimación puntual. Propiedades 2.2.1 Ejemplo 2.3 Estimación por intervalos y propiedades2.4 Intervalos de confianza para .2.4.1 Intervalo de confianza para con varianza conocida (2.4.1.1 Ejercicios 2.4.2 Intervalos de confianza para con varianza desconocida (2) 2.4.2.1 Ejercicios

2

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.4.3 Intervalo de confianza para el parámetro deproporción p cuando se muestrea una distribuciónbinomial. 2.4.3.1.1 Ejercicios2.4.4. intervalos de confianza para la diferencia demedias cuando se muestrean dos distribucionesnormales e independientes. 2.4.4.1 Ejercicios 2.5 Intervalo de confianza para 2

3

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.5.1 Ejercicios

III. PRUEBAS DE HIPOTESIS

3.1 Conceptos de la teoría de hipótesis. 3.2 Errores tipo I y tipo II3.2.1 Ejercicios3.3 Pruebas de hipótesis para una media 3.3.1 Prueba de hipótesis para una media convarianza conocida(2) 3.3.2. Prueba de hipótesis para la media convarianza desconocida 3.3.2.1 Ejercicios3.4 Pruebas de hipótesis de proporciones 3.4.1 Una proporción3.4.2. Diferencia de proporciones. 3.4.2.1 Ejercicios3.5 Pruebas de hipótesis para diferencia de dosmedias 3.5.1. Prueba de hipótesis para la diferencia demedias con varianzas conocidas 3.5.2. Prueba de hipótesis para la diferencia demedias con varianzas desconocidas3.5.2.1 Ejercicios 3.6 Pruebas de hipótesis sobre la varianza de unadistribución normal3.6.1 Ejercicios 3.7 Pruebas de hipótesis para una razón de varianzas3.7.1 Ejercicios

4

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

BIBLIOGRAFIA

5

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

I. PRINCIPIOS DE LAS TECNICAS DEL MUESTREO

Muestra es la parte del grupo de elementos que seexamina y población es el grupo total a partir delcual se selecciona la muestra, conocida también comouniverso..

Un censo comprende el examen de todos los elementosde un determinado grupo, mientras que el muestreocomprende el análisis de una pequeña parte de ellos.El objetivo del muestreo es establecergeneralizaciones con respecto a un grupo total deelementos sin tener que examinarlos uno por uno.Esto hace necesario que la población objetivo seaestablecida de manera que se puedan hacergeneralizaciones significativas.

Las poblaciones de tamaño limitado se conocen comopoblaciones finitas, en tanto que las que tienentamaño ilimitado se conocen como poblacionesinfinitas. Ejemplo de poblaciones finitas: losalumnos de una clase determinada, los productos deun supermercado, los libros de una biblioteca y losautomóviles del estado de Veracruz. Por otra parte,las poblaciones infinitas generalmente son losresultados o elementos de cierto tipo de proceso,como la tirada de monedas, en la cual el número decaras que se puede producir es ilimitado. Otrosejemplos de esta población son la producción futurade una máquina, la extracción de canicas de una urnaregresando cada canica a su lugar antes de sacar

6

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

otra, y el nacimiento de insectos. La consideraciónimportante es si separar uno o un pequeño número deelementos de la población, influirá de maneraconsiderable en las probabilidades relativas. Elproblema de regresar o no un elemento muestreado auna población antes de sacar otro de ésta, surgecuando se muestrea a una población finita, ya que laprobabilidad de incluir los elementos de unapoblación en una muestra dependerá de sí estamosmuestreando con reposición o sin reposición.

El propósito de un estudio estadístico suele ser,extraer conclusiones acerca de la naturaleza de unapoblación. Al ser la población grande y no poder serestudiada en su integridad en la mayoría de loscasos, las conclusiones obtenidas deben basarse enel examen de solamente una parte de ésta, lo que noslleva, en primer lugar a la justificación,necesidad y definición de las diferentes técnicas demuestreo.

La teoría del muestreo tiene por objetivo, elestudio de las relaciones existentes entre ladistribución de un carácter en dicha población y lasdistribuciones de dicho carácter en todas susmuestras.

Las ventajas de estudiar a una población a partir desus muestras son principalmente:

Coste reducido: Si los datos que buscamos lospodemos obtener a partir de una pequeña parte del

7

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

total de la población, los gatos de recogida ytratamiento de los datos serán menores.

Mayor rapidez: Estamos acostumbrados a ver comolos resultados de escrutinio de las primeras mesaselectorales, se obtiene una aproximación bastantebuena del resultado final de unas elecciones, muchashoras antes de que el recuento final de votos hayafinalizado;

Más posibilidades: Para hacer cierto tipo deestudios, por ejemplo el de duración de cierto tipode bombillas, no es posible en la prácticadestruirlas todas para conocer su vida media, ya queno quedaría nada que vender. Es mejor destruir sólouna parte de ella y sacar conclusiones sobre lasdemás.

De este modo se ve que al hacer estadísticainferencial debemos enfrentarnos con dos problemas:

Elección de la muestra (muestreo), que es a lo quenos dedicaremos en este capítulo. Extrapolación de las conclusiones obtenidassobre la muestra, al resto de la población (inferencia).

El tipo de muestreo más importante es el muestreoaleatorio, en el que todos los elementos de lapoblación tienen la misma probabilidad de serextraídos; Aunque dependiendo del problema y con elobjetivo de reducir los costes o aumentar la

8

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

precisión, otros tipos de muestreo pueden serconsiderados como veremos más adelante: muestreosistemático, estratificado y por conglomerados.

1.1 Muestreo aleatorio

Consideremos una población finita, de la quedeseamos extraer una muestra. Cuando el proceso deextracción es tal que garantiza a cada uno de loselementos de la población la misma oportunidad deser incluidos en dicha muestra, denominamos alproceso de selección muestreo aleatorio.

El muestreo aleatorio se puede plantear bajo dospuntos de vista:

Con reposición . Sin reposición de los elementos;

Si el tamaño de una muestra es pequeño en relacióncon el de la población, el no regresar los objetosmuestreados a la población tendrá un efectoinsignificante sobre las probabilidades de loselementos restantes, y muestrear sin reposición nocausará serias dificultades. Por otra parte, lasmuestras relativamente grandes tienden adistorsionar las probabilidades de los elementosrestantes cuando se muestrea sin reposición. Unaregla generalmente aceptada es sustituir unidades siel tamaño de la muestra excede del 5% del tamaño de

9

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

la población. Por lo que el seleccionar una muestracompleta de inmediato equivale a muestrear sinreposición. Cuando se muestrea con reposición esposible obtener el mismo resultado mas de una vez,en tanto que tomando la muestra total de una vez,seria imposible que eso sucediera.

  

10

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1.2 Muestreo aleatorio con reposición

Sobre una población E de tamaño N podemos realizarextracciones de n elementos, pero de modo que cadavez el elemento extraído es repuesto al total de lapoblación. De esta forma un elemento puede serextraído varias veces. Si el orden en la extracciónde la muestra interviene, la probabilidad de unacualquiera de ellas, formada por n elementos es:

Si el orden no interviene, la probabilidad de unamuestra cualquiera, será la suma de la anterior,repitiéndola tantas veces como manera de combinarsus elementos sea posible. Es decir,

Sea n1 el número de veces que se repitecierto elemento e1 en la muestra;

Sea n2 el número de veces que se repitecierto elemento e2;

Sea nk el número de veces que se repitecierto elemento ek, de modo que .Entonces la probabilidad de obtener la muestra

11

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

es

es decir,

El muestreo aleatorio con reposición es tambiéndenominado muestreo aleatorio simple, que secaracteriza por que cada elemento de la poblacióntiene la misma probabilidad de ser elegido, y lasobservaciones se realizan con reemplazamiento. Deeste modo, cada observación es realizada sobre lamisma población (no disminuye con las extraccionessucesivas). Sea X una variable aleatoria definida sobre lapoblación E, y f(x) su ley de probabilidad.

En una muestra aleatoria simple, cada observacióntiene la distribución de probabilidad de lapoblación:

12

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Además todos las observaciones de la variablealeatoria son independientes, es decir

1.3 Muestreo aleatorio sin reposición

Consideremos una población E formada por Nelementos. Si observamos un elemento particular,

, en un muestreo aleatorio sin reposición se dala siguiente circunstancia:

La probabilidad de que e sea elegido en primer

lugar es ;

Si no ha sido elegido en primer lugar (lo que

ocurre con una probabilidad de ), la probabilidad

de que sea elegido en el segundo intento es de . en el (i+1)-ésimo intento, la población constade N-i elementos, con lo cual si e no ha sidoseleccionado previamente, la probabilidad de que lo

sea en este momento es de .

Si consideramos una muestra de elementos, dondeel orden en la elección de los mismos tieneimportancia, la probabilidad de elección de unamuestra cualquiera es

13

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Lo que corresponde en el sentido de la definición deprobabilidad de Laplace a un caso posible entre lasn posibles n-uplas de N elementos de la población.

Si el orden no interviene, la probabilidad de queuna muestra

sea elegida es la suma de las probabilidades deelegir una cualquiera de sus n-uplas, tantas vecescomo permutaciones en el orden de sus elementos seanposibles, es decir

  

14

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Existen varias razones por las que el muestreo sinreposición se lleva a cabo en la práctica real:

Los efectos pueden ser insignificantes y puedeser más conveniente hacerlo así.

Si se realizan ensayos destructivos.

En el muestreo industrial será difícilpersuadir a los inspectores carentes deadiestramiento en estadística de que regresen loselementos muestreados a la población,particularmente si éstos están defectuosos.

Cuando se regresa un objeto muestreado a lapoblación, existe una posibilidad de que seaincluido en un ensayo subsiguiente.

1.4 Muestreo aleatorio estratificado

Un muestreo aleatorio estratificado es aquel en elque se divide la población de N individuos, en ksubpoblaciones o estratos, atendiendo a criteriosque puedan ser importantes en el estudio, de tamañosrespectivos N1, ..., Nk,

15

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Y realizando en cada una de estas subpoblacionesmuestreos aleatorios simples de tamaño ni. .

A continuación nos planteamos el problema de cuantoselementos de muestra se han de elegir de cada uno delos estratos. Para ello tenemos fundamentalmente dostécnicas: la asignación proporcional y la asignaciónoptima.

1.4.1 Ejemplo

Supongamos que realizamos un estudio sobre lapoblación de estudiantes de una Universidad, en elque a través de una muestra de 10 de ellos queremosobtener información sobre el uso de barras delabios. En primera aproximación lo que procede es hacer unmuestreo aleatorio simple, pero en su lugar podemosreflexionar sobre el hecho de que el comportamientode la población con respecto a este carácter no eshomogéneo, y atendiendo a él, podemos dividir a lapoblación en dos estratos: Estudiantes masculinos (60% del total); Estudiantes femeninos (40% restante). De modo que se repartan proporcionalmente ambosgrupos el número total de muestras, en función desus respectivos tamaños (6 varones y 4 mujeres).Esto es lo que se denomina asignación proporcional.

16

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Si observamos con más atención, nos encontramos(salvo sorpresas de probabilidad reducida) que elcomportamiento de los varones con respecto alcarácter que se estudia es muy homogéneo ydiferenciado del grupo de las mujeres.

Por otra parte, con toda seguridad la precisiónsobre el carácter que estudiamos, será muy alta enel grupo de los varones aunque en la muestra hayamuy pocos (pequeña varianza), mientras que en elgrupo de las mujeres habrá mayor dispersión. Cuandolas varianzas poblacionales son pequeñas, con pocoselementos de una muestra se obtiene una informaciónmás precisa del total de la población que cuando lavarianza es grande. Por tanto, si nuestros mediossólo nos permiten tomar una muestra de 10 alumnos,será más conveniente dividir la muestra en dosestratos, y tomar mediante muestreo aleatorio simplecierto número de individuos de cada estrato, de modoque se elegirán más individuos en los grupos demayor variabilidad. Así probablemente obtendríamosmejores resultados estudiando una muestra de 1 varón. 9 hembras. Esto es lo que se denomina asignación óptima.   

1.4.2 Asignación proporcional

Sea n el número de individuos de la población totalque forman parte de alguna muestra:

17

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Cuando la asignación es proporcional el tamaño de lamuestra de cada estrato es proporcional al tamañodel estrato correspondiente con respecto a lapoblación total:

18

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1.4.3 Asignación óptima

Cuando se realiza un muestreo estratificado, lostamaños muestrales en cada uno de los estratos, ni,los elige quienes hace el muestreo, y para ellopuede basarse en alguno de los siguientes criterios:

Elegir los ni de tal modo que se minimice lavarianza del estimador, para un coste especificado,o bien,

Habiendo fijado la varianza que podemosadmitir para el estimador, minimizar el coste en laobtención de las muestras.

Así en un estrato dado, se tiende a tomar unamuestra más grande cuando:

El estrato es más grande;

El estrato posee mayor variabilidad interna(varianza);

El muestreo es más barato en ese estrato.

1.5 Muestreo Sistemático Cuando los elementos de la población están ordenadosen fichas o en una lista, una manera de muestrearconsiste en

19

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Sea ;

Elegir aleatoriamente un número m, entre 1 yk;

Tomar como muestra los elementos de la lista:

Esto es lo que se denomina muestreo sistemático.Cuando el criterio de ordenación de los elementos enla lista es tal que los elementos más parecidostienden a estar más cercanos, el muestreosistemático suele ser más preciso que el aleatoriosimple, ya que recorre la población de un modo másuniforme. Por otro lado, es a menudo más fácil nocometer errores con un muestreo sistemático que coneste último.

1.5.1 Ejemplo

Si los elementos de la lista no están dispuestos enun orden particular, el muestreo sistemático puededar lugar a un muestreo aleatorio, muestreando cadaelemento k-ésimo de la lista, en el cual k seobtiene, dividiendo el tamaño de la población entreel tamaño de la muestra (estos es, k = N/m). De este

20

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

modo, si N es igual a 200 y n es igual a 10,entonces k = 200/10 = 20. Esto significa que semuestreará un elemento de cada secuencia de 20.

1.6 Muestreo por conglomerados

Si intentamos hacer un estudio sobre los habitantesde una ciudad, el muestreo aleatorio simple puederesultar muy costoso, ya que estudiar una muestra detamaño n implica enviar a los encuestadores a npuntos distintos de la misma, de modo que en cadauno de ellos sólo se realiza una entrevista. En estasituación es más económico realizar el denominadomuestreo por conglomerados, que consiste en elegiraleatoriamente ciertos barrios dentro de la ciudad,para después elegir calles y edificios. Una vezelegido el edificio, se entrevista a todos losvecinos.

Nota: A modo de advertencia, se requiere de unasimplificación cuidadosa y de un conocimiento ampliopara emplear estas técnicas de muestres, enparticular para determinar qué elementos de unapoblación muestrear, y decidir como interpretar losresultados muestrales.

1.7 Ejercicios

1.1 Explique que es el muestreo.

21

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1.2 Defina los siguientes muestreosa)Conglomeradob)Estratificadoc)Aleatorio

1.3 Enuncie las razones por la que en la práctica real es más importante llevar a cabo un muestreosin reposición.

1.4 Defina muestra y población.

1.5 Cual es el objetivo de la teoría del muestreo.

22

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

II. TEORÍA DE LA ESTIMACION

El curso de probabilidad ha proporcionado losconceptos básicos de la probabilidad y de lasdistribuciones de probabilidad. El objetivo de estaunidad es mostrar como a través de lasdistribuciones de muestreo es posible hacerinferencias acerca de la población, a partir devalores observados de las estadísticas muéstrales.La inferencia estadística acerca de los parámetrospoblacionales, puede efectuarse mediante laestimación del valor de un parámetro, tema de estaunidad, o por pruebas de hipótesis respecto de suvalor, lo cual es material específico de la unidadIII. La teoría de la estimación estadística consistede aquellos métodos por los cuales se realizaninferencias o generalizaciones acerca de lapoblación. Esto se puede realizar mediante el métodoclásico a partir de una muestra aleatoria de lapoblación, y el método bayesiano, el cual utilizaconocimiento subjetivo previo acerca de ladistribución de probabilidad de parámetrosdesconocidos, junto con la información muestral. Laestimación bayesiana no se incluye en esta obra.

2.1. Estimación y propiedades de los estimadores

La estimación puede dividirse en dos clases,estimación puntual y estimación por intervalos.

23

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Suponga que un vendedor de computadoras quiereestimar la ganancia promedio en la venta de ciertomodelo de la marca X. La estimación se podríaefectuar a través de un solo numero, por ejemplo18%, o estimar una ganancia entre el 12 y 20%dependiendo del cliente y el volumen de compra. Elprimer caso es una estimación puntual, toda vez querepresenta un único valor y el segundo casocorresponde a una estimación por intervalo yrepresenta a todas las posibles ganancias que hayentre el 12 y el 20% El procedimiento de estimación puntual utiliza lainformación de la muestra para obtener un solonúmero o punto que estima el parámetro objetivo. Elprocedimiento de estimación por intervalo hace usode la información de la muestra para obtener dosnúmeros que se supone van a incluir el parámetro deestudio. En cada caso la estimación real se hacemediante un estimador que es una regla que establececomo utilizar los datos de la muestra, paradeterminar el valor (o valores) que utilizamos comoestimación puntual (o por intervalo).

Comúnmente un estimador se expresa mediante unaformula. Por ejemplo: la media muestral.

Si se desea obtener una estimación por intervalo deun parámetro, se tiene que utilizar los datos de lamuestra para calcular dos puntos. Con los cuales seespera con una probabilidad alta que el parámetro

24

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

objetivo se encuentre en el intervalo que formandichos puntos.

2.2.Estimación puntual. Propiedades

La estadística se ocupa en gran medida con la tomade inferencias de parámetros poblacionales,inferencias que son inciertas debido a que se basanen comprobaciones obtenidas de las muestras.Considérese el problema de la estimación deparámetros. Por ejemplo, se puede conocer la mediade calificaciones otorgadas por un profesor endeterminada materia, o la variabilidad en el tiempopromedio de duración de las pilas de unacalculadora. Para encontrar dichos estirnadoresdebemos conocer primero la distribución del fenómenoen estudio, para proponer un estimador de losparámetros poblacionales que definen a dichadistribución. En la practica, sin embargo, en rarasocasiones tendremos que preocuparnos por laformulación de nuevos estimadores, ya que esto estarea de los estadísticos teóricos; nuestro objetivoes pues la selección del estimador apropiado.

Si nos concentramos por obvias razones en ladistribución normal, es bien claro que la mediamuestral X es un estimador de la media poblacional y que la varianza muestral S2 es un estimador dela varianza poblacional , especialmente siconsideramos la sencillez de su cálculo.

25

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Naturalmente, éstos no son los únicos estimadores deesos parámetros. ¿Hasta donde son estos estadísticosbuenos estimadores de esos parámetros?. El problemaahora consiste en seleccionar la “mejor” fórmula,pero primero debemos definir el concepto “mejor”.

En vez de definir "mejor", considérense variaspropiedades deseables v trátese de tener el mayornúmero de ellas asociadas con la elección de unestimador. Por ejemplo, insesgamiento exige que lamedia de todas las posibles estimaciones sea elparámetro que se estima. La media de una poblaciónde X es , el parámetro que se estima para lapoblación principal, de modo que X es un estimadorno sesgado de . La media de una población de S2 osea S2, es así que S2 es un estimador no sesgadode . Sin embargo, si el denominador empleado en lavarianza es n en vez de n - 1, entonces laestimación es sesgada. El sesgo no es un problemagrave si se conoce su magnitud. Este sería el casosi n fuese el divisor en la estimación de . Elsesgo es serio cuando se desconoce su magnitud, yaque no se puede hacer ningún tipo de corrección parael mismo.

No obstante su importancia el criterio deinsesgamiento no puede ser único, ya que para unparámetro puede tener varios estimadores insesgados,quedando el problema de decidir cual de ellos es elmejor, en algún sentido, que los demás. Considerelos estimadores insesgados de un parámetro cuyas

26

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

funciones de probabilidad se presentan en la figura2. 2.

Figura 2.1. Distribución de los estirnadores insesgados para el parámetro

Observe que tanto los dos estimadores de sonestimadores insesgados. Sin embargo presenta unavarianza comparativamente menor que , lo cual seprefiere. Se dice, entonces que el estimador esmás eficiente que dado que tiene varianza minina.

La sencillez del cálculo constituye otra propiedaddeseable. Toda estimación que se encuentra medianteadición y substracción de múltiplos de observacionesse llama función lineal de ellas. La media es unafunción lineal mientras que la varianza y ladesviación estándar no son funciones lineales. Esclaro que las funciones lineales son fáciles decalcular. Dado que la utilidad de un estimadordepende de su varianza, lo usual es reportar elestimador y su desviación estándar. La varianza de Xes n, y en general será desconocida, por lo que sereportara la varianza estimada de X, es decir S2

x, =S2/n, mediante la ecuación:

27

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.2.1 Ejemplo

2.1. La agencia para la Protección Ambiental (EPA) yla Universidad de Florida cooperaron recientementeen cierto estudio de los posibles efectos deoligoelementos en agua potable con respecto a laforma de cálculos renales. Enseguida se indicandatos con respecto a la edad, la concentración decalcio en el agua potable para consumo casero(medida por partes por millón), y, el habito defumar. Se obtuvieron datos de individuos conproblemas recurrentes de cálculos renales que vivenen los estados de ambas Carolinas y en los estadosde las Montañas Rocallosas.

CAROLINAS ROCALLOSASTamaño de muestra 467 191Edad promedio 45.10 46.40Desviación estándar de laedad

10.20 9.80

Concentración promedio decalcio

11.30 40.10

Desviación estándar paracalcio

16.60 28.40

Proporción de fumadores 0.780 0.61

(a) Estimar la concentración media de calcio en elagua potable para los pacientes con cálculos en lasCarolinas. Establecer un límite para el error deestimación.

28

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

(b) Estimar la diferencia en el promedio de lasedades de los pacientes con cálculos renales en lasCarolinas y en las Rocallosas. Establecer un límitede error de estimación.

(c) Estimar y establecer un límite de dosdesviaciones estándar para la diferencia en lasproporciones de los pacientes con cálculos renalesen las Carolinas y en las Rocallosas que eranfumadores al momento del estudio.

2.2 Un auditor se encuentra interesado en conocer elimporte de las cuentas por cobrar en cierta empresa.Para estimar está deuda obtiene una muestraaleatoria de 20 cuentas por cobrar de las 500cuentas de dicha empresa. Los datos se presentan dela manera siguiente (cantidades en dólares).

29

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

30

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Cuenta Cantidad Cumplimiento Cuenta Cantidad Cumplimiento1 278 Sí 11 188 No2 192 Sí 12 212 No3 310 Sí 13 92 Sí4 94 No 14 56 Sí5 86 Sí 15 142 Sí6 335 Sí 16 37 Sí7 310 No 17 186 No8 290 Sí 18 221 Sí9 221 Sí 19 219 No10 168 Sí 20 305 Sí

¿Considera usted que una cuenta por cobrar promediode la firma excede a 250 dólares?

2.3 Refiérase al ejercicio 2.2. A partir de losdatos en la verificación del cumplimiento, estime laproporción de las cuentas de la empresa que nocumplen con los procedimientos establecidos.Establecer un límite para el error de estimación.¿Considera que la proporción de cuentas que cumplencon los procedimientos excede el 80%?

31

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.4 Un incremento en la tasa de ahorro de losconsumidores se relaciona frecuentemente con unafalta de confianza en la economía y se afirma que esun indicador de una tendencia de recesión en laeconomía. Una muestra aleatoria de 200 cuentas deahorro en cierta comunidad mostró un incrementomedio en los montos de las cuentas de ahorro de 7.2%en los últimos 12 meses V una desviaci6n estándar de5.6%. Estimar la media del incremento porcentual enel monto de las cuentas de ahorro en los últimos 12meses para los ahorradores de la comunidad.Establecer un límite para el error de estimación.

2.3 Estimación por intervalos y propiedades

Un estimador puntual es con frecuencia inadecuadocomo estimación de un parámetro, ya que raramentecoincide con el parámetro. Una situación alternativaes la estimación por intervalos de la forma [Li,Ls], donde Li es el limite inferior y Ls es ellimite superior. Un estimador por intervalo es unaregla que especifica el método que utiliza lasmediciones de la muestra para calcular los númerosque forman los extremos del intervalo. En el casoideal seria conveniente que el intervalo tuviera dospropiedades.

32

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1 ) El intervalo contenga el parámetro-objetivo

2) Intervalos relativamente estrechos tamaño demuestra. Lo cual depende del valor de y deltamaño de la muestra.

Los estimadores por intervalo se denominancomúnmente como intervalos de confianza. Laprobabilidad de que un intervalo contenga a seconoce como coeficiente de confianza. Desde un puntode vista practico, el coeficiente de confianzaindica la fracción de veces que en un muestreorepetitivo, los intervalos construidos contendríanel parámetro-objetivo .

P(Li < < Ls)=1-

donde

1 - Coeficiente de confianza

P(Li < < Ls) = Intervalo de confianza bilateral

El significado de lo anterior puede describirse dela siguiente forma:

Considere es necesario conocer la producción lecherapromedio () de cierta región. Suponga que sepropone calcular un intervalo de confianza del 90%

33

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

de dicha producción (mediante las técnicas descritasen secciones posteriores). Entonces después derealizar múltiples muestreos, podemos esperar que el90% de los límites calculados contendrán elparámetro es decir la producción promedio de dicharegión. En la practica solo se realiza una vez elmuestreo, entonces con una confianza de 100 (1 - )veces de 100, el intervalo contendrá el parámetro y100 veces no lo contendrá

2.4 Intervalos de confianza para .

La construcción de intervalos de confianza permiteestimar el valor de un parámetro ante laimposibilidad de calcular el valor real. Mediante eluso de las funciones de distribución derivadas delmuestreo efectuaremos la estimación cuando semuestrea de una población que se distribuye normal,ya sea que se conozca o no la varianza poblacional.Así mismo la técnica se aplica a distribucionesdiscretas que por el tamaño de la muestra puedenser aproximadas a una distribución normal. Porúltimo se describen intervalos de confianza para ladiferencia de medias.

2.4.1 Intervalo de confianza para con varianzaconocida (

34

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Se X1, X2,...Xn una muestra aleatoria de unadistribución normal con media desconocida Elinterés es construir un intervalo de confianza de100 ( 1 - ) % para con varianza conocida 2. Laconstrucción de dicho intervalo se hace con base almejor estimador de , explícitamente la mediamuestral .

Sabemos que

Si se toman los valores Z /2 y Z1-en la distribuciónZ, puede escribirse

Lo cual se ilustra en la figura 2.4.1

35

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Figura 2.4.1 Derivación de un intervalo de confianza para en unapoblación con distribución normal

Multiplicando por y despejando se obtiene

En términos generales, un intervalo de 100(1-) deconfianza para estará dado por

Donde Z/2 es el punto que deja a su izquierda100(/2) % de la densidad normal estándar.

Los pasos para construir un intervalo de confianzapara la media de una distribución normal convarianza 2

x conocida, son:

36

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1 Elegir el nivel de confianza (1 - ) al cual sedesea realizar la inferencia, considerando que amayor confianza elegida mayor longitud deintervalos por lo tanto mayor precisión en laestimación.

2 Obtener el valor Z/2 de las tablas de la normalestándar.

3 Efectuar el cálculo de la media muestral.

4 Calcular los extremos del intervalo.En la interpretación de un intervalo de confianza esnecesario notar que antes de obtener una muestraexiste una probabilidad 100(1-a), de que elparámetro se encuentre dentro de los limitesaleatorios que definen un intervalo; una vezobtenida la muestra, no hablamos en términos deprobabilidad, sino de la confianza de que elparámetro se encuentre en el intervalo calculado. Esdecir una vez computado el intervalo de confianzasolo son posibles dos resultados: contiene o no elparámetro. De contenerlo el intervalo no proporcionainformación del verdadero valor, simplemente decimosque con 100(1-) de nuestra confianza el parámetrose encuentra dentro de dicho intervalo.

Para justificar los argumentos anteriores considerael peso de los alumnos de cierta universidad, de loscuales se tiene información histórica que = 63.5 y= 9.283. Se seleccionaron al azar 10 muestras de

37

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

tamaño 5 y se calcula la media (X) para construir unintervalo de confianza de 95% dado por X ±1.96(9.283) , los resultados se muestran en elcuadro 2.4. Observe que de estos 10 intervalos, soloel intervalo para la muestra dos no incluye el valorde la media poblacional (63.5 kg). Note el 90% delos intervalos calculados contiene lo cual estacercano al coeficiente de confianza del 95%. Por locual deducimos que si extraemos una muestra yestablecemos un intervalo de confianza, tendremosuna confianza alta de que dicho intervalo incluiráel parámetro.

Se habrá notado que el tamaño de la muestra seconsidera conocido en la estimación de un intervalode confianza. El tamaño de muestra se fija enfunción del tiempo, la economía y la disponibilidaddel material en estudio. Entonces es primordialobtener un tamaño de muestra óptimo, para generarestimaciones adecuadas sin derrochar recursos. Dadoque mientras mayor sea el tamaño de muestra que seutilice, menor sería la longitud del intervalo deconfianza y en consecuencia habrá mayor precisión enla estimación. El cálculo del tamaño de muestra esde gran interés y existen diversas formas de calculopara lo cual es necesario indicar tanto la exactitudcomo la precisión deseadas, mediante valorespermisibles del error y del nivel de confianza. Sepresentan una de ellas a través de la expresión

38

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

La cual puede rescribirse como

donde

al despejar no obtenemos la ecuación que buscamos

Note que en la ecuación anterior es necesarioconocer el valor de la varianza poblacional,situación que puede ser irreal, lectores interesados

39

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

en el tenia pueden consultar el excelente libro deScheaffer.

2.4.1.1 Ejercicios

2.5. Se midió la resistencia a la ruptura portorcimiento de un cierto tipo de tela en un lote conlos siguientes resultados (en psi): 182, 172, 176,178. La desviación estándar basada en la experienciaprevia es de 5 psi, Encuentre un intervalo deconfianza del 99% para la resistencia promedio de laruptura por torcimiento del lote.

Respuestas P[170.5625<<183.4375]=0.99

2.6. Un fabricante de fibras sintéticas que deseaestimar la tensión de ruptura media de una fibra.Diseña un experimento para observar las tensiones deruptura en libras, de 1 6 hilos del procesoseleccionados azar. Las tensiones son 20.8, 20.6,21.0, 20.9, 19.9, 20.2, 19.8, 19.6, 20.9,.21.1,20.4, 20.6, 19.7, 19.6, 20.3 v 20.7. Supóngase quela tensión de ruptura de una fibra se encuentramodelada por una distribución normal con desviaciónestándar de 0.45 Libras. Construir un intervalo deconfianza estimado del 98% para la tensión deruptura promedio de la fibra.

Respuesta [20.1196,20.6427]

40

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.7. Los siguientes datos representan medidas deporosidad en una muestra de un cargamento de coque.Encuentre un intervalo de confianza del 95% para lamedia verdadera. Suponga que = 0.25. ,

2.16, 2.07, 2.34, 1.97, 1.97, 1.90, 2.19, 2.23,2.15, 2.47, 2.31, 1.94, 2.31, 1.86, 2.25, 2.14,2.15, 2.161 2.30, 2.48, 2.11, 2.15, 2.24, 2.04,2.21, 1.91, 2.01, 2.09, 2.07, 2.25

Respuesta [2.0581, 2.2370]

2.8 Se desea estimar el número medio de horas de usocontinuo antes de que cierto tipo de computadorarequiera una reparación inicial. Si podemos suponerque = 20 días, ¿De que tamaño debe ser una muestraa fin de suponer con una confianza del 90% que lamedia muestral difiera a lo más 5 días?

Respuesta [ 44]

2.9 El director administrativo de un colegio deseausar la media de una muestra aleatoria para estimarla cantidad promedio de tiempo que tardan losalumnos en ir de una clase a la siguiente, y ademásquiere poder asegurar con una confianza del 99% queel error es a lo más de 0.25 minutos. Si se suponepor experiencia =. 1.4 minutos, ¿ Qué tamaño debetener la muestra?

41

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Respuesta [208]

2.10. Una tienda de donas se interesa es estimar suvolumen de ventas diarias. Supóngase que el valor dela desviación estándar es de $50. Si el volumen deventas se encuentra aproximado por una distribuciónnormal,

a) ¿Cuál debe ser el tamaño de la muestra para quecon una probabilidad de 0.95 la media muestral seencuentre a no más de $20 del verdadero volumen deventas promedio?

Respuesta [25]

b) Si no es posible suponer que la distribución esnormal, obtener el tamaño necesario de la muestrapara la pregunta a.

Respuesta [125]

2.4.2 Intervalos de confianza para con varianzadesconocida (2)

En esta sección tratamos la forma de construir unintervalo de confianza para la media de una

42

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

distribución normal con varianza desconocida. Esnecesario que el supuesto de normalidad es unarestricción que debe cumplirse para que lasinferencias que realicemos sean válidas. Es decir lacalidad de nuestras inferencias será función deltamaño de muestra y de la semejanza de ladistribución de la población de la cual se muestreaa la distribución normal. Encontramos ladistribución de muestreo cuando la media y lavarianza 2 son desconocidos, la variable aleatoria

tiene una distribución t de Student con n - 1 gradosde libertad. Si se toman valores t/2,(n-1) y -t/2,(n-1)

en la distribución t, con t(n-1) grados de libertadpuede escribirse:

Lo cual se ilustra en la figura 2.4. 2

43

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.4.2 Derivación de un intervalo de confianza para en una población condistribución normal

Después de despejar se obtiene

En términos generales, un intervalo de 100(1 - ) deconfianza para estará dado por

donde t/2,(n-1) es el punto que deja a su derecha100(/2) % de la densidad t de Student con n - 1grados de libertad. Los pasos para construir unintervalo de confianza para la media de cuando nose conoce la varianza 2

X, son:

44

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

1. Elegir el nivel de confianza (1 - a) al cualse desea realizar la inferencia, considerandoque a mayor confianza elegida, mayor longitud deintervalo y por lo tanto menor precisión en laestimación.

2. Obtener el valor t /2,(n-1) de las tablas de ladistribución t de Student.

3.Efectuar el cálculo de la media y desviaciónestándar muestral.

4. Calcular los extremos del intervalo.

La interpretación asociada al intervalo nos indicaque con una confianza del 100 (1 - )%, elintervalo calculado contendrá al parámetro. Es decira la media poblacional .

2.4.2.1 Ejercicios

2.1 1. El crecimiento del tronco principal para unamuestra de 17 pinos rojos de 4 años, tiene una mediade 11.3 pulgadas y una desviación estándar de 3.4pulgadas. Obtenga un intervalo de confianza de 90%para la media del crecimiento del tronco principalpara una población de pinos rojos de 4 años sujeta acondiciones ambientales similares. Supóngase que elcrecimiento tiene una distribución normal.

45

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Respuesta (9.8602,12.7397)

2.12. En un proceso químico se han producido, enpromedio 800 toneladas de cierto producto por día.Las producciones diarias para la semana pasadafueron 785, 805, 790, 793 y 802 toneladas. Estimar apartir de los datos la media de la producción diariacon un coeficiente de confianza de 90 %.

Respuesta (787.0528, 802.947)

2.13. Debido a la variabilidad en los descuentos porlos automóviles entregados a cambio, la ganancia porauto nuevo vendido por un distribuidor deautomóviles varia de uno a otro. Las ganancias porventas (en cientos de dólares); registradas lasemana pasada, fueron 2.1, 3.0, 1.2, 6.2, 4.5 y 5.1.Obtener un intervalo de confianza de 95% para laganancia media por venta.

Respuesta (1.684, 5.6825)2.14. Se registro el tiempo transcurrido entre lafacturación y el pago recibido, para una muestraaleatoria de 91 clientes de una empresa decontadores públicos. La media y la desviaciónestándar de dicha muestra fueron 39.1 días y 17.3días, respectivamente. Obtener un intervalo de

46

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

confianza de 90% para el tiempo medio que transcurreentre la facturación y el pago recibido para todaslas cuentas de las firmas de contadores públicos.Interpreta el resultado.

Respuesta (36.089, 42.114)

Interpretación nueve de cada diez veces, el tiempotranscurrido entre la facturación y el pago seráaproximadamente entre 36 y 43 días.

2.15. La cámara de comercio de una ciudad seinteresa en estimar la cantidad promedio de dineroque gasta la gente que asiste a convenciones,calculando comidas, alojamiento y entretenimientopor día. De las distintas convenciones que se llevana cabo en la ciudad, se seleccionaron 16 personas delas que se obtuvo la siguiente información endólares: 150, 175, 163, 148, 142, 189, 135, 174,168, 152, 158, 184, 134, 146, 155, 163. Si, sesupone que la cantidad de dinero gastada en un díaes una variable aleatoria distribuida normal,obtener los intervalos de confianza estimados del90, 95 y 98% para la cantidad promedio real.

Respuestas (151.3055, 165.6944), (149.753,167,2469),(147.8197, 169.182)

47

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.16. Los pesos de la fruta contenida en 21 latas deduraznos seleccionadas al azar fueron (en onzas):11.0, 11.6, 10.9, 12.0, 11.5, 12.0, 11.2, 10.5,12.2, 11.8,12. 1, 11.6, 11.7, 11.6, 11.2, 12.0,11.4, 10.8, 11.8, 10.9 y 11.4. Determine elintervalo de confianza de 98%,para estimar el pesopromedio por lata de los duraznos.

Respuesta (11.2238,11.7475)

2.4.3 Intervalo de confianza para el parámetro deproporción p cuando se muestrea una distribuciónbinomial.

Se menciono que una aplicación importante delteorema del límite central, es la aproximación dedistribuciones discretas a la normal cuando eltamaño de muestra es suficientemente, grande.Entonces es posible construir un intervalo deconfianza para una proporción a través de lavariable aleatoria.

De esta forma la probabilidad 1 - del intervaloaleatorio para una proporción esta dada por:

48

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

En términos generales, un intervalo de 100(1-) deconfianza para p estaría dado por

Si deseamos corregir por continuidad el intervalo de100(1 – )% de confianza para p está dada por

cuyo uso es recomendable. Note que el factor 1/2namplia el intervalo en la misma proporción para cadaextremo del intervalo; si n es muy grande lacorrección por continuidad será prácticamente nula,por lo cual podríamos omitir su aplicación. Semenciona que estos intervalos se derivan a partirdel supuesto que la muestra es suficientementegrande; el cuadro 2.4.3.1 nos facilita la decisiónde cuando un tamaño de muestra es grande o no.

49

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Cuadro 2.4.3.1. Tamaños de muestra apropiadas para usar la aproximaciónNormal

Si p es iguala

La aproximación Normal serárazonablemente si n es al menos

0.5 300.4 0 0.6 500.3 o 0.7 800.2 o 0.8 2000.1 o 0.9 6000.05 o 0.95 1000

2.4.3.1.1 Ejercicios

2.17. Se hizo un estudio en relación con laratificación de un dirigente sindical. En respuestaa la pregunta "Si Votaría por ratificar aldirigente?", hubo 250 respuestas “si"; 125 , "no", y75 respuestas indecisas. Halle una estimación parala proporción poblacional que votará por ratificaral dirigente utilizando un intervalo de confianza de95%.

Respuesta (0.5096,0.6014)

2.19. El departamento de análisis de mercados de unacompañía productora de café instantáneo realizó unestudio entre hombres casados para determinar laproporción de éstos que prefieren su marca.Veinte de100 entrevistados contestaron afirmativamente.

50

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Utilice un intervalo de confianza del 95% paraestimar la proporción de todas los varones casadosque prefieren la marca de café instantáneo.

Respuesta (0.107,0.293)

2.4.4. intervalos de confianza para la diferencia demedias cuando se muestrean dos distribucionesnormales e independientes

Discutiremos a continuación la estimación porintervalos de la diferencia de medias de dosmuestras independientes que provienen de poblacionesque se distribuyen normalmente. Existen dos casos,dependiendo del conocimiento de la varianzapoblacional.

Sean X1.X2,...Xn e Y1, Y2.. Yn dos muestras aleatoriasde dos distribuciones normales independientes, conmedias x y y y varianzas 2

x y 2y respectivamente.

Se desea construir un intervalo de confianza para ladiferencia x - m. Supóngase que conocidas lasvarianzas poblacionales 2

x y 2y Entonces de

los resultados obtenidos en la variable aleatoria

51

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

De tal forma que si seguimos los procedimientosempleado en los incisos anteriores, el intervaloaleatorio de 100 (1 – ) % de confianza para x – y

esta dado por

Entonces el intervalo de confianza del 100 (1 – )% para x – y es

Si las varianzas poblacionales se desconocen peroson iguales (x = y) entonces la variable aleatoria

52

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Tiene distribución t de Student con k = nx + ny – 2grados de libertad. En donde la estimación combinadade la varianza es dada por

Al despejar x – y el intervalo de 100 (1 – ) %de confianza resultante es igual a

,

Es necesario considerar que es indiferente quemuestra es X y cual es Y. lo más importante es lainterpretación de los signos del intervalo. Si ambosextremos son positivos, X > Y. Si ambos sonnegativos, X < Y. En el caso de signos diferentes,el extremo izquierdo expresa la máxima diferenciapor la que Y supera a X y el extremo derecho lamáxima diferencia por la que X es mayor que Y.

2.4.4.1 Ejercicios

53

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.20. Se aplicó un examen de matemáticas a un grupode 50 alumnos seleccionados al azar de la secundariaA y a un grupo de 45 de estudiantes seleccionados alazar de la secundaria B. El grupo de la secundaria,A obtuvo una media de 75 puntos con una desviaciónestándar de 10 puntos. El grupo de la secundaria Blogró una media 72 puntos con una desviación de 8puntos. Construir un intervalo de confianza del 95%para la diferencia en los resultados medios.

Respuesta Sp= 9.1086, (-0.6684, 66684)

2.21. Una comparación de los tiempos de reacción ados estímulos diferentes en un experimentopsicológico de asociación de palabras aplicado a unamuestra aleatoria de 16 personas, produjo losresultados (en segundos) que se muestran en lasiguiente tabla. Obtener un intervalo de confianzade 90% para (1 – 2)

Estimulo

Tiempo de reacción (en segundos

1 1 2 3 1 2 3 1 22 4 1 3 3 2 2 3 3

Respuesta Sp 0.8767, (-1.5216.0.0216)

54

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.22 Estime un intervalo de confianza del 95 % ladiferencia del coeficiente de inteligencia (IQ)entre los miembros mas viejos y más jóvenes (hombresy mujeres) de una familia tomando como base lasiguiente muestra aleatoria de sus IQ.

Masviejos

145

133

116

128

85 100 105 150 97 110 120 130

Masjóvenes

131

119

103

93 108

100 111 130 135

113 108 125

Respuesta Sp=16.8993, (10.7181.17.8981)

2.23. Se aplicaron 2 métodos para enseñar la lecturaa dos grupos de niños de una escuela primaria y secompararon los resultados mediante una prueba delectura y comprensión. El método 1 se aplicó a 11niños para los cuales se obtuvo una media y unadesviación estándar de 64 y 52 puntosrespectivamente. El método 2 se probó en 14 niñosque al final de la prueba obtuvieron una media de 69y una desviación estándar de 71 puntos. Obtener unintervalo de confianza de 95% para (1 - 2).

Respuesta Sp=7.9208, (-1.6020,11.6020)

55

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.24. Se administraron dos nuevos medicamentos apacientes con cierto padecimiento cardiaco. Elprimer medicamento bajo la presión sanguínea de 16pacientes en un promedio de 11 puntos, con unadesviación estándar de 6 puntos. El segundo fármacodisminuyó la presión sanguínea de 20 pacientes en unpromedio de 12 puntos, con una desviación estándarde 8 puntos. Desarrollar un intervalo de confianzadel 95% para la diferencia en la reducción media dela presión sanguínea, bajo el supuesto que lasmediciones se distribuyen normales con varianzasiguales.

Respuesta Sp=7.1866, (-5.89,3.89)

2.25. Se midieron las presiones sanguíneasdiastólicas de 15 pacientes utilizando dos técnicas:el método estándar utilizado por personal medico yotro método que utiliza un aparato electrónico conindicador digital. Los resultados fueron lossiguientes:

Método PacienteEstándar 7

280 88 80 80 75 92 77 80 65 69 96 77 75 60

Indicadordigital

70

76 87 77 81 75 90 75 82 64 72 95 80 70 61

56

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Determine el intervalo de confianza del 90% para ladiferencia media de las dos lecturas

Respuesta Sp= 9.7119, (5.3026,6.7626)

2.5 Intervalo de confianza para 2

Considere ahora el problema de construir unintervalo de confianza para la varianza de lapoblación (2) cuando se muestrea de una poblacióncon distribución normal. Encontramos que ladistribución de muestreo asociada con la varianzamuestral (S2) es chi-cuadrada con n - 1 grados delibertad. Usando la distribución 2(n – 1), podemosencontrar los valores

2,(n-1) y

(n-1)

tales que

P[(n-1) <n-1 <

2,(n-1) ]= 1 -

Donde 2 (n – 1) =( n – 1) S2/2, según se expone en la

figura 2.5.1

57

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

(n-1)

2,(n-1)Figura 2.5.1 intervalo de confianza para 2 para una población que se

distribuye normal. La cual se puede expresar como

P[(n-1) < <

2,(n-1) ]= 1 -

Después de manipular esta expresión, para 2

obtenemos

P[ = 1 -

Por lo que el intervalo 100 ( 1 - )% de confianzapara 2 es

58

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

del cual si obtenemos la raíz cuadrada, seconvierte en un intervalo de 100 (1 - )% deconfianza para

El lector deberá considerar al plantear intervalosde confianza que los términos exactitud y precisiónque en el lenguaje cotidiano son sinónimos, en laestadística no lo son. El termino exactitud se usaen estadística solo cuando hablamos del tamaño demuestra. Mientras que precisión se considera comoopuesto al término varianza, de tal forma quemientras más variabilidad exista menos precisión,entonces, si en un problema se hace referencia aprecisión, el intervalo a emplear involucrara algunamedida de variabilidad. (Guerrero, 1989)

Una diferencia notable entre los intervalos deconfianza para y 2 en la distribución Normal esque, en el caso de , el punto medio del intervalocoincide con X, o sea el estimador de , casocontrario del intervalo para 2, donde el punto mediodel intervalo no coincide con S2, debido a la faltade simetría de la distribución. (Infante y Zarate,1984)

2.5.1 Ejercicios

59

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2.26. En un proceso químico se han producido, enpromedio, 800 toneladas de cierto producto por díalas producciones diarias para la semana pasadafueron 785, 805, 790, 793 y 802 toneladas.Determinar un intervalo de confianza de 90% para lavarianza 2 de la producción diaria.

Respuesta P[29.3013<<391.1668]=0.90

2.27. Se indica que las anormalidades congénitasocurren mayormente entre niños varones engendradospor padres de mayor edad promedio. Se obtuvieronhistories clínicas de este tipo de anormalidadescorrespondientes a 20 infantes varones cuyas madrestuvieron las edades siguientes: 31, 21, 29, 28, 34,45, 21, 41, 27, 37, 43, 21, 39, 38, 32, 28, 37, 28,16 y 39. Determine el intervalo de confianza de 90%para la desviación estándar de la edad en madres dehijos con anormalidades congénitas.

Respuesta P[40.85<<121.70]=0.90

2.28. Si 32 mediciones del punto de ebullición delazufre tienen una desviación estándar de 0.83 gradosCelsius, constrúyase un intervalo con un nivel deconfianza del 98% para la desviación estándar realde tales mediciones.

60

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

P[0.38<<0.70]=0.98

2.29. Se espera tener una cierta variación aleatorianominal en el espesor de las laminas de plástico queuna máquina produce. Para determinar cuando lavariación en el espesor se encuentra dentro deciertos limites, cada día se seleccionan en formaaleatoria 12 láminas de plástico y se mide enmilímetros su espesor. Los datos que se obtuvieronson los siguientes: 12.6, 11.9, 12.3, 12.8 11.8,11.7, 12.4, 12.1, 12.3, 12.0, 12.5, 12.9. Si sesupone que el espesor es una variable aleatoriadistribuida normal, obtener el intervalo deconfianza estimado del 99% para la varianzadesconocida del espesor. Si no es aceptable unavarianza mayor de 0.90 mm, ¿existe alguna razón parapreocuparse con base en esta evidencia?

P[0.0614<<0.6309]=0.99

No. La muestra no proporciona evidencia de queocurra una varianza de 0.9 mm2, con una confianzadel 99%

2.30. Se tiene interés en la variabilidad de lospuntajes obtenidos en un examen TOEFL (de Test ofenglish as a Foreign Languaje). Se obtiene una

61

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

muestra aleatoria de puntajes correspondientes aestudiantes extranjeros con los siguientesresultados: 495, 525, 580, 605, 552, 490, 590, 505,551, 600. Obtenga un intervalo de confianza de 95 %para la desviación estándar delas calificaciones delexamen TOEFL.

P[30.16<<80.04]=0.95

2.31. Mientras realizan una tarea extenuante, elritmo cardiaco de 25 trabajadores se incrementa enun promedio de 18.4 pulsaciones por minuto, con unadesviación estándar de 4.9 pulsaciones por minuto.Calcular un intervalo con un nivel de confianza del95% para la correspondiente desviación estándar dela población.

P[3.83<<6.82]=0.95

62

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

III. PRUEBAS DE HIPOTESIS

El principal objetivo de la estadística es hacerinferencias con respecto a parámetros poblacionalesdesconocidos, basadas en la información obtenidamediante datos muestrales. Es necesario recordar quela estadística utiliza dos enfoques básicos:

1.El enfoque descriptivo, que se ocupaesencialmente de resumir y describir en formaconcisa, ya sea mediante gráficas o a travésde unas cuantas medidas descriptivas lainformación con que se cuente, y

2.El enfoque inferencial, cuyo objetivofundamental es el de utilizar muestrasrepresentativas para realizar inferencias quesean validas para toda la población de dondese obtuvo la muestra

Estas inferencias se expresan a través de laestimación estadística de parámetros tema de launidad anterior y mediante la prueba de hipótesis devalores muestrales lo cual es el punto central de lapresenta en esta unidad.

Las pruebas de hipótesis se realizan en todos losÁmbitos en los cuales pueden contrastarse la teoríafrente a la observación. Un profesor puede comprobarque dos métodos de enseñanza son igualmenteeficientes. Un administrador puede proponer la

63

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

hipótesis de que cierto insecticida reducirá lapoblación de áfidos que atacan cierto cultivo. Estashipótesis deberán probarse estadísticamentecomparando la hipótesis con los valores muestralesobservados.

AI igual que en la unidad anterior se presentadiversas situaciones en las cuales se emplea laprueba de hipótesis acerca de tres parámetrosbásicos: la media , la desviación estándar , y laproporción p.

64

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.1 Conceptos de la teoría de hipótesis.

Se presentan diversos conceptos de una hipótesisestadística con el fin de que el lector forme supropio criterio.

Una hipótesis estadística es una aseveración sobreun modelo probabilístico. El procedimiento medianteel cual se juzga la factibilidad de la hipótesis esuna prueba de hipótesis. (Infante y Zarate, 1990)

Una hipótesis estadística es una afirmación sobre lapoblación. Esta proposición es plausible de serevaluada mediante una muestra de la población.

Una hipótesis estadística es una aseveración oconjetura sobre la distribución de una o másvariables aleatorias. Si la hipótesis estadísticaespecificada completamente la distribución esllamada simple; de otra forma es llamada compuesta.(Mood, Graybill and Boes, 1974)

Una hipótesis estadística es una afirmación conrespecto a alguna característica desconocida de unapoblación de interés (Canavos, 1987)

Para los propósitos de este texto una hipótesisestadística se considera como una suposición acercadel estado de la naturaleza, generalmente expresadapor el comportamiento de una variable aleatoria y sudistribución de probabilidades.

65

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

La lógica fundamental de una prueba de hipótesis sepuede aclarar mediante un ejemplo. Suponga que sedesea comprobar si la estatura promedio de losalumnos de cierta especialidad universitaria es deal menos 1.65 metros. Note entonces que la prueba dehipótesis constituirá un mecanismo que nos permitaverificar la veracidad o falsedad de esta hipótesis.La naturaleza de una prueba de Hipótesis estadísticaes determinar si la hipótesis se encuentra fundadaen la evidencia que se obtiene a través de unamuestra aleatoria. Esta determinación se tomarasiempre con base en la probabilidad, y, si esta esminina, entonces será rechazada la hipótesis.

Cualquier prueba estadística de hipótesis funcionaexactamente de la misma manera y se compone de losmismos elementos esenciales

1 ) Hipótesis nula, Ho

Hipótesis que se desea probar o contrastar.Generalmente es una aseveración en el sentido de queun parámetro poblacional tiene un valor especifico.La hipótesis nula es aquélla que el investigadoresta dispuesto a sostener como plausible, a menosque la evidencia experimental en su contra seasustancial. Adema hipótesis nula contendráinvariablemente la igualdad

2)Hipótesis alternativa, Ha

66

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Esta hipótesis sobre la cual se centra la atención,es una aseveración sobre el mismo parámetropoblacional que se utiliza en la hipótesis nula.

La hipótesis nula y alternativa se proponen despuésde examinar el problema o aseveración, buscando queambas sean mutuamente excluyentes. A partir de estemomento en el procedimiento do prueba de hipótesisse trabajara bajo el supuesto de que la hipótesisnula es una afirmación correcta. Este caso puede sercomparado con un juicio legal estadounidense dondese supone que el acusado es inocente mientras no sele demuestre lo contrario. AI concluir estecontraste do hipótesis se tomará una de dosdecisiones posibles. Se estará de acuerdo con lahipótesis nula y s dirá que no existe suficienteevidencia muestral para rechazar Ho (esto correspondeen el juicio a declarar la inocencia del acusado). Obien existe evidencia muestral para rechazar Ho (esdecir el acusado es culpable).

3) Estadístico de prueba

Variable aleatoria cuyo valor en una muestra dadadeterminara nuestra decisión de "no rechazar Ho" obien "rechazar Ho"

4) Región de rechazo

67

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Especifica los valores estadísticos de la pruebapara los cuales se rechaza la hipótesis nula. Si erauna muestra particular el valor calculado delestadístico de la prueba se localiza en la región derechazo, se rechaza la Hipótesis nula Ho en favor dela hipótesis alternativa Ha. Si el valor delestadístico de la prueba no cae en la región derechazo, no rechazamos Ho.

3.2 Errores tipo I y tipo II

Una hipótesis estadística es esencialmente diferentede una proposición matemática debido a que ladecisión sobre la veracidad de la Hipótesisestadística se funda en el comportamiento de unavariable aleatoria y, en consecuencia pueden tomarsedecisiones equivocadas.

Recuerde el ejemplo "el acusado es inocente hastaque no se le demuestre lo contrario " donde lahipótesis nula es "Inocente " y la alternativa"culpable". El rechazo de la hipótesis nulaimplicarla que la parte acusadora a proporcionado lasuficiente evidencia para condenar al acusado. Encontraparte, ante la falta de evidencia el acusadoserá declarado inocente.

El lector deberá notar que en el ejemplo anterior esposible cometer dos errores; declarar al acusadoinocente por falta de pruebas cuando en realidad es

68

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

culpable y decidir que el acusado culpable por malainterpretación de las pruebas, cuando realmente esinocente. En general, para cualquier prueba dehipótesis se tienen las posibilidades que sepresentan en la siguiente tabla.

69

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Situación real (desconocida) Decisióntomada

Ho ciertaHa falsa

Ho falsaHa cierta

RechazarHo

Error tipo ILa probabilidaddebe ser baja.

Símbolo a

Decisión correctaLa probabilidaddebe ser alta.Símbolo 1 – =poder de prueba

No rechazar Decisión correctaLa probabilidaddebe ser alta.Símbolo 1 – a=coeficiente de

confianza

Error tipo IILa probabilidaddebe ser baja.

Símbolo:

En el caso judicial el Error Tipo I consiste enconcluir que el acusado es culpable cuando esinocente, y el Error Tipo II en concluir que esinocente cuando en realidad es culpable. Dado que ladecisión que tomamos en una prueba de hipótesis sebasa en la evidencia muestral, siempre estaremosexpuestos a ambos tipos de error. La notación que seemplea casi universalmente para denotar esto erroreses: para la probabilidad de Error Tipo I y parala probabilidad de Error Tipo II.

= P[ Error Tipo I ] = P[ Rechazar cuando Ho escierta]

= P[ Error Tipo II ] = P[no rechazar Ho cuando Ho

es falsa]

70

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Es necesario considerar que generalmente se asume laactitud de tomar el error tipo I corno mas grave. Siconsidera el caso de un acusado que es condenado ala pena capital. Una vez ejecutado no es posibleremediar el error si es inocente, dado que no esposible volverlo a la vida. Por el contrario unapersona que es declarada inocente por falta depruebas es posible llevarla a juicio nuevamente.Dado lo anterior es común seleccionar de antemano eltamaño del error tipo I que se esta dispuesto asoportar, sin embargo es necesario considerar que amedida que el error tipo I disminuye, el error tipoII aumenta. La única forma reducir ambos erroressimultáneamente es aumentado el tamaño de muestra.En secciones posteriores se presenta el manejonumérico y grafico del tema. 3.2.1 Ejercicios

3.1) Supóngase que una empresa de ingeniería se lepide verificar la seguridad de una presa. ¿Qué tipode error cometería si se equivocase al rechazar lahipótesis nula de que la presa es segura? ¿Qué tipode error cometería si se equivoca al aceptar lahipótesis nula de que la presa es segura?

3.2) Supóngase que deseamos probar la hipótesis nulade que un dispositivo anticontaminante paraautomóviles es eficaz. Explíquese en quecondiciones cometeríamos un error tipo I y en quecondiciones cometeríamos un error tipo II.

71

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.3) Una socióloga esta interesada en la eficienciade un curso de capacitación para conseguir que másconductores utilicen los cinturones de seguridad delos automóviles. ¿Qué hipótesis esta probando lasocióloga si comete un error tipo I al concluirerróneamente que el curso de capacitación no esefectivo?

3.4) Una gran firma maquiladora es acusada dediscriminación en su política de contratación.

a) Qué hipótesis esta siendo probada si un juradocomete un error tipo I al encontrar que la firma esinocente?

b) Qué hipótesis esta siendo probada si un juradocomete un error tipo II al encontrar que la firma esculpable?

3.3 Pruebas de hipótesis para una media

Se presentan en esta sección pruebas de hipótesissobre el parámetro al igual que en el caso de laestimación se presentan dos alternativas de acuerdoal conocimiento o desconocimiento de la varianzapoblacional. También se calcula la probabilidad decometer error tipo I y error tipo II cuandoefectuamos pruebas de hipótesis acerca la mediapoblacional () y conocemos la varianza poblacional(2).

72

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.3.1 Prueba de hipótesis para una media convarianza conocida(2)

Sea una muestra aleatoria X1, X2, ...,,Xn, de unadistribución que se supone Normal con media yvarianza 2. Es decir que cada una de las variablesaleatorias es N(, ), y además esas variables sonindependientes. Si queremos inferir sobre elparámetro de la distribución empleando para ellola muestra que se tiene. Los juegos de hipótesis deinterés práctico son de tres tipos:

a) Ho: = . En oposición a Ha: .

b) Ho: . En oposición a Ha: > .

c) Ho: . En oposición a Ha: < .

donde . es una constante elegida por elinvestigador.

La estadística de prueba en cualquiera de los trescasos es:

73

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Con un nivel de significancía , las reglas dedecisión correspondientes a (a), (b) y (c) sonrespectivamente:

a) "Rechazar Ho si | Zc| |Z/2| “

b) "Rechazar Ho si Zc Z1-”c) "Rechazar Ho si Zc Z”

Se presentan a continuación en la figura 3.3.1. larepresentación grafica de las regiones de rechazo,correspondientes a los juegos de hipótesis,presentados anteriormente.

Figura 3.3.1.1.a. Región de rechazo para una prueba de hipótesis de coladerecha

74

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

0Figura 3.3.1.2.b. Región de rechazo para una prueba de hipótesis de cola

derecha

Figura 3.3.1.3.c. Región de rechazo para una prueba de hipótesis de colaizquierda

3.3.2. Prueba de hipótesis para la media convarianza desconocida

En el inciso anterior desarrollamos una prueba dehipótesis para la media suponiendo que conocemos elvalor de la varianza poblacional (2), lo cual es unasituación poco frecuente, aun es posible plantearuna prueba de hipótesis satisfactoria para la media.

Sea una muestra aleatoria X1, X2... Xn de unadistribución que se distribuye normal con mediadesconocida y varianza desconocida 2. Entoncesmediante los conceptos estudiados la mejor

75

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

estadística de prueba se distribuye t de Student.Los juegos de hipótesis de interés práctico son detres tipos:

Juego de hipótesis

a) Ho: = . En oposición a Ha: .

b) Ho: . En oposición a Ha: > .

c) Ho: . En oposición a Ha: < .

donde es una constante elegida por elinvestigador.

La estadística de prueba en cualquiera de los trescasos es:

Con un nivel de significancía , las reglas dedecisión correspondientes a (a), (b) y (c) son,respectivamente:

a) "Rechazar Ho si | Tc| t/2,n-1 “

b) "Rechazar Ho si Tc tn-1”

c) "Rechazar Ho si Tc -tn-”

76

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

El lector deberá notar que el juego de hipótesisempleados son similares a los presentados en lasección 3.3.l., así mismo las regiones críticas(rechazo) son similares aunque mas reducidas por eluso de la distribución t de Student.

3.3.2.1 Ejercicios 3.5. Los salarios diarios en cierta, rama de laindustria en particular presentan una distribuciónnormal con media de $13.20 y una desviación estándarde 2.50. Una compañía X que emplea a 40 trabajadorespaga en promedio $12.20, ¿puede acusarse a estacompañía de pagar sueldos bajos?. Emplear = 0.01.

Respuestas

Juego de hipótesis:

Ho: . En oposición a Ha: <

Estadístico de Prueba

=-2.5298

Regla de desición

Rechazar Ho si Zc< Z0.01=2.325

77

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: Rechazar Ho en favor de Ha. Es decir conun nivel de significancía = 0.01, existesuficiente evidencia muestral para decir que lacompañía X paga salarios inferiores a los de la ramade la industrias a la que pertenece.

3.6. Las casas cercanas a una universidad tienen unvalor medio igual a $58,000. Se supone que aquellasque están situadas en la vecindad de la universidadtienen un valor superior. Se tomo una muestraaleatoria de 12 casas en el área universitaria paracontrastar esta teoría. Su avaluó promedio es de$62,460, siendo su desviación estándar de $5,200.Realice un contraste de hipótesis utilizando =0.01

Respuestas

Juego de hipótesis:

Ho: 58000. En oposición a Ha: > 58000

Estadístico de Prueba

=2.9711

Regla de decisión:Rechazar Ho si Tc> t0.01,11=2.7181

78

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: Rechazar Ho en favor de Ha con un nivelsignificancía de 0.01. Es decir la muestra aportasuficiente evidencia para manifestar que las casascercanas a una universidad tienen un valor mediomayor a $58,000.

3.7. Un grupo de estudiantes sostiene que el alumnopromedio invierte al menos 25 minutos diarios parallegar a la universidad. El departamento deservicios escolares obtuvo una muestra del tiempoempleado (un solo sentido) por 36 estudiantes cuyamedia y desviación estándar fue 22 y 7.3 minutos,respectivamente. ¿ Tiene el departamento evidenciapara rechazar la afirmación de los estudiantes?Utilice = 0.01

Respuestas

Juego de hipótesis:

Ho: 25. En oposición a Ha: <25

Estadístico de Prueba

=-2.4657

Regla de decisión:

79

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Rechazar Ho si tc - t0.01,35=-2.4377

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.01. Es decir existe suficienteevidencia muestral para rechazar la afirmación delos estudiantes.

3.8. En las etiquetas de una marca de lecheevaporada se afirma que esta contiene "no menos de850 U.I. (Unidades internacionales) de vitamina Dpor litro". Se realizan 15 determinaciones delcontenido (por litro) de vitamina D y se obtienenlos siguientes resultados:

836, 849, 872, 861, 839, 826, 856, 8.62, 859, 852,8480' 839, 846, 870, 861

Pruebe la hipótesis del fabricante con = 0.025.

Respuestas

Juego de hipótesis:

Ho: 850. En oposición a Ha: 0

Estadístico de Prueba

80

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

=0.5147

Regla de decisión:Rechazar Ho si Tc<- t0.025,n-1=-2.1448

Conclusión: Con un nivel de significancía = 0.025no existe suficiente evidencia muestral pararechazar Ho, por lo que se concluye que la lecheevaporada contiene al no menos de 850 U.I. devitamina D por litro.

3.9. En una muestra aleatoria de seis varillas deacero se obtuvo una resistencia media a lacomprensión de 58,392 psi (libras por pulgadacuadrada) con una desviación estándar de 648 psi.Emplear esta información y un nivel de significancíade = 0.05 para probar si la media de laresistencia real a la comprensión del acero del cualproviene esta muestra es de 58,000 psi.

Respuestas

Juego de hipótesis:

Ho: = 58000. En oposición a Ha: 58000

81

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Estadístico de Prueba

=1.4818

Regla de decisión:

Rechazar Ho si tc< t0.025,5=2.5706

Conclusión: No existe suficiente evidencia muestralpara rechazar Ho con un nivel de significancía de0.05. Es decir la media, de la resistencia a lacompresión del acero del cual proviene esta muestraes de 58,000 psi.

3.10. Una muestra aleatoria de los archivos de unacompañía que contiene información detallada indicaque las ordenes para cierta pieza de máquina fueronentregados en 10, 12, 19, 14, 15, 18, 11 y 13 días.Usar un nivel de significancía = 0.01 para probar La afirmación que el tiempo medio de entrega es de10.5 días. Elegir la Hipótesis alterna de manera queel rechazo de la hipótesis nula = 10.5 implique quela entrega de las órdenes toma mas tiempo delindicado.

82

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.01. Es decir existe evidenciamuestral que indica un tiempo de entrega mayor de10.5 días

3.11. Cinco mediciones del contenido de alquitrán decierta marca de cigarros producen los siguientesresultados: 14.5, 14.2, 14.4, 14.3 y 14.5 mg porcigarro. Probar que la diferencia entre el promediomuestral y la media del contenido de alquitrán queindica el fabricante = 14.0 es significativa, con = 0.05.

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.05. Es decir existe suficienteevidencia muestral para rechazar la afirmación delfabricante

3.12. Supóngase que en el ejercicio anterior laprimera medición es anotada incorrectamente como16.0 en lugar de 14.5. Verificar si ahora ladiferencia entre la media muestral y el contenido dealquitrán que indica el fabricante = 14.0 no essignificativa con = 0.05. Explicar la aparenteparadoja de que, a pesar de que la diferencia entre y ha aumentado, no hay significancía

estadística.

83

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: No rechazar Ho con un nivel designificancía de 0.05. Es decir no existe suficienteevidencia muestral para rechazar la afirmación delfabricante. Note el incremento desproporcionado dela varianza con respecto al de la media lo que causala aparente paradoja.

84

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.4 Pruebas de hipótesis de proporciones

Ya presentamos el teorema del límite central y semencionó que este teorema es fundamental para lateoría de probabilidades. Una de las aplicacionesmas importante de dicho teorema es la aproximaciónde variables aleatorias discretas cuando n a ladistribución normal. Por otro lado, las pruebas dehipótesis relacionadas con proporciones (porcentajeso probabilidades) se emplean en diversas áreas delconocimiento humano.

3.4.1 Una proporción

Es cierto que existen pruebas apropiadas con baseen la distribución binomial, solo consideramos aquílas pruebas de hipótesis para la proporción deéxitos en un experimento binomial para muestrasgrandes que se basan en la aproximación a ladistribución normal. La proporción o porcentajejuega un papel destacado en el control de calidad yen las encuestas de opinión, entre otrasaplicaciones del tema.

Estaremos interesados en probar Ho: p = po, donde pes parámetro de la distribución binomial, entonceslos juegos de hipótesis de interés practico serán:

a) Ho: p = po vs Ha p po

b) Ho: p = po vs Ha p > po

c) Ho: p = po vs Ha p < po

85

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

donde po es una constante elegida por el investigador La estadística de prueba en cualquiera de los trescasos es

Con un nivel de significancía a, las reglas dedecisión correspondientes a (a), (b) y (c) son,respectivamente:

a)Rechazar Ho si |Zc| |Z

b)Rechazar Ho si Zc Z

c)Rechazar Ho si Zc Z

3.4.2. Diferencia de proporciones.

Las pruebas de diferencia de proporciones serealizan en general cuando queremos comparar dosmuestras cuyo parámetro de interés es la proporción.Deseamos entonces conocer si pertenecen a la mismapoblación o corroborar si la diferencia entre estasexcede cierto porcentaje. Por ejemplo, podríamos

86

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

verificar que la proporción de alumnos que apruebancierta materia con el profesor A es igual a laproporción de alumnos aprobados en esa misma materiapor el profesor B. Es posible que un alumnodetermine emplear cierto habito de estudio solo sicomprueba que la proporción de alumnos aprobados esmayor que aquellos que no la usan.

El procedimiento de pruebas de hipótesis se puedeextender para varias proporciones. No obstantesolamente se incluirá el material referente a dospoblaciones, los lectores interesados en ampliar susconocimientos pueden consultar (Joliiisovi, 1 989).En el caso de la prueba para dos proporciones esposible probar diversos juegos de hipótesis deinterés práctico, los cuales son de tres tipos:

a) Ho: p1 - p2 = pc vs Ha p1 - p2 pc

b) Ho: p1 - p2 = pc vs Ha p1 - p2 > pc

c) Ho: p1 - p2 = pc vs Ha p1 - p2 < pc

donde p1 y p2 son las proporciones poblacionales parala muestra 1 y 2 respectivamente y la pc es ladiferencia que probamos entre ambas proporciones. Esnecesario destaca que pc = 0 si esperamos detectarcualquier diferencia y p2 0 cuando es necesarioencontrar una diferencia de proporciones enespecial.

La estadística de prueba en cualquiera de los trescasos es:

87

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Con un nivel de significancía las reglas dedecisión correspondientes a (a), (b) y (c) sonrespectivamente:

a)Rechazar Ho si |Zc| Z1-

b)Rechazar Ho si Zc Z

c)Rechazar Ho si Zc Z

88

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.4.2.1 Ejercicios

3.13. Un fabricante de bombas de pozo profundoasegura que a lo sumo el 30 % de sus bombasrequieren reparación en los primeros 5 años deoperación. Si una muestra aleatoria de 120 bombasincluye 47 que requieren reparación en los primeros5 años se puede afirmar que esto contradice laafirmación del fabricante. Use = 0.05.

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.05. Es decir existe evidenciamuestral para contradecir la proporción (30%) de lasbombas que requieren reparación los primeros 5 añosde operación.

3.14. La experiencia de un comerciante en aparatos yaccesorios mostró que 10% de sus clientes quecompran a plazos liquidan sus cuentas antes delvencimiento de la última mensualidad (la vigésimocuarta). Al sospechar un incremento en esteporcentaje el comerciante selecciona al azar 200compradores a crédito para saber sus intenciones,treinta y tres ellos afirmaron tener planeado pagaradeudos antes de la última mensualidad. ¿Son losdatos suficientes para indicar que el porcentaje decompradores a plazos que pagarán sus deudas antes dela última mensualidad, excede de 10%? . Usar unnivel de significancía = 0.05.

89

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.05. Es decir la muestra aportaevidencia suficiente para indicar que el porcentajede compradores a plazos que pagaran sus deudas antesde la última mensualidad, excede el 10%.

3.15. El rendimiento de una computadora se observaen un periodo de dos años para verificar laafirmación de que la probabilidad del tiempo perdidopor fallas exceda a 5 horas en una semana cualquieraes de 0.2. ¿ Qué se puede concluir con un nivel designificancía =0.05, si hubo solo 11 semanas enlas cuales el tiempo perdido de la computadoraexcedió las 5 horas?. (Recuerde que un año tiene 52semanas).

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de 0.05. Es decir existe suficienteevidencia muestral para refutar la afirmación delproductor acerca del tiempo perdido por fallas enuna semana.

3.16. Un fabricante modificó una línea de producciónpara reducir el promedio de la fracción dedefectuosos. Para determinar si la modificación fueefectiva, el fabricante sacó una muestra aleatoriade 400 artículos antes de la modificación de lalínea de producción y otra muestra aleatoria de 400

90

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

artículos después de tal cambio. Los porcentajes dedefectuosas en las muestras eran

Antes Después

5.25%

3.5%

Pruebe la Hipótesis de que la modificación disminuyela proporción de artículos defectuosos con un nivelde significancía = 0.05.

Conclusión: No rechazar Ho con un nivel designificancía = 0.01. Es decir no existe evidenciamuestral para afirmar que la modificación reducesignificativamente el número de artículosdefectuosos.

3.17. Un genetista esta interesado en la proporciónde machos y hembras de una población que tienecierta enfermedad menor en la sangre. En una muestraaleatoria de 100 machos se encuentran 31 afectadosmientras que solamente 24 de 100 hembras presentanla enfermedad. Se puede concluir, con un nivel designificancía de = 0.01, que la proporción demachos afectados por esta enfermedad de la sangre esmayor que la proporción de hembras tambiénafectadas? (Walpole V Myers, 1989)

91

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: No rechazar Ho con un nivel designificancía = 0.01. Es decir existe evidenciamuestral para afirmar que la enfermedad afecta porigual a ambos sexos.

3.18. Dos empresas que fabrican artículosequivalentes afirman tener la misma proporción depreferencia hacia sus productos entre losconsumidores. Una muestra aleatoria indica que 102de 300 y 152 do 400 consumidores prefrieren losproductos A V B respectivamente. ¿Indica estaevidencia una diferencia significativa entre lasproporciones?. Utilizar = 0.02.

Conclusión: No rechazar Ho con un nivel designificancía =0.02. Es decir no existe evidenciamuestral que sugiera que el consumidor prefiere unproducto en especial.

3.5 Pruebas de hipótesis para diferencia de dosmedias

La prueba de hipótesis para la diferencia de dosmedias es quizás una de las pruebas más empleadas.Con frecuencia estamos interesados era probar si dosmuestras tienen igual promedio o si alguna de ellases mayor que otra. Se han proporcionado ya las

92

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

distribuciones muestrales para la diferencia demedias cuando se conoce o se desconoce la varianzapoblacional (2). Las pruebas que se presentan eneste apartado suponen que ambas muestras sonaleatorias e independientes y las poblaciones de lascuales provienen se distribuyen normales. Lospruebas de dos medias para muestras apareadas odependientes van mas haya del objetivo de estecurso.

3.5.1. Prueba de hipótesis para la diferencia demedias con varianzas conocidas

Sean X1, X1 .. .... Xn, y Y1, Y2, ..., Yn, muestrasaleatorias que se obtienen de dos distribucionesnormales independientes con media x y y y varianzas

x y 2y respectivamente. Entonces por los conceptos

aprendidos sabemos que es factible establecer unaestadística mediante la cual se pueden probar lasHipótesis que a continuación se presentan.

a) Ho: x - y = d vs Ha x - y d

b) Ho: x - y = d vs Ha x - y >d

c) Ho: x - y = d vs Ha x - y <d

donde d es una constante positiva mayor o igual quecero y que representa la diferencia que se deseaprobar entre los valores desconocidos de las mediaspoblacionales.

El estadístico de prueba correspondiente a estasHipótesis será dado por

93

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Con un nivel de significancía , las reglas dedecisión correspondientes a (a), (b) y (c) son,respectivamente:

a)Rechazar Ho si |Zc| Z

b)Rechazar Ho si Zc Z

c)Rechazar Ho si Zc Z

3.5.2. Prueba de hipótesis para la diferencia demedias con varianzas desconocidas

Se ha mencionado anteriormente que en situacionesreales es poco común tener conocimiento del valor dela varianza poblacional. Ya encontramos unestadístico para la diferencia de medias convarianzas iguales pero desconocidas. Es necesariodecir que la prueba es sensible a situaciones en lascuales no se cumplen los supuestos principalmente alde varianza iguales lo cual nos lleva a inferenciasequivocadas, por otra parte el supuesto denormalidad no afecta esta prueba cuando el tamaño dela muestra es mayor de 15.

94

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Las hipótesis de interés se presentan a continuaciónen el formato acostumbrado:

a) Ho: x - y = d vs Ha x - y d

b) Ho: x - y = d vs Ha x - y >d

c) Ho: x - y = d vs Ha x - y <d

donde d es una constante positiva mayor o igual quecero y que representa la diferencia que se deseaprobar entre los valores desconocidos de las mediaspoblacionales.

El estadístico de prueba correspondiente a estashipótesis será dado por

donde Sp2 =

Con un nivel de significancía a las reglas dedecisión correspondientes a (a), (b) y (c) son,respectivamente.

a)Rechazar Ho si |Tc| tn+m-2

b)Rechazar Ho si Tc t,n+m-2

95

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

c) Rechazar Ho si Tc -tn+m-2

3.5.2.1 Ejercicios

3.19. Supóngase que deseamos investigar si enpromedio el sueldo del hombre excede en más de $ 20por semana al de la mujer en cierta industria. Silos datos revelan que 60 hombres ganan en promedio$292.50 a la semana con una desviación estándar de $1 5.60, mientras que 60 mujeres perciben en promedio$ 266.10 por semana con una desviación estándar de$18.20. ¿Qué puede concluirse con un nivel designificancía de 0.017

Conclusión: No rechazar Ho con un nivel designificancía = 0.01. Es decir no existesuficiente evidencia muestral para decir que elpromedio del sueldo para hombres excede en mas de $20 por semana al de la mujer en cierta industria.

3.20. Un fabricante de motores eléctricos comparó laproductividad de trabajadores de ensamblaje para dostipos de horarios semanales de trabajo de 40 horas.Uno cuatro días de 10 horas (horaria 1) y cl horarioestándar de 5 días de 8 horas (horario 2). Seasignaron 20 trabajadores a cada horario de trabajoy se registro el número de unidades armadas duranteuna semana las medias (en cientos de unidades) y lasvarianzas muestrales se indican a continuación

96

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Estadística Horario1 2

MediaMuestral

43.10 44.60

Varianzamuestral

4.28 3.89

¿Proporcionan los datos evidencia suficiente paraindicar una diferencia en la productividad mediapara los dos horarios de trabajo?. Haga la pruebacon un nivel de significancía = 0.05.

Conclusión: Rechazar Ho en favor Ha con un nivel designificancía = 0.05. Es decir la evidenciamuestral indica una diferencia de productividadentre horarios.

3.21 Se aplicó un examen relacionado con losaspectos fundamentales del sida a dos grupos uno deestudiantes universitarios de licenciatura y el otrode egresados del bachillerato. A continuación sepresenta un resumen de los resultados de el examen.

Graduados n media

Desviaciónestándar

Universit 75 77.5 6.2

97

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

ariosBachiller

es75 60.4 7.4

¿Indican estos datos que los graduados deuniversidad tuvieron en promedio un resultadosignificativamente mayor de 13 puntos en el examen?.Utilizar = 0.001.

Conclusión: Rechazar Ho en favor Ha con un nivel designificancía = 0.001. Es decir existe suficienteevidencia muestral para decir que los estudiantesuniversitarios tienen un puntaje, trece puntossignificativamente superior que los estudiantes debachillerato en aspectos relacionados con el sida.

3.22. Con el fin de reducir los costos en laalimentación de cerdos, se genero una dieta coningredientes no convencionales y de bajo costo. Parael experimento se contó con 24 cerdos de la mismaraza, edad y peso inicial similar. Doce cerdosfueron alimentados con la dieta no convencional yotros doce con un alimento comercial. Se midió laganancia de peso al final del experimento, losresultados obtenidos se presentan a continuación.

Dieta Media

DesviaciónEstándar

Comercial 49.2 3.9No 40.0 2.5

98

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

convencional

Probar la hipótesis de que ambas dietas producenigual ganancia de peso. Utilizar un nivel designificancía de = 0.001.

Conclusión: No rechazar Ho con un nivel designificancía = 0.001. Es decir existe suficienteevidencia muestral para decir que ambas dietasproducen la misma ganancia de peso.

3.23. Dos grupos de 10 ratones de laboratorio fueronalimentados con una dieta preestablecida. AIfinalizar tres semanas se registró el peso ganadopor cada animal. ¿Justifican los datos de la tablasiguiente la conclusión de que el peso medio ganadocon la dieta B fue mayor que con la dieta A, alnivel de significación = 0.05?

Dieta A

5 14 7 9 11 13 14 12 8 7

Dieta B

5 21 4 9 16 23 16 13 19 21

99

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Conclusión: Rechazar Ho en favor Ha con un nivel designificancía = 0.05. ES decir existe suficienteevidencia muestral para decir que el peso medioganado con la dieta B fue mayor que el de la dietaA.

3.24. Se ha desarrollado una nueva cura para cementoPórtland. Se efectúan ensayos para determinar si lanueva cura tiene un efecto (positivo o negativo) enla resistencia. Se ha producido un lote sometido aambas curas, la estándar y la experimental. Lasresistencias a la compresión (psi) son lassiguientes

CuraestándarX

4.125

4.225

4.35

3.575

3.875

3.825

3.975

3.80

3.775

3.850

Curaexperimental Y

4.25 3.95 3.9 4.075

4.55 4.45 4.15 4.55

3.70 4.25

Pruebe el efecto en la resistencia del cambio decura a un nivel de significancía de = 0.05.

Conclusión: Rechazar Ho en favor Ha con un nivel designificancía = 0.05. Es decir existe suficienteevidencia muestral para decir que la nueva curatiene efecto (positivo o negativo) en la resistenciadel cemento.

100

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.6 Pruebas de hipótesis sobre la varianza de unadistribución normal

Las secciones anteriores de este capitulo trataroncon el problema de pruebas de media de unadistribución normal o con la aproximación de unadistribución discreta a una distribución normal. Sinembargo con frecuencia surgen problemas querequieren) inferencias acerca de la variabilidad.Por ejemplo considere la variabilidad de lascalificaciones otorgadas por cierto profesor endeterminado examen. Se esperaría que laspuntuaciones tuvieran una varianza pequeña y queademás su media fuera mayor o igual al promediomínimo aprobatorio.

Esta sección se refiere a la prueba de hipótesisrelacionadas con las varianza o desviación estándarpoblacional. En otras palabras, interesa la pruebade hipótesis relacionada con la uniformidad de unapoblación. Se parte bajo el supuesto de la muestraproviene de una población que se distribuye normal.

Sea X1, X2, ..., Xn, una muestra aleatoria de unapoblación que se distribuye normal con media yvarianza 2 desconocida. Las Hipótesis de interésson:

a) Ho: = . En oposición a Ha:

.

101

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

b) Ho: < . En oposición a Ha: >

.

c) Ho: > . En oposición a Ha: <

. donde 2

o, es el valor propuesto de 2 . Laestadística para probar estas hipótesis se basan enla varianza muestral S 2.

Entonces la estadística de prueba que permite fijarel nivel de significancía deseado es

Entonces bajo la hipótesis nula. Las reglas dedecisión son:

En la figura 3.6.1. se ilustra gráficamente lasregiones de rechazo para cada tipo de hipótesis.. ..

102

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Figura 3.6.1 a. Región de rechazo para una prueba de hipótesis bilateralpara 2

REGION DE RECHAZOFigura 3.6.1.b. Región de rechazo de cola derecha para una prueba de

hipótesis para 2

103

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Figura 3.6.1.c. Región de rechazo de cola izquierda para una prueba deHipótesis para 2

104

0Región de rechazo

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

3.6.1 Ejercicios

3.25. Datos de archivo indican que la varianza delas mediciones efectuadas sobre lámina metálicagrabada, las cuales fueron obtenidas por inspectoresexpertos en control de calidad es de 0.18 pulgadascuadradas. Las mediciones realizadas por uninspector sin experiencia podrían tener una varianzamayor (debido quizás a su poca destreza para leerlos instrumentos) o también una varianza rnuypequeña (quizás porque las mediciones excesivamentealtas o bajas se han descartado). Si un nuevoinspector mide 101 laminas grabadas con una varianzade 0.13 pulgadas cuadradas, pruébese con un nivelde significancía de 0.05 si el inspector realizamediciones satisfactorias.

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía = 0.05. Es decir existe evidenciamuestral suficiente para indicar que el nuevoinspector no toma satisfactoriamente sus mediciones.

3.26. El gerente de una planta sospecha que elnúmero de piezas que produce un trabajador enparticular por día, fluctúa más allá del valornormal esperado. El gerente decide observar elnúmero de piezas que produce este trabajador durante10 días, seleccionados estos al azar. Los resultadosson 15, 12, 8, 13, 12, 15, 16, 9, 8 y 14. Si se sabeque la desviación estándar para todos los

105

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

trabajadores es de 2 unidades y si el numero deestas que se produce diariamente se encuentramodelada en forma adecuada por una distribuciónnormal, aun nivel de = 0.05, ¿ Tiene apoyo lasospecha del gerente?

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía = 0.05. Es decir existe evidenciamuestral para avalar la sospecha del gerente.

3.27. En un proceso de llenado, la tolerancia parael peso de los recipientes es 8 gramos para reunireste requisito la desviación estándar en el pesopuede ser de 2 gramos. Los pesos de 25 recipientesseleccionados al azar dieron como resultado unadesviación estándar de 2.8 gramos. Si los pesos sedistribuyen normales, determinar si la varianza deestos es diferente del valor necesario. Emplear =0.01

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía = 0.01. Es decir la evidenciamuestral indica que el proceso no tiene latolerancia requerida.

3.28. Un fabricante de maquinas empacadoras de jabónen polvo afirma, que su producto podría llenar lascajas con un peso dado con una amplitud de no mas

106

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

2/5 de onza. La media y la varianza da una muestrade 8 cajas de 3 onzas resultaron ser iguales a 3.1 y0.01 8 onzas, respectivamente. Pruebe la hipótesisde que la varianza de la población de mediciones delpeso es 2 = 0.01 contra la alternativa de 2> 0.01.Emplear un nivel de significancía = 0.05. Conclusión: No rechazar Ho con un nivel designificancía = 0.05. Es decir la muestra noproporciona evidencia suficiente para decir que 2 >0.01.

3.29. Un agricultor labra todo su terreno en lamisma época con un solo cultivo. En consecuencia,desea sembrar una variedad de fríjol cuya maduraciónsea uniforme (que sea pequeña la desviación estándarentre los momeritos de madurez de las plantas). Unaproductora de semillas ha desarrollado un nuevohíbrido que considera idóneo para el agricultor. Eltiempo de maduración de la variedad estándar tieneuna media igual a 50 días con una desviaciónestándar de 2.1 días. Una muestra aleatoria de 30plantas del nuevo híbrido señala una desviaciónestándar de 1.65 días. ¿Indica esta muestra unadisminución significativa de la desviación estándaral nivel de significancía = 0.05?.

Conclusión: No rechazar Ho con un nivelsignificancía de = 0.05. Es decir la muestra de lanueva variedad no proporciona evidencia

107

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

significativa de tener una desviación estándar menorde 2.1.

3.30. Un grupo de ecologistas manifiesta que latemperatura durante el verano en cierta región esmás variable actualmente como consecuencia de lacontaminación. Si la temperatura máxima histórica(20 años) es de 34° con una desviación estándar de4°. Se tomó una muestra de tamaño 21 de lastemperaturas máximas obtenidas durante los últimos 3años en dicha región y se obtuvo una desviaciónestándar de 7.5°. Probar la hipótesis de losecologistas con un nivel de significancía de 0.05

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía de = 0.001. Es decir existeevidencia muestral para validar un incremento en lavariabilidad de la temperatura.

3.7 Pruebas de hipótesis para una razón de varianzas

Se discute el procedimiento para comparar lasvarianzas de dos poblaciones normales. Note que laprueba de hipótesis para la razón de dos varianzasdepende fuertemente del supuesto de que laspoblaciones muestreadas son normales es decir que lasinferencias no son robustas con respecto a lossupuestos distribucionales. La estructura de los

108

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

datos necesarios para la comparación se presentaenseguida:

a)X1..., Xn es una muestra aleatoria de N(x,2x)

b)Y1,...,Yn es una muestra aleatoria de N(y,2y)

c)Las dos muestras son independientes

La distribución F permite probar la hipótesis sobrela razón de dos varianzas, cuyas hipótesis deinterés son

a) Ho: x = y. En oposición a Ha: x y.

b) Ho: x = y. En oposición a Ha: x > y.

c) Ho: x = y. En oposición a Ha: x < y.

El lector debe notar que la hipótesis alternativa ena) equivale a decir que las dos varianzas sondiferentes, mientras que en b) y en c) se expresa queuna variable es mayor que otra. La estadística deprueba F será Fc y se considera que bajo la hipótesisnula 2x = 2y, entonces

109

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Por lo cual una prueba de tamaño a para los juegosde hipótesis propuestos anteriormente puedenefectuarse mediante la estadística Fc, con lassiguientes reglas de decisión

a)Rechazar Ho si Fc Fn-1,m-1,/2 o si Fc 1/ Fm-

1,n-1,/2

b) Rechazar Ho si Fc Fn-1,m-1,

c) Rechazar Ho si Fc 1/ Fm-1,n-1,

La elección de que la población es X y cual es Y, sedetermina por el tamaño de las varianzas muestrales.El denominador o población Y deberá ser aquellapoblación con varianza mayor o igual que la delnumerador, con lo cual conseguimos que Fc sea mayor oigual que uno. Esto nos lleva a que el juego dehipótesis se reduce a las hipótesis.

a) Ho: x = y. En oposición a Ha: x y.

b) Ho: x = y. En oposición a Ha: x > y.

Con estadístico de prueba dado por

110

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Por lo cual una prueba de tamaño a para los juegosde hipótesis anteriores puede efectuarse mediante laestadística Fc, con las siguientes reglas de decisión

a)Rechazar Ho si Fc Fn-1,m-1,/2

b) Rechazar Ho si Fc Fn-1,m-1,

3.7.1 Ejercicios

3.31. Un director de personal que proyectabautilizar una prueba t de student para comparar elpromedio del número de inasistencias mensuales parados categorías de empleados se encontró con unaposible dificultad. La variación en el número detales inasistencias parecía ser diferente para losdos grupos. Para verificar esto, seleccionóaleatoriamente 5 meses y contó el número de faltasde asistencia para cada grupo. Los datos se muestranen la siguiente tabla.

Categoría A

20 14 19 22 25

Categoría B

37 29 51 40 26

111

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

a) ¿Cuál fue la suposición necesaria para poderusar la prueba t que preocupa al director depersonal?

Los datos provienen de poblaciones que sedistribuyen normales con varianzas poblacionalesdesconocidas pero iguales. En este problemaaparentemente las varianzas no son iguales.

b) Proporcionan los datos evidencia suficientepara indicar que las varianzas difieren para laspoblaciones de las inasistencias para las doscategorías de empleados?. Emplear = 0.10 einterpretar los resultados. Conclusión: No rechazar Ho con un nivel designificancía = 0.10. Es decir no existe evidenciamuestral, para decir que las varianzas poblacionalesde las dos muestras son diferentes, por lo tanto esposible que efectuar la prueba t proyectada por eldirector de personal.

3.32. La cantidad de cera superficial en cada ladode bolsas de papel encerado es una variablealeatoria. Hay razones para sospechar que hay unamayor variación en la cantidad de cera en elinterior de la bolsa que era el exterior. Se haobtenido una muestra de 61 observaciones de lacantidad de cera de cada lado de estas bolsas conlos siguientes resultados.

112

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

Cera en libras por unidad de área muestreadaEstadísticas Superficie

exteriorSuperficieinterior

Media 0.9480 0.6520Varianza 0.3189 0.7043

Conduzca una prueba para determinar si lavariabilidad de la cantidad de cera de la superficieinterior es mayor que la contenida en la superficieexterior, Usar un nivel de significancía = 0.01...

Conclusión: Rechazar Ho en favor de Ha con un nivelde significancía = 0.01. ES decir existe suficienteevidencia muestral, para indicar que la superficieinterior de las bolsas contiene más cera que laexterior.

3.33. Una panadería está considerando la compra deuno de dos hornos. Se requiere que la temperaturapermanezca constante durante la operación dehorneado. Se hizo un estudio para medir la varianzaen temperatura de los dos hornos en funcionamiento.Antes de que el termostato restableciera la flama,la varianza en la temperatura del horno A fue iguala 2.4, resultante de 16 mediciones. La varianza delhorno B fue de 3.2 resultante de 12 mediciones.¿ Proporciona esta información suficiente evidencia

113

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

para concluir que existe una diferencia entre lasvarianzas para los dos hornos?. Utilizar un nivel designificancía de =0.02.

Conclusión: No rechazar Ho con un nivel designificancía = 0.02. Es decir no existesuficiente evidencia muestral, para concluir que haydiferencia entre las varianzas para los dos hornos.

3.34. Se realizó un estudio para decidir si hay ono la misma variabilidad en la presión sanguíneasistólica entre hombres y mujeres. Se utilizaronmuestras aleatorias de 16 hombres y 13 mujeres paracontrastar la afirmación de los investigadores enel sentido de que las varianzas eran diferentes.Realice el contraste de hipótesis, con = 0.05,utilizando los datos siguientes:

Hombres

120 120 118 112 120 114 130 114 124 125 130100 120 108 112 122

Mujeres

122 102 118 126 108 130 104 116 102 122 120118 130

Conclusión: No rechazar Ho con un nivel designificancía = 0.05. La muestra no aportaevidencia para decir que la variabilidad de la

114

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

presión sanguínea sistólica depende del individuo.1

3.35. En un experimento acerca de la contaminacióndel aire, se comparan dos tipos de instrumentos paramedir fa cantidad de monóxido de sulfuro en laatmósfera. Se desea determinar si los dos tipos deinstrumentos producen mediciones que tienen la mismavariabilidad variabilidad. Se registraron lassiguientes lecturas para los dos instrumentos.

Monóxido de sulfuroInstrumento A Instrumen

to B0.860.820.750.610.890.640.810.680.65

0.870.740.630.550.760.700.690.570.53

Media 0.7455

0.673111

Desviaciónestándar

0.10405

0.11174

Suponiendo que las distribuciones de las poblacionesestán distribuidas aproximadamente en forma normal,

115

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

probar la hipótesis planteada con un nivel designificancía de =0.02.

Conclusión: No rechazar Ho con un nivel designificancía = 0.02. Es decir no existesuficiente evidencia muestral que manifiestediferencias en la variabilidad de los instrumentos.

3.36. El Instituto del consumidor desea comparar lavariabilidad en la eficacia de un medicamentoelaborado por las compañías X e Y. Ambosmedicamentos se distribuyen en forma de tabletas de250 mg. Se determinó la eficacia en 25 tabletas encada compañía encontrándose S2

1 = 2.09 y S22 =1.06.

Realizar una prueba para contrastar la variabilidadde ambos medicamentos con =0.10.

Conclusión: Rechazar Ho a favor de Ha con un nivel designificancía =0.10. Es decir la muestraproporciona evidencia sobre la diferencia en lavariabilidad de ambos productos.

116

FACULTAD DE CONTADURÍA Y ADMINISTRACIÓNESTADÍSTICAS II

UNIVERSIDAD DE SOTAVENTO, A.C

BIBLIOGRAFÍA

MENDENHALL W. INTRODUCCIÓN A LA PROBABILIDAD YLA ESTADÍSTICA. MÉXICO: EDITORIALIBEROAMERICANA. 1982. AAAA

STEVENSON, W. ESTADÍSTICA PARA ADMINISTRACIÓN YECONOMIA. MÉXICO: HARLA. 1981.

H. T. HAYSLETT, JR. ESTADISTICA SIMPLIFICADA.MEXICO: EDICIONES MINERVA.1980.

MURRAY R. SPIEGEL. PROBABILIDAD YESTADISTICAMEXICO: MC GRAW HILL.1980.

PACHECO JOSE E. MANUAL DE ESTADISTICA YPROBABILIDAD. MÉXICO: UV.1998.

117