UNIVERSIDADE DO OESTE DE SANTA CATARINA -UNOESC JOAÇABA

83
UNIVERSIDADE DO OESTE DE SANTA CATARINA - UNOESC JOAÇABA APOSTILA BÁSICA ESTATÍSTICA JOAÇABA, fevereiro - 2015

Transcript of UNIVERSIDADE DO OESTE DE SANTA CATARINA -UNOESC JOAÇABA

UNIVERSIDADE DO OESTE DE SANTA CATARINA - UNOESC

JOAÇABA

APOSTILA BÁSICA

ESTATÍSTICA

JOAÇABA, fevereiro - 2015

2

O material apostilado deste curso é para uso exclusivamente didático, sem intenção comercial. Nenhuma parte desta publicação pode ser reproduzida ou transmitida, sob qualquer forma – fotocópia, gravação – ou por qualquer meio – eletrônico, mecânico – sem a permissão da UNOESC - Joaçaba e do autor/organizador do material.

Disciplina: ESTATÍSTICA e PROBABILIDADE COMPUTACIONAL

Adaptação para Curso de Engenharia Professor FABIANO PASQUAL D´AGOSTINI

[email protected]

3

A ESTATÍSTICA NA ENGENHARIA

Logo após a revolução Industrial, métodos estatísticos foram incorporados

nos processos industriais para garantir a qualidade dos produtos. Amostras de itens

produzidos eram avaliadas sistematicamente para inferir se o processo estava sob

controle. Mais recentemente, a avaliação da qualidade passou a ser feita ao longo

de todo o processo produtivo como forma de corrigir eventuais falhas no sistema

assim que elas aparecessem. Isso levou a um aumento da qualidade do produto

final a redução de curtos, pois se reduziram drasticamente as perdas por defeitos.

Além do acompanhamento estatístico da qualidade, as indústrias costumam

fazer experimentos estatisticamente planejados para encontrar a combinação dos

níveis dos fatores do processo que levem a melhor qualidade possível. Na outra

ponta, as empresas levantam dados de amostras de consumidores para realizar

pesquisas de marketing direcionadas ou para adequar os produtos aos clientes. O

planejamento dessas amostras e a análise dos dados necessitam de técnicas

estatísticas.

Muitas vezes, a relação entre estatística e engenharia é ainda mais estreita.

Os próprios métodos de engenharia costumam incorporar intrinsecamente

procedimentos probabilísticos ou estatísticos. Assim, para que um aluno possa

entender certos métodos de engenharia, é necessário que tenha conhecimento de

probabilidade e estatística.

BARBETTA, Pedro Alberto, São Paulo: Atlas, 2004.

4

DEFINIÇÕES Estatística é ciência quando estuda populações; é método quando serve de

instrumento a uma outra ciência. É também arte, ciência-método e método-ciência, segundo vários tratadistas, daí advindo uma variedade de definições. Eis algumas:

“Conjunto dos processos que têm por objeto a observação, a classificação

formal e a análise dos fenômenos coletivos ou de massa, e por fim a indução das leis a que tais fenômenos obedecem globalmente” ( Milton da Silva Rodrigues).

“Apresentação numérica, tabular ou gráfica dos resultados da observação

dos fenômenos de massa.” “A estatística é a parte da matemática aplicada que se ocupa em obter

conclusões a partir de dados observados” (Ruy Aguiar da Silva Leme). Parte da Matemática que organiza e apresenta informações numéricas, além

de obter conclusões a partir dessas informações. “É observação metódica, e tão universal quanto possível, dos fatos

considerados em globo, reduzidos a grupos homogêneos e interpretados mediante a indução matemática” (Ferraris).

“Dados quantitativos sujeitos em larga escala à influência de uma

multiplicidade de causas” (Yule e Kendall). “Conjunto do que é realmente notável em um Estado ou a descrição da

situação atual de um Estado” (Achenwall). “O método que tem por objeto o estudo quantitativo dos dados ou fatos que

se apresentam em massa e a pesquisa de suas relações” (Authus Pagano). “É um ramo de matemática aplicada e pode ser considerada como a

Matemática aplicada a dados observados” (R.A. Fischer). “A Estatística não é senão a História em repouso; a História não é senão a

Estatística em movimento” (Schlozer). “Em uma palavra, se a Economia sabe indicar como produzir, a Estatística

pode dizer quanto produzir. Aquela ensina a movimentar a máquina econômica das nações, esta regula a velocidade conveniente.”

“A Estatística é coleta, apresentação, análise e interpretação de dados

numéricos” (Croxton e Cowden). “Deve-se considerar a Estatística, de um lado como método aplicado em

todos os domínios das ciências concretas particulares onde se encontram fenômenos coletivamente típicos, e, de outro lado, como ciência concreta de caráter

5

geral que estuda os fenômenos coletivamente típicos como tais, independentemente do domínio particular a que pertencem” (Giorgio Mortara).

Algumas frases célebres têm sido arquivadas pelos estatísticos, entre as

quais: “Estatística é o orçamento das coisas e sem orçamento não há salvação”

(Napoleão). “Sem adequado conhecimento de Estatística, o investigador das Ciências

Sociais sente-se, freqüentemente, como um cego, tateando num quarto escuro, à procura de um gato preto que lá não está” (Croxton e Cowden).

“Faça o Brasil a Estatística que deve ter e a Estatística fará o Brasil como

deve ser” (Teixeira de Freitas).

CONCEITOS PRELIMINARES O QUE É ESTATÍSTICA?

Vários autores têm procurado definir a Estatística, porém a que vamos seguir

é a enunciada por DUGÉ DE BERNONVILLE, e que julgamos ser simples e fácil de ser memorizada:

“Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos”.

POPULAÇÃO E AMOSTRA

Conforme ficou claro na definição, a Estatística tem por objetivo o estudo dos fenômenos coletivos e das relações que existem entre eles. Entende-se como fenômeno coletivo aquele que se refere à POPULAÇÃO, ou universo, que compreende um grande número de elementos, sejam coisas ou pessoas. Portanto, para a Estatística só interessam fatos que englobem um grande número de elementos.

A POPULAÇÃO pode ser, segundo seu tamanho, finita ou infinita, porém, na

prática nunca encontraremos populações com infinitos elementos, (populações com grande número de componentes), populações muito grandes são estudadas por amostragem.

AMOSTRA: é uma parte representativa de todo ou do universo; ou, em outros

termos, “é o grupo de elementos selecionados com a intenção de descobrir algo a respeito da população de que fazem parte”. Todo subconjunto não vazio e menor do que a população constitui uma amostra dessa população.

6

POR QUE ESTUDAR ESTATÍSTICA? Não seria fora de propósito o estudante perguntar “por que devo estudar Estatística?”. Certamente isso exigirá um esforço da parte do mesmo, que desejará saber o benefício que daí lhe advirá. Por ora, vamos sugerir algumas respostas: 1. O raciocínio estatístico é largamente utilizado no governo e na administração;

assim, é possível que, no futuro, um empregador venha a contratar ou promover um funcionário por causa de seu conhecimento de Estatística.

2. Os administradores necessitam do conhecimento da Estatística para bem tomar

sua decisões e para evitar serem iludidos por certas apresentações viciosas. 3. Cursos subseqüentes utilizam a análise Estatística. 4. A maioria das revistas profissionais e outras contém referências freqüentes a

estudos estatísticos. 5. A imprensa, tanto quanto muitas experiências cotidianas, oferece amplas

oportunidades para a interpretação Estatística.

RAMOS PRINCIPAIS DA ESTATÍSTICA

Teoria das probabilidades, Estatística Descritiva ou Dedutiva e Estatística Indutiva ou Inferência Estatística.

TEORIA DAS PROBABILIDADES

A teoria das probabilidades proporciona uma base racional para lidar com situações influenciadas por fatores relacionados com o acaso.

ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INDUTIVA

ESTATÍSTICA DESCRITIVA OU DEDUTIVA: É aquela que tem por objeto

descrever e analisar determinada população, sem pretender tirar conclusões de caráter mais genérico (geral – que tem caráter de generalidade).

ESTATÍSTICA INDUTIVA OU INFERÊNCIA ESTATÍSTICA: É a parte da

Estatística que, baseando-se em resultados obtidos da análise de uma amostra da população procura inferir (deduzir por meio de raciocínio; tirar por conclusão), induzir (persuadir, instigar) ou estimar as leis de comportamento da população da qual a amostra foi retirada. Através da ESTATÍSTICA INDUTIVA podemos aceitar ou rejeitar hipóteses.

7

METODOLOGIA DA PESQUISA

DEFINIÇÃO DOS OBJETIVOS: Definir com exatidão o objetivo: • Da pesquisa; • Setores geográficos; • Grau de precisão; • Tipo de amostragem; • Amplitude de tamanho; • Tempo e custo previsto. OBJETIVOS MAIS COMUNS DE UMA PESQUISA: • Dados pessoais � grau de instrução, religião, dados econômicos, etc.; • Dados sobre vizinhança � relações familiares, habitat, como vivem os vizinhos

do indivíduo, etc.; • Dados sobre comportamento � ex.: comportamento dos operários diante da

mudança de local do refeitório; • Níveis de informação � aspirações, esperanças e angústias em relação a

determinado assunto; • Atitudes e modificações que motivam para ação � representa a causa dos

comportamentos. PREPARAÇÃO DO PLANO “Máximo de informações com o mínimo de custo e tempo”. FORMA DE COLETA • Observação Direta � através de uma pessoa, câmera de TV ou cinema. • Entrevista � é o método mais eficiente, porém mais caro. • Auto-entrevista � sem entrevistador, custo baixo feito pelo correio ou mala-

direta. De 10% a 20% são devolvidos. QUESTIONÁRIO Na entrevista e na auto-entrevista, o acessório principal é o questionário, se mal formulado resultará em dados inaproveitados.

8

UM BOM QUESTIONÁRIO DEVE SER: • Completo: conter todas as informações que pretendemos obter; • Concreto: formulação das perguntas dever ser clara e objetiva; • Secreto: sem identificação; • Discreto: evitar perguntas que possam ferir a suscetibilidade do

pesquisado.

9

ARREDONDAMENTO DE NÚMEROS

A norma NBR 5891 da Associação Brasileira de Normas Técnicas (ABNT) estabelece as

regras fixas de arredondamento na numeração decimal, em uso na atualidade. Essas regras

estão de acordo com a Resolução 886/66 do IBGE.

O arredondamento de um número à unidades mais próximas (décimo ou decimal, centésimo, milésimo, etc) reduz seus dígitos significativos ao número de dígitos exigidos pelo cálculo realizado. A estatística convencionou adotar um critério para o arredondamento: a metade dos dados possíveis será arredondado para maior e a outra metade arredondado para menor, desta forma resulta as seguintes regras: 1 – Sempre que o algarismo a abandonar for inferior a 5 (1, 2, 3, 4), faz-se o arredondamento para menor (mantendo-se o algarismo anterior), abandonando-o simplesmente. Ex: 95,34 (arredondar para uma casa após a vírgula)= 2 - Sempre que o algarismo a abandonar for superior a 5 (6, 7, 8, 9), arredonda-se o algarismo anterior para maior. Ex: 54,367 (arredondar para 2 casas após a vírgula)= 3 – Sempre que o algarismo a abandonar for exatamente 5, a convenção é fazer o arredondamento para o par mais próximo. 3.1 – Se o algarismo anterior ao 5 for ímpar (1, 3, 5, 7 , 9) arredonda-se para maior = arredondamento para o par mais próximo. Ex: 9,35 (arredondar para uma casa após a vírgula) = 3.2 - Se o algarismo anterior ao 5 for par (2, 4, 6, 8) abandona-se o 5 (arredondamento para menor (mantendo-se o algarismo anterior). Ex: 7,65 (arredondar para uma casa após a vírgula)= 3.3 – Se após o 5 houver qualquer número significativo, arredonda-se para maior. Ex: 9,85001 (arredondar para uma casa após a vírgula) = 9,9 28,50003 (arredondar para número inteiro) = 29 Esta prática faz com que, ao longo das operações, as diminuições e acréscimos devido aos arredondamentos tendam a se compensar. Obs: Nos softwares de computadores (como o Excel) e calculadoras científicas, porém, não

é aplicado o critério indicado no item 3. Nesses casos, se o primeiro algarismo a ser

abandonado for o algarismo 5, o arredondamento será feito com aumento de uma unidade

ao algarismo que antecede o 5.

TIBONI, Conceição Gentil Ribeiro, 2003: 16-17

10

EXERCÍCIOS DE ARREDONDAMENTO CONFORME NBR 5891 E RES. 886/66 DO IBGE

1- 38,83134 (arredondar para 2 casas) = 23 – 53,02 (arredondar para número inteiro)= 2 – 16,8971 ( arredondar para número inteiro)= 24 – 33,5 (arredondar para número inteiro)= 3 - 16,8971 (arredondar para 3 casas)= 25 – 99,9 (arredondar para número inteiro)= 4 – 132,5 (arredondar para número inteiro)= 26 – 26,5 (arredondar para número inteiro)= 5 – 15,25 (arredondar para uma casa)= 27 – 1,008 (arredondar para número inteiro)= 6 – 27,1275 (arredondar para 3 casas )= 28 – 108,5 (arredondar para número inteiro)=

7 – 6,865476 (arredondar para 2 casas)= 29 – 128,53 (arredondar para número inteiro)=

8 – 18,758 (arredondar para o décimo mais próximo)= 30 – 739,5 (arredondar para número inteiro)=

9 – 15,449 (arredondar para 2 casas )= 31 – 53,02 (arredondar para número inteiro)=

10 – 18,05 (arredondar para uma casa)= 32 – 20,742 (arredondar para o décimo mais próximo)= 11 – 89,1750 (arredondar para 2 casas)= 33 – 205,2384 (arredondar para o décimo mais próximo)=

12 – 5,789 (arredondar para uma casa)= 34 – 5,385 (arredondar para o décimo mais próximo)=

13 – 6,601 (arredondar para número inteiro)= 35 – 39,49 (arredondar para o décimo mais próximo)=

14 – 130,055 (arredondar para número inteiro)= 36 – 45,097 (arredondar para o décimo mais próximo)=

15 – 28,65 (arredondar para uma casa )= 37 – 28,255 (arredondar para o décimo mais próximo)=

16 – 19,95 (arredondar para número inteiro)= 38 – 12,352 (arredondar para o décimo mais próximo)=

17 – 32,505 (arredondar para uma casa)= 39 – 0,7500 (arredondar para o décimo mais próximo)= 18 – 1459,3333 (arredondar para o milésimo mais próximo)= 40 – 15,545 (arredondar para o centésimo mais próximo)= 19 – 15,523 (arredondar para o décimo mais próximo)= 41 – 18,575 (arredondar para o centésimo mais próximo)= 20 – 15,5569 (arredondar para o centésimo mais próximo)= 42 – 11,550 (arredondar para o centésimo mais próximo)= 21 – 15,505 (arredondar para duas casas)= 43 – 5,445 (arredondar para o centésimo mais próximo)= 22 – 88,502 (arredondar para duas casas)= 44 – 0,546 (arredondar para o centésimo mais próximo)=

45. Uma transportadora entregou em um mês: 6,19655 toneladas de produtos eletrônicos; 15,8561 toneladas de brinquedos; 13,6455 toneladas de alimentos; 09,7450 toneladas de papel; 10,3400 toneladas de remédio; 12,2350 toneladas de tecidos. Calcule quanto a transportadora entregou nesse mês, em toneladas:

a) sem arredondar;

b) arredondando para o centésimo mais próximo (um a um)

11

46 – Calcular a soma para as duas situações abaixo: 1º Utilizando as regras de arredondamento para uma casa após a vírgula em cada elemento individualmente e depois somar. 2º Utilizando a regra de arredondamento somente após a soma (arredondar uma casa após a vírgula). 19,35 + 8,65 + 3,25 + 13,15 + 2,95 + 0,75 + 16,85 + 7,85 + 11,45 + 4,15 =

12

CÁLCULO PARA DETERMINAÇÃO DO ERRO AMOSTRAL ERRO AMOSTRAL: é a diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se deseja estimar. Para a determinação do tamanho da amostra, o pesquisador precisa especificar o erro amostral tolerável, ou seja, o quanto ele admite errar na avaliação dos parâmetros de interesse. Ex. Na divulgação de pesquisas eleitorais, é comum encontrar, no relatório, algo como: a presente pesquisa tolera um erro amostral de 2%. Isto quer dizer que quando a pesquisa aponta determinado candidato com 20% de preferência do eleitorado, está afirmando, na verdade, que a preferência por este candidato é um valor do intervalo de 18% a 22% (ou seja 20% ± 2%).

A especificação erro amostral tolerável deve ser feita sob um enfoque probabilístico, pois, por maior que seja a amostra, existe sempre o risco do sorteio gerar uma amostra com características bem diferentes da população de onde está sendo extraída. Portanto o erro amostral não inclui distorções que decorrem do mau planejamento ou má aplicação da pesquisa.

UMA FÓRMULA PARA O CÁLCULO DO TAMANHO MÍNIMO DA AMOSTRA

Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem conhecer o tamanho da população, através da seguinte expressão:

n0 = 20

1

E

onde: n0 = primeira aproximação para o tamanho da amostra E0 = erro amostral tolerável Conhecendo o tamanho da população, N, pode-se corrigir o cálculo anterior, por:

n = 0

0.

nN

nN

+

13

Exercício:

1) Sabendo-se que a população de Joaçaba é 27.005 habitantes, calcular a

amostragem necessária para realização de uma pesquisa sócio econômica com um

erro amostral de 2,5 %. (duas casas após a vírgula).

2) Sabendo-se que a população de Joaçaba é 27.005 habitantes, calcular a amostragem necessária para realização de uma pesquisa sócio econômica com um erro amostral de 4%. (duas casas após a vírgula). 3) Sabendo-se que o número de eleitores de Joaçaba é 20.156, calcular a amostragem necessária para realização de uma pesquisa de intenção de voto com um erro amostral de 5%. (duas casas após a vírgula). (dados fictícios)

4) Sabendo-se que a população da Região da AMMOC é 185.456 habitantes, calcular a amostragem necessária para obter-se um erro amostral de 7% para realização de uma pesquisa eleitoral. (dados fictícios)

5) Sabendo-se que a população de São Paulo é 10.434.252 habitantes, calcular a amostragem necessária para obter-se um erro amostral de 4% para realização de uma pesquisa eleitoral. (fonte: Atlas de desenvolvimento humano no Brasil, 2000)

6) A Rede de Hotéis Guanabara possui 2.359 funcionários, calcular o número de funcionários que deverão ser pesquisados para realização de uma pesquisa de clima organizacional, sendo determinado um erro amostral admissível de 3%. (dados fictícios) 7) Sabendo-se que a população de Itapiraquara é 302.962 habitantes, calcular a amostragem necessária para realização de uma pesquisa sócio econômica com um erro amostral de 2%. (duas casas após a virgula). (dados fictícios)

8) Qual o erro amostral (em percentual) de pesquisa realizada em um Município com 89.984 habitantes, sabendo-se que foram entrevistados 645 habitantes? (dados fictícios) 9) Qual o erro amostral (em percentual) de pesquisa realizada em uma Empresa com 1.240 funcionários, sabendo-se que foram entrevistados 320 funcionários? (dados fictícios)

14

DADOS BRUTOS Quando se faz n observações diretas em um fenômeno coletivo ou observa-se as respostas a uma pergunta em uma coleção de n questionários, obtém-se uma seqüência de n valores numéricos. Tal seqüência é denominada dados brutos. Representando por X a característica observado no fenômeno coletivo ou na pergunta do questionário, estão x1 representa o valor da característica obtida na primeira observação do fenômeno coletivo ou o valor da característica observado no primeiro questionário; x2 representa o valor da característica X na Segunda observação do fenômeno coletivo ou o valor da característica X observada no segundo questionário e assim sucessivamente. Desta forma, os dados brutos podem ser representados por X: x1, x2, x3, ..., xn. Esta seqüência de valores assim obtidas apresenta-se completamente desordenada. De modo geral, pode-se afirmar que: Dados Brutos é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo.

ROL É o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente. Ex: No final do ano o Hotel Primavera calculou o grau de satisfação de seus clientes com as seguintes notas 7, 5, 9, 8, 7, 6, 9. Neste exemplo, X representa as notas e pode ser apresentada na forma: X: 7, 5, 9, 8, 7, 6, 9 (Dados Brutos) Ou X: 5, 6, 7, 7, 8, 9, 9 (Rol) ou X: 9, 9, 8, 7, 7, 6, 5 (Rol) EXERCÍCIOS Construa o Rol para a seqüência de dados brutos: 1- X: 5, 6, 3, 8, 2, 7, 4 2 – Y: 2,4 ; 3,1 ; 5,3 ; 2,9 ; 4,5 ; 0,8 ; 3,6 3 – W: 3, 3, 6, 5, 5, 7, 8, 6, 6, 5 4 – Z: 125, 127, 134, 138, 147, 145, 149, 158, 161 5 – B: 2, 4, 4, 6, 8, 8, 6, 9, 12 6 – J: 9, 11, 12, 8, 10, 9, 12, 15, 16, 19

15

NOTAÇÃO SIGMA – ΣΣΣΣ

∑=

n

i

ix1

Muitos dos processos estatísticos (a maioria) exigem o cálculo da soma de um conjunto de números. Usa-se a letra maiúscula grega Σ para denotar a soma. Assim, se uma variável x tiver os valores 1, 5, 6 e 9, então Σx= 21. Analogamente, se as despesas y com um produto forem $8,82 em janeiro, $12,01 em fevereiro e $2,10 em março, então Σy= $22,93 Exemplo 1 - Se os valores de x são 2, 4, 5 e 9 calcule: a) Σx; b) Σx

2; c) (Σx)2.

Solução: a) Σx =

b) Σx2=

c) (Σx)2=

Lê-se: “somatório de xi, para i variando de 1 a n” ou “soma de xi, para i variando de 1 a n“

O primeiro elemento dos termos a serem somados

i é uma observação individual da série. x é o nome dos termos a serem somados

ΣΣΣΣ é a instrução para somar

n é o último elemento a ser somado

Escores Cada número de x é um escore

16

Se apenas uma parte dos valores é que deve ser somada, usam-se índices

para indicá-los. Assim, ∑=

5

1iix significa a soma dos valores da variável x começando

com o primeiro (i=1) e terminando com o quinto (i=5): ∑=

5

1iix = x1 + x2 + x3 + x4 + x5

∑=

n

i

ix1

significa que devemos somar n (todas) observações; costuma-se

escrever abreviadamente como ΣXi ou ΣX. Exemplo 2 – Utilizando os dados apresentados, calcule: Dados:

a) ∑=

2

1iix b) ∑

=

4

2iix

c) ∑=

11

7iix d) ∑ ix

Solução: a) ∑=

2

1iix

b) ∑=

4

2iix

c) ∑=

11

7iix

d) ∑ ix

i xi

1 2 3 4 5 6 7 8 9

10 11

8 2 3 6 7 8 9 4 5 4 1

17

Propriedade Importante:

A soma de uma soma (ou diferença) de duas variáveis é igual à soma (ou diferença) das

somas individuais das duas variáveis:

∑=

+n

i

ii yx1

2 )( =∑=

n

i

ix1

2+ ∑

=

n

i

iy1

∑=

−n

i

ii yx1

2 )( =∑=

n

i

ix1

2 –∑

=

n

i

iy1

Por exemplo: Σ (x-y) = Σx - Σy = STEVENSON, Willian, 1981: 13-18

EXERCÍCIOS

1) Calcule cada uma das quantidades seguintes para os dados abaixo: (n é o número de observações)

a)∑Y

b) ∑ 2Y

c)

2

∑Y

i x y (x-y) 1 2 3 4

8 3 4 5

5 2 0 4

y 15 10 5 9

14 20 6

17

18

2) Sendo Calcular: a) ∑ x

b) ∑ y

c) ∑ xy

d) ∑ 2x

e) ∑ 2y

f) ( )∑ − yx

g) ( )∑ −1x

x: 3 5 8 9 10 13 15 17 y: 2 3 7 8 9 13 14 14

19

MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central são usadas, para indicar um valor que tende a tipificar, ou a representar melhor, um conjunto de números. As medidas mais usadas são as médias, a mediana, a moda, o quartil e o percentil.

A MÉDIA

A média aritmética é a idéia que ocorre a maioria das pessoas quando se fala em “média”. E como ela possui certas propriedades matemáticas convenientes, é a mais importante das três medidas que estudaremos. Calcula-se a média aritmética determinando-se a soma dos valores do conjunto e dividindo-se esta soma pelo número de valores no conjunto. Assim, a média dos valores 70,80 e 120 é:

Se um estudante fez 4 provas e obteve as notas 83, 94, 95 e 86, sua média será: A média de uma amostra é representada pelo símbolo X (lê-se “x barra”), e seu cálculo pode expressar-se em notação sigma como segue:

∑=

=n

n

iixx

1 ou simplesmente n

xx∑=

O processo de cálculo da média aritmética é o mesmo, quer se trate de um

conjunto de valores que traduzem representações amostrais, quer se trate de todos os valores de uma população. Não obstante, utiliza-se o símbolo µµµµ para a média de uma população, e ΝΝΝΝ para o número de itens da população.

N

x∑=µ

A média tem certas propriedades interessantes e úteis que explicam por que é ela a medida de tendência central mais usada:

1) a média de um conjunto de números pode ser calculada; 2) para um dados conjunto de números, a média é única;

20

3) a média é sensível a ( ou afetada por) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica;

4) somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa constante. Assim, somando-se 4,5 a cada valor de um conjunto, a média ficará aumentada de 4,5. Analogamente, subtraindo-se de cada valor do conjunto uma constante, ou multiplicando-se ou dividindo-se por ela cada valor do conjunto, a média fica reduzida dessa constante, ou multiplicada ou dividida por ela;

5) a soma dos desvios dos números de um conjunto a contar da média é zero:

∑ =− 0)( xxi Por exemplo: A média dos números 2, 4 e 6 é 4: 43

642=

++=x

subtraindo 4 de cada um dos números , obtemos: 2 −−−− = 4 −−−− = 6 −−−− = 0 →→→→ é zero Ex1) Calcular a média aritmética:

a) X: 12, 23, 34, 11, 16, 18

b) W: 78, 89, 65, 66, 78, 92, 77, 89

c) Y: 12,4; 13,0; 11,8; 15,1; 12,1; 16,7; 10,3; 14,6; 12,0

21

EX2) Calcular a média aritmética em US$ do mês de janeiro/2004 referente aos produtos importados pelo Estado de Santa Catarina. OBS: Dados verdadeiros, porém de somente uma amostragem.

Ministério do Desenvolvimento Indústria e Comércio Exterior

DEPLA / GEREST

IMPORTAÇÃO BRASILEIRA

SANTA CATARINA

Principais Produtos Importados

UF42_E4 02/03/15

Ord Descrição 2004 (Jan/Jan) 2003 (Jan/Jan) Var%

US$ F.O.B. Part% Kg Líquido US$

F.O.B. Part% Kg Líquido 04/03

1 OUTROS POLIMEROS DE ETILENO,EM FORMAS 8.987.655 9,17 11.803.421 2.052.417 2,44 3.404.749

2 OUTROS POLIETILENOS S/CARGA,D>=0.94,EM 7.362.453 7,52 9.917.745 2.831.783 3,36 4.849.750

3 MALTE NAO TORRADO,INTEIRO OU PARTIDO ...............................4.666.821 4,76 15.556.071 238.560 0,28 840.000

4 FARINHAS E "PELLETS",DA EXTRACAO DO 4.549.839 4,64 19.872.000 4.249.328 5,05 25.011.260

5 FIO TEXTURIZADO DE POLIESTERES ................................2.853.281 2,91 2.227.828 1.136.505 1,35 893.727

6 UREIA COM TEOR DE NITROGENIO>45% EM 1.707.055 1,74 9.767.496 70.312 0,08 662.524

7 OUTRAS PREPARACOES PARA ALIMENTACAO 1.696.184 1,73 1.172.550 272.363 0,32 241.020

8 MILHO EM GRAO,EXCETO PARA SEMEADURA ..............................1.494.723 1,53 19.299.650 4.152.625 4,93 42.367.630

9 ARROZ 1.302.725 1,33 6.139.500 --- --- ---

10 GARRAFOES,GARRAFAS,FRASCOS,ARTIGOS 1.302.161 1,33 963.509 1.072.908 1,27 872.107

11 BONITOS- 1.175.800 1,20 1.490.300 --- --- ---

12 SARDINHAS,SARDINELAS,ETC.CONGELADAS, 1.117.268 1,14 2.324.004 899.085 1,07 2.477.572

13 TRIPAS DE 1.024.348 1,05 204.727 747.322 0,89 161.740

14 TEARES 967.991 0,99 33.490 --- --- ---

15 OUTROS PNEUS NOVOS PARA ONIBUS OU 966.989 0,99 589.487 --- --- ---

16 TEARES P/TECIDO DE 919.933 0,94 59.320 --- --- ---

17 OUTRAS METIONINAS ................................................................901.449 0,92 420.000 447.561 0,53 220.000

18 OUTRAS LUVAS DE BORRACHA 840.536 0,86 529.740 474.654 0,56 302.566

19 LAMIN.FERRO/ACO,L>=6DM,GALVAN.OUTRO 802.036 0,82 1.551.316 --- --- ---

20 OUTS.CHAPAS,FOLHAS,TIRAS,ETC.AUTO- 754.873 0,77 138.165 287.931 0,34 107.512

Média U$ .............................

22

A MÉDIA PONDERADA Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente a mesma importância ou o mesmo peso. Dizemos então que elas têm o mesmo peso relativo. No entanto, existem casos onde as ocorrências têm importância relativa diferente. Nestes casos, o cálculo da média deve levar em conta esta importância relativa ou peso relativo. Este tipo de média chama-se média aritmética ponderada. Ponderar é sinônimo de pesar. No cálculo da média ponderada, multiplicamos cada valor do conjunto por seu "peso", isto é, sua importância relativa. A fórmula para o cálculo é:

Média ponderada = ∑

=

=n

i

i

n

i

ii

w

xw

1

1

Exemplo: Um estudante que obtém 8,0 no primeiro exame, 9,0 no segundo, e 9,6 no

exame final, sendo os pesos estipulados pela Universidade os seguintes: para o primeiro

exame 30%, para o segundo exame 30% e para o exame final peso de 40%. Qual será a

média ponderada deste Estudante?

Exame Nota (xi) Peso(wi) (xi. wi )

nº 1

nº 2

Final

Σ= Σ=

Mp=

i

ii

w

wx

Mp=

onde: wi é o peso da observação de ordem i.

23

Ex1) Calcular a média ponderada das notas A1 de um aluno da UNOESC onde obteve as seguintes notas: primeira A1=6,5 e segunda A1= 7,5 sabendo-se que a primeira A1 tem peso 40% e a segunda A1 tem peso 60%. O aluno deverá fazer A2?

Ex2) Calcular a média ponderada das notas A1 de um aluno da UNOESC

onde obteve as seguintes notas: primeira A1=5,5 e segunda A1= 8,5 sabendo-se que a primeira A1 tem peso 60% e a segunda A1 tem peso 40%. O aluno deverá fazer A2?

Ex3) Na Distribuidora e importadora de equipamentos eletrônicos Savaris

Ltda é utilizado a média ponderada para distribuição final da comissão para seus vendedores devido questões de mercados diferenciados. Sabendo-se que as vendas realizadas na Região 01 tem peso 25%; na Região 02 tem peso 35% e na Região 03 peso 40%. Pergunta-se: Qual a comissão final (média ponderada) recebida pelo vendedor que comercializou na Região 01 = R$ 2.340,00; na Região 02 = R$ 1.890,00 e na Região 03 = R$ 4.780,00?

Ex4) Um estudante obteve as seguintes notas: 8, 5, 7 e 4, onde os pesos

das notas são os seguintes, respectivamente: 25; 30; 35 e 10. Calcular a média ponderada das notas. (duas casas após a virgula).

Ex5) Um estudante obteve as seguintes notas: 8, 5, 9 e 4, onde os pesos

das notas são os seguintes, respectivamente: 25; 30; 35 e 10. Calcular a média ponderada das notas. (duas casas após a virgula).

MÉDIA HARMÔNICA

Sejam x1, x2, x3, ... , valores de X, associados às freqüências absolutas F1, F2, F3, ... , Fn, respectivamente.

A média harmônica de X é definida por:

∑=

=++++

=n

i i

i

n

n

x

F

n

x

F

x

F

x

F

x

F

nMh

13

3

2

2

1

1 ...

onde

∑=

=n

i

iFn1

Em particular, se F1 = F2 = F3 = ... = Fn = 1, teremos:

24

∑=

=++++

=n

i in x

n

xxxx

nMh

1321

11...

111

Exemplo1: Calcular a média harmônica para 3, 5, 8; 4; 5; 3; 5; 7; 4

Então:

Mh=

Exemplo2: Encontre a média harmônica para as séries:

Xi 2 3 4 5 6

Fi 3 4 6 5 2

∑=

=++++

=n

i i

i

n

n

x

F

n

x

F

x

F

x

F

x

F

nMh

13

3

2

2

1

1 ...

Observação1: A média harmônica é particularmente recomendada para série de valores que são inversamente proporcionais, como para o cálculo da velocidade média, custo médio de bens comprados com uma quantia fixa.

Propriedades da média harmônica A média harmônica é menor que a média geométrica para valores da variável diferentes de zero.

e por extensão de raciocínio podemos escrever :. OBS2: A média harmônica não aceita valores iguais a zero como dados de uma série.

A igualdade só ocorrerá quando todos os valores da série forem iguais. OBS3: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a seguinte relação:

25

Demonstraremos a relação acima com os seguintes dados: z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 } Média aritmética = 51,3 / 5 = 10,2600 Média geométrica = 10,2587 Média harmônica = 5 / 0,4874508 = 10,2574 Comprovando a relação: 10,2600 + 10,2574 / 2 = 10,2587 = média geométrica

Média Geométrica É a raiz n-ésima do produto de todos eles. Média Geométrica Simples:

ou Exemplo - Calcular a média geométrica dos seguintes conjuntos de números: a) { 10, 60, 360 }........ no excel : =(10*60*360)^(1/3) ....R: 60 b) { 2, 2, 2 }........ no excel : =(2*2*2)^(1/3) ....R: 2 c) { 1, 4, 16, 64 }........ no excel : =(1*4*16*64)^(1/4) ....R: 8 . Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo capital/dívida que seja independente da dívida ou do capital das diferentes empresas envolvidas, é recomendável o uso da média geométrica. Se o que se deseja saber é a relação capital/dívida de um certo número de empresas, após a consolidação, a cifra correta será obtida através da média aritmética.

26

MÉDIA QUADRÁTICA É a raiz quadrada da média aritmética dos quadrados Média Quadrática Simples: (para dados não agrupados)

Exemplo - Calcular a média quadrática simples do seguinte conjunto de números: a = { 2 , 3 , 4 , 5 } ....Resp: 3,67 . A média quadrática é largamente utilizada em Estatística, principalmente quando se retende

calcular a média de desvios ( x - X .) , em vez de a média dos valores originais. Neste caso, a média quadrática é denominada desvio-padrão, que é uma importante medida de dispersão. A MEDIANA

Uma segunda medida do meio de um conjunto de números é a mediana. Sua característica principal é dividir um conjunto ordenado de dados em dois grupos iguais; a metade terá valores inferiores à mediana, a outra metade terá valores superiores à mediana. Para calcular a mediana, é necessário primeiro ordenar os valores (comumente) do mais baixo ao mais alto. Em seguida, conta-se até a metade dos valores para achar a mediana.

Por exemplo: a mediana do conjunto 5, 6, 8 é 6→ 6 está no meio.

Em geral, a mediana ocupa a posição 2

)1( +n.

Logo, para três números, a posição 22

)13(=

+, ou seja, a segunda posição.

Outro exemplo: Determinar a mediana dos valores 7, 8, 9, 10. De acordo com nossa fórmula, a posição da mediana ( 4 + 1) ⁄ 2 = 2,5; que está a meio caminho dos dois valores médios, ou seja, 8,5 neste caso, este valor deixa dois valores abaixo e dois acima.

O processo para determinar a mediana é:

O processo para determinar a mediana é:

1) ordenar os valores (ROL); 2) verificar se há um número ímpar ou par de valores; 3) para um número ímpar de valores, a mediana é o valor do meio. Para um número par

de valores, a mediana é a média aritmética dos dois valores do meio.

27

Outros exemplos: Par Mediana a) 2, 3, 3, 4 b) 1; 18; 19, 20 c) 5,1 ; 6,5 ; 8,1 ; 9,1; 10,1 ; 15,5 d) 5, 6, 7, 4, 6, 8, 9, 7, 4, 5, 8, 9, 3, 6 e) 100, 121, 118, 120, 115, 116, 118, 115 Ímpar Mediana a) 1 ; 1 ; 3 ; 3; 4 ; 7; 8 b) 9 ; 40; 80; 81; 100 c) 3,6; 9,2; 10,1; 11,8; 12,8 d) 6, 7, 5, 6, 8, 7, 9 e) 1, 3, 2, 3, 1, 4, 3, 2, 5, 3, 5, 4, 6 SEPARATRIZES Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas relativamente à sua característica de separar a série em duas partes que apresentam o mesmo numero de valores. QUARTIS

A mediana de um conjunto de números é maior que uma metade dos valores e menor que a

outra metade.

Uma medida estreitamente relacionada com a mediana é o quartil. Os quartis

dividem conjuntos ordenados em 4 partes iguais: 25% dos valores serão inferiores ao 1º

quartil (Q1), 50% serão inferiores ao segundo quartil ( Q2= mediana), 75% serão inferiores

ao terceiro quartil (Q3), e 25% serão superiores ao terceiro quartil.

28

Exemplo: Determine, por inspeção, os quartis dos seguintes conjuntos de dados:

Costuma-se arrendodar quando um quartil não é um número inteiro.

Quartis em dados não agrupados

O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis.

Exemplo 1: Calcule os Quartis da série { 5, 2, 6, 9, 10, 13, 15}

O primeiro passo a ser dado é definir o ROL (ordenação) crescente ou decrescente

dos valores:

{2, 5, 6, 9, 10, 13, 15}

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md= 9

que será igual a Q2=9.

Temos agora {2,5,6} e {10,13,15} como sendo os dois grupos de valores iguais

proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as

medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2).

Logo em {2,5,6} a mediana é = 5 = Q1=5. Ou seja: será o quartil 1.

Em {10,13,15} a mediana é = 13 = Q3=13. Ou seja: será o quartil 3.

Exemplo 2: Calcule os quartis da série: {1,1,2,3,5,5,6,7,9,9,10,13}

A série já está ordenada, então calcularemos o Q2 = Md = (5+6) / 2 = 5,5

a) 1 2 3 4

Q1 Q2 Q3

b) 2 3 5 8 9 12 13 15

Q1 Q2 Q3

Na realidade serão calculadas “3 medianas” em uma mesma série.

29

O quartil 1 será a mediana da série à esquerda de Md: {1,1,2,3,5,5}

Q1 = (2+3)/2 = 2,5

O quartil 3 será a mediana da série à direita de Md: {6,7,9,9,10,13}

Q3 = (9+9)/2 = 9

STEVENSON, Willian, 1981: 19-23

Exercícios: Calcular os Quartis: Q1, Q2 e Q3 para as séries abaixo: a) {3, 4, 6, 7, 4, 5, 6 } b) {12, 14, 16, 14, 15, 18, 17, 13} c) {3, 8, 9, 4, 6, 7, 2, 9, 10, 12, 11} d) {103, 98, 99, 104, 86, 87, 102, 89, 110, 112, 91} e) {8, 4, 9, 4, 6, 9, 2, 9, 10, 12, 11, 12, 16, 7, 17, 11, 15} f) {31, 45, 33, 56, 29, 45}

PERCENTIS EM DADOS NÃO AGRUPADOS

30

31

Exercícios: Para os dados da tabela anterior calcular:

a) P37

b) P50

c) P14

d) P88

e) P44

32

COMPARAÇÃO ENTRE MÉDIA E MEDIANA A escolha da média, ou da mediana, como mediana de tendência central de um conjunto, depende de diversos fatores. A média é sensível (ou influenciada por) cada valor do conjunto, inclusive os extremos. Por outro lado, a mediana é relativamente insensível aos valores extremos.

mediana media

Observe que a média é afetada pelos valores extremos, enquanto a mediana não é. Assim, os dados sobre renda pessoal, ou valor de casas residenciais têm na mediana uma medida descritiva mais adequada: isto porque bastam alguns valores muito grandes para inflacionar a média aritmética. De modo geral a média possui certas propriedades que a tornam atraente. Além disso, a ordenação dos dados para determinar a mediana pode ser enfadonha e o cálculo da mediana não é possível fazer com calculadora.

A MODA A moda é o valor que ocorre com maior freqüência em um conjunto: Exemplo: Dados nos números: 10, 10, 8, 6, 10: há três dez; portanto, dez é a moda. A moda funciona como medida descritiva quando se trata de contar dados.

Comparada com a média e a mediana, a moda é a menos útil das medidas para problemas estatísticos porque não se presta a análise matemática ao contrário do que ocorre com as outras duas medidas. A moda indica o valor “típico” em termos da maior ocorrência. A utilidade da moda se acentua quando um ou dois valores ocorrem com muito maior freqüência que outros. Inversamente, quando todos ou quase todos os valores ocorrem aproximadamente com a mesma freqüência, a moda nada acrescenta em termos de descrição dos dados.

A moda é o valor que ocorre com maior freqüência.

33

COMPARAÇÃO ENTRE MÉDIA, MEDIANA E MODA Definição Vantagens Limitações Média

n

x

x

i∑=

1. Reflete cada valor. 2. Possui

propriedades matemáticas atraentes.

1. É influenciada por valores externos.

Mediana Metade dos valores são maiores, metade menores.

1. Menos sensível a valores extremos do que a média.

1. Difícil de determinar para grande quantidade de dados.

Moda Valor mais freqüente. 1. Valor ”típico”: maior quantidade de valores encontrados neste ponto.

1. Não se presta à análise matemática.

2. Pode ser moda para certo conjunto de dados.

EXERCÍCIOS 1) Determine a média e a mediana de cada conjunto: a) 4, 8, 7, 3, 5, 6→ b) 2, 1, 7, 6 → c) 0,010; 0,020; 0,030; 0,020; 0,015 → d) 309; 81; 452; 530; 70; 55; 198; 266 → 2) Inspecionam-se quinze rádios antes da remessa. Os números de defeitos por unidade são: 1; 0; 3; 4; 2; 1; 0; 3; 1; 2; 0; 1; 1; 0; 1 Qual o valor da média, mediana, moda e o 3º Quartil?

34

MEDIDAS DE DISPERSÃO

São necessários dois tipos de medidas para descrever adequadamente um

conjunto de dados. Além da informação quanto ao “meio” de um conjunto de números, é

conveniente dispormos também de um método que nos permita exprimir a dispersão. As

medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros,

ou separados. Esta situação é ilustrada esquematicamente na figura abaixo:

a) � � � � � � � � � � �

pequena dispersão

� � � � � � � � � � �

b)

grande dispersão

A dispersão mede quão próximos, uns dos outros, estão os valores de um grupo.

Consideraremos cinco medidas de dispersão:

• o intervalo;

• o desvio médio;

• a variância;

• o desvio padrão;

• Coeficiente de variação.

Todas elas, exceto o (intervalo) têm na média o ponto de referência. Em cada caso,

o valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o

valor da medida (intervalo, variância, etc.).

35

O INTERVALO

O intervalo de um grupo de números é, de modo geral, a medida mais simples de

calcular e de entender.

O intervalo pode se expresso de duas maneiras:

1ª) a diferença entre o maior e o menor valor;

2ª) o maior e menor valor no grupo.

Consideramos os três valores: 1; 10 e 25. A diferença entre o maior valor e o

menor é 25 – 1 = 24. Alternativamente, pode-se dizer que o intervalo de valores vai de 1 a

25. Este último método tende a ser mais informativo. Por exemplo: o mero conhecimento de

que o intervalo de um conjunto de números é 44 não nos diz nada a respeito dos números;

mas dizer que o intervalo vai de 300 a 344 já nos dá uma informação adicional sobre a

grandeza dos números.

O intervalo pode ser expresso pela diferença entre o maior e o menor número

em um grupo, ou pela identificação desses dois números.

Alguns exemplos:

Intervalo

Números Diferença Do menor ao maior

1; 5; 7 e 13

14; 3; 17; 4; 8; 73; 36 e 48

3,2; 4,7; 5,6; 2,1; 1,9; 10,3

A vantagem de utilizar o intervalo como medida de dispersão reside no fato de o

intervalo ser relativamente fácil de calcular mesmo para um grande conjunto de números.

A maior limitação do intervalo é o fato de ele só levar em conta os dois valores

extremos de um conjunto, nada informando quanto aos outros valores. Por exemplo:

Focaliza o maior e o menor valor no conjunto (ou seja, os valores externos).

36

1º) � � � � � � � � � �

2º)

3º)

� � ��� � � � � �

� � � � � � � � �

Intervalo

três gruposdiferentes denúmeros, todoscom o mesmointervalo

No 1º conjunto, os valores se distribuem uniformemente, e o intervalo é uma boa

medida.

No 2º, os números se apresentam mais densamente agrupados, muito embora o

intervalo ainda proporcione uma medida aproximada de dispersão.

No 3º, o intervalo é facilmente influenciado por alguns valores externos, sendo por

tanto enganoso quanto à indicação da dispersão. Por isso, a utilidade do intervalo é

bastante limitada.

STEVENSON, Willian, 1981: 24-25

37

MEDIDAS DE DISPERSÃO QUE TÊM A MÉDIA COMO

PONTO DE REFERÊNCIA

Em razão de suas propriedades matemáticas, quase sempre se calcula a média de

um conjunto de dados. Por isso, existem várias medidas de dispersão que têm a média

como ponto de referência. Todas elas requerem o cálculo do desvio, ou diferença entre cada

valor e a média, ( )xxi − .

Estudaremos três dessas medidas.

A primeira focaliza o desvio absoluto a contar da média, enquanto que as outras

duas se concentram nos quadrados dos desvios a contar da média. A discussão se

concentrará principalmente em dados amostrais, ao invés de em dados de populações

inteiras, enfatizando assim o fato de que utilizaremos estatísticas amostrais para aproximar

os valores do parâmetros das populações.

1º) Desvio Médio Absoluto (DMA): Mede o desvio médio dos valores em relação

à média do grupo, ignorando o sinal do desvio. Calcula-se subtraindo a média de cada valor

do grupo e desprezando o sinal (+ ou −) do desvio, e tomando a média em seguida. Ao

calcular o desvio médio, é necessário levar em conta o fato de que a soma dos desvios

positivos e negativos, a contar da média, será sempre (por definição) igual a zero. A

conversão das diferenças a valores absolutos (todos os valores são considerados como

desvios positivos) antes de se proceder à soma resolve o problema.

Calcula-se então o desvio médio absoluto pela fórmula seguinte:

n

xxDMA

i∑ −=

onde: n é o número de observações no conjunto.

38

Exemplo 1: Determine o desvio médio, para o seguinte conjunto de números:

2; 4; 6; 8; 10

Solução: Determinação da média

=x

Em seguida, determinaremos as diferenças entre a média e cada valor:

xi x xi – x xxi −

Σ= Σ=

Desvio Médio: =−∑n

xxi

O DMA tem aplicação no controle de inventários.

O desvio médio absoluto de um conjunto de números é a média dos desvios dos valores a contar da média, ignorando-se o sinal de

diferença.

39

A VARIÂNCIA

Calcula-se a variância de uma amostra quase da mesma forma que o desvio médio,

com duas pequenas exceções:

1º) os desvios são elevados ao quadrado antes da soma;

2º) toma-se a média dividindo-se por n−−−−1 em lugar de n, porque isso dá melhor estimativa

da variância populacional.

Calcula-se a variância para uma amostra pela fórmula:

( )1

2

2

−= ∑

n

xxSx

i

Calcula-se a variância para uma população pela fórmula: ( )n

xxSx

i∑ −=

2

2

Se um conjunto de números constitui uma população, ou se a finalidade de somar

os dados é apenas descrevê-los, e não fazer inferências sobre uma população, então deve-

se usar n em lugar de (n −−−− 1) no denominador.

Exemplo: Calcule a variância da amostra 2; 7; 6; 9; 11

Solução: a média ( x ) é

xi x (xi – x ) ( )2xxi −

Σ= Σ=

40

A variância de uma amostra é a média dos quadrados dos desvios dos valores a

contar da média, calculada usando-se n −−−− 1 em lugar de n.

Uma fórmula alternativa para o cálculo da variância é:

( )

1

2

2

2

=

∑∑

n

n

xx

S

i

i

x

Esta fórmula é mais fácil de calcular porque não exige o cálculo da média e também

porque não há necessidade de determinar cada um dos desvios.

Usando os dados anteriores podemos observar a variância calculada por esta última fórmula

é idêntica à obtida anteriormente.

( )=

−=∑

1

2

2

n

xxSx

i

EM RESUMO Os estágios do cálculo da variância são: 1º) Calcular a média; 2º) Subtrair a média a cada valor do conjunto; 3º) Elevar ao quadrado cada desvio; 4º) Somar os quadrados dos desvios; 5º) Dividir a soma por (n− 1) se se trata de dados amostrais, ou simplesmente por n par somar o conjunto ou se os dados representam todos os valores de uma população.

41

ix 2ix

2

7

6

9

11

∑ = 35ix ∑ =2

ix

DESVIO PADRÃO

O desvio Padrão depende da soma dos quadrados dos desvios dos valores da variável.

Portanto, quanto menor o Desvio Padrão mais os valores da variável se aproximam de sua

média. Dessa maneira:

• Se o desvio de um valor da variável for menor que o desvio padrão da variável,

então esse valor estará mais próximo da média do que um outro valor com desvio

maior.

• Quanto mais os valores da variável se afastar de sua média maior serão os desvios

e, conseqüentemente, maior será o desvio padrão e mais aberta será a distribuição

de freqüência da variável.

• Se duas variáveis tiverem a mesma média e desvios padrões diferentes, a

distribuição da variável com maior desvio padrão será mais aberta que a da variável

com menor desvio padrão.

LAPPONI, Juan Carlos, 2000: 104

O Desvio Padrão é a medida mais usada na comparação de diferenças entre conjuntos de

dados, por ter grande precisão. O Desvio Padrão determina a dispersão dos valores em

relação à média.

=2Sx

42

Fórmula:

( )1

2

−= ∑

n

xxS

i

para amostra

Fórmula:

( )n

xxS

i∑ −=

2

para população

Fórmula alternativa = S =

( )

1

2

2

−∑ ∑

n

n

xx

i

i

(como anteriormente para calculo da variância, a substituição de (n −−−−1) por n produz

as fórmulas do desvio padrão da população).

Exemplo: Calcule o desvio padrão da amostra de peso (massa) de 7 pacotes de erva mate

retirados durante uma inspeção de qualidade: 501g; 500g; 499,5g; 500,5g; 500g; 500,1g;

499,8g.

xi x (xi – x ) ( )2xxi −

Σ= Σ=

O desvio padrão é simplesmente a raiz quadrada positiva da variância. Assim, se a variância é 81, o desvio padrão é 9; se a variância é 10, o desvio padrão

é 16,310 = .

43

( )1

2

−= ∑

n

xxS

i

=

STEVENSON, Willian, 1981: 24-30

O desvio padrão é uma das medidas mais comumente usadas para distribuições e desempenha papel relevante em toda ESTATÍSTICA. A unidade do desvio padrão é a mesma da média. Por exemplo, se a média é em reais, o desvio padrão também se exprime em quadrados de unidades (por exemplo: reais2, m2, cm2, etc.).

44

MEDIDAS DE DISPERSÃO RELATIVA

COEFICIENTE DE VARIAÇÃO (CV) CV: Coeficiente de Variação de Pearson Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de CV: Coeficiente de Variação de Pearson (é a razão entre o desvio padão e a média referentes a dados de uma mesma série). A fórmula é:

(o resultado neste caso é expresso em percentual, entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula). Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. De uma forma geral, se o CV: For menor ou igual a 15% → baixa dispersão: dados homogêneos For entre 15 e 30% → média dispersão For maior que 30% → alta dispersão: dados heterogêneos Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos:

45

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado menor será o de maior homogeneidade ( menor dispersão ou variabilidade). CV estatura = ( 5 / 175 ) x 100 = 2,85 % CV peso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos. A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de dados e, conseqüentemente, se a média é uma boa medida para representar estes dados. É utilizado, também, para comparar conjuntos com unidades de medidas distintas. Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a média está próxima de zero. Uma média muito próxima de zero pode inflacionar o CV. Um coeficiente de variação superior a 50% sugere alta dispersão o que indica heterogeneidade dos dados. Quanto maior for este valor, menos representativa será a média. Neste caso, opta-se pela mediana ou moda, não existindo uma regra prática para a escolha de uma destas medidas. O pesquisador, com sua experiência, é que deverá decidir por uma ou outra. Por outro lado, quanto mais próximo de zero, mais homogêneo é o conjunto de dados e mais representativa será sua média.

Exercícios:

46

EXERCÍCIOS COMPLEMENTARES 1) Responda: a) O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique. b) O desvio médio absoluto pode ser negativo? Zero? Explique. 2)Calcule a média e o desvio padrão das vendas diárias: $ 8.100; $ 9.000; $ 4.580; $ 5.600; $ 7.680; $ 4.800; $ 10.640 3)Calcular a média harmônica para os seguintes valores: a) 3, 5, 7, 3, 5, 4, 8, 9, 3, 2, 7 b) 23, 24, 22, 30, 27, 24, 26, 26 4) Determine a média e a mediana para cada um dos conjuntos de dados: a) 7; 9; 2; 1; 5; 4,5; 7.5; 6.2 b) 1; 2; 10; 7; 7; 9; 8; 5; 2; 11 c) 30; 2; 79; 50; 38; 17; 9 d) 0,11; 0,032; 0,027; 0,035; 0,042 5) Calcule a média e a variância para o conjunto de dados abaixo, supondo que eles representem: a) uma amostra; b) a população. 83; 92; 100; 57; 85; 88; 84; 82; 94; 93; 91; 95

47

APOSTILA

ESTATÍSTICA

APLICADA

PARTE I I

48

1. DISTRIBUIÇÃO DE FREQÜENCIA INTRODUÇÃO: Um dos objetivos da Estatística é obter uma significativa redução na quantidade de dados com os quais opera-se diretamente (amostragem). Isto pode ser conseguido modificando-se a forma de apresentação destes dados. Quando se lida com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente trabalha-se com grande quantidade de dados. Para tal, utiliza-se a DISTRIBUIÇÃO DE FREQÜENCIA. Uma distribuição de freqüência é uma tabela na qual os possíveis valores de uma variável se encontram agrupados, na qual registra-se os valores observados. Os valores observados podem ser registrados, numa distribuição de freqüência, em classes ou não. As classes são pequenos intervalos, tais que, quando reunidos, abrangem todo o conjunto de dados. INTERPRETAÇÃO DE INTERVALO DE CLASSE: Existem várias formas de apresentarmos o intervalo de classes: iguais ou diferentes entre si. Porém, sempre que possível, devemos optar por intervalos iguais, o que facilitará os cálculos posteriores. Mas mesmo com intervalos iguais, as distribuições poderão apresentar-se da seguinte forma: 0 10 Compreende todos os valores entre 0 e 10, excluindo os extremos.

0 10 Compreende todos os valores entre 0 e 10, incluindo os extremos. 0 10 Compreende todos os valores entre 0 e 10, incluindo o 10 e excluindo o 0. 0 10 Compreende todos os valores entre 0 e 10, incluindo o 0 e excluindo o 10.

DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS OU

DADOS TABULADOS EM CLASSES È uma representação tabular de um conjunto de valores em que coloca-se na primeira coluna, em ordem crescente, os valores ordenados em classes da série e, na segunda coluna os valores das freqüências absolutas simples correspondentes, ou seja, é o arranjo em classes dos dados estatísticos. Embora o processo de agrupamento inutiliza alguns detalhes originais dos dados, consegue-se vantagens importantes no aspecto geral obtido, torna mais clara e evidente a relação essencial dos dados.

49

CONSTRUÇÃO A construção da distribuição de freqüência para dados agrupados ou tabulados em classe requer o conhecimento de alguns conceitos.

AMPLITUDE TOTAL DO ROL (At) OU OSCILAÇÕES Considerando-se X a variável em estudo, então Xmax é a variável de maior valos do rol e Xmin

é a variável de menor valor do rol. Denomina-se amplitude total dos dados (At) a diferença entre o maior e o menor valor do rol, ou seja, é a diferença entre os valores extremos do rol. Matematicamente temos:

FREQUENCIA TOTAL (ft)

Representa a soma de todos os elementos observados nas freqüências simples, ou seja, é a quantidade de valores observados. Pode-se representa-la pela expressão matemática:

QUANTIDADE DE CLASSES OU NÚMERO DE CLASSES (k) Não existem regras que permitam determinar o número exato de classes. Contudo o número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele pretende responder. Para a elaboração de tabela de Distribuição de Freqüência para dados agrupados ou tabulados em classes Sturges sugere para calcular a quantidade de classes (número de classes) a expressão matemática:

At = X max - X min

ft = ∑=

n

i

fi1

= N

K = 1 + 3,3 log.N

50

OBSERVAÇÃO

I. Se o número de classes for muito pequeno, características importantes da

distribuição de freqüência podem ficar ocultas ou serem apresentadas de forma bastante resumida.

II. Por outro lado, quando se utiliza muitas classes (número de classes for grande),

o trabalho (resultado) pode ficar muito extenso, não realçando aspectos relevantes da distribuição de freqüência.

III. “k” poderá ser um número aproximado, porém inteiro, por isso, o arredondamento deverá seguir as regras apresentadas no MODULO 01.

LIMITES DE CLASSE

Os números (valores) extremos de uma classe são denominados limites de classe;

o número da esquerda, de menor valor, é o limite inferior (li) da classe e o número da direita, de maior valor, é o limite superior (Li) da classe.

OBSERVAÇÃO

I. Limites reais ou limites verdadeiros da classe ou as fronteiras de classes ou limites exatos, são os pontos ao longo da escala de medida que servem para separar classes adjacentes.

II. Normalmente as classes são trabalhadas com intervalos de classes fechado à esquerda e aberto a direita ou intervalos semi-abertos à direita ( ).

III. Os limites inferior ou superior, no intervalo de classe depende do número de dígitos significativos que se está trabalhando.

AMPLITUDE DO INTERVALO DE CLASSE (h)

Na elaboração de uma Tabela de Distribuição de freqüência para dados agrupados

ou tabulados em classe o critério para determinação da Amplitude do Intervalo de classe, varia de acordo com o número de classes que se deseja, contudo, quanto maior for a amplitude da classe, menos precisão se obterá dos fenômenos analisados. Assim, para que todas as classes tenham o mesmo tamanho, elas deverão ter a mesma amplitude (mesmo intervalo), desta forma a expressão matemática abaixo prevê essa amplitude:

OBSERVAÇÃO

h = K

At

51

I. A amplitude do intervalo de classe (h) depende do número de dígitos significativos que se está trabalhando.

II. Se houver necessidade de arredondamento da amplitude, este deverá ser feito (sempre) à maior.

A amplitude do intervalo de classe é definida pela diferença entre os

limites superior e inferior dessa classe. É referida também como a amplitude, o tamanho ou o comprimento da classe e, simbolicamente representada por h. Matematicamente:

PONTOS MÉDIOS OU CENTRAIS DE UMA CLASSE (Pmi) È o ponto intermediário intervalo de classe representa o valor típico da classe, que,

muitas vezes, poderá ser usado para aproximar os demais valores da classe. É comum, numa distribuição de freqüência, colocar os pontos médios das classes

numa coluna, isto é, para cada classe calcula-se o ponto médio dos seus limites. O ponto médio (Pmi) é calculado pela soma do limite inferior (li ) de uma classe com

a metade da amplitude do intervalo de classe (h), ou ainda, é a média aritmética simples entre o limite superior (Li ) e o inferior (li) de uma classe. Assim, as seguintes expressões matemáticas, podem ser usadas para o cálculo do ponto médio de classes:

FREQUENCIA ABSOLUTA SIMPLES (fi )

É definida como sendo o número de vezes ou de informações em cada classe

contém, ou seja, é a quantidade de valores que pertencem a uma classe. REGRAS GERAIS PARA ELABORAR UMA DISTRIBUIÇÃO DE

FREQUENCIA PARA DADOS AGRUPADOS OU TABULADOS EM CLASSES ORGANIZAÇÃO DA TABELA DE DISTRIBUIÇÃO DE FREQUENCIA 1º . Determinar o maior e o menor número dos dados isolados, e então, calcular a

amplitude total do rol (At). At = Xmax −−−− Xmin

2º. Determinar o número de valores observados = freqüência total (ft = N).

h = Li - li

Pmi = 2

liLi +

52

∑=

n

i

fi1

= ft = N

3º. Determinar o número de classes = quantidade de classes (k).

k= 1 + 3,3 log.N

4º. Determinar a amplitude (h) h = k

At

5º Determinar os intervalos de classe. 6º Determina-se o número de observações que correspondem a cada classe, ou

seja, determinar a freqüência simples (fi ). 7º. Determinar os pontos médios de cada classe. 8º Elaborar a tabela de distribuição de freqüência . OBSERVAÇÕES

I. Sempre que possível, utilizar, em tabela de freqüências, classes com amplitude (h) iguais, o que permite uma comparação perfeita das freqüências de classes.

II. O menor valor do rol (Xmin) deverá ser igual (ou menor) que o limite inferior (li) da 1ª classe.

III. O maior valor do rol (Xmax ) deverá ser menor que o limite superior (Li) da última classe.

EXERCÍCIO RESOLVIDO: Em 18 Estabelecimentos Comerciais de Joaçaba, verificou-se os valores abaixo

para um determinado produto de consumo, em outubro de 2005. Fazer a distribuição de freqüência para os dados abaixo (dados fictícios).

Tabela 1. Valores de um produto de consumo, verificando em 18

Estabelecimentos Comerciais, em outubro de 2005. 16,1 21,5 17,3 19,1 21,6 19,7 18,7 17,9 20,9 17,4 15,5 20,7 17,8 19,8 20,4 19,7 19,8 22,1 INFORMAÇÕES PARA RESOLUÇÃO:Para fazer a distribuição de freqüência para

dados agrupados ou tabulados em classes, sugere-se a seqüência de passos apresentados anteriormente.

1º . Determinar o maior e o menor número dos dados isolados, e então, calcular a

amplitude total do rol (At). At = Xmax −−−− Xmin

53

2º. Determinar o número de valores observados = freqüência total (ft = N).

∑=

n

i

fi1

= ft = N

N =

3º. Determinar o número de classes = quantidade de classes (k).

k= 1 + 3,3 log.N

Conforme observação III = k = 5

4º. Determinar a amplitude (h) h = k

At

5º Determinar os intervalos de classe. 6º Determina-se o número de observações que correspondem a cada classe, ou

seja, determinar a freqüência simples (fi ). 7º. Determinar os pontos médios de cada classe. 8º Elaborar a tabela de distribuição de freqüência .

54

Valores de um produto de consumo, verificado em 18 Estabelecimentos Comerciais, em outubro de 2001.

Preços (R$) Freqüência (fi) Amplitude (h) Ponto Médio (Pmi)

Total ∑ =fi

HISTOGRAMA

55

2. DISTRIBUIÇÕES CONTÍNUAS E O MODELO NORMAL1 PEDRO ALBERTO BARBETTA

Neste capítulo, estudaremos o modelo de probabilidades mais conhecido da

Estatística: a chamada distribuição normal de probabilidades. Para podermos estudar esta distribuição, vamos, inicialmente, estender o conceito de equiprobabilidade para variáveis aleatórias contínuas.

Dizemos que uma variável aleatória é contínua quando não conseguimos

enumerar seus possíveis resultados, por estes formarem um conjunto infinito, em um dado intervalo de números reais. Por exemplo, a altura de um indivíduo, tomando ao acaso, é uma variável aleatória contínua, pois não é possível enumerar todos os valores possíveis de altura de indivíduos, mas podemos dizer, por exemplo, que o resultado será um número do intervalo de zero a dois metros e meio, o qual contém infinitos números.

Chama-se Distribuição Normal a distribuição de probabilidades definida pela

função de densidade de probabilidades:

F(x)= Porém esta função fica totalmente definida e simplificada pelos parâmetros µ

(média aritmética de uma população) e σ ou “S“ (desvio padrão) com auxilio de valores padronizados (tabela).

1 O texto que compõe o capítulo 5 foi obtido do livro ESTATÍSTICA APLICADA ÀS CIÊNCIAS SOCIAIS – oitavo capítulo.

56

Exemplo 1: Selecionar, aleatoriamente, de uma certa universidade, um

estudante do sexo masculino. Seja X o valor de sua altura, em centímetros. Temos, novamente, uma variável aleatória contínua, mas, desta vez, não é

razoável atribuir a mesma probabilidade para diferentes faixas de altura. Por exemplo, é intuitivo que a probabilidade do estudante acusar altura no intervalo de 165 a 175 cm é bem maior do que no intervalo de 190 a 200 cm, mesmo que ambos os intervalos tenham a mesma amplitude.

A Figura 2(a) sugere um modelo mais adequado para a presente situação.

Por este modelo, conhecido como distribuição normal de probabilidades, existe um valor típico, ou valor médio, que no caso de alturas de homens adultos, deve estar em torno de 170 cm. Intervalos em torno deste valor médio têm altas probabilidades de ocorrência, mas as probabilidades diminuem na medida em que nos afastamos deste valor médio, indiferentemente se do lado esquerdo (para valores menores) ou do lado direito (para valores maiores). A Figura 2(b) identifica a probabilidade do evento o estudante sorteado ter mais de 180 cm.

Fig. 2 Um modelo para a altura de um aluno universitário.

130 140 150 160 170 180 190 200 210 xaltura (em cm)

57

2.1. DISTRIBUIÇÕES NORMAIS A distribuição normal é caracterizada por uma função, cujo gráfico descreve

uma curva em forma de sino. Esta distribuição depende de dois parâmetros, a saber: µµµµ (média) – este parâmetro especifica a posição central da distribuição de

probabilidades. σσσσ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição

de probabilidades2. A Fig. 3 apresenta a forma gráfica de um modelo normal genérico, com

parâmetros µ e σ. A curva é perfeitamente simétrica em torno da média µ e, independentemente dos valores de µ e σ, a área total entre a curva e o eixo das abscissas é igual a 1 (um), permitindo identificar probabilidades de eventos como áreas sob a curva, como já ilustramos na Fig. 2(b).

Fig. 3 Gráfico da distribuição normal com parâmetros µ e σ A Fig. 4 mostra diferentes modelos normais, em termos dos parâmetros µ e σ.

Estes modelos podem representar, por exemplo, a distribuição de alturas de criança em diferentes populações.

Fig. 4 Distribuições normais em função dos parâmetros µ e σ.

2 Os parâmetros µ e σ do modelo normal têm analogia com as estatísticas X e S, usadas para medir, respectivamente, a posição central e dispersão de uma distribuição de freqüências.

58

As duas distribuições da Fig. 4(a) podem representar, por exemplo, (1) alturas de estudantes da primeira série do primeiro grau e (2) da oitava série. Podemos admitir que ambas as distribuições apresentam, aproximadamente, a mesma dispersão (σ1 ≈ σ2), porém, na oitava série os estudantes devem ter, em média, alturas maiores do que os estudantes da primeira série ( µ1 > µ2) . Por outro lado, as distribuições da Fig. 4(b) podem representar (3) alturas de estudantes da quarta série e (4) alturas de estudantes de todas as séries. É razoável supor, nesse caso, que a média das alturas dos dois grupos de estudantes devem ser aproximadamente iguais (µ3 ≈ µ4),mas a dispersão deve ser maior no grupo formado por todas as séries.

VALORES PADRONIZADOS E A DISTRIBUIÇÃO NORMAL PADRÃO

Com o objetivo de facilitar a obtenção de determinadas áreas sob uma curva

normal, podemos fazer uma transformação na variável, levando-a para uma distribuição normal com média 0 (zero) e desvio padrão 1 (um), também conhecida com distribuição normal padrão.

Para que um dado valor x, de uma distribuição normal com média µ e desvio

padrão σ, se transforme em um valor z da distribuição normal padrão, basta fazer a seguinte operação:

σµ−

=x

z

O valor z é conhecido como valor padronizado. Ele fornece uma medida

relativa do valor x, em termos da distribuição da variável aleatória em estudo, como ilustramos no seguinte exemplo.

59

Exemplo 2: Suponha que em uma certa universidade, a altura dos

estudantes do sexo masculino tenha distribuição normal com média µ= 170cm e desvio padrão σ= 10 cm. A Fig. 5 mostra a relação entre a escala dos valores das alturas de universitários masculinos (x) e seus correspondentes valores padronizados (z). Por exemplo, para um estudante de altura x= 180cm, temos o valor padronizado z= (180 – 170)/10 = 1, ou seja, este estudante encontra-se a 1 (um) desvio padrão acima da altura média dos estudantes do sexo masculino da universidade.

Fig. 5 Transformação de valores de alturas de universitários (x) em valores padronizados (z).

Seja X a altura, em centímetro, de um estudante do sexo masculino,

selecionado ao acaso, dessa universidade. Considere que temos interesse no evento X>>>>180. A figura 6 mostra a equivalência da probabilidade deste evento, P(X>>>>180), com uma certa área na distribuição normal padrão. Para facilitar a notação, identificaremos por Z uma variável aleatória com distribuição normal padrão.

Z= σµ−x

Z= 10

170180 −

Z = 1

60

Tabela IV com z = 1 encontra-se o valor da área = 0,1587

= 15,87%

61

2.2 TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO

Como vimos na seção precedente, as probabilidades de uma variável com distribuição normal podem ser representadas por áreas sob a curva da distribuição normal padrão. No apêndice, apresentamos a Tabela IV que relaciona valores positivos de z com áreas sob a cauda superior da curva. Os valores de z são apresentados com duas decimais. A primeira decimal fica na coluna da esquerda e a segunda decimal na linha do topo da tabela. A Fig. 7 mostra como podemos usar a Tabela IV para encontrar, por exemplo, a área sob a cauda superior da curva, além de z = 0,21.

Fig. 7: Ilustração do uso da tabela da distribuição norma padrão (Tabela IV do apêndice) para encontrar a área na cauda superior relativa ao valor de z= 0,21.

Exemplo 2, continuação – Admitimos que a altura X de um estudante do sexo masculino, tomado ao acaso de uma universidade, tinha distribuição normal com média 170 cm e desvio padrão 10 cm. Vimos, também, que a probabilidade dele acusar altura superior a 180 cm, correspondia à área acima de z= 1 da curva normal padrão, isto é, P(X > 180) = P(Z > 1). Usando a Tabela IV do apêndice, podemos encontrar esta área (probabilidade), como ilustra o esquema seguinte.

A Tabela IV considera valores de z entre 0 (zero) e 5 (cinco). Além de z= 5 a

área pode ser considerada nula. Aliás, a partir de 3 (três) a área já é praticamente nula. Áreas para valores negativos de z podem ser obtidas por simetria, considerando os correspondentes valores positivos. O exemplo seguinte mostra como podemos operar com áreas, a fim de obter diversas probabilidades de interesse.

segunda decimal de zz 0,00 ... 0,09...1,0...

0,1587

Portanto:P(X>180)= 0,1587

segunda decimal de zz 0,00 0,01 0,02 ... 0,09

0,00,10,2...

0,4168

(área na cauda superior)

62

Exemplo 3: Suponha que o desempenho dos alunos das três últimas fases do Curso de Ciências da Computação da UFSC tenha distribuição normal de média 2,5 e desvio padrão de 0,6. Selecionando aleatoriamente um aluno desta população, qual a probabilidade dele acusar desempenho entre 2 e 3,5? Solução. Primeiramente precisamos transformar os valores de desempenho x, em valores padronizados:

63

1) Considerando a variável aleatória X do Exemplo 3 que a altura X de um estudante do sexo masculino, tomado ao acaso de uma universidade, tinha distribuição normal com média 170 cm e desvio padrão 10 cm., calcule: a) P(X>190); b) P(150<X<190); c) P(X≤160); d) a percentagem esperada de estudantes com altura entre 150 e 190 cm. 2) Admitindo que a distribuição do quociente de inteligência (Q.I.), de crianças de uma certa escola, seja normal com média 100 pontos e desvio padrão 10 pontos, calcule: a) a probabilidade de uma criança, tomada ao acaso dessa escola, acusar Q.I. superior a 120 pontos; b) a percentagem esperada de crianças com Q.I. na faixa de 90 a 110 pontos. 3) O resultado da média dos alunos de um determinado curso foi µ = 7,5 pontos e a variância Sx2 = 3. Utilizando-se dos conceitos e aplicação da curva de Gauss (distribuição normal) determinar: a) Os alunos que obtiveram nota igual ou superior a 8 ⇒ P(x > 8) b) Os alunos que obtiveram nota entre 3,5 e 9 ⇒ P(3,5 < x < 9) c) Os alunos que obtiveram nota inferior a 2,0 ⇒ P( x < 2,0) 4) A idade média de ingresso de 3000 estudantes de uma determinada Universidade é de 22 anos e o desvio padrão é 5,4 anos. Admitindo-se que as idades estão distribuídas normalmente, determinar quantos estudantes ingressarão conforme as seguintes limitações:

a) Entre 18 e 23 anos; b) Menos que 18 anos; c) Mais que 26 anos;

5) A nota dos alunos de um determinado curso foram (7; 8; 6; 7,5; 8; 5) notas estas que representam uma amostra. Pergunta-se:

a) Qual a probabilidade em percentual de alunos tirarem nota inferior a 5. b) Qual a probabilidade em percentual de alunos tirarem nota superior a 9.

6) Suponha que em uma certa região, o peso dos homens adultos tenha distribuição normal com média 70 kg e desvio padrão 16 kg. E o peso das mulheres adultas tenha distribuição normal com média 60 kg e desvio padrão 12 kg. Ao selecionar uma pessoa ao acaso, o que é mais provável: uma mulher com mais de 75 kg, ou, um homem com mais de 90 kg? 7) Em uma fábrica de farinha de trigo, o departamento de qualidade retirou por amostragem 05 pacotes de farinha com a seguinte pesagem: (998g; 1000g; 996g; 1001g; 995g). Qual a probabilidade segundo a distribuição normal de acontecer um erro de mais que 10g?

64

3. AJUSTAMENTO DE RETA E CORRELAÇÃO3 GILBERTO ANDRADE MATINS

3.1. INTRODUÇÃO

Um dos maiores problemas para o investigador de fenômenos humanos ou físicos é o estabelecimento de um modelo matemático que descreva e explique o fenômeno ocorrido na vida real, com boa aproximação. A busca de uma relação funcional entre as variáveis observadas que descrevem o fato é uma tarefa de muitos cientistas em qualquer área de estudo. Assim, o pediatra tem interesse em estabelecer uma relação funcional entre o peso e a altura dos bebês; o economista busca o estabelecimento de uma função que explique o comportamento das vendas, em unidades de um produto, em função do preço; o administrador precisa de uma função que descreva os custos de um produto, quando as quantidades variam; o engenheiro quer saber a relação funcional entre a resistência do concreto e a razão água/cimento; o médico tem interesse em relacionar através de uma função o volume do plasma sangüíneo e a superfície dos corpos dos pacientes; o psicólogo deseja a função que explique o QI (quociente de inteligência), etc.

Seja Y uma variável que nos interessa estudar e cujo comportamento futuro desejamos prever. É fácil prever. É fácil identificarmos uma série de variáveis Xi; (X1, X2, X3,..., Xn) que influenciam o comportamento de Y, a variável dependente do modelo. A Estatística oferece meios de chegarmos à relação função entre a variável dependente (Y) e as variáveis explicativas ou independentes (X1, X2, X3,..., Xn) através da análise de regressão. Quando maior o número de variáveis explicativas, mais completo será o modelo. Todavia, sua solução será também mais difícil e complexa. Em razão disso, limitaremos nossa exposição ao caso em que apenas duas variáveis intervêm no modelo: a variável dependente Y e a variável independente X. Apresentaremos apenas o estudo da função linear (ajustamento de uma reta), isto é, estudaremos o modelo:

bXaY += onde a e b são os parâmetros da função.

3 O texto que compõe o capítulo 6 foi obtido do livro Princípios de Estatística

65

Uma maneira bastante prática para auxílio na determinação da função entre as variáveis dependente e independente é a construção do gráfico denominado “diagrama de dispersão”. Para desenharmos o diagrama de dispersão devemos coletar uma amostra de valores X e Y : (x1 , y1), (x2 , y2) , ( x3 , y3), . . . , ( xn, yn), marcando esses pontos em um sistema de coordenadas cartesianas. Assim:

”Diagrama de Dispersão”

Para análise de “nuvem” de pontos assinalados, teremos melhores

condições de especificar a função que relaciona as variáveis. No caso do ajustamento de uma linha reta, o diagrama de dispersão apresentará uma “nuvem” de pontos que nos irá sugerir uma relação linear entre X e Y . É também provável que a nuvem de pontos nos indique outros tipos de funções (exponencial, parábola, etc.). Tais ajustamentos fogem aos objetivos desse curso.

3.2. AJUSTAMENTO DA RETA Estabelecido o modelo Y = a + bx, precisamos dos valores de a e b de forma que a nossa reta passe tão próxima quanto possível dos pontos assinalados no diagrama de dispersão. Isto é, queremos minimizar a discrepância total entre os pontos marcados e a reta que iremos determinar. O melhor método para a determinação dos parâmetros a e b que minimize as discrepância é o Método dos Mínimos Quadrados. Segundo esse método, poderemos avaliar os parâmetros a e b pela aplicação das seguintes fórmulas:

( )∑ ∑∑ ∑∑

•−=

22 xxn

yxxynb

xbya −= , onde n = tamanho-amostra

x = n

x∑= média dos xi

y

yn

y2

y3

y1

x1 x2 x3 ... xn x

••••

••••••••

••••

66

y = n

y∑= média dos yi

3.3. EXEMPLO DE APLICAÇÃO

Utilizando os dados abaixo: a) Construa o diagrama de dispersão. b) Ajuste uma reta aos dados. c) Trace a reta no diagrama de dispersão. d) Qual é o custo para 16 unidades do artigo?

Quantidades (x) 10 11 12 13 14 15 Custos (y) 100 112 119 130 139 142

Solução: a) Diagrama de dispersão

b) Ajustamento da reta Neste item precisamos avaliar a e b. Para tanto, é conveniente a construção

da tabela:

Custosy

150 -140 -130 -120 -110 -100 -

| | | | | | x10 11 12 13 14 15 quantidades

••

•• •

67

X Y XY X2

10 11 12 13 14 15

∑ 75

Assim: n= ; ∑ xy = ; ∑ x = ; ∑ y= ; ∑ 2x =

( )∑ ∑∑∑∑

−•

−•=

22 xxn

yxxynb =

==∑n

yy

==∑n

xx

xbya −= , logo a= Portanto, y = a + bx y = c) Gráfico da reta obtida

d) Custo para 16 unidades Como x = quantidade e y = custo, basta calcularmos o valor de y quando

Custo y 150 -140 -130 -120 -110 -100 -

| | | | | | x 10 11 12 13 14 15 quantidade

y=

68

x = 16. Assim: y = y = Logo, o custo para 16 unidades será : e) Custo para 8 unidades

69

EXERCÍCIO 1. Ajustar uma reta aos dados:

X 1 2 3 4 5 6 7 8 Y 3 3 5 6 6 7 8 9

2. Sendo: Idade da casa (meses) X 12 15 18 24 30 36 Aluguel (R$) Y 170 150 130 140 100 80

a) Construir o diagrama de dispersão b) Ajustar uma reta aos dados c) Traçar a reta obtida no diagrama d) Qual seria o valor do aluguel para 21 meses?

70

APÊNDICE TABELA IV – Distribuição normal padrão

z

segunda decimal de z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2842 0,2843 0,2776 0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681

1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

3,0 0,00135 3,5 0,000233 4,0 0,0000317 4,5 0,00000340 5,0 0,000000287

71

4. APRESENTAÇÃO GRÁFICA DE DADOS

Os dados estatísticos, apresentados em tabelas, também podem ser expostos em gráficos, desde que não haja necessidade de grande precisão, os gráficos permitem ao observador uma leitura mais rápida do fenômeno representado.

Na apresentação gráfica de dados são necessários alguns cuidados: a)Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto; b) O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título acima do gráfico, porém a maioria dos estatísticos o coloca abaixo. c) No eixo das abscissas (eixo x), a escala cresce da esquerda para a direita e é escrita embaixo do eixo, como mostra o esquema:

d) No eixo das ordenadas (eixo y), a escala cresce de baixo para cima e é escrito à esquerda do eixo. Deve ser feitas setas para indicar a direção dos eixos. e)As variáveis representadas em cada eixo devem ser claramente identificadas. No eixo das ordenadas escreve-se o nome da variável na extremidade do eixo, no eixo das abscissas escreve-se o nome da variável embaixo da escala, como mostra no esquema abaixo:

f) A escala deve iniciar na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos (como por exemplo, 50, 51, etc), pode ser feita uma interrupção no eixo, com indicação clara da posição zero. Veja no esquema.

72

g) O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar: h) Os gráficos podem exibir, no rodapé, a fonte, isto é, a instituição, o pesquisador, ou o grupo de pesquisadores que forneceu o gráfico ou os dados que permitam a construção do gráfico.

i) Para facilitar a leitura, podem ser feitas linhas auxiliares. Nestes casos, o gráfico é feito dentro de retângulos, como mostra o esquema:

73

4.1 TIPOS DE GRÁFICOS

1- GRÁFICO DE BARRAS – GRÁFICO DE COLUNAS

O Gráfico de barras ou colunas é usado para representar séries cronológicas, geográficas e categóricas. Para entender como se faz um gráfico de barras, primeiro

observe a série cronológica apresentada na tabela abaixo.

Tabela 01. População presente no Brasil, segundo o ano do censo demográfico

Ano do censo demográfico População 1940 41.236.315 1950 51.944.397 1960 70.191.370

1970 (1) 93.139.037 1980 (1) 119.002.706

2000 169.872.859 FONTE: IBGE (2000) (1) População residente

Para apresentar os dados da tabela 01 em um gráfico de barras siga os seguintes

passos: a) trace o sistema de eixos cartesianos; escreva os anos no eixo das abscissas; a

população será representada no eixo das ordenadas. b) Construa barras retangulares para representar a população em cada ano de censo. As

barras terão base de mesma largura, mas a altura de cada barra será dada pela população no ano do censo;

c) As barras (colunas) serão separadas pela metade da largura de cada barra (preferentemente);

d) Coloque o título no gráfico. Observe o gráfico representativo da tabela 01.

Gráfico 01População presente no Brasil, segundo o ano de censo

demográfico

020000000400000006000000080000000

100000000120000000140000000160000000

180000000

1940 1950 1960 1970 (1) 1980 (1) 2000

Popula

ção

FONTE: IBGE (2000) (1) População residente

74

A apresentação gráfica de séries geográficas e cronológicas, através de gráficos de barras, é feita da mesma forma. Observe os dados da série geográfica apresentados na tabela 02 as regiões podem ser colocadas no eixo das abscissas; o número de pessoas de cada região pode ser apresentado no eixo das ordenadas, como mostra o gráfico 02 para facilitar a leitura foram feitas linhas auxiliares.

Tabela 02. População residente no Brasil, segundo a região, de acordo com o censo demográfico de 2000

Região População Norte 12.911.170

Nordeste 47.782.488 Sudeste 72.430.194

Sul 25.110.349 Centro-oeste 11.638.658

FONTE: IBGE (2000)

Gráfico 02População residente no Brasil, segundo a região, de acorso

com o censo demográfico de 2000

0

10000000

20000000

30000000

40000000

50000000

60000000

70000000

80000000

Norte Nordeste Sudeste Sul Centro-oeste

75

É preciso deixar claro, no entanto, que no caso dos dados da tabela 02 as barras

também podem ser construídas em posição horizontal. Para isso: a) trace o sistema de eixos cartesianos; apresenta as regiões no eixo das ordenadas e a

população no eixo das abscissas; b) construa barras iguais e com comprimento dado pelo número de pessoas de cada

região; as barras (colunas) serão separadas pela metade da largura de cada barra (preferentemente);

c) coloque o título no gráfico. Observe o gráfico representativo da tabela anterior.

Gráfico 03População residente no Brasil, segundo a região, de acordo com o censo demográfico de

2000

0 10.000.000 20.000.000 30.000.000 40.000.000 50.000.000 60.000.000 70.000.000 80.000.000

Norte

Nordeste

Sudeste

Sul

Centro-oeste

É mais comum a representação das barras ou colunas em posição vertical, como foi feito no gráfico 02 no entanto, as barras em posição horizontal facilitam a identificação da categoria, principalmente nos casos em que estas categorias têm nomes muito longos. Isto porque os nomes podem ser escritos em posição horizontal e por extenso, dispensando o uso de abreviaturas ou legendas.

Os dados de séries cronológicas devem ser apresentados em seqüência. Se, porém, os dados são de uma série categórica, ou mesmo de uma série geográfica, a apresentação das barras em ordem crescente (ou decrescente) ajuda na comparação da importância relativa das categorias. Como mostra o gráfico 04, é mais fácil interpretar o gráfico da direita (B) do que o gráfico apresentado à esquerda (A).

Gráfico 04. Dados fictícios

Dados fictícios (A)

012345678

A B C D

Dados fictícios (B)

0

1

2

3

4

5

6

7

8

B A D C

76

Os números e as palavras devem ser escritos fora das barras. Nos casos em que

os nomes são muito extensos recomenda-se usar uma legenda explicativa. OBSERVAÇÃO

O gráfico de barras, verticais ou horizontais, pode ser tridimensional. Observe o gráfico 05, referente a tabela 02.

NorteNordeste

SudesteSul

Centro-oeste

0

10.000.000

20.000.000

30.000.000

40.000.000

50.000.000

60.000.000

70.000.000

80.000.000

Gráfico 05População residente no Brasil, segundo a região, de acordo com o censo

demográfico de 2000

77

GRÁFICO DE LINHAS (LINEARES)

O gráfico de linhas é usado para apresentar séries cronológicas. Observe os dados da tabela 01. Para fazer o gráfico de linhas para a tabela 01, tomada como exemplo, segue-se os seguintes dado: a) trace o sistema de eixos cartesianos; no eixo das abscissas coloque os anos do censo.

No eixo das ordenadas apresente os dados da população; b) faça corresponder um ponto para cada par de valores da série. Por exemplo, para o par

(1949,41 milhões) faça um ponto; c) una os pontos por segmentos de reta; coloque o título no gráfico.

Gráfico 06População presente no Brasil, segundo o censo demográfico

0

20.000.000

40.000.000

60.000.000

80.000.000

100.000.000

120.000.000

140.000.000

160.000.000

180.000.000

1940 1950 1960 1970 (1) 1980 (1) 2000

População

78

GRÁFICO DE SETORES OU GRÁFICO DE TORTAS

O gráfico de setores é usado para comparar proporções. Observe os dados fictícios

apresentados na tabela 03.

Tabela 03. Distribuição de alunos da 1ª série do Grupo Escolar “Maria Conceição”, segundo a situação em relação as notas

Situação Freqüência Percentual

Promovido 12 50,0 Em recuperação 8 33,3 Retido 4 16,7

Total 24 100,0

A comparação das proporções, no caso deste exemplo e de outros similares, fica fácil ser for construído um gráfico de setores.

Gráfico 07Distribuição de alunos da 1ª série do Colégio Dom Pedro,

segundo a situação em relação as notas

50%

33%

17%

promovido

Em recuperação

Retido

Gráfico 08Distribuição de alunos da 1ª série do Colégio Dom Pedro,

segundo a situação em relação as notas

Retido17%

promovido50%Em

recuperação33%

79

GRÁFICO COMPARTIVO

Muitas vezes são desenhados dois gráficos, lado a lado, para melhor estabelecer a comparação de um fenômeno. Outras vezes, os dados obtidos em situações distintas são sobrepostas na mesma figura, para evidenciar a comparação. Os gráficos são desenhados da meneira comum, mas são colocados juntos para facilitar a comparação.

Observe a série cronológica apresentada na tabela 04, para a apresentação gráfica desses dados pode ser feito o gráfico de barras (gráfico 09), ou gráfico de linhas (gráfico 10), nestes gráficos se estabelece uma comparação entre população urbana e população rural.

Tabela 4. População residente no Brasil, urbana e rural,

segundo o ano do censo demográfico

Ano do censo Demográfico

População Urbana Rural

1940 (1) 12 880 182 28 356 133 1950(1) 18 782 891 33 161 506

1960 31 303 034 38 767 423 1970 52 084 984 41 054 053 1980 80 436 409 38 566 297 2000 137 925 238 31 947 618

Fonte: IBGE (2000) (1) População presente.

Gráfico 09População residente no Brasil, urbana e rural, segundo o ano do censo demográfico

0

20

40

60

80

100

120

140

160

1940 (1) 1950(1) 1960 1970 1980 2000

Mil

es

Urbana

Rural

80

Gráfico 09População residente no Brasil, urbana e rural, segundo o ano do censo demográfico

0

20

40

60

80

100

120

140

160

1940 (1) 1950(1) 1960 1970 1980 2000

Mil

es

Urbana

Rural

Os gráficos 09 e 10 mostram melhor do que a tabela 5, que as populações urbana e rural têm, no Brasil, tendências diferentes de crescimento. Enquanto a população das cidades aumenta rapidamente, a população do campo cresceu cada vez mais lenta até 1970 e diminui na última década.

Além destes gráficos comparativos pode-se ter os gráficos de área (gráfico 11).

Gráfico 11População residente no Brasil, urbana e rural, segundo o ano do censo demográfico

0

20

40

60

80

100

120

140

160

180

1940 (1) 1950(1) 1960 1970 1980 2000

Mil

es

Rural

Urbana

81

EXERCÍCIOS APRESENTAÇÃO GRÁFICA DE DADOS

01. Faça um gráfico de barras para apresentar os valores de densidade demográfica,

segundo a região.

Tabela.P01. Densidade demográfica no Brasil, segundo a região, de acordo com o censo demográfico de 1980

Região Densidade (hab/km2) Norte

Nordeste Sudeste

Sul Centro-oeste

1,65 22,57 56,31 33,86 4,01

Fonte: IBGE (1980) 02. Faça um gráfico de linha para representar o crescimento em altura de crianças do sexo

masculino.

Tabela.P02. Altura média de crianças do sexo masculino no Rio de Janeiro em 1975, segundo a idade

Idade (anos) Altura média (cm) 7 8 9 10 11 12

119,7 124,4 129,3 134,1 139,2 143,2

Fonte: IBGE (1977) 03. Desenhe gráficos para representar os valores de temperatura segundo o mês, nas cidades do Rio de Janeiro e de São Paulo. Note que é preciso fazer dois gráficos, um para cada cidade. Faça um gráfico comparativo entre as duas cidades.

82

Tabela.P03. Temperatura do ar, segundo o mês, nas cidades de Rio de Janeiro e São Paulo, em 1983

Idade (anos) Temperatura (ºC) Rio de Janeiro São Paulo

Janeiro Fevereiro

Março Abril Maio

Junho Julho

Agosto Setembro Outubro

Novembro Dezembro

26,6 27,0 26,0 24,4 24,0 21,5 24,6 20,6 20,6 22,6 24,4 25,2

22,5 23,1 21,2 20,7 19,2 19,7 17,6 17,0 15,9 18,8 21,4 21,8

Fonte: IBGE (1977)

BIBLIOGRAFIA

MARTINS, Gilberto de Andrade. Princípios de estatística / Gilberto de Andrade

MARTINS, Denis Donaire. São Paulo: Atlas, 1979.

VIEIRA, Sonia e HOFFMANN, Rodolfo. Elementos de Estatística. São Paulo: Atlas, 1990.

LAPPONI, Juan Carlos. Estatística: Usando Excel: – São Paulo: Lapponi Treinamento e

Editora Ltda, 2000.

CRESPO, Antônio Arnot. Estatística Fácil, - 17. ed. – São Paulo: Saraiva, 2002.

STEVENSON, William J. Estatística Aplicada à Administração; tradução Alfredo Alves de

Farias. – São Paulo:Harper & Row do Brasil, 1981.

TIBONI, Conceição Gentil Rebelo. Estatística Básica para o Curso de Turismo – 2. ed – São Paulo: Atlas, 2003.

BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Florianópolis:

Editora da UFSC, 1994 BONINI, Edmundo Eboli e BONINI, Sergio Eboli. Estatística: Teoria e exercícios. São

Paulo: Loyola, 1990. GENTIL, Nelson; SANTOS, Carlos A. Marcondes; GRECO, Antônio Carlos;

BELLOTO FILHO, Antônio; GRECO, Sérgio Emílio. Matemática para o 2º Grau. São Paulo: Ática.

HOFFMANN, Rodolfo. Estatística para economistas. São Paulo: Pioneira, 1980.

83

KARMEL, Peter Henry & Polaser. Estatística geral e aplicada para economistas. São Paulo: Atlas, 1972.

KAZMIER, Leonard J. Estatística aplicada à economia e administração. São Paulo:

McGraw-Hill do Brasil, 1982. (ColeçãoSchuman). MATINS, Gilberto de Andrade. Princípios de estatística. São Paulo: Atlas, 1990. SPIEGEL, Murray Ralph. Estatística: resumo da teoria. São Paulo: Mc Graw-Hill,

1974. (Coleção Schaunn). TOLEDO, Geraldo Luciano & OVALLE, Ivo. Estatística básica. São Paulo: Atlas. VIEIRA, Sônia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo: Atlas, 1986.