Estatistica de acidente de trabalho 2007-2012 e as situações ...
21631 estatistica
-
Upload
independent -
Category
Documents
-
view
0 -
download
0
Transcript of 21631 estatistica
Esta Publicação é propriedade do GICEA, Gabinete de Gestão de iniciativas comunitárias.
Este produto é protegido pelas leis em vigor e copyright, estando reservados todos os seus direitos. Não pode ser reproduzido nem transcrito por qualquer processo seja ele qual for sem autorização dos titulares do direito. Os infractores são passíveis de procedimento judicial.
Índice
Guia de exploração ........................................................................ 1
Capítulo 1 ..................................................................................... 3
Introdução histórica ....................................................................... 4 Objecto da Estatística..................................................................... 5 População, Amostra e Unidade Estatística ......................................... 5 Variáveis Estatísticas...................................................................... 7 Classificação da Estatística.............................................................. 9 Aplicações da Estatística ................................................................10
Capítulo2.....................................................................................12
Recolha e classificação de dados.....................................................13 Quadros de Frequências ................................................................15 Tabelas de Frequências para variáveis discretas ...............................17 Tabela de Frequências para variáveis contínuas................................18
Capítulo 3 ....................................................................................20
Representação tabular de dados .....................................................21 Diagrama de caule e folhas ............................................................22 Representação gráfica de dados estatísticos e de frequências ..................................................................................24 Diagrama por pontos.....................................................................25 Gráficos de Barras e Histogramas ...................................................26 Gráficos de Barras ........................................................................26 Histograma ..................................................................................29 Polígonos de frequências (simples e acumuladas) .............................30 Função cumulativa ........................................................................32 Variáveis discretas ........................................................................32 Variáveis contínuas .......................................................................33 Curvas de frequência e ogivas ........................................................35 Gráficos circulares ........................................................................36 Pictogramas .................................................................................39 Outros Tipos de Gráficos................................................................40 Gráfico de rectângulo ....................................................................40 Gráfico de linhas...........................................................................41 Diagrama de quadrados.................................................................42 Pirâmide etária .............................................................................43 Série regional ou geográfica...........................................................44 Gráficos mal construídos................................................................46
Capítulo 4 ....................................................................................47
Medidas de tendência central .........................................................48 Moda, média e mediana.................................................................48 Moda...........................................................................................48 Média ..........................................................................................50 Mediana ......................................................................................51 Comparação entre a moda, a mediana e a média..............................53 Quantis .......................................................................................56 Diagrama de extremos e quartis .....................................................57 Medidas de dispersão ....................................................................60 Amplitude, desvio e desvio médio. ..................................................61 Variância e desvio padrão ..............................................................62 Variância .....................................................................................62 Desvio padrão ..............................................................................62 Comparação entre as medidas de dispersão .....................................63 Influência da alteração dos valores da variável na média e no desvio padrão ..............................................................64
Capítulo 5 ....................................................................................66
Distribuições bidimensionais...........................................................67 Diagrama de Dispersão .................................................................67 Coeficiente de correlação linear ......................................................72 Recta de Regressão.......................................................................74
Capítulo 6 ....................................................................................76
Apresentação ...............................................................................77 Problema 1 - Os Pacotes do Açúcar .................................................77 Problema 2 - O Lançamento do Peso ...............................................78 Calculadoras Gráficas ....................................................................79 Folha de Cálculo .........................................................................102
Capítulo 7 ..................................................................................126
Bibliografia ................................................................................127
Anexo I .....................................................................................128
Cálculo de Classes ......................................................................129
Anexo II ....................................................................................130
Sites Nacionais ...........................................................................131 Sites Internacionais ....................................................................133
Índice de figuras
Figura 1 – Variáveis Estatísticas....................................................... 8
Figura 2 – Classificação da Estatística............................................... 9
Figura 3 – Recolha e classificação de dados......................................14
Figura 4 – Caule e folhas (idades dos empregados de um escritório - versão 1)...................................................................22
Figura 5 – Caule e folhas (idades dos empregados de um escritório - versão 2)...................................................................23
Figura 6 – Caule e folhas (comparação das classificações de dois testes).........................................................................24
Figura 7 – Diferentes tipos de correlação .........................................73
Figura 8 – Escala de correlação ......................................................73
Figura 9 – Menu estatístico ............................................................79
Figura 10 – Listas de dados............................................................79
Figura 11 – Ordenação de dados 1..................................................80
Figura 12 – Ordenação de dados 2..................................................80
Figura 13 – Ordenação de dados 3..................................................80
Figura 14 –Cálculo de medidas estatísticas 1....................................81
Figura 15 – Cálculo de medidas estatísticas 2...................................81
Figura 16 – Definição do tipo de gráfico 1 ........................................82
Figura 17 – Definição do tipo de gráfico 2 ........................................82
Figura 18 – Representação de Histograma 1 ....................................83
Figura 19 – Definição da janela 1....................................................83
Figura 20 – Definição da janela 2....................................................83
Figura 21 – Representação do Histograma 2 ....................................84
Figura 22 – Estudo do Histograma ..................................................84
Figura 23 – Representação do diagrama de extremos e quartis ..........84
Figura 24 – Estudo do diagrama de extremos e quartis......................85
Figura 25 – Representação da caixa de bigodes ................................85
Figura 26 – Estudo da caixa de bigodes ...........................................85
Figura 27 – Menu estatístico...........................................................86
Figura 28 – Lista de dados 1 ..........................................................86
Figura 29 – Lista de dado 2............................................................86
Figura 30 – Definição do tipo de gráfico 1 ........................................87
Figura 31 – Definição do tipo de gráfico 2 ........................................87
Figura 32 – Representação da nuvem de pontos ...............................88
Figura 33 – Diagnostic On..............................................................88
Figura 34 – Determinação da recta de regressão ..............................89
Figura 35 – Cálculo do coeficiente de correlação linear ......................89
Figura 36 – Equação da recta de regressão ......................................90
Figura 37 – Representação da recta de regressão .............................90
Figura 38 – Estudo do diagrama de dispersão...................................90
Figura 39 – Menu estatístico...........................................................91
Figura 40 – Introdução de dados 1..................................................91
Figura 41 – Introdução de dados 2..................................................91
Figura 42 – Ordenação de dados 1..................................................92
Figura 43 – Ordenação de dados 2..................................................92
Figura 44 – Cálculo de medidas estatísticas 1...................................92
Figura 45 – Cálculo de medidas estatísticas 2...................................93
Figura 46 – Leitura das medidas estatísticas ....................................93
Figura 47 – Voltar à lista de dados ..................................................93
Figura 48 – Definição do tipo de gráfico...........................................94
Figura 49 – Definição do Histograma...............................................94
Figura 50 – Construção do Histograma 1 .........................................94
Figura 51 – Alteração manual da janela ...........................................95
Figura 52 – Construção do Histograma 2 .........................................95
Figura 53 – Construção do Histograma 3 .........................................96
Figura 54 – Alteração manual da janela 2 ........................................96
Figura 55 – Construção do Histograma 4 .........................................96
Figura 56 – Estudo do Histograma ..................................................97
Figura 57 – Construção do diagrama de extremos e quartis ...............97
Figura 58 – Estudo do diagrama de extremos e quartis......................97
Figura 59 – Menu estatístico...........................................................98
Figura 60 – Introdução dos dados ...................................................98
Figura 61 – Definição do tipo de gráfico...........................................98
Figura 62 – Definição do diagrama de extremos e quartis ..................99
Figura 63 – Definição da frequência relativa .....................................99
Figura 64 – Construção da nuvem de pontos 1 .................................99
Figura 65 – Construção da nuvem de pontos 2 ...............................100
Figura 66 – Cálculo da equação da recta de regressão e do coeficiente de correlação..............................................100
Figura 67 – Desenhar a recta de regressão 1 .................................100
Figura 68 – Menu Graph ..............................................................101
Figura 69 – Desenhar a recta de regressão 2 .................................101
Figura 70 – Estudo da recta de regressão ......................................101
Figura 71 – Introdução de dados na folha de cálculo .......................102
Figura 72 – Ordenação de dados...................................................103
Figura 73 – Medidas estatísticas ...................................................103
Figura 74 – Assistente de funções 1 ..............................................104
Figura 75 – Assistente de funções 2 ..............................................104
Figura 76 – Assistente de funções 3 ..............................................105
Figura 77 – Cálculo da média .......................................................105
Figura 78 – Cálculo do desvio padrão ............................................106
Figura 79 – Assistente de funções 4 ..............................................106
Figura 80 – Assistente de funções 5 ..............................................107
Figura 81 – Assistente de funções 6 ..............................................107
Figura 82 – Determinação dos quartis ...........................................107
Figura 83 – Tabela de frequências.................................................108
Figura 84 – Assistente de gráficos 1 ..............................................109
Figura 85 – Assistente de gráficos 2 ..............................................109
Figura 86 – Assistente de gráficos 3 ..............................................110
Figura 87 – Assistente de gráficos 4 ..............................................110
Figura 88 – Assistente de gráficos 5 ..............................................111
Figura 89 – Assistente de gráficos 6 ..............................................111
Figura 90 – Histograma 1 ............................................................112
Figura 91 – Histograma 2 ............................................................112
Figura 92 – Assistente de gráficos 7 ..............................................113
Figura 93 – Assistente de gráficos 8 ..............................................113
Figura 94 – Histograma 3 ............................................................114
Figura 95 – Introdução de dados ..................................................115
Figura 96 – Assistente de gráficos 9 ..............................................116
Figura 97 – Assistente de gráficos 10 ............................................117
Figura 98 – Assistente de gráficos 11 ............................................117
Figura 99 – Assistente de gráficos 12 ............................................118
Figura 100 – Assistente de gráficos 13 ..........................................118
Figura 101 – Nuvem de pontos 1 ..................................................119
Figura 102 – Nuvem de pontos 2 ..................................................119
Figura 103 – Assistente de funções 7 ............................................120
Figura 104 – Assistente de funções 8 ............................................120
Figura 105 – Assistente de funções 9 ............................................121
Figura 106 – Assistente de funções 10...........................................121
Figura 107 – Determinação do coeficiente de correlação linear .........121
Figura 108 – Linha de tendência 1 ................................................122
Figura 109 – Linha de tendência 2 ................................................122
Figura 110 – Linha de tendência 3 ................................................123
Figura 111 – Recta de regressão 3................................................123
Figura 112 – Previsões 1 .............................................................124
Figura 113 – Previsões 2 .............................................................124
Índice de tabelas
Tabela 1 – População residente no Alentejo......................................16
Tabela 2 – Frequências (Número de irmãos) ....................................17
Tabela 3 – Frequências (Alturas em cm dos alunos do 9º ano) ...........19
Tabela 4 – Dados (Número de medalhas ganhas por país em Sydney 2000)...............................................................21
Tabela 5 – Idades dos empregados de um escritório .........................22
Tabela 6 – Classificações de dois testes ...........................................23
Tabela 7 – Consumo interno de água engarrafada de 1987 a 1998 .....25
Tabela 8 – Número de alunos por sexo ............................................26
Tabela 9 – Frequências acumuladas do número de irmãos .................32
Tabela 10 – Alturas de alunos ........................................................34
Tabela 11 – Frequência relativa de alunos por sexo...........................37
Tabela 12 – Consumo de Vinho por regiões do país...........................40
Tabela 13 – Novos fogos construídos (versão 1) ...............................42
Tabela 14 – Novos fogos construídos (versão 2) ...............................43
Tabela 15 – Idades das empregadas ...............................................48
Tabela 16 – Preços de viagens........................................................50
Tabela 17 – Resumo das características das medidas de tendência central.........................................................................55
Tabela 18 – Localização do Q1 e Q3 .................................................56
Tabela 19 – Temperaturas máximas................................................57
Tabela 20 – Tempo de duração de lâmpadas ....................................59
Tabela 21 – Salários da empresa A .................................................60
Tabela 22 – Salários da empresa B .................................................60
Tabela 23 – Calculo da média e do desvio padrão .............................64
Tabela 24 – Marcas do lançamento do peso nos Jogos Olímpicos ........68
Tabela 25 – Comprimento do salto e peso do atleta ..........................69
Tabela 26 – Pressão atmosférica e temperatura................................70
Tabela 27 – Temperatura / Tempo de coagulação do sangue..............71
Tabela 28 – Altitudes e temperaturas ..............................................74
Tabela 29 – Peso dos pacotes de açúcar ..........................................78
Tabela 30 – Lançamento do peso....................................................78
Índice de gráficos
Gráfico 1 – Produção de vinho na região demarcada do Douro............24
Gráfico 2 – Consumo interno de água engarrafada de 1987 a 1998.....26
Gráfico 3 – Construção de um gráfico de barras verticais ...................27
Gráfico 4 – Gráfico de barras horizontais .........................................28
Gráfico 5 – Barras representadas por figuras....................................28
Gráfico 6 – Gráfico de barras verticais em profundidade ....................28
Gráfico 7 – Barras horizontais em profundidade................................29
Gráfico 8 – Duas ou mais barras para cada variável ..........................29
Gráfico 9 – Histograma da distribuição das alturas dos alunos de uma turma...................................................................30
Gráfico 10 – Polígono de frequências (Tempo de chegada ao Centro de Formação).....................................................31
Gráfico 11 – Polígono de frequências acumuladas (Tempo de chegada ao Centro de Formação)....................................31
Gráfico 12 – Função cumulativa para varáveis discretas.....................33
Gráfico 13 – Função cumulativa para variáveis contínuas...................34
Gráfico 14 – Curva de acumulação de frequências ou ogiva................35
Gráfico 15 – Gráfico circular ...........................................................38
Gráfico 16 – Gráfico circular (Principais importadores de vinho do Porto – 1998) ...............................................................38
Gráfico 17 – Pictograma (Venda de veículos ligeiros de passageiros).................................................................39
Gráfico 18 – Gráfico de rectângulos.................................................41
Gráfico 19 – Gráfico de linhas (evolução do número de óbitos por VHI) ............................................................................41
Gráfico 20 – Gráfico de quadrados (Novos fogos construídos).............43
Gráfico 21 – Pirâmide etária...........................................................44
Gráfico 22 – Série regional ou geográfica 1 ......................................44
Gráfico 23 – Série regional ou geográfica 2 ......................................45
Gráfico 24 – Série regional ou geográfica 3 ......................................45
Gráfico 25 – Pictograma mal construído...........................................46
Gráfico 26 – Gráfico de barras mal construído ..................................46
Gráfico 27 – Determinação geométrica da moda...............................50
Gráfico 28 – Determinação geométrica da mediana...........................52
Gráfico 29 – Diagrama de extremos e Quartis ..................................58
Gráfico 30 – Diagrama de extremos e quartis partindo de um gráfico de frequências acumuladas..................................59
Gráfico 31 – Correlação ano /distância do lançamento do peso ...........68
Gráfico 32 – Correlação comprimento do salto /peso do atleta............70
Gráfico 33 – Correlação temperatura / pressão atmosférica ...............70
Gráfico 34 – Correlação temperatura / tempo de coagulação do sangue ........................................................................71
Gráfico 35 – Recta de regressão .....................................................75
Índice de fórmulas
Fórmula 1 – Frequência absoluta acumulada ....................................15
Fórmula 2 – Frequência relativa......................................................16
Fórmula 3 – Frequência relativa acumulada......................................16
Fórmula 4 – Função cumulativa para variáveis discretas ....................32
Fórmula 5 – Localização da moda dentro da classe modal ..................49
Fórmula 6 – Média aritmética .........................................................50
Fórmula 7 – Determinação da mediana............................................53
Fórmula 8 – Variância ...................................................................62
Fórmula 9 – Desvio padrão ............................................................62
Fórmula 10 – Coeficiente de correlação linear...................................72
Fórmula 11 – Coeficiente de regressão ............................................75
1
Guia de exploração
O presente manual está estruturado com 5 capítulos iniciais onde são introduzidos os conceitos teóricos para o estudo da Estatística assim como alguns exemplos.
Sendo um dos principais objectivos deste trabalho a utilização de novas tecnologias no estudo da Estatística, é apresentado um sexto capítulo onde são resolvidos dois problemas com recurso à utilização de calculadoras gráficas assim como de computadores.
O formador deverá utilizar as indicações fornecidas no Capítulo 6 de forma transversal, isto é, a utilização das calculadoras gráficas e dos computadores deve acompanhar todos os conteúdos apresentados nos 5 primeiros capítulos deste manual.
Os conteúdos estão adaptados, de um modo geral, aos diversos módulos de Estatística para o nível III da Formação Profissional.
Cada formador poderá utilizar como complemento deste manual, o Manual de Exercícios de Estatística e a Bateria de Acetatos de Estatística, dos mesmos autores, podendo a utilização adequada destes três produtos dar origem à elaboração de planos de sessão estruturados científica e pedagogicamente.
Este manual é ainda complementado com um anexo onde se podem encontrar uma lista comentada de sites da Internet, nacionais e internacionais, onde se podem encontrar informações de caracter científico e dados estatísticos para a elaboração de novas questões.
A utilização das calculadoras gráficas na formação em Estatística deve ser considerada não só uma ferramenta facilitadora do cálculo mas também com uma forte componente pedagógica. Neste sentido, será útil que o formador disponha de um projector de dados apropriado à projecção da janela da sua calculadora gráfica, e que os formandos possam dispor também, individualmente ou em pequenos grupos, de calculadoras gráficas.
No presente manual, para facilitar a compreensão de alguns conceitos teóricos assim como cálculos, escolheram-se por vezes exemplos menos adaptados à realidade, porém com a utilização da calculadora gráfica podem ser tratados qualquer tipo de dados sem qualquer dificuldade, podendo assim ser tratados problemas relacionados com a vida real,
2
particularmente com a área de formação do formando, pelo que a maioria das questões apresentadas no Manual de Exercícios de Estatística são deste tipo.
Em sala de formação equipada com computadores, pode-se recorrer à folha de cálculo em alternativa às calculadoras gráficas. Nesta situação, são também apresentadas no Capítulo 6 um conjunto de indicações sobre a utilização da folha de cálculo no estudo da Estatística.
Dos mesmos autores está ainda disponível um CD ROM que além de integrar o presente Manual de Estatística, o Manual de Exercícios de Estatística e a Bateria de Acetatos de Estatística, referidos anteriormente, contém ainda referências a software de Estatísca, disponibilizando mesmo alguns programas.
Embora a avaliação dos formandos não seja objectivo deste manual, nem dos restantes produtos, a verificação e a consolidação dos conhecimentos adquiridos pode ser feita, de uma forma tradicional, com o apoio do Manual de Exercícios de Estatística, ou de uma forma lúdica, utilizando jogos didácticos. Para facilitar o trabalho do formador, a equipa que preparou estes produtos, criou e produziu dois jogos para serem utilizados pelos formandos, encontrando-se um disponível no CD ROM e o outro, denominado O Presidente, disponível em formato clássico de caixa com tabuleiro, e que pode ser utilizado por um máximo de 6 jogadores.
3
Capítulo 1
Iniciação à Estatística
Introdução histórica
Objecto da Estatística
População, Amostra e Unidade Estatística
Variáveis Estatísticas
Classificação da Estatística
Aplicações da Estatística
Capítulo 1: Iniciação à Estatística
4
Introdução histórica
A estatística tem evoluído muito nos últimos anos, mas desde sempre que o homem tem sentido necessidade de recolher informação.
O recenseamento geral de uma população é uma prática que remonta à antiga Roma e Egipto. O seu objectivo principal era obter informação para a colecta de impostos, chamada para o serviço militar e outros assuntos governamentais.
Durante a Idade Média, registaram-se alguns dados sobre epidemias e terramotos que podem ser considerados como uma espécie de levantamento estatístico.
Foi já no sec. XVIII que surgiu o primeiro levantamento de dados a nível nacional.
Foi também no sec XVIII que surgiu o termo “Staatenkunde” - traduzido para português como Estatística - pelo professor Achenwall, como “ciência das coisas do estado” visto que era o Estado que organizava e produzia esses estudos.
Começou-se assim a fazer tratamentos estatísticos de fenómenos sociais e demográficos.
No sec XVIII, Bayes foi o primeiro matemático a aplicar a teoria das probabilidades no previsão de fenómenos, baseado em levantamentos estatísticos.
Na sua origem a estatística estava ligada ao Estado. Hoje, não só se mantém esta ligação, como todos os estados e a sociedade em geral dependem cada vez mais dela, tornando-se assim indispensável ao cidadão do sec XXI.
Capítulo 1: Iniciação à Estatística
5
Objecto da Estatística
Numa sociedade baseada na tecnologia e na comunicação, recolher, organizar, descrever, exibir e interpretar dados, tomar decisões ou fazer previsões com base nessa informação tem cada vez mais importância.
O estudo da estatística realça a importância de questionar, conjecturar e procurar relações quando se formulam e resolvem problemas do mundo real.
O estudo estatístico incide fundamentalmente sobre situações que, por estarem sujeitas a múltiplas influências raramente se podem representar por uma lei matemática simples ou por um modelo determinado.
A estatística é um ramo da matemática que estuda uma ou várias características ou propriedades de uma população, e que permite estabelecer previsões que facilitem a tomada de decisões assim como interpretar e explicar a realidade.
A estatística aparece no mundo actual como resposta à complexidade de problemas que não permitem uma solução através de um único modelo com uma resposta exacta. Para resolver estes problemas utiliza--se um conjunto de técnicas e instrumentos que conjuntamente dão respostas aproximadas, com níveis de erro controlados.
População, Amostra e Unidade Estatística
A maior parte das situações em que é necessário utilizar técnicas estatísticas , envolve a necessidade de tirar conclusões gerais acerca de um grande número de indivíduos , recorrendo a num número restrito desses indivíduos. Surgem assim os conceitos de População e Amostra.
Exemplos:
1- Para se conhecerem as intenções de voto nas próximas eleições, pode-se fazer um inquérito. Este não pode ser feito a toda a população. Escolhe-se então um grupo significativo de pessoas que vão
Capítulo 1: Iniciação à Estatística
6
constituir a amostra, sendo a população formada por todos os indivíduos com direito a voto.
2- O departamento de controle de qualidade de uma fábrica de pilhas pretende analisar a duração de determinado tipo de pilhas. É claro que não é possível experimentar todas as pilhas que formam a população, assim escolhe-se um lote de pilhas que constituem a amostra.
População é o conjunto de indivíduos com qualquer característica em comum e com interesse para o estudo em causa.
Em estatística a palavra população não só se refere a pessoas, mas também a objectos e acontecimentos.
A cada um dos elementos de uma população chama-se unidade estatística.
Amostra é um subconjunto finito da população que se supõe representativo desta.
Em muitas situações torna-se aconselhável, ou mesmo necessário recorrer a uma amostra em vez da população porque :
• a população é em número infinito
• a observação da população é muito dispendiosa ou leva muito tempo
• para levar a efeito a observação haveria destruição generalizada dos elementos da população.
A generalização dos resultados obtidos através do estudo de uma amostra comporta sempre um certo erro, todavia podemos considerar que a estimativa da característica populacional em estudo é útil se a amostra utilizada for representativa da população.
Quando uma amostra não é representativa da população, diz-se que é enviesada. A sua utilização para estimar características da população pode ter consequências graves, na medida em que a amostra tem propriedades que não reflectem as propriedades da população.
Por exemplo se considerarmos a amostra formada pelos jogadores da equipa de basquetebol de uma determinada escola para estudar as alturas dos alunos da escola, concluiríamos que os estudantes são mais altos do que na realidade o são.
Para escolher adequadamente uma amostra deve-se ter em conta alguns aspectos tais como:
Capítulo 1: Iniciação à Estatística
7
• todos os indivíduos da população devem ter igual probabilidade de serem seleccionados;
• deve conter em proporção tudo o que a população possui, qualitativa e quantitativamente;
• deve ser suficientemente larga, de modo a que as características da amostra se aproximem, tanto quanto possível, das características da população.
Existem algumas técnicas científicas para seleccionar uma amostra. Os tipos de amostras mais utilizadas são:
• Amostra aleatória, onde qualquer elemento tem a mesma probabilidade de ser escolhido, a escolha é feita ao acaso.
• Amostra estratificada, é utilizada quando a população apresenta grupos diferenciados. Assim, divide-se a população em grupos tão homogéneos quanto possível e selecciona-se em cada grupo uma parte proporcional à sua dimensão.
Variáveis Estatísticas
No estudo de uma população, podem-se encontrar muitas características, também designadas por carácteres ou atributos.
A cada característica estudada numa dada população chama-se variável estatística.
Por exemplo no conjunto dos alunos de uma determinada escola podemos estudar
• a cor dos olhos
• a altura
• os desportos preferidos
• a idade
Nas características anteriores encontram-se algumas que se podem traduzir na forma de um valor numérico e outras que não são quantificáveis, traduzindo-se por qualidades, categorias ou preferências.
Capítulo 1: Iniciação à Estatística
8
As variáveis estatísticas que exprimem uma qualidade, não se podendo traduzir numericamente são chamadas Variáveis Qualitativas . Como exemplos temos a cor dos olhos ou os desportos preferidos.
Uma variável qualitativa pode tomar diversas formas, às quais se chamam modalidades. Azul, verde, castanho ... , são modalidades da variável qualitativa “cor dos olhos”.
As variáveis qualitativas podem ser ou não ordenáveis. As que podem ser ordenáveis denominam-se ordinais. Por exemplo, o nível de instrução é uma variável ordinal, uma vez que os valores que esta variável toma são 1º ciclo, 2º ciclo, 3º ciclo, etc..
As que não são ordenáveis, denominam-se nominais e é um exemplo deste tipo de variáveis, a profissão.
Quando uma variável estatística pode ser medida , sendo representada por um número, diz-se uma Variável Quantitativa .
As variáveis quantitativas podem ainda ser dividida em dois tipos :
Variável quantitativa discreta, é aquela que só pode tomar valores isolados, como por exemplo o número de irmãos ou o número de golos marcados num dado jogo.
Variável quantitativa contínua, é aquela que pode tomar qualquer valor de um dado intervalo, [ [21, xx , de números reais, como por exemplo a altura ou o peso de uma pessoa ou o tempo gasto por cada aluno no percurso casa – escola.
Figura 1 – Variáveis Estatísticas
Por vezes, a classificação de uma variável quantitativa em discreta ou contínua levanta algumas dúvidas. Por exemplo a variável “idade”, na maior parte das vezes é considerada discreta, pois quando se pergunta a idade a alguém é normal que a resposta seja um número inteiro. No
Variáveis estatísticas
Quantitativa Qualitativa
Discreta Contínua
Capítulo 1: Iniciação à Estatística
9
entanto trata-se de uma variável contínua pois a diferença de idades de duas pessoas pode ser tão pequena quanto se queira, um ano, um mês, uma semana, um dia...
Classificação da Estatística
Para fazer o estudo estatístico de uma população consideram-se normalmente duas fases distintas.
Uma primeira fase consiste em recolher os dados, organizá-los em tabelas ou gráficos e condensar a informação em valores que traduzam satisfatoriamente as características da totalidade dos dados. Nesta fase utiliza-se a Estatística Descritiva, cuja finalidade é descrever certas propriedades de um conjunto de dados. A estatística descritiva pode ser aplicada tanto à amostra como à população.
Conhecidos os resultados de uma amostra, entra-se numa segunda fase, onde se procura tirar conclusões sobre a totalidade da população, generalizando os resultados obtidos através da amostra. Entra-se então no campo da Estatística Indutiva.
A Estatística Indutiva é um método de investigação muito importante, pois facilita a tomada de decisões, permitindo prever a evolução de determinados conhecimentos.
Figura 2 – Classificação da Estatística
Estatística Indutiva
População Amostra
Estudo da amostra
Características da amostra
Características da população
Estatística Descritiva
Capítulo 1: Iniciação à Estatística
10
Exemplos de situações nas quais se utiliza a Estatística Descritiva:
• Consumo de leite na população portuguesa
• Volume das exportações portuguesas nos últimos anos
• Acidentes de viação nas estradas portuguesas
Exemplos de situações em que se utiliza a Estatística Indutiva
• Previsão de resultados eleitorais
• Previsão do crescimento económico
• Previsões demográficas
Podemos ainda analisar os dados obtidos e procurar estabelecer relações entre os fenómenos em estudo. Este processo designa-se por Estatística Analítica.
A utilização da Estatística como um método científico ao serviço dos diferentes ramos do saber, constitui a Estatística Aplicada, da qual é exemplo a Bioestatística.
Aplicações da Estatística
A estatística está presente no dia a dia da nossa sociedade, sendo utilizada em diversas situações:
• veicular informação nos diversos órgãos de comunicação (jornais, revistas, televisão, rádio, internet, ... );
• sondar a opinião pública ( preferências , hábitos,... );
• fundamentar previsões ( evolução da população, do mercado, de recordes, ... );
• justificar tomadas de decisão (construção de escolas, incentivo ao consumo, ... ).
Com o desenvolvimento das novas tecnologias, nomeadamente a informática, torna-se mais fácil tratar a informação, pelo que, até a mais
Capítulo 1: Iniciação à Estatística
11
simples decisão económica como a comercialização de um produto não é tomada sem ter em conta os resultados estatísticos.
A Estatística tem grande importância em determinadas áreas, tais como a Economia, a Medicina, a Política, a Geografia, a Psicologia e muitas outras. A procura do conhecimento tem sido uma das preocupações constantes das pessoas que se dedicam a investigar, e a estatística tem vindo a desempenhar um papel cada vez mais importante na seriedade dos processos utilizados na procura da “verdade”.
Exemplos de aplicação da estatística:
• Na Economia, para determinar a comercialização de um produto, para calcular o prémio de um seguro ou para determinar a taxa de juro de um empréstimo bancário.
• Na Medicina, para estudar o efeito de um novo medicamento ou para saber qual o tipo de sangue cuja necessidade é maior numa emergência.
• Na Pedagogia, para o estudo de novos métodos de aprendizagem.
Capítulo 2: Distribuição de Frequências
13
Recolha e classificação de dados
Qualquer estudo estatístico tem como ponto de partida a recolha e posterior classificação dos dados.
Os dados a recolher podem ser de tipos diferentes e ter origens diversas.
Assim, os dados recolhidos directamente a partir da fonte originária denominam-se dados primários e aqueles que provêm já de uma recolha feita previamente chamam-se dados secundários.
Quanto à origem, os dados podem ser provenientes de uma fonte interna, se uma organização coloca dados seus à disposição dos seus órgãos de decisão, ou de uma fonte externa, se uma organização disponibiliza dados seus para outras organizações.
A recolha de dados pode ser feita de forma contínua (recolha de dados meteorológicos), periódica (censos populacionais) ou ocasional(sondagens).
Quanto aos métodos usados na recolha de dados, podem ser muito diversificados, como por exemplo, as entrevistas pelo telefone, o preenchimento de questionários escritos ou electrónicos, as entrevistas pessoais, etc..
Na fase de classificação dos dados procede-se à identificação de unidades de informação com características comuns e posteriormente ao seu agrupamento.
No esquema da página seguinte (figura 3) podemos verificar de forma resumida o que ficou dito anteriormente quanto à fonte dos dados e ao seu tipo, bem como quanto à periodicidade, métodos de recolha e classificação dos dados.
Capítulo 2: Distribuição de Frequências
14
!!!! entrevistas questionários entrevistas pelo telefone pessoais
Identificação de unidades de informação com características comuns e posterior
agrupamento.
Figura 3 – Recolha e classificação de dados
Tip
os
de f
on
tes
T
ipo
s d
e
dad
os
P
eri
od
icid
ad
e
M
éto
do
s d
e
reco
lha
Cla
ssif
icaçã
o
do
s d
ad
os
Fonte externa
de dados
Dados secundários
Dados primários
contínua
Fonte interna
de dados
periódica ocasional
Capítulo 2: Distribuição de Frequências
15
Quadros de Frequências
Após a recolha e classificação dos dados, torna-se necessário organizá--los em quadros e tabelas, de forma a que a sua leitura e interpretação se torne mais fácil.
Na construção destes quadros e tabelas é importante o conhecimento de noções como frequência absoluta, simples e acumulada e frequência relativa, simples e acumulada.
A partir do exemplo seguinte, iremos definir os diferentes tipos de frequências.
No ano de 1991, a população residente no Alentejo dividia-se da seguinte forma: 128 678 no Alto Alentejo, 173 216 no Alentejo Central, 98 519 no Alentejo Litoral e 143 020 no Baixo Alentejo.
Fonte: Instituto Nacional de Estatística
Neste exemplo, o número de residentes em cada sub-região do Alentejo designa-se por frequência absoluta.
Na organização de quadros e tabelas, as variáveis estatísticas são designadas por x, sendo x1 a primeira concretização da variável, x2 a segunda concretização da variável e xi a iézima concretização da variável, independentemente do tipo de variável.
A frequência absoluta de uma determinada variável x, é o número de vezes que essa variável ocorre e representa-se habitualmente por fi.
A frequência absoluta acumulada de uma variável é a soma das frequências absolutas anteriores com a frequência absoluta dessa variável, isto é
∑=
=i
iii fF
1
Fórmula 1 – Frequência absoluta acumulada
Capítulo 2: Distribuição de Frequências
16
A frequência relativa de uma variável é o quociente entre a frequência absoluta e o total de ocorrências N, isto é:
N
ffr i
i = ( ∈ifr [0,1]).
Fórmula 2 – Frequência relativa
A frequência relativa acumulada de uma variável é a soma das frequências relativas anteriores com a frequência relativa dessa variável, isto é:
∑=
=i
1irii fFr .
Fórmula 3 – Frequência relativa acumulada
Os valores da frequência relativa e da frequência relativa acumulada podem ser apresentados na forma de percentagem.
A partir do exemplo dado, podemos agora elaborar os quadros de frequência absoluta, de frequência absoluta acumulada, de frequência relativa e de frequência relativa acumulada.
Tabela 1 – População residente no Alentejo
fi
(frequência
absoluta)
Fi
(freq. absoluta
acumulada)
fri
(frequência
relativa)
Fri
(freq. relativa
acumulada) Alto
Alentejo 128 687 128 687 0,237 0,237
Alentejo Central 173 216 301 894 0,319 0,556
Alentejo Litoral 98 519 400 413 0,181 0,737
Baixo Alentejo 143 020 543 433 0,263 1
TOTAL (N)= 543433
Capítulo 2: Distribuição de Frequências
17
Na apresentação de um quadro de frequências devemos ter em atenção alguns aspectos relacionados com a sua construção, facilitadores da sua leitura e compreensão.
Título – relacionado com o conteúdo do quadro.
Núcleo do quadro – formado por linhas e colunas contendo os números e informações necessárias.
Total – apresenta-se entre traços horizontais e é facultativo em algumas tabelas.
Fonte – situa-se no rodapé e é obrigatória(excepto para dados hipotéticos).
Notas de rodapé – explicações escritas no rodapé e são facultativas.
Tabelas de Frequências para variáveis discretas
Exemplo:
Nas turmas A e B do 9º ano de uma escola, os alunos registaram o número de irmãos, obtendo-se o seguinte resultado:
2 1 1 6 0 5 0 0 1
1 2 1 1 2 1 1 1 1
1 1 1 1 1
Tabela 2 – Frequências (Número de irmãos)
Número de irmãos Nº irmãos xi fi Fi fri Fri
0 3 3 0,13 0,13
1 15 18 0,66 0,79
2 3 21 0,13 0,92
5 1 22 0,04 0,96
6 1 23 0,04 1,00
Total 23 - 1,00 -
Capítulo 2: Distribuição de Frequências
18
F1 = f1 Ex: F1 = f1 = 3
F2 = f1 + f2 Ex: F2 = 3 + 15=18
F3 = f1 + f2 + f3
…………………………
Fn = f1 + f2 + f3 +…+ fn
N
ffr i
i = Ex: 0,1323
3fri ≅=
Tabela de Frequências para variáveis contínuas
Requer atenção especial a organização de tabelas de frequência de variáveis contínuas.
Exemplo:
Consideremos as alturas, em centímetros, dos alunos do 9º ano de escolaridade de uma escola:
160 168 178 170 186 158 167 152 168
166 172 170 154 169 180 174 185 173
189 177 177 165 167
Como se trata de uma variável contínua o primeiro procedimento a efectuar consiste em organizar a distribuição, agrupando os dados em classes.
1. Determinar o limite superior (Ls) e o limite inferior (Li) das classes:
Limite superior: 160 cm → Li = 160
Limite superior: 152 cm → Ls = 152
2. Calcular a amplitude total (H):
Amplitude total (H) é a diferença entre o limite superior e o limite inferior:
H = Ls – Li ⇔ H = 189 – 152 ⇔ H = 37
Capítulo 2: Distribuição de Frequências
19
3. Determinar o número de classes1 (n):
n = 5
4. Calcular a amplitude da classe(h):
84,75
37 ≅⇔=⇔=⇔= hhhn
Hh
5. Determinar a frequência absoluta.
6. Organizar a tabela da distribuição:
Tabela 3 – Frequências (Alturas em cm dos alunos do 9º ano)
Classes fi Fi fri fri (%) Fri
[152,160[ 4 4 0.17 17 0.17
[160,168[ 5 9 0.22 22 0.39
[168,176[ 8 17 0.35 35 0.74
[176,184[ 3 20 0.13 13 0.87
[184,192[ 3 23 0.13 13 1
Total 23 - 1,00 100
1 Não existe uma fórmula universalmente aceite para calcular o número de classes, no entanto podemos levar em linha de conta as sugestões dadas por alguns autores – ver Apêndice I.
20
Capítulo 3
Representação gráfica e tabular de dados
Representação tabular de dados
Diagrama de caule e folhas
Representação gráfica de dados estatísticos e de frequências
Capítulo 3: Representação gráfica e tabular de dados estatísticos
21
Representação tabular de dados
A tabela é um instrumento muito utilizado para representar dados estatísticos, por:
• ser de fácil e rápida construção;
• ser de fácil leitura;
• permitir estabelecer rapidamente comparações.
Exemplo:
No último grande acontecimento desportivo de 2000, a distribuição de medalhas nos 13 países mais bem sucedidos, está expressa na seguinte tabela:
Tabela 4 – Dados (Número de medalhas ganhas por país em Sydney 2000)
País Nº medalhas ganhas
%
Estados Unidos 90 10.6
Rússia 77 9.1
China 59 6.9
Austrália 56 6.6
Alemanha 54 6.3
França 36 4.2
Itália 31 3.6
Coreia do Sul 28 3.3
Cuba 26 3.1
Grã-Bretanha 25 2.9
Roménia 24 2.8
Holanda 23 2.7
Ucrânia 20 2.4
... ... ...
TOTAL 850 100
Capítulo 3: Representação gráfica e tabular de dados estatísticos
22
Diagrama de caule e folhas
O diagrama de caule e folhas é um método de organização de dados, cuja representação se pode situar entre a tabela e o gráfico.
Num diagrama de caule e folhas são perfeitamente visíveis todos os dados observados e facilmente é visualizada a forma como eles se distribuem por diversas classes.
Para construir um diagrama de caule e folhas começamos por traçar uma linha vertical, registam-se à esquerda os valores correspondentes ao caule e à direita os valores correspondentes às folhas.
Considerando por exemplo, as idades dos empregados de um escritório
Tabela 5 – Idades dos empregados de um escritório
18 19 18 20
22 21 22 28
31 32 25 21
27 24 27 31
23 24 27 36
O respectivo diagrama de caule e folhas será então:
1 8 8 9 2 0 1 1 2 2 3 4 4 5 7 7 7 8 3 1 1 2 6 Folhas
Figura 4 – Caule e folhas (idades dos empregados de um escritório - versão 1)
No caule colocaram-se os algarismos das dezenas e as folhas são formadas pelos algarismos das unidades ordenados .
Quando a amostra é muito grande, por vezes os caules ficam muito compridos. Nesta situação podemos subdividir os caules. Para este exemplo podemos dividir cada caule ao meio.
Capítulo 3: Representação gráfica e tabular de dados estatísticos
23
1 1 8 8 9 2 0 1 1 2 2 3 4 4 2 5 7 7 7 8 3 1 1 2 3 6 Folhas
Figura 5 – Caule e folhas (idades dos empregados de um escritório - versão 2)
Este tipo de representação é muito útil para fazer a comparação de dois conjuntos de dados, relativos à mesma característica. Consideremos então o seguinte exemplo, em que são apresentadas as classificações (em pontos) de dois testes de Estatística.
Tabela 6 – Classificações de dois testes
Para fazer a comparação das classificações do dois testes faz-se um diagrama de caule e folhas, no qual se coloca à esquerda do caule as classificações do primeiro teste e à direita as do segundo.
Por observação do diagrama, representado pela figura 6, verifica-se, de imediato que os resultados do 2º teste foram superiores aos do primeiro.
O respectivo diagrama de caule e folhas será então:
1º teste
75 158
42 122
73 135
112 138
126 72
128 78
92 75
97 128
95 153
153 142
2º teste
112 145
94 111
125 132
134 112
145 95
82 163
122 143
163 185
164 124
124 123
Capítulo 3: Representação gráfica e tabular de dados estatísticos
24
2
8 5 5 3 2
7 5 2
2 8 8 6 2
8 5 2
8 3 3
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
2 4 5 1 2 2 2 3 4 4 5 2 4 3 5 5 3 3 4 5
Folhas Caule Folhas
Figura 6 – Caule e folhas (comparação das classificações de dois testes)
Representação gráfica de dados estatísticos e de frequências
0
50
100
150
200
250
300
350
400
pip
as d
e 55
0 lit
ros
1994 1995 1996 1997 1998
Produção de Vinho na RegiãoDemarcada do Douro
Vinho Não Beneficiado
Vinho do Porto
Gráfico 1 – Produção de vinho na região demarcada do Douro
Capítulo 3: Representação gráfica e tabular de dados estatísticos
25
Observando o gráfico 1, que descreve em que anos houve maior produção de vinhos na Região Demarcada do Douro, qual a estimativa para o valor da produção total de Vinho Não Beneficiado, de 1994 a 1998? Qual das produções foi maior, a do vinho do Porto ou do Vinho Não Beneficiado?
Os dados estatísticos podem ser representados por tabelas, por quadros de distribuição por frequência e por gráficos. A função do gráfico é fornecer informações, por meio de efeito visual imediato, contidas numa tabela.
A estatística dispõe de vários tipos de gráficos, que, dependendo da variável, procuramos a representação mais adequada ao fenómeno em estudo.
Para variáveis quantitativas é comum recorrer a gráficos de barras e de áreas.
Diagrama por pontos
O diagrama por pontos tem como referência o sistema cartesiano ortogonal. A partir dos dados da tabela 7, podemos construir um diagrama por pontos, que nos permite ter uma visão simples e rápida da evolução do consumo interno de água engarrafada desde 1987 até 1998.
Tabela 7 – Consumo interno de água engarrafada de 1987 a 1998
ANOS 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Consumo interno
271 290 325 348 361 88 410 445 511 549 585 650
Regras para a sua construção:
1. Deve-se sempre dar um título que indique qual o estudo em causa;
2. Rótulos para ambos os eixos;
3. Escala bem definida. Quando uma das escalas não começa em zero, deve-se dar essa indicação no eixo respectivo, como acontece no exemplo anterior em relação ao eixo das abcissas, no qual apenas são registados anos a partir de 1987;
Capítulo 3: Representação gráfica e tabular de dados estatísticos
26
4. Quando se utilizarem linhas verticais e horizontais secundárias para fazer a correspondência entre os valores das variáveis, estas devem ser a tracejado;
5. Sempre que exista, deve-se indicar a fonte;
6. Sempre que se justifique poder-se-ão indicar outros elementos como a data, notas de rodapé, etc.
Consumo interno de Água Engarrafada de 1987 a 1998
0
100
200
300
400
500
600
700
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Anos
Con
sum
o(m
ilhõe
s de
litr
os)
Gráfico 2 – Consumo interno de água engarrafada de 1987 a 1998
Gráficos de Barras e Histogramas
Gráficos de Barras
Como construir o gráfico de barras usando os dados contidos na tabela do número de alunos por sexo, de uma certa escola?
Tabela 8 – Número de alunos por sexo
Sexo F. absoluta (fi) F. relativa (fr%)
15 65,2
8 34,8
Total 23 100
Capítulo 3: Representação gráfica e tabular de dados estatísticos
27
Passos a seguir:
• Começamos por traçar o sistema cartesiano ortogonal, indicando a variável no eixo das abcissas e a frequência relativa (ou absoluta) no eixo das ordenadas.
• Em seguida, traçamos barras com altura correspondente ao percentual da categoria (variável).
Gráfico 3 – Construção de um gráfico de barras verticais
Observações:
1. As abcissas e ordenadas podem ser trocadas, colocando a variável na vertical e a frequência relativa (ou absoluta) na horizontal (ver exemplos adiante).
2. As bases dos rectângulos devem ter a mesma medida.
3. Os gráficos de barras também são usados para variáveis quantitativas.
Alunos da escola X, segundo o sexo
0
10
20
30
40
50
60
70
1 2Sexo
fr(%)
Alunos da escola X, segundo o sexo
0
10
20
30
40
50
60
70
1 2Sexo
fr(%)
Capítulo 3: Representação gráfica e tabular de dados estatísticos
28
Alunos da escola X, segundo o sexo
0 10 20 30 40 50 60 70
1
2
Sexo
fr(%)
Gráfico 4 – Gráfico de barras horizontais
Exemplos de gráficos de barras:
Consumo mensal de água engarrafada no Alentejo (milhões de m3)
Gráfico 5 – Barras representadas por figuras
0
40
80
120
160
200
Nº
de
leit
ore
s
Público Correioda Manhã
Record A Bola Diário deNotícias
A Capital
Jornais diários
Quotas de mercado
Gráfico 6 – Gráfico de barras verticais em profundidade
15,03 16 16,68
18,15
Set/00 Out/00 Nov/00 Dez/00
Capítulo 3: Representação gráfica e tabular de dados estatísticos
29
0 20 40 60 80 100 120 140 160 180 200
Nº de leitores
Público
Correio da Manhã
Record
A Bola
Diário de Notícias
A Capital
Jorn
ais
diá
rio
s
Quotas de mercado
Gráfico 7 – Barras horizontais em profundidade
Dormidas na Hotelaria por NUTS IIJaneiro a Dezembro
0
2000
4000
6000
8000
10000
12000
14000
Norte Centro LVT Alentejo Algarve Açores Madeira
NUTS II
Do
rmid
as(m
ilhar
es)
1997
1998
Gráfico 8 – Duas ou mais barras para cada variável
Histograma
É um gráfico utilizado para representar distribuições de frequências de variáveis contínuas, construído com rectângulos justapostos no plano cartesiano. Cada rectângulo tem como base a amplitude da classe e altura correspondente à frequência. As amplitudes representam-se
Capítulo 3: Representação gráfica e tabular de dados estatísticos
30
sempre no eixo das abcissas e as respectivas frequências no eixo das ordenadas.
A área de cada rectângulo é proporcional à sua frequência e a área total é proporcional à soma total das frequências.
O histograma seguinte representa a distribuição das alturas dos alunos de uma turma.
0
1
2
3
4
5
6
7
8
9
Classes
freq
uên
cia
Gráfico 9 – Histograma da distribuição das alturas dos alunos de uma turma
Polígonos de frequências (simples e acumuladas)
Polígonos de Frequências são gráficos de linhas que se obtêm unindo sucessivamente, com segmentos de recta, os pontos médios dos lados superiores dos rectângulos de um histograma.
Podemos ainda dizer, com a mesmo significado, que um Polígono de Frequências é um gráfico que se obtém unindo os pontos que têm por abcissa o ponto médio de uma classe e por ordenada a respectiva frequência.
Observando o gráfico 10, podemos verificar que, o polígono de frequências intersecta o eixo das abcissa em dois pontos que se obtêm considerando os pontos médios de duas classes, imediatamente antes e depois do histograma, de frequência nula.
152 160 168 176 184 192
Capítulo 3: Representação gráfica e tabular de dados estatísticos
31
Tempo de chegada ao Centro de Formação
0
10
20
30
40
50
60
70
80
Tempo(min)
Nº
form
and
os
Gráfico 10 – Polígono de frequências (Tempo de chegada ao Centro de Formação)
Se considerarmos um gráfico de área, constituído pela área compreendida entre o eixo das abcissas e a linha poligonal, essa área é igual à área do histograma respectivo.
Também para as frequências acumuladas podemos traçar o respectivo polígono de frequências, também designado, polígono integral. Supõe-se que a distribuição dos elementos se faz de forma uniforme dentro de cada classe, pelo que a representação gráfica é do tipo linear.
Tempo de chegada ao Centro de Formação
0
20
40
60
80
100
Tempo(min)
Nº
form
and
os(
%)
Gráfico 11 – Polígono de frequências acumuladas (Tempo de chegada ao Centro de Formação)
10 30 50 70 90 110
10 30 50 70 90 110
Capítulo 3: Representação gráfica e tabular de dados estatísticos
32
A construção da linha poligonal que traduz o polígono de frequências, obtém-se, a partir do histograma das frequências acumuladas, unindo o vértice inferior esquerdo da primeira classe com o vértice superior direito da mesma classe e este, sucessivamente, com os vértice superior direito da classe seguinte, tal como se pode verificar no gráfico 11.
Função cumulativa
A função cumulativa indica, para cada valor de x, a frequência absoluta ou relativa de observações com intensidade menor ou igual a x.
Variáveis discretas
De um modo geral , dada um variável estatística que toma os valores x1, x2, ..., xk e cujas frequências acumuladas (absolutas ou relativas) são n1, n2, ...nk, chama-se função cumulativa F, à função real de variável real assim definida:
F x
n x x
n x x
nk
( )
...
=
≤ <
≤ <
≥
0
1 2
2 3
se x < x
se x
se x
...
se x x
1
1
2
k
Fórmula 4 – Função cumulativa para variáveis discretas
A sua representação gráfica é a de uma função em escada.
Considerando o número de irmãos dos alunos de uma certa turma:
Tabela 9 – Frequências acumuladas do número de irmãos
Nº irmãos Fi 0 5 1 9 2 12 3 13 4 14
≥<≤<≤<≤<≤
=
4x se 144x3 se 133x2 se 1221 se 910 se 5
0<x se 0
)(xx
xF
Capítulo 3: Representação gráfica e tabular de dados estatísticos
33
A respectiva representação gráfica é a seguinte:
Gráfico 12 – Função cumulativa para varáveis discretas
Variáveis contínuas
Para definir a função cumulativa para variáveis contínuas temos que :
• Antes do limite inferior da 1ª classe, a frequência acumulada é 0, pelo que na representação gráfica se traça um segmento de recta sobre o eixo dos xx até esse valor.
• No limite inferior da 2ª classe, a frequência acumulada é a frequência da classe anterior.
• No limite inferior da 3ª classe, a frequência acumulada é a soma das frequências das duas classes anteriores e assim sucessivamente.
• Chegando à ultima classe, temos a garantia que o limite superior será 1, 100% ou igual ao número total de observações, conforme se trabalhe com frequências relativas simples ou acumuladas ou frequências absolutas.
Depois de marcados estes pontos, supondo que a distribuição dentro de cada classe se faz de forma uniforme, unem-se estes pontos com segmentos de recta, obtendo-se assim o gráfico da função cumulativa.
Nº de irmãos
Fi
Capítulo 3: Representação gráfica e tabular de dados estatísticos
34
Para definir a função cumulativa é ainda necessário encontrar as equações dos segmentos de recta considerados em cada classe.
Considerando agora as alturas dos alunos da turma do 9º ano:
Tabela 10 – Alturas de alunos
Classes Fi [152,160[ 4 [160,168[ 9 [168,176[ 17 [176,184[ 20 [184,192[ 23
Gráfico 13 – Função cumulativa para variáveis contínuas
A função cumulativa é dada por:
≥
<≤
<≤
<≤−
<≤
<≤
=
192x se 23
192x184 se 3-x83
184x176 se 3-x38
176x168 se 159
168160 se 16-x85
160152 se 76-x21
152<x se 0
)( x
x
x
xF
152 160 168 176 184 192 Classes
Fi
Capítulo 3: Representação gráfica e tabular de dados estatísticos
35
Curvas de frequência e ogivas
Quando o número de observações, para dados contínuos, é bastante elevado, podemos considerar classes com amplitudes muito pequenas, tendentes para zero, isto é, aumentar indefinidamente o número de classes, e desta forma o polígono de frequências aproxima-se de uma curva a que se chama curva de frequência.
Quando se trata de frequências acumuladas, a curva que se obtém designa-se normalmente por ogiva ou curva de acumulação de frequências.
0
10
20
30
40
50
60
70
80
90
100
Classes
Fre
q.(
%)
Gráfico 14 – Curva de acumulação de frequências ou ogiva
Outros exemplos de curvas de frequência e ogivas:
Curva simétrica ou curva de gauss
Curva assimétrica positivaou curva desviada para a
direita
X1 X2 X3 X4 X5 X6 X7 X8
Capítulo 3: Representação gráfica e tabular de dados estatísticos
36
Curva assimétrica negativa ou curva desviada para a
esquerda
Curva em J
Curva em J invertida Curva em U
P eso
Gráficos circulares
Os gráficos circulares são muito usuais para comparar frequências, e são de construção e leitura fácil.
Para construir um gráfico circular, considerando os dados contidos numa tabela, procede-se como se indica:
• Desenha-se um círculo de raio qualquer a representar os 100% dos dados.
!
!
!
!
!
!
Ogiva
Capítulo 3: Representação gráfica e tabular de dados estatísticos
37
• Calcula-se a proporção do círculo que representará cada categoria, sabendo que 100% corresponderá a 360º do círculo, determinando a amplitude do ângulo ao centro correspondente às frequências relativas, já conhecidas.
• Utilizando um transferidor, divide-se o círculo de acordo com as proporções.
Considerando o exemplo da tabela 11, o procedimento para a obtenção do gráfico circular, representado pelo gráfico 15, é o que se apresenta a seguir:
Tabela 11 – Frequência relativa de alunos por sexo
Sexo F. relativa
65,2%
34,8%
Total 100%
Determinação da amplitude dos sectores circulares:
100% - 360º 65,2% - x } ⇒ x ≅ 235º
100% - 360º 34,8% - x } ⇒ x ≅ 125º
Divisão do circulo:
235º125º
Capítulo 3: Representação gráfica e tabular de dados estatísticos
38
Alunos da escola X, por sexo
34,8º 65,2º
Gráfico 15 – Gráfico circular
Outro exemplo:
Os gráficos circulares, podem apresentar formas diversificadas. Entre os cinco principais mercados para o Vinho do Porto, a distribuição do volume das exportações é descrita pelo gráfico seguinte:
Principais importadores do Vinho do Porto1998
31,7%
16,1%13,6%
12,8%
9,3%
16,5%
França Holanda Portugal Bélgica-Lux Reino Unido Outros
Fonte: Instituto do Vinho do Porto
Gráfico 16 – Gráfico circular (Principais importadores de vinho do Porto – 1998)
Capítulo 3: Representação gráfica e tabular de dados estatísticos
39
Pictogramas
Neste tipo de gráficos utilizamos figuras ou símbolos alusivos ao fenómeno a estudar.
Na construção de um pictograma devemos ter em conta o seguinte:
• Devemos dar nome (título) ao gráfico.
• Dar significado a cada símbolo.
• As figuras ou símbolos devem estar relacionados com o fenómeno.
• Alinhar os símbolos em coluna ou em linhas e manter a mesma distância entre si.
• A diferença entre as quantidades deve ser expressa pelo maior ou menor número de símbolos e nunca pelo maior ou menor tamanho destes.
Exemplo de um pictograma:
Gráfico 17 – Pictograma (Venda de veículos ligeiros de passageiros)
Venda de veículos ligeiros de passageiros(Janeiro 2000 a Julho 2000)
772
1983
3187
2149
484
2881
2481
0 500 1000 1500 2000 2500 3000 3500
BMW
Ford
Opel
Peugeot
Volkswagen
Honda
Renault
= 500 unidades
Fonte: ACAP
Capítulo 3: Representação gráfica e tabular de dados estatísticos
40
Outros Tipos de Gráficos
Gráfico de rectângulo
Se considerarmos os dados constantes da tabela seguinte, sobre o consumo de uma determinada marca de vinho, por região do país, podemos obter um gráfico da distribuição do referido consumo, semelhante ao que é apresentado, no qual considerámos um rectângulo com 7 cm de comprimento, representando 100% do consumo.
A partir daqui, e fazendo os cálculos para as diversas regiões, obteremos com facilidade, como é indicado, as proporções do rectângulo referentes às diversas regiões.
Tabela 12 – Consumo de Vinho por regiões do país
Consumo de vinho X, por regiões do país
Classe Frequência Freq. relativa
Norte 3840 33%
Sul 2630 23%
Alentejo 5170 44%
Total 11640 100%
100% - 7cm 33% - x } ⇒ x = 2,31 cm
100% - 7 cm 23% - x } ⇒ x = 1,61 cm
100% - 7 cm 44% - x } ⇒ x = 3,08 cm
Capítulo 3: Representação gráfica e tabular de dados estatísticos
41
33% 23% 44%
Consumo de vinho X, segundo as regiões do país
Norte Sul Alentejo
Gráfico 18 – Gráfico de rectângulos
Gráfico de linhas
O número total de óbitos por HIV (Vírus da Imunodeficiência Humano) em Portugal atingiu o seu valor máximo em 1996, quando se registaram mais de um milhar de óbitos (1111). Na década em análise, a tendência de crescimento deste indicador apenas foi quebrada no ano de 1997, neste ano ocorreram 972 óbitos, sendo que destes, 815 casos referiam-se a indivíduos do sexo masculino (84% do total de óbitos). Esta proporção tem-se mantido estável nos últimos dez anos.
Evolução do número de Óbitos por VIH
0
200
400
600
800
1000
1200
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
Anos
Nº
ób
ito
s
Homens Mulheres Total
Gráfico 19 – Gráfico de linhas (evolução do número de óbitos por VHI)
Capítulo 3: Representação gráfica e tabular de dados estatísticos
42
Para a década em estudo, a idade mediana dos óbitos por HIV desceu 5 anos. Baixou dos 38 anos em 1988 para os 33 anos em 1997, quer para o total da população, quer para cada sexo quando considerado isoladamente.
Sempre que uma informação tende a aumentar ou a diminuir, os valores numéricos como no exemplo anterior, ou em outros exemplos como lucros de empresas, natalidade ou mortalidade, índice de custo de vida, etc., utilizamos os gráficos de linhas, cuja finalidade é a determinação da evolução do fenómeno estudado em diferentes posições.
No exemplo dado devemos considerar:
• o fenómeno em estudo é o número de óbitos por HIV;
• a variável é o tempo de 1988 a 1997;
• a frequência a registar são os óbitos por HIV em Portugal;
Diagrama de quadrados
Os dado são representados por quadrados com áreas proporcionais às categorias.
Exemplo:
Tabela 13 – Novos fogos construídos (versão 1)
Novos fogos construídos @=1000 fogos
1988 @ @
1989 @ @ @
1990 @ @ @ @ @
1991 @ @ @ @
Para a sua construção é necessário:
• Extrair a raiz quadrada dos números da tabela dada, arredondando os resultados. Essas raízes serão os comprimentos dos lados dos quadrados.
• Criar uma nova tabela, adequando as medidas do comprimento dos lados a uma escala.
Capítulo 3: Representação gráfica e tabular de dados estatísticos
43
Tabela 14 – Novos fogos construídos (versão 2)
Novos fogos construídos numa cidade
ANO Nº fogos construídos
Raíz quadrada
Arredon-damento
Redução (cm)
1998 2000 44,7 45 4,5
1989 3000 54,8 55 5,5
1990 5000 70,7 71 7,1
1991 4000 63,2 63 6,3
• Na terceira coluna, foi feito o arredondamento dos algarismos para a centena mais próxima, encontrando o valor arredondado 45, para representar o lado do quadrado que representa o número de fogos construídos no ano de 1988.
• Devemos ajustar esse número a uma escala de medição.
• Optamos por ajustar para centímetro; assim sendo, 45 será representado por 4,5 cm. Se não for possível utilizar estas medidas na construção do gráfico, utilizamos comprimentos proporcionais.
• A área de cada quadrado é proporcional ao número de fogos construído e o lado é proporcional à raiz quadrada da área.
Novos fogos construídos
Gráfico 20 – Gráfico de quadrados (Novos fogos construídos)
Pirâmide etária
O gráfico permite estudar e prever a evolução dos diferentes grupos etários, entre 1996 e 2020.
1988 1989 1990 1991
Capítulo 3: Representação gráfica e tabular de dados estatísticos
44
Fonte: MEPAT, Portugal, Plano Nacional de Desenvolvimento Económico e Social, Diagnóstico Prospectivo, Lisboa, 1999
Gráfico 21 – Pirâmide etária
Nota: como o facto é estudado numa faixa de tempo denominamos este fenómeno por Série Cronológica
Série regional ou geográfica
O fenómeno é estudado em diferentes locais.
Fonte: INE, Portugal Agrícola, 1994, Lisboa, 1995
Gráfico 22 – Série regional ou geográfica 1
Capítulo 3: Representação gráfica e tabular de dados estatísticos
45
Poluição no rio Reno e seus afluentes
Fonte:W.E.& V.M.Marsden, Going in to Europe, Oliver & Boyd, Edimburgo, 1989
Gráfico 23 – Série regional ou geográfica 2
Diminuição progressiva do crescimento demográfico
Fonte:INE, Estimativas da População, 1997, Lisboa, 1998
Gráfico 24 – Série regional ou geográfica 3
Capítulo 3: Representação gráfica e tabular de dados estatísticos
46
Gráficos mal construídos
Consumo de Queijo em Portugal
0 5 10
1996
1997
1998
1999
Kg/ habitante/ ano
Gráfico 25 – Pictograma mal construído
O gráfico anterior está mal construído porque, como vimos anteriormente, num pictograma, as figuras têm que ter todas a mesma dimensão.
44%
12% 10% 9% 7%
18%
Despesas em cultura das CâmarasMunicipais, por domínios
1998
Gráfico 26 – Gráfico de barras mal construído
No gráfico anterior não estão indicados quais os domínios correspondentes às despesas em cultura das Câmaras Municipais.
Capítulo 4: Parâmetros Estatísticos
48
Medidas de tendência central
As medidas de tendência central são valores da variável, utilizados para caracterizar a população em estudo, através dos seus valores centrais.
Moda, média e mediana
Moda
Para um conjunto de dados define-se moda como sendo o valor da variável com maior frequência. Representa-se por MO
Numa distribuição pode existir mais do que uma moda ou até nem existir moda .
Uma distribuição onde existem duas modas diz-se bimodal, se existem mais do que duas modas diz-se multimodal. Tal acontece quando há dois ou mais valores da variável aos quais corresponde a maior frequência.
Não existe moda, quando na distribuição, todos os elementos têm a mesma frequência, a distribuição diz-se amodal.
A determinação da moda é extremamente fácil quando os dados são discretos, bastando para tal, identificar qual tem maior frequência.
Exemplo 1
No quadro seguinte indicam-se as idades das empregadas de caixa de um supermercado
Tabela 15 – Idades das empregadas
25 23 25 24 25 22 25 20 25 20 24 20 23 28 21
Capítulo 4: Parâmetros Estatísticos
49
Nesta distribuição a moda é 25 anos.
Quando os dados são contínuos, começa-se por determinar a classe modal (a de maior frequência). Dentro desta classe, podemos depois determinar um valor aproximado para a moda, por processo numérico ou geométrico.
Existem algumas fórmulas para localizar a moda dentro da classe modal, todas elas através de valores aproximados. Uma destas fórmulas é a de King
aff
flM
pa
po ×
++=
Fórmula 5 – Localização da moda dentro da classe modal
onde:
l = limite inferior da classe modal
fp = frequência da classe anterior à classe modal
fa = frequência da classe posterior à classe modal
a = amplitude da classe
Para determinar geometricamente uma estimativa do valor da moda procede-se da seguinte forma:
• determina-se a classe modal;
• unem-se os vértices superiores do rectângulo da classe modal com os vértices das classes contíguas;
• a perpendicular, baixada do ponto de intersecção das linhas obtidas anteriormente para o eixo horizontal, determina neste, a localização gráfica da moda.
Exemplo 2
Numa agência de viagens, fez-se um levantamento do número de viagens organizadas durante um mês, de acordo com os preços.
Capítulo 4: Parâmetros Estatísticos
50
Tabela 16 – Preços de viagens
Preços (em contos) fi Fi
[ 50 , 100 [ 6 6 [ 100 , 150 [ 7 13 [ 150 , 200 [ 12 25 [ 200 , 250 [ 3 28 [ 250 , 300 [ 2 30
0
2
4
6
8
10
12
Preços
fi
Gráfico 27 – Determinação geométrica da moda
Média
A média é a medida de tendência central da amostra mais utilizada. Representa-se por x e obtém-se a partir da expressão
N
fx
i∑=ix
Fórmula 6 – Média aritmética
onde xi = valores observados
fi = frequência absoluta de xi
0 50 100 150 200 250 300
Moda
Capítulo 4: Parâmetros Estatísticos
51
N = nº de elementos da amostra
Se os dados se encontram agrupados em classes, considera-se para xi o valor intermédio da classe. Neste caso, não se obtém o verdadeiro valor da média, mas sim um valor aproximado.
Para o exemplo 1 tem-se então
23,3 15
21+22+20x3+23x2+24x2+25x5+28 = =x
Para o exemplo 2 tem-se então
155 30
2x275+3x225+10x175+7x125+8x75 = =x
Mediana
Devido a limitações na utilização da média e da moda, surge a necessidade da utilização de uma outra medida de tendência central, a mediana.
A mediana é o valor, pertencente ou não à amostra, que a divide ao meio, isto é, 50% dos elementos da amostra são superiores ou iguais à mediana e os outros 50% são inferiores ou iguais à mediana.
Representa-se por Med ou ~x .
Para determinar a mediana, ordenam-se os n elementos da amostra e se:
• n é ímpar, a mediana é o elemento que se encontra na posição central. A posição do elemento é dada por
21+N
• n é par, a mediana é a semi soma dos dois elementos centrais. A posição dos elementos é dada por
2N e
22+N
No exemplo 1 , o número de elementos da amostra é ímpar, pelo que, a mediana é o dado que se encontra na posição central, após a ordenação dos dados.
8 = 2
1+15 =
21+N
Capítulo 4: Parâmetros Estatísticos
52
A mediana é o dado que ocupa a posição 8 e o seu valor é 24.
A determinação da mediana de uma distribuição com dados agrupados em classes torna-se mais simples com recurso ao respectivo polígono de frequências relativas acumuladas.
Após a construção do polígono de frequências, procede-se da seguinte forma:
1. No eixo vertical, onde se registam os valores das frequências, marca-se o valor
2N caso as frequências sejam absolutas, ou o valor
0,5 (ou 50%) no caso de frequências acumuladas;
2. Por esse valor traça-se uma linha horizontal até intersectar o polígono de frequências;
3. Pelo ponto de intersecção anteriormente determinado, traça-se uma linha vertical cuja intersecção com o eixo das abcissas nos fornece o valor (aproximado) da mediana.
A partir do exemplo 2, temos
Gráfico 28 – Determinação geométrica da mediana
Para o cálculo da mediana utilizando processos numéricos procede-se da seguinte forma:
1. Calcula-se a ordem 2N ;
0
20
40
60
80
100Fr i
(%)
0 50 100 150 200 250 300
Mediana
Capítulo 4: Parâmetros Estatísticos
53
2. Através das frequências acumuladas, identifica-se a classe mediana, classe onde se situa a mediana, ou seja o termo de ordem
2N ;
3. Calcula-se o valor da mediana utilizando a expressão:
a f
F - 2N
L +=Med
Fórmula 7 – Determinação da mediana
onde: L = limite inferior da classe mediana
F = frequência absoluta acumulada da classe anterior à classe mediana
f = frequência absoluta da classe mediana
a = amplitude da classe mediana
Ainda em relação ao exemplo 2, a ordem do termo mediano é 15230 =
Então a classe mediana é a classe [150,200[ e o valor aproximado da
mediana é (3)158,X50 12
13 -15 150 =+=Med
Comparação entre a moda, a mediana e a média
Não se pode dizer, em termos absolutos, qual das medidas de tendência central é preferível. Tal depende do contexto em que estão a ser utilizadas.
A média é a medida de tendência central mais utilizada. Contudo tem algumas limitações, vejamos o seguinte exemplo:
Se determinarmos a média do seguinte conjunto de dados
14 ; 12 ; 98 ; 13 ; 11 ; 12 ; 11 ; 13 ; 14
obtém-se o valor x = 22
Capítulo 4: Parâmetros Estatísticos
54
Embora todos os dados, à excepção de um, estejam compreendidos entre 11 e 14 inclusivé, o valor obtido para a média está muito afastado desses valores. Neste caso a média não cumpre a função de ser uma medida representativa dos dados, pois ao dizer-se que a média é 22, imediatamente se pensa num conjunto de dados que não se afastem muito do valor da média.
O que acontece é que a média é muito sensível a valores “ muito grandes” ou “ muito pequenos” relativamente aos restantes valores da amostra.
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados que pretende representar.
Como medida de localização a mediana é mais resistente do que a média, pois não é tão sensível aos dados.
A moda surge como uma medida de tendência central com especial importância para reduzir a informação de conjuntos de dados qualitativos , para os quais não se pode calcular a média e por vezes nem sequer a mediana (se os dados não forem susceptíveis de ordenação).
Comparando as diversas medidas de tendência central, podemos classificar as distribuições quanto à simetria
Esta é uma distribuição simétrica, (como o gráfico mostra) onde todas as medidas de tendência central têm valores aproximadamente iguais, isto é,
xxMo ==~
Esta é uma distribuição assimétrica positiva ou desviada para a direita, onde
xxMo <<~
Capítulo 4: Parâmetros Estatísticos
55
Esta é uma distribuição assimétrica negativa ou desviada para a esquerda,
onde xxMo >>~
No quadro seguinte resumem-se as principais características das diversas medidas de tendência central, tendo em consideração aspectos como utilização, influenciabilidade, representatividade e inferência estatística
Tabela 17 – Resumo das características das medidas de tendência central
Utilização Influenciabilidade Representatividade Inferência estatística
Méd
ia É a medida
mais familiar e a mais
utilizada.
É uma medida influenciada por todos os valores observados.
Qualquer alteração destes valores produz uma modificação no
valor da média, podendo esta tomar
um valor diferente de todos os observados.
Por considerar todos os valores observados no seu cálculo, a média poderá deixar de ser representativa se a
distribuição for altamente assimétrica
devido a alguns valores extremos.
É a medida mais eficiente
quando se trata de inferir
sobre uma população a
partir de dados recolhidos
apenas numa amostra .
Med
ian
a
É fácil de calcular e de compreender
É determinada pelo número de
observações e não pelo seu valor. Deste modo, os valores extremos,
quer sejam grandes ou pequenos, não afectam
o seu valor.
É uma medida muito utilizada, sobretudo para distribuições fortemente assimétricas por não ser
afectada por valores extremos.
Para fins de inferência
estatística, a mediana não satisfaz as
propriedades de um bom estimador.
Mod
a É em geral,
menos utilizada que a média e
a mediana.
O seu valor não sofre a influência de valores
extremos
Não existe em algumas distribuições enquanto
que noutras poderá existir mais do que uma.
Revela maior
utilidade perante o estudo de variáveis
qualitativas.
Capítulo 4: Parâmetros Estatísticos
56
Quantis
De modo análogo à mediana, definem-se outras medidas estatísticas que têm, por vezes, bastante interesse para o conhecimento de uma distribuição estatística. De um modo geral as medidas estatísticas que dividem o conjunto dos dados em partes iguais são designadas por Quantis .
Conforme o número de partes em que se divide a distribuição podemos falar de quartis, decis, percentis,.etc.
Os quartis dividem a distribuição dos dados em quatro partes iguais.
O segundo quartil (Q2) coincide com a mediana. Como a mediana separa a distribuição em duas partes iguais, o primeiro quartil (Q1) é a mediana da primeira parte e o terceiro quartil (Q3) é a mediana da segunda parte.
Com os dados ordenados por ordem crescente, podemos esquematizar da seguinte forma o posicionamento da mediana e do 1º e 3º quartis.
x 1 Q 2 Q 3 Q 1 x n
m e d
5 0 % d a p o p u l a ç ã o 5 0 % d a p o p u l a ç ã o
2 5 % d a p o p u l a ç ã o 7 5 % d a p o p u l a ç ã o
Para determinar o 1º e 3º quartis utilizando processos numéricos, começamos por fazer a sua localização de acordo com o seguinte quadro
Tabela 18 – Localização do Q1 e Q3
N par N ímpar
Localização de Q1 N + 2
4 N + 1
4
Localização de Q3 3N + 2
4 3 x
+ 1
4
N
Além da mediana e dos quartis, existem outras medidas estatísticas que dividem a distribuição em partes iguais.
Capítulo 4: Parâmetros Estatísticos
57
Os decis que dividem a distribuição em 10 partes iguais.
Os percentis que dividem a distribuição em 100 partes iguais.
Os percentis são largamente utilizados pelos pediatras para analisar a condição física das crianças, relativamente ao peso e à altura. Assim, por exemplo, se o peso de uma criança estiver no percentil 60, significa que a criança está bem, se estiver perto do percentil 75 então é preciso tomar cuidado pois a criança está a ficar um pouco gorda.
Diagrama de extremos e quartis
Na tabela seguinte apresentam-se as temperaturas máximas registadas em diversos locais do país num certo dia de Julho
Tabela 19 – Temperaturas máximas
Temperaturas máximas (em ºC )
Bragança 23 Vila real 24 Porto 25 Penhas Douradas 22 Coimbra 29 Cabo Carvoeiro 25 Portalegre 31 Lisboa 29 Évora 31 Beja 33 Faro 29 Sagres 27 Ponta Delgada 24 Funchal 24
Ordenando os dados, temos a seguinte distribuição de temperaturas:
22 23 24 24 24 24 25 25 27 29 29 29 31 33
Q1 Med Q3
Q1 = 24
Capítulo 4: Parâmetros Estatísticos
58
Q2 = Med = 2
2525 + =25
Q3 = 29
Existem diferentes formas de definir os quartis. É por isso possível que, em diferentes programas de computador ou calculadoras, os valores indicados para os quartis sejam ligeiramente diferentes. Como só interessa usar os quartis em populações ou amostras muito grandes, essas pequenas diferenças não têm qualquer importância.
Dispondo os valores da mediana e quartis ordenados sobre um segmento de recta, obtemos o diagrama seguinte:
Q1 Q2 Q3 22 33 24 25 29
Gráfico 29 – Diagrama de extremos e Quartis
A este diagrama chamamos Diagrama de Extremos e Quartis (o extremo inferior é o mínimo da amostra e o extremo superior é o máximo da amostra).
Este diagrama fornece informações sobre a distribuição dos valores da variável no seu domínio e permite-nos afirmar que :
• 25% das temperaturas são iguais ou inferiores a 24ºC
• 75% das temperaturas mais altas variam entre 24ºC e 33ºC
• 50% das temperaturas variam entre 22ºC e 25ºC
• A maior concentração de temperaturas ocorre no intervalo ] 24;25[ já que a cada um deles pertencem 25% das temperaturas.
A utilização do diagrama de extremos e quartis é particularmente útil, quando se pretende comparar amostras .
Quando temos dados agrupados em classes, recorrendo ao polígono de frequências relativas acumuladas determinamos os quartis e depois constrói-se o respectivo diagrama de extremos e quartis .
Capítulo 4: Parâmetros Estatísticos
59
Exemplo:
Numa fábrica de lâmpadas, escolheram-se 300 lâmpadas, para estudar o seu tempo de duração. Os resultados, em horas estão registados no quadro abaixo.
Tabela 20 – Tempo de duração de lâmpadas
Duração (em horas)
[200;300 [ [300;400 [ [400 ;500 [ [500 ; 600[
Nº de lâmpadas 30 90 140 40
Freq.relativa Acumulada (em %)
10 40 87 100
O respectivo diagrama de extremos e quartis é então
0102030405060708090
100Fr i
(%)
Gráfico 30 – Diagrama de extremos e quartis partindo de um gráfico de frequências acumuladas
O diagrama de extremos e quartis dá também algumas indicações sobre o tipo de distribuição.
Distribuição uniforme
Q1 Q2 Q3
200 300 400 500 600
Capítulo 4: Parâmetros Estatísticos
60
Concentração na zona central
Concentração nos extremos
Concentração no extremo inferior
Medidas de dispersão
Um aspecto importante no estudo descritivo de um conjunto de dados é a determinação da variabilidade ou dispersão desses dados relativamente à medida de tendência central da amostra.
As medidas de localização ou tendência central estudadas não são suficientes para caracterizar completamente um conjunto de dados.
Consideremos o exemplo :
Em duas empresas, registaram-se os valores dos salários dos seus trabalhadores:
Tabela 21 – Salários da empresa A
Salário (em contos) 70 80 85 110
nº de trabalhadores 15 10 12 3
Tabela 22 – Salários da empresa B
Salário (em contos) 60 65 70 80 85 90 120 150
nº de trabalhadores 9 10 10 6 12 8 3 1
Capítulo 4: Parâmetros Estatísticos
61
Se fizermos os cálculos, verificamos que o valor médio dos salários nas duas empresas é igual (80 contos) assim como a mediana (80 contos), embora existam diferenças significativas entre os salários das duas empresas.
Na empresa A, os salários encontram-se mais próximos da média enquanto na empresa B os salários estão mais dispersos em relação à média.
Torna-se então necessário arranjar novos parâmetros estatísticos que meçam a menor ou maior dispersão dos dados.
Como a medida de tendência central mais utilizada é a média, será relativamente a ela que se define a principal medida de dispersão - o desvio padrão .
Amplitude, desvio e desvio médio.
Como vimos no exemplo anterior é necessário recorrer a novos parâmetros estatísticos que meçam a maior ou menor dispersão dos dados.
Uma primeira possibilidade é determinar a amplitude da distribuição.
Amplitude de uma distribuição ou conjunto de dados é a diferença entre o maior e o menor valores observados.
Há realmente uma maior amplitude em B, mas a amplitude é uma fraca medida de dispersão. Repare-se que se existisse um trabalhador com o vencimento de 20 contos, a amplitude passava para 90 sem que os vencimentos globais se alterassem significativamente.
Pode-se ainda determinar a amplitude interquartis, a qual nos indica a amplitude do intervalo onde se situa a metade central das observações. A amplitude interquartis é a diferença entre o terceiro quartil e o primeiro.
Atendendo a que a média pretende representar todos os elementos de uma distribuição, a forma de avaliar a maior ou menor representatividade consiste em encontrar uma medida para as diferenças dos valores reais da variável relativamente à média e a essa medida chama-se desvio.
Desvio de um valor é a diferença entre o valor da variável e a média da distribuição ( xi - x )
Capítulo 4: Parâmetros Estatísticos
62
Os desvios podem ser positivos ou negativos, e a sua soma é sempre igual a 0.
Para avaliar a dispersão dos dados pode-se calcular a média dos desvios (considerados em módulo). A este valor chama-se desvio médio.
Variância e desvio padrão
Variância
A variância é uma medida de dispersão idêntica, na sua forma, ao desvio médio. Em vez de considerar os desvios em módulo, considera-se os seus quadrados.
A variância representa-se por σ2 e o seu valor é dado pela fórmula
( )n
x
=
n
1=i
2i
2∑ −
σx
Fórmula 8 – Variância
Para uma situação concreta, a variância é de difícil interpretação, pois ao utilizar os quadrados dos desvios, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida de dispersão na mesma unidade que os dados, consideramos a raiz quadrada da variância, obtendo-se o desvio padrão.
Desvio padrão
O desvio padrão é a medida de dispersão mais utilizada, representa-se por σ e é igual à raiz quadrada da variância
( )
n
x
=
n
1=i
2i∑ −
σx
Fórmula 9 – Desvio padrão
Capítulo 4: Parâmetros Estatísticos
63
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.
Considerando o exemplo inicial pode-se verificar que
Média Mediana Desvio padrão
Empresa A 80 80 10,61 Empresa B 80 80 21,46
Ou seja na Empresa B a dispersão dos salários é maior do que na Empresa A.
Combinando o conhecimento da média e do desvio padrão, pode-se, em muitas situações, caracterizar a localização e a dispersão dos dados.
Comparação entre as medidas de dispersão
Amplitude
• É muito fácil de calcular, resumindo-se a uma mera subtracção entre dois valores extremos observados;
• É muito pouco utilizada, uma vez que não fornece indicações sobre o que se passa no centro da distribuição.
Desvio médio
• É fácil de calcular e de interpretar, é mais sensível que a amplitude, por considerar a diferença de todas as observações relativamente a um valor central;
• A utilização nesta medida do conceito de valor absoluto constitui uma desvantagem pelo seu difícil tratamento matemática, fazendo assim com que seja pouco utilizada;
• É uma medida menos influenciada por valores extremos que o desvio padrão.
Variância
• É uma medida cuja interpretação do seu significado é pouco vantajosa, uma vez que não se exprime na mesma medida em que se exprimem os dados. Desta forma também não constitui uma das medidas mais usadas.
Desvio padrão
• É a medida de dispersão mais utilizada; • É afectado por todos os valores observados, sendo
altamente sensível a valores extremos, dados que os desvios em relação à média são elevados ao quadrado. Assim é desaconselhável em distribuições assimétricas;
• É apropriado o seu uso em situações de inferência estatística.
Capítulo 4: Parâmetros Estatísticos
64
Influência da alteração dos valores da variável na média e no desvio padrão
Numa determinada empresa os ordenados de 10 trabalhadores, em contos, referentes ao ano de 1972 eram os seguintes:
12 10 11 15 7 10 12 10 8 12
Em 1980 os ordenados duplicaram.
Em 1988 os ordenados subiram igualmente 40 contos relativamente a 1980.
Determinando a média e o desvio padrão dos ordenados nos anos de 1972, 1980 e 1988
Tabela 23 – Calculo da média e do desvio padrão
1972 1980 1988
12 24 64 10 20 60 11 22 62 15 30 70 7 14 54 10 20 60 12 24 64 10 20 60 8 16 56 12 24 64
x 10,7 21,4 51,4 σ 2,147 4,294 4,294
podemos concluir que:
• Em 1980 os ordenados duplicaram assim como a média e o desvio padrão.
Capítulo 4: Parâmetros Estatísticos
65
• Em 1988 houve um aumento constante de 40 contos nos ordenados, a média aumentou 40 mas o desvio padrão manteve-se.
De um modo geral :
• se todos os valores de uma população aumentarem uma constante a, a média também aumenta a, mas o desvio padrão não sofre alteração.
• se todos os valores de uma população forem multiplicados por uma constante b, também a média e o desvio padrão aparecem multiplicados por essa constante.
Capítulo 5: Estatística Bidimensional
67
Distribuições bidimensionais
Por vezes o que se pretende estudar das populações não é uma característica isolada, mas duas ou mais características.
Quando, numa dada população, se estudam diferentes características, interessa muitas vezes tentar descobrir se existe alguma relação entre elas, ou se pelo contrário, são independentes.
No caso de se pretender estudar duas características conjuntamente, os valores observados aparecem sob a forma de pares ordenados e tem-se assim uma variável bidimensional.
Existem variáveis estatísticas que estão normalmente relacionadas, tais como:
• peso em kilogramas e altura em centímetros de uma pessoa
• consumo de gasolina e cilindrada de um automóvel
• altitude e temperatura numa montanha num dada dia
• o vencimento e a formação
Para verificar se existe, de facto, uma relação entre as diversas características de uma população, podem utilizar-se diversos instrumentos estatísticos, de entre os quais destacamos aqui os seguintes:
• Diagramas de dispersão;
• Coeficientes de correlação;
• Rectas de regressão
Diagrama de Dispersão
Na tabela 24 estão registadas as distâncias alcançadas no lançamento do peso pelo atleta que conseguiu a medalha de ouro nos Jogos Olímpicos, desde Atenas (1900) a Sidney (2000) .
Capítulo 5: Estatística Bidimensional
68
Tabela 24 – Marcas do lançamento do peso nos Jogos Olímpicos
Ano Distância ( m ) Ano Distância ( m )
1900 11.22 1956 18.58
1904 14.10 1960 19.68 1906 14.81 1964 20.33 1908 12.33 1968 20.54 1912 14.21 1972 21.18 1920 15.34 1976 21.05 1924 14.81 1980 21.35 1928 15.00 1984 21.26 1932 15.87 1988 22.47 1936 16.00 1992 21.71 1948 16.20 1996 21.52 1952 15.89 2000 21.29
Uma boa maneira de ter uma ideia sobre a situação e tentar chegar a uma conclusão, é representar as duas variáveis num mesmo gráfico, a que se chama diagrama de dispersão ou gráfico de correlação.
Ao conjunto de pontos obtido chama-se nuvem de pontos.
Lançamento do peso
0
4
8
12
16
20
24
1880 1900 1920 1940 1960 1980 2000 2020
ano
dis
tân
cia
( m
)
Gráfico 31 – Correlação ano /distância do lançamento do peso
Capítulo 5: Estatística Bidimensional
69
Pela observação do gráfico 31 podemos observar que a distância a que os atletas laçam o peso, de um modo geral, tem evoluído ao longo dos anos.
Gráfico de correlação ou diagrama de dispersão é um gráfico em que cada ponto representa um elemento da população sendo as suas coordenadas os valores das duas variáveis.
Este gráfico permite observar o comportamento conjunto das duas variáveis e determinar se existe alguma relação entre elas.
Centro de gravidade é o ponto da nuvem que tem como coordenadas, cada uma das médias das duas variáveis em estudo.
A observação do diagrama de dispersão, intuitivamente , permite-nos analisar se existe ou não uma relação entre as variáveis.
Quando existe alguma relação de dependência entre duas variáveis, diz-se que existe uma correlação entre elas.
Exemplo 1:
Para averiguar se a distância atingida no salto em comprimento está relacionada com o peso do atleta, seleccionaram-se 10 atletas, obtendo-se os seguintes resultados:
Tabela 25 – Comprimento do salto e peso do atleta
Salto (cm)
195 173 202 198 215 190 180 165 150 182
Peso (kg) 55 72 66 81 75 76 70 72 65 73
Para melhor compreender estes dados pode fazer-se uma representação gráfica adequada, obtendo assim uma nuvem de pontos (gráfico 32).
Observamos que a nuvem de pontos se encontra bastante dispersa. Diz--se então que não existe uma relação muito clara entre estas duas variáveis, ou seja, as duas características estão fracamente correlacionadas.
Capítulo 5: Estatística Bidimensional
70
120
140
160
180
200
220
40 50 60 70 80 90
peso (kg)
salt
o (
cm)
Gráfico 32 – Correlação comprimento do salto /peso do atleta
Exemplo 2:
Ao subir uma serra, um grupo de estudantes foi registando a temperatura e a respectiva pressão atmosférica, preenchendo o seguinte quadro.
Tabela 26 – Pressão atmosférica e temperatura
Pressão atmosférica
(mm) 700 695 680 668 650 635 620 617 610
Temperatura (em ºC ) 15 14 13 11 9 9 7 7 5
0
5
10
15
20
580 600 620 640 660 680 700 720
pressão atmosférica (mm)
tem
per
atu
ra (
ºC )
Gráfico 33 – Correlação temperatura / pressão atmosférica
Capítulo 5: Estatística Bidimensional
71
Analisando o gráfico, vê-se claramente que existe uma relação muito forte entre a temperatura e a pressão atmosférica. Quando aumenta a pressão atmosférica também aumenta a temperatura. Diz-se então que existe uma correlação positiva bastante forte.
Exemplo 3:
Para observar a relação existente entre o tempo que demora a coagular o sangue a diferentes temperaturas, foi efectuada uma experiência cujos resultados foram os seguintes:
Tabela 27 – Temperatura / Tempo de coagulação do sangue
Temperatura ( ºC )
5 10 15 20 25 35 40 45 30
tempo de coagulação ( seg)
45 38 32 28 24 19 22 21 21
0
10
20
30
40
50
0 10 20 30 40 50Tem p.(ºC)
tem
po
de
co
agu
laçã
o (
se
g
Gráfico 34 – Correlação temperatura / tempo de coagulação do sangue
Podemos assim verificar que a temperatura e o tempo de coagulação do sangue estão relacionadas entre si. De um modo geral, quanto maior for a temperatura menos tempo demora a coagular o sangue. Uma correlação deste tipo diz-se negativa.
Numa certa população há correlação entre duas variáveis quando existe uma relação mais ou menos aproximada entre elas.
A correlação é positiva quando o aumento de uma variável corresponde, de um modo geral, ao aumento da outra
Capítulo 5: Estatística Bidimensional
72
A correlação é negativa, se ao aumento de uma variável corresponde geralmente a diminuição da outra.
Coeficiente de correlação linear
O objectivo do estudo da correlação, é verificar se existe ou não relação entre as variáveis em estudo, e avaliar o grau dessa relação.
Neste estudo apenas se consideram as correlações lineares, ou seja aquelas em que a nuvem de pontos se condensa em torno de uma recta.
Para medir a maior ou menor correlação linear existente entre duas variáveis, Pearson propôs o coeficiente de correlação linear, que se representa por r , e é definido por
( ) ( )
−
−
=
∑ ∑∑ ∑
∑∑∑
n
yy
n
xx
n
yxy
r2
2
2
2
x -
Fórmula 10 – Coeficiente de correlação linear
O valor de r pertence ao intervalo [-1 ; 1 ].
Se r >0, a correlação é positiva, ou seja as variáveis variam no mesmo sentido.
Se r < 0, a correlação é negativa, ou seja as variáveis variam em sentido contrário.
Se r =0, não existe correlação entre as variáveis.
Se r = 1, a correlação é positiva total ou perfeita e os pontos estão todos sobre uma recta de declive positivo.
Se r = -1, a correlação é negativa total ou perfeita e os pontos estão todos sobre uma recta de declive negativo.
Na página seguinte apresentam-se algumas figuras que ilustram os diferentes tipos de correlações que se podem encontrar.
Capítulo 5: Estatística Bidimensional
73
Correlação linear perfeita
x
y
Se r = 1, existe uma equação
que relaciona x com y
Correlação linear positiva
x
y
Se 0< r <1, a correlação é positiva e tanto mais forte quanto r se aproximar de 1
Correlação linear perfeita
x
y
Se r = -1, existe uma equação
que relaciona x com y
Correlação linear negativa
x
y
Se -1< r <0, a correlação é negativa e é tanto mais forte quanto r se aproximar de -1
Figura 7 – Diferentes tipos de correlação
Escala de correlação
-1 -0,5 0 0,5 1Perfeita PerfeitaNula
forteforte f r a c a
Figura 8 – Escala de correlação
Capítulo 5: Estatística Bidimensional
74
Recta de Regressão
Quando a correlação entre duas variáveis é elevada ( quer seja positiva ou negativa ), isso significa que se conhecer o valor de uma das variáveis então é possível ter uma ideia do valor que a outra variável irá tomar. Em linguagem estatística, diz-se que podemos inferir o valor da outra variável.
Considere-se o seguinte exemplo :
Numa visita de estudo à Serra da Estrela, uma turma registou as temperaturas e a altitude à medida que subiu a serra. A temperatura foi medida em, graus centígrados e a altitude em metros.
Tabela 28 – Altitudes e temperaturas
Altitude Temperatura
900 14 1010 14 1152 13 1270 12 1322 10 1420 11 1510 10 1625 9 1750 8 1883 6 1920 4 1998 3
Será possível prever a temperatura a 1770 metros de altitude?
Para responder a esta questão, ainda que de forma aproximada, é necessário encontrar uma recta que se ajuste o mais possível aos pontos da nuvem. A esta recta, que passa pelo centro de gravidade da nuvem de pontos, chama-se Recta de Regressão, e ao seu declive chama-se coeficiente de regressão.
Matematicamente podemos encontrar a equação reduzida desta recta, a partir do conhecimento de um ponto (centro de gravidade) e do declive.
O centro de gravidade é ( )yx, = (1480 ; 9,5)
Capítulo 5: Estatística Bidimensional
75
O coeficiente de regressão ou declive da recta é dado por:
( )n
xx
n
yxy
a2
2
x -
∑∑
∑∑∑−
=
Fórmula 11 – Coeficiente de regressão
Utilizando a calculadora vem que a equação da recta é:
y = - 0,01x + 24
0
5
10
15
700 900 1100 1300 1500 1700 1900 2100
Altitude
Tem
per
atu
ra
Gráfico 35 – Recta de regressão
Quer pela leitura do gráfico, quer pela utilização da equação da recta, pode-se agora responder à questão . a temperatura correspondente a uma altitude de 1770 metros é o valor sobre a recta correspondente a x=1770, isto é aproximadamente 6,3ºC.
76
Capítulo 6
Novas Tecnologias no Estudo da Estatística
Apresentação
Calculadoras Gráficas
Folha de Cálculo
Capítulo 6: Novas Tecnologias no Estudo da Estatística
77
Apresentação
Efectuar um estudo estatístico sem a ferramenta apropriada pode tornar-se um trabalho fastidioso. Usando uma calculadora sem modo estatístico, os cálculos a efectuar são por vezes morosos o que desvirtua a natureza da estatística, pois esta deve ser encarada como uma forma de compreender o real e não como um simples meio para se praticar o cálculo.
Sendo a calculadora gráfica uma ferramenta de fácil acesso e de simples utilização e estando o uso do computador a generalizar-se, o cálculo das medidas estatísticas e a representação gráfica dos dados está bastante facilitada. Assim, o uso das novas tecnologias vem enriquecer o processo ensino/aprendizagem da estatística permitindo que este seja baseado na resolução de problemas concretos.
O tema “Novas Tecnologias no Estudo da Estatística” não aparece como mais um tema a estudar separadamente dos restantes mas sim como uma ferramenta a utilizar em todos eles. Deste modo, partindo de dois problemas concretos (Problema 1 e Problema 2), o primeiro com apenas uma variável em estudo e o outro com dados bivariados, irão explorar-se os pontos abordados nos capítulos anteriores tendo como principal objectivo explicar como proceder com a calculadora gráfica e com o computador.
As calculadoras que se vão abordar são a “Texas Intruments TI-83 Plus” e a “Casio CFX 9950G”, pois são as de mais fácil utilização que estão difundidas no mercado e, pelas mesmas razões, o software usado é a versão 2000 em português do “Microsoft Excel”.
Problema 1 - Os Pacotes do Açúcar
Os pacotes de açúcar que costumam acompanhar o café têm a indicação “P.L. 8/9g”. Tendo-se pesado 34 desses pacotes obtiveram-se os seguintes resultados:
Capítulo 6: Novas Tecnologias no Estudo da Estatística
78
Tabela 29 – Peso dos pacotes de açúcar
Peso Líquido (em g)
9,2 9,0 7,9 8,3 8,4 8,7 8,1 8,6 8,3 7,9 8,9 8,5 7,8 8,4 8,4 8,7 7,6 8,1 8,2 8,5 7,5 8,6 8,2 8,5 8,1 8,6 8,1 8,1 8,3 8,1 8,5 8,2 8,3 8,0
Pretende-se, através de um estudo estatístico, analisar a distribuição do peso dos pacotes de açúcar.
Problema 2 - O Lançamento do Peso
Na tabela abaixo estão registadas as distâncias alcançadas no lançamento do peso pelo atleta que conseguiu a medalha de ouro nos Jogos Olímpicos, desde Atenas (1900) a Sidney (2000).
Tabela 30 – Lançamento do peso
Ano Distância (m) Ano Distância (m) 1900 11.22 1956 18.58 1904 14.10 1960 19.68 1906 14.81 1964 20.33 1908 12.33 1968 20.54 1912 14.21 1972 21.18 1920 15.34 1976 21.05 1924 14.81 1980 21.35 1928 15.00 1984 21.26 1932 15.87 1988 22.47 1936 16.00 1992 21.71 1948 16.20 1996 21.52 1952 15.89 2000 21.29
Pretende-se, através de um estudo estatístico, estudar a relação existente entre as variáveis Ano e Lançamento.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
79
Calculadoras Gráficas
Ir-se-ão de seguida resolver os dois problemas apresentados recorrendo às calculadoras gráficas atrás referidas. Como cada calculadora tem a sua estrutura de funcionamento, resolve-se primeiramente ambos os problemas com uma das calculadoras e seguidamente com a outra.
Resolução do Problema 1
O primeiro passo a efectuar para se fazer um estudo estatístico é a organização dos dados numa tabela. Para isso pressiona-se a tecla STAT e obtém-se o seguinte ecrã:
Figura 9 – Menu estatístico
Pressionando a tecla ENTER pode-se introduzir os dados numa lista, por exemplo em L1. Os dados vão sendo introduzidos um a um com a tecla ENTER. Note-se que no final da janela, entre parêntesis, se pode observar quantos dados já estão registados.
Figura 10 – Listas de dados
Depois de introduzidos os dados pode ter-se necessidade de os ordenar. Para isso pressiona-se novamente a tecla STAT, selecciona-se o menu SortA, e com ENTER obtém-se a última janela da figura.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
80
Figura 11 – Ordenação de dados 1
Agora é só indicar L1 fazendo 2nd 1 e depois, com a tecla ENTER, fica-se com a lista L1 ordenada por ordem crescente.
Figura 12 – Ordenação de dados 2
Pode observar-se a lista já ordenada com as teclas STAT ENTER.
Figura 13 – Ordenação de dados 3
Depois de se terem organizado os dados na Lista L1 podem-se calcular rapidamente todas as medidas estatísticas da variável peso.
Para isso faz-se STAT e usam-se as setas direccionais para se seleccionar o menu CALC. O cálculo das medidas estatísticas a uma variável efectua-se pela opção 1-Var Stats.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
81
Figura 14 –Cálculo de medidas estatísticas 1
Agora, pressionando duas vezes a tecla ENTER, fica-se com aquelas medidas calculadas. Para se poderem observar todas as medidas calculadas devem-se utilizar as teclas direccionais a fim de percorrer todos os valores que estão disponíveis no ecrã.
Figura 15 – Cálculo de medidas estatísticas 2
Para se calcular a variância é necessário efectuar o quadrado do desvio padrão ( xσ ).
Note-se ainda que, a única medidas estatística que não foi calculada foi a moda.
Seguidamente vai-se explicar um processo que permite o cálculo da classe modal sem haver necessidade de se contarem os dados.
Passa-se então à representação gráfica dos dados. Neste caso, como a variável estatística é continua, a forma mais correcta de os representar é através de um histograma. O primeiro passo a efectuar para a construção de um gráfico estatístico na calculadora Texas TI83 Plus, é sempre a definição do tipo de gráfico que se pretende construir e a indicação da lista ou listas onde os dados estão registados.
Para se representar o peso dos pacotes de açúcar num histograma vai-se proceder do seguinte modo:
Fazendo 2nd Y= tem-se acesso aos gráficos estatísticos.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
82
Figura 16 – Definição do tipo de gráfico 1
Neste momento os três gráficos que se podem construir em simultâneo estão desligados (Plot ... Off).
Pressionando a tecla ENTER tem-se acesso a uma das “Plots”. Nesse ecrã, vai-se definir o tipo de gráfico que se pretende observar e indicar onde é que os dados estão registados.
O tipo de gráficos disponíveis são os seguintes:
Nuvem de Pontos ou Gráfico de Dispersão;
Gráfico de Dispersão cujos pontos consecutivos são unidos por um segmento de recta;
Histograma;
Caixa de Bigodes;
Diagrama de extremos e quartis;
Gráfico de distribuição normal de probabilidade.
Para dar instruções à máquina no sentido de construir um Histograma, deve-se, com as setas direccionais, deslocar o cursor de modo a que este fique sobre cada uma das opções que se pretendem escolher e depois fazer-se ENTER. Não esquecer também de fazer ENTER sobre On para ligar a “Plot”.
Figura 17 – Definição do tipo de gráfico 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
83
Para se observar o histograma é necessário indicar a janela em que o vamos definir e também a amplitude das classes. Uma forma fácil de proceder é fazer ZOOM 9, pois isto define automaticamente uma janela para os dados estatísticos que estão definidos na Plot que se tem ligada.
Figura 18 – Representação de Histograma 1
Agora já é mais fácil definirmos uma janela adequada bem como um valor razoável para a amplitude das classes. Fazendo window observa-se que a janela onde estamos a ver o gráfico é [ ] [ ]21.15;9.348.9;5.7 −× e
que a amplitude das classes é de ...2833.0
Figura 19 – Definição da janela 1
Como estes valores são pouco práticos de trabalhar, alterando os parâmetros da window, vamos definir uma nova janela [ ] [ ]15;35.9;5.7 −×
e classes de amplitude 3.0 .
Figura 20 – Definição da janela 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
84
Pressionado agora a tecla GRAPH observa-se um gráfico semelhante ao anterior mas com valores mais fáceis de trabalhar.
Figura 21 – Representação do Histograma 2
Fazendo TRACE, e usando as teclas direccionais, pode-se observar que, por exemplo, existem dois pacotes de açúcar com peso compreendido entre as 5.7 e 8.7 gramas e que a classe modal é [ [4.8;1.8 .
Figura 22 – Estudo do Histograma
Um outro gráfico que, neste estudo, é importante analisar é o Diagrama de Extremos e Quartis. Pode-se construí-lo procedendo de forma análoga à anterior, seleccionando na Plot1 este tipo de gráfico e depois fazer novamente GRAPH para o visualizar.
Figura 23 – Representação do diagrama de extremos e quartis
Neste gráfico, fazendo TRACE, podem-se ler os valores extremos, os quartis e a mediana.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
85
Figura 24 – Estudo do diagrama de extremos e quartis
Pode-se também construir um gráfico denominado Caixa de Bigodes que, para além de fornecer toda a informação que é dada pelo Diagrama de Extremos e Quartis, revela a existência de “outliers” no conjunto de dados. “Outliers” são valores da variável que estão muito afastados da generalidade dos dados recolhidos e podem ser devidos a erros na recolha dos valores. Por vezes é vantajoso excluir os “outliers” do estudo estatístico para que estes não alteram a veracidade do mesmo.
Figura 25 – Representação da caixa de bigodes
Fazendo Trace verifica-se que o valor 9,2 é um “outlier” do conjunto de dados recolhidos pois este valor encontra-se separado dos restantes na Caixa de Bigodes.
Figura 26 – Estudo da caixa de bigodes
Capítulo 6: Novas Tecnologias no Estudo da Estatística
86
Resolução do Problema 2
Para se efectuar um estudo estatístico, deve começar-se por organizar os dados numa tabela. Pressiona-se a tecla STAT e obtém-se o seguinte:
Figura 27 – Menu estatístico
Premindo a tecla ENTER podem-se introduzir os dados numa lista, por exemplo em L1. Os dados vão sendo introduzidos um a um com a tecla ENTER. Note-se que no final da janela, entre parêntesis, se podem observar quantos dados já estão registados.
Figura 28 – Lista de dados 1
Para fazer o estudo dos dados apresentados no problema 2, é necessário ter-se em conta que se trata de dados bivariados. Uma das variáveis estatísticas é o ano e a outra é a medida do lançamento. Após a introdução da variável ano em L1, registam-se os valores da variável medida do lançamento em L2.
Figura 29 – Lista de dado 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
87
Seguidamente, vai-se observar o diagrama de dispersão para que, pela análise deste gráfico, se possa conjecturar a existência de correlação linear entre as duas variáveis.
O primeiro passo a efectuar para a construção de um gráfico estatístico na calculadora Texas TI83 Plus é sempre a definição do tipo de gráfico que se pretende construir e a indicação da lista ou listas onde os dados estão registados.
Para se representar o diagrama de dispersão procede-se do seguinte modo:
Fazendo 2nd Y= temos acesso aos gráficos estatísticos.
Figura 30 – Definição do tipo de gráfico 1
Neste momento os três gráficos que se podem construir em simultâneo estão desligados (Plot ... Off).
Pressionando a tecla ENTER, neste caso, tem-se acesso à Plot 1. Aí vai-se definir o tipo de gráfico que se pretende observar e indicar onde é que os dados estão registados. Para dar instruções à máquina nesse sentido deve, com as setas direccionais, deslocar-se o cursor de modo a que este fique sobre cada uma das opções que se pretendem escolher e depois fazer-se ENTER. Não esquecer também de fazer ENTER sobre On para ligar a Plot.
Figura 31 – Definição do tipo de gráfico 2
Podem obter-se mais informações sobre o tipo de gráficos disponíveis na página 82
Capítulo 6: Novas Tecnologias no Estudo da Estatística
88
Para se observar o diagrama de dispersão é necessário indicar a janela em que o vamos definir. Uma forma fácil de proceder é fazer ZOOM 9, pois isto define automaticamente uma janela para os dados estatísticos que estão definidos na Plot que se tem ligada.
Figura 32 – Representação da nuvem de pontos
Pela observação do gráfico pode-se inferir a existência de correlação linear positiva entre as duas variáveis.
Passa-se de seguida à construção da recta de regressão e ao cálculo do coeficiente de correlação linear.
Para mais facilmente se calcular o valor de r, deve-se fazer 2nd CATALOG (que fica por baixo da tecla 0) e percorrer esta lista até se encontrar DiagnosticOn. Depois, pressionando ENTER ENTER, faz com que, sempre que se constrói a recta de regressão, o valor de r seja automaticamente calculado e apresentado. Este procedimento só é necessário fazer uma vez pois fica activado até se efectuar o processo contrário que é DiagnosticOff.
Figura 33 – Diagnostic On
Capítulo 6: Novas Tecnologias no Estudo da Estatística
89
Para se construir a recta de regressão deve começar-se por pressionar a tecla STAT, depois, com as setas direccionais seleccionar CALC e, neste menu, escolher LinReg(ax+b) pressionando a tecla ENTER sobre esta opção.
Figura 34 – Determinação da recta de regressão
Agora vão-se indicar as listas onde estão registados os dados e pedir que a equação da recta seja colocada em Y1 para que a calculadora sobreponha os gráficos. Para isso faz-se 2nd L1 , 2nd L2 , Vars, selecciona-se com as setas direccionais Y-Vars Function e, fazendo ENTER ENTER ENTER, a calculadora indica a equação da recta de regressão e mostra o coeficiente de correlação linear.
Figura 35 – Cálculo do coeficiente de correlação linear
Capítulo 6: Novas Tecnologias no Estudo da Estatística
90
Neste momento, ao pressionar-se a tecla Y= pode observar-se que em Y1 já se encontra definida a equação da recta de regressão.
Figura 36 – Equação da recta de regressão
Fazendo GRAPH visualiza-se a recta de regressão em simultâneo com o diagrama de dispersão.
Figura 37 – Representação da recta de regressão
Ao fazer-se TRACE sobre recta de regressão podem-se fazer previsões sobre o medida do lançamento que se irá obter em determinados Jogos Olímpicos. Para que o cursor fique sobre a recta é necessário que, depois de pressionar a tecla TRACE, usar as teclas direccionais para cima ou para baixo para se seleccionar o gráfico da recta e depois deslocar o cursor para a direita ou para a esquerda a fim de se encontrar o ano pretendido.
Figura 38 – Estudo do diagrama de dispersão
Capítulo 6: Novas Tecnologias no Estudo da Estatística
91
Pode-se assim prever que, no ano de 1940, caso se tivessem realizado Jogos Olímpicos, o vencedor do lançamento do peso alcançaria uma distância na casa dos 16,7 metros.
Resolução do Problema 1
Como o que se pretende é efectuar um estudo estatístico deve seleccionar-se o menu STAT usando as setas direccionais e a tecla EXE.
Figura 39 – Menu estatístico
Qualquer estudo estatístico deve iniciar-se pela organização dos dados numa tabela. Assim, pressionando a tecla EXE vão-se introduzindo os dados, um a um, em List 1.
Figura 40 – Introdução de dados 1
Uma vez que a consulta dos dados fica facilitada se estes estiverem ordenados vai-se seguidamente exemplificar como se deve proceder para que os valores da variável peso fiquem listados por ordem crescente.
Com a tecla F1 selecciona-se SORT-A e indica-se, fazendo 1, que só se pretende ordenar uma lista.
Figura 41 – Introdução de dados 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
92
Depois de pressionar a tecla EXE, dá-se indicação de se ordenar a lista1 fazendo 1 EXE.
Figura 42 – Ordenação de dados 1
Caso a opção SRT-A não esteja disponível na tecla F1 deve usar-se a tecla F6 de modo a que aquela apareça no ecrã.
Figura 43 – Ordenação de dados 2
Depois de organizados os dados, vai-se prosseguir calculando as principais medidas estatísticas. Primeiramente deve pressionar-se a tecla F6 até que a opção CALC esteja disponível no ecrã.
Figura 44 – Cálculo de medidas estatísticas 1
Capítulo 6: Novas Tecnologias no Estudo da Estatística
93
Seguidamente pressiona-se as teclas F2 e F1 respectivamente e imediatamente o calculo das medidas estatísticas é apresentado no ecrã da calculadora.
Figura 45 – Cálculo de medidas estatísticas 2
Para se poderem observar todas as medidas estatísticas calculadas, devem utilizar-se as teclas direccionais a fim de percorrer todos os valores que estão disponíveis no ecrã.
Figura 46 – Leitura das medidas estatísticas
Alerta-se que o valor do desvio padrão que é tratado neste manual, é dado por n∂x , pois o valor de n∂x -1representa o desvio padrão a n-1 valores da variável.
Calculadas as medidas estatísticas, vai-se continuar a estudar o problema 1 através da representação gráfica dos dados. Como se trata de uma variável quantitativa continua, um gráfico que é útil na interpretação dos resultados é o histograma. Começa-se por pressionar duas vezes a tecla EXIT para se voltar à janela onde são visualizadas as listas.
Figura 47 – Voltar à lista de dados
Capítulo 6: Novas Tecnologias no Estudo da Estatística
94
Neste momento premindo as teclas F1 e F6 respectivamente tem-se acesso à definição do tipo de gráfico que se pretende construir.
Figura 48 – Definição do tipo de gráfico
Para se fazerem alterações às definições do gráfico, usam-se as setas direccionais e seleccionam-se as opções através das teclas F1 a F6. Neste caso vão-se deixar as indicações de acordo com a figura abaixo.
Figura 49 – Definição do Histograma
Pressionando a tecla EXE e posteriormente F4, F1 e F6 o histograma é apresentado no ecrã.
Figura 50 – Construção do Histograma 1
Capítulo 6: Novas Tecnologias no Estudo da Estatística
95
Antes de se passar ao estudo do gráfico é necessário definir-se manualmente a amplitude das classes e o extremo inferior da primeira classe, pois os valores definidos automaticamente são pouco práticos de estudar.
Premindo as teclas SHIFT MENU respectivamente, tem-se acesso às definições do gráfico. Neste menu deve pressionar-se F2 na opção Stat Wind, como indicado na figura.
Figura 51 – Alteração manual da janela
Seguidamente pressionam-se as teclas EXIT, F1 e F1 respectivamente, de modo a ter-se acesso à alteração manual das definições do gráfico (Figura).
Figura 52 – Construção do Histograma 2
Para se estudar este problema podem definir-se classes de amplitude 0,3 sendo 7,5 um valor adequado para o extremo inferior da primeira classe.
Vão-se definir estes valores nas opções Start e Pitch e depois pressiona-se a tecla F6 para desenhar o gráfico pretendido.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
96
Figura 53 – Construção do Histograma 3
A janela em que se estava a trabalhar tornou-se inadequada aos valores que foram então definidos para as classes. Pressionando as teclas SHIFT e F3 respectivamente, podem alterar-se os parâmetros de visualização da janela para, por exemplo, [7,5;9,5]×[-3;15] e definir-se para escala no eixo das abcissas o valor 0,3 (Figura 54).
Figura 54 – Alteração manual da janela 2
Premindo seguidamente as teclas EXIT, F1, F1 e F6, tem-se o Histograma preparado para que possa ser estudado.
Figura 55 – Construção do Histograma 4
Para se estudar o gráfico faz-se SHIFT F1 e, com as teclas direccionais, percorre-se o gráfico a fim de se fazerem as leituras que se pretenderem.
Pode assim observar-se que existem dois elementos na classe [7,5;7,8[ ou que a classe modal é a classe [8,1;8,4[ e é constituída por 13 elementos.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
97
Figura 56 – Estudo do Histograma
Um gráfico muito útil num estudo do tipo que se está a efectuar é o diagrama de extremos e quartis pois, para além de, no mesmo gráfico termos informação sobre a mediana e os quartis, também nos permite observar a forma como os dados estão distribuídos.
A construção deste gráfico processa-se de forma análoga à do histograma devendo, no entanto, seleccionar-se o gráfico do tipo MedBox (com a tecla F2) quando se está a definir Graph Type.
Figura 57 – Construção do diagrama de extremos e quartis
Por observação do gráfico, nota-se uma distribuição aproximadamente simétrica dos dados, havendo no entanto uma maior concentração de valores entre o 1º e o 3º quartil.
Pode agora, fazendo trace (premindo as teclas SHIFT e F1) e usando as teclas direccionais, lerem-se os valores extremos, a mediana e os quartis desta distribuição.
Figura 58 – Estudo do diagrama de extremos e quartis
Capítulo 6: Novas Tecnologias no Estudo da Estatística
98
Resolução do Problema2
Inicia-se o estudo deste problema pela introdução dos dados nas listas. Para isso, depois de se ter ligado a calculadora, é necessário optar pelo menu STAT e depois premir a tecla EXE.
Figura 59 – Menu estatístico
Uma vez que se trata de uma distribuição bidimensional, colocam-se os valores referentes a anos em List1 e os relativos ao lançamento em List2, usando a tecla EXE e as teclas direccionais.
Figura 60 – Introdução dos dados
Depois de introduzidos os dados, vai construir-se o diagrama de dispersão a fim de se verificar a existência, ou não de relação entre as duas variáveis. Pressiona-se sucessivamente as teclas F1 e F6 para se visualizar a janela da figura 61.
Figura 61 – Definição do tipo de gráfico
Capítulo 6: Novas Tecnologias no Estudo da Estatística
99
Deve agora seleccionar-se o gráfico pretendido. Com as setas direccionais coloca-se o cursor sobre Graph Type e, usando F6 até encontrar o gráfico do tipo Scat, pressiona-se F1, obtendo-se o ecrã:
Figura 62 – Definição do diagrama de extremos e quartis
É também necessário indicar que a frequência de cada valor é 1. Vai-se colocar o cursor sobre Frequency e pressiona-se F1.
Figura 63 – Definição da frequência relativa
Pressionado as teclas EXIT e F4, chega-se a um ecrã onde é possível indicar que se pretende construir o gráfico definido em StatGraph1.
Figura 64 – Construção da nuvem de pontos 1
Pode então visualizar-se a nuvem de pontos pressionando finalmente as teclas F1 e F6 respectivamente, como se verificar na figura 65.
Pela observação do gráfico pode inferir-se que existe uma correlação linear positiva entre as duas variáveis. Passa-se por isso à construção da recta de regressão e ao cálculo do coeficiente de correlação linear.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
100
Figura 65 – Construção da nuvem de pontos 2
Premindo simplesmente a tecla F1 tem-se de imediato a equação da recta de regressão bem como o respectivo valor do coeficiente de correlação linear. Uma vez que este é um valor muito próximo de 1, a suspeita de correlação linear sai reforçada permitindo que se tome esta recta como bom estimador de resultados.
Figura 66 – Cálculo da equação da recta de regressão e do coeficiente de correlação
Se se pressionar a tecla F6 pode observar-se simultaneamente a nuvem de pontos e a recta de regressão mas, para que se possa trabalhar com esta recta é necessário copiar a sua expressão analítica para o menu GRAPH. Deve assim fazer primeiro F5 e depois EXE e só finalmente premir a tecla F6.
Figura 67 – Desenhar a recta de regressão 1
Capítulo 6: Novas Tecnologias no Estudo da Estatística
101
Para se usar a recta para fazer previsões é necessário fazer Trace sobre a recta de regressão. No menu STAT não é possível fazê-lo e, por isso, tem de se sair deste menu e entrar no menu GRAPH. Pressiona-se a tecla MENU e com as teclas direccionais, desloca-se o cursor até este, tal como é exemplificado na figura.
Figura 68 – Menu Graph
Fazendo EXE depois F6 tem-se acesso ao gráfico da recta de regressão.
Figura 69 – Desenhar a recta de regressão 2
É agora possível fazer Trace (premindo as teclas SHIFT e F1) sobre a recta e percorrer os pontos da mesma, com as teclas direccionais, a fim de se poderem fazer previsões.
Figura 70 – Estudo da recta de regressão
Pode assim prever-se que, no ano de 1940, caso se tivessem realizado Jogos Olímpicos, o vencedor do lançamento do peso alcançaria uma distância na casa dos 16,7 metros.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
102
Folha de Cálculo
Resolução do Problema 1
O primeiro passo a efectuar para se fazer um estudo estatístico é a organização dos dados numa tabela. Para isso, depois de se abrir o programa Microsoft Excel, vão-se introduzindo os dados, um a um, numa coluna, como é exemplificado na figura abaixo.
Figura 71 – Introdução de dados na folha de cálculo
Capítulo 6: Novas Tecnologias no Estudo da Estatística
103
Depois de introduzidos os dados, pode ter-se necessidade de os ordenar. Para isso, devem seleccionar-se os valores que se pretendem
ordenar e depois selecciona-se a opção do comando Dados.
Figura 72 – Ordenação de dados
Para se calcularem as medidas estatísticas começa-se por escrever o nome das medidas que se pretendem calcular em diferentes células, como exemplificado na figura;
Figura 73 – Medidas estatísticas
Capítulo 6: Novas Tecnologias no Estudo da Estatística
104
Para se calcular a média, depois de se ter colocado o cursor na célula que se seleccionou para a média (célula C2), usando o rato, faz-se clique sobre o comando Inserir e, neste menú, escolhe-se a opção para se ter acesso ao assistente de funções. Dentro do assistente de funções, na categoria Estatística, selecciona-se a função MÉDIA.
Figura 74 – Assistente de funções 1
Pressionando a opção obtém-se o seguinte quadro:
Figura 75 – Assistente de funções 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
105
Agora, vão-se seleccionar, com o rato, as células onde estão registados
os dados que se estão a estudar e pressionar a opção . O valor da média fica automaticamente registado na célula que tinha sido destinada para este fim.
Figura 76 – Assistente de funções 3
Figura 77 – Cálculo da média
Por um processo em tudo semelhante pode-se calcular (em D2 e E2) o desvio padrão e a mediana, seleccionando as funções DESVPADP e MED respectivamente.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
106
Figura 78 – Cálculo do desvio padrão
Para se calcularem os quartis (em F2 e G2) selecciona-se a função
PERCENTIL e, depois de fazer e indicar as células onde estão registados os dados, coloca-se na segunda linha o valor 0,25 se se pretende calcular o 1º quartil ou 0,75 se se pretende calcular o 3º quartil.
Figura 79 – Assistente de funções 4
Capítulo 6: Novas Tecnologias no Estudo da Estatística
107
1º Quartil
Figura 80 – Assistente de funções 5
3º Quartil
Figura 81 – Assistente de funções 6
Figura 82 – Determinação dos quartis
Capítulo 6: Novas Tecnologias no Estudo da Estatística
108
Depois de calculadas as principais medidas estatísticas pode-se passar à sua representação gráfica.
Uma vez que a variável estatística é contínua, o Histograma é um gráfico que permite uma análise correcta dos dados.
Para que se possa construir este tipo de gráfico vai-se construir uma tabela de frequências absolutas com 6 classes de amplitude 0,3 e com valor mínimo 7,5. Para isso vai-se usar uma nova folha do documento em que se está a trabalhar (folha 2).
Figura 83 – Tabela de frequências
Depois de seleccionadas as células (com o botão esquerdo do rato pressionado) onde estão registadas as classes e as frequências
absolutas, pressiona-se o ícone do menu Inserir para activar o assistente de gráficos (Figura 84).
Seguidamente deve seleccionar-se o gráfico “COLUNAS” e continuar-se
com para se visualizar a janela referente ao assistente de gráficos que se apresenta na figura 85.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
109
Figura 84 – Assistente de gráficos 1
Figura 85 – Assistente de gráficos 2
Prosseguindo com a opção , pode-se dar um título ao gráfico e indicar o nome das variáveis colocadas em cada um dos eixos.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
110
Figura 86 – Assistente de gráficos 3
Figura 87 – Assistente de gráficos 4
Ainda dentro deste passo vai-se seleccionar a opção a fim de se indicar que não se pretende que seja mostrada legenda, não seleccionando a opção Mostrar legenda.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
111
Figura 88 – Assistente de gráficos 5
Na opção pode também pedir-se que sejam mostrados os valores da frequência absoluta.
Figura 89 – Assistente de gráficos 6
Pressionando finalmente o ícone , um gráfico de barras é apresentado na folha em que se está a trabalhar.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
112
Figura 90 – Histograma 1
Para que o gráfico fique com umas medidas mais apropriadas, devem alterar-se as medidas do rectângulo até que este tenha o aspecto que se pretende obter.
Figura 91 – Histograma 2
Como o gráfico que se tem ainda não é um Histograma mas sim um gráfico de barras, vai ter de se alterar o espaço entre as barras para que a escala do eixo horizontal seja contínua. Para isso, deve fazer-se “duplo
Capítulo 6: Novas Tecnologias no Estudo da Estatística
113
clique” sobre uma das colunas do gráfico e esperar que surja a seguinte figura:
Figura 92 – Assistente de gráficos 7
E depois de se definir a largura de intervalo 0 e de se premir
, tem-se finalmente o histograma.
Figura 93 – Assistente de gráficos 8
Capítulo 6: Novas Tecnologias no Estudo da Estatística
114
Pacotes de Acúcar
24
13
10
3 3
02468
101214
7,5-7,8 7,8-8,1 8,1-8,4 8,4-8,7 8,7-9,0 9,0-9,3
Pesos (g)
Fre
q.
Figura 94 – Histograma 3
Pode-se então utilizar este gráfico para efectuar o estudo da distribuição do peso dos pacotes de açúcar.
Sendo este software uma Folha de Cálculo, apesar de ajudar bastante a fazer um estudo estatístico, não é um programa integralmente destinado a este fim, pelo que, se mostra insuficiente quando se pretende fazer um estudo mais aprofundado. Neste exemplo deixa-se por estudar o diagrama de extremos e quartis pois, apesar de ser possível construi-lo, o processo não está automatizado.
Sugere-se assim que, em alguns casos, se faça uso de um software mais especializado (por exemplo Winstat; SPSS etc...)
Capítulo 6: Novas Tecnologias no Estudo da Estatística
115
Resolução do Problema 2
O primeiro passo a efectuar para se fazer um estudo estatístico é a organização dos dados em tabelas. Para isso, depois de se abrir o programa Microsoft Excel, vão-se introduzindo os dados, um a um, em cada coluna, como é exemplificado na figura abaixo.
Figura 95 – Introdução de dados
Depois dos dados terem sido introduzidos na folha de cálculo, passa-se à construção do diagrama de dispersão. Neste gráfico pode-se visualizar a existência, ou não, de correlação linear entre as duas variáveis (ano e lançamento).
Capítulo 6: Novas Tecnologias no Estudo da Estatística
116
Começa-se por seleccionar as células (Figura 96) que contêm os dados
estatísticos e depois pressiona-se o ícone que se encontra disponível no menu Inserir para obter a janela da figura.
Figura 96 – Assistente de gráficos 9
Seguidamente, selecciona-se o gráfico “DISPERSÃO [XY]”(Figura 97) e
continua-se com .
Um primeiro exemplo de diagrama de dispersão é apresentado pelo assistente de gráficos (Figura 97).
Capítulo 6: Novas Tecnologias no Estudo da Estatística
117
Figura 97 – Assistente de gráficos 10
Prosseguindo com a opção pode dar-se um título ao gráfico elaborado e indicar o nome das variáveis colocadas em cada um dos eixos.
Figura 98 – Assistente de gráficos 11
Ainda dentro deste passo vai-se indicar para que não sejam mostradas nem linhas de grelha nem legenda.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
118
Figura 99 – Assistente de gráficos 12
Figura 100 – Assistente de gráficos 13
Pressionado finalmente o ícone , o gráfico é apresentado na folha de cálculo em que se está a trabalhar (Figura 101).
Depois de se ajustarem as dimensões do rectângulo onde foi construído o gráfico obtém-se uma nuvem de pontos como a da figura 102.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
119
Figura 101 – Nuvem de pontos 1
Figura 102 – Nuvem de pontos 2
Pela observação do diagrama de dispersão, pode inferir-se a existência de correlação linear positiva entre as duas variáveis.
Para se calcular o coeficiente de correlação linear, deve-se começar por seleccionar uma célula onde se vai colocar o seu valor.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
120
Depois, seleccionando no menu Inserir pressionando a opção tem-se acesso ao assistente de funções. Dentro do assistente de funções, na categoria “estatística”, selecciona-se a função CORREL.
Figura 103 – Assistente de funções 7
Pressionando a opção obtém-se o quadro da figura.
Figura 104 – Assistente de funções 8
Depois, seleccionam-se as células onde estão registados os dados da variável Ano para que estes valores fiquem registados em Matriz1 e, depois de colocar o cursor em Matriz2, procede-se de igual modo com a variável Lançamento.
Capítulo 6: Novas Tecnologias no Estudo da Estatística
121
Figura 105 – Assistente de funções 9
Figura 106 – Assistente de funções 10
Pressionando finalmente a opção , o valor do coeficiente de correlação linear fica automaticamente registado na célula que se tinha destinado para esse fim.
Figura 107 – Determinação do coeficiente de correlação linear
Capítulo 6: Novas Tecnologias no Estudo da Estatística
122
Depois de se ter representado o gráfico de dispersão e se ter conjecturado sobre a existência de correlação entre as duas variáveis, vai-se proceder seguidamente à construção da recta de regressão e ao cálculo da sua equação.
Para isso, faz-se clique sobre o conjunto de pontos representados graficamente e, em seguida, no menu Gráfico, selecciona-se a opção Adicionar linha de tendência (Figura 108). Deve então ser apresentada uma caixa de diálogo como a da figura.
Figura 108 – Linha de tendência 1
Figura 109 – Linha de tendência 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
123
No separador Tipo, neste caso, seleccionar a regressão linear e, posteriormente, no separador Opções, vai-se optar por Mostrar equação no gráfico (Figura 110).
Figura 110 – Linha de tendência 3
Premindo então a opção na caixa de diálogo, a recta de regressão é apresentada sobre o gráfico bem como a respectiva equação (Figura 111).
Figura 111 – Recta de regressão 3
Capítulo 6: Novas Tecnologias no Estudo da Estatística
124
A recta de regressão é , neste caso, um modelo que permite obter com grande fiabilidade a distância num ano em que não se realizaram Jogos Olímpicos. Pode-se então conjecturar sobre qual seria este valor no ano de 1940.
Para se efectuar este cálculo com o programa Excel, pode proceder-se do seguinte modo:
1. Numa célula à escolha coloca-se o valor 1940 ( por exemplo a célula F22)
2. Numa outra célula escreve-se =0,1018*F22-180,79 (Figura)
3. Pressionar a tecla Enter
Figura 112 – Previsões 1
Figura 113 – Previsões 2
Capítulo 6: Novas Tecnologias no Estudo da Estatística
125
Pode-se assim prever que, caso se tivessem realizado Jogos Olímpicos no ano de 1940, o vencedor do lançamento do peso alcançaria uma distância próxima dos 16,7 metros.
Capítulo 7: Bibliografia
127
Bibliografia
ALVES, C.B. [et al] – Infinito 10, Areal Editores, Porto, 1996
AUBYN, M.C.; BRITO, C.; MARTINS, A.C. – Matemática 10, Lisboa Editora, Lisboa, 1997
BASTOS, Rita [et al] – Matemática10:Estatística, Edições Contraponto, Porto, 1997
GRUPO AZARQUIEL – Estatística no 3º Ciclo do Ensino Básico, Associação de Professores de Matemática, Lisboa, 1993.
MARTINS, Maria Eugénia Graça [et al] - Estatística, Ministério da Educação /DES, Lisboa, 1999
MELLO, F. Galvão de, - Probabilidades e Estatística, Conceitos e Métodos Fundamentais, Escolar Editora, 1993
MURTEIRA, J. F. Bento - Análise exploratória de dados, Mc Graw Hill, Lisboa,1993
MURTEIRA, J. F. Bento – Estatística Descritiva, Mc Graw Hill, Lisboa, 1989
NEVES, Maria Augusta Ferreira - Matemática 10º Ano Parte 3:Estatística, Porto Editora, 1997
REIS, Elizabeth - Estatística Descritiva, Edições Sílabo, 1996
MORGAN, Larry – Statistic Handbook for the TI-83, Texas Instruments, 1997
GRUPO DE TRABALHO T3 – Estatística e Calculadoras Gráficas, Associação de Professores de Matemática, Lisboa, 1999
TEXAS INSTRUMENTS – Manual de Instruções da Calculadora Gráfica TI-83, E.U.A, 1999
NAZARETH, Helena – Curso Básico de Estatística, Editora Ática, 1989
MACHADO, Artur da Rocha – Guia Prático para o uso do Retroprojector, Instituto do Emprego e Formação Profissional, 1999
Anexo I: Cálculo de Classes
129
Cálculo de Classes
O erro inerente a qualquer representação de dados agrupados em classes, pode tornar-se tão pequeno quanto se queira, escolhendo amplitudes de classe tendendo para zero e, portanto, reduzindo a perda de informação. No entanto, valores pequenos da amplitude de classe implicam um grande número de classes conduzindo assim a um decréscimo de simplicidade, que foi uma das principais razões pela qual começamos por agrupar os dados em classes.
Torna-se assim necessário, procurar um equilíbrio entre a precisão e a simplicidade. Não existem regras gerais para encontrar este equilíbrio, ou seja, o agrupamento mais conveniente. Assim cada investigador está dependente, em cada estudo, das conclusões que pretende encontrar, do bom senso e da sua experiência.
Apesar disto, optámos por deixar aqui as sugestões de vários autores, para o cálculo do número de classes.
Sturges Vellemen Dixon e Kronmall
Fórmula N
n2log1+ n2 n10log10
10 4 6 10
20 5 8 13
30 5 10 14
40 6 12 16
50 6 14 20
100 7 20 21
200 8 28 23
300 9 34 24
Anexo II: A Estatística na Internet
131
Sites Nacionais
http://alea-estp.ine.pt
Projecto ALEA - Acção Local Estatística Aplicada (INE - Instituto Nacional de Estatística)
Informações sobre o Objecto da Estatística
http://www.agroportal.pt/Ciencias/estatistica.htm
Agroportal é um sítio na Internet, do tipo directório / portal, que pretende dar a conhecer (apontar) os sites existentes (preferencialmente de língua portuguesa) com interesse para o sector agrário e rural. Nele se incluem alguns dados estatísticos.
http://www.alentejodigital.pt/beja/estatistica
Estatísticas de Beja
Portal Virtual onde se pode encontrar informação de Dados Estatísticos de Beja.
http://www.fc.ul.pt/cea/
Centro de Estatística e Aplicações da Faculdade de Ciências da Universidade de Lisboa
Um dos maiores e mais activos grupos de investigação nesta área, está bem posicionado para contribuir ao solicitado em aspectos das ciências estatísticas.
http://www.ine.pt/srea/
Instituto Nacional de Estatística / SREA - Serviço Regional de Estatística dos Açores
Serviço Regional de Estatística dos Açores
http://www.ine.pt/srea/informacao/metainformacao/conc.asp
Instituto Nacional de Estatística / SREA - Serviço Regional de Estatística dos Açores
Anexo II: A Estatística na Internet
132
Informação Estatística / Conceitos Estatísticos
http://www.isegi.unl.pt
Instituto Superior de Estatística e Gestão de Informação
Universidade Nova de Lisboa
Informações de Cursos; Alunos; Docentes; I&D; Novidades; Catálogos; Localização
Estatística e Gestão de Informação
http://www.math.ist.utl.pt/~psoares/stat/pe/pe.html
Instituto Superior Técnico
Probabilidades e Estatística (LECivil, LEMateriais, LENaval, LETerritório, LEEC, LEFT, LEAmbiente, Larquitectura)
http://www.min-financas.pt/dgt/informacoes/infor_estat/portugues/f_estat1.htm
SDDS - Special Data Dissemination Standard
O SDDS - Padrão Especial de Divulgação de Dados, é um programa do Fundo Monetário Internacional que tem por objectivo garantir que a divulgação de informação estatística, difundida pelos países subscritores, apresenta características de actualidade, transparência, integridade e qualidade.
http://www.apm.pt/
Associação de Professores de Matemática
Destaques, Novidades e Notícias
http://www.mat.uc.pt/~jaimecs/pessoal/
Página Pessoal
Página Pessoal do Professor Jaime Carvalho e Silva
Anexo II: A Estatística na Internet
133
Sites Internacionais
http://geocities.com/marianaibd/pagina_2.htm
Página Pessoal
Algumas definições de Estatística
http://huizen.dds.nl/~berrie/
Página Internet de Estatística de Berrie’s
Página de Estatística multimédia com animação.
http://www.rialto.k12.ca.us/frisbie/pictogram.html
Projecto ALEA - Acção Local Estatística Aplicada (INE - Instituto Nacional de Estatística) e INE
Informações sobre dados, tabelas e gráficos - Representação gráfica de dados (Pictogramas)
http://interstat.stat.vt.edu/InterStat/intro.html-ssi
Estatística na Internet
InterStat é o nome dado ao local na Internet, onde cada um pode publicar ou ler acerca de qualquer assunto de investigação Estatística ou métodos inovadores. Os artigos são escolhidos pelo editor. Uma vez aceites, os artigos abstractos ficam disponíveis para consulta. Os artigos estão em Formato Documental Portátil (PDF) e/ou em Formato Postscript (PS).
http://lib.stat.cmu.edu/
Departamento de Estatística da Universidade de Carnegie Mellon
Principal ponto de entrada para StatLib (Biblioteca de Estatística) na Universidade de Carnegie Mellon. Colecção de Software e dados estatísticos, etc..
Anexo II: A Estatística na Internet
134
http://lib.stat.cmu.edu/DASL/
Biblioteca de História e Dados
DASL é um conjunto de arquivo de dados e relatos que ilustram o uso de métodos estatísticos básicos. Espera-se fornecer dados a partir de uma larga variedade de tópicos para que os professores de Estatística possam encontrar exemplos reais a dar aos seus alunos. Este programa DASL localiza informações e ficheiros de interesse comum.
http://members.aol.com/johnp71/javastat.html#WhichAnalysis
Páginas Internet que permitem cálculo estatístico
As páginas Internet listadas aqui compreendem um acesso fácil, a uma variedade de software estatístico. Todas estas fontes estão acessíveis uma vez que caso se tenha acesso à Internet. O acesso é gratuito através de vários fornecedores.
http://olam.ed.asu.edu/~glass/502/home.html
Universidade de Illinois (EUA)
Gene Glass Curso na Universidade Estatal do Arizona
http://trochim.human.cornell.edu/kb/sampling.htm
Amostragem é o processo de unidades de selecção (ex., pessoas, organizações) a partir de um interesse de uma população que ao estudar uma amostra, pode claramente generalizar os resultados para a população que queremos escolher. Fala-se acerca de alguns termos estatísticos usados na amostragem. Finalmente discute-se a maior distinção entre Probabilidade e não Probabilidade nos métodos de amostragem.
http://www.alumni.caltech.edu/~chamness/equation/equation.html
Instituto de Tecnologia da Califórnia
Coeficiente de entrada para 3x; 3 sistema de equações e respectiva resolução.
http://www.amstat.org/
Associação de Estatística Americana
Anexo II: A Estatística na Internet
135
http://www.animatedsoftware.com/statglos/statglos.htm
Empresa de Software de Animação
Glossário Internet de Termos de Estatística
http://www.biostat.washington.edu/Xvlib/
Universidade de Washington
Listas actualizadas de departamentos de estatística, associações, arquivos de dados e grupos de discussão, etc.
http://www.cas.lancs.ac.uk/glossary_v1.1/Alphabet.html
Universidade de Lancaster (Inglaterra)
Índice Alfabético de todos os items
http://www.estatistica.eng.br/
Página Pessoal de Paulo Afonso Lopes
É um portal que se destina a desmistificar o ensino e o uso da Estatística e informa as pessoas como utilizarem este importante ramo da ciência, muitas vezes mal compreendido.
http://www.execpc.com/~helberg/statistics.html
Probabilidades e Estatística
É um lista de recursos estatísticos a descobrir no World Wide Web (www), que é útil na pratica.
http://www.gsm.uci.edu/~joelwest/Statistics/index.html
Métodos de estatística
Estas páginas fornecem referências a outras informações “on-line”, reportando ao uso de métodos de Estatística em negócios, ensino e investigação científica. Inclui também recursos exemplificados.
http://www.itl.nist.gov/div897/ctg/stat/stsm.htm
Testar Software por intermédio de métodos de estatística
Anexo II: A Estatística na Internet
136
Projecto de ensaios de software de métodos de estatística. Inclui quadro de testes para determinar se um programa está em conformidade com as especificações funcionais
http://www.math.yorku.ca/
Universidade de York
Fonte de Estatística de York
http://www.math.yorku.ca/SCS
Serviço de consulta de Estatística da Universidade de York
Publicações Online
http://www.math.yorku.ca/SCS/Gallery/
Página Internet de Michael Friendly
Visualização de dados e Gráficos Estatísticos
http://www.math.yorku.ca/SCS/Online/
Universidade de York
Programa SPSS e SYSTAT
http://www.maths.uq.edu.au/~gks/webguide/
Ciência Estatística na Internet
A Ciência Estatística na Internet (StatWeb) está designada para ser disponível num guia de fontes estatísticas. Em termos de conteúdo é um dos mais activos “Sites” na Austrália dedicados à ciência estatística
http://www.mathsoft.com/splus/
MathSoft Inc
Site de informação oficial do S Plus
http://www.minitab.com/
Minitab Inc
Software para manuseamento de dados estatísticos
Anexo II: A Estatística na Internet
137
http://www.mnsinc.com/dan_rope/gpl/
Arquivo de produção Gráfica (GPL)
Arquivo de produção Gráfica para construção de “applets java” que intercedem nos gráficos estatísticos de alta qualidade.
http://www.msi.umn.edu/user_support/scivis/scivis-list.html
Universidade de Minnesota (EUA)
Instituto de “Super - computação”
http://www.physics.csbsju.edu/stats/
Utilização da estatística
Utilização da estatística
http://www.probability.net/
Lições (Tutorials) de Probabilidade
Bem vindo ás minhas lições de probabilidade. São consideradas um curso completo “on-line”, de medida teórica. São designadas como um conjunto de simples exercícios conduzindo gradualmente ao desenvolvimento de resultados.
http://www.pstat.com/
P-STAT, Inc.
Outras fontes (Links) sobre Estatística e software de gráficos estatísticos.
http://www.saigon.com/~tuan/statlnk.htm
Fontes de Estatística de Saigão - Vietname
http://www.sas.com/
SAS Institute Inc
Matéria da SAS
Anexo II: A Estatística na Internet
138
http://www.spss.com/
SPSS Inc
Programa SPSS para Windows e explicação de como correr o mesmo SPSS em modo interactivo e não interactivo de UT Austin
http://www.stat.duke.edu/sites/java.html
NWP Associates, Inc
Colecção de “applets java” em tópicos de estatística
http://www.stat.ncsu.edu/info/jse/
Jornal de Estatística Educacional
Jornais e Publicações Online
http://www.stat.sc.edu/~west/javahtml/Regression.html
Departamento de Estatística da Universidade da Carolina do Sul (EUA)
“applet java” programada para ensinar os alunos sobre o efeito dos pontos médios na respectiva recta de regressão.
http://www.stat.sc.edu/~west/webstat/
Departamento de Estatística da Universidade da Carolina do Sul (EUA)
“Kit” de Estatística em “Linguagem de programação Java”, da Webster West da Universidade da Carolina do Sul (EUA). Leitores de dados locais em arquivo de formato simples
http://www.stat.ucla.edu/consult
Departamento de Estatística da Universidade Californiana de Los Angeles (UCLA)
Algumas ligações (links) para computação interactiva, a correr sobre Xlisp-Stat e outros programas no servidor da UCLA.
http://www.stat.ucla.edu/textbook/demos/
Departamento de Estatística da Universidade Californiana de Los Angeles (UCLA)
Estatísticas da UCLA
Anexo II: A Estatística na Internet
139
http://www.stat.ufl.edu/vlib/statistics.html
Centro de Saúde da Universidade da Flórida
Listas actualizadas de departamentos de estatística, associações, arquivos de dados e grupos de discussão
http://www.stat.ufl.edu/vlib/statistics.html
Departamento de Estatística da Universidade da Florida
Departamentos e Grupos de Estatística
http://www.stat.unipg.it/iasc/
Universidade de Perugia - Itália
Este serviço é oferecido pelo departamento de Estatística da Universidade de Perugia – Itália
“Java Applet” para 3D de “Animated Normal Distribution”
http://www.stat.unipg.it/JAVA/nor3d-en.html
Universidade de Perugia - Itália
Análise em Estatística é uma importante actividade no departamento Samba, no Centro de Computorização Norueguês (NR). Existem outras actividades, como: Análise e Reconhecimento de Imagem e Padrões.
http://www.stat.unipg.it/ncsu/info/jse/homepage.html
Universidade de Perugia - Itália
Jornais e Publicações Online
http://www.statistics.com/
Análise estatística
Directório compreensivo de ligações e fontes de dados; É um “Site” útil quando se necessita de encontrar dados estatísticos.
http://www.wolfram.com/
Wolfram Research, Inc.
Anexo II: A Estatística na Internet
140
Software de Matemática e Estatística
http://www.yorku.ca/dept/psych/lab/sas/
Universidade de York
Notas de Curso em SAS/GRAPH e respectivas ligações (links), sintaxe, sumários e exemplos.
http://www.yorku.ca/dept/psych/lab/sas/sgintro.htm
Universidade de York
Software WebPower, Diagramas Sieve, a correr sobre SAS na Internet
http://www.mathforum.com/math.topics.html
The Math Forum
Site Internet tipo “forum”, sobre Matemática (Estatística)
http://www.mathforum.com/probstat/probstat.software.html
The Math Forum
Software para Probabilidades e Estatísticas
http://www.nctm.org
Concelho Nacional de Professores de Matemática (E.U.A.)
http://www.ti.com/calc/docs/calchome.html
Texas Instruments
Informações sobre Calculadoras Texas Instruments utilizadas no Ensino
http://www.casio.com/education/index.cfm
Casio
Informações sobre Calculadoras Casio utilizadas no Ensino
141
Ficha técnica
Participaram neste trabalho os formadores abaixo referidos que cederam os respectivos direitos de propriedade e autoria:
Coordenador Nacional:
António Adérito Araújo
Coordenadores Locais:
Elisabete Quintas (Coimbra) e Miguel Shirley (Lisboa)
Texto:
António Adérito Araújo
Carlos Rosmaninho
Elisabete Quintas
Fernanda Soares
Jacinto Salgueiro
Lino Nossa
Maria Rita Martins
Nely Vilanova
Paula Bulhão
Produção Multimédia:
Manuel Borrões e Tiago Borrões
Jogos Didácticos:
Joaquim Perdigão, Nely Vilanova, Ricardo Shirley e Luís Fernandes
Apoio Administrativo:
António Silva
Investigação na Internet:
António Shirley, Ricardo Shirley e Miguel Shirley
Esta Publicação é propriedade do GICEA, Gabinete de Gestão de
iniciativas comunitárias.
Este produto é protegido pelas leis em vigor e copyright, estando
reservados todos os seus direitos. Não pode ser reproduzido nem
transcrito por qualquer processo seja ele qual for sem autorização
dos titulares do direito. Os infractores são passíveis de
procedimento judicial.
Índice
APRESENTAÇÃO DO MANUAL DE EXERCÍCIOS........................................................... 1 INICIAÇÃO À ESTATÍSTICA ..................................................................................... 2 1-Fases de um estudo estatístico. ............................................................................ 3 2-Estatística Descritiva/Estatística Indutiva. .............................................................. 3 3-Razões para utilizar uma amostra. ........................................................................ 3 4-Classifique cada uma das variáveis estatísticas....................................................... 3 5-Indique a população e a unidade estatística. .......................................................... 4 6- Frases para comentar(...). .................................................................................. 4 7- Variáveis discretas e variáveis contínuas............................................................... 4 8- Estatística Descritiva ou Estatística Indutiva.......................................................... 5 9- Termos Estatísticos(...). ..................................................................................... 5 10-População/Amostra/Unidade Estatística. .............................................................. 6 11-Análise de Texto. Termos estatísticos (...)............................................................ 6 12- Numa escola Básica.... amostragem aleatória, amostragem sistemática e amostragem estratificada. ................................................................... 7 13- Comente as seguinte afirmação(...).................................................................... 7 14- Dê exemplos de população(...). ......................................................................... 7 15- Indique População/amostra/unidade estatística (...). ............................................ 7 16- Limitações de um estudo Estatístico(...).............................................................. 8 17- Análise de dados estatísticos (quadro-Drogas)..................................................... 8 18-Análise de dados estatísticos (gráfico circular-Acções). .......................................... 9 19 - Análise de dados estatísticos (quadro-Jogos olímpicos). ..................................... 10 20- As Audiências.....amostras. ............................................................................. 10 21- Candidatos a um emprego....normas de selecção............................................... 11 22- Classificação de variáveis...qualitativas e quantitativas. ...................................... 12 DISTRIBUIÇÃO DE FREQUÊNCIAS REPRESENTAÇÃO GRÁFICA E TABULAR DOS DADOS ESTATÍSTICOS.................................................................... 13 23 – Dias de Nevoeiro(...)..................................................................................... 15 24 – Ocupantes de automóveis(....). ...................................................................... 16 25 –Número de irmãos(....). ................................................................................. 16 26-Concurso Municipal para o cargo de Contabilista.(...)........................................... 17 27-Horas de estudo de uma turma(...). .................................................................. 17 28 – Complete o quadro da distribuição de frequências. ........................................... 18 29- Classes ….Limites........................................................................................... 18 30-Classificação de um teste de matemática (0-100).(...)......................................... 18 31-Classificações (0 – 100) de um exame de Português.(...). .................................... 19 32- Os atletas praticantes de judo(....)................................................................... 19 33- Hábitos de leitura(....). ................................................................................... 20 34- Inquérito feito sobre o agregado familiar a 300 famílias(....). .............................. 20 35- As idades dos professores(....)......................................................................... 21 36 - Alunos matriculados no 1º ciclo por NUTS I,II,III.(....). ..................................... 21 37- Análise de gráfico(...). .................................................................................... 22
38- Número de refeições...pictograma.(...). ............................................................ 22 39- Na escola da Rita.. número de alunos que têm computador.(pictograma)(...)................................................................................ 23 40- Num stand de automóveis usados.(...). ............................................................ 23 41- Numas termas existem 16 hotéis.(...)............................................................... 24 42- Estudo sobre a população urbana(....). ................................................................... 24 43- Fez-se um inquérito, aos 100 empregados de uma fábrica.(....). ....................................................................................................... 25 44- Na Quinta do Seminário, a produção de uvas.... ................................................ 25 45– Idades dos participantes num torneio de ténis(....). ........................................... 26 46- Numa produção anual de 2000 milhares de toneladas de cortiça(..). .......................................................................................................... 26 47- Numa distribuição de frequências(...). .............................................................. 27 48- Eleições da associação de estudantes do Instituto Serra(...). ............................... 27 PARÂMETROS ESTATÍSTICOS ................................................................................ 28 49 - Numa cooperativa pretendeu-se testar o modo como as máquinas distribuíam batatas(...). ......................................................................... 31 50- Num estudo sobre o número de ervilhas por cada vagem(...). ............................. 31 51-Lucro por dia de um supermercado (...)............................................................. 31 52- O salário médio anual que uma empresa paga aos seus empregados(...). ................................................................................................. 32 53- Observe a tabela seguinte e indique a moda...................................................... 32 54 –Para a distribuição abaixo(...medidas de tendência central). ............................... 32 55 - Tempo, em meses, que 250 jovens estiveram no desemprego(...). ................................................................................................. 33 56- Média , a moda e a mediana............................................................................ 33 57 - Resultados recolhidos por uma empresa de venda de enciclopédias ao domicílio(...). .............................................................................. 34 58- Lançaram-se 6 moedas iguais sobre uma mesa(...)............................................ 34 59-Mediu-se o tempo gasto na execução de uma tarefa numa fábrica(...). ......................................................................................................... 35 60- Indique o valor de a, sabendo que o conjunto de números(...)............................. 35 61 - Os depósitos dos clientes de um Banco(...). ..................................................... 36 62 –Mediana ...quadris(...). .................................................................................. 36 63- O gerente de uma fábrica ....os minutos de atraso de uma empregada(...).................................................................................................... 36 64- Salários de 5 funcionários(...).......................................................................... 37 65- Determine o desvio padrão. ............................................................................ 37 66- As classificações na disciplina de Português(....). ............................................... 38 67 - O casal Pires tem 6 filhos com as seguintes idades(...). ..................................... 38 68-Notas no final do 2º período, na disciplina de Matemática(...)............................... 39 69- Inquérito a 75 jovens sobre as idas a discotecas(...). ......................................... 39 70-Resultados de um mesmo teste.... aplicado a duas escolas(...). ............................ 40 71 – Pesos de alunos (...). .................................................................................... 41 72 - O número de garrafas de vinho existentes num supermercado(...)................................................................................................ 41 73- Vencimentos dos operários de uma empresa em milhares de escudos(...). ....................................................................................................... 42
74- 400 esferas de rolamento com os seguintes diâmetros(...).................................. 42 75-O n.º de pares de meias produzidas por duas fabricas(...)................................... 43 76 – Tempo em minutos a ver televisão(...). ........................................................... 43 77 - Idades dos alunos matriculados no Ensino Recorrente Nocturno (...). ..................................................................................................... 44 78- Qual foi o número que se adicionou...média(...)................................................. 44 79- Média, a variância e o desvio padrão (...).......................................................... 45 80- O encarregado de uma fábrica de confecções.. anotou o tempo.. que empregado demora na casa-de-banho(...). ........................................... 45 81– Notas na Disciplina de Português(....). ............................................................. 45 82- O n.º de dias que os professores faltaram ...num ano lectivo(....). ........................................................................................................ 46 83- As distribuições seguintes... notas obtidas por três turmas.. à disciplina de matemática(...). ................................................................................ 47 84- Os salários (em milhares de escudos) de três empresas X,Y e Z são os seguintes(...). ........................................................................................ 47 ESTATÍSTICA BIDIMENSIONAL .............................................................................. 48 85– Determine o coeficiente de correlação linear.. construindo o diagrama de dispersão(...).................................................................................... 50 86– Alturas e os pesos de 15 empregados de uma fábrica (...). ................................. 50 87– Numa fábrica de peças para automóveis é feito o acompanhamento sistemático da percentagem de peças defeituosas(...).................................................................................................... 51 88– Calcule o coeficiente de correlação linear (...). .................................................. 51 89– Refaça o exercício anterior.. pontos B, G, H, D,J,E. ............................................ 52 90– Encontre a equação de correlação linear (...). ................................................... 52 91– milhares de Km2, e a população, em milhões de habitantes, de países membros da EU.(...)................................................................................... 52 92- Calcule os coeficientes de regressão e interprete os dados. ................................. 53 93- Calcule os coeficientes da equação de regressão. ............................................... 53 94- Resultados das observações meteorológicas no mês de Dezembro de 19988(...). ...................................................................................... 53 95- Estudo sobre os equipamentos privados dos cidadãos europeus.(...)...................................................................................................... 54 96- Perguntou-se a 15 rapazes a sua idade e a hora a que usualmente se deitavam(....). ............................................................................... 55 97- Casamentos/Divórcios. ................................................................................... 55 98- Haverá interesse em realizar um estudo estatístico(...)....................................... 56 99– Pesos e alturas dos alunos de uma turma(...). .................................................. 56 PROPOSTA DE RESOLUÇÃO................................................................................... 58 Resolução do exercício 1....................................................................................... 58 Resolução do exercício 2....................................................................................... 59 Resolução do exercício 3....................................................................................... 59 Resolução do exercício 4....................................................................................... 59 Resolução do exercício 5....................................................................................... 60 Resolução do exercício 6....................................................................................... 60 Resolução do exercício 7....................................................................................... 61 Resolução do exercício 8....................................................................................... 61
Resolução do exercício 9....................................................................................... 62 Resolução do exercício 10. .................................................................................... 62 Resolução do exercício 11. .................................................................................... 62 Resolução do exercício 12. .................................................................................... 63 Resolução do exercício 13. .................................................................................... 63 Resolução do exercício 14. .................................................................................... 64 Resolução do exercício 15. .................................................................................... 64 Resolução do exercício 16. .................................................................................... 64 Resolução do exercício 17. .................................................................................... 65 Resolução do exercício 18. .................................................................................... 65 Resolução do exercício 19. .................................................................................... 66 Resolução do exercício 20. .................................................................................... 67 Resolução do exercício 21. .................................................................................... 68 Resolução do exercício 22. .................................................................................... 69 Resolução do exercício 23. .................................................................................... 70 Resolução do exercício 24. .................................................................................... 71 Resolução do exercício 25. .................................................................................... 71 Resolução do exercício 26. .................................................................................... 72 Resolução do exercício 27. .................................................................................... 72 Resolução do exercício 28. .................................................................................... 73 Resolução do exercício 29. .................................................................................... 73 Resolução do exercício 30. .................................................................................... 74 Resolução do exercício 31. .................................................................................... 75 Resolução do exercício 32. .................................................................................... 75 Resolução do exercício 33. .................................................................................... 76 Resolução do exercício 34. .................................................................................... 77 Resolução do exercício 35. .................................................................................... 78 Resolução do exercício 36. .................................................................................... 78 Resolução do exercício 37. .................................................................................... 79 Resolução do exercício 38. .................................................................................... 80 Resolução do exercício 39. .................................................................................... 81 Resolução do exercício 40. .................................................................................... 82 Resolução do exercício 41. .................................................................................... 83 Resolução do exercício 42. .................................................................................... 84 Resolução do exercício 43. .................................................................................... 86 Resolução do exercício 44. .................................................................................... 86 Resolução do exercício 45. .................................................................................... 87 Resolução do exercício 46. .................................................................................... 88 Resolução do exercício 47. .................................................................................... 89 Resolução do exercício 48. .................................................................................... 90 Resolução do exercício 49. .................................................................................... 91 Resolução do exercício 50. .................................................................................... 94 Resolução do exercício 51. .................................................................................... 95 Resolução do exercício 52. .................................................................................... 97 Resolução do exercício 53. .................................................................................... 97 Resolução do exercício 54. .................................................................................... 97 Resolução do exercício 55. ...................................................................................101 Resolução do exercício 56. ...................................................................................102
Resolução do exercício 57. ...................................................................................104 Resolução do exercício 58. ...................................................................................105 Resolução do exercício 59. ...................................................................................107 Resolução do exercício 60. ...................................................................................109 Resolução do exercício 61. ...................................................................................109 Resolução do exercício 62. ...................................................................................111 Resolução do exercício 63. ...................................................................................112 Resolução do exercício 64. ...................................................................................114 Resolução do exercício 65. ...................................................................................116 Resolução do exercício 66. ...................................................................................116 Resolução do exercício 67. ...................................................................................117 Resolução do exercício 68. ...................................................................................118 Resolução do exercício 69. ...................................................................................119 Resolução do exercício 70. ...................................................................................121 Resolução do exercício 71. ...................................................................................121 Resolução do exercício 72. ...................................................................................123 Resolução do exercício 73. ...................................................................................124 Resolução do exercício 74. ...................................................................................124 Resolução do exercício 75. ...................................................................................124 Resolução do exercício 76. ...................................................................................125 Resolução do exercício 77. ...................................................................................126 Resolução do exercício 78. ...................................................................................127 Resolução do exercício 79. ...................................................................................127 Resolução do exercício 80. ...................................................................................128 Resolução do exercício 81. ...................................................................................129 Resolução do exercício 82. ...................................................................................131 Resolução do exercício 83. ...................................................................................133 Resolução do exercício 84. ...................................................................................134 Resolução do exercício 85. ...................................................................................135 Resolução do exercício 86. ...................................................................................137 Resolução do exercício 87. ...................................................................................138 Resolução do exercício 88. ...................................................................................139 Resolução do exercício 89. ...................................................................................139 Resolução do exercício 90. ...................................................................................140 Resolução do exercício 91. ...................................................................................141 Resolução do Exercício 92....................................................................................142 Resolução do Exercício 93....................................................................................143 Resolução do Exercício 94....................................................................................143 Resolução do Exercício 95....................................................................................145 Resolução do Exercício 96....................................................................................146 Resolução do Exercício 97....................................................................................146 Resolução do Exercício 98....................................................................................147 Resolução do Exercício 99....................................................................................147 BIBLIOGRAFIA....................................................................................................151
1- Apresentação do Manual de exercícios de estatística
1
APRESENTAÇÃO DO MANUAL DE
EXERCÍCIOS
Este manual tem como objectivo apresentar propostas de exercícios de estatística aos formadores. É complementar ao manual de estatísticas à bateria de acetados e ao CD.
O manual está dividido em cinco capítulos:
Capítulo 1:Iniciação á estatística.
Capítulo 2:Distribuição de frequências e representação gráfica e tabular de dados estatísticos.
Capítulo 3: Parâmetros estatísticos.
Capítulo 4: Estatística bidimensional.
Capítulo 5: Proposta de resolução.
Cada capítulo tem uma pequena introdução teórica ao tema abordado.
2- Iniciação à estatística
2
INICIAÇÃO À ESTATÍSTICA
Os nossos formandos terão necessidade de utilizar uma linguagem própria. Assim, é necessário que estes tenham bem presentes o significado de População, Amostra e Variável:
População
Colecção de seres com características em comum e com interesse para o estudo
Amostra
Subconjunto finito da população que se supõe representativa desta
A utilidade da estatística estende-se às mais diferentes áreas de actividade.
O homem, como parte integrante da sociedade actual necessita de conhecimentos estatísticos. No dia–a–dia contacta com a informação que precisa de ser interpretada e transmitida.
Interpretações da estatística
!Sondagem ou um censo
!Um estudo !Uma ciência
Processos de escolha de uma amostra Amostragem sistemática
Amostragem estratificada
Amostragem aleatória simples
2- Iniciação à estatística
3
Variável
São atributos qualitativos/quantitativos que estão relacionados com a qualidade/quantidade e que se apresentam com várias modalidades
1-Fases de um estudo estatístico.
Quais são as fases que um estudo estatístico deve conter e, em seu entender, quais as características e as limitações do método estatístico?
2-Estatística Descritiva/Estatística Indutiva.
O que distingue a Estatística Descritiva da Estatística Indutiva?
3-Razões para utilizar uma amostra.
Indique quais são as razões que levam a utilizar uma amostra num estudo estatístico.
4-Classifique cada uma das variáveis estatísticas.
Relativamente aos habitantes de uma aldeia do norte, consideraram-se as seguintes variáveis estatísticas:
- Sexo
- Profissão.
- Tempo que passa a ver televisão.
- Número de pessoas do seu agregado familiar.
Classifique cada uma das variáveis estatísticas como qualitativa ou quantitativa, e esta última em discreta ou contínua.
Qualitativas
Quantitativas
Discretas
Contínuas
2- Iniciação à estatística
4
5-Indique a população e a unidade estatística.
Indique a população e a unidade estatística em que o carácter em estudo era:
a) O desporto favorito das mulheres portuguesas.
b) A cilindrada dos carros dos professores da Escola D. Maria.
c) A marca dos carros vendidos em Portugal em 1999.
d) A cor dos olhos de um grupo de amigos.
6- Frases para comentar(...).
Comente as seguintes afirmações à luz dos conhecimentos já adquiridos:
a) “Para saber se os bolos da minha pastelaria eram bons tive que os provar todos. Já estou enjoada”.
b) “Os Europeus não se vão adaptar à moeda única. Eu já fiz um inquérito à população Portuguesa”.
c) “A minha empresa já sabe quem vai ganhar as eleições. Entrevistámos 2000 cidadãos da Linha de Cascais“.
7- Variáveis discretas e variáveis contínuas.
Dos seguintes atributos estatísticos indique justificando os que são variáveis discretas e variáveis contínuas.
a) Número de palavras de um soneto de Camões.
b) A nota da disciplina de Estrutura e Organização e Tratamento de Dados.
c) O peso das 5 Top Model mais famosas da actualidade.
d) O sexo dos professores da escola secundária de S. José.
e) As temperaturas registadas num dia na Guarda.
2- Iniciação à estatística
5
8- Estatística Descritiva ou Estatística Indutiva.
Indique, para cada uma destas situações, se as conclusões apresentadas são resultados de Estatística Descritiva ou Estatística Indutiva.
a) Com base nos resultados dos Exames Nacionais, o Ministério da Educação informou que 15% dos alunos que fizeram Exame Nacional a Matemática obtiveram nota superior a 10.
b) O Francisco teve 13.5 de média nos testes de Matemática, no 3º período.
c) 15% dos Alunos do IFRTS frequentam o 2º ciclo.
d) O salário médio de 20 empregados da Panificadora Caty é de 85000 escudos.
e) Segundo a Unicef, mais de 20% das crianças no mundo vivem em situação de pobreza.
9- Termos Estatísticos(...).
Leia atentamente a seguinte notícia
300 milhões utilizam a net
“ Os cibernautas em todo o mundo ultrapassam os 300 milhões segundo a projecção “Imagem da Web”, realizada pela empresa canadiana Angus Reid, que prevê o surgimento de mais 150 milhões de utilizadores dentro de um ano. Segundo os resultados, citados pela Lusa, e obtidos com base numa amostra de 28.374 consumidores de 34 países, os E.U.A continuam muito à frente em termos de cibernautas. Os norte–americanos que “navegam” são já 108 milhões, cerca de 39 por cento dos utilizadores de Internet em todo o mundo.
Os dados que caracterizam o universo das pessoas interrogadas indica que 20 por cento têm acesso à Internet em casa, 97 por cento têm televisão, 49 por cento possuem telemóvel e 42 por cento um computador portátil. Por países, nos Estados Unidos 59 por cento da população dispõe de acesso à Internet, no Canadá esse valor desce para 56 por cento , no Japão não ultrapassa os 33 por cento.
Notícias – Tek sapo.,pt
a) A partir da leitura desta notícia mencione os termos estatísticos contidos neste texto e defina-os.
2- Iniciação à estatística
6
b) No estudo referido na notícia usou-se um censo ou uma sondagem? Justifique.
10-População/Amostra/Unidade Estatística.
Para estimar a audiência dos quatro canais de televisão, realizou-se um estudo a partir de 2500 famílias portuguesas. Relativamente ao estudo indique:
a) A população.
b) A amostra.
c) A unidade estatística.
11-Análise de Texto. Termos estatísticos (...).
Leia atentamente o seguinte texto:
Veredicto contra a Microsoft divide E.U.A.
Um terço dos norte americanos apoia a decisão do juíz Thon Penfiel em condenar a Microsoft por abuso de posição dominante, mas outro terço está do lado da empresa de Bill Gates.
De acordo com uma sondagem publicada na última edição da revista semanal Newsweek, 34 por cento dos cidadãos nos E.U.A. está de acordo com a condenação da Microsoft, percentagem exactamente igual aos que desaprovam a decisão do juiz Thomas. Os restantes 32 por cento declararam não ter opinião sobre o assunto.
A sondagem, efectuada nos passados dias 6 e 7 de Abril de 2000, a uma amostra de 752 adultos, revela ainda que 54 por cento dos inquiridos julga que a decisão os afectará directamente, sendo que 21 por cento espera um impacto desta decisão quer nos utilizadores individuais, quer nas empresas. Cerca de 33 por cento, por outro lado, espera um impacto menor, enquanto 36 por cento dos indíviduos acham que a decisão de Thomas Penfield não terá impacto sobre os utilizadores.
Notícias Teck sapo
Tendo em conta o texto indique:
a) A população.
b) A amostra.
2- Iniciação à estatística
7
c) Indique o carácter estatístico referenciado no texto.
d) Em sua opinião a amostra seleccionada é representativa? Justifique.
12- Numa escola Básica.... amostragem aleatória, amostragem sistemática e amostragem estratificada.
Numa escola básica á 600 alunos nos 7º ,8º e 9 anos distribuídos da seguinte forma:
Ano N.º de alunos 7º ano 180 8º ano 216 9º ano 204 Total 600
Pretende-se escolher uma amostra de 60 alunos para efectuar um estudo sobre a ocupação dos tempos livres. Explique como precederia usando amostragem aleatória, amostragem sistemática e amostragem estratificada
13- Comente as seguinte afirmação(...).
“Uma amostra deve ser imparcial e representativa”
“ Os resultados de uma sondagem não contém margem de erro”
14- Dê exemplos de população(...).
- finita
- infinita
15- Indique População/amostra/unidade estatística (...).
Os seguintes valores representam o número de filhos de 10 operários de uma fábrica:
4,2,1,5,0,3,3,2,1,1.
Indique:
2- Iniciação à estatística
8
a) A população.
b) A unidade estatística.
c) A variável estatística, classificando-a.
d) O que representam os números 4,2,1,5,0,3,3,2,1,1.
16- Limitações de um estudo Estatístico(...).
Foi levantada a seguinte questão via internet: Quanto tempo aguentaria sem telemóvel? Responderam a esta questão 645 pessoas. Os resultados a esta questão são apresentados na seguinte quadro: Respostas 1 Hora 1 dia 1 Semana 1 mês Para sempre Morria logo
Votos 81 160 75 60 104 165
a)Em seu entender os dados obtidos são representativos da opinião dos portugueses.
b) Apresente as limitações de um estudo desta Natureza.
17- Análise de dados estatísticos (quadro-Drogas).
Foram analisados instrumentos de notação estatística da Polícia Judiciária sobre a droga apreendida em 1997 e 1998, seguidamente apresentados:
Tipo de droga
(gramas) 1997 1998
Heroína 57.389 96.666
Cocaína 3.162.638 624.949
Haxixe 9.621.188 5.574.794
Liamba 72.256 7.115
2- Iniciação à estatística
9
A partir dos dados da tabela:
a) Indique os dois tipos de droga mais consumidos em 1997.
b) Os dois tipos de droga menos consumidos em 1998.
c) Indique os tipos de droga em que se verifica maior diferença de um ano para o outro.
18-Análise de dados estatísticos (gráfico circular-Acções).
Os resultados da transacção de acções na Bolsa de Valores de Lisboa, Sabendo que o número total de empresas cujas acções são aceites na Bolsa é de 3000, determine:
a) O número de empresas que diminuíram a sua cotação.
b) O número de empresas que estabilizaram a sua cotação.
c) O número de empresas que não diminuíram a sua cotação.
20%
38%
42%
subiram
desceram
constantes
2- Iniciação à estatística
10
19 - Análise de dados estatísticos (quadro-Jogos olímpicos).
Na tabela seguinte encontram-se alguns dados referentes às Olimpíadas desde 1960.
Ano Local Países Homens Mulheres Modalidades Provas
1960 Roma 84 4859 537 17 150
1964 Tóquio 94 4854 732 18 163
1968 México 113 5782 844 17 172
1972 Munique 123 8485 1603 21 195
1976 Montreal 88 4915 1274 21 198
1980 Moscovo 81 4311 1192 21 206
1984 Los Angeles 140 5458 1620 23 221
1988 Seul 160 7105 2476 23 237
Responda às seguintes questões:
a) Em que ano é que participaram mais atletas?
b) É mais constante o crescimento do número de atletas masculinos ou femininos?
c) Como trabalho de investigação tente arranjar dados referentes aos Jogos Olímpicos de 1992 a 1996 para completar a tabela anterior.
20- As Audiências.....amostras.
No dia 2 de Agosto de 1999, a percentagem de audiências em cada um dos quatro canais nacionais de televisão era a seguinte:
Canais de televisão Audiências (%)
Canal 1 28.4 Canal 2 6.8 Canal 3 51.3 Canal 4 13.5
a) Numa amostra de 1500 espectadores, escolhidos ao acaso, quantos espectadores se esperaria que vissem o canal 3?E o canal 1?
2- Iniciação à estatística
11
b) Numa amostra de um certo número de espectadores, escolhidos ao acaso, 1020 viram, e o canal 1. Quantos espectadores esperaria que vissem a canal 3? E a canal 4 ?
21- Candidatos a um emprego....normas de selecção.
Seis colegas da Faculdade de Economia resolveram candidatar-se a uma vaga nas Finanças e os resultados foram os seguintes:
Candidatos Classificação
académica
Classificação
da entrevista Prova Escrita
Ana 13 7 10
Pedro 10 16 11
João 10 8 10
Rui 11 8 9
Maria 14 12 14
Marina 10 12 8
As normas de selecção de candidaturas para técnico no Parlamento Europeu são as seguintes
a) Quais foram os candidatos eliminados?
b) Qual o candidato melhor classificado no concurso?
c) Apresente uma lista ordenada de candidatos.
Classificação académica - 30%
Classificação dos resultados da Entrevista - 50 %
Prova escrita - 20%
2- Iniciação à estatística
12
d) Se um dos candidatos tivesse sido classificado com zero na entrevista, poderia ser admitido? Justifique.
22- Classificação de variáveis...qualitativas e quantitativas.
Analise a tabela seguinte, classificando as variáveis em qualitativas e quantitativas:
Família Idade da
mãe Classe social
Ordenado mensal
N.º de filhos em idade escolar
1 25 Baixa 249 € 1
2 34 Média 449 € 2
3 42 Média alta 748 € 1
4 28 Média 400 € 3
5 39 Alta 1746 € 4
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
13
DISTRIBUIÇÃO DE FREQUÊNCIAS
REPRESENTAÇÃO GRÁFICA E
TABULAR DOS DADOS
ESTATÍSTICOS
FASES DO MÉTODO ESTATÍSTICO
!Definição do problema !Planificação do processo de resolução !Recolha de dados !Organização dos dados !Representação dos dados !Análise e interpretação dos dados
FREQUÊNCIAS
Absolutas (fi) Corresponde ao n.º de vezes que esse valor foi atribuído
Relativas(fri) É o quociente entre a frequência absoluta do valor da variável e o n.º total de observações
n
ff i
r =
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
14
REPRESENTAÇÃO GRÁFICA
Gráficos Circulares
Pictogramas Gráficos de Barras
Representado por um círculo que está dividido em sectores cuja as amplitudes são proporcionais
São gráficos onde se utilizam símbolos alusivos ao fenómeno que se vai estudar
Gráficos onde se visualiza a frequência através de rectângulos proporcionais à frequência
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
15
23 – Dias de Nevoeiro(...).
O boletim mensal n.º 10 do INE publicou os seguintes resultados registados no Observatório da Serra do Pilar, no Porto, em cada um dos meses de 1999:
Meses
do ano
N.º de dias
de nevoeiro
Janeiro 2
Fevereiro 1
Março 7
Abril 2
Maio 6
Junho 7
Julho 4
Agosto 3
Setembro 2
Outubro 2
Novembro 3
Dezembro 3
a) Em quantos meses do ano se registaram 7 dias de nevoeiro?
b) Construa uma tabela de frequências absolutas e relativas (acumuladas e não acumuladas).
c) Indique o número de meses em que se verificaram 4 ou menos dias de nevoeiro.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
16
d) O que significa dizer que fr3= 59%?
24 – Ocupantes de automóveis(....).
Para fazer um estudo estatístico, a Ana anotou, durante 10 minutos, o número de ocupantes por automóvel numa estação de serviço da auto-estrada:
1 2 1 4 2 1 1 2 1 2 4 1
5 2 3 1 1 2 2 1 3 1 1 1
2 1 2 3 3 1 2 4 1 3 1 2
3 2 4 1 6 3 3 3 2 3 3 1
3 4 3 2 4 3 2 3 1 1 2 5
a) Identifique a variável estatística em estudo e indique os seus valores.
b) Classifique a variável estatística.
c)Construa uma tabela de frequências absolutas e relativas.
25 –Número de irmãos(....).
Os alunos de uma turma do 8º ano de escolaridade têm o seguinte número de irmãos:
0 0 2 3 2
4 1 1 1 2
2 0 1 3 3
3 4 4 2 0
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
17
a) Construa a tabela de frequências dos dados.
b) Quantos alunos têm menos de dois irmãos?
c) Quantos alunos têm pelo menos 3 irmãos?
26-Concurso Municipal para o cargo de Contabilista.(...).
A tabela seguinte mostra como foram classificados os candidatos a um concurso municipal para o cargo de Contabilista.
Classificação 0 1 2 3 4 5 6 7 8 9 10
Frequência 5 12 17 25 30 43 36 16 13 4 0
a) Entre que valores (inclusive) varia a classificação?
b) Quantas pessoas concorreram ao emprego?
c) Construa a tabela de frequências absolutas acumuladas.
d) Quantos candidatos tiraram nota inferior a 5?
27-Horas de estudo de uma turma(...).
Observe o seguinte gráfico que representa a distribuição do número de horas de estudo de uma turma:
2
7
9
43
0
2
4
6
8
10
1 2 3 4 5
Horas de estudo por dia
Nº
de a
lun
os
a) Determine a dimensão da amostra inquirida.
b) Elabore a respectiva tabela de frequências relativas simples e acumuladas.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
18
c) Qual a percentagem de alunos que estudam 3 horas?
28 – Complete o quadro da distribuição de frequências.
xi Fi fr Fr
R 20 0,2
P 30 0,5
T 40
D
29- Classes ….Limites.
Considere a classe seguinte :[1,40;1.55[
Indique:
a) O limite inferior da classe.
b) O limite superior da classe.
c) A amplitude da classe.
d) Calcule o ponto médio da classe.
30-Classificação de um teste de matemática (0-100).(...).
A tabela seguinte mostra os dados relativos à classificação de um teste de matemática (0-100).
CLASSIFICAÇÃO DO TESTE DE MATEMÁTICA (0-100)
37 75 56 73 70 74 43 30 35 65 51 37
30 43 82 52 59 39 16 50 49 63 90
Construa a tabela de frequências considerando 6 classes, atribuindo o valor 14 para o limite inferior da primeira classe e o valor 13 para a amplitude de cada classe.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
19
31-Classificações (0 – 100) de um exame de Português.(...).
O quadro seguinte representa as classificações (0 – 100) de um exame de Português:
8 11 12 14 20 25 29 61 62 69 70 75 27
30 35 36 35 30 30 37 79 85 99 61 60 39
38 38 30 31 40 41 41 60 53 59 58 57 43
42 42 42 45 46 46 47 57 56 55 51 50 48
48 49 49 50
a) Construa uma tabela de frequências, utilizando as seguintes classes:
0-10; 10-20; 20-30; 30-40; 40-50; 50-60; 60-70; 70-80; 80-90; 90-100
b) Quantos alunos obtiveram nota inferior a 50%?
32- Os atletas praticantes de judo(....).
Os atletas praticantes de judo são distribuídos consoante os seus pesos. Numa competição realizada na zona centro, concorreram 30 jovens, com os seguintes pesos:
a) Faça a contagem da distribuição numa tabela de frequências, sabendo que as classes foram divididas da seguinte forma:
41,5 49,8 31,4 61,2 59,6 35.2 42 53 51.2 56
56 42 43.5 42 54 58.4 36 58 59.4 62
55.6 39 45.2 42.7 36 38.5 43.6 45 54.3 57.6
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
20
30-35;35-40;... ;60-65.
b) Faça um histograma da distribuição considerada.
c) Trace um polígono de frequências.
33- Hábitos de leitura(....).
Inquiriram-se 230 alunos de uma escola sobre os seus hábitos de leitura, tendo-se obtido os resultados apresentados na tabela seguinte:
N.º de alunos Tipo de livro Rapazes Raparigas
Policiais 37 20
Romances 30 36
Ficção Científica 23 24
Banda desenhada 32 28
a) Relativamente a este estudo indique:
- População
- Os caracteres estatísticos
b) Represente as preferências das raparigas num gráfico circular.
c) Escolha um tipo de gráfico adequado para comparar os preferências.
34- Inquérito feito sobre o agregado familiar a 300 famílias(....).
Num inquérito feito sobre o agregado familiar a 300 famílias construiu-se a seguinte tabela:
Agregado Familiar 2 3 4 5 6 7 8
Fi 99 48 3
Fiac 27 72 237 297
a) Complete a tabela.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
21
b) Qual a percentagem de famílias com um agregado familiar de 5 pessoas?
c) Qual a percentagem de famílias que têm menos de 6 pessoas no seu agregado familiar?
d) Represente a distribuição de frequências relativas num diagrama circular.
35- As idades dos professores(....).
Numa escola, as idades dos professores são as seguintes:
31 32 51 29 46
43 32 57 56 59
41 50 45 33 42
56 61 62 44 57
Utilize um separador de frequências para representar os dados.
36 - Alunos matriculados no 1º ciclo por NUTS I,II,III.(....).
Alunos matriculados no 1º ciclo por NUTS I,II,III
41%
17%
33%
5%
4%
Norte
Centro
Lisboa V.Tejo
Alentejo
Algarve
a) Qual a região em que existe menor número de alunos inscritos? E o maior número?
b) Sabendo que no ano lectivo 1998/99 existiam 497517 alunos, determine o número de alunos matriculados em cada região?
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
22
37- Análise de gráfico(...).
Com base no gráfico, diga justificando, se são verdadeiras ou falsas as seguintes afirmações:
25
5
46
65
36
23
0
10
20
30
40
50
60
70
7 8 9 10 11 12
Xi
Efe
ctiv
os
i. A dimensão da população em estudo é 55.
ii. 11,5% é a frequência relativa do valor 12.
iii. 70,5% dos efectivos correspondem a valores menores ou iguais a 10.
iv. A frequência relativa do valor 8 é nula.
38- Número de refeições...pictograma.(...).
O pictograma junto ilustra o n.º de refeições servidas por um restaurante durante quatro meses do ano:
= 150 refeições Junho . Julho Agosto Setembro
a) Quantas refeições foram servidas nos meses de julho e agosto
b) Sabendo que mês de Outubro serviram 450 refeições desenhe a linha do diagrama correspondente a Outubro
c) Construa uma tabela de frequências que traduza a mesma informação
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
23
39- Na escola da Rita.. número de alunos que têm computador.(pictograma)(...).
Na escola da Rita fez-se um estudo sobre o número de alunos que têm computador. Foi apresentado um inquérito a 4 turma e os resultados foram apresentados no seguinte gráfico:
Alunos com computador 4 = crianças
Turma A
Turma B
Turma C
Turma D
a) Qual a turma que têm mais computadores
b) Dois alunos da turma D adquiriram mais tarde um computador. Reformule o gráfico.
c) Construa uma tabela de frequências e represente os dados através de um gráfico de barras.
d) Quais as vantagem e desvantagem de um pictograma.
40- Num stand de automóveis usados.(...).
Num stand de automóveis usados há carros de várias marcas: Marca 1- 15, Marca 2 – 4 , Marca 3 – 10, Marca 4 – 2; Marca 5 – 5.
a)Determine a percentagem do número de carros de cada marca .
b) Ilustre esta informação através de um gráfico circular.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
24
41- Numas termas existem 16 hotéis.(...).
Numas termas existem 16 hotéis, distribuídos pelas seguintes categorias:
Categoria Nº de hotéis
4
3
5
2
2
a) Calcule as frequências relativas simples e acumuladas.
b) Qual a percentagem de hotéis de 5 estrelas existentes nas termas?
c) Desenhe o gráfico de barras das frequências absolutas.
42- Estudo sobre a população urbana(....).
Foi feito um estudo sobre a população urbana em vários países do mundo, retractado no quadro seguinte:
Países 1990 2000
Pop. Urbana(Mlhões)
Pop.urbana/pop. total (%)
Pop. total
Pop. Urbana(milhões)
Pop. urbana/pop.tot
al (%) Pop.total
Argélia 12,9 52 19.5 60
Nigéria 38,2 35 63.9 43
Quénia 5.7 24 11.1 32
Bolívia 3.7 51 5.2 58
Brasil 112.1 75 140.8 82
China 302.2 26 451.7 35
Filipinas 26.7 43 37.2 49
India 216.1 26 290.9 29
Indonésia 53.1 29 79.5 37
Tailândia 12.1 22 17.7 29
Austrália 14.6 85 16.8 86
E.U.A 188.1 75 213.3 78
Japão 95.3 77 101.1 79
Fonte : Enciclopédia Universal da Texto Editora
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
25
a) Com os dados fornecidos, complete a tabela indicando a população total em cada um dos países.
b) Quais foram os países que verificaram um maior aumento da população urbana.
c) Represente os dados graficamente, registando no mesmo gráfico a população urbana em 1990 e 2000.
43- Fez-se um inquérito, aos 100 empregados de uma fábrica.(....).
Fez-se um inquérito, aos 100 empregados de uma fábrica, sobre o meio de transporte que usavam para se deslocarem até ao local de trabalho:
Transporte Automóvel Autocarro Comboio Motorizada Bicicleta
N.º de pessoas 15 20 10 30 25
Construa um pictograma que ilustre a mesma informação, usando um símbolo para representar 5 pessoas.
44- Na Quinta do Seminário, a produção de uvas....
Na Quinta do Seminário, a produção de uvas foi a seguinte:
Anos 1995 1996 1997
Produção (ton.) 20 35 15
a) Os seminaristas guardavam as uvas em tanques que levavam 5 toneladas cada. Faça um pictograma que traduza a situação usando um símbolo (sexto de uvas por ex.) para representar 5 toneladas.
b) Cada tonelada corresponde a 135 litros de vinho. Faça um pictograma em que um garrafão (ou outro)corresponda a 150 litros de vinho.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
26
45– Idades dos participantes num torneio de ténis(....).
A distribuição de frequências relativas às idades dos participantes num torneio de ténis é dada pela seguinte tabela:
IDADE 16 17 18 19 20 21
FREQUÊNCIA 2 4 12 5 6 1
a) Elabore um quadro da distribuição de frequências absolutas e frequências relativas.
b) Construa o diagrama de barras para a distribuição de frequências relativas em %.
c)Quantos participantes têm menos de 18?
d) Qual a percentagem de participantes com mais de 20 anos?
46- Numa produção anual de 2000 milhares de toneladas de cortiça(..).
Numa produção anual de 2000 milhares de toneladas de cortiça, estão representados no quadro seguinte, os principais produtores mundiais:
Portugal Espanha França Brasil Itália México
Produção
(mil. ton.) 120 500 800 300 180 100
a) Represente o gráfico de barras das frequências.
b) Utilize um diagrama circular para representar a mesma distribuição.
c)Mencione duas regras comuns a este dois tipos de gráficos atrás referidos.
3- Distribuição de Frequências / Representação gráfica e tabular dos dados estatísticos
27
47- Numa distribuição de frequências(...).
Numa distribuição de frequências obtivemos os seguintes resultados:
Xi 10 20 30 40 50
fi 25 30 18 15 12
a) Elabore um quadro da distribuição de frequências absolutas e frequências relativas.
b) Construa para a distribuição de frequências absolutas um gráfico à sua escolha.
48- Eleições da associação de estudantes do Instituto Serra(...).
Para as eleições da associação de estudantes do Instituto Serra, com 300 alunos, concorreram 3 listas e votaram 225 alunos.
LISTAS
N.º votos
%
(em relação aos
alunos que votaram)
Lista A 57
Lista B 36
Lista C
a) Complete a tabela.
b) Construa um gráfico circular que traduza a situação descrita.
4- Parâmetros Estatísticos
28
PARÂMETROS ESTATÍSTICOS
A média, mediana e moda, chamam-se medidas de localização ou de tendência central. Estas medidas estatísticas, representam os fenómenos pelos seus valores “médias” em torno dos quais tendem a concentrar-se os dados.
MODA
Representa-se por Mo e é o conjunto de n valores de um conjunto x1; x2; ...; xn de uma variável estatística, ao valor que ocorre com maior frequência.
MEDIANA
Representa-se por Md. Sejam x1; x2; ...; xn , n dados estatísticos (por exemplo do menor ara o maior).
Se n é ímpar, chama-se Mediana ao valor da variável que ocupa a posição central.
Se n é par, chama-se Mediana à média aritmética de dois valores centrais.
MÉDIA
Representa-se por x e é o somatório de valores de uma variável quantitativa x1; x2; ...; xn a dividir pelo seu número total.
4- Parâmetros Estatísticos
29
Os quartis são os valores que dividem a distribuição em quatro partes iguais.
Quartis e diagramas de extremos e quartis
Sejam x1 e xn , respectivamente, o menor e o maior valor da variável, considerando o conjunto ordenado: Chama-se Quartis aos três valores Q1 Q2 e Q3, que dividem o conjunto em quatro partes iguais.
x1
Q1 Q2 Q3
Md xn
• Q2 coincide com a mediana
• Q1 indica-nos que pelo menos
25% das observações estão
abaixo de Q1
• Q3 indica-nos que pelo menos
75% das observações estão
abaixo de Q3
4- Parâmetros Estatísticos
30
Chama-se desvio médio à média aritmética do valor absoluto da diferença entre cada valor e a média.
VARIÂNCIA
σ2 = variância
n = número de dados
xi = dado
x = média
DESVIO PADRÃO
σ = desvio padrão
n = número de dados
xi = dado
x = média
Medidas de dispersão
( )2
1
n
yxn
ii∑
=
−=σ
( )2
11
2
n
xxn
i∑
=
−=σ
4- Parâmetros Estatísticos
31
49 - Numa cooperativa pretendeu-se testar o modo como as máquinas distribuíam batatas(...).
Numa cooperativa pretendeu-se testar o modo como as máquinas distribuíam batatas pelos diferentes sacos, que deveriam conter cada um 5 Kg. Para isso, pesaram-se 1000 sacos e agruparam-se os pesos obtidos em classes:
PESOS (Kg)
N.º de sacos
[4,7 ;4,9[ 150
[4,9 ;5,1[ 250
[5,1 ;5,3[ 300
[5,3 ;5,5[ 200
[5,5 ;5,7[ 100
Calcule os parâmetros estatísticos (Média, Moda, Mediana).
50- Num estudo sobre o número de ervilhas por cada vagem(...).
Num estudo sobre o número de ervilhas por cada vagem, obtiveram-se os seguintes resultados:
N.º de ervilhas por vagem 1 2 3 4 5 6 7 8
Efectivos 3 4 5 9 6 7 4 2
Calcule a mediana e a classe modal.
51-Lucro por dia de um supermercado (...).
A tabela seguinte indica o lucro por dia de um supermercado, durante 365 dias:
Lucro (em contos) 0 - 20 20 - 30 30 - 40 40 - 50 50 - 80
Frequência 20 50 90 120 90
a) Calcule a média e o desvio padrão.
4- Parâmetros Estatísticos
32
b) Desenhe um histograma que represente a distribuição, e nele assinale a média e o desvio padrão.
52- O salário médio anual que uma empresa paga aos seus empregados(...).
O salário médio anual que uma empresa paga aos seus empregados é de 400 contos. A média dos salários pagos aos homens e às mulheres é, respectivamente, 500 e 300 contos. Determine a percentagem de homens e de mulheres que trabalham na empresa.
53- Observe a tabela seguinte e indique a moda.
Observe a tabela seguinte e indique a moda.
Temperatura mínima (ºC) em Junho xi
Número de dias ni
12 3
14 4
15 6
16 7
17 5
18 6
54 –Para a distribuição abaixo(...medidas de tendência central).
Classes 2-4 4-6 6-8 8-10 10-12
fi 4 8 14 8 6
4- Parâmetros Estatísticos
33
a)Construa um histograma e um polígono de frequências para os dados anteriores
b)Calcule as medidas de tendência central?
55 - Tempo, em meses, que 250 jovens estiveram no desemprego(...).
A seguinte tabela mostra o tempo, em meses, que 250 jovens estiveram no desemprego:
Tempo (meses)
0 - 4 4 - 8 8 - 12 12 - 16 16 - 20 20 - 24
N.º de pessoas
40 30 31 39 54 56
a) Qual a percentagem de jovens que estiveram no desemprego menos de 1 ano?
b) Qual o intervalo de tempo modal?
c) Calcule o tempo médio e o desvio médio.
d) Desenhe um histograma para ilustrar os dados.
56- Média , a moda e a mediana.
Determine a média , a moda e a mediana de cada conjunto de dados:
a)
41 31 35 48 29 46 32
b)
58 57 61 61 69 57 61 68 52 64
4- Parâmetros Estatísticos
34
c)
95 83 97 86 86 97 83 87 97 86
57 - Resultados recolhidos por uma empresa de venda de enciclopédias ao domicílio(...).
A tabela seguinte mostra os resultados recolhidos por uma empresa de venda de enciclopédias ao domicílio:
Número de encomendas por mês Número de vendedores
0 – 10 1
10 – 20 5
20 – 30 7
30 – 40 6
40 - 50 5
a) Calcule a amplitude, a média e o desvio padrão da distribuição.
b) Faça um comentário acerca do interesse de cada uma destas medidas para interpretar a informação pela empresa.
58- Lançaram-se 6 moedas iguais sobre uma mesa(...).
Lançaram-se 6 moedas iguais sobre uma mesa, 80 vezes. Em cada lançamento contou-se o número de coroas voltadas para cima, obtendo-se os seguintes resultados:
Xi 0 1 2 3 4 5 6
fi 2 5 17 20 18 12 6
a) Elabore um quadro da distribuição de frequências absolutas e frequências relativas.
4- Parâmetros Estatísticos
35
b) Construa o diagrama de barras para a distribuição de frequências absolutas.
c) Indique a moda e a mediana.
d) Calcule a média aritmética.
59-Mediu-se o tempo gasto na execução de uma tarefa numa fábrica(...).
Mediu-se o tempo gasto na execução de uma tarefa numa fábrica. Os resultados foram os seguintes:
Tempo N.º de operários
10 - 12 4
12 – 14 6
14 – 16 8
16 – 18 12
18 – 20 5
Determine
a)a média
b) a mediana
c)o desvio padrão.
60- Indique o valor de a, sabendo que o conjunto de números(...).
12 10 11 10 9 10 13 8 11 a
tem:
- moda 10; - mediana 10 - média 10,3
4- Parâmetros Estatísticos
36
61 - Os depósitos dos clientes de um Banco(...).
Os depósitos dos clientes de um Banco, estão representados no quadro seguinte:
Importância (contos)
N.º de depósitos
[100;200[ 50
[200;300[ 55
[300;400[ 28
[400;500[ 20
[500;600[ 90
[600;700[ 10
[700;800[ 80
[800;900[ 67
a) Qual a percentagem de depósitos inferiores a 500 contos?
b) Construa o histograma.
c) Calcule a média aritmética.
d) Calcule o desvio padrão.
62 –Mediana ...quadris(...).
Para cada um dos conjunto de dados indique:
8 10 11 12 14 10 9 11 8 14
a) A mediana, o 1º e 3º quartis.
b) Construa o diagrama de extremos e quartis.
63- O gerente de uma fábrica ....os minutos de atraso de uma empregada(...).
O gerente de uma fábrica registou os minutos de atraso de uma empregada durante 12 dias.
Os resultados foram os seguintes:
4- Parâmetros Estatísticos
37
5 0 2 4 4 3
0 4 1 5 1 4
a)Elabore um diagrama de barras
b) Represente graficamente a função cumulativa
c) Calcule a média, a mediana, a moda e os quartis
d)Represente o polígono de frequências acumuladas.
64- Salários de 5 funcionários(...).
Na Tabela seguinte registaram-se os salários de 5 funcionários:
Ano
Funcionário 1980 1990 1995
A 50.000
B 60.000
C 75.000
D 100.000
Complete a tabela sabendo que:
Em 1990 os salários aumentaram 30%
Em 1995 os salários subiram relativamente a 1980 30 contos
Calcule a média/ desvio padrão: Tire conclusões.
65- Determine o desvio padrão.
Determine o desvio padrão de cada uma das distribuições:
4- Parâmetros Estatísticos
38
a)
Xi fi
1 3
2 4
3 6
4 5
b)
Xi fi
1 34
2 29
3 40
4 31
5 37
6 35
66- As classificações na disciplina de Português(....).
As classificações na disciplina de Português numa turma de 8º ano foram as seguintes:
Classificações Frequência absoluta
[0,20[ 2
[20,50[ 0
[50,75[ 4
[75,90[ 5
[90,100[ 3
a) Calcule o desvio padrão das notas destes alunos.
b) Interprete o resultado.
67 - O casal Pires tem 6 filhos com as seguintes idades(...).
O casal Pires tem 6 filhos com as seguintes idades: 3,7,9,11,13,15. Determine:
4- Parâmetros Estatísticos
39
a) A amplitude das idades.
b) Os desvios em relação á média.
c) O desvio médio.
68-Notas no final do 2º período, na disciplina de Matemática(...).
Em duas turmas do 7º ano da Escola Lusitano, as notas no final do 2º período, na disciplina de Matemática, foram as seguintes:
Classificações obtidas
1 2 3 4 5
A 1 5 6 2 1
B 0 8 3 3 1
a) Determine a média e o desvio padrão relativamente a cada uma das turmas.
b) Será que a média e o desvio padrão distinguem as duas distribuições?
69- Inquérito a 75 jovens sobre as idas a discotecas(...).
Fez-se um inquérito a 75 jovens sobre as idas a discotecas no último mês, e os resultados foram os seguintes:
N.º de idas à discoteca durante o mês
Frequência absoluta
0 10
1 17
2 12
3 20
4 6
5 6
6 4
a) Represente os dados graficamente.
b) Que percentagem de jovens não foi à discoteca?
4- Parâmetros Estatísticos
40
c) Qual a moda desta distribuição? E a amplitude?
d) Determine a mediana e a média da distribuição.
e) Qual é o desvio padrão?
70-Resultados de um mesmo teste.... aplicado a duas escolas(...).
Os resultados, numa escola de 0 a 100, obtidos por alunos de duas escolas num mesmo teste, aplicado a turmas do 8º ano, foram os seguintes:
Escola X
70 60 52 54 63 63 48 60 56 53 67 82 99
78 69 65 64 50 35 53 44 64 60 36 56 74
60 47 76 76 67 48 69 63 58
Escola Y
47 65 39 76 79 81 48 68 86 59 74 68 32
53 74 80 90 78 78 84 57 62 89 81 78 70
59 62 66 71 80 84 74 71 76 83 72 68 63
a) Organize os dados num duplo diagrama de caule-e-folhas.
b) Calcule os seguintes parâmetros:
- Média
- Mediana
- 1º quartil
- 3º quartil
4- Parâmetros Estatísticos
41
71 – Pesos de alunos (...).
Numa turma, pesaram-se os alunos, registando-se os dados na seguinte tabela:
61 53 48 63 47 38 40 67 39 47 71 63
65 52 61 49 50 62 44 58 66 61 59 57
72 60 52 50 46 71 43 42 55 45
a) Calcule o peso médio dos alunos da turma.
b) Organize os dados com amplitude igual a7 kg, tomando para limite inferior da 1º classe 35kg.
c) Construa um polígono de frequências absolutas acumuladas.
d) Determine a mediana.
e) Determine o desvio padrão.
72 - O número de garrafas de vinho existentes num supermercado(...).
O número de garrafas de vinho existentes num supermercado na época natalícia, distribui-se segundo os dados da tabela:
Capacidade da garrafa (cl) 25 50 100 150
N.º de garrafas 24 30 46 46
a) Determine a média da distribuição.
b) Como as vendas estavam a ser razoáveis, o número de garrafas de 150 cl foi aumentado. A média após o aumento no conjunto das garrafas é de 100 cl. Qual foi o aumento do número de garrafas?
4- Parâmetros Estatísticos
42
73- Vencimentos dos operários de uma empresa em milhares de escudos(...).
Para os dados seguintes, determine as localizações e os valores dos quartis.
Vencimentos dos operários de uma empresa em milhares de escudos
51 56 63 75 95 51
106 71 81 111 56 76
81 121 76 76 63 106
74- 400 esferas de rolamento com os seguintes diâmetros(...).
Uma fábrica precisou de adquirir 400 esferas de rolamento com os seguintes diâmetros:
Diâmetro N.º de esferas
4.90-4.95 24
4.95-5.00 74
5.00-5.05 120
5.05-5.10 78
5.10-5.15 104
Localize graficamente os quartis Q1, Q2 e Q3.
4- Parâmetros Estatísticos
43
75-O n.º de pares de meias produzidas por duas fabricas(...).
Os seguintes diagramas de extremos e quartis representam o n.º de pares de meias produzidas por duas fabricas:
Tendo em conta os diagramas, diga se são falsas ou verdadeiras as seguintes questões:
A) A diferença entre os extremos é menor para a fábrica Neves.
B) A amplitude interquartis é maior na fábrica Matias.
C) Na fabrica Matias verifica-se uma menor dispersão dos dados inferiores ou iguais a Q2.
D) Na fabrica Neves verifica-se uma maior dispersão dos dados superiores ou iguais a Q1.
76 – Tempo em minutos a ver televisão(...).
Fez-se um estudo sobre o tempo em minutos de 100 alunos de uma escola viam televisão por dia:
Tempo a ver T.V 0 - 15 15 - 30 30-45 45-60 60-75 75 - 90
Nº de alunos 32 22 18 12 10 6
a) Calcule as medidas de tendência central.
b) Analise a distribuição quanto à simetria.
4- Parâmetros Estatísticos
44
77 - Idades dos alunos matriculados no Ensino Recorrente Nocturno (...).
A tabela seguinte refere-se as idades dos alunos matriculados no Ensino Recorrente Nocturno:
Idades Alunos matriculados
15 30
16 48
17 57
18 39
19 54
20 36
21 18
22 18
a) Elabore a correspondente tabela de frequências completa. Calcule a percentagem de idades contidas no intervalo ]x-σ,x+σ[.
b) Determine a percentagem de alunos com idade superior ou igual a 19 anos.
c) Qual destes dois diagramas de extremos e quartis representam os dados? Justifique.
78- Qual foi o número que se adicionou...média(...).
10 números têm média de 15. Se juntarmos um 11º número ao conjunto a média passa a ser 20. Qual foi o número que se adicionou.
4- Parâmetros Estatísticos
45
79- Média, a variância e o desvio padrão (...).
Considere os valores de uma variável quantitativa 18,21,22,24,25,28.
a)Calcule a média, a variância e o desvio padrão.
b) A Partir dos dados da média e do desvio padrão calcule os mesmas medidas para os valores 38,41,42,44,45.
80- O encarregado de uma fábrica de confecções.. anotou o tempo.. que empregado demora na casa-de-banho(...).
O encarregado de uma fábrica de confecções anotou o tempo que cada empregado demora na casa-de-banho, ao longo de um dia, tendo obtido os seguintes resultados:
2 9 12 10 0 5 4 17 7
13 15 5 10 1 3 19 6 7
12 14 5 8 15 4 2 11 2 12
Considerando os intervalos de classe: [0,4[;[4,8[;[8,12[;[12,16[;[12,16[;[16,20[
a) Construa a tabela de frequências, considerando os diferentes tipos de frequências.
b) Calcule a média desta distribuição e faça um pequeno comentário sobre a atitude do patrão no registo destes valores.
81– Notas na Disciplina de Português(....).
Numa escola com 364 alunos do 11º ano, inquiriram-se ao acaso 32 alunos os quais obtiveram as seguintes notas na Disciplina de Português.
a) Diga se o referido estudo se trata de um censo ou de uma sondagem?
13 9 8 11 13 10 15 10
15 18 10 8 11 10 13 9
15 15 10 13 9 11 13 10
10 14 15 9 8 10 11 12
4- Parâmetros Estatísticos
46
b) Defina “população” e “amostra” e identifique-as no presente estudo.
c) Elabore a respectiva tabela de frequências absolutas simples e acumuladas e frequências relativas simples e acumuladas em %.
d) Na amostra estudada, quantos alunos obtiveram positiva
e) Na mesma amostra, quantos alunos tiveram menos de 13 valores;
f) Qual a percentagem de alunos com nota igual ou superior a 15.
g) Qual a moda e a mediana das notas;
h)Determine a média das notas obtidas pelos alunos
i)Determine o desvio padrão das notas.
j)Faça o gráfico de barras das notas obtidas.
l)Elabore o diagrama de quartis das notas obtidas
82- O n.º de dias que os professores faltaram ...num ano lectivo(....).
Numa escola registaram-se o n.º de dias que os professores faltaram nos num ano lectivo.
N.º de dias de faltas 0 1 2 3 4 5 6 7 8 10
N.º de prof. 6 3 12 11 7 4 2 3 1 1
a) Constrói uma tabela em que figurem frequências absolutas e relativas simples e acumuladas.
b) Olhando para a tabela das frequências relativas acumuladas, diz quais são o 1º quadril, a mediana e o 3º quadril. Confirma os valores com a calculadora.
c) Qual a moda, a média e a mediana desta distribuição e qual o significado da moda e da média nesta situação?
d) Representa graficamente a distribuição de frequências absolutas simples.
e) Faça um gráfico de extremos e quartis.
4- Parâmetros Estatísticos
47
83- As distribuições seguintes... notas obtidas por três turmas.. à disciplina de matemática(...).
As distribuições seguintes representam as notas obtidas por três turmas do 8º ano à disciplina de matemática:
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
a) Qual das obteve melhores resultados. Justifique?
b) Classifique quanto à simetria/assimetria a distribuição das notas dos alunos.
84- Os salários (em milhares de escudos) de três empresas X,Y e Z são os seguintes(...).
Os salários (em milhares de escudos) de três empresas X,Y e Z são os seguintes:
X 50 70 60 60 150 170 260 60 70 60 200
Y 80 80 80 50 40 40 50 200 80 80 100
Z 120 60 60 115 115 90 100 115 115 90 90
Relativamente aos dados fornecidos ligue as seguintes colunas
Empresa X *Distribuição simétrica
Empresa Y *Distribuição assimétrica positiva
Empresa Z *Distribuição assimétrica negativa
5- Estatística Bidimensional
48
ESTATÍSTICA BIDIMENSIONAL
No capítulo anterior estudaram-se diferentes variáveis. Interessa agora descobrir se existe relação entre essas variáveis.
Grau de dependência entre duas variáveis - CORRELAÇÂO
Para testar a correlação, o primeiro passo é marcar num
gráfico cartesiano, cada uma das séries de valores num dos
eixos – DIAGRAMA DE DISPERSÃO
Conjunto de pontos obtidos – NUVEM DE PONTOS
5- Estatística Bidimensional
49
Se a correlação existente for do tipo linear, isto é, se os pontos no diagrama de dispersão se distribuírem em torno de uma recta, mede-se a correlação através do COEFICIENTE DE CORRELAÇÃO LINEAR.
r = ( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
R>0 Correlação positiva
R>0 Correlação negativa
R=1 Correlação positiva
local
R=-1 Correlação negativa
total
R=0 Não existe correlação
a = ( )∑ ∑∑
−
∑ ∑−
n
xx
xyn
yx
2
2
Coeficiente de regressão - Declive da recta de regressão
5- Estatística Bidimensional
50
85– Determine o coeficiente de correlação linear.. construindo o diagrama de dispersão(...).
Determine o coeficiente de correlação linear para os dados dos conjuntos abaixo, construindo o diagrama de dispersão.
a)
X 3 4 10 9 7 11
y 1,6 1,2 1,0 1,2 1,4 1,0
b)
X 3 4 5 6 7 8 9
y 9 1 0 3 8 2 1
c)
X 0 1 2 3 4 5 7
y 4 19 22 41 35 62 66
d)
X -13 -11 -9 -7 -5
y 0,01 0,02 0,03 0,04 0,05
86– Alturas e os pesos de 15 empregados de uma fábrica (...).
Verifique o grau de correlação linear entre as alturas e os pesos de 15 empregados de uma fábrica, cujos valores são apresentados na seguinte tabela:
Peso (kg)
67 73 61 61 70 68 81 89 71 66 75 86 75 63 80
Altura (cm)
167 171 166 167 171 172 175 180 170 167 170 179 174 167 178
5- Estatística Bidimensional
51
87– Numa fábrica de peças para automóveis é feito o acompanhamento sistemático da percentagem de peças defeituosas(...).
Numa fábrica de peças para automóveis é feito o acompanhamento sistemático da percentagem de peças defeituosas produzidas em cada intervalo de meia hora. Após um mês de produção, os valores médios percentuais de defeitos em cada horário são os seguintes:
Horas 7:00 7:30 8:00 8:30 9:00 9:30 10:00 10:30 11:00 11:30 12:00
Percentagens 0,12 0,08 0,14 0,18 0,14 0,16 0,12 0,18 0,16 0,18 0,20
Verifique a existência da correlação linear entre o horário e a percentagem feita.
88– Calcule o coeficiente de correlação linear (...).
Calcule o coeficiente de correlação linear do conjunto de pontos apresentado:
00,5
11,5
22,5
33,5
44,5
0 2 4 6 8X
Y
H K
G I J
B F
E
C
DA
5- Estatística Bidimensional
52
89– Refaça o exercício anterior.. pontos B, G, H, D,J,E.
Refaça o exercício anterior não considerando os pontos B, G, H, D,J,E
90– Encontre a equação de correlação linear (...).
Encontre a equação de correlação linear para o conjunto de valores, relacionando horas e percentagem de defeitos, do exercício 87.
91– milhares de Km2, e a população, em milhões de habitantes, de países membros da EU.(...).
A tabela seguinte mostra a extensão, em milhares de Km2, e a população, em milhões de habitantes, de países membros da UE:
Países
Extensão
(milhares de Km2)
População
(milhões)
Bélgica 30,5 9,8
Dinamarca 43,1 5,1
Grécia 132 10
Irlanda 70,3 3,5
Holanda 41,2 14,7
Portugal 92 10,3
a) Determine a percentagem da área e população de Portugal, relativamente aos outros países.
b) Dos países indicados na tabela, diga qual o que tem mais habitantes por Km2 e o que tem menos.
c) Determine o coeficiente de correlação entre as variáveis extensão e população, e comente os resultados.
5- Estatística Bidimensional
53
92- Calcule os coeficientes de regressão e interprete os dados.
A partir de 7 observações para duas variáveis X e Y obtiveram-se os seguintes resultados:
01,344
99,403
96,301
3,49
8,43
2
2
=ΥΧ
=Υ
=Χ
=Υ
=Χ
∑∑∑∑∑
ii
i
i
i
i
93- Calcule os coeficientes da equação de regressão.
A partir de uma amostra de 10 observações para X e Y obtiveram-se os seguintes resultados:
Χ =15,66
Υ =76,5
6,12765=ΥΧ∑ ii
54,26192 =Χ∑ i
94- Resultados das observações meteorológicas no mês de Dezembro de 19988(...).
A tabela seguinte indica os resultados das observações meteorológicas no mês de Dezembro de 1998 (Boletim Mensal do INE – n.º 1):
Localização Temp. do ar (ºC) (média mensal)
N.º de horas de sol
Lisboa 14,3 60,7
Porto 13,1 34,5
Ponta Delgada 14,5 87,4
Funchal 17,5 119,8
Considerando a variável bidimensional temperatura do ar, número de horas de sol:
Calcule os coeficientes de regressão e interprete os dados
Calcule os coeficientes da equação de regressão
5- Estatística Bidimensional
54
a) Desenhe o diagrama de dispersão e interprete-o.
b) Calcule o coeficiente de correlação e interprete-o
c) Calcule a recta de regressão e utilizando-a faça uma estimativa de quantas horas de sol teria uma localidade onde a temperatura do ar, em média, foi de 16 ºC.
95- Estudo sobre os equipamentos privados dos cidadãos europeus.(...).
Foi feito um estudo sobre os equipamentos privados dos cidadãos europeus, para testar o seu nível de vida:
Países da comunidade
Televisões (por mil
habitantes,1993)
Telefones (por 1000
habitantes,1993)
B 450 436
BK 530 590
D 560 456
GR 350 458
E 400 365
F 580 537
IRL 300 328
I 430 423
L 350 543
NL 540 500
AT 500 449
P 300 330
FI 630 545
SE 670 679
UK 430 470
a) Represente os dados através de um diagrama de dispersão, e sobre este faça um esboço da recta de regressão.
b) Observando o diagrama de dispersão, refira-se ao sinal e à intensidade da correlação. Que conclusão se pode tirar?
5- Estatística Bidimensional
55
96- Perguntou-se a 15 rapazes a sua idade e a hora a que usualmente se deitavam(....).
Perguntou-se a 15 rapazes a sua idade e a hora a que usualmente se deitavam. As respostas vêm apresentadas no seguinte diagrama de dispersão:
0
2
4
6
8
10
12
0 5 10 15Idade em anos
Ho
ras
de
dei
tar
97- Casamentos/Divórcios.
Tendo em conta o seguinte quadro:
Países Casamentos (por 1000
habitantes)
Divórcios (por 1000
habitantes)
B 5 3
BK 7 2
D 5 2
EL 4 1
L 5 2
NL 6 2
A 5 2
P 6 1
FIN 5 3
S 4 2
IS 5 2
NO 5 3
Comente a frase, à luz dos conhecimentos estatísticos:
“ quanto mais casamentos mais divórcios”....
Indique o sinal da correlação, justificando a resposta.
5- Estatística Bidimensional
56
98- Haverá interesse em realizar um estudo estatístico(...).
Para cada uma das situações seguintes, diga se, em sua opinião, haverá interesse em realizar um estudo estatístico sobre a relação entre elas:
a) As audiências de uma telenovela e o nível de cultural dos Portugueses.
b) O número de horas de estudo de um aluno e as médias obtidas nas disciplinas.
c) O número de habitantes de uma casa e a quantidade de pão comprado durante uma semana.
d) O número de televisões vendidas por uma loja de uma cidade e o número de passageiros que viajam nos transportes públicos dessa mesma cidade.
e) O número de idas à praia e a medida do seu sapato.
f) O peso de um recém-nascido e o número de cigarros fumados por uma grávida por dia.
99– Pesos e alturas dos alunos de uma turma(...).
Na tabela estão representados pesos e alturas dos alunos de uma turma:
Peso (kg) Altura (cm)
56 156
62 162
50 155
50 156
59 165
57 161
70 170
78 175
60 159
55 160
62 168
a) Ordene os alunos por ordem crescente de peso. Tenha atenção para que cada peso se mantenha associado à altura correspondente.
5- Estatística Bidimensional
57
b) Obtenha um gráfico com a nuvem de pontos correspondente a esta situação. O gráfico sugere a existência de correlação linear entre as duas variáveis?
c) Qual é o respectiva coeficiente de correlação linear?
d) Calcule a recta de regressão.
e) Verifique que a recta de regressão passa no ponto de coordenadas (peso médio; altura média).
f) Construa uma nova coluna na tabela contendo os valores estimados pela recta de regressão para o peso dos alunos desta turma.
6- Proposta de resolução
58
PROPOSTA DE RESOLUÇÃO
Resolução do exercício 1.
As fases que um estudo estatístico deve conter são:
Definir o problema ( deve ser estabelecido de uma forma clara e precisa. Nesta fase deve-se verificar se não foram realizados estudos estatísticos sobre a mesma temática ).
Planificação do processo de resolução ( nesta fase definem-se os procedimentos necessários à resolução do problema, tipo de dados a obter e a forma como obtê-los, que tipo de população a estudar e a calendarizarão das actividades ).
Recolha de dados ( envolve a obtenção, a reunião e o registo sistemático dos dados. Estes podem ser obtidos por questionários, observações directas, entrevistas etc... ).
Organização e apresentação dos dados ( nesta fase faz-se a contagem dos dados. Apresentação dos dados em tabelas ou gráficos, facilitando-se, deste modo, a compreensão do carácter em estudo e a sua futura análise ).
Análise e interpretação dos dados ( esta ´a fase mais importante e delicada do estudo estatístico, pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o problema ).
Um estudo estatístico deve obedecer a certos requisitos que levem à sua efectiva utilização, pelo que deve ser um factor de redução de incerteza, precisa, divulgada regularmente e harmonizada de modo a permitir comparações. É preciso ter bastante cuidado com a população a escolher para o estudo estatístico, pois é fácil fazer uma recolha de dados que não correspondam à realidade.
6- Proposta de resolução
59
Resolução do exercício 2.
A Estatística Descritiva tem como finalidade descrever certas propriedades relativas a um conjunto de dados.
A Estatística Indutiva procura inferir propriedades do universo estatístico a partir de propriedades verificadas na amostra.
Assim podermos concluir que a Estatística Descritiva tem como processo a redução de dados, enquanto que a Estatística Indutiva tem como processo a generalização de resultados obtidos à custa de um conjunto de elementos a um outro conjunto mais numeroso.
Resolução do exercício 3.
A recolha de dados é a fase mais dispendiosa do trabalho estatístico, e o seu preço é tanto maior quanto maior for o número de dados recolhidos.
Quando se faz um estudo estatístico a principal dificuldade resulta da recolha de dados ser um trabalho demasiadamente longo e difícil.
Uma outra dificuldade resulta de os dados não serem completamente estáveis e rigorosos.
Para além disso existem estudos que não seria possível interrogar todos os indivíduos, daí que se utilizam amostras para o estudo estatístico.
Resolução do exercício 4.
Sexo: qualitativa.
Profissão: qualitativa.
Tempo que passa a ver televisão: quantitativa contínua.
6- Proposta de resolução
60
Número de pessoas do seu agregado familiar: quantitativa discreta.
Resolução do exercício 5.
a)
População: mulheres portuguesas.
Unidade Estatística: a mulher portuguesa.
b)
População: todos os professores da escola D. Maria em Coimbra.
Unidade Estatística: professor da mesma escola.
c)
População: todos os carros vendidos em Portugal em 1999.
Unidade Estatística: um carro vendido em Portugal.
d)
População: um grupo de amigos.
Unidade Estatística: cor dos olhos.
Resolução do exercício 6.
a)
Nesta situação o senhor da pastelaria cometeu um erro inutilizando todos os elementos observados. Neste caso justificava-se a escolha de uma amostra.
b)
Neste caso não se poderia generalizar, concluindo apenas por um inquérito aos portuguesas a opinião sobre a moeda única. A amostra não era representativa de todos Europeus.
6- Proposta de resolução
61
c)
A mostra não era representativa, não podendo obter resultados de confiança a partir desta sondagem á população de uma determinada região. Teria que se considerar uma amostra representativa que incluía elementos de todo país de todas as classes sociais e vários níveis etários.
Resolução do exercício 7.
a)
Variável discreta.
b)
Variável discreta.
c)
Variável contínua.
d)
Variável discreta.
e)
Variável contínua.
Resolução do exercício 8.
A.
Estatística Indutiva
B.
Estatística Descritiva
C.
Estatística Indutiva
6- Proposta de resolução
62
D.
Estatística Descritiva
E.
Estatística Indutiva
Resolução do exercício 9.
a)
A população em estudo: cibernautas de todo mundo
A amostra: 28.374 consumidores de 34 países.
b)
Nos estudo referido na notícia usou-se um sondagem porque a amostra é 28.374 consumidores de 34 países. Para ser um censo tinha que se interrogar todas as pessoas do mundo inteiro.
Resolução do exercício 10.
a)
A população: famílias portuguesas.
b)
A amostra: 2500 famílias portuguesas.
c)
Unidade Estatística: uma família portuguesa.
Resolução do exercício 11.
a) A população: cidadãos dos EUA
6- Proposta de resolução
63
b) A amostra: 752 adultos.
c) Condenação ou não da Microsoft.
d) A amostra seleccionada não é representativa, pois o número de inquiridos é muito reduzido em relação à população dos EUA
Resolução do exercício 12.
A amostragem aleatória qualquer aluno tinha probabilidade de ser escolhido. A amostragem sistemática, estabelecendo-se uma regra. Assim escolhendo um aluno ao acaso e depois estabelecia uma regra para escolher os restantes alunos, como por exemplo, de 10 em 10. Na amostragem estratificada procede-se do seguinte modo:
Ano Amostra
7º Ano 18
8º Ano 22
8º Ano 20
Resolução do exercício 13.
Na escolha de uma mostra deve-se ter em conta alguns aspectos tais como:
Todos os indivíduos da população devem ter igual probabilidade de serem seleccionadas;- ser imparcial
Deve conter em proporção tudo o que a população possui, qualitativa e quantitativamente - representativa
A afirmação sobre o facto das sondagem não conterem erros é falsa. Existem casos de erros nas sondagem bastante conhecidos (eleição presidencial americana e 1936). Para que não ocorram erros e para que se possa obter resultados de confiança a partir de sondagens, será necessário utilizar amostras representativas, o que não é fácil muitas vezes de se conseguir. Assim a
6- Proposta de resolução
64
representatividade da amostra faz com que os resultados obtidos possam conter erros.
Resolução do exercício 14.
Finita: - alunos de uma escola do interior (por exemplo)
Infinita: Temperaturas do mundo num determinado momento (por exemplo)
Resolução do exercício 15.
a)
A população é constituída por todos os operários de uma fábrica.
b)
A unidade estatística é o operário.
c)
A variável em estudo é o número de filhos do operário. Esta variável é discreta, pois só pode tomar um número finito de valores.
d)
Os números são resultados dos 10 operários inquiridos ou seja são o número de filhos de cada um dos 10 operários.
Resolução do exercício 16.
a)
Não são representativos
b)
As limitações deste estudo são:
6- Proposta de resolução
65
Não é representativa uma vez que nem todos os que têm telemóvel navegam na Internet.
O n.º de pessoas pode não ser real uma vez que a mesma pessoa pode ter respondido mais que uma vez.
Resolução do exercício 17.
a)
Haxixe e cochina.
b)
Liamba e heroína.
c)
A maior diferença de um ano para o outro foi no tipo de droga haxixe.
Resolução do exercício 18.
a)
Sabendo que o número de empresas cujas acções são aceites na bolsa é 3000, e que 38 % diminuíram a sua cotação; estão através de uma regra de três simples conseguimos determinar o número de empresas que desceram.
Nº de empresas %
3000 100
x 38
1140100
383000 == xx
6- Proposta de resolução
66
1140∴ empresas diminuíram a sua cotação
b)
42 % das empresas que estabilizaram cotação (42 %)
Pelo processo da alínea anterior
1260100
423000 == xx
1260∴ as empresas que estabilizaram a sua cotação
c)
o número de empresas que não diminuíram a sua cotação são:
n.º de empresas que estabilizaram a sua cotação + o n.º o de empresas que subiram a sua cotação.
Nº de empresas que subiram :
600 + 1260 = 1860
1860∴ empresas não diminuíram a sua cotação
Resolução do exercício 19.
a)
O ano que participaram mais adultos foi em 1972, participaram 10.088 atletas.
Em 1960 participaram 5396 atletas
Em 1964 participaram 5586 atletas
Em 1968 participaram 6626 atletas
Em 1972 participaram 10088 atletas
6- Proposta de resolução
67
Em 1976 participaram 6189 atletas
Em 1980 participaram 5503 atletas
Em 1984 participaram 7078 atletas
Em 1988 participaram p581 atletas
b)
Masculinos
c)
Aconselha-se os alunos a procurarem sites de forma a que estes utilizem dados reais.
Resolução do exercício 20.
a)
Viriam o canal 3 = 770 espectadores (1500x 51,3 %)
Viriam o canal 1 = 426 espectadores (1500 x 28,4 %)
b)
1020 corresponderia 28, 4 % (100% corresponde a 3592) – canal 1
1843 “ 51,3 % (3592 x 51,3%) – canal 3
485 “ 13, 5 % (3592 x 13,5) – canal 4
6- Proposta de resolução
68
Resolução do exercício 21.
Candidatos Classificação académica
Classificação da Entrevista Prova Escrita
Classificação Total
Ana 13 x 30% = 3.9 7x 50% =3.5 10x 20% =2 9.4
(3.9+3.5+2)
Pedro 10x30% =3 16x50% = 8 11x20% = 2.2 13.2
(3+8+2.2)
João 10x30% =3 8x50%=4 10x20% =2 9
(3+4+2)
Rui 11x30% = 3.3 8x50% =4 9x20% =1.8 9.1
(3.6+4+1.8)
Maria 14x30% =4.2 12x50% =6 14x20% =2.8 13
(4.2+6+2.8)
Mariana 10x30% =3 12x50=6 8x20%=1.6 10.6
(3+6+1.6)
a)
Os candidatados eliminados foram : Ana, Rui e o João.
b)
O candidato melhor classificado foi o Pedro.
6- Proposta de resolução
69
c)
Candidatos Classificação
Pedro 13.2
Maria 13
Mariana 10.6
Ana 9.4
Rui 9.1
João 9
d)
Só poderia ter nota positiva se tivesse 20 valores na classificação académica e 20 valores na prova escrita. Se a admissão passa-se por obter nota positiva seria admitido.
Resolução do exercício 22.
Variável Qualitativa Variável Quantitativa
Classe Social Idade da mãe
Ordenado Mensal
N.º de filhos com idade escolar
6- Proposta de resolução
70
Resolução do exercício 23.
a)
Em 1999 os meses em que se registou com 7 dias de nevoeiro foram dois: Março e Junho.
b)
Meses do ano Nº de dias de nevoeiro ( fi )
fri
Fi
Fri
Fri %
Janeiro 2 0.05 2 0.05 5% Fevereiro 1 0.02 3 0.07 7%
Março 7 0.17 10 0.24 24% Abril 2 0.05 12 0.29 29% Maio 6 0.13 18 0.42 42%
Junho 7 0.17 25 0.59 59% Julho 4 0.10 29 0.69 69%
Agosto 3 0.07 32 0.76 76% Setembro 2 0.05 34 0.81 81% Outubro 2 0.05 36 0.86 86%
Novembro 3 0.07 39 0.93 93% Dezembro 3 0.07 42 1 100%
Total 42 1
n
ff i
ri = ( frequência relativa ).
if (frequência absoluta é o número de vezes que um dado foi
observado).
IF ( frequência absoluta acumulada ).
RIF ( frequência relativa acumulada ).
c)
O número de meses que se verificaram 4 ou menos dias de nevoeiro foram nove. Foi o mês de Janeiro, Fevereiro, Abril, Julho, Agosto, Setembro, Outubro, Novembro e Dezembro.
6- Proposta de resolução
71
d)
3RF = 59% significa que 59% dos meses têm um número de dias
de nevoeiro inferior ou igual a três.
Resolução do exercício 24.
a)
A variável em estudo é : n.º de ocupantes por automóvel
Os seus valores são: 1,2,3,4,5,6
b)
Variável quantitativa discreta
c)
N.º de ocupantes por
automóvel if rif IF RIF
1 ocupante 20 0.33 20 0.33
2 ocupantes 16 0.27 36 0.6
3 ocupantes 15 0.25 51 0.85
4 ocupantes 6 0.1 57 0.95
5 ocupantes 2 0.03 59 0.98
6 ocupantes 1 0.02 60 1
Total 60 1
Resolução do exercício 25.
a)
N.º de irmãos 0 1 2 3 4
Frequência 4 4 5 4 3
6- Proposta de resolução
72
b)
4 + 4 = 8
Existem 8 alunos que têm menos do que dois irmãos
c)
4+4+5+4 =17
Existem 17 alunos que têm pelo menos 3 irmãos
Resolução do exercício 26.
a)
A classificação varia entre zero e dez
b)
5+12+17+25+30+43+36+16+13+4+0 =201
c)
Classificação 0 1 2 3 4 5 6 7 8 9 10
fi 5 12 17 25 30 43 36 16 13 4 0
Fi 5 17 34 59 89 132 168 184 197 201 01
d)
89 ( ver na tabela Frequências acumuladas)
Resolução do exercício 27.
a)
6- Proposta de resolução
73
n = 2+7+9+4+3
= 25
A dimensão da amostra inquirida é 25
b)
xi 1 2 3 4 5
fi 2 7 9 4 3
fri 0.08 0.28 0.36 0.16 0.12
Fi 2 9 18 22 25
Fri 0.08 0.36 0.72 0.88 1
c)
pela analise da tabela (fri) concluiu-se que os alunos que estudam 3 horas é 36 % ( 0,36 x100)
Resolução do exercício 28.
xi fi fri Fri R 20 0.2 0.2 P 30 0.3 0.5 T 40 0.4 0.9 D 10 0.1 1
Resolução do exercício 29.
[1.40;1.55[
a)
o limite inferior da classe 1.40
fi nº de alunos
xi horas de estudo por dia
6- Proposta de resolução
74
b)
o limite superior da classe 1.55
c)
a amplitude da classe 0.15 (1.55-1.40)
d)
Ponto médio = 475.12
95.2
2
40.155.1 ==+
Resolução do exercício 30.
a) e b)
14 é o valor para o limite inferior.
Amplitude de cada classe é 13
x-14 =13 ⇔, x é o valor do limite superior da 1ª classe
⇔x= 13 + 14⇔ x=27
Classes
if
ifr
iF
iFr Ponto médio
ix
14-27 1 0,043 1 0,043 20,5 27-40 6 0,26 1+6=7 0,043+0,26=0,303 33,5 40-53 6 0,26 7+6=13 0,303+0,26=0,563 46,5 53-66 4 0,174 13+4=17 0,563+0,174=0,737 59.5 66-79 4 0,174 17+4=21 0,737+0,174=0,911 72,5 79-92 2 0,09 21+2=23 0,911+0,09≈ 1 85,5 Total 23 ≈ 1
6- Proposta de resolução
75
Resolução do exercício 31.
a)
Classes
if
ifr
iF
iFr
0-10 1 0,018 1 0,018 10-20 3 0,054 4 0,072 20-30 4 0,071 8 0,143 30-40 12 0,214 20 0,357 40-50 15 0,268 35 0,625 50-60 10 0,179 45 0,804 60-70 6 0,107 51 0,911 70-80 3 0,054 54 0,965 80-90 1 0,018 55 0,983 90-100 1 0,018 56 ≈ 1 Total 56 ≈ 1
b)
Obtiveram nota inferior a 50% 35 alunos
Resolução do exercício 32.
a)
Pesos ( Kg ) if ifr iF iFr
30 - 35 1 0,03 1 0,03 35 - 40 4 0,13 5 0,16 40 - 45 7 0,23 12 0,39 45 – 50 3 0,1 15 0,49 50 – 55 4 0,13 19 0,62 55 – 60 9 0,3 28 0,92 60 - 65 2 0,07 30 0,99≈1 Total 30 ≈1
6- Proposta de resolução
76
b) e c)
Resolução do exercício 33.
a)
Total dos alunos da escola
230 alunos da escola
Variável qualitativa – preferências literárias
b)
����������������������������������������������������������������
������������������������������������������������������������������������������������
������������������������������������������������������
������������������������������������������������������������������������
Políciais 19%
Romances33%
Ficção Científica
22%
Banda Desenhada
26%
6- Proposta de resolução
77
c)
0
5
10
15
20
25
30
35
40
Políciais Romances Ficção Científica Banda DesenhadaTipo de livro
Fre
qu
ênci
a
Rapazes
Raparigas
Resolução do exercício 34.
a)
Agregado Familiar 2 3 4 5 6 7 8
if 27 45 99 66 48 12 3
IF 27 72 171 237 285 297 300
ifr 0,09 0,15 0,33 0,22 0,16 0,04 0,01
% 9 15 33 22 16 4 3
iIF 0,09 0,24 0,57 0,79 0,95 0,99 1
b)
22 %
6- Proposta de resolução
78
c)
79 %
d)
6%
9%
11%14%
17%
20% 23%
10%
1
2
3
4
5
6
7
8
Resolução do exercício 35.
2 9
3 1 2 2 3
4 1 2 3 4 5 6
5 0 1 6 6 7 7 9
6 1 2
Resolução do exercício 36.
a)
Analisando o gráfico circular, podemos concluir que:
- a região em que existe menor número de alunos inscritos é a região do Algarve.
- a região em que existe maior número de alunos inscritos é a região do Norte.
6- Proposta de resolução
79
b)
Ano lectivo 1998/99 existiam 497517
Resolução do exercício 37.
i. Falsa. A dimensão da população em estudo é:
(25+5+46+65+36+23= 200)
ii. Verdadeira. 5,11100115,0200
23 == x
iii. Verdadeira = 12,5%+2,5%+23%+32,5% = 70,5 %
iv. Falsa = 025,0200
5 =
Algarve (4%)
100
4497517 ×=x
19901=x
Alentejo(5%)
100
5497517 ×=x
24876=x
Centro (17%)
100
17497517 ×=x
84578=x
Lisboa V Tejo (33%)
100
33497517 ×=x
164180=x
Norte (41%)
100
41497517 ×=x
203982=x
Os números dos alunos matriculados em cada região são: Algarve : 19 901 Alentejo: 24 876 Centro: 84 578 Lisboa V. Tejo: 164 187 Norte: 203 982
6- Proposta de resolução
80
Resolução do exercício 38.
a)
150 refeições x 13= 1950 Julho
150 refeições x17 =2550 Agosto..
b)
= 150 refeições Junho . Julho Agosto Setembro Outubro
c)
Meses if ifr iF iFr
Junho 1200 0.17 1200 0.17
Julho 1950 0.27 3150 0.44
Agosto 2550 0.35 5700 0.79
Setembro 1050 0.15 6750 0.94
Outubro 450 0.06 7200 1
Total 7200 1
6- Proposta de resolução
81
Resolução do exercício 39.
a)
a turma que tem mais computadores é a turma A ( 18 computadores)
b)
Alunos com computador 4 = crianças
Turma A
Turma B
Turma C
Turma D
c)
Turma if ifr iF iFr
A 18 0.33 18 0.33
B 12 0.22 30 0.55
C 16 0.30 40 0.85
D 8 0.15 54 1
Total 54 1
6- Proposta de resolução
82
Alunos com computador
18
12
16
8
0
5
10
15
20
A B C DTurmas
nº
de
alunos
d)
Vantagem: São atractivos dando um grande impacto visual
Desvantagens: Dão pouca informação e podem-se tornar pouco precisos.
Resolução do exercício 40.
a)
Marca if ifr %
Marca1 15 0,41 41 Marca2 4 0,11 11 Marca3 10 0,28 28 Marca4 2 0,06 6 Marca5 5 0,14 14 Total 36 1 100
6- Proposta de resolução
83
º6,147%100
º360%41 =×Marca1
º6,39%100
º360%11 =×Marca2
º8,100%100
º360%28 =×Marca3
º6,21%100
º360%6 =×Marca4
º4,54%100
º360%14 =×Marca5
Resolução do exercício 41.
a)
Turma if ifr iFr %
1 Estrela 4 0.25 0.25 25
2 Estrelas 3 0.18 0.43 18
3 Estrelas 5 0.31 0.74 31
4 Estrelas 2 0.13 0.87 13
5 Estrelas 2 0.13 1 13
Total 16 1
b)
13 % dos hotéis são de 5 Estrelas
Carros Existentes no Stand
41%
11%
28%
6%
14%
Marca 1
Marca 2
Marca 3
Marca 4
Marca 5
6- Proposta de resolução
84
c)
Hotéis existentes nas termas
4
3
5
2 2
0
1
23
4
5
6
1 Estrela 2 Estrelas 3 Estrelas 4 Estrelas 5 Estrelas
Categorias
Nº
de
Hoté
is
Resolução do exercício 42.
Aconselha-se a utilização da folha de cálculo para a resolução deste exercício.
a)
1990
País População
urbana(milhões)
Pop.Urbana/Pop.Total
(%)
População Total (milhões)
Argélia 12,9 52 24,8 Nigéria 38,2 35 109,1 Quénia 5,7 24 23,8 Bolívia 3,7 51 7,3 Brasil 112,1 75 149,5 China 302,2 26 1.162,3
Filipinas 26,7 43 62,1 India 216,1 26 831,2
Indonésia 53,1 29 183,1 Tailândia 12,1 22 55,0 Austrália 14,6 85 17,2
E.U.A 188,1 75 250,8 Japão 95,3 77 123,8
6- Proposta de resolução
85
2000
País População
urbana(milhões)
Pop.Urbana/Pop.Total
(%)
População Total (milhões)
Argélia 19,5 60 32,5 Nigéria 63,9 43 148,6 Quénia 11,1 32 34,7 Bolívia 5,2 58 9,0 Brasil 140,8 82 171,7 China 451,7 35 1.290,6 Filipinas 37,2 49 75,9 India 290,9 29 1.003,1 Indonésia 79,5 37 214,9 Tailândia 17,7 29 61,0 Austrália 16,8 86 19,5 E.U.A 213,3 78 273,5 Japão 101,1 79 128,0
b)
Os países em que se verificou maior aumento foram : Índia e China.
c)
População Urbana 1900/2000
0
50
100
150
200
250
300
350
400
450
500
Argélia Nigéria Quénia Bolívia Brasil China Filipinas India Indonésia Tailândia Austrália E.U.A Japão
Países
Po
pu
laçã
o U
rban
a
6- Proposta de resolução
86
Resolução do exercício 43.
carro Autocarro Comboio Motorizada Bicicleta
Nota: todos os bonecos têm igual tamanho.
Resolução do exercício 44.
a)
1995 1996 1997
= 5 pessoas
= 5 toneladas
6- Proposta de resolução
87
b)
20T
35T
15T
20t = 2700 litros =18 garrafões
35t = 4725 Litros = 31 garrafões e meio
15t = 2025 Litros = 13 garrafões e meio
Resolução do exercício 45.
a)
Idade if ifr iF iFr %
16 2 0.07 2 0.07 7
17 4 0.13 6 0.2 13
18 12 0.4 18 0.6 40
19 5 0.17 23 0.77 17
20 6 0.2 29 0.97 20
21 1 0.03 30 1 3
Total 30 1 100
6- Proposta de resolução
88
b)
Idades dos participantes num Torneio de Ténis
713
40
17 20
3
0
10
20
30
40
50
16 17 18 19 20 21
Idade
%
c)
6 participantes têm menos de 18 anos.
d)
23 % dos participantes têm 20 ou mais anos.
Resolução do exercício 46.
a)
Produção Anual de Toneladas de Cortiça
120
500
800
300
180
100
0
200
400
600
800
1000
Portugal Espanha França Brasil Itália México
Países
Pro
du
ção
(to
nela
das)
6- Proposta de resolução
89
b)
Produção Anual de Toneladas de Cortiça
Portugal6%
Espanha25%
França40%
Brasil15% Itália
9%
M éxico5%
c)
Gráficos de Barras/ Gráficos circulares
- deve conter título
- a área da barra ou sector é proporcional á frequência
Resolução do exercício 47.
a)
xi if ifr % iF iFr
10 25 0.25 25 25 0.25
20 30 0.30 30 55 0.55
30 18 0.18 18 73 0.73
40 15 0.15 15 88 0.88
50 12 0.12 12 100 1
Total 100 1 100
6- Proposta de resolução
90
b)
12
15
18
30
25
0 10 20 30 40
10
20
30
40
50
fi
xi
Resolução do exercício 48.
a)
Listas Nº de Votos
% ( em relação aos alunos que votaram)
Lista A 57 25 Lista B 81 36 Lista C 87 39
6- Proposta de resolução
91
b)
Resultados das eleições para a Associação de Estudantes
Lista B36%
Lista A25%
Lista C39%
Resolução do exercício 49.
a)
Pesos
(kg)
if ifr % iFr
[4,7;4,9[ 150 0.15 15 15
[4,9;5,1[ 250 0.25 25 40
[5,1;5,3[ 300 0.30 30 70
[5,3;5,5[ 200 0.20 20 90
[5,5;5,7[ 100 0.10 10 100
Total 100 1 100
6- Proposta de resolução
92
b)
Moda
Classe Modal : [5,1;5,3[
aff
fl
pa
po ×
++=Μ
)1(2,52.0250200
2501,5 =×
++=OM
Média
Pesos (kg)
if ix if ix
[4,7;4,9[ 150 4.8 720 [4,9;5,1[ 250 5 1250 [5,1;5,3[ 300 5.2 1560 [5,3;5,5[ 200 5.4 1080 [5,5;5,7[ 100 5.6 560 Total 1000 5170
6- Proposta de resolução
93
Ponto Intermédio da classe ix
N
fxx ii∑=
170,51000
5170 ==x
Mediana
Através do gráfico podemos identificamos a classe mediana ( podemos já mostrar o valor aproximado da mediana)
6- Proposta de resolução
94
Cálculo Numérico
af
FN
Led ×−
+=Μ 2
)6(16,52,0300
4002
1000
1,5 =×−
+=Μed
Resolução do exercício 50.
N.º de ervilhas por vagem 1 2 3 4 5 6 7 8
Efectivos ( fi ) 3 4 5 9 6 7 4 2
Fi 3 7 12 21 27 34 38 40
N
fxx ii∑=
n é par
K1 =2
40 K2= 21
2
240 =+
K1=20
6- Proposta de resolução
95
Neste caso na linha Fi encontramos o nº 21. Um dos valores que vai entrar no cálculo é x21 = 4 o outro é o x20, que também é determinado na mesma coluna pois 20> 12 e 20<21
Mediana é :
42
44
2~ 2120 =+=+= xxx
Moda = Variável com maior frequência ( 4 )
Resolução do exercício 51.
a)
Lucro ( em contos) 0-20 20-40 40-60 60-80 80-100 Total
Frequência (fi) 20 50 90 120 90 370
xi 10 30 50 70 90
Xi2 100 900 2500 4900 8100
fixi 200 1500 4500 8400 8100 22700
fixi2 2000 45000 225000 588000 729000 1589000
N
fxx ii∑=
).2(35,61370
22700dcx ≅=
6- Proposta de resolução
97
Resolução do exercício 52.
MHMHMMHH
MHMHMH
MH
=⇔=⇔−=−⇔
⇔+=+⇔=++
100100300400400500
400400300500400300500
logo temos:50% de Homens e 50 % mulheres.
Resolução do exercício 53.
a moda é valor com maior frequência : 16 º C
Resolução do exercício 54.
a)
Histograma e polígono no mesmo gráfico.
6- Proposta de resolução
98
b)
Classes if ix if ix
2 – 4 4 3 12
4 - 6 8 5 40
6 - 8 14 7 98
8 - 10 8 9 72
10 - 12 6 11 66
Total 40 288
Média
6- Proposta de resolução
99
2,740
288 ==x
Moda
Classe modal 6 –8
Valor aproximado da moda calculado através da fórmula de King
7288
86 =×
++=OM
Mediana
Graficamente determinamos a mediana da seguinte forma:
6- Proposta de resolução
101
Resolução do exercício 55.
t
(meses) if (1) iF (2) ifr (3) iFr (4) ix (5) if ix (6) xxi − (7) if xxi − (8)
0 – 4 40 40 0,16 0,16 2 80 11,28 451,2
4 - 8 30 70 0,12 0,28 6 180 7,28 218,4
8 - 12 31 101 0,124 0,404 10 310 3,28 101,68
12 - 16 39 140 0,156 0,56 14 546 0,72 28,08
16 - 20 54 194 0,216 0,776 18 972 4,72 254,88
20 - 24 56 250 0,224 1 22 1232 8,72 488,32
∑ 250(1) 1 3320(6) 1542,56
a)
A percentagem de jovens que estiveram no desemprego menos de um ano foi: 40,4%
b)
O intervalo do tempo modal é : [20; 24[
c)
Tempo médio : 28,13250
3320 ==x
Desvio Médio: n
xxfd
n
iiii∑
=
−= 1
Desvio Médio = 17,6250
56,1542 ≅
6- Proposta de resolução
102
d)
Resolução do exercício 56.
a)
Média
).2(43,377
262
7
32462948353141dcx ≅=++++++=
Moda
Conjunto amodal
6- Proposta de resolução
103
Mediana
29 31 32 35 41 46 48
35~ =x
b)
Média
8,6010
608
10
64526861576961615758 ==+++++++++=x
Moda
Mo=61
Mediana
52 57 57 58 61 61 61 64 68 69
612
122
2
6161~ ==+=x
c)
Média
7,8910
897
10
86978783978686978395 ==+++++++++=x
Moda
M0=86
M0=97
Conjunto Bimodal
6- Proposta de resolução
104
Mediana
83 83 86 86 86 87 95 97 97 97
5,862
8786~ =+=x
Resolução do exercício 57.
N.º de encomendas
por mês
0 - 10
10 - 20
20 - 30
30 - 40
40 - 50 ∑
Nº de vendedores if 1 5 7 6 5 24
ix 5 15 25 35 45
rif 0.04 0,21 0.29 0.25 0.21
if ix 5 75 175 210 225 690 2
ix 25 225 625 1225 2025
if2
ix 25 1125 4375 7350 10125 23000
a)
A amplitude é a diferença entre o limite superior da última classe e o limite inferior da primeira.
A amplitude de cada classe é 10
A amplitude da amostra é 50 –0 = 50
75,2824
690 ==x
48.11
771.131
)75.28(24
23000 2
==
−=
δδ
δ
6- Proposta de resolução
105
b)
Com o cálculo da média podemos prever o número de encomendas por mês.
O desvio padrão permite determinar a dispersão dos valores relativamente à média. Combinando o conhecimento da média e o desvio padrão, podemos em muitas situações caracterizar a localização e a dispersão dos valores.
Resolução do exercício 58.
a)
ix 0 1 2 3 4 5 6 ∑
if 2 5 17 20 18 12 6 80
rif 0.025 0.062 0.213 0.25 0.225 0.15 0.075 1
iF 2 7 24 44 62 74 80
riF 0.025 0.087 0.3 0.55 0.775 0.925 1
if ix 0 5 34 60 72 60 36 267
6- Proposta de resolução
106
b)
Resultados do lançamento de moedas
25
1720
18
12
6
0
5
10
15
20
25
1 2 3 4 5 6 7
xi
fi
c)
Moda = 3
Mediana , n = 80
402
801 ==K 41
2
280 =+=K
Logo a 3~ =x ( ver nas frequências absolutas acumuladas )
d)
)..2(34,380
267dcx ≅=
6- Proposta de resolução
107
Resolução do exercício 59.
a)
Classes if ix if ix
10 – 12 4 11 44 12 - 14 6 13 78 14 – 16 12 15 180 16 - 18 8 17 136 18 - 20 5 19 95 Total 35 533
)..2(23,1535
533dcx ≅=
b)
Determinamos geometricamente a classe mediana. A classe mediana conforme podemos observar no gráfico é: [14;16[
6- Proposta de resolução
108
25,15212
102
35
14 =×−
+=Μed
c)
( )22
xn
fx i−= ∑δ
Classes if ix 2x if2x
10 – 12 4 11 121 484
12 - 14 6 13 169 1014
14 – 16 12 15 225 2700
16 - 18 8 17 289 2312
18 - 20 5 19 361 1805
Total 35 533 8315
37,295,23135
8315 ≅−=δ
6- Proposta de resolução
109
Resolução do exercício 60.
910394
3,1010
1181310910111012
=⇔=+⇔
⇔=+++++++++
aa
a
8 9 9 10 10 10 11 11 12 13 Mo=10 10~ =x
Resolução do exercício 61.
Importância Nº de Contos Depósitos rif % riF
[100;200[ 50 0,13 13 13 [200;300[ 55 0,14 14 26 [300;400[ 28 0,07 7 33 [400;500[ 20 0,05 5 38 [500;600[ 90 0,23 23 61 [600;700[ 10 0,03 3 63 [700;800[ 80 0,20 20 83 [800;900[ 67 0,17 17 100
400 1,00
a)
A percentagem de depósitos inferiores a 500 : 38%
6- Proposta de resolução
110
b)
c)
Importância Nº de Contos Depósitos ix if ix
[100;200[ 50 150,00 7500 [200;300[ 55 250,00 13750 [300;400[ 28 350,00 9800 [400;500[ 20 450,00 9000 [500;600[ 90 550,00 49500 [600;700[ 10 650,00 6500 [700;800[ 80 750,00 60000 [800;900[ 67 850,00 56950
400 213000
5,532400
213000 ==x
6- Proposta de resolução
111
d)
Importância Nº de Contos Depósitos ix 2x if 2x
[100;200[ 50 150 22500 1125000 [200;300[ 55 250 62500 3437500 [300;400[ 28 350 122500 3430000 [400;500[ 20 450 202500 4050000 [500;600[ 90 550 302500 27225000 [600;700[ 10 650 422500 4225000 [700;800[ 80 750 562500 45000000 [800;900[ 67 850 722500 48407500
400 136900000
Resolução do exercício 62.
a) Ordenando os dados:
5,102
1110~ =+=x
)2(27,24225,283556400
136900000cd≅−=δ
6- Proposta de resolução
112
Localização do Q1= 4
2+n para n par
Localização do Q3= 4
23 +n para n par
Q1= 34
210 =+ Q3= 8
4
2103 =+x
b)
Resolução do exercício 63.
a)
6- Proposta de resolução
113
b)
≥⟨≤
⟨≤⟨≤⟨≤⟨≤
⟨
512
5410
436
325
214
102
00
)(
x
x
x
x
x
x
x
xF
c)
Média
75,212
33
12
254413122120 ==×+×+×+×+×+×=x
6- Proposta de resolução
114
Moda : 4
Mediana:
0 0 1 1 2 3 4 4 4 4 5 5
5,32
43~ =+=x
Resolução do exercício 64.
Ano Funcionário
1980 1990 1995
A 50000 65000 80000 B 60000 78000 90000 C 75000 97500 105000 D 100000 130000 130000 x 71250 92625 101250
Desvio Padrão 1980
Funcionário
(x- x )2
A 451562500 B 126562500 C 14062500 D 826562500
∑ 1418750000
x 71250
6- Proposta de resolução
115
( )2
1
n
yxn
ii∑
=
−=σ 18833
4
1418750000 ==σ
Desvio Padrão 1990
Funcionário
(x- x )2
A 763140625 B 213890625 C 23765625 D 1396890625
∑ 2397687500
x 92625
244834
2397687500 ==σ
Desvio Padrão 1995
Funcionário
(x- x )2
A 451562500 B 126562500 C 14062500 D 826562500
∑ 1418750000
x 101250
188334
1418750000 ==σ
6- Proposta de resolução
116
Em 1990 os salários aumentaram 30% a média aumentou 30% e o desvio padrão igualmente. Em 1995 verificou-se um aumento constante dos salários em 30 contos a média aumentou 30 e o desvio padrão manteve-se
Resolução do exercício 65.
a)
)3(722,218
45362413cdx ≅×+×+×+×=
( ) ( ) ( ) ( ) ( ) 044,1722,218
45362413 22222
≅−×+×+×+×=σ
b)
)3(549,3206
635537431340229134cdx ≅×+×+×+×+×+×=
( ) ( ) ( ) ( ) ( ) ( ) ( ) )3(701,1549,3206
635537431340229134 2222222
cd≅−×+×+×+×+×+×=σ
Resolução do exercício 66.
Classificações if ix if ix 2x if
2x
[0;20[ 2 10 20 100 200 [20;50[ 0 35 0 1225 0 [50;75[ 4 62,5 250 3906,25 15625 [75;90[ 5 82,5 412,5 6806,25 34031,25
[90;100[ 3 95 285 9025 27075 14 967,5 76931,25
6- Proposta de resolução
117
)2(11,6914
5,967cdx ≅=
( ) )2(81,2611,6914
25,76931 2 cd=−=σ
b)
Podemos concluir que se verifica uma grande dispersão das notas relativamente á média.
Resolução do exercício 67.
a)
amplitude = h
h = màx (xi) – min (xi), com i =1,2,....n
h= 15-3
h= 12
A amplitude das idades á 12
b)
67,96
151311973
≅
+++++=
x
x
6- Proposta de resolução
118
xi
Idade xxi − xxi −
3 -6.67 6.67 7 -2.67 2.67 9 -0.67 0.67 11 1.33 1.33 13 3.33 3.33 15 5.33 5.33
c)
n
xxd
n
ii∑
=
−= 1
33.36
67.91567.91367.91167.9967.9767.93≅
−+−+−+−+−+−=d
Resolução do exercício 68.
a)
8.215
1524635211 =×+×+×+×+×=Ax
( ) 98.08.215
5142362511 222222
=−×+×+×+×+×=Aδ
8.215
5143332810 =×+×+×+×+×=bx
Desvio em relação à média
6- Proposta de resolução
119
( ) 98.08.215
5143332810 222222
=−×+×+×+×+×=Bδ
b)
Como a média e o desvio padrão são iguais para a turma A e B, conclui-se que estas duas medidas não destinguem as duas distribuições.
Resolução do exercício 69.
a)
6- Proposta de resolução
120
b)
% (0) = %1310075
10 ≅×
A percentagem de jovens que não foi à discoteca é de 13%
c)
M0= 3
Amplitude = 6-0 =6
d)
n=75 (impar)
K= 382
175 =+
2~38 == xx
39.275
645646320212117010 ≅++++++= xxxxxxxx
e)
( ) 66.139.275
635 2 ≅−=Aδ
6- Proposta de resolução
121
Resolução do exercício 70.
a)
6 5 3 2 4 8 8 7 4 4 7 8 8 6 6 4 3 3 2 0 5 3 7 9 9 9 9 7 7 5 4 4 3 3 3 0 0 0 0 6 2 2 3 5 6 8 8 8 6 6 4 0 7 0 1 1 2 4 4 4 6 6 8 8 8 9 2 8 0 0 1 1 3 4 4 6 9 9 9 0
b)
Média Escola X 61≅ Média Escola Y 70≅
Mediana Mediana
1º Quartil 1º Quartil
3º Quartil 3º Quartil
Resolução do exercício 71.
ª)
Pesos if IF ix if ix 2x if
2x
[35;42[ 3 3 38.5 115.5 1482.25 4446 [42;49[ 8 11 45.5 364 2070.25 16562 [49;56[ 7 18 52.5 367.5 2756.25 1994 [56;63[ 8 26 59.5 476 3540.25 28322 [63;70[ 5 31 6.5 332.5 4422.25 22111 [70;77[ 3 34 73.5 220.5 5402.25 16207
34 1876 106943
Escola X Escola Y
60 72
53 62
69 80
6- Proposta de resolução
122
b)
18.5534
1876 ≅=x
c)
O gráfico acima permite localizar a classe mediana necessária para a questão seguinte.
d)
5577
112
34
49 =×−
+=Μed
e)
(com os dados da tabela da alínea a) )
6- Proposta de resolução
123
( ) 1018.5534
106943 2 ≅−=δ
Resolução do exercício 72.
a)
ix if IF if ix
25 24 24 600
50 30 54 1500
100 46 100 4600
150 46 146 6900
146 13600
15,93146
13600 ≅=x
b)
20
100050
15069004600150060010014600146
)46(1504610030502425100
=⇔⇔=⇔
⇔++++=−⇔
⇔+
+×+×+×+×=
x
x
xxx
x
O aumento do número de garrafas foi de 20
6- Proposta de resolução
124
Resolução do exercício 73.
762
7676~ =+=x
Resolução do exercício 74.
Resolução do exercício 75.
A- Verdadeira
B- Verdadeira
6- Proposta de resolução
125
C- Falsa
D- Falsa
Resolução do exercício 76.
Tempo a a ver TV
Nº de Alunos ix rif % riF if ix
0 - 15 32 7.5 0,32 32 32 240 15 - 30 22 22,5 0,22 22 54 495 30 - 45 18 37,5 0,18 18 72 675 45 - 60 12 52,5 0,12 12 84 630 60 - 75 10 67,5 0,1 10 94 675 75 - 90 6 82,5 0,06 6 100 495
∑ 100 3210
a)
Média 1.32100
3210 ==x
Calculo da moda
M0 ≅ 11
6- Proposta de resolução
126
Calculo da mediana
)27(,271522
322
100
15 =×−
+=Μed
b)
Mo< x~ < x Logo esta distribuição é assimétrica positiva
Resolução do exercício 77.
ix if rif % iFr (%) if ix 2
ix if2
ix
15 30 0,1 10 10 450 225 6750
16 48 0,16 16 26 768 256 12288
17 57 0,19 19 45 969 289 16473
18 39 0,13 13 58 702 324 12636
19 54 0,18 18 76 1026 361 19494
20 36 0,12 12 88 720 400 14400
21 18 0,06 6 94 378 441 7938
22 18 0,06 6 100 396 484 8712
∑ 300 1 100 5409 98691
a)
03.18300
5409 ==x
( ) 97.103.18300
98691 2 ≅−=Aδ
6- Proposta de resolução
127
] −x δδ +x; [
]16,06;20[ 67% das observações encontram-se no intervalo
b)
18% +12%+6%+6% = 42 %
42% dos dos alunos tem idade igual ou superior a 19.
c)
O diagrama os dados é o diagrama B.( Q1= 16; Q2= 18 Q3=19)
Resolução do exercício 78.
7015
2011
150
15
2011
10=⇔
=
=+⇔
=
=+y
x
y
x
yx
O número adicionado foi 70.
Resolução do exercício 79.
a)
236
282524222118 =+++++=x
6- Proposta de resolução
128
( ) ( ) ( ))2(75,7
6
)2328(2325)2324()2322(23212318 222222
cd≅−+−+−+−+−+−=δ
b)
43
2023
=+=
x
x
75,7≅δ
Resolução do exercício 80.
a)
Classes if ifr % IF iFr
0 - 4 6 0,21 21 6 0,21 4 - 8 8 0,29 29 14 0,50
8 - 12 5 0,18 18 19 0,68 12 - 16 7 0,25 25 26 0,93 16 - 20 2 0,07 7 28 1,00
28 1 100
b)
ix if if ix
2 6 12 6 8 48 10 5 50 14 7 98 18 2 36
∑ 28 244
6- Proposta de resolução
129
71,828
244 ==x
(Diálogo com os formandos sobre a atitude da entidade patronal )
Resolução do exercício 81.
a)
Trata-se de uma sondagem.
b)
População é um conjunto de indivíduos com qualquer característica em comum e com interesse para o estudo em causa.
Amostra é um subconjunto finito da população que se supões representativa desta.
c)
Notas if rif % iF riF
8 3 0,09 9 3 9 9 4 0,13 13 7 22 10 8 0,25 25 15 47 11 4 0,13 13 19 59 12 1 0,03 3 20 63 13 5 0,16 16 25 78 14 1 0,03 3 26 81 15 5 0,16 16 31 97 18 1 0,03 3 32 100
∑ 32 1 100
d)
25 alunos obtiveram nota positiva
e)
19% dos alunos tiveram nota igual ou superior a 15
6- Proposta de resolução
130
f)
Mo= 10
11~ =x
g)
ix if if ix
8 3 24 9 4 36 10 8 80 11 4 44 12 1 12 13 5 65 14 1 14 15 5 75 18 1 18
∑ 32 368
h)
ix if 2x if2x
8 3 64 192 9 4 81 324 10 8 100 800 11 4 121 484 12 1 144 144 13 5 169 845 14 1 196 196 15 5 225 1125 18 1 324 324
∑ 32 4434
( ) 51,25´,1132
4434 2 ≅−=δ
5,1132
368 ==x
6- Proposta de resolução
131
i)
Resolução do exercício 82.
a)
ix if rif % riF iF if ix
0 6 0,12 12 12 6 0 1 3 0,06 6 18 9 3 2 12 0,24 24 42 21 24 3 11 0,22 22 64 32 33 4 7 0,14 14 78 39 28 5 4 0,08 8 86 43 20 6 2 0,04 4 90 45 12 7 3 0,06 6 96 48 21 8 1 0,02 2 98 49 8 10 1 0,02 2 100 50 10 50 1 100 159
6- Proposta de resolução
132
b)
1º Quadril = 2
Mediana = 3
3º Quadril = 4
c)
18,350
159 ==x
Mo=2
d)
Falta dos Professores durante o Ano Lectivo
6
3
1211
7
4
23
1 1
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 10
Dias de Faltas
Nº
de
pro
fess
ore
s
Em média os professores faltaram 3 dias (média) A maioria dos professores faltaram 2 dias (moda)
6- Proposta de resolução
133
e)
Resolução do exercício 83.
a)
Turma A
b)
Turma A – Simétrica em forma de Sino
Turma B – Assimétrica positiva
Turma C – Assimétrica negativa
6- Proposta de resolução
134
Resolução do exercício 84.
Empresa X
70~60
110
0
==
=
x
M
x
Logo a empresa X tem uma distribuição assimétrica positiva x >>>> x~ >>>> 0M
Empresa Y
80~80
80
0
==
=
x
M
x
Logo a empresa Y tem uma distribuição simétrica x = x~ = 0M
Empresa Z
100~115
27.97
0
==
=
x
M
x
Logo a empresa Z tem uma distribuição assimétrica negativa x <<<< x~ <<<< 0M
6- Proposta de resolução
135
Resolução do exercício 85.
a)
x y 2x 2y x y
3 1,6 9 2,56 4,8 4 1,2 16 1,44 4,8 10 1 100 1 10 9 1,2 81 1,44 10,8 7 1,4 49 1,96 9,8 11 1 121 1 11 44 7,4 376 9,4 51,2
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r=
−
−
×−
6
76,544,9
6
1936376
6
4,7442,51
⇔ r= -0,80
r<<<<0 Correlação negativa – As variáveis variam no sentido negativo
b)
x y 2x 2y x y
3 9 9 81 27 4 1 16 1 4 5 0 25 0 0 6 3 36 9 18 7 8 49 64 56 8 2 64 4 16 9 1 81 1 9
42 24 280 160 130
6- Proposta de resolução
136
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r
−
−
×−
7
576160
7
1764280
7
2442130
=-0,3
r<<<<0 Correlação negativa – As variáveis variam no sentido negativo
c)
x y 2x 2y x y
0 4 0 16 0 1 19 1 361 19 2 22 4 484 44 3 41 9 1681 123 4 35 16 1225 140 5 62 25 3844 310 7 66 49 4356 462
22 249 104 11967 1098
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r=
−
−
×−
7
6200111967
7
484104
7
249221098
=0,958
r >>>>0 Correlação positiva– As variáveis variam no mesmo sentido
d)
x y 2x 2y x y
-13 0,01 169 0,0001 -0,13 -11 0,02 121 0,0004 -0,22 -9 0,03 81 0,0009 -0,27 -7 0,04 49 0,0016 -0,28 -5 0,05 25 0,0025 -0,25 -45 0,15 445 0,0055 -1,15
6- Proposta de resolução
137
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r=
−
−
×−−−
5
0225.00055.0
5
2025445
5
)15.0()45(15.1
=1
r =1 Correlação positiva total ou perfeita
Resolução do exercício 86.
x y Peso Altura x2 y2 xy 67 167 4489 27889 11189 73 171 5329 29241 12483 61 166 3721 27556 10126 61 167 3721 27889 10187 70 171 4900 29241 11970 68 172 4624 29584 11696 81 175 6561 30625 14175 89 180 7921 32400 16020 71 170 5041 28900 12070 66 167 4356 27889 11022 75 170 5625 28900 12750 86 179 7396 32041 15394 75 174 5625 30276 13050 63 167 3969 27889 10521 80 178 6400 31684 14240
1086 2574 79678 442004 186893
R=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔
6- Proposta de resolução
138
⇔ r=
−
−
×−
15
6625476442004
15
117939679678
15
)2574()1086(186893
⇔ r= 0,94 Correlação forte correlação positiva
Resolução do exercício 87.
x y 2x 2y x y
7 0,12 49 0,0144 0,84 7,3 0,08 53,29 0,0064 0,584 8 0,14 64 0,0196 1,12 8,3 0,18 68,89 0,0324 1,494 9 0,14 81 0,0196 1,26 9,3 0,16 86,49 0,0256 1,488 10 0,12 100 0,0144 1,2 10,3 0,18 106,09 0,0324 1,854 11 0,16 121 0,0256 1,76 11,3 0,18 127,69 0,0324 2,034 12 0,2 144 0,04 2,4 103,5 1,66 1001,5 0,2628 16,034
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r=
−
−
×−
11
7556.22628.0
11
106095.1001
11
)66.1()5.103(034.16
⇔
⇔ r= 0.71
6- Proposta de resolução
139
Resolução do exercício 88.
x y 2x 2y x y
3 1 9 1 3 3 2 9 4 6 4 1 16 1 4 4 2 16 4 8 4 3 16 9 12 5 1 25 1 5 5 2 25 4 10 5 3 25 9 15 5 4 25 16 20 6 3 36 9 18 6 4 36 16 24 50 26 238 74 125
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r= 59,0
11
67674
11
2500238
11
1300125
≅
−
−
−
Resolução do exercício 89.
Pontos
x y
2x
2y x y
A 3 1 9 1 3 C 4 2 16 4 8 I 5 3 25 9 15 K 6 4 36 16 24
∑ 18 10 86 30 50
6- Proposta de resolução
140
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r= 1
4
10030
4
32486
4
18050
=⇔
−
−
−r
Resolução do exercício 90.
Equação da correlação linear
( )xxayy −=−
( )∑ ∑
∑ ∑ ∑
−
−=
n
xx
n
yxxy
a 2
2
( ) 25,10712;5,1001;81,171;034,16;66,1;5,10322 ====== ∑∑ ∑ ∑ ∑ ∑ ∑ xxyxxyyx
41,911
5,103 =⇔= xx
15,011
66,1 =⇔= yy
015,0
11
25,107125,1001
11
81,171034,16
=⇔−
−= aa
6- Proposta de resolução
141
Recta de regressão
009,0015,0141,0015,015,0)4,9(015,015,0 +=⇔−=−⇔−=− xyxyxy
Aconselhasse a utilização da máquina gráfica afim de visualizar o diagrama de dispersão e a recta de regressão.
Resolução do exercício 91.
Países x y 2x 2y %(Extensão) %(população) x y
Bélgica 30.5 9.8 930.25 96.04 8 18 298.9 Dinamarca 43.1 5.1 1857.61 26.01 11 9 219.81
Grécia 132 10 17424 100 32 19 1320 Irlanda 70.3 3.5 4942.09 12.25 17 7 246.05 Holanda 41,2 14.7 1697.44 216.09 10 28 605.64 Portugal 92 10.3 8464 106.09 22 19 947.6
∑ 409.1 53.4 35315.39 556.48 100 100 3638
ª)
A percentagem da área e da população de Portugal relativamente aos outros países é respectivamente de 22% e 19%
b)
Dos países indicados na tabela o que tem mais habitantes por Km2 é a Holanda.
c)
(ver o dados da tabela inicial )
;48,556;39,35315;4,53;1,409 22 ==== ∑∑ ∑ ∑ yxyx
( ) ( ) ∑ ∑∑∑ ∑ ==== 94,21845;56,2851;81,167362;363822
yxyxxy
6- Proposta de resolução
142
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔
⇔ r= 0038,0
6
56,285148,556
6
1,16736239,35315
6
94.218453638
−=⇔
−
−
−r
Neste exemplo existe uma correlação negativa entre a extensão e a população quase nula. ( Apela-se ao espírito crítico dos formandos afim de criticarem os dados fornecidos por este exemplo)
Resolução do Exercício 92.
7
01,344
99,403
96.301
3,49
8.43
2
2
=
=
=
=
=
=
∑∑∑∑∑
n
yx
y
x
y
x
ii
i
i
i
i
r=( ) ( )
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔
⇔ r= 89.0
7
49.243099.403
7
44.191896.301
7
34.21591,344
=⇔
−
−
−r
6- Proposta de resolução
143
Resolução do Exercício 93.
( )xxayy −=−
54.2619
6.12765
5.76
66.15
2 =
===
∑∑
i
ii
x
yx
y
x
( )∑ ∑
∑ ∑ ∑
−
−=
n
xx
n
yxxy
a 2
2
⇔ 7,4
10
56.2452354.2619
10
1197996.12765
=⇔−
−= aa
( ) 898.27.4602.737.45.7666.157.45.76 +=⇔−=−⇔−=− xyxyxy
Resolução do Exercício 94.
ª)
Temperatura do ar/Nº de horas de sol
60,7
34,5
87,4
119,8
0
10
20
30
40
50
60
70
80
90
100
110
120
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Temperatura do ar
Nº
de
hora
s de
sol
6- Proposta de resolução
144
Pela observação do gráfico podemos concluir que existe uma relação forte entre o número de horas de sol e a temperatura do ar.
b)
Localização x y 2x 2y x y
Lisboa 14,3 60,7 204.49 3684.49 868.01
Porto 13,1 34,5 171.61 1190.25 451.95
Ponta Delgada 14,5 87,4 210.25 7638.76 1267.3
Funchal 17,5 119,8 306.25 14352.04 2096.5
∑ 59.4 302.4 892.6 26865.54 4683.76
( )( )∑ ∑∑∑∑∑∑∑∑
=
=
=
=
=
=
=
=
56.17962
76.91445
36.3528
76.4683
54.26865
6.892
4.302
4.59
2
2
2
2
yx
y
x
xy
y
x
y
x
r=( ) ( )
⇔
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r= 94.0
4
76.9144554.26865
4
36.35286.892
4
56.1796276.4683
=⇔
−
−
−r Correlação forte
6- Proposta de resolução
145
c)
73.96194.1971637.18
16
194.19737.186.75794.27237.18)85.14(37.186.75
37.18
4
36.35286.892
4
56.1796276.4683
6.754
4.302
85.144
4.59
0
=⇔−×==
−=⇔+−=⇔−=−
=⇔−
−=
=⇔=
=⇔=
yy
x
yxyxy
aa
yy
xx
Teria 97 horas de sol aproximadamente
Resolução do Exercício 95.
a)
Televisões/ telefones (por 1000 Habitantes-1993)
050
100150200250300350400450500550600650700
-10 40 90 140 190 240 290 340 390 440 490 540 590 640 690 740
Televisões
Tel
efones
6- Proposta de resolução
146
b)
O sinal da correlação é positiva. Podemos concluir que os habitantes que possuem televisão provavelmente possuem telefone.
Resolução do Exercício 96.
A correlação estuda a intensidade da relação ou a dependência entre as duas variáveis ( neste caso entre a idade dos rapazes e as horas de deitar) da distribuição.
Como à medida que a idade dos rapazes aumenta as horas de deitar também, ou seja, quanto mais velhos mais tarde é a hora de deitar, então trata-se de uma correlação positiva ( x cresce e y cresce)
Resolução do Exercício 97.
Casamentos/ divórcios (por 1000 habitantes)
0
1
2
3
4
0 1 2 3 4 5 6 7 8
Casamentos
div
órc
ios
Pela análise do gráfico de dispersão não se pode estabelecer qualquer relação entre o número de casamentos e divórcios neste caso.
6- Proposta de resolução
147
Resolução do Exercício 98.
ª)
Sim.
b)
sim
c)
Sim
d)
Não
e)
Não
f)
Sim
Resolução do Exercício 99.
ª)
Pesos(kg) Altura(cm) 50 155 50 156 55 160 56 156 57 161 59 165 60 159 62 162 62 168 70 170 78 175
6- Proposta de resolução
148
b)
Peso/Altura
0102030405060708090
100110120130140150160170180
0 10 20 30 40 50 60 70 80
Peso
Altura
O gráfico sugere correlação positiva forte.
c)
x y
Pesos(kg) Altura(cm) 2x
2y x y
50 155 2500 24025 7750 50 156 2500 24336 7800 55 160 3025 25600 8800 56 156 3136 24336 8736 57 161 3249 25921 9177 59 165 3481 27225 9735 60 159 3600 25281 9540 62 162 3844 26244 10044 62 168 3844 28224 10416 70 170 4900 28900 11900 78 175 6084 30625 13650
659 1787 40163 290717 107548
6- Proposta de resolução
149
r=( ) ( )
⇔
−
−
∑ ∑−
∑ ∑∑ ∑∑
n
yy
n
xx
xyn
yx
2
2
2
⇔ r= 92.0
11
3193369290717
11
43428140163
11
1177633107548
=⇔
−
−
−r
d)
91.11972.045.16254.4272.0)09.59(72.045.162
72.0
11
43428140163
11
1177633107548
45.16211
1787
09.5911
659
+=⇔+−=⇔−=−
=⇔−
−=
=⇔=
=⇔=
xyxyxy
aa
yy
xx
e)
45.16245.16291.11909.5972.045.16291.11972.0 =⇔+×=⇔+= xy
A recta de regressão passa no ponto de coordenadas ( peso médio, altura média)
6- Proposta de resolução
150
f)
Altura(cm)
Pesos(kg) 1.11972.0 += xy
50 155 50 155 55 159 56 159 57 160 59 162 60 162 62 164 62 164 70 170 78 175
659 1785
Bibliografia
151
BIBLIOGRAFIA
ALVES, C.B. [et al] – Infinito 10, Areal Editores, Porto, 1996
AUBYN, M.C.; BRITO, C.; MARTINS, A.C. – Matemática 10, Lisboa Editora, Lisboa, 1997
BASTOS, Rita [et al] – Matemática10:Estatística, Edições Contraponto, Porto, 1997
GRUPO AZARQUIEL – Estatística no 3º Ciclo do Ensino Básico, Associação de Professores de Matemática, Lisboa, 1993.
MARTINS, Maria Eugénia Graça [et al] - Estatística, Ministério da Educação /DES, Lisboa, 1999
MELLO, F. Galvão de, - Probabilidades e Estatística, Conceitos e Métodos Fundamentais, Escolar Editora, 1993
MURTEIRA, J. F. Bento - Análise exploratória de dados, Mc Graw Hill, Lisboa,1993
MURTEIRA, J. F. Bento – Estatística Descritiva, Mc Graw Hill, Lisboa, 1989
NEVES, Maria Augusta Ferreira - Matemática 10º Ano Parte 3:Estatística, Porto Editora, 1997
REIS, Elizabeth - Estatística Descritiva, Edições Sílabo, 1996
MORGAN, Larry – Statistic Handbook for the TI-83, Texas Instruments, 1997
GRUPO DE TRABALHO T3 – Estatística e Calculadoras Gráficas, Associação de Professores de Matemática, Lisboa, 1999
TEXAS INSTRUMENTS – Manual de Instruções da Calculadora Gráfica TI-83, E.U.A, 1999
NAZARETH, Helena – Curso Básico de Estatística, Editora Ática, 1989
Ficha Técnica
152
Ficha técnica
Participaram neste trabalho os formadores abaixo referidos que cederam os respectivos direitos de propriedade e autoria:
Coordenador Nacional:
António Adérito Araújo
Coordenadores Locais:
Elisabete Quintas (Coimbra) e Miguel Shirley (Lisboa)
Texto:
António Adérito Araújo
Carlos Rosmaninho
Elisabete Quintas
Fernanda Soares
Jacinto Salgueiro
Lino Nossa
Maria Rita Martins
Nely Vilanova
Paula Bulhão
Produção Multimédia:
Manuel Borrões e Tiago Borrões
Jogos Didácticos:
Joaquim Perdigão, Nely Vilanova, Ricardo Shirley e Luís Fernandes
Apoio Administrativo:
António Silva
Investigação na Internet:
António Shirley
BATERIA DE TRANSPARÊNCIAS
A presente bateria de transparências está estruturada, em termos de ordem, em consonância com o Manual do Formador, seguindo a sequência dos conteúdos deste, como se pode ver no seguinte índice:
Capítulo 1
Transparência 1 Objecto da Estatística
Transparência 2 Conceitos Fundamentais
Transparência 3 Atributos e Modalidades
Transparência 4 Classificação da Estatística
Transparência 5 Aplicações da Estatística
Capítulo 2 Transparência 6 Recolha e a classificação de dados
Transparência 7 Diagrama de caule e folhas
Transparência 8 Quadros de Frequências
Capítulo 3
Transparência 9 Representação tabular de dados
Transparência 10 Representação gráfica
Transparência 11 Representação gráfica
Transparência 12 Diagrama por pontos
Transparência 13 Gráficos de barras
Transparência 14 Outros de gráficos de barras
Transparência 15 Histogramas
Transparência 16 Polígonos de frequências
Transparência 17 Gráficos circulares
Transparência 18 Pictogramas
Transparência 19 Gráficos mal construídos
Capítulo 4
Transparência 20 Média(variáveis discretas)
Transparência 21 Média(variáveis contínuas)
Transparência 22 Mediana(variáveis discretas)
Transparência 23 Mediana(variáveis contínuas)
Transparência 24 Moda
Transparência 25 Tipos de distribuições
Transparência 26 Comparação das medidas de tendência
central
Transparência 27 Comparação das medidas de tendência
central
Transparência 28 Quantis
Transparência 29 Quartis
Transparência 30 Diagrama de extremos e quartis
Transparência 31 Amplitude, desvio e desvio médio
Transparência 32 Variância e desvio padrão
Transparência 33 Comparação das medidas de dispersão
Transparência 34 Alteração das medidas estatísticas
Transparência 35 Alteração das medidas estatísticas
Capítulo 5
Transparência 36 Distribuição bidimensional
Transparência 37 Tipos de correlação
Transparência 38 Coeficiente de correlação linear(r)
Transparência 39 Recta de regressão
Transparência 40 Recta de regressão
Breveestudo
estatístico
Transparência 41 Estudo estatístico(caracterização dos dados)
Transparência 42 Estudo estatístico(frequências e
percentagens)
Transparência 43 Estudo estatístico(medidas de localização e
quartis)
Transparência 44 Estudo estatístico(medidas de dispersão)
Transparência 45 Estudo estatístico(representação gráfica)
Capítulo 6
Transparência 46 Problema 1 – Os pacotes de açucar
Transparência 47 Cálculo das medidas estatísticas
Transparência 48 Cálculo das medidas estatísticas
Transparência 49 Cálculo das medidas estatísticas
Transparência 50 Cálculo das medidas estatísticas
Transparência 51 Cálculo das medidas estatísticas
Transparência 52 Cálculo das medidas estatísticas
Transparência 53 Cálculo das medidas estatísticas
Transparência 54 Cálculo das medidas estatísticas
Transparência 55 Cálculo das medidas estatísticas
Transparência 56 Cálculo das medidas estatísticas
Transparência 57 Cálculo das medidas estatísticas
Transparência 58 Cálculo das medidas estatísticas
Transparência 59 Gráfico a uma variável
Transparência 60 Gráfico a uma variável
Transparência 61 Gráfico a uma variável
Transparência 62 Gráfico a uma variável
Transparência 63 Gráfico a uma variável
Transparência 64 Gráfico a uma variável
Transparência 65 Gráfico a uma variável
Transparência 66 Gráfico a uma variável
Transparência 67 Gráfico a uma variável
Transparência 68 Gráfico a uma variável
Transparência 69 Gráfico a uma variável
Transparência 70 Problema 2 – Lançamento do peso
Transparência 71 Estudo de dados bivariados
Transparência 72 Estudo de dados bivariados
Transparência 73 Estudo de dados bivariados
Transparência 74 Estudo de dados bivariados
Transparência 75 Estudo de dados bivariados
Transparência 76 Estudo de dados bivariados
Transparência 77 Estudo de dados bivariados
Transparência 78 Estudo de dados bivariados
Transparência 79 Estudo de dados bivariados
Transparência 80 Estudo de dados bivariados
Transparência 81 Estudo de dados bivariados
Transparência 82 Estudo de dados bivariados
Transparência 83 Estudo de dados bivariados
Transparência 84 Estudo de dados bivariados
Transparência 85 Estudo de dados bivariados
Transparência 86 Estudo de dados bivariados
Transparência 87 Estudo de dados bivariados
Transparência 88 Estudo de dados bivariados
Transparência 89 Estudo de dados bivariados
Transparência 90 Estudo de dados bivariados
Com o objectivo geral de ajudar os formadores a gerir o mais adequadamentepossível as sessões de formação e o tempo disponível para a leccionação dos conteúdos programáticos, elaborámos um conjunto de transparências que, visam essencialmente:
Apoiar o formador na elaboração dos planos de sessão; Sintetizar os conteúdos explorados durante a sessão; Introduzir o estudo dos conteúdos que constam do Manual do Formador; Facilitar a exploração de actividades com a calculadora gráfica e com ocomputador;Permitir a realização de actividades com a calculadora gráfica e computador, sem uso do projector de dados apropriado; Permitir ao formador, de uma forma rápida, verificar a consolidação de pré-requisitos necessários à exploração de determinados conceitos estatísticos;Apresentar problemas a desenvolver durante as sessões; Diversificar as estratégias de exploração das actividades propostas.
Sendo um dos principais objectivos deste sub-projecto, a utilização de novastecnologias no estudo da Estatística, são apresentadas uma série de transparências (46-90) onde ilustram a exploração de dois problemas com recurso à utilização de calculadoras gráficas assim como de computadores. Constituindo mais um instrumento de trabalho, esta bateria de transparências foi concebida de forma a que o formador possa explorar as mesmas de acordo com as estratégias pedagógicas que achar mais conveniente. No entanto, cada uma destas noventa transparências possui uma sugestão de exploração, que obviamente poderá ser ou não seguida pelo formador. A transparência é apresentada dentro de uma “mica” que possui duas abas laterais, as quais deverão ser abertas quando o formador deposita a transparência no retroprojector, como se vê na figura:
Ao abrir estas abas, o formador poderá de uma forma fácil e discreta seguir a descrição da exploração que é sugerida, como se ilustra na figura seguinte:
Transparência 2
Conceitos fundamentais
A Estatística Descritiva, antes demedir ou contar os dadosobtidos na tomada deobservações, precisa emprimeiro lugar de identificar a fonte de informação, bem comoos elementos que vão fornecer ainformação, etc.. Assim, é importante definirmos (aindaque intuitivamente) algunsconceitos fundamentais,constituindo pois este oobjectivo desta transparência.O formador poderá partir deuma situação bem recente epara a qual todos nóscontribuímos – oRecenceamento Geral daPopulação Censos 2001. Paradefinir este conceito, o formadorpoderá lançar questões como:- Qual o objectivo desteRecenceamento?- Quem constituiu a fonte deinformação para o Censos 2001?- O que é comum a estesindivíduos?Relativamente à amostra, oformador deverá lançar questõessobre vários exemplos, de formaa que o formando sinta que porvezes, é impossível conhecer ascaracterísticas de todos oselementos da população e
torna-se então necessárioretirar uma amostra ousubconjunto dessa população,para a qual serão estudadas ascaracterísticas;O formador poderá reforçar aideia anterior, referindo que noexemplo dos CD’s, é fácilperceber que não faria sentidoque todos os CD’s fossemtestados pois uma vez gravados,ficam inutilizados para novagravação;O formador poderá aindachamar a atenção para a existência de métodosapropriados de recolha da amostra, assegurando assim a possibilidade de se extrapolarpara a população, quaisquerconclusões a que se cheguem a partir da informação recolhidana amostra.
Os pré-requisitos necessários à utilização desta bateria de transparências, são nulos, devendo no entanto, o formador, certificar-se que terá na sua sala de formação um bom retroprojector e bem como um local de ampla e boa visibilidadepara projectar, dado que não é agradável ver apenas alguns centímetros da transparência, obrigando assim a uma deslocação constante da mesma.
ÍNDICE DE TRANSPARÊNCIAS
Transparência 1 • Objecto da Estatística
Transparência 2 • Conceitos Fundamentais
Transparência 3 • Atributos e Modalidades
Transparência 4 • Classificação da Estatística
Transparência 5 • Aplicações da Estatística
Transparência 6 • Recolha e a classificação de dados
Transparência 7 • Diagrama de caule e folhas
Transparência 8 • Quadros de Frequências
Transparência 9 • Representação tabular de dados
Transparência 10 • Representação gráfica
Transparência 11 • Representação gráfica
Transparência 12 • Diagrama por pontos
Transparência 13 • Gráficos de barras
Transparência 14 • Outros de gráficos de barras
Transparência 15 • Histogramas
Transparência 16 • Polígonos de frequências
Transparência 17 • Gráficos circulares
Transparência 18 • Pictogramas
Transparência 19 • Gráficos mal construídos
Transparência 20 • Média(variáveis discretas)
Transparência 21 • Média(variáveis contínuas)
Transparência 22 • Mediana(variáveis discretas)
Transparência 23 • Mediana(variáveis contínuas)
Transparência 24 • Moda
Transparência 25 • Tipos de distribuições
Transparência 26 • Comparação das medidas de tendência central
Transparência 27 • Comparação das medidas de tendência central
Transparência 28 • Quantis
Transparência 29 • Quartis
Transparência 30 • Diagrama de extremos e quartis
Transparência 31 • Amplitude, desvio e desvio médio
Transparência 32 • Variância e desvio padrão
Transparência 33 • Comparação das medidas de dispersão
Transparência 34 • Alteração das medidas estatísticas
Transparência 35 • Alteração das medidas estatísticas
Transparência 36 • Distribuição bidimensional
Transparência 37 • Tipos de correlação
Transparência 38 • Coeficiente de correlação linear(r)
Transparência 39 • Recta de regressão
Transparência 40 • Recta de regressão
Transparência 41 • Estudo estatístico(caracterização dos dados)
Transparência 42 • Estudo estatístico(frequências e percentagens)
Transparência 43 • Estudo estatístico(medidas de localização e quartis)
Transparência 44 • Estudo estatístico(medidas de dispersão)
Transparência 45 • Estudo estatístico(representação gráfica)
Transparência 46 • Problema 1 – Os pacotes de açucar
Transparência 47 • Cálculo das medidas estatísticas
Transparência 48 • Cálculo das medidas estatísticas
Transparência 49 • Cálculo das medidas estatísticas
Transparência 50 • Cálculo das medidas estatísticas
Transparência 51 • Cálculo das medidas estatísticas
Transparência 52 • Cálculo das medidas estatísticas
Transparência 53 • Cálculo das medidas estatísticas
Transparência 54 • Cálculo das medidas estatísticas
Transparência 55 • Cálculo das medidas estatísticas
Transparência 56 • Cálculo das medidas estatísticas
Transparência 57 • Cálculo das medidas estatísticas
Transparência 58 • Cálculo das medidas estatísticas
Transparência 59 • Gráfico a uma variável
Transparência 60 • Gráfico a uma variável
Transparência 61 • Gráfico a uma variável
Transparência 62 • Gráfico a uma variável
Transparência 63 • Gráfico a uma variável
Transparência 64 • Gráfico a uma variável
Transparência 65 • Gráfico a uma variável
Transparência 66 • Gráfico a uma variável
Transparência 67 • Gráfico a uma variável
Transparência 68 • Gráfico a uma variável
Transparência 69 • Gráfico a uma variável
Transparência 70 • Problema 2 – Lançamento do peso
Transparência 71 • Estudo de dados bivariados
Transparência 72 • Estudo de dados bivariados
Transparência 73 • Estudo de dados bivariados
Transparência 74 • Estudo de dados bivariados
Transparência 75 • Estudo de dados bivariados
Transparência 76 • Estudo de dados bivariados
Transparência 77 • Estudo de dados bivariados
Transparência 78 • Estudo de dados bivariados
Transparência 79 • Estudo de dados bivariados
Transparência 80 • Estudo de dados bivariados
Transparência 81 • Estudo de dados bivariados
Transparência 82 • Estudo de dados bivariados
Transparência 83 • Estudo de dados bivariados
Transparência 84 • Estudo de dados bivariados
Transparência 85 • Estudo de dados bivariados
Transparência 86 • Estudo de dados bivariados
Transparência 87 • Estudo de dados bivariados
Transparência 88 • Estudo de dados bivariados
Transparência 89 • Estudo de dados bivariados
Transparência 90 • Estudo de dados bivariados
Transparência 1
Objecto da Estatística
Esta transparência, através da apresentação de algumas situações, pretende fazer sentir ao
formando que são problemas semelhantes a estes, que constituem a base de trabalho da
Estatística. É no sentido de responder a problemas/situações como estas que a Estatística, através
da execução de várias tarefas em diferentes fases, desenvolve todo o seu trabalho.
Sugere-se que antes da observação desta transparência, sejam pedidas aos formandos alguns
exemplos de situações onde a Estatística tenha um papel fundamental. A partir destes exemplos,
podemos seguidamente explorar a transparência, realçando que já na antiguidade se faziam
estudos estatísticos. Como finalização, sugere-se que se faça uma enumeração das várias etapas
inerentes a qualquer estudo estatístico.
Transparência 2
Conceitos fundamentais
A Estatística Descritiva, antes de medir ou contar os dados obtidos na tomada de observações,
precisa em primeiro lugar de identificar a fonte de informação, bem como os elementos que vão
fornecer a informação, etc.. Assim, é importante definirmos (ainda que intuitivamente) alguns
conceitos fundamentais, constituindo pois este o objectivo desta transparência.
O formador poderá partir de uma situação bem recente e para a qual todos nós contribuímos – o
Recenceamento Geral da População Censos 2001. Para definir este conceito, o formador poderá
lançar questões como:
- Qual o objectivo deste Recenceamento?
- Quem constituiu a fonte de informação para o Censos 2001?
- O que é comum a estes indivíduos?
Relativamente à amostra, o formador deverá lançar questões sobre vários exemplos, de forma a
que o formando sinta que por vezes, é impossível conhecer as características de todos os
elementos da população e torna-se então necessário retirar uma amostra ou
subconjunto dessa população, para a qual serão estudadas as características. O formador poderá
reforçar a ideia anterior, referindo que no exemplo dos CD’s, é fácil perceber que não faria sentido
que todos os CD’s fossem testados pois uma vez gravados, ficam inutilizados para nova gravação.
O formador poderá ainda chamar a atenção para a existência de métodos apropriados de recolha
da amostra, assegurando assim a possibilidade de se extrapolar para a população, quaisquer
conclusões a que se cheguem a partir da informação recolhida na amostra.
Transparência 3
Atributos e modalidades
Quando se estuda uma população ou amostra dessa população, sob o ponto de vista da Estatística,
o que se pretende é conhecer as suas características ou atributos, para que numa fase posterior
nos seja possível tomar decisões com base nesse conhecimento: estabelecer comparações com
outras populações, fazer previsões para o futuro, etc.
Esta transparência ilustra como se classificam os atributos quer qualitativos quer quantitativos.
Sugere-se que o formador faça a distinção entre uns e outros colocando questões como:
- Todas as características de uma determinada população podem ser expressas através de
números?
- Quais as características que podem ser expressas através de valores numéricos?
- A intensidade desta característica pode variar de elemento para elemento?
Sugere-se ainda que o formador faça ainda a distinção entre quantitativos discretos e quantitativos
contínuos. Há que referir que é necessário um certo cuidado nos casos de variáveis como “peso de
uma pessoa” e “peso dos recém nascidos”: se pensarmos numa variável que toma os valores
68kg, 69kg, 70kg, 71kg, 72kg, etc., a variável em causa é quantitativa discreta; mas se tomar
valores como 2,90kg, 2,95kg, 3,34kg, 3,35kg, etc., esta constitui uma variável quantitativa
contínua, por tomar qualquer valor dentro de um intervalo de números reais.
Transparência 4
Classificação da Estatística
Com esta transparência pretende-se, de uma forma sintética, dar a conhecer as várias “fases”
pelas quais a Estatística tem passado, em função da sua própria evolução ao longo dos tempos.
Sugere-se que à medida que o formador revele estas diferentes etapas, as ilustre com exemplos
concretos: por exemplo, as transparências 39 e 40 tratam uma situação real em que se estabelece
uma relação entre duas variáveis – é em situações deste tipo que está bem presente a Estatística
Analítica.
O esquema apresentado no final da transparência, tem por finalidade definir quais os momentos
de intervenção da Estatística Descritiva e da Estatística Indutiva, que são aquelas que vamos
aprofundar neste programa de Estatística.
Transparência 5
Aplicações da Estatística
Esta transparência pretende ilustrar algumas das aplicações da Estatística na vida quotidiana, bem
como em algumas ciências.
O formador deverá pedir aos formandos, à medida que vai analisando cada um dos exemplos
contidos nesta transparência, que indiquem de forma sucinta a forma de operacionalizar um
estudo estatístico em cada uma destas áreas. Esta descrição das etapas que é necessário levar a
cabo poderá tornar mais fácil a esquematização do processo Recolha e Classificação dos dados,
que é ilustrada na transparência 6.
Os exemplos contidos nesta transparência, podem até servir de pontos de partida para eventuais
estudos estatísticos com dados reais, solicitados pelo formador.
Transparência 6
Recolha e classificação de dados
Com esta transparência o formador pode facilmente identificar e descrever algumas das fases do
processo de recolha de dados. Sugere-se a apresentação desta informação enquadrada num
momento em que se faça a análise das etapas do método estatístico: identificação do problema,
recolha, crítica, apresentação, análise e interpretação dos dados.
• Fontes de dados
• Tipos de dados
• Periodicidade
• Métodos de recolha
• Classificação da informação
Na exploração da transparência, deverão ser lançadas questões do tipo:
- Quem forneceu os dados?
- Que tipo de dados foram recolhidos?
- Com que periodicidade é feita essa recolha?
- Que instrumentos se usaram na recolha?
- Como se fez o tratamento dos dados?
Sugere-se que o formador dê situações aos formandos (por exemplo, os Censos 2001), para que
estes identifiquem nas mesmas, as várias fases aqui sintetizadas.
Transparência 7
Diagrama de caule e folhas
A apresentação desta transparência, permite ao formador exemplificar rapidamente, o modo de
representação de um conjunto de dados através de um diagrama de caule e folhas.
Convém alertar o formando para o facto de, se os dados com que estamos a trabalhar tiverem três
algarismos (p.e. 163), então os algarismos das centenas e das dezenas constituirão o caule e o
algarismo das unidades a folha.
O formador deverá, na exploração desta transparência, fazer sentir as vantagens deste diagrama:
- uma percepção do aspecto global dos dados, sem perda alguma de informação;
- imaginar o gráfico daí resultante, através de uma rotação de 90º do respectivo diagrama.
Transparência 8
Quadros de frequências
A finalidade desta transparência é exemplificar, de forma simples, como se efectua o cálculo da
frequência absoluta acumulada, da frequência relativa e da frequência relativa acumulada. Caso os
formandos já tenham abordado este tema anteriormente, sugere-se que os dados da situação
apresentada nesta transparência sejam fornecidos, sob a forma de exercício e que só no final lhes
seja mostrado o quadro de frequências para que possam confirmar os seus cálculos.
Transparência 9
Representação tabular de dados
Esta transparência mostra um dos principais instrumentos para a representação de dados em
Estatística, que é a tabela. Na maior parte das situações, antes de representar os dados através de
gráficos, procede-se à organização da informação por meio de uma tabela. Esta tem a vantagem
de permitir desde logo tirar algumas conclusões quanto aos dados e, numa fase posterior facilita a
representação gráfica da da informação. O formador pode até fazer notar que a construção de
gráficos em determinado software, nomeadamente numa folha de cálculo, exige numa primeira
fase a representação tabular dos dados.
O formador deverá informar os formandos de que a tabela é um instrumento muito utilizado, uma
vez que:
- é de fácil e rápida construção;
- é de fácil leitura e quando os dados são relativamente “simples”, permite rapidamente
estabelecer comparações.
Transparência 10
Representação gráfica
Esta transparência pretende despertar a sensibilidade dos formandos para a representação gráfica,
que através de uma simples folha de cálculo pode ser uma actividade bem aliciante. São
apresentados dois gráficos, pouco utilizados no dia-a-dia para que o formando possa também ficar
sensibilizado para o facto de existir uma grande variedade de gráficos. A sua escolha depende do
contexto do problema que estudamos e daquilo que se pretende evidenciar.
O formador pode com a presença destes dois gráficos, fazer algumas perguntas para testar os
alunos no que diz respeito à interpretação gráfica. Sugere-se que o formador vá “destapando” a
transparência gráfico a gráfico (para os formandos não se perderem) e lançe questões como:
- Qual a tendência para o consumo de água engarrafada, em Portugal?
- Em que períodos parece ter havido um aumento mais acentuado de consumo de água
engarrafada?
- Supondo que o estudo feito envolveu 2550 condutores, quantos deles tinham menos de 0.8
mg de álcool no sangue?
Sugere-se ainda que o formador peça aos seus formandos para redigir um pequeno texto de
interpretação de um determinado gráfico.
Transparência 11
Representação gráfica
Tal como na transparência anterior, são apresentados dois gráficos pouco comuns.
Também aqui, o formador pode fazer algumas perguntas para testar os alunos no que diz respeito
à interpretação gráfica. Sugere-se assim as seguintes:
- Em que anos houve maior produção de vinhos na Região demarcada do Douro?
- Faça uma estimativa para o valor da produção total de Vinho Não Beneficiado.
- De 1994 a 1998, qual das produções foi maior: a do Vinho do Porto ou do Vinho Não
Beneficiado?
- Relativamente aos itens estudados, qual dos inquiridos denotou maior nível de satisfação?
Sugere-se ainda que o formador peça aos seus formandos para redigir um pequeno texto de
interpretação de um determinado gráfico.
Transparência 12
Diagrama por pontos
Esta transparência pretende ilustrar a construção de um gráfico de pontos. Cabe ao formador
chamar a atenção dos formandos para as regras gerais de construção de qualquer gráfico tais
como a existência de um título, de rótulos para ambos os eixos com as unidades de medida (neste
caso, o consumo vem expresso em milhões de litros), escala bem definida, etc.. Na elaboração de
um diagrama por pontos é usual a existência de linhas verticais e horizontais a tracejado fazendo a
correspondência entre as variáveis. Neste caso omitimos essas linhas por uma questão de não
sobrecarregar o gráfico.
Valerá a pena o formador questionar os formandos sobre qual a forma preferível de apresentar os
dados (em tabela ou em diagrama por pontos). E porquê?
Sugerimos que mais tarde o formador utilize também esta transparência quando abordar a recta
de regressão, podendo pedir aos formando que façam uma previsão quanto ao consumo de água
no ano de 1999.
Transparência 13
Gráficos de barras
Esta transparência pretende ilustrar a construção de um gráfico de barras que é um dos tipos de
gráficos mais utilizados, uma vez que é de fácil construção e adequado à maior parte das
situações.
O formador poderá apresentar os dados aos formandos, tapando o gráfico e solicitar aos mesmos
que elaborem um gráfico de barras. Numa fase posterior poderá lançar um conjunto de questões,
com o intuito de obter por parte dos formandos uma síntese das principais características deste
tipo de gráficos, nomeadamente:
- pode ser construído com barras verticais ou horizontais;
- as barras diferem apenas no seu comprimento, que deve ser proporcional à frequência de
cada uma das modalidades da variável em estudo;
- as barras devem ser igualmente distanciadas umas das outras.
Este tipo de gráfico tem a vantagem de permitir estabelecer comparações muito facilmente e
provocar um forte impacto visual.
Optou-se nesta situação também por colocar em cima de cada barra a respectiva frequência
relativa em percentagem, o que nos ajuda no caso de se querer analisar a proporção que uma
modalidade assume no todo.
Transparência 14
Outros gráficos de barras
A finalidade desta transparência é alertar os formandos para o facto de que existe uma
multiplicidade de gráficos de barras cujo uso depende obviamente da situação em estudo, do que
se pretende evidenciar, do gosto de quem está a construir o gráfico, das comparações que se
pretendem estabelecer, etc..
Transparência 15
Histogramas
Esta transparência pretende ilustrar a construção de um histograma que é o gráfico utilizado para
representar sobretudo variáveis contínuas. O formador deverá no final chamar a atenção para as
principais características de um histograma, constituindo no fundo regras básicas de construção
dos gráficos deste tipo.
Transparência 16
Polígonos de frequências
Esta transparência, pretende ilustrar a construção de um polígono de frequências (simples e
acumuladas). Para isso recolheram-se os dados referentes ao tempo que os formandos de um
determinado Centro de Formação levam desde o local onde recebem a formação e a sua
residência.
O processo de construção destes polígonos podem ser sintetizados da seguinte forma:
• Polígono de frequências simples:
- construir o histograma da distribuição;
- considerar uma classe adicional no início e outra no fim;
- marcar o ponto central no topo de cada barra e unir os mesmos.
• Polígono de frequências acumuladas:
- construir o histograma das frequências acumuladas;
- marcar os pontos cuja abcissa é o limite superior da classe e cuja ordenada é a
respectiva frequência acumulada da classe;
- unir os pontos determinados anteriormente.
O formador deverá “destapar” o segundo polígono, após a análise do primeiro polígono estar
concluída.
Como finalização, convém também referir aos formandos que, para construir o polígono de
frequências não é necessário representar o histograma, se as classes tiverem a mesma amplitude.
Transparência 17
Gráficos circulares
Esta transparência pretende ilustrar a construção de um gráfico circular que é conjuntamente com
o de barras, um dos tipos de gráficos mais utilizados. Embora a sua construção manual não seja
tão rápida, esta desvantagem é rapidamente ultrapassada se utilizarmos a tecnologia que hoje
temos acesso, nomeadamente o computador.
Com o intuito de desenvolver a interpretação gráfica e o cálculo, o formador poderá lançar
questões do tipo:
Sabendo que neste ano, forma produzidos 94 500 000 litros de Vinho do Porto, qual a quantidade
que ficou em Portugal?
A presença de uma situação em que é vantajoso a apresentação dos dados através de um gráfico
circular (dado que se tem a percepção da “fatia” de mercado que cada país tem na comercialização
do Vinho do Porto), deverá ser complementada por uma breve exemplificação de como se calcula
o ângulo correspondente a pelo menos dos sectores do gráfico. O formador poderá “destapar” a
pergunta final, partindo então para a exemplificação referida atrás.
Transparência 18
Pictogramas
Esta transparência pode ser utilizada como uma primeira ilustração, daquilo que é um pictograma.
A análise do gráfico poderá ser feita com base em algumas questões, chamando a atenção para as
regras básicas da construção de um pictograma:
- como é que os símbolos estão alinhados?
- existe ligação entre o símbolo utilizado e a situação em estudo?
- como estão expressas as quantidades: com maior ou menor número de símbolos ou,
aumento ou diminuição do tamanho do símbolo?
Esta transparência, pode em alternativa, surgir como forma de exercício na qual terá de ser feita
uma interpretação do gráfico, chamando a atenção para a importância da legenda do símbolo
utilizado.
O formador deverá também, sempre que possível, fazer notar as vantagens e desvantagens da
utilização de um pictograma.
Pictogramas
Vantagens Desvantagens
• são atractivos • têm grande impacto visual • com um olhar, apreende-se uma ideia
• são pouco precisos
Transparência 19
Gráficos mal construídos
São apresentadas nesta transparência duas situações muito simples, nas quais se pretende que os
formandos identifiquem qual o problema de cada um dos gráficos. Na primeira situação, é
apresentado um pictograma em que alguns dos símbolos utilizados não estão “empilhados” de
acordo com a frequência, mas sim aumentado o seu tamanho, não verificando uma das regras
básicas da construção de um pictograma.
No segundo caso, podemos ver um gráfico de barras cilíndricas, em que não são especificadas
quais as modalidades que a variável toma.
Transparência 20
Média (variáveis discretas)
Nesta transparência é exemplificada a resolução de um problema em que é necessário o cálculo da
média, para o caso de uma variável quantitativa discreta. Sugere-se que esta transparência seja
mostrada como proposta de exercício, sendo os dados fornecidos na tabela a amarelo (a parte a
azul deverá por isso encontrar-se tapada). Apesar deste ser resolvido “manualmente”, recomenda-
se que também o seja através da calculadora ou computador, para que o aluno sinta as vantagens
da utilização deste tipo de tecnologia.
Apesar de na transparência não se encontrar nenhuma resposta (por razões de economia de
espaço) como forma de conclusão do exercício, alertamos para o facto de ser sempre aconselhável
a existência da mesma.
Transparência 21
Média (variáveis contínuas)
Tal como na transparência anterior, aqui é exemplificado o cálculo do valor da média, mas agora
para o caso de uma variável contínua. As recomendações que se fizeram na transparência
anterior, continuam válidas aqui.
Transparência 22
Mediana (variáveis discretas)
Também nesta transparência é totalmente exemplificada a resolução de uma situação em que se
pede o cálculo da mediana, para o caso de uma variável discreta. Tal como nas situações
apresentadas nas duas últimas transparências, a resolução aqui apresentada não dispensa um
tratamento mais rápido através de tecnologia adequada.
Na resolução dos primeiros exercícios, sugere-se que o formador coloque em local bem visível, um
quadro esquemático da forma como se calcula a mediana para os casos em que o número total de
elementos é par ou ímpar, por forma a ajudar o formando no seu raciocínio.
Transparência 23
Mediana (variáveis contínuas)
Para o caso de uma variável contínua, o cálculo da mediana resume-se desta forma:
• calcula-se a ordem N/2 ;
• pelas frequências acumuladas identifica-se a classe mediana;
• calcula-se o valor exacto da mediana através da fórmula:
af
FNlMed ⋅
−+= 2 , onde
l = limite inferior da classe mediana;
F = frequência absoluta acumulada da classe anterior à classe mediana;
f = frequência absoluta da classe mediana;
a = amplitude da classe mediana.
Esta transparência exemplifica o cálculo da mediana através da aplicação desta fórmula. Esta,
pressupõe que as frequências se distribuem uniformemente dentro de cada classe. Isto pode ser
verificado através da determinação gráfica da mediana, partindo do polígono de frequências
acumuladas, como se pode ver na parte final da transparência. Transparência 24
Moda
A moda dos números x1, x2, ..., xn, designada por Mo é extremamente fácil de determinar, no caso
de variáveis discretas, bastando para isso identificar o valor da variável com maior frequência
absoluta. No caso de variáveis contínuas, que é o caso da presente transparência) é necessário
N par N ímpar Ordem do elemento central 2
N ; 2
2+N 2
1+N
Mediana é a média dos
elementos centrais
é o elemento central
definir primeiro a classe modal (classe com maior frequência absoluta) e depois aplicar a seguinte
fórmula:
aff
flM
pa
p
o ⋅+
+= , onde
l = limite inferior da classe modal;
fp = frequência absoluta da classe a seguir à classe modal;
fa = frequência absoluta da classe anterior à classe modal;
a = amplitude da classe modal.
Sugere-se que esta transparência seja mostrada como proposta de exercício, sendo os dados
fornecidos na tabela a amarelo (a parte a azul deverá por isso encontrar-se tapada).
Após a determinação analítica do valor da moda, o formador poderá exemplificar que este valor
poderá também ser determinado graficamente. Para tal é necessário construir o histograma da
respectiva distribuição, identificar a classe modal e fazer a construção que se apresenta no
acetato.
Transparência 25
Tipos de distribuições
Dada uma amostra ou população, o aspecto do histograma reflecte a forma da distribuição. Esta
transparência pretende assim ilustrar os principais tipos de distribuições, devendo posteriormente
o formador, fazer algumas considerações sobre algumas delas.
• Distribuições simétricas:
A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a
uma classe média. Relativamente à distribuição simétrica em forma de sino, verifica-se que
oMMedx == ;
• Distribuições assimétricas:
A distribuição das frequências faz-se de forma mais acentuadamente assimétrica,
apresentando valores substancialmente mais pequenos num dos lados, relativamente ao
outro. Relativamente às distribuições assimétrica positiva e assimétrica negativa, verifica-se
respectivamente oMMedx >> e oMMedx << ;
• Distribuições de cauda longa:
A distribuição das frequências faz-se de tal forma que existem algumas classes nos
extremos, cujas frequências são muito pequenas, relativamente às classes centrais,
apresentando algumas classes intermédias com frequência nula;
• Distribuições com vários “picos” ou modas:
A distribuição das frequências apresenta 2 ou mais “picos” a que chamamos modas,
sugerindo que os dados são constituídos por vários grupos distintos.
Transparência 26
Medidas de tendência central
Não existe uma regra geral para determinar qual a medida de tendência central mais apropriada
para descrever uma determinada distribuição, no entanto, o formador poderá apresentar esta
transparência, que constitui um quadro resumo das características de cada uma destas medidas
estabelecendo uma comparação entre elas, quanto à utilização e influenciabilidade.
Transparência 27
Medidas de tendência central
Continuação da transparência anterior, analisando as medidas de tendência central estabelecendo
uma comparação entre elas, quanto à representatividade e à inferência estatística.
Transparência 28
Quantis
Esta transparência pretende, através da recta real, dar a conhecer os vários quantis (medidas que
dividem a distribuição num determinado número de partes iguais) e ilustrar como se procede à
localização dos mesmos, num determinado conjunto de dados.
O formador deverá fazer notar porque razão é que a mediana coincide com o segundo quartil e
com o quinto decil.
Os quartis são bastante utilizados e são os que nós vamos estudar mais aprofundadamente.
Transparência 29
Quartis
Sendo os quartis bastante utilizados no tratamento de dados estatísticos, nesta transparência é
totalmente exemplificado o cálculo destas medidas, para o caso de uma variável discreta. São
apresentados os índices de preços ao consumidor desde o início do mês de Janeiro de 2000 até
Agosto de 2001, não estando aqueles ordenados. Desta forma, o formador pode optar por
apresentar esta transparência sob a forma de exercício, sendo útil nos primeiros casos a
apresentação aos formandos de um quadro elucidativo da forma como se localizam o primeiro e o
terceiro quartis:
Transparência 30
Diagrama de extremos e quartis
Esta transparência ilustra o modo de construção de um diagrama de extremos e quartis. Tendo
como dados a situação hídrica das albufeiras portuguesas em Fevereiro de 2000, sugere-se que o
formador proponha aos formandos o cálculo dos quartis: Q1 = 39, Q2 = 57 e Q3 = 76A partir
destes valores faz-se a representação gráfica dos mesmos, permitindo a construção do diagrama.
Este tipo de diagrama permite-nos tirar conclusões quanto à menor ou maior concentração dos
dados nos intervalos inter-quartis. Da observação do diagrama, conclui-se que existe maior
dispersão dos dados entre o mínimo e Q1 do que entre Q3 e o máximo.
N par N ímpar Localização
de Q1 4
2+N 4
1+N
Localização de Q3 4
23 +N 4
13
+× N
Transparência 31
Amplitude, desvio e desvio médio
Esta transparência pretende, através de uma situação muito simples, aclarar a forma como se
calcula cada uma destas medidas de dispersão.
O formador poderá optar por pedir aos formandos que obtenham um gráfico de barras a partir dos
seguintes dados:
Alturas
João Rui Telmo Vasco Tiago 2 2,05 1,9 2,05 1,9
Após a construção do gráfico, poderá então partir para a apresentação da transparência, uma vez
que a presença do gráfico permite ao formando interiorizar melhor o porquê de alguns desvios
(relativamente às alturas inferiores à média) serem de sinal negativo.
Transparência 32
Variância e desvio padrão
Dando continuidade ao exemplo apresentado na transparência 31, mostra-se aqui como se obtém
a variância e o desvio padrão. Convém alertar os formandos para a necessidade de determinar
sempre o valor da média, antes de efectuar estes cálculos.
A partir do exemplo contido nesta transparência, o formador pode chamar a atenção dos
formandos para o facto da variância vir expressa em m2, enquanto que o desvio padrão vem
expresso em metros. Por esta razão, a segunda medida estatística é mais utilizada dado que se
torna mais “manejável” quando se pretende estabelecer comparações entre distribuições.
Transparência 33
Medidas de dispersão
Não existe uma regra geral para determinar qual a medida de dispersão mais apropriada para
descrever uma determinada distribuição, no entanto apresenta-se nesta transparência, um quadro
resumo das características de cada uma destas medidas estabelecendo uma comparação entre
elas.
Transparência 34
Alteração das medidas estatísticas
Com esta transparência, o formador pode propôr uma actividade que constitui uma actividade de
investigação matemática, cujo objectivo é compreender que transformação sofre o valor da média
e do desvio padrão, ao adicionarmos aos dados iniciais uma determinada constante.
Assim, depois de serem analisados os primeiros cálculos, o formador pode propôr ao formando que
calcule a média dos preços e o desvio padrão do novo conjunto de dados:
3066
490380196153x ≈++++= ...
€
( ) ( )113
6
306490306153 22
≈−++−
= ...σ €
Pretende-se que à posteriori seja o próprio formando, em função dos resultados obtidos, a deduzir
o “enunciado” que se pretende:
“Se ao conjunto de dados iniciais for adicionado uma constante a, também a média aparece
adicionada pela mesma constante, mas o desvio padrão mantém-se.”
Transparência 35
Alteração das medidas estatísticas
Tal como a transparência anterior, esta pode constituir uma actividade de investigação
matemática, cujo objectivo é compreender que transformação sofre o valor da média e do desvio
padrão, ao multiplicarmos os dados iniciais por uma determinada constante.
Assim, também aqui o formando pode calcular a média dos preços e o desvio padrão do novo
conjunto de dados e, deduzir depois o “enunciado” que se pretende:
95198
123123816816x ,
,,...,, =++++= milhões esc.
( ) ( )288422
8
9519123295198162 22
,,,...,, ≈−⋅++−⋅=σ milhões esc.
“Se o conjunto de dados iniciais for multiplicado por uma constante a, também a média e o
desvio padrão aparecem multiplicados pela mesma constante.”
Transparência 36
Distribuição bidimensional
No processo de tomada de decisões é muitas vezes necessário fazer previsões. Simultaneamente,
é muito mais fácil tomar decisões sobre uma determinada variável, quando é possível estabelecer
uma relação entre esta e uma outra variável cujo comportamento se conhece. O primeiro passo no
estudo de distribuições bidimensionais consiste precisamente, em apurar, se a relação existente
entre as variáveis não é meramente acidental.
Esta transparência pretende assim, ilustrar um dos passos a tomar na verificação da existência ou
não desta relação entre as variáveis: depois de recolher os dados, temos de representá-los através
do diagrama de dispersão e finalmente interpretá-lo. Assim, o formador poderá disponibilizar no
quadro os pares ordenados relativos à latitude e temperatura média verificada em algumas
capitais europeias:
(20;51,4), (17;53,3), (17;52,5), (18;48,2), (21;48,8), (27;41,9), (12;60),
(29;40,4), (13;55,7), (18;59,3), (17;60,2), (21; 38,7), (17; 50,8) Neste caso concreto, observa-se que:
- os pontos não estão aleatoriamente distribuídos no gráfico;
- os pontos concentram-se ao longo de uma recta;
- à medida que a latitude aumenta, a temperatura diminui e vice-versa.
Isto leva-nos a concluir que existe uma relação entre as variáveis em estudo.
O diagrama de dispersão tem uma dupla função:
- ajuda a determinar se existe alguma relação entre as variáveis;
- permite identificar qual é a equação mais apropriada para descrever essa relação.
Transparência 37
Tipos de correlação
Esta transparência pode ser utilizado como uma primeira abordagem sobre os vários tipos de
relações entre duas variáveis. Quando se observa um diagrama de dispersão, pode-se
imediatamente verificar se existe ou não relação entre as variáveis em estudo. Sugere-se que esta
análise, se baseie nas seguintes questões:
• à medida que uma das variáveis aumenta, o que acontece à outra?
• à medida que uma das variáveis diminui, o que acontece à outra?
Quando existe alguma dependência entre as mesmas, diz-se que existe uma correlação entre elas.
Aqui apresentam-se os mais comuns tipos de correlação.
Transparência 38
Coeficiente de correlação linear(r)
O coeficiente de correlação linear ou coeficiente de correlação linear de Pearson é uma medida do
grau de associação entre variáveis, tomando valores entre –1 e 1.
Apresentam-se nesta transparência várias situações de correlação e o seu significado perante o
valor do coeficiente na escala de correlação.
Sugere-se ao formador que, para reforçar a ideia de correlação que cada uma dos gráficos
transmite, explique o que se passa em cada situação:
- se r=1, a correlação é positiva e trata-se de uma situação em que existe uma fórmula
matemática que relaciona as variáveis x e y;
- se 0<r<1, a correlação é positiva e é tanto mais forte quanto mais r se aproxima de 1;
- se r=-1, a correlação é negativa e também aqui existe uma fórmula matemática que relaciona
as variáveis x e y;
- se –1<r<0, a correlação é negativa e é tanto mais forte quanto mais r se aproxima de –1.
Transparência 39
Recta de regressão1
A utilização mais importante e mais comum da recta de regressão é feita com o objectivo de
prever o comportamento de uma variável com base nos valores conhecidos da outra variável. Com
o exemplo apresentado nesta transparência, pretende-se fazer a exploração de uma situação em
que é bem visível a correlação entre duas variáveis - o índice de produção agrícola e o índice de
consumo de energia - a partir de dados referentes a nove anos diferentes do século XX.
1 Esta transparência faz conjunto com a transparência 40, com o intuito da segunda ser sobreposta à primeira após a análise da situação por parte dos alunos
Nesta transparência, o objectivo é apresentar a situação em que possamos facilmente verificar a
existência de uma relação entre as variáveis – correlação linear positiva forte. O formador poderá
questionar os formandos sobre o tipo de correlação de que se está a tratar e inclusivé solicitar aos
formandos que confirmem esta conclusão através do cálculo do coeficiente de correlação linear.
Sugere-se ainda que se obtenha dos formandos sugestões de como efectuar a previsão pedida
na última frase desta transparência acetato.
O formador depois de apresentar o diagrama de dispersão, deverá questionar os formandos sobre
a existência ou não de correlação entre as variáveis.
Anos Índice de
consumo de energia
Índice de produção agrícola
1947 100 100
1950 112 104
1954 121 111
1958 131 127
1960 137 133
1964 162 139
1968 185 144
1970 193 144
1977 219 173
Transparência 40
Recta de regressão
Esta transparência constitui uma continuação da anterior, na medida em que são dadas as
respostas às questões colocadas na transparência 39.
Após as respostas devidamente fundamentadas dos formandos, esta transparência deverá ser
sobreposta à anterior, esquematizando assim os principais passos a tomar no cálculo da previsão.
Convém fazer notar aos alunos, que a previsão só poderá ser feita após termos determinado a
equação da recta de regressão. De facto, depois de encontrada a equação desta, é bastante
simples o cálculo da respectiva previsão:
y = 0,5434 ×××× 302 + 48,436 ⇔⇔⇔⇔ y ≈≈≈≈ 213.
Há que alertar os formandos para o facto deste valor constituir apenas uma previsão e por isso
deve ser interpretado como tal.
Transparência 41
Estudo estatístico
As transparências 41-45 constituem um breve estudo estatístico sobre as idades dos alunos de 9º
ano de uma escola. Os dados com que se vão trabalhar, deverão ser apresentados da seguinte
forma:
“Na escola X, a sua Direcção solicitou um estudo estatístico sobre alunos do 9º ano de
escolaridade. Para o efeito, registaram-se as idades dos alunos da turma mais representativa do
9º ano, registando-se na tabela que se mostra no acetato:”
Com este exemplo, faz-se uma análise completa no que diz respeito ao cálculo dos diversos
indicadores estatísticos, construindo-se também alguns gráficos desta distribuição. Sugere-se que
estas transparências sejam mostradss aos alunos sob a forma de exercício, sendo “destapados” à
medida que aqueles vão prosseguindo na resolução do problema.
Na presente transparência, são apresentados os dados recolhidos e feitos alguns cálculos para a
construção da tabela de frequências.
Transparência 42
Estudo estatístico
Dando continuidade à transparência anterior, esta apresenta a tabela de frequências já construída,
bem como a indicação do valor da moda. É ainda exemplificado o cálculo de uma percentagem a
partir da tabela de frequências.
Transparência 43
Estudo estatístico
Dando continuidade ao estudo estatístico, esta transparência apresenta o cálculo das medidas de
localização central.
Transparência 44
Estudo estatístico
Dando continuidade ao estudo estatístico, esta transparência apresenta o cálculo das medidas de
dispersão.
Transparência 45
Estudo estatístico
Dando continuidade ao estudo estatístico, esta transparência apresenta duas representações
gráficas deste conjunto de dados.
Transparência 46
Problema 1 – Os Pacotes de Açúcar
Nesta transparência é apresentado um problema estatístico a uma variável para que seja feito um
estudo usando as novas tecnologias na estatística. Servindo de referência às transparências 47 a
69, o formador deve passá-la sempre que oportuno para que os formandos possam acompanhar o
estudo que se está a fazer.
Transparência 47
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência anterior, mostra-se quais os passos a seguir
para se calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica
denominada no manual do formador de Calculadora A.
Nesta transparência é exemplificado, somente, como introduzir os dados.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 48
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência anterior, mostra-se quais os passos a seguir
para se calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica
denominada no manual do formador de Calculadora A.
Nesta transparência é exemplificado como, depois de introduzidos, se ordenam os dados.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 49
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência 46, mostra-se quais os passos a seguir para se
calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica denominada
no manual do formador de Calculadora A.
Esta transparência surge no seguimento dos transparências 47 e 48 e nela são exemplificados os
passos a tomar no cálculo das medidas estatísticas a uma variável.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 50
Cálculo das medidas estatísticas
Esta transparência surge na conclusão das transparências 47, 49 e 49. Nela estão mostrados os
valores das medidas estatísticas calculadas.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 51
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência 46, mostra-se quais os passos a seguir para se
calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica denominada
no manual do formador de Calculadora B.
Aqui é exemplificado, somente, como introduzir os dados devendo ser mostradas as
transparências 52, 53 e 54 para completar a demonstração.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 52
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência 46, mostra-se quais os passos a seguir para se
calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica denominada
no manual do formador de Calculadora B.
Nesta transparência é exemplifica-se como, depois de introduzidos, se ordenam os dados.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 53
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência 46, mostra-se quais os passos a seguir para se
calcularem as medidas estatísticas a uma variável com o auxilio da calculadora gráfica denominada
no manual do formador de Calculadora B.
Esta transparência surge no seguimento das transparências 52 e 53 e nele são exemplificados os
passos a tomar no cálculo das medidas estatísticas a uma variável.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 54
Cálculo das medidas estatísticas
Esta transparência surge na conclusão das transparências 51, 52 e 53. Nela estão mostrados os
valores das medidas estatísticas calculadas.
Tendo os formandos acesso a uma destas calculadora, o formador pode utilizar esta transparência
para lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa
proposta.
Transparência 55
Cálculo das medidas estatísticas
Usando o problema apresentado na transparência 46, mostra-se quais os passos a seguir para se
calcularem as medidas estatísticas a uma variável com o auxilio de uma Folha de Cálculo.
Aqui é exemplificado, somente, como introduzir devendo ser mostrados as transparências 56, 57 e
58 para completar a demonstração.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência lhe
explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 56
Cálculo das medidas estatísticas
Nesta transparência é exemplificado como, depois de introduzidos numa Folha de Cálculo, se
ordenam os dados.
Tendo os formandos acesso a esta ferramenta, o formador pode utilizar esta transparência para
lhe explicar como proceder, enquanto estes o vão acompanhando na resolução da tarefa proposta.
Transparência 57
Cálculo das medidas estatísticas
Esta transparência surge no seguimento das transparências 55 e 56 onde é exemplificado como
introduzir e ordenar os dados usando uma Folha de Cálculo. Aqui mostra-se como se deve
proceder no assistente de funções para se seleccionar a medida estatística que se pretende
calcular.
Transparência 58
Cálculo das medidas estatísticas
Como conclusão das transparências 55, 56 e 57, esta transparência mostra como se deve
proceder, dentro do assistente de funções, depois de se seleccionar a medida estatística que se
pretende calcular, para seleccionar os dados que vão fazer parte desse cálculo.
Transparência 59
Gráfico a uma variável
Dando continuidade ao estudo estatístico do problema enunciado na transparência 46, sugere-se o
uso desta transparência para exemplificação dos passos a tomar para a definição do tipo de gráfico
estatístico que se pretende construir com a calculadora gráfica denominada no manual do
formador de Calculadora A.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 60
Gráfico a uma variável
Depois de seleccionado o tipo de gráfico, mostra-se nesta transparência como proceder de modo a
obter uma representação gráfica, na calculadora denominada no manual do formador de
Calculadora A, do gráfico que se pretende estudar.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 61
Gráfico a uma variável
Esta transparência serve ilustrar o ajustamento dos valores da janela do gráfico construído nas
transparências 59 e 60, a fim de facilitar o estudo do mesmo.
O formando deve acompanhar a explicação com o auxilio da calculadora gráfica denominada no
manual do formador de Calculadora A.
Transparência 62
Gráfico a uma variável
Após a obtenção do gráfico construído nas transparências 59, 60 e 61 procede-se ao seu estudo,
tal como é mostrado nesta transparência.
O formando deve acompanhar a explicação com o auxilio da calculadora gráfica denominada no
manual do formador de Calculadora A.
Transparência 63
Gráfico a uma variável
Dando continuidade ao estudo estatístico do problema enunciado na transparência 46, sugere-se o
uso da presente transparência para exemplificação dos passos a tomar na definição do gráfico
estatístico que se pretende construir, utilizando a calculadora gráfica denominada no manual do
formador de Calculadora B.
Esta transparência está agrupada com as transparências 64, 65 e 66.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 64
Gráfico a uma variável
Para que se possa fazer um estudo adequado de um gráfico estatístico com a calculadora gráfica
denominada no manual do formador de Calculadora B, deve definir-se manualmente a janela
onde se pretende visualizar o gráfico. Nesta transparência exemplifica-se como predefinir a
calculadora para posteriormente se poderem alterar os valores da janela manualmente.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 65
Gráfico a uma variável
Nesta transparência é exemplificado como proceder para completar a construção de um gráfico
estatístico usando a calculadora gráfica denominada no manual do formador de Calculadora B,
devendo ser apresentada em conjunto com as transparências 63, 64 e 66.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 66
Gráfico a uma variável
Nesta transparência explica-se o estudo de um problema estatístico através de um gráfico
construído com a calculadora gráfica denominada no manual do formador de Calculadora B.
Esta pertence ao grupo de transparências 63 a 66.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 67
Gráfico a uma variável
Dando continuidade ao estudo estatístico do problema enunciado na transparência 48, sugere-se o
uso desta transparência para exemplificar como, depois de introduzidos os dados numa Folha de
Cálculo, se deve preparar este programam para que se possa construir um gráfico estatístico a
uma variável.
Esta transparência está agrupado com as transparências 68 e 69.
O formando deve acompanhar a explicação com o auxilio de um computador.
Transparência 68
Gráfico a uma variável
No seguimento da transparência 67, é apresentado qual a opção a tomar no primeiro passo do
assistente de gráficos durante a construção de um histograma.
Esta transparência está agrupada com as transparências 67 e 69.
O formando deve acompanhar a explicação com o auxilio de um computador.
Transparência 69
Gráfico a uma variável
Nesta transparência mostra-se o último passo necessário para a construção de um gráfico
estatístico. Esta conclui os procedimentos efectuados nas transparências 67 e 69.
O formando deve acompanhar a explicação com o auxilio de um computador.
Transparência 70
Problema 2 – Lançamento do peso
Um problema estatístico com dados bivariados é exemplificado neste problema. Esta transparência
serve de apoio às transparências 71 a 90, onde é feito um estudo estatístico bidimensional usando
as novas tecnologias.
Transparência 71
Estudo de Dados Bivariados
Esta transparência é o primeira de um grupo a que pertencem também as transparências 72 a 75.
Nela exemplifica-se como proceder com a calculadora gráfica denominada no manual do formador
de Calculadora A, na introdução dos dados estatísticos quando se efectua um estudo estatístico
de dados bivariados.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 72
Estudo de Dados Bivariados
Sugere-se o uso desta transparência para exemplificação dos passos a tomar na definição do tipo
de gráfico estatístico que se pretende trabalhar num estudo de dados bivariados, utilizando a
calculadora gráfica denominada no manual do formador de Calculadora A.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 73
Estudo de Dados Bivariados
Nesta transparência exemplifica-se como proceder com a calculadora gráfica denominada no
manual do formador de Calculadora A, na representação de um diagrama de dispersão.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 74
Estudo de Dados Bivariados
Nesta transparência mostra-se como se calculam a equação da recta de regressão e o coeficiente
de correlação linear usando a calculadora gráfica denominada no manual do formador de
Calculadora A.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 75
Estudo de Dados Bivariados
Esta transparência é a última de um grupo a que pertencem também as transparências 71 a 74.
Nela exemplifica-se como proceder com a calculadora gráfica denominada no manual do formador
de Calculadora A, para se estudar graficamente um problema estatístico de dados bivariados.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 76
Estudo de Dados Bivariados
Esta transparência é a primeira de um grupo a que pertencem também as transparências 77 a 82.
Nela exemplifica-se como proceder na introdução dos dados estatísticos nas listas da calculadora
gráfica denominada no manual do formador de Calculadora B.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 77
Estudo de Dados Bivariados
Sugere-se o uso desta transparência para exemplificação dos passos a tomar na definição do tipo
de gráfico estatístico que se pretende trabalhar num estudo de dados bivariados, utilizando a
calculadora gráfica denominada no manual do formador de Calculadora B.
O formando deve acompanhar a explicação com o auxilio desta calculadora.
Transparência 78
Estudo de Dados Bivariados
Nesta transparência exemplifica-se como proceder com a calculadora gráfica denominada no
manual do formador de Calculadora B, na representação de um diagrama de dispersão.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 79
Estudo de Dados Bivariados
Nesta transparência mostra-se como se calculam a equação da recta de regressão e o coeficiente
de correlação linear usando a calculadora gráfica denominada no manual do formador de
Calculadora B.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 80
Estudo de Dados Bivariados
No seguimento da transparência anterior pode visualizar-se a recta de regressão a sobrepor a
nuvem de pontos.
Os formandos deverão ter acesso à calculadora gráfica denominada no manual do formador de
Calculadora B para poderem acompanhar o formador enquanto este vai indicando, com a ajuda
da transparência, quais os passos a dar para a resolução da tarefa proposta na transparência 70.
Transparência 81
Estudo de Dados Bivariados
Para que se possa estudar convenientemente a recta de regressão é necessário copiar a sua
equação para o menu GRAPH da calculadora gráfica denominada no manual do formador de
Calculadora B.
A realização desta tarefa pode ser visualiza nesta transparência.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 82
Estudo de Dados Bivariados
Esta transparência é a última de um grupo a que pertencem também as transparências 76 a 81.
Nela exemplifica-se como proceder com a calculadora gráfica denominada no manual do formador
de Calculadora B para se estudar graficamente um problema estatístico de dados bivariados.
Os formandos deverão ter acesso a esta calculadora para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 83
Estudo de Dados Bivariados
Esta transparência é a primeira de um grupo a que pertencem as transparências 83 a 90. Nela
exemplifica-se como proceder, usando uma Folha de Cálculo, na introdução dos dados
estatísticos quando se efectua um estudo estatístico de dados bivariados.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 84
Estudo de Dados Bivariados
Esta transparência é a segundo de um grupo a que pertencem as transparências 83 a 90. Nela
exemplifica-se como proceder, usando uma Folha de Cálculo, para se entrar no assistente de
gráficos do programa.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 85
Estudo de Dados Bivariados
Esta transparência é uma das que pertence ao grupo de transparências 83 a 90. Nela exemplifica-
se como proceder, usando uma Folha de Cálculo, dentro do assistente de gráficos, para construir
um diagrama de dispersão.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 86
Estudo de Dados Bivariados
Mostra-se, nesta transparência, como se completa a construção do diagrama de dispersão iniciada
na transparência anterior.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 87
Estudo de Dados Bivariados
Esta transparência pertence ao grupo de transparências 83 a 90. Nela exemplifica-se como
proceder, usando uma Folha de Cálculo, para se entrar no assistente de funções e aí seleccionar
o cálculo do coeficiente de correlação linear.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 88
Estudo de Dados Bivariados
Esta transparência completa a tarefa de calcular o coeficiente de correlação linear iniciada na
transparência anterior.
Os formandos deverão ter acesso a um computador, com uma Folha de Cálculo, para poderem
acompanhar o formador enquanto este vai indicando, com a ajuda da transparência, quais os
passos a dar para a resolução da tarefa proposta na transparência 70.
Transparência 89
Estudo de Dados Bivariados
Esta transparência é uma das que pertence ao grupo de transparências 83 a 90. Nela exemplifica-
se como proceder, usando a Folha de Cálculo, para se dar instruções no sentido de se
representar a recta de regressão sobre o diagrama de dispersão.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.
Transparência 90
Estudo de Dados Bivariados
Esta transparência é um das que pertence ao grupo de transparências 83 a 90. Nele exemplifica-se
como proceder, usando a Folha de Cálculo, para se dar instruções no sentido de indicar a
equação da recta de regressão na representação da mesma.
Os formandos deverão ter acesso a um computador para poderem acompanhar o formador
enquanto este vai indicando, com a ajuda da transparência, quais os passos a dar para a resolução
da tarefa proposta na transparência 70.