Elemente de statistica matematica

17
ELEMENTE DE STATISTICA MATEMATICA Elemente de Statistica Matematic a Statistica matematica se ocupa de gruparea, analiza si interpretarea datelor referiotare la un anumit fenomen precum si cu unele previziuni privind producerea lui viitoare. Populatia statistica este orice multime definite de obiecte de aceeasi natura. Elementele unei populatii se numesc unitati statistice sau indivizi. Numarul de elemente care constituie populatia se numeste volumul populatiei. Caracteristica (sau variabila statistica) a populatiei trasatura comuna tuturor unitatilor (indivizilor) populatiei. Caracteristica poate fi cantitativa sau calitativa. Caracteristicile cantitative pot fi discrete (sau discontinue) daca variabila statistica ia valor finite sau continue daca variabila poate lua orice valoare dintr-un interval finit sau infinit. Numarul tuturor indivizilor unei populatii se numeste efectivul total al acelei populatii. Se numeste frecventa absoluta a unei valori x a caracteristicii, numarul de unitati ale populatiei corespunzatoare acestei valori. Se numeste frecventa relativa a unei valori x i a caracteristicii raportul dintre frecventa absoluta n i a valorii x i si efectivul total al populatiei. Elemente Caracteristice ale unei Serii Statistice 1. Media Se numeste media caracteristicii x numarul: 2. Mediana Mediana este o valoare astfel incat jumatatea valorilor ale esantionului sunt mai mici sau egale cu si cealalta jumate a valorilor sunt mai mari sau egale cu . 3. Modulul

Transcript of Elemente de statistica matematica

ELEMENTE DE STATISTICA MATEMATICA

Elemente de Statistica Matematic a

Statistica matematica se ocupa de gruparea, analiza si interpretarea datelor referiotare la un anumit fenomen precum si cu unele previziuni privind producerea lui viitoare.

Populatia statistica este orice multime definite de obiecte de aceeasi natura. Elementele unei populatii se numesc unitati statistice sau indivizi. Numarul de elemente care constituie populatia se numeste volumul populatiei.

Caracteristica (sau variabila statistica) a populatiei trasatura comunatuturor unitatilor (indivizilor) populatiei. Caracteristica poate fi cantitativa sau calitativa.

Caracteristicile cantitative pot fi discrete (sau discontinue) daca variabila statistica ia valor finite sau continue daca variabila poate lua orice valoare dintr-un interval finit sau infinit.

Numarul tuturor indivizilor unei populatii se numeste efectivul total al acelei populatii.

Se numeste frecventa absoluta a unei valori x a caracteristicii, numarul de unitati ale populatiei corespunzatoare acestei valori.

Se numeste frecventa relativa a unei valori xi a caracteristicii raportul dintre frecventa absoluta ni a valorii xi si efectivul total al populatiei.

Elemente Caracteristice ale unei Serii Statistice

1. MediaSe numeste media caracteristicii x numarul:

2. MedianaMediana este o valoare astfel incat jumatatea valorilor ale

esantionului sunt mai mici sau egale cu si cealalta jumate a valorilor sunt mai mari sau egale cu .3. Modulul

Prin modulul (sau dominanta) unei serii statistice se intelege valoareacaracteristicii corespunzatoare cele mai mari frecvente daca valorile caracteristicii sunt discrete si valoarea centrala a clasei corespunzatoare celei mai mari frecvente daca variabila este continua.

4. Dispersia

Numarul v se numeste dispersia valorilor esantionului.Numarul se numeste abaterea mediei patratelor.

Problema 1

Un profesor isi ia din catalogul unei clase mediile la matematica pe semestrul trecut in vederea unor prelucrari statistice. Acestea sunt: 6, 7, 7, 5, 9, 8, 4, 10, 7, 5, 6, 6, 7, 8, 4, 4, 6, 5, 8, 6, 7, 5, 6, 9, 7.

1) Sa se completeze un tabel care contine rubricile: Nota, Frecventa absoluta, Frecventa relativa, Frecventa Cumulata. Realizati reprezentarea in batoane si poligonul frecventelor.

2) Folosind datele din tabel precizati:a. Cati elevi au note mai mici decat 5? Indicati procentul lor.b. Cati elevi au note intre 5 si 7? Indicati procentul lor.c. Cati elevi au note intre 7 si 10? Indicati procentul lor.d. Reprezentati aceste date printr-o diagrama in forma unui disc,

cu a), b), c) indicate prin sectoare ale cercului.3) Determinati media aritmetica, mediana, dispersia si abaterea mediei

patratice.

1)

2) a. 3 elevi au note sub 5. Acestia reprezinta 12%.b. 10 elevi au note intre 5 si 7. Acestia reprezinta 40%.c. 12 elevi au note intre 7 si 10. Acestia reprezinta 48%.

3) Media aritmetica = (4*3+5*4+6*6+7*6+8*3+9*2+10)/25=6.48Mediana = 7Dispersia = 2.48 (calculate tabelar)Abaterea = 1.57

Problema 2

In cadrul laboratorului de matematica aplicata se considera aruncarea simultana a doua zaruri de cate doi elevi si se inregistreaza suma punctelor obtinute pe cele doua zaruri. Se arunca zarurile de 30 de ori. Completati un tabel care contine urmatoarele coloane: Suma obtinuta,Frecventa absoluta, Frecventa relativa, Frecventa cumulata crescatoare. Alcatuiti diagrama in batoane. Calculati media, dispersia si abaterea mediei patratica.

Media = 7,033333333Dispersia = 8,165567Abaterea = 2,857545

Problema 3

La examenul de bacalaureat, cei 500 de elevi ai unui liceu au obtinut la proba de matematica rezultatele din tabelul alaturat. Sa se alcatuiasca histograma si poligonul frecventelor. Calculati media, dispersia si abaterea mediei patratica.

Elemente de limbaj in statistica.Date Statistice

Definitii1 Multimea pe care se realizeaza un studiu statistic se numeste populatie

statistica.2 Elementele componente ale unei poulatii statistice se numesc unitati

statistice sau indivizi.3 Numarul total de unitati statistice se numeste efectivul total al

populatiei statistice.4 O parte a populatiei statistice aleasa special pentru a fi studiata se

numeste esantion.5 Proprietatea sau indicatorul in functie de care se cerceteaza o populatie

statistica se numeste caracteristica sau variabila statistica.O caracteristica se numeste caracteristica calitativa daca nu poate fimasurata(valoarea ei nu se exprima numeric).Ex: media generala,calificativul,profesia O caracteristica cantitativa se numeste discontinua sau discreta daca nu poatelua decat valori numerice izolate.O caracteristica cantitativa care poate lua orice valoare dintr-un interval delungime finita sau infinita se numeste caracteristica cantitativa continua.Intervalel in care o caracteristica ia valori se numesc grupe sau clase devalori.Ex: a)Nota la teza.media generala sunt caracteristici cantitative discrete.

b)Inaltimea este o caracteristica in functie de care poate fi studiat ungrup.

Culegerea,Inregistararea si Clasificarea DatelorStatistice

Sa consideram studiul efectuat asupra unui grup de sportivi dupa inaltime(exprimata in centimetri).Rezultatele masuratorii sunt inregistrate in ordinea in care a decursmasuratoare si sunt asezate in urmatorul tabel:165 168 177 195 172 198 196 190 201 168172 168 168 196 173 199 182 195 196 196185 205 184 192 178 165 174 182 177 172196 192 188 195 175 192 175 184 192 170184 205 190 200 188 176 184 174 188 170170 180 184 199 192 184 170 175 184 188

165 168 177 195 172 198 196 190 201 168172 168 168 196 173 199 182 195 196 196185 205 184 192 178 165 174 182 177 172196 192 188 195 175 192 175 184 192 170184 205 190 200 188 176 184 174 188 170170 180 184 199 192 184 170 175 184 188

Sub aceasta forma datele inregistrate sunt greu de analizat.De aceeaeste necesara o alta grupare sau clasificare a datelor.De exemplu,saasezam aceaste date in ordinea crescatoare a inaltimi sportivilorconsemnand cati sportivi au o anumit inaltime.Se obtine urmatorul tabel:cm Nr.

sportivi

cm Nr.sportivi

cm Nr.sportiv

i

Cm Nr.sporti

vi

cm Nr.sportivi

165 2 174 1 180 1 190 2 199 2168 4 175 3 182 2 192 5 200 1170 4 176 1 184 7 195 3 201 1172 3 177 2 185 1 196 5 205 2

173 1 178 2 188 4 198 1 - -

Cu ajutorul acestei clasificari a datelor se pot obtine niste concluzii mairapide privind particularitatile acestui grup.Rezultatele analizei statistice pot fi obtinute uneori mai usor daca se practicao alta grupare a datelor statistice.De exemplu se poate face o grupare a valorilor caracteristicii studiatein clase de valori:Clase devalori

Nr.Sportivi

[165,170)

6

[170,175)

6

[175,180)

8

[180,185)

10

[185,190)

5

[190,195)

7

[195,200)

11

[200,205)

4

Cu ajutorul acestui tabel de date se pot obtine cu usurinta diferite informatiidespre grupul de studiu,ca de exemplu:-sunt 60 de sportivi-cei mai multi sportivi au inaltimea in clasa de valori [195,200),urmand cei cuinaltimea in clasa de valori [180,185) etc.-9 sportivi au inaltimea in clasa de valori [170,175)si reprezinta 15% dinefectivul populatiei statistice;-exista 45 de sportivi cu inaltimea sub 95 cm etc.Valoarea absoluta a diferentei extremitatilor unei clase de valori se numesteamplitudinea clasei.

Serii Statistice.Frecvente

1 Multimea tututor perechilor (xi,ni),1 i p formeaza o serie statisticacu o singura variabila.

2 Numarul ni de unitati statistice corespunzatoare valorii xi acaracteristicii sau a unei clase de valori se numeste frecventa absoluta avalorii xi,respectiv frecventa absoluta a clasei de valori considerate.

Rezulta ca Modul de prezentare a unei serii statistice cu o variabila statisticaeste sub forma unui tabel orizontal sau vertical care cuprinde valorilevariabilei statistice sau clasele de valori si frecvntele absolutecorespunzatoare:

Valorilecaracteristic

e

x1 x2.....xp

Frecventaabsoluta

n1n2 ....np

Clase devalori

[x1,x2)...[xp-1,xp)

Frecventaabsoluta

n1.....................n

p

Se spune ca aceste tabele definesc distributia sau repartitia statistica avariabilei statistice.Frecventa absoluta cumulata crescatoare a valorii x a variabilei statisticeeste suma tutuoro frecventelor absolute ale valorilor variabilei care apar panala xi inclusiv.

Se noteaza

Frecventa absoluta cumulata descrescatoare a valorii xi a variabilei statisticeieste suma tuturor frecventelor absolute ale valorilor variabilei care apar la xiinclusiv.

Se noteaza

Raportul dintre frecventa absoluta a unei valori xi sau a unei clase de valoristatistice si efectivul total al populatiei se numeste frecventa relativa aclasei de valori .

Se noteaza

Se numeste frecventa relativa cumulata crescatoare a valorii xi a variabileistatistice , suma tuturor frecventelor relative a valorilor care apar pana la xiinclusiv. Se noteaza

Se numeste frecventa relativa cumulata descrescatoare a valorii xi a variabileistatistice , suma tuturor frecventelor relative ale vlorilor care apar la xiinclusiv.

Se noteaza

Analog se definesc frecventele relative cumulate ale claselor de valori .

Reprezentarea Grafica a Datelor Statistice

O modalitatea de realizare a analizei si interpretarii datelor statistice oconstituie reprezentarea grafica a acestora ,reprezentare care permitevizualizarea datelor statistice in scopul formarii unei imagini intuitive siimediate asupra fenomenului studiat.

1 Graficul unei serii statistice se numeste diagrama structurala.

1.Reprezentarea grafica folosind diagrama circularaCercul de structura sau diagrama circulara este un cerc a carui arie reprezinta efectivul total al populatiei statistice (100%).Valorile variabilei se reprezinta prin sectoare de cerc ale caror arii sunt proportionale cu frecventele relative ale valorilor variabilei.Cu ajutorul regultii de trei simpla se determina masura unghiului la centru corespunzator fiecarei frecvente. Ex: Structura veniturilor banesti (in lei) din bugetul personal al unui student pe o luna se afla in urmatorul tabel de date:

Venituri Bursa destudiu

Donatii Activitatisuplimentare

Vanzari de

bunuriFrecventaabsoluta

2 400 000 1 200 000 2 100 000 300000

Frecventarelativa

40% 20% 35% 6%

Cu regula de trei simpla se obtine urmatoarea corespondenta intre frecventa relativa fi si masura unghiului la centru corespunzator:Fi 40% 20% 35% 5%n 144 72 126 18

Diagrama circulara asociata serii statistice cu variabila calitativa este redatade fi.

2.Reprezentarea grafica folosind dreptunghiul destructura

Pentru desenarea dreptunghiului de structura se considera un reper cartezian inplan.Axa verticala va fi axa frecventelor relative fi ale valorilor xi alevariabilei statistice.Cu baza pe axa verticala se deseneaza un dreptunghi cu inaltimea de 100 deunitati.Se divizeaza dreptunghiul pe linii orizontale obtinand dreptunghiuri cuariile proportionale cu frecventele fi.

Ex: Pentru seria statistica cu variabila calitativa din tabelul anterior seobtine dreptunghiul de structura din figura urmatoare :

.

3.Reprezentarea grafica prin batoane

Diagrama structurala cu ajutoarul batoanelor se obtine astfel:2 se alege un reper cartezian in plan3 pe axa orizontala se reprezinta valorile xi ale variabilei statistice4 pe axa verticala se reprezinta frecventele absolute ni sau frecventele

relative fi corespunzatoare valorilor xi 1ip5 segmentul cu extremitatile in punctele cu coordonatele (xi,0), (xi, ni)

respectiv (xi, fi) reprezinta batonul corespunzator valorii xi.Ex; Se considera seria statistica reprezentand distributia unui esantion de 120de tineri in functie de numarul de carti imprumutate de la bibleoteca intr-un semestru.Numarcarti

0 1 2 3 4 5 6 7 8

Numarelevi

2 8 10 18 20 25 22 5 10

4.Reprezentarea grafica prin coloane sau benzi

Acest tip de reprezentare grafica foloseste dreptunghiuri cu latimi egale silungimile proportionale cu frecventele absolute sau cu frecventele relative alevalorilor variabilei statisticei.Daca dreptunghiurile sunt asezate vertical,reprezentarea grafica se numestediagrama prin coloane, iar daca sunt asezate orizontal reprezentarea grafica senumeste diagrama prin benzi.Ex: Repartitia numarului de ore de emisie de radio (mii ore program) in perioada1998-2003 este:

Anii1998 1999 20

002001

2002

2003

Numarore

52 58 64 60 70 75

5.Poligonul frecventelorO modalitate de vizualizare a datelot unei seriistatistice este poligonulfrecventelor care permite reprezentarea grafica sub forma unei curbe.Fie seriastatistica cu telor absolute se unescprintr-o linie poligonala decoordonate , .Daca se unesc punctele decoordonate se obtine poligonul frecventelorrelative.

6.HistogramaSe considera o serie statistica cu variabila cantitativa continua si clasele devalori de amplitudini egale:distributia unui grup de tineri dupa inaltimeaexprimata in centimetri:

Inaltime Numar tineri Frecventaabsolutacumulata

crescatoare

Frecventaabsolutacumulata

descrescatoare[155,160)

5 5 63

[160,165)

12 17 58

[165,170)

15 32 46

[170,175)

20 52 31

[175,180)

8 60 11

[180,185)

3 63 3

Interpretarea Datelor Statistice Prin Parametride Pozitie

Analiza si interpretarea datelor statistice legate de un studiu statistic s-a realizat pana la acest moment cu ajutorul frecventelor si a graficelorstatistice. Pentru o serie statistica este interesant de gasit acea marime care survinecel mai des , acea marime este cea mai reprezentativa pentru toata seria. O astefle de marime se numeste indicator sau parametru de pozitie deoarecearata pozitia elementelor principale ale seriei in cadrul acesteia. Reprezentivitatea unor astfel de marimi este data de gradul de concentrarea datelor statistice in jurul lor.

1.Valoarea medie a unei serii statistice

Fie seris statistica asociata unui studiustatistic asupra unei populatii statistixce din efectivul N, cu variabilacantitativa.Se numeste valoare medie sau media variabilei statistice X , media aritmetica atuturor valorilor variabilei statistice calculata pentru toate unitatilepopulatiei statistice.

Se noteaza

2.Mediana seriei statisticeordonata

Mediana unei serii statistice ordonate este valoarea Me care imparte sirulordonat al valorilor variabile in doua parti,fiecare parte continand acelasinumar de valori.*Mediana unei serii statistice cu variabila cantitativa discreta se obtineastfel: -se aseaza cele N valori ale variabilei in ordine crescatoare saudescrescatoare -daca N este numar impar, atunci

-daca N este par N=2k, atunci

Clasa de valori in seria frecventelor absloute cumulate careia ii corespunde celputin jumateate din efectivul total al populatiei se numeste clasa mediana.Mediana unei serii statistice cu variabila cantitativa de tip continuu secalculaeaza cu formula

Unde: L=limita inferioara a clasei mediane CM=cota medianei Ni-1=frecventa absoluta cumulata crescatoare pana la clasa mediana ni=frecventa absoluta corespunzatoare clasei mediane k=amplitudinea clasei mediane

3.Modulul unei serii statistice

In multe activitati economico-sociale prezinta interes acele aspecte caresurvin cel mai frecvent in derularea lor.

De exemplu compararea numarului de apeluri telefonice pe intervale mici detimp da posibilitatea determinarii perioadei din zi cand o centrala telefonicaeste cel mai mult solicitata si, in conseciinta , da posibilitatea determinariicapacitatii optime a centralei. Astfel de probleme se rezolva folosind parametru statistic de pozitie numitmodul sau dominanta.Definitie!Modulul sau dominanta unei serii reprezintavaloarea unei clase de valori a variabilei care corespunde celui mai mareefectiv si se noteaza Mo.

*Pentru determinarea unei valori mai exacte a modulului unei serii statistice cudate grupate in clase de valori , vom face o analiza pe o secventa a diagrameistructurale a acesteia care sa contina si valorile din clasa modala [1, L).Fie cazul seriei statistice in care clasa de valori anterioare clasei modale arefrecventa mai mica decat frecventa clasei de valori care urmeaza clasei modale.

Notam: 1=diferenta dintre frecventa clasei modale si cea a clasei anterioareei. 2=diferenta dintre frecventa clasei modale si cea a claseiurmatoare. K=amplitudinea clasei modale k=L-1Se obtine :

4.Dispersia.Abaterea medie patratica Sa consideram urmatoarele seturi de date: {1,2,3,4,5} si{2,40;2,50 ;2,60 ;2,80 ;5}

Se constata ca ambele siruri de date au valoarea medie egala cu 3 ,sunt distincte , iar datele primului sir sunt raspandite in raport cu media fatade cele a setului al doilea. Pentru a masura gradul de impartasire a datelor unei seriistatistice fata de medie se folosesc urmatorii parametri de pozitie: dispersiasi abaterea medie patratica.Definitie! *Fiind data seria statisticadispersia valorilor este media aritmetica ponderata apatratelor abatarilor de la medie ale valorilor variabilei.

Se noteaza

In cazul datelor grupate in clase de valori , se considera abaterile centrelorclaselor de valori de la medie.Definitie! *Fiind data seria statistica senumeste abatere medie patratica a valorilor variabilei numarul undeeste dispersia serie.

Se noteaza

Abaterea medie patratica da posibilitatea caracterizarii dispersieivalorilor variabilei statistice.Astfel, o serie care este putin dispersata ,adica prezinta valori ce sunt strans grupate in jurul valorii medii, conduce lao medie patratica micaDefinitie! Raportul dintre abaterea medie patratica si valoarea medie a uneiserii statistice se numeste coeficient de variatie