|
SARRERA![]() |
Estatistika hainbat datu eta emaitza eskuratzen dizkigun matematikaren adarra da, baina horrez gain, erabaki zuzenak hartzea ahalbidetzen digu, zalantzan egon gaitezkeen kasuetan. Esaten da "estatistika, zalantzazko egoeren aurrean erabakiak hartzeko artea " dela.
Oharturik egongo zara, edozein egunkari begiztatu orduko edo irratia zein telebista piztu orduko, mota honetako albisteak aurkitzen ditugula: " hil honetan gehien saldu den CD-a" edo " gazteriaren gehiengoak marka honetako edo hartako prakak erosten ditu " ...
Egunero jasotzen dugu ikerketa estatistikoen bitartez landuriko informazio asko. Baina, argi al daukagu nola lortzen diren emaitza horiek? Ba al dakigu behar bezala interpretatzen? Fidagarriak al dira eskaintzen dizkiguten emaitzak?
Gai honetan arazo hauek ebazten lagunduko digute, estatistikaren munduan sakonduz.
|
PROZESU ESTATISTIKOAK![]() |
Azterketa estatistikoetan, zientzia guztietan bezala, era metodikoan eta ordena zehatz baten arabera jardun beharra dago emaitza fidagarriak lortu nahi badira:
Prozesu estatistikoetan hiru urrats bereiz ditzakegu:
Aurrena, aztertu nahi den fenomenoa deskribatu beharra dago. Horretarako inkestak landu, emaitzak bildu eta datuak jasotzen ditu.
Ondoren, datuen analisia egiten da. Honetarako, taula estatistikoetan antolatzen dira lortu diren emaitzak sailkatuz, eta justifikatzen dituen azalpenik ba ote dagoen aztertzen da.
Azkenik, lortu diren datuen arabera, azterturiko fenomenoaren eboluzioaren iragarpena egin daiteke.
Adibidez:
*Futbol talde batek ez du egin garrantzizko fitxajerik, baina aurre-denboraldian ez du batere emaitza onik lortu; horregatik zuzendaritzak jakin nahi du ea bazkideek abonua berrituko duten datorren denboraldirako.
Telefono bidez egin zaio inkesta bazkide-kopuru jakin bati. Lortu diren emaitzak ondoko diagraman daude jasorik

Galdetu zaienen %30-ak berrituko du txartela, %60-ak ez du berrituko eta %10-a zalantzan dago.
Honen arabera, zer uste duzu zuk gertatuko dela? Zer egingo zenuke zuk?
———————————————————————————
*Ikastetxe batek informatikako ikastaro bat eskaini nahi die ikasleen gurasoei. Ikastaro hori emango duen irakasleak ez daki zein maila duten gurasoek. Horregatik inkesta bat prestatu eta gurasoetako batzuei eman die. Lortu dituen erantzunak diagrama honetan adierazitakoak dira.
Zein erabaki hartuko zenuke zuk?

|
|
POPULAZIOA, LAGINA, BANAKOA![]() |
Ikerketa estatistiko batean aztergai diren elementu guztiez osaturiko multzoari populazioa deitzen zaio. Hitz hau ez da erabiltzen pertsonak adierazteko bakarrik, gauzez eraturiko multzoei populazio deritze.
Oso handia den populazio batean ikerketa estatistiko bat egin nahi dugunean, populazioaren zati batetik hartzen ditugu datuak. Aukeratzen den zatiari lagina deritzo. Zenbat eta handiagoa izan lagina, orduan eta fidagarriagoak izango dira lorturiko emaitzak.
BANAKOA POPULAZIOA LAGINA
Populazioa edo lagina osatzen duten elementuetako bakoitzari banakoa deritzo.
|
Adibidez:
Autonomi Erkidegoan, DBHko zenbat ikasle dauden hepatitis B-aren aurka txertaturik aztertu nahi da. Ikasleen kopurua oso handia denez, lagin bat hautatu da.
DBHko ikasle guztiek osatzen dute ikerketaren populazioa. Laginak populazioa ondo ordezkatuko badu, Erkidegoko hainbat hiri eta herritan bizi diren ikasleak hautatu behar dira, neska eta mutilak eta ikasmaila desberdinetakoak, hau da, adin guztietakoak. |
|
ALDAGAI ESTATISTIKOAK ![]() |
Aldagai estatistiko bat egiten dugunean populazio baten ezaugarri zehatz bat analizatzeko izaten da: musika-disko baten salmentak, odol emaileen odol taldea, pelikula bat ikustera joan den pertsonen kopurua, ikasleen ilearen kolorea,.
Zenbakizko balio baten bidez adierazten diren ezaugarri edo karaktereei kuantitatiboak deritze eta kualitate bat adierazten dutenei berriz, kualitatiboak .
Disko baten salmentei edo pelikula batera joan diren pertsonen kopuruari dagozkion datuak zenbakien bidez adierazten ditugu, baina ilearen koloreaz edo odol taldeaz galdetzen diren erantzunei ez dagozkie zenbakizko baliorik. Beraz lehenengo bi kasuak aldagai kuantitatiboak izango dira, eta besteak kualitatiboak.
Ezaugarri jakin batean modalitate desberdinak hartu behar dira kontuan, hau da, irten daitezkeen erantzun desberdin guztiak. Adibidez, dantza txapelketa batean modalitate desberdinak egon daitezke: euskal dantzak, saltsa, merengea,.
Ezaugarri kuantitatibo bat aztertzen dugunean gerta daitezkeen emaitza guztiak zenbakizkoak dira. Horietako bakoitza modalitate bati dagokio eta aldagai estatistiko deritzo.
Aldagai estatistiko diskretua eta jarraia
Aldagai estatistiko diskretua , balio osoak bakarrik har ditzakeena da. Adibidez, gelako ikasle kopurua: 18, 23, 19,.
Aldagai estatistiko jarraia , ondoz ondoko bi balioen artean infinitu balio har ditzakeena da. Adibidez, gelako ikasleen garaiera: 1,24; 1,45; 1,83;.
Kasu honetan balio asko edo oso desberdinak aurkitu daitezke, horregatik tarteka edo multzoka jartzea komeni da. Tarte bakoitzak bere muturren arteko balioei dagozkien datu guztiak barne hartzen ditu.
Tarte bakoitzaren goiko eta beheko muturren arteko diferentziari tartearen zabaltasuna edo anplitudea deitzen zaie.
|
Adibidea:
DBHko 2. mailako gela batean ikasleen garaiera neurtu eta emaitza hauek lortu dira: 1,68; 1,75; 1,60; 1,72; 1,80; 1,82; 1,81; 1,78; 1,67; 1,85; 1,77; 1,79; 1,83; 1,68; 1,74; 1,82; 1,71; 1,76; 1,73; 1,64.
Balio txikiena 1,60 eta handiena 1,85.
Datu hauek 1,10 m-tako tarteetan banatu nahi baditugu, tarte hauek eratuko ditugu:
1,60-1,70 1,70-1,80 1,80-1,90
Ohar zaitez tarte bat amaitzen den balio berean hasten dela hurrengoa. Tarte hauei gainjarriak deitzen zaie. Bi tarteen balio berbera ez errepikatzeko, parentesi eta kortxeteak erabiltzen dira:
[1.60,1.70) tartean datu hauek sartuko lirateke: 1.68, 1.60, 1.67, 1.68, 1.64
[1.70,1.80) tartean datu hauek sartuko lirateke: 1.75, 1.72, 1.78,1.77, 1.79, 1.74, 1.71, 1.76, 1.73
[1.80,1.90) tartean datu hauek sartuko lirateke: 1.80, 1.82, 1.81, 1.85, 1.83, 1.82. |
|
TAULA ESTATISTIKOAK ![]() |
Datu estatistikoak ordenatu egin behar dira, erosoago aztertzeko eta dagozkien ondorioak ateratzeko. Estatistikan egiten den lehenengo gauza inkesta batean lortu diren emaitzak ordenatzea da, txikienetik handienera edo alderantziz.
Maiztasun absolutua (f) Inkesta bat egiten denean, datu asko agertzen dira errepikaturik, eta noski, horiek denak taula batean jasotzea, aspergarria izateaz gain, ia alferreko lana litzateke. Datu hauek era laburtuan adierazteko, modalitate bakoitzaren alboan zenbat aldiz errepikatzen diren idazten da. Zenbaki honi maiztasun absolutua deritzo, eta aldagai estatistiko bakoitzak berea edukiko du. Maiztasun absolutua adierazteko "f" letra erabiltzen da.
Maiztasun erlatiboa (f r )
Baina batzuetan maiztasun absolutuak ez du nahikoa informazio ematen, ez baitu adierazten zer tamainatakoa den erabilitako lagina, hau da, zenbat banakoz osatuta dagoen (N lagina)
Kasu hauetan maiztasun erlatiboa erabiltzen dugu. Maiztasun absolutua laginaren tamainaz zatituz lortzen da.

Maiztasun metatua (f a , f ra )
Aldagaiaren balioak txikienetik handienera ordenatu ondoren, balio jakin baten maiztasun metatua aurkitzeko, hartu den balioaren eta berau baino balio txikiago guztien batuketa egiten da: bai maiztasun absolutuekin, maiztasun absolutu metatua (fa) kalkulatzeko eta baita maiztasun erlatiboekin, maiztasun erlatibo metatua (fra) kalkulatzeko.
Taula estatistikoak
Inkestan lortutako datuen kontaketa egin ondoren, eta aldagai bakoitzaren maiztasuna ezagutzen direnean, hauek maiztasun taulen edo taula estatistikoen bidez adierazten dira.
Maiztasun taulak berdin erabil daitezke aldagai estatistiko diskretuetarako edota aldagai jarraietarako.
Aldagaia diskretua denean, zutabe batean aldagai estatistikoaren balioak ipintzen dira, ia beti txikienetik handienera ordenaturik; aldagaia jarraia denean berriz, balioak tarteetan pilaturik aurkezten dira.
|
Adibidea:
DBHko 2. mailako ikasle-talde bati galdetu diote ea bakoitzak euro bateko zenbat txanpon dauzkan patrikan. 20 ikasleko lagin bat harturik, emaitza hauek lortu dira:
2, 1, 3, 4, 1, 2, 5, 6, 2, 3, 4, 1, 3, 3, 3, 4, 2, 1, 1, 1
Maiztasun taula baten ordenaturik hau daukagu:
Txanponak |
Maiztasun absolutua
f |
Maiztasun absolutu metatua
f a |
Maiztasun erlatiboa
f r |
Maiztasun erlatibu metatua
f ra |
1 |
6 |
6 |
6/20=0,3 |
0,3 |
2 |
4 |
6+4=10 |
4/20=0,2 |
0,2+0,3=0,5 |
3 |
5 |
10+5=15 |
5/20=0,25 |
0,5+0,25=0,75 |
4 |
3 |
15+3=18 |
3/20=0,15 |
0,75+0,15=0,90 |
5 |
1 |
18+1=19 |
1/20=0,05 |
090+0,05=0,95 |
6 |
1 |
19+1=20 |
1/20=0,05 |
0,95+0,05=1 |
——————————————————————————
DBHko 2.mailako gela batean ikasleen garaiera neurtu eta emaitza hauek lortu dira:
1.68, 1.75, 1.60, 1.72, 1.80, 1.82, 1.81, 1.78, 1.67, 1.85, 1.77, 1.79, 1.83, 1.68, 1.74, 1.82, 1.71, 1.76, 1.73, 1.64
Garaiera |
Maiztasun absolutua
f |
Maiztasun absolutu metatua
f a |
Maiztasun erlatiboa
f r |
Maiztasun erlatibo metatua
f ra |
[1.60-1.70) |
5 |
5 |
5/20=025 |
0,25 |
[1.70-1.80) |
9 |
5+9=14 |
9/20=0,45 |
0,25+0,45=0,70 |
[1.80-1.90) |
6 |
14+6=20 |
6/20=0,30 |
0,70+0,30=1 |
|
|
INFORMAZIOAREN ADIERAZPEN GRAFIKOA![]() |
Ikerketa estatistiko baten emaitzak aurkeztu nahi direnean, bai komunikabideetan, bai lan zientifikoetan, emaitza horiek islatzen dituzten grafikoak erabiltzen dira.
Adierazpen grafikoak, politagoa eta dotoreagoa izateaz gain, ia informazio guztia begiratu huts batez geureganatzea ahalbidetzen du.
Egia da, dena den, kritikoak izan behar dugula grafikoen aurrean, batzuk engainagarriak izaten baitira; horretarako, adi begiratu behar dira eskalak eta baita datuak lortzeko erabili den laginaren tamaina era.
Adierazpen grafiko ohizkoenak hauek dira:
Histogramak:
Aldagai jarraiak adierazteko erabiltzen dira. Elkarren kontra ezarritako laukizuzen batzuk dira, oinarrien tarteak eta altuerak maiztasunak adierazten dituztenak.
Histogramen ezaugarria zera da, laukizuzenetako bakoitzaren azalera, maiztasun absolutu edo erlatiboaren balioari egokitu behar zaiola.
|
Adibidea
Euskadiko itzulian erlojuz kontrako proba batean parte hartu duten 100 txirrindulariek ondoko laukian adierazten diren denborak egin dituzte:
Denbora(min) |
Txirrindulari kopurua |
[30-32) |
22 |
[32-34) |
25 |
[34-36) |
23 |
[36-38) |
10 |
[38-40) |
15 |
[40-42) |
5 |
Emaitza horiek ondoko histograman jasota daude

|
|
Barra diagrama:
Adierazpen grafiko hauek aldagai estatistiko diskretutarako edo aldagai estatistiko kualitatiboentzat erabili ohi dira. X ardatzean aldagaien balioak jartzen dira, eta horietako bakoitzetik Y ardatzarekiko barra paraleloak marrazten dira, berauen altuera maiztasunaren berdina delarik, ardatz honetan islatzen den eskalaren arabera.
|
Adibidea:

|
|
Maiztasun poligonoa:
Laukizuzenaren goi-oinarrietako erdiko puntuak lerro poligonal batez lotzen baditugu, maiztasun-poligonoa deritzona ateratzen zaigu.
Mota honetako adierazpen grafikoak histograma edo barra-diagrama batekin ordezka edo konbina daitezke
|
Abidea:

|
|
Sektore diagrama:
Adierazpen eredu honetan, sektore zirkular bat esleitzen zaio modalitateetako bakoitzari, sektore bakoitzaren anplitudea dagokion maiztasunaren proportzionala delarik. Horretarako, maiztasun guztien baturari 306ºtako balioa egokiarazten zaio eta sektore bakoitzaren anplitudea, adierazten duen maiztasunarekiko proportzioan aurkitzen da.
Normalean mota honetako adierazpen grafikoak ezaugarri kualitatiboetarako egokiak izaten dira.
|
Adibidea:
Histograma argitzerakoan erabili dugun kasua berreskuratuko dugu:
Denbora(min) |
Txirrindulari kopurua
Maiztasuna f |
Maiztasun erlatiboa |
Gradu kopurua
( º ) |
Portzentaia
% |
[30-32) |
22 |
22/100=0.22 |
0.22*365=80.3 |
22 |
[32-34) |
25 |
25/100=0.25 |
0.25*360=91.25 |
25 |
[34-36) |
23 |
0.23 |
83.95 |
23 |
[36-38) |
10 |
0.10 |
36.5 |
10 |
[38-40) |
15 |
0.15 |
54.75 |
15 |
[40-42) |
5 |
0.05 |
18.25 |
5 |

|
|
Piktogramak:
Aldagai bakoitzaren maiztasunarekiko tamaina proportzionala duen marrazki edo ikono batez adierazten da.
Maiztasuna marrazkia errepikatuz ere adieraz daiteke, beronen neurririk aldatu gabe.
|
Adibidea
Hondartza bila datozen turisten kopuruaren bilakaera azken urteetan:

|
|
ZENTRALIZAZIO NEURRIAK ![]() |
Lagin baten ikerketa estatistikotik lorturiko datuak emaitza bakar batean biltzen dituzten balioei zentralizazio parametroak deritze.
Garrantzitsuenak batezbestekoa, mediana eta moda dira.
Euretako bakoitzak irizpide desberdinak islatzen ditu, eta lan bakoitzean landu nahi den ikerketa motari ongien egokitzen zaiona hartu behar da kontutan.
Batezbestekoa
Banaketa bateko aldagai bakoitzari egokituko litzaiokeen balioa da, denak berdinak liratekeen kasuan.
Hau da denetan erabiliena, kalkulatzeko erraza da eta behaketako datu guztiak hartzen ditu kontuan.
Batezbestekoa ezaugarri kuantitatiboetan bakarrik kalkulatu daiteke, balio guztien batura, dauzkagun balio guztien kopuruaz zatituz.
|
Adibidea
12tik 14 urte bitarteko 20 ikasleri galdetu diegu ea zenbat aldiz joaten diren zinemara hileko, eta erantzunak maiztasun-taula batean jaso ditugu
Zenbat aldiz(x) |
Ikasle kopurua(f) |
x*f |
1 |
2 |
2 |
2 |
2 |
4 |
3 |
10 |
30 |
4 |
4 |
16 |
5 |
2 |
10 |
|
N=20 |
S =62 |
Ikasle horiek zinemara joaten diren aldien batezbestekoa kalkulatzeko, 20 ikasleak zinemara joan diren aldi guztien batuketa egingo dugu, eta emaitza laginaren tamainaz zatitu.
Kalkulua errazteko balio bakoitza dagokion maiztasunaz biderka dezakegu.
Emaitza guztien batura laginaren tamainaz zatitzen badugu, bataz bestekoa irtengo zaigu

|
|
Aldagai estatistikoa jarraia bada eta balioak tarteetan multzokaturik badaude, tarte bakoitzari dagokion klase-marka hartuko dugu, hots, dagokion tartearen batezbestekoa. |
Adibidea
Ondoko taulan 100 txirrindularik lasterketa batean egin dituzten denborak daude:
Denbora
(min) |
Klase-marka
(x) |
Txirrindulari kopurua
(f) |
x·f |
[30-32) |
31 |
22 |
682 |
[32-34) |
33 |
25 |
825 |
[34-36) |
35 |
23 |
805 |
[36-38) |
37 |
10 |
370 |
[38-40) |
39 |
15 |
585 |
[40-42) |
41 |
5 |
205 |
|
|
N=100 |
S =3472 |
Batezbestekoa kalkulatzeko, klase-marka bakoitza dagokion maiztasun absolutuarekin biderkatzeaz atera zaizkigun emaitzen batura, laginaren tamainaz zatituko dugu:

|
|
Moda
"Modan dago" esaten dugunean, zera adierazten dugu, ohitura bat, janzkera bat, eta abarren erabilpena nagusitzen dela une jakin batean edo giza talderen batean. Estatistikan ere esanahi hori bera dauka. Moda maiztasun handiena daukan aldagai estatistikoari deritzo, hau da, gehien errepikatzen den balioari.
Moda berdin zehaztu daiteke ezaugarri kuantitatiboetan zein kualitatiboetan.
|
Adibidea:
Azkeneko saskibaloi denboraldian honako ikusle kopuru hauek izan ditu talde jakin batek:
Ikusle kopurua |
10.000 |
15.000 |
20.000 |
22.0000 |
25.000 |
Maiztasun absolutua |
4 |
6 |
8 |
2 |
2 |
Emaitza hauei dagokien moda 20.000 ikasle da, hori baita maiztasun absolutuetan ematen den baliorik altuena. Esaten de normalean ikusleen kopurua 20.000 izan dela. |
|
Mediana
Mediana, lagina bi zati berdinetan erdibitzen duen aldagaiaren balioa da, datuak ordena gorakorrean ordenaturik daudenean. Hau da, mediana baino txikiagorik diren datuen kopurua, handiagoak direnean kopuruaren berdina da.
Datuen kopurua bakoitia bada, mediana bat dator erdikoaren balioarekin, baina datuen kopurua bikoitia bada, bi erdiko balio izango ditugu, eta mediana bi horien bataz bestekoa izango da.
|
Adibidea:
Hiri batean, astebetean zehar egunero alkohola dela eta gertatu diren istripu kopuruak jaso dira. Hona emaitzak:
2,3,0,5,8,12,1
Datuak txikienetik handienera ordenatzen baditugu, zerrenda honela gelditzen zaigu:
0,1,2,3,5,8,12
Erdiko posizioaren dagoen zenbakia 3.a da, beraz, hori da mediana.
———————————————————————————
Herri batean, urte osoan zehar, hilabete bakoitzaren enplegua lortu duten emakumeen kopuruak erregistratu dira.
Hauek dira emaitzak: 4,9,10,10,8,5,13,13,10,5,8,eta 13
Datuak ordenatzen baditugu: 4,5,5,8,8,9,10,10,10,13,13,13,
Datuen kopurua bikoitia denez, ez daukagu lagina bi zati berdinetan erdibitzen duen balio bakar bat. Mediana kalkulatzeko, 9 eta 10aren arteko bataz bestekoa aurkitu behar dugu:
Beraz, mediana hau da: emakumek lortu dute enplegua hileko. |
|
|
 |
Sarrera
Prozesu Estatistikoak
Definizioak |
Aldagai Estatistikoak
Taula Estatistikoak
Adierazpen Grafikoak
Zentralizazio Neurriak |
|
|