Verslo Statistika - Koreliacija

  • Uploaded by: skaitiniai
  • 0
  • 0
  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Verslo Statistika - Koreliacija as PDF for free.

More details

  • Words: 1,178
  • Pages: 9
Tiesin÷s koreliacijos skaičiavimas Kas yra tiesin÷ koreliacija? 1. Koreliacija – dviejų reiškinių (dviejų požymių) tarpusavio sąryšis. 2. Reiškinys, kai objektų aib÷je požymį x atitinka ne vienas požymis y, o jų skirstinys su vidurkiu y x , ir keičiantis x reikšmei kinta ir y x reikšm÷, vadinamas koreliacija. 3. 4.

Dvimačiai duomenys (kai išmatuoti kiekvieno objekto du požymiai) neretai būna pasiskirstę pagal dvimatį normalųjį skirstinį. Tačiau šio skirstinio yra 2 atvejai. Nesusijusių požymių dvimatis normalusis skirstinys būna tais atvejais, kai požymiai x1 ir x2 tarpusavyje nesusiję. Tuomet grafikas atrodo taip (“kalvos” ašys lygiagrečios koordinačių ašims):

x2

x1

5. 6. 7.

 1  x − µ  2  x − µ  2   1 1 2 2 Jo lygtis: f ( x1 , x 2 ) = f 1 ( x1 ) f 2 ( x 2 ) = exp −   +   σ 1σ 2 ⋅ 2 π  σ 2     2  σ 1   1

Antrasis atvejis − tiesiškai susijusių požymių dvimatis normalusis skirstinys. Jis turi 5 parametrus - 2 vidurkius (µ1 ir µ2), 2 vid.kv.nuokrypius (σ1 ir σ2) bei koreliacijos koeficientą (ρ). Jo grafikas:

x2

x1

8.

Jo lygtis:

f ( x1 , x2 ) =

9. 10.

1 2πσ 1σ 2

  ( x1 − µ1 ) 2 1 ( x − µ1 )( x2 − µ 2 ) ( x2 − µ 2 ) 2   × exp − − 2ρ 1 +   2 2 σ 1σ 2 σ 22 1− ρ 2   2(1 − ρ )  σ 1

Dvimačių duomenų grafiko braižymas Darbo pradžia − tuščia lentel÷ su dviem stulpeliais duomenų:

Spauskite mygtuką įrankin÷je, kuris iškviečia grafikų braižymo meniu. Grafiko tipas turi būti XY(Scatter). Toliau spauskite NEXT.

Antrame grafikų braižymo žingsnio meniu spauskite sluoksnį SERIES ir įveskite: NAME − tiesiog „duomenys”, X values − Pirmojo duomenų stulpelio adresą, Y values − Antrojo duomenų stulpelio adresą

Čia X ir Y ašių pavadinimų nerašysime, tod÷l iškart spauskite FINISH. Gaunate dvimatį duomenų grafiką.

Koreliacijos koeficiento skaičiavimas Koreliacijos koeficientas skaičiuojamas pagal lygtį rxy =

∑(x ∑ (x

i

i

− x )( yi − y )

− x ) 2 ⋅ ∑ ( yi − y ) 2

, tačiau jums

pakaks pasinaudoti Excel’io funkcija CORREL. Langelyje D1 parašykite rxy = .

Tuomet darbin÷je juostel÷je peliuku užžym÷kite raides xy.

o po to paspauskite komandų grupę FORMAT. Atsidariusiame meniu paspauskite komandą CELLS.

Atsidaro naujas meniu, kuriame reikia peliuko kairiu klavišu spustel÷ti langelį SUBSCRIPT, o po to − mygtuką OK.

Tada peliuko kairiu klavišu spragtel÷kite bet kuriame tuščiame lentel÷s langelyje. Gautas rezultatas turi atrodyti taip:

. Dabar pereikite į langelį E1 Spauskite mygtuką

, kuris iškviečia funkcijų meniu PASTE FUNCTION.

Statistinių funkcijų grup÷je (STATISTICAL) suraskite funkciją CORREL ir spauskite OK. Atsidaro funkcijos CORREL tvarkymo meniu.

Jo apačioje trumpai aprašyta ką daro ši funkcija. Žymeklis dabar yra juostel÷je ARRAY1, tod÷l meniu yra paaiškinta, ką reikia įrašyti į šią juostelę. O čia jums reikia įrašyti pirmojo tiriamųjų objektų požymio reikšmių stulpelio (skaičiai iš pirmojo duomenų stulpelio) adresą. Tam reikia peliuko kairiu klavišu spragtel÷ti šioje vietoje. Funkcijos meniu laikinai dingsta, ir atsiveria lentel÷, kurioje likusi tik argumentų ARRAY1 įvedimo juostel÷.

Dabar jums reikia peliuku užžym÷ti pirmojo duomenų stulpelio skaičius (pirmojo požymio vertes). Užžym÷jus duomenis juostel÷je atsiranda duomenų adresas, ir tuomet peliuko kairiu klavišu spauskite šį mygtuką.

Grįžote į funkcijos CORREL tvarkymo lentelę. Dabar lygiai taip pat antrojoje juostel÷je ARRAY2 įveskite antrojo požymio vertes (antrasis duomenų stulpelis). Tuomet funkcijos lentel÷ atrodys šitaip:

Čia yra rezultatas, gaunamas paskaičiavus funkcijos reikšmę su įvestais argumentais (ARRAY1 ir ARRAY2). Šalia juostelių yra parodytos argumentų reikšm÷s (pavyzdyje tilpo tik pirmasis skaičius...). Spauskite OK.

Gaunate koreliacijos koeficientą rxy. Koreliacijos koeficiento patikimumo skaičiavimas. Koreliacijos koeficientas yra apskaičiuotas iš atsitiktin÷s imties duomenų, tod÷l jo reikšm÷ irgi atsitiktin÷. Visiškai įmanoma, kad koreliacijos koeficientas gali būti nepatikimas. Tiesin÷s koreliacijos koeficientas rxy yra nepatikimas: Generalin÷je aib÷je tiesin÷s koreliacijos (tiesinio ryšio) visiškai n÷ra ir jos koreliacijos koeficientas ρxy , tačiau imties koreliacijos koeficientas rxy yra nelygus nuliui, tod÷l atrodo, kad koreliacija yra. z transformacija Tikrinant rxy patikimumą koreliacijos koeficientą rxy tenka transformuoti į dydį z. Dydžiai z skirstosi normaliai. Langelyje D2 rašote „z =”, o langelyje E2 iškviečiate funkciją FISHER, kuri atlieka z-transformaciją (angliškai − Fisher transformation). Jos formul÷: z =

1 1+ r ln . 2 1− r

Funkcijos FISHER meniu reikia įvesti langelio su rxy reikšme adresą ir spausti OK.

Jeigu imties tūris mažesnis nei 25 objektai, dydį z reikia transformuoti Hotelingo transformacija:

z* = z −

3z + r . 4(n − 1)

Tam suskaičiuokite imties dydį n (su funkcija COUNT), o po to − z*.

Normuotas nuokrypis tz Normuotąjį nuokrypį skaičiuokite pagal vieną iš apačioje pateiktų formulių. Tuomet skaičiuojamas normuotas nuokrypis tz:

1 z = z ⋅ n − 3 , kadangi čia s z = . sz n−3 z* = z * ⋅ n − 1 , kadangi čia s z* = b) atlikus z ir Hotelingo transformacijas t z = s z* a) atlikus vien z transformaciją t z =

1 . n −1

Patikimumo apskaičiavimas Patikimumas p nustatomas integruojant standartinį normalųjį skirstinį: a) nuo tz iki +∞, jeigu tz >0, arba b) nuo -∞ iki tz, jeigu tz <0, o gautą skaičių padauginus iš 2. gautas dydis yra rxy reikšmingumo lygmuo. Jeigu p<0,05, tuomet rxy yra patikimas.

Taigi, apskaičiuokite rxy reikšmingumo lygmenį p. Jo formul÷ turi atrodyti taip (vietoje adreso E5 rašykite adresą langelio. kuriame suskaičiuotas jūsų tz):

Funkcija NORMSDIST skaičiuoja integralą nuo -∞ iki x

o mums reikia integralo nuo x iki +∞, tod÷l skaičiuojamas 1-NORMSDIST(X). Pagal p dydį padarykite išvadą − rxy patikimas ar ne. rxy pasikliauties intervalo skaičiavimas z pasikliauties intervalo (ribų) skaičiavimas Formul÷: Z − u 0, 975 ⋅

1 1 ≤ Z ρ ≤ Z + u 0,975 ⋅ n−3 n −3

u0,975 skaičiuojamas naudojant funkciją NORMSINV:

Toliau apskaičiuojami z intervalo apatin÷ ir viršutin÷ ribos. Čia naudojama z ar z* (su Hotelingo transformacija) reikšm÷s (jei reikia naudoti Hotelingo transformaciją – naudoti SQRT(... - 1), jei Hotelingo nereikia – SQRT(... - 3) ). Adresus įrašykite savo – jie turi atitikti jūsų Excel lentelę.

Lygiai taip pat suskaičiuokite ir zvirš. r pasikliauties intervalo (ribų) skaičiavimas Kai z ribas turite, reikia atlikti atvirkštinę transformaciją. Tam naudojama funkcija FISHERINV( ), į kurią įrašomos zap ir zvirš verčių adresai. Įrašymas atmintin Suskaičiavę failą įrašykite kompiuterio diskan (suteikite savo pavadinimą). Pakartotiniai skaičiavimai Tuos pačius skaičiavimus turite atlikti ir su kita požymių pora. Bet pakartotiniai skaičiavimai kur kas paprastesni: 1. Pakeičiate failo su koreliacijos skaičiavimais pavadinimą. 2. Į pirmus du stulpelius įkeliate savo duomenis. 3. grafike pakeičiate X ir Y ašių pavadinimus. 4. Jeigu jūsų antroji imtis (antroji imties dalis) yra didesn÷, negu pirmoji, reikia paredaguoti skaičiavimus ir grafiką: 5. Pakeiskite duomenų užžym÷jimo ribas formul÷se, kurios naudojama funkcijas CORREL, COUNT. Tam reikia peliuku užžym÷ti langelį su formule, paspausti klaviatūros klavišą F2 (redagavimas). Įsijungia redagavimo moda. Peliuku darbin÷je juostel÷je užžym÷kite senąjį duomenų adresą formul÷je, o tada peliuku užžym÷kite naujuosius duomenis. 6. Naujai užžym÷kite ir duomenų ribas grafike (dešiniu peliuko mygtuku spragtel÷ti grafiko parašt÷je → komanda SOURCE DATA → SERIES → peržymite serijas).

Related Documents

Statistika
June 2020 31
Statistika
April 2020 16
Statistika
April 2020 25
Statistika
November 2019 34
Statistika
April 2020 23

More Documents from ""