♦ Koreliacijos koeficientai gali būti apskaičiuoti pagal formulę: r =
∑ ( x − x )( y − y)
(
∑ x −x
)2 ( y − y)2
).
Paprastais žodžiais tariant, turim x ir y bei skaičiuojam koreliaciją ryx, t.y. y nuo x. Raide i žymimas indeksas – tiesiog, lentelės stulpelio pozicija (stulpelio numeris): i 1 2 3 4 5 6 x 1 5 3 7 8 4 y 4 25 14 33 35 18 Imam koreliacijos formulę: skaitiklyje yra praleista visokių indeksų. visų suma, todėl formulė atrodo painoka. Keliaujam į wikipedia http://en.wikipedia.org/wiki/Correlation_and_dependence ir pasižiūrim, kaip atrodo pilna formulė:
Aha, skaitiklis kur kas gražesnis – atsiranda indeksai. Vardiklis sugadintas, nes naudojami standartiniai nuokrypiai. Bet užtai dabar įsivaizduojam, kas tie indeksai i ir pasitvarkom Valkausko formulę:
∑ ∑
n
ryx =
i =1
n
i =1
( xi − x)( yi − y )
( xi − x ) 2 ( yi − y ) 2
x su brūkšneliu viršuje ir y su brūkšneliu viršuje – tai atitinkamai visų x ir visų y reikšmių vidurkis. Štai ir aišku, ko reikės: x reikšmių vidurkio; y reikšmių vidurkio, tuomet (X - Xvidurkis), (YYvidurkis); jų sandaugos; jų kvadratų sandaugos. i x y
1 1 4 .. .. ..
2 5 25 .. .. ..
3 3 14 .. .. ..
4 7 33 .. .. ..
5 8 35 .. .. ..
6 4 18 .. .. ..
..
..
..
..
..
..
..
..
..
..
..
..
Jų .. sandauga
..
..
..
..
..
(X-Xvid) (Y-Yvid)
jų sandauga (XXvid)^2 (YYvid)^2
X vidurkį pasiskaičiuojam: suma/6 Y vidurkį pasiskaičiuojam: suma/6 Dabar daug išminties nereikia – pasiimam excelį, ir sumuojam, dalinam, traukiam šaknį... Žinoma, realiam 3 uždavinyje reikės trijų koreliacijų: tarp Z ir A, tarp Z ir B, ir tarp Z ir C, kur Z yra vienas parametras (rezultatinis, jį reikės didžiojoje dalyje variantų apsiskaičiuoti pagal formules), ir A, B, C yra skliaustuose nurodyti parametrai.
Kaip sudaryti tiesinę lygtį? Tiesinės lygties išraiška – y = a + bx. Tiek a, tiek b apskaičiuojami minimalių kvadratų metodu. Vėlgi iš Valkausko užrašų imam formules:
♦ Tiesės lygties atveju: yˆ x = a + bx , parametrų skaitinės reikšmės surandamos skaičiuojant pagal šias formules: 2 n ∑yx − ∑y ∑x ∑y ∑x −∑yx ∑x a= ; b = ). n ∑x 2 − ∑x ∑x n x2 − x x ∑
∑ ∑
Aišku, indeksų nėra, bet juos susidedam analogiškai, arba, jei tingim, apsilankom http://www.efunda.com/math/leastsquares/lstsqr1dcurve.cfm ir paskaitom paaiškinimus šalia panašios formulės. Jei labai tingim, tiesiog paskaitom apie Excel funkcijas INTERCEPT (skaičiuoja a reikšmę) ir SLOPE (skaičiuoja b reikšmę), arba dar geriau – LINEST (apskaičiuoja abu parametrus). Visa tai darom didžiausios koreliacijos (t.y. didžiausią tarpusavio sąsają) turinčiai kintamųjų porai, vienai iš Z-A, Z-B ir Z-C. Koreliacijos tuo didesnė, kuo ji toliau nuo 0 į nesvarbu kurią pusę: minusą (koreliacija neigiama, atvirkšinė) arba pliusą (koreliacija teigiama, tiesioginė).