7. Linearna regresija Marko Pirc 5. maj 2009
Naloga 1 Navodila Za meritve1 v datoteki ”HitrostTokaOdFrekvence.txt”(naloga 6.1) doloˇci parametra najboljˇse premice. Ker so podane napake hitrosti, lahko doloˇciˇs tudi χ2 . Rezultati Rezultate sem izraˇcunal s programom Origin, kateri ima ze vgrajeno funkcijo v meniju Analysis→Fitting→Fit Linear in Residual sum of sqare, kateri vrne vrednost χ2 .
graf hitrosti toka v odvisnosti od frekvence (datoteka "HitrostTokaOdFrekvence.txt") 5
podatki meritev linear fit (upoštevanje napak) y = 0,978x - 1,939 linear fit (brez napak) y = 1,008x - 2,095
h i t r o s t t o k a [ µm / s ]
4
3
2 4
1 Blaz
5
frekvenca [Hz]
6
Kavˇ ciˇ c, Duˇsan Babiˇ c in Igor Poberaj, Mikrofluidiˇ cno vezje z mikroˇ crpalko, OMF 56 (2009) 1.
1
7
Za primerjavo sem naredil fitanje in izraˇcune za oba primera - z in brez upoˇstevanja napak. Na zgornjem grafu se vidi rahlo odstopanje med premico, fitano z upoˇstevanjem napak in tisto brez upoˇstevanja. Rezultat sem preveril tudi s programom Mathematica in funkcijo, opisano na spletni strani ROVF, katera mi je dala enake rezultate: -enaˇcba linearne zveze in vrednost χ2 z upoˇstevanjem napak: y = 0, 978 · x − 1, 939;
χ2 = 0, 086.
ˇ raˇcunamo χ2 po formuli v navodilih dobimo vrednost 5,44 ker tam ni napisano, da (Opomba: Ce je potrebno vsak ˇclen vsote deliti s kvadratom napake!) -enaˇcba linearne zveze brez upoˇstevanja napak: y = 1, 008 · x − 2, 095 Pri tem je prvi parameter linearne zveze naklonski koeficient k in drugi parameter zaˇcetna vrednost n. Opomba: Vse vrednosti so zaokroˇzene na tri decimalna mesta.
2
Naloga 2 Navodila Skozi oblak podatkov ”Tintin.dat”potegni najboljˇso premico. Uporabiˇs lahko kar korelacijske rezultate iz naloge 6.2. Rezultati
G r a f o d z iv a n a z d r a v ilo v o d v is n o s ti o d d o z e ( d a to te k a " T in tin .d a t" )
t [u r z v o n e n ja n a te d e n ]
2 4
1 6
8
r e z u lta ti m e r ite v lin e a r n a z v e z a y = - 0 ,1 2 4 x + 1 6 ,4 5 5 0
2 0
4 0
d o z a [m g /k g z iv e m a s e ]
Na zgornji graf nisem narisal primerjalne premice pofitane s programom, saj se popolnoma ujema z izraˇcunano in se je na grafu sploh ne vidi. Za izraˇcun rezultatov pri tej nalogi sem uporabil korelacijske rezultate iz naloge 6.2: R = −0, 394, x ¯ = 12, 438, y¯ = 14, 906, σx = 12, 672, σy = 4, 003. Iz tega hitro sledi: σy k =R· = −0, 124 σx ˇ vemo, da premica s tem naklonskim koeficientom poteka skozi toˇcko s koordinatami (¯ Ce x,¯ y ) lahko preprosto izraˇcunamo zaˇcetno vrednost po enaˇcbi: n = y¯ − k · x ¯ = 16, 455. Iskana enaˇcba premice je: y = −0, 124 · x + 16, 455.
3
Naloga 3 Navodila Skozi toˇcke v histogramu podatkov ”Interval.dat”poskusi potegniti najboljˇso eksponentno funkcijo w = Ae−λx ki jo moramo najprej predelati v linearno zvezo. Z logaritmiranjem dobimo ln(w) = ln(A) − λx. V grafu y = ln(w) od x sta koeficienta premice k = −λ in n = ln(A). Po teoriji verjetnosti mora biti koeficient λ enak reciproˇcni povpreˇcni vrednosti histograma. Rezultati Najprej sem pripravil histogram iz podatkov datoteke ”Interval.dat”, v katerem sem podatke opredalˇcil v 25 predalˇckov (kasneje za preizkus tudi za 5) (program Origin in vgrajena funkcija Frequency Counts). Nato sem vrednosti na y osi logaritmiral (orodje Excel), drugaˇce oznaˇcil (vrednosti v nadaljnjih izraˇcunih niso upoˇstevane) vse ”outlierse”, ter dobljeni graf pofital z linearno premico:
h is to g r a m
p r ih o d o v fo to n o v v d e te k to r v o d v is n o s ti o d c a s o v n e g a in te r v a la m e d n jim i ( d a to te k a " In te r v a l.d a t" ) p o d a tk i m e r ite v lin e a r n a z v e z a y = - 0 ,0 0 3 2 6 x + 5 ,8 8 7
ln(število prihodov fotonov)
6
3
0
p o d a tk i z v e lik o n a p a k o ( o u tlie r s ) 0
1 0 0 0
d o l z i n a c a s o v n e g a i n t e r v a l a [ µs ]
Iz ˇcesar sledi: k = −λ = −0, 00326 in n = 5, 887 = ln(A) −→ A = 360, 323. Iskana eksponentna funkcija je torej: w = 360, 323 · e−0,00326·x .
4
2 0 0 0
Naˇs histogram z izraˇcunano najboljˇso eksponentno funkcijo izgleda:
h is to g r a m
p r ih o d o v fo to n o v v d e te k to r v o d v is n o s ti o d c a s o v n e g a in te r v a la m e d n jim i ( d a to te k a " In te r v a l.d a t" )
3 0 0
število prihodov fotonov
h is to g r a m p o r a z d e lite v fo to n o v f(x ) = 3 6 0 ,3 2 3 * e x p (-0 ,0 0 3 2 6 * x )
2 0 0
1 0 0
0
0
1 0 0 0
2 0 0 0
3 0 0 0
d o l z i n a c a s o v n e g a i n t e r v a l a [ µs ]
Komentar: Pravilneje bi bilo, ˇce bi izbral ˇstevilo predalˇckov tako, da nebi bila vrednost nobenega 0. ˇ bi histogram po predalˇcenju tudi normiral, bi bila izraˇcunana vrednost λ enaka, To je pri n=11. Ce drugaˇcna bi bil le koeficient A, kateri funkcijo reztegne ali skrˇci v smeri y osi.
Dodatek: Navodilo naloge nas spraˇsuje tudi o primerjavi med koeficientom λ in povpreˇcno vrednostjo y¯ histograma. emo, da se slednjo izraˇcuna kot (delal sem z Excelomin Originom): 1 y¯ = P (”BinCenter” × ”RelativeF requency”) V mojem primeru (25 predalˇckov) tako dobljena vrednost λ znasa 0,00321 kar se dobro ujema s prvotno izracunano vrednostjo. Pogledal sem ujemanje tudi za druge n-je. Za n=5 je enaˇcba iskane funkcije: w = 1225, 4 · e−0,00262·x in znaˇsa λ izraˇcunana iz histograma 0,00344 kar je ˇze nekoliko veˇcje odstopanje od prave vrednosti.
5
Naloga 4 Navodila Teorija kemijske kinetike napove za sigmoidno krivuljo iz podatkov ”Adrenalin.dat”(naloga 1.1) naslednjo odvisnost F/Fmax = c/(a + c), kjer pomeni a koncentracijo s poloviˇcnim maksimalnim uˇcinkom. Doloˇci koeficienta Fmax in a. Pretvori v linearno zvezo - ena pot je uvedba reciproˇcnih spremenljivk 1/F in 1/c, druga pa je uvedba spremenljivke c/F . Rezultati Pri tej nalogi nisem bil najbolj siguren v pravilnost reˇsevanja, saj nam datoteka z meritvami podaja le deleˇz sile v %, ne pa same sile v N . Nalogo sem potem reˇsil na naˇcin kot nam je pri predavanju povedal prof. Kodre. Vse podatke sem si pripravil v programu Excel, narisal ter fital pa z vgrajeno funkcijo v programu Origin. Opomba: Vrednosti Fmax in a sem izraˇcunal na obe naˇcina, ki sta opisana v navodilih.
(I) uvedba spremenljivke c/F : c F = Fmax a+c
preoblikujemo v
c 1 a = ·c+ . F Fmax Fmax
Tako si pripravimo tudi podatke, ter narisemo graf in doloˇcimo premico z najboljˇsim lineranim ujemanjem:
g r a f k o n c e n tr a c ije /s ilo v o d v is n o s ti o d k o n c e n tr a c ije ( d a to te k a " A d r e n a lin .d a t" ) p o d a tk i lin e a r n a z v e z a y = 0 ,0 0 9 7 6 x + 0 ,2 2 1 8
c / F [ ( µg / L ) / % ]
1 0
5
0
0
5 0 0
1 0 0 0
c [ µg / L ]
Velja: k=
1 Fmax
−→
Fmax = 102, 46 N
in
6
n=
a Fmax
−→
a = 22, 73
µ L
(II) uvedba spremenljivk 1/F in 1/c: Pri tem naˇcinu naˇs zaˇcetni izraz dobi obliko: a 1 1 = ·c+ F Fmax Fmax Najprej sem si v Excelu ustrezno pripravil podatke, jih narisal in pofital v Originu. Za primerjavo sem naredil dva fita, enega za vse toˇcke in enega brez toˇck, za katere sem ocenil da preveˇc odstopajo od linearnega modela (v tem primeru je to zadnja tocka):
g r a f r e c ip r o c n ih v r e d n o s ti s ile v o d v is n o s ti o d k o n c e n tr a c ije r a z to p in e ( d a to te k a " A d r e n a lin .d a t" ) p o d a tk i m e r ite v lin e a r n a z v e z a y = 0 ,3 4 5 x + 0 ,0 0 6 4 9 ( v s e to c k e ) lin e a r n a z v e z a y = 0 ,1 9 6 x + 0 ,0 0 9 6 8 ( b r e z z a d n je )
1 /F [1 /% ]
0 ,0 6
0 ,0 4
0 ,0 2
0 ,0 0
0 ,0 4
0 ,0 8
0 ,1 2
0 ,1 6
1 / c [ 1 / ( µg / L ) ]
kjer velja:
k=
a Fmax
in
n=
1 Fmax
Ko izracunamo Fmax in a za oba primera fitanja, dobimo: -uporaba vseh toˇck: Fmax = 154, 08 N in a = 53, 16
µg L
-brez ”outliersev”(pravilnejˇsi rezultat): Fmax = 103, 31 N in a = 20, 25
µg L
Komentar: Vidi se, da je pravi naˇcin tisti, pri katerem sem odstranil zadnjo toˇcko (ki je izjemno odstopala). Tako dobljeni rezultati se zelo dobro ujemajo z rezultati dobljenimi s prvim naˇcinom.
7
Graf naˇse funkcije izraˇcunane po obeh naˇcinih v primerjavi z originalnimi podatki izgleda nekako takole:
g r a f m e r ite v in iz r a c u n a n ih fit fu n k c ij ( d a to te k a " A d r e n a lin .d a t" )
5 0
F /F
m a x
[% ]
1 0 0
p o d a tk i m e r ite v fu n k c ija n a r is a n a p o p r v e m n a c in u fu n k c ija n a r is a n a p o d r u g e m n a c in u 0
0
5 0 0
1 0 0 0
k o n c e n t r a c i j a ( µg / L )
Funkcija v parih toˇckah nekoliko odstopa (verjetno ker nisem upoˇsteval nekaj toˇck), ˇse boljˇse ujemanje pa se vidi ˇce ga narisemo v logaritemski skali.
8