Y
F T ra n sf o
A B B Y Y.c
bu to re he
om
PËRDORIMI I RRJETAVE NEURONIKE PËR PARASHIKIMIN E NDRYSHIMEVE KOHORE DHE HAPËSINORE TE FUSHËS GJEOMAGNETIKE Përgatiti:
Studenti diplomant: Niko Hyka
[email protected] Udhëheqës Diplome: Prof.Dr. Bejo Duka
[email protected]
Departamenti i Fizikës Fakulteti i Shkencave Natyrore, FSHN
Tiranë, Qershor 2007
C
REPUBLIKA E SHQIPËRISË
lic
k
he k lic C w.
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
PËRMBAJTJA Hyrje....................................................................................................................................4
Kapitulli 1 1. Rrjetat neuronike 1.1. Ç’janë rrjetat neuronike..............................................................................................6 1.2. Ndërtimi i modeleve neuronike. 1.2.1. Neuroni i thjeshtë......................................................................................................7 1.2.2. Funksionet e transferimit..........................................................................................9 1.3. Arkitektura e rrjetes 1.3.1. Shtresat neuronike. Analiza e termave………………...........................................10 1.3.2. Inicjimi, trajnimi dhe simulimi i rrjetës neuronike................................................13 1.3.3 Rrjetat neuronike parashikuese Feed-forward backpropagation. Algoritmi i llogaritjes së peshave.............................................................................................14 1.3.4. Metodat e trajnimit të rrjetave feed-forward. Metoda standarte...........................17 1.3.5. Metoda të tjera trajnimi të rrjetave feed-forward...................................................19
Kapitulli 2 2.1. Koncepte të përgjithshme të fushës magnetike..........................................................22 2.2. Njohja me modelet e fushë magnetike......................................................................24 2.3. Seritë kohore të fushës magnetike. Metodat e parashikimit.....................................30
Kapitulli 3 Zbatimi i serive kohore të fushës gjeomagnetike 3.1. Ndërtimi i modelit neuronik për parashikimin e fushës magnetike............................32 3.2. Aplikimi i metodës së parë për gjetjen e rrjetës më të mirë parashikuese..................33 3.3. Aplikimi i metodës së dytë për gjetjen e rrjetës më të mirë parashikuese. Krahasimi i dy metodave të zbatuara..........................................................................41 3.4. Aplikime të modelit neuronik në parashikimin e vlerave reale të fushës gjeomagnetike....................................................................................................................46
2
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Kapitulli 4 Parashikimi global i fushës magnetike 4.1. Vlerat reale të fushës magnetike të matura nga observatorët dhe përpunimi i tyre....49 4.2. Krijimi i observatorëve imagjinarë.............................................................................50 4.3. Parashikimi i fushës magnetike globale për periudhën kohore 2005 – 2015 4.4. Ndërtimi i izolinjave të fushës magnetike. Evoluimi i fushës magnetike globale 2005 – 2015........................................................................................................................59
Kapitulli 5 5.1. Konkluzionet..............................................................................................................66 5.2. Referencat..................................................................................................................67 5.3. Shtojcë........................................................................................................................68
3
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Hyrje Njohja me ecurinë e fenomeneve apo e madhësive të ndryshme, gjithmonë ka qënë një preokupim për kërkuesit shkencorë. Këtu nuk bëhet fjalë për madhësitë që kanë një evoluim linear, por për madhësi të cilat kanë një ecuri jo lineare. Fusha magnetike e Tokës është një nga ato fusha, komponentet e së cilës ndryshojnë vazhdimisht me kohën. Duke qenë se mekanizmat e gjenerimit të kësaj fushe, qoftë ato të brendëshëm (në bërthamën fluide të Tokës), qoftë ato të jashtëm (si era diellore), kanë një dinamikë jo lineare, variacionet kohore të fushës gjeomagnetike kanë natyrë shumë të çrregullt. Janë ndërtuar shumë modele të cilat japin një ecuri të përafruar të fushës si psh. IGRF, Modeli Gufm1, WMM2005 etj. Gjithsesi këto modele japin rezultate të kënaqshme për aq kohë sa nuk ndodhin fenomene të jashtëm të cilët nuk mund të parashikohen dhe që influenca e tyre në vlerat e fushës eshtë relativisht e madhe. Përmendim këtu ndikimin e stuhive diellore në vlerat e fushës magnetike në një pikë të Tokës apo dhe zona të veçanta të globit ku fusha magnetike pëson çrregullime të vazhdueshme. Këto modele japin edhe parashikime të ndryshimeve të fushës magnetike që arrijë në disa vjet P.sh, modeli IGRF (International Geomagnetic Reference Field) arrin parashikime për fushën kryesore deri në 5 vjet dhe modeli përpunohet çdo 5 vjet në bazë të matjeve të grumbulluara nga observatorët gjeomagnetikë dhe matjeve satelitore të fushës gjeomagnetike. Para disa vitesh, një punim i kryer nga Prof. B. Duka [7], [8], [10], realizoi modelime të parashikimit të variacioneve shekullore të fushës gjeomagnetike në observatorë të veçantë në Europë duke përdorur ekuacione të dinamikës jolineare. Por tentativa e tij për ta shtrirë këtë formë modelimi për të gjithë globin nuk u realizua, qoftë për arsye të vështirësive të mëdha, qoftë edhe për mungesën e një metodike të qartë të zgjedhjes së formës ekuacioneve dinamikë. Prandaj, ai inicioi këtë punim, qëllimi i të cilit është të tregojë se cilat janë mundësitë e përdorimit të rrjetave neuronike në arritjen e parashikimeve më afatgjata të fushës gjeomagnetike në të gjithë globin. Rrjetat artificiale neuronike, që ne kemi përdorur, janë pjesë e paketës software ‘Matlab’, pronë e kompanisë Mathworks1. Rezultatet e arritura nga ky studim ishin të kënaqshme por nuk duhet menduar se janë më të mirat e mundshme. Kjo për shkak të kohës së shkurtër të studimit, si edhe të numrit të pakët të observatorëve gjeomagnetikë që kanë seri të gjata kohore (disa dhjetëvjeçarë) regjistrimesh koherente të komponeneteve të fushës gjeomagnetike. Ne kemi operuar me vlerat mesatare vjetore të këtyre regjistrimeve të cilat janë të publikuara në Internet [15], për të gjithë Observatorët gjeomagnetikë të Globit të njohur nga IAGA (International Association of Geomagnetism and Aeronomy). Aplikimi i rrjetave neuronike po njeh zhvillim shumë të madh në ditët e sotme, në veçanti ato përdoren shumë në studimin e serive kohore të madhësive nga më të ndryshmet. Prandaj edhe aplikimi i tyre në parashikimet e ecurisë së afërt të serive kohore të 3 komponenetve të fushës gjeomagnetike në një pikë të globit, nuk përbën ndonjë risi të re, pavarësisht se nuk është përdorur më parë. Por e reja është se duke studjuar sjelljen kohore të serive të vlerave të simuluarar nga modele të ndryshme, ne kemi testuar rrjetat neuronike, për të arritur tek ato rrjeta që realozojnë më mirë qëllimin 1
www.mathworks.com
4
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
tonë. Përveç kësaj, e reja e këtij punimi është se për herë të parë rrjetat neuronike zbatohen për plotësimin e vlerave të munguara në seritë kohore të vrojtimeve në obseravtorë të ndryshëm, dhe sidomos ajo që është më e rëndësishme, për krijimin e të ashtuquajtuarve “observatorë imagjinarë” në pikat e globit ku faktikishit mungojnë observatorët gjeomagnetikë ose dendësia e tyre e tyre është mjaft e vogël. Kjo e fundit është ndoshta arritja dhe vlera më e madhe e këtij punimi, sepse në bazë të këtyre observatorëve realë dhe “imagjinarë”, është trajnuar rrjeta neuronike me vlerat përkatëse të fushës gjeomagnetike në të gjithë globin dhe më pas është kryer parashikimi i variacionit të saj në dhjetëvjeçarin e ardhshëm. Materiali që paraqitet këtë punim, mund të shërbejë si një bazë e mirë për këdo që kërkon njohuri mbi ndërtimin, funksionimin dhe përdorimin e rrjetave neuronike. Në Kapitullin I, jepet një përshkrim i shkurtër mbi rrjetat neuronike. Si janë ndërtuar dhe si ato funksionojnë. Vazhdohet me përshkrimin e rrjetave parashikuese duke analizuar në hollësi funksionimin e tyre, algoritmet që përdoren për trajnimin e rrjetave dhe si realizohet parashikimi. Në Kapitullin II jepen disa koncepte bazë mbi fushën magnetike të Tokës, seritë kohore të komponentëve të saj si dhe disa modele të njohura si p.sh modeli Gufm1 dhe IGRF. Në kapitullin III, zbatohen rrjeta të ndryshme neuronike për seri të gjata kohore të fushës magnetike të llogaritura nga modeli Gufm1. Zbatohet modeli neuronik në një rast konkret me vlerat reale të fushës magnetike Në Kapitullin IV paraqitet përpunimi i vlerave të fushës magnetike të matura nga observatorët dhe janë gjeneruar observatorë “imagjinarë”. Në fund është bërë parashikimi i vlerave të fushës magnetike globale për një periudhë 10-vjeçare. Evoluimin në kohë nga 1960.5 – 2015.5, është paraqitur me anën e izolinjave.
5
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Kapitulli 1 Në këtë kapitull do të përqëndrohemi kryesisht në ndërtimin e rrjetave neuronike. Do të bëhet një analizë e përgjithshme mbi rrjetat neuronike dhe më pas do të kalohet në modelin e rrjetave parashikuese. Synimi ynë kryesor është njohja sa më mirë e funksionimit të modeleve parashikuese të rrjetave neuronike, me qëllimin e vetëm, marrja e rezultateve sa më të mira në parashikimin e fushës magnetike. Për këtë arsye, përshkrimi që do të bëjmë nuk do të kalojë në analiza të thella matematikore, përveç disa rasteve ku do të flitet për modelin e rrjetave parashikuese. Falë zhvillimit dhe aplikimit të rrjetave neuronike në vitet e fundit, ekziston një literaturë e gjërë dhe e bollshme që shpjegon deri në detaje ndërtimin dhe funksionimin e tyre, prandaj është e lehtë për këdo që kërkon të zgjerojë njohuritë e tij në këtë fushë. Në këtë material ne jemi mbështetur kryesisht në botimin ‘Neural Network Toolbox’ të autorëve: Howard Demuth dhe Mark Beale.
1. Rrjetat neuronike 1.1. Ç’janë rrjetat neuronike Rrjetat neuronike janë bashkësi neuronesh të organizuara në shtresa. Çdo neuron paraqet një funksion i cili duke vepruar mbi një hyrje/input vlerash të madhësive skalareose vektoriale jep një dalje/output vlerash të tjera. Këto output-e varen qoftë nga forma e funksionit transferues, qoftë edhe nga “peshimi” që i jepet vlerave hyrëse, para se mbi to të veprojë funksioni i transferimit. Ideja e ndërtimit të rrjetave neuronike është bazuar në ndërtimin dhe funksionim e trurit të njeriut i cili është i përbërë nga një numër shumë i madh nyjesh nervore që lidhen midis tyre me anën e sinapseve. Në këtë analogji, Neuronet – janë analogët e nyjeve nervore, Koefiçientët peshë – janë ekuivalentë e sinapseve nervore, ndërsa Funksionet e transferimit – kryejnë një funksion analog me atë të përpunimit që truri i bën sinjalit nervor. Një ose disa neurone përbëjnë shtresën neuronike dhe më shumë se një shtresë neuronike përbën të ashtuquajturën ‘Rrjetë Artificiale Neuronike’/ Artificial Neural Networks/ ANN. Neuronet e së njëjtës shtresë nuk lidhen me njëri-tjetrin, ndërkohë që neuronet e shtresave të tjera lidhen midis tyre me anën e peshave neuronike. Sinjali hyrës në një rrjetë neuronike, shpërhapet në të gjithë neuronet e rrjetës njëkohësisht, ashtu si një informacion shpërhapet në nyjet nervore të trurit të njeiut. Funksionimi në paralel është tipari kryesor i rrjetave neuronike. Të gjithë elementët përbërës të rrjetës neuronike do të analizohen hollësisht më poshtë për të dhënë një ide më të qartë mbi ndërtimin dhe funksionin e tyre.
6
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1.2 Ndërtimi i modeleve neuronike. 1.2.1. Neuroni i thjeshtë. Një neuron i thjeshtë paraqitet në fig.1.2.1.a). p është një skalar i cili nëpërmjet një lidhje shumëzimi me skalarin peshë w (weight), jep produktin w × p i cili është përsëri një skalar. Vlera në hyrje w × p është argumenti i vetëm i funksionit të transferimit f, i cili jep në dalje skalarin a. Në figurë janë treguar elementët përbërës e një neuroni të thjeshtë me simbolikën përkatëse të cilat do të shpjegohen në vijim. a
n
a = f(w.p)
dalje
hyrje
P
W
f
Fig.1.2.1.a) Ndërtimi i një neuroni të thjeshtë i cili ka si vlerë hyrëse një skalar. Elementët përbërës të tij janë: p, w, f dhe a.
Σ
f
a
dalje
hyrje
P
W
b
1
a = f(w.p+b)
Fig.1.2.1.b. Skema e ndërtimit e neuronit të thjeshtë i cili ka si vlerë hyrëse një skalar por i shtohet devijuesi b.
Neuroni në fig.1.2.1.b) ka një skalar devijues (bias) b i cili i shtohet në pikën e takimit termit wp, pikë e cila është treguar me veprimin e shumës. Devijuesi b është si një hyrje shtesë me peshë 1. Termi rezultant i dalë nga veprimi i mësipërm i shënuar me n, është përsëri një skalar i cili shërben si hyrje e funksionit transferues f, dhe është argumenti i këtij funksioni. Funksioni i transferimit f paraqet një funksion linear ose jo (zakonisht merret sigmoid, tansig etj) që transformon argumentin n në hyrje për të dhënë në dalje parametrin a. w dhe b janë parametra rregullues/adxhustues të neuronit. Ideja kryesore e nje rrjete neuronike është që secili parametër të rregullohet në mënyrë të tillë që përfundimet e marra të jenë të kënaqshme. Kështu, ne mund të trajnojmë rrjetën për të bërë një punë të veçantë duke rregulluar peshat w, parametrat b ose ndoshta rrjeta i përshtat këta parametra në mënyrë të tillë që përfundimi të jetë sa më i mirë. Të gjitha rrjetat neuronike e përdorura në Matlab kanë të përfshirë devijuesin b, por kjo nuk do të thotë se është i domosdoshëm përdorimi i tij. Në shumë shembuj të tjerë
7
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
inicjimi i tij është zero. Kjo varet nga rrjeta e përdorur dhe specifika e problemit, p.sh në rastet kur konsiderojme filtrat linearë përdorimi i b është i domosdoshëm. Le të supozojmë se në hyrje të një neuroni kemi një vektor në vend te skalarit p. Një neuron me një vektor në hyrje me R elementë shënohet, p1 , p 2 ,... p R , ku secili element në hyrje është shumëzuar me peshat përkatëse w1,1 , w1, 2 ,...w1, R , dhe këto të fundit shumohen në pikën e takimit. Kjo shumë është w.p, produkti midis vektorit shtyllë p dhe rrjeshtit të matricës peshë W (indeksi i parë i matricës tregon neuronin) Argumenti në këtë rast shkruhet: n = W*p + b. Duhet thënë se w njihen me emrin funksionet peshë ose koefiçintët peshë dhe identifikohen si ‘sinapset’ e rrjetve neuronike. Pra, ashtu si nyjet nervore në trurin e njerut lidhen me anën e sinapseve, tek rrjetat neuronike elementet lidhen me njëri-tjetrin me anën e peshave. Peshat janë vlera (fillimisht tw inicjuara e mandej tw llogaritura) qw dalin nga funksione të tilla si shuma e katrorëve të devijimit midis vlerave të hyrjes (input) dhe vlerave të daljes (output). W1.1
P
n = wp+b
W1.2 . . W1.r
1
P 2
. .
a
f
Σ b
1
hyrje
a = f(w.p+b)
dalje
Fig.1.2.2 Skema e neuronit të thjeshtë që ka në hyrje një vektor.
Në fig.1.2.2 janë treguar të gjitha detajet e një neuroni të vetëm. Kur konsiderojmë një rrjetë me shumë neurone dhe ndoshta me shumë shtresa neuronike, numri i madh i detajeve, çon në devijim ose humbje të linjës kryesore për të cilën është ndërtuar rrjeta. Prandaj, janë sajuar shkurtime për të mos mbingarkuar strukturën e rrjetës neuronike.
P 1
P
hyrje
P Rx1
2
. .
.
1
f
W 1xR
Σ
n 1x1
a 1x1
dalje
b a = f(w.p+b)
1
Neuroni Fig.1.2.3. Paraqitja skematike e neuronit të thjeshtë pas shkurtimeve të bëra më sipër.
Vektori në hyrje p, është paraqitur në të majtë me anën e një shiriti vertikal. Dimensionet e vektorit p në figurë tregohen si Rx1.
8
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Do të përdorim një shkronjë kapitale p.sh R, për të treguar dimesionin e një vektori. Kështu, p është një vektor prej R elementësh në hyrje. Këto elementë në një vektor shtyllë p, shumëzojnë një rresht të vetëm R të matricës W.
1.2.2. Funksionet e transferimit. Në Matlab janë përfshirë shumë funksione transferimi. Lista e plotë e këtyre funksioneve gjendet në TFG ( transfer function graphs). Tre funksionet më të përdorshëm janë dhënë më poshtë. 1. Funksioni transferues hard-lim njihet me emrin ‘funksioni shkallë’ dhe kufizon vlerat në dalje të neuronit midis 0 dhe 1. N.q.se argumenti hyrës në f është n ³ 0 , limiti është 1, dhe është 0 n.q.se argumenti është n p 0 . 2. Funksioni i transofmimit linear ‘Linear Transfer Function’. ‘purelin’ →Linear → f ( x ) = f 0 ( x) = x . Neuronet e këtij tipi përdoren si përafrues linearë në Filtrat Linearë ADALINE. 3. Funksioni i transformimit sigmoid, merr në hyrje të gjitha vlerat e intervalit ]- ¥,+¥[ dhe i kufizon ato në dalje brenda intervalit ]0,1[ për funksionin transferues logsig dhe brenda intervalit ]-1, 1[ për funksionin transferues tansig. Këto dy funksione transferues përdoren shpesh në rrjetat feed-forward në të cilat përdoret algoritmi i llogaritjes së peshave “backpropagation”. Meqënëse në këtë algoritëm përdoren derivatet e para të funksioneve transferues, kushti kryesor është që këta funksione të jenë të derivueshëm. 1 ‘logsig’ → Logistic Sigmoid → f ( x ) = f 0 ( x ) = . 1 + e-l x ¶f ( x ) f ' ( x) = = lf ( x )[1 - f ( x )] . ¶x el x - e - l x ‘tansig’ → Hyperbolik Tangent Sigmoid → f ( x ) = f 0 ( x) = l x - l x . e +e ¶f ( x ) f ' ( x) = = l[1 - f 2 ( x )] . ¶x Në strukturën e rrjetave neuronike, shpesh shënimi i funksionit f zvëndësohet me ikonat e mëposhtme për të bërë më të qartë rolin e këtyre funksioneve transferues.
Fig.1.2.2 Ikonat e tre prej funksioneve transferues më të përdorshëm
9
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1.3. Arkitektura e rrjetës 1.3.1 Shtresat neuronike Dy ose më shumë neurone mund të kombinohen në një shtresë, dhe një rrjetë e veçantë mund të përmbajë një ose më shumë shtresa të tilla. Fillimisht le të konsiderojmë një shtresë neuronike. Një rrjetë një shtresore me R elementë në hyrje dhe me S neurone jepet në fig.1.3.1. Në këtë rrjetë çdo element i vektorit p në hyrje, është lidhur me secilin neuron hyrës nëpërmjet matricës peshë W . Elementët e matricës peshë W jepen në fig 1.3.2. .
Fig.1.3.1Paraqitja skematike e një shtrese neuronike.
Fig 1.3.3. Elementët e matricës peshë W
Elementët e vektorit futen në rrjetë nëpërmjet matricës peshë W .
Fig.1.3.3.
Theksojmë që, indekset e rreshtit në elementet e matricës W tregojnë destinacionin neuronik te peshës, (pra indeksi rrjesht tregon neuronin me të cilin do të lidhet pesha).
10
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Indekset e shtyllës tregojnë se kush janë burimet hyrëse të këtyre peshave. Kështu, w1,2 tregon vlerën e peshës që lidhet me elementin e dytë tw vektorit hyrws, me destinacion neuronin e parë. S neurone dhe R elementë hyrës të vektorit p në një rrjetë njështresore paraqiten me shënime të shkurtuara. p është një vektor me gjatësi R, W është një SxR matricë, a dhe b janë vektorë me gjatësi S. Pra, shkurtimisht shpjeguam se në një shtresë neuronike përfshihen: matrica e peshave, veprimet e shumëzimit dhe shumës, vektori ndikues b dhe funksionet e transferimit. Kombinimi i dy ose më shumë shtresave përbën rrjetën neuronike. Çdo shtresë ka një matricë peshë W, një vektor ndikues b, dhe vektorin që merret në dalje a. Për të bërë dallimin midis matricave peshë, vektorëve a, etj, (për secilën shtresë në figurë) do të shtojmë një indeks lart i cili do të tregojë numrin e shtresës së cilës i përket variabli që na intereson. E thënë ndryshe, duhet të bëjmë një dallim midis matricave peshë të cilat janë të lidhura në hyrje dhe matricave peshë që janë të lidhura midis shtresave. Gjithashtu duhet të identifikojmë burimin dhe destinacionin për një matricë peshë. Do të quajmë matricat peshë të lidhura në hyrje si pesha hyrëse, dhe do të quajmë pesha të shtresës matricat peshë që dalin nga shtresat. Gjithashtu, do të përdorim indekset lart për të identifikuar burimin (indeksi i dytë) dhe destinacionin (indeksi i parë) për peshat e ndryshme dhe elementë të tjerë të rrjetës. Për ilustrim është marrë një rrjetë njështresore e treguar më parë por e rivizatuar me shkurtimet e mësipërme.
Fig.1.3.3. Skema e një rrjete njështrsore pas shënimeve të reja
Siç shihet, kemi etiketuar matricën peshë të lidhur me vektorin p si matrica peshë hyrëse (Input Weight matrix IW 1,1 , matrica me peshat fillestare që lidhen me vlerat hyrëse) që ka si burim 1 dhe si destinacion 1. Gjithashtu, elementët e shtresës një si p.sh vektori b, n dhe a kanë indeksin 1 lart për të treguar se të gjithë këta elementë i përkasin shtresës së parë. Në pjesën tjetër do të përdorim matricën peshë të shtresës (Layer Weight) ashtu si Input Weight matrices IW, (LW janë koefiçintët peshë e të gjithë neuroneve që përmban një shtresë neuronike). Shënimi që përdoret në këtë rast në Matlab për një peshë të dhënë është: IW1,1 ® net.IW {1,1} . Kështu, për të marrë argumentin n të funksionit të transferimit, duhet të shkruajmë kodin: n {1} = net.IW {1,1} * p+net.b {1,1} ;
11
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
hyrje
shtresa 1
shtresa 2
shtresa 3
dalje
Fig.1.3.4. Ndërtimi i një rrjete neuronike tre shtresore. Në të janë paraqitur të gjithë elementët e saj së bashku me relacionet e transformimit.
Rrjeta e treguar në fig.1.3.4, ka R1 input-e, S1 neurone në shtresën e parë, S2 neurone në shtresën e dytë, etj. Është e zakonshme që shtresa të ndryshme të kenë numër të ndryshëm neuronesh.. Theksojmë që daljet e çdo shtrese të ndërmjetme shërbejnë si hyrje për shtresën pasardhëse. Kështu, shtresa 2 mund të analizohet si një rrjetë një shtresore me S1 input-e, S2 neurone dhe një matricë peshë W me përmasa S1xS2 . Hyrja e shtresës 2 është vektori a1 dhe dalja është vektori a2. Një shtresë që jep daljet e rrjetës quhet shtresë e dalëse. Të gjitha shtesat e tjera quhen shtresa të fshehura. Në fig.1.3.4. (që është dhënë më sipër), ka një shtresë dalëse (shtresa 3) dhe dy shtresa të fshehura ( shtresat 1 dhe 2). E njëjta rrjetë e treguar më sipër, me shënimet e reja paraqitet në fig.1.3.5. së bashku me ekuacionin përkatës. hyrje
shtresa 1
shtresa 2
shtresa 3
dalje
Fig.1.3.5. Paraqitja skematike e rrjetës tre shtresore të fig.1.3.4 pas shënimeve të reja.
12
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Ndërtimi i rrjetave është kombinim i thjeshë i neuroneve, pra peshave, vektoreve zhvendosës, funksioneve të transferimit etj. Por e veçanta në ndërtimin e rrjetës qëndron në funksionin që ajo do të kryejë. Nisur nga ky funksion, rrjetat ndahen në rrjetat e perceptimit, rrjetat e parashikimit etj. Këto të fundit janë përdorur në studimin tonë dhe do të trajtohen gjërësisht.
1.3.2 Inicjimi, trajnimi dhe simulimi i rrjetës neuronike Tani ndodhemi në situatën e funksionimit të rrjetës neuronike. Sigurisht kjo është dhe pjesa më specifike e problemit, pasi kërkon të njihet me përpikmëri ndërtimi dhe funksioni për të cilin është ndërtuar rrjeta. Zakonisht janë tre etapa nëpër të cilat kalon proçesi i funksionimit të rrjetës. Inicjimi
Inicjimi i rrjetës ka të bëjë me inicjimin e peshave fillestare W dhe të devjuesit b. Meqënëse e përmendëm më sipër që W, b janë parametra rregullues të brendshëm të rrjetës, ata fillimish inicjohen në vlera të rastësishme dhe gjatë trajnimit të rrjetës ato korigjohen duke bërë të mundur që në fund të proçesit të trajnimit të jenë gjeneruar koeficintë peshë të tillë të cilët duke u lidhur me vlerat që simulojnë rrjetën, të na japin në dalje të saj rezultatin më të mirë të mundshëm. Fillimisht peshat fillestare janë të rendit 10-3 - 10-4 dhe më pas gjatë trajnimit ato korigjohen vazhdimisht. Gjithashtu, inicjimi i peshave mund të bëhet brenda një intervali vlerash të caktuar duke bërë të mundur që peshat fillestare të jenë të rendit që ne dëshirojmë, kjo në varësi të specifikës së problemit për të cilin do të përdoret rrjeta neuronike. Trajnimi
Trajnimi është proçesi më i rëndësishëm i funksionimit të një rrjete neuronike. Kjo për faktin se vetëm gjatë këtij proçesi rrjeta krijon një funksion F të vetin me anën e të cilit sinjali hyrës të transformohet në mënyrë të tillë që difrenca e sinjalit në dalje me diferencës e sinjalit të synuar të jetë minimale. Me fjalë të tjera, proçesi i trajnimit mund të quhet si një ‘cikël’ i brendshëm i rrjetës gjatë të cilit llogariten koeficientë peshë W. Për trajnimin e rrjetave neuronike ekzistojnë një numër i madh funksionesh trajnues si p.sh trainbr, trainbfg, trainlim, trainos etj, të cilët funksionojnë në bazë të algoritmeve të veçantë. Ne do të përqëndrohemi në disa nga algoritmat kryesore të trajnimit në paragrafin pasardhës dhe do të tregohet se si bëhet llogaritja e peshave. Simulimi
Simulimi është proçesi i fundit i fuksionimit të rrjetave neuronike. Me simulim do të kuptojmë ‘ekzekutimin’ e rrjetës së trajnuar. Gjatë këtij proçesi, bëhet simulimi i rrjetës së trajnuar me vlera të ndryshme nga ato me të cilat ajo është trajnuar dhe merren në dalje të saj vlerat dalëse të rrjetës ose output-et. Është e rëndësishme të kuptohet se në
13
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
proçesin e simulimit, ne nuk mund të ndikojmë në rezultatin përfundimtar që merret në dalje të rrjetës, pasi vetë rrjeta në fund të proçesit të trajnimit, ka krijuar një funksion të sajin transferues i cili është relacioni që lidh vlerat me të cilat do të simulohet rrjeta me vlerat e synuara. Y = F(X) ku: Y → vlerat dalëse të rrjetës, F → funksioni me të cilin rrjeta lidh vlerat hyrëse dhe ato dalëse, X → vlerat hyrëse.
1.3.3 Rrjetat neuronike parashikuese Feed-forward backpropagation. Në përgjithësi, modelet parashikuese bazohen gjërësisht në rrjetat shumështresore të quajtura ‘Multi–Layer feed-forward’, me algoritëm të llogaritjes së peshave, ‘backpropagation’2. ‘Backpopagation’, është një algoritëm i gradientit zbritës në të cilin peshat e rrjetës zhvendosen përgjatë anës negative të gradientit të funksionit të performancës3. Në fakt, modeli parashikues përbëhet nga dy mekanizma bazë, forward/përpara dhe backward/prapa. Secili mekanizëm ecën vetëm sipas një drejtimi, pa patur devijime apo feedback-ë . Në drejtimin e parë, i cili është dhe kahu drejtë , vlerat hyrëse lidhen fillimisht me peshat fillestare dhe më pas në dalje të rrjetës merret Y . Mekanizmi i dytë është më kompleks. Sinjali (që në këtë rast është gabimi i rrjetës) ecën në drejtim të kundërt me atë të sinjalit hyrës,. Në këtë fazë llogaritet gabimi i rrjetës dhe llogariten peshat e reja W. Në tërësi mekanizmi njihet me emrin ‘backpropagation’ dhe rrjetat neuronike që bazohen në këtë model njihen me emrin ‘Feed-forward backpropagation’.
2
Është një përgjithësim i metodës së Widrow-Hoff për të cilën do të flasim më poshtë. Funksionet e performancës (efektshmërisë) janë disa por më të rëndësishmit janë: mae - Mesatarja e gabimeve absolute (Mean absolute error performance function) dhe Performance Derivative Function -dmae mse - mesatarja e katërorëve të gabimit (Mean squared error performance function) dhe Performance Derivative Function - dmse msereg - Mesatarja e katërorëve të gabimit me regularizim (Mean squared error with regularization performance function) dhe Performance Derivative Function -dmsereg. sse - Shuma e katërorëve të gabimit (Sum squared error performance function) dhe Performance Derivative Function dsse. 3
14
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Një skemë e dy mekanizmave të mësipërm jepet në fig .1.3.3.1 hyrje
j
i
dalje
k
Kalimi i drejtë
• pesha të fiksuara w (n) • llogariten y (n) ji
x
y
j
Kalimi i kundërt
• llogariten d (n) • rillogariten peshat w (n+1) j
ji
dalje
i
j
k
hyrje
Fig .1.3.3.1 Shkurtimisht, në këtë skemë paraqitet një rrjetë me disa shtresa. Lart tregohet ecuria në kahun e drejtë e sinjalit të rrjetës dhe poshtë ecuria në të kundërt e gabimit të rrjetës.
Algoritmi i llogartjes së peshave
Rrjetat feed-forward funksionojnë në bazë të algoritmit ‘backpropagation’4, skema e të cilit është dhënë në fig 1.3.3.1. Peshat e reja llogariten në drejtim të kundërt me drejtimin e vlerave hyrëse. Për ilustrim, rrjetën e përgjithsuar më sipër e kemi marrë për një rast konkret. Ajo është e përbërë nga tre shtresa, dy shtresa të fshehura dhe një shtresë në dalje. Për secilin neuron të çdo shtrese, jepet skema e evoluimit të sinjalit hyrës dhe ekuacioni i sinjalit në dalje tij:
Fig.1.3.3.2 Vlerat hyrëse lidhen me peshat fillestare w dhe kalojnë në çdo neuron nga e majta në të djathtë ashtu siç është treguar në në dy skemat e mësipërme. Është dhënë vetëm neuroni i parë dhe neuroni në dalje të rrjetës, shoqëruar me ekuacionet e vlerave dalëse të neuroneve respektivë.
4
Në fakt ka disa variante të algoritmit backpropopagation, nga të cilët me i thjeshti adopton peshat dhe shmangësit sipas drejtimit në të cilin funksioni i performancës zbret me shpejt në drejtimit e gradientit negativ.
15
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Hapi tjetër i algoritmit është krahasimi i vlerës në dalje të rrjetës y me vlerën e dëshiruar z. Diferenca e midis këtyre dy vlerave jep gabimin e sinjalit . Më pas, d lidhet me peshën ekzistuese të neuronit të shtresës paraardhëse vazhdohet deri tek neuroni i fundit i shtresës hyrëse. Skematikisht ajo ç’ka u tha më lart, paraqitet:
Fig.1.3.3.3 Skematikisht tregohet ecuria e sinjalit ( d ) në kahun e kundërt, nga e djathta në të majtë shoqëruar me relacionet përkatëse të çdo kalimi (në figurë nuk janë paraqitur të gjitha kalimet).
Është e pamundur që të llogaritet direkt gabimi i sinjalit për neuronet e brendshëm sepse vlerat në dalje të këtyre neuroneve janë të panjohura. Për këtë arsye, për shumë vjet metoda e trajnimit ishte e panjohur. Vetëm në mesin e viteve 80 u bë i njohur algoritmi ‘backpropagation’. Kur sinjali i gabimit për secilin neuron është llogaritur, koefiçientët peshë për çdo neuron në shtresën hyrëse rillogariten. Modifikimi bëhet me anën e derivateve të para të funksionit f në lidhje me sinjalin hyrës në të (e). Kjo është arsyeja që funksionet f duhet të jenë të diferencueshëm. Atëhërë skema e llogaritjes së peshave të reja së bashku me ekuacionet përkatëse është dhënë në fig.1.3.4.4.
16
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Fig.1.3.3.4 Në skemat e figurës 1.3.4.4 tregohet llogaritja e peshave të reja
Koeficienti h në relacionet e mësipërme, përcakton hapin e ‘lërning’ të rrjetës dhe merr vlera midis zeros dhe njëshit. Ka disa metoda në zgjedhjen e këtij parametri. Metoda e parë është të fillohet metoda e ‘learning’ me vlerë të madhe të këtij parametri. Pasi koefiçientët fillestarë të peshave janë krijuar, vlera e parametrit h ulet gradualisht. Metoda e dytë është më e komplikuar. Kjo metodë nis proçesin e‘learning’, me vlerë të vogël h . Gjatë proçesit të trajnimit vlera e tij është duke u rritur dhe zvogëlohet përsëri në stadin final.
17
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Fillimi i trajnimit me vlera të vogla të h mundëson përcaktimin e shenjës së koefiçientëve peshë.
1.3.4. Metodat e trajnimit të rrjetave feed-forward backpropagation Metoda standarte Në përgjithësi trajnimi i rrjetës ashtu siç përmendëm më lart, është një proçes shumë i rëndësishëm. Kjo për faktin se synimi kryesor është arritja e një vlere sa më të saktë në dalje të rrjetës. Kjo saktësi nënkupton që rrjeta të ‘mos gabojë’ ose ky gabim të jetë sa më i vogel. Ka një numër variantesh të algoritmit bazë të cilat bazohen në teknikat e optimizimit standart siç janë: metoda e Njutonit dhe e metoda gradientit të konjuguar.[1] Në Toolbox gjenden disa variante të këtyre algoritameve. Për të analizuar këtë proçes të funksionimit të rrjetave parashikuese, le të marrim në konsideratë një rast më përgjithsues të një rrjete feed-forward. Metoda bazë e trajnimit të rrjetave feed-forward njihet me emrin metoda standarte e trajnimit Një rrjetë e tillë është paraqitur në fig.1.3.3.5.
Vj
w jk
x
W
ij
Oi k
Hyrja
Shtresat e fshehura
Dalja
Fig.1.3.3.5. Paraqitja skematike e një rrjete shumë shtresore feed-foward.
Në të dallohen: shtresa hyrëse, dalëse dhe shtresat e fshehura të cilat janë përcaktuar me k, j, i respektivisht. Për një kalim m , një neuron j në shtresën e fshehur, merr nga neuroni i ndodhur në shtresën hyrëse vlerën : x mj = å w jk x km + bk 1.3.1 k
18
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
ku x km
është sinjali hyrës në neuronin e k-të të shtresës hyrëse dhe w jk janë peshat
lidhëse midis neuronit j në shtresën e fshehur dhe neuronit k të shtresës hyrëse. bk është devijuesi i lidhur në shtresën hyrëse. Dalja V j merret nga neuroni i j-të i shtresës së fshehur duke kaluar nëpër funksionin e trasferimit f (x ) : V jm = f ( x mj ) = f (å w jk x km + bk ) 1.3.2 k
Një neuron i në shtresën e jashtme, merr një sinjal/vlerë nga neuroni j i shterës së fshehur si vlerë hyrëse dhe jep në dalje Oim pas kalimit në funksionin transferues f ( xim ) . Kujtojmë se në këtë rast duke marrë vlerat e çdo neuron në dalje, në tërësi dalja e rrjetës është vektor. Kështu, për neuronin e i-të do të kemi: Oim = f ( xim ) = f (åWijV jm + b j ) 1.3.3 j
m i
Duke zvëndësuar (1.3.2), përfundimisht O shkruhet:
Oim = f (åWij f (å w jk xkm )
1.3.4
j
Në rrjetat shumështresore feedforward, përdoren një numër shumë i madh funksionesh jolinearë. E rëndësishme është që këta funksione të jenë të diferencueshën. Funksioni i gabimit E, përcaktohet si shuma e gabimeve të veçanta dhe jepet me shprehjen: N
(
1 p dalj E = å å Ti m - Oim 2 m = 1 i= 1
2
)
1.3.5
ku, Ti m është vlera e synuar 5, i = 1,...N dalje . Duke zvëndësuar (1.3.4) merret: 2
N öù æ 1 p dalje é 1.3.6 E = å å êTi m - f çç å Wij f w jk x km ÷÷ú 2 m =1 i =1 êë øúû è j Në këtë rast peshat e reja llogariten në funksion të peshave të vjetra sipas drejtimit ‘gradient descent’. Peshat e reja ndryshojnë me DW , e cila në vetevete është proporcionale me E. Pra: Wijpas = Wijpara + DWij 1.3.7 ku ¶E DWij = -h 1.3.8 ¶Wij
(
DW =ij
5
¶E -h= ¶Wij
m ¶E ¶V j -h å m m ¶V j ¶Wij
Target
19
)
1.3.9
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
dhe h është parametri i ‘learning’ të rrjetës. Pas llogaritjes, peshat e reja lidhen me sinjalin hyrës dhe vazhdohet me të njëjtën proçedurë trajnimi deri në fund të këtij proçesi derisa të arrihet minimumi gabimi i rrjetës. Ka dy mënyra të ndryshme ku algoritmi i gradientit zbritës zbatohet. Është moda me shkallë (incremental mode) dhe në modën e rritjes graduale (batch mode). Në ‘batch mode’, të gjitha vlerat hyrëse futen në rrjetë para se të rigjenerohen peshat.
1.3.5. Metoda të tjera trajnimi të rrjetave feed-forward Duke ditur rëndësinë e proçesit të trajnimit, janë ndërtuar një numër i madh algoritmesh trajnuese të rrjetave feed-forward. Ideja qëndron në rrugën që ndiqet për llogaritjen e koefiçientëve peshë. Ne do të përmendim disa nga këto metoda, pa hyrë në analiza të thella matematikore. Metoda LMS
Metoda e katërorëve më të vegjël ( LMS/ Least Mean Squares) [1] ose rregulli Widrow-Hoff, minimizon gabimin mesatar. Algoritmi LMS, është një shembull i trajnimit të mbikqyrur në të cilin koefiçienti i ‘learning rate’ ( h ) gjendet nga një grup vlerash më të ‘mira’, ku gjatë trajnimit ai kufizohet në këtë interval, dhe në dalje merren rezultatet e dëshiruara. {p1,t1},{p2,t2},...{pQ,tQ} ku, pQ janë vlerat hyrëse të rrjetës dhe tQ janë vlerat e synuara/target koresponduese të vlerave që merren më dalje të rrjetës neuronike. Gabimi llogaritet si diferencë midis vlerave dalëse të rrjetës me vlerat e synuara. Me anën e këtij algoritmi, kërkohet të minimizohet mesatarja e shumës së këtyre gabimeve. 1 Q 1 Q Pra, mse = å e(k ) 2 = (t (k ) - o(k )) 2 å Q k =1 Q k =1 Ky algoritëm përshtat w dhe devijuesin b (kryesisht në neuronet me funksione transferimi lineare psh ADALINE) në mënyrë që të minimizohet kjo mesatare gabimesh. Funksioni mse quhet funksion i performancës. Në rastin e rrjetave lineare, ky funksion është kuadratik. Kështu që indeksi i performancës duhet të ketë një minimum global, një minimum të dobët ose nuk ka fare minimum. Në përgjithësi kjo varet nga karakteristikat e vektorit hyrës. E thënë ndryshe, karakteristikat e vektorit hyrës përcaktojnë nëse ka ose jo një zgjidhje. Batch Training (train)
Në ‘batch mode’, peshat dhe devijuesit gjenerohen vetëm pasi ka mbaruar proçesi i plotë i trajnimit të rrjetës. Gradientët e llogaritur në çdo trajnim, mblidhen së bashku për të përcaktuar ndryshimin përfundimtar në peshat dhe devijuesit.[1]
20
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Batch Gradient Descent (traingd)
Funksioni trajnues për ‘Batch Gradient Descent’ është traingd Peshat dhe devijuesit janë rigjeneruar në drejtim të kundërt me gradientin e funksionit të performancës. N.q.se duam të trajnojmë një rrjetë duke përdorur ‘batch steepest descent’ duhet të vendosim funksionin trajnues të rrjetës, traingd, dhe atëherë thirret funksioni train që është treguar më lart. Algoritmat e kuazi-Njutonit Algoritmi BFGS (trainbgf)
Funksioni trainbfg është metoda e Njutonit, si një alternativë e metodës së gradientit të konjuguar [1] për optimizimin e shpejtë. Hapi bazë/korigjimi i metodës së Njutonit është: ¶E xk +1 = xk - Ak-1 ¶w -1 ku, Ak janë matriciat Hessian [2] të cilat përbëhen nga derivatet e dyta të funksionit të performancës dhe janë llogaritur për vlerën e radhës të peshave dhe të devijuësve Metoda e Njutonit konvergjon më shpejt se metoda e gradientit të konjuguar por është më kompekse dhe kërkon kohë për llogaritjen e matricave Hessian. Ekziston një klasë algoritmash që bazohen në metodën e Njutonit por që nuk kërkojnë llogaritjen e derivateve të dyta. Këto quhen Metodat kuazi-Njutoniane. Ato marrin një Hessian të përafruar në çdo hap të algoritmit. Korigjimi është llogaritur si një funksion i gradentit. Ky algoritëm është përfshirë në ‘rutinën’ e funksionit trainbfg6. Algoritimi Levenberg-Marquardt (trainlm)
Është si metoda e Njutonit, por e krijuar për t’iu afruar një shpejtësie të rendit të dytë të trajnimit, pa llogaritur matricat Hessian. Kur funksioni i performancës ka formën e shumës së katrorëve (siç është në përgjithësi në rrjetat feed-forward), atëherë matricat Hessian mund të përafrohen si: ¶E H = JTJ dhe gradienti llogaritet si: g = = JT e, ku e është vektori i gabimeve të rrjetës. ¶w J është Jakobiani që përmban derivatet e para të gabimit të rrjetës dhe mund të llogaritet me metoden standarte të algoritmit ‘backpropagation’e cila është më pak e komplikuar se llogaritja e drejtpërdrejtë e matricave Hessian. Algoritmi Levenberg-Marquardt[3] përdor këtë përafrim në llogaritjen e peshave: xk +1 = xk - [ J T J + m I ]-1 J T e Kur µ është zero, kjo është metoda e Njutonit që përdor matricat e përafruara Hessian. Kur µ është e madhe, kjo bëhet metoda e zbritjes gradiente me vlerë të vogël të hapit. Metoda e Njutonit është më e shpejta dhe më e sakta me një gabim minimal, kështu, 6
Toolbox\nnet\trainbfg.
21
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
qëllimi është t’i afrohemi sa më shpejt asaj. Pra, µ zvogëlohet (ose reduktim i funksionit të performancës) mbas çdo hapi të sukseshëm dhe rritet vetëm atëherë kur hapi që kryhet e rrit funksionin e performancës. Në këtë mënyrë, funksioni i performancës do të zvogëlohet gjithmonë pas çdo hapi të algoritmit. Regularizimi
Me këtë metodë modifikohet funksioni i performancës duke i shtuar një term që përmban një mesatare të shumës së katrorëve të peshave dhe devijuesëve. Duke ditur që funksioni i performancës është: 1 N 1 N =å (ei ) 2 = å (ti - oi )2 F = mse N i =1 N i =1 do të kishim msereg = g mse + (1 - g )msw 1 n wj 2 . å n j =1 Duke përdorur këtë funksion performance, rrjeta do të ketë pesha dhe devijues më të vegjël. Kjo bën që përgjigjja e saj të tentojë drejt një përputhje më të ‘butë’ me vlerat e dëshiruara. Theksojmë se një nga funksionet trajnues më të përdorshëm që bazohet në metodën e mësipërme të trajnimit është trainbr. Ky funksion trajnues i rrjetave neuronike, llogarit peshat W dhe devijuesin b mbështetur në optimizimin e algoritmit Levenberg-Marquard. Ai minimizon një kombinim të katërorëve të gabimit dhe peshave, dhe pastaj përcakton kombinimin më të mirë të tyre në mënyrë që rrjeta të japë rezultati më të saktë. I gjithë ky proces quhet regularizimi Bayesian[1]. ku g - është shkalla e performancës, dhe msw =
Këto janë metodat kryesore të trajnimit të rrjetave feed-forward. Por, kush do të jetë modeli ynë parashikues dhe cila do të jetë metoda që do të përdoret për trajnimin e këtij modeli? Këto janë pyetjet që do të perpiqemi t’u japim përgjigje në kapitullin 3, duke përdorur rrjeta tw ndryshme neuronike.
22
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Kapitulli 2 Në këtë kapitull do të bëhet një përmbledhje e njohurive kryesore mbi fushën magnetike të Tokës. Ndërtimi i modeleve të fushës magnetike, do të jetë gjithashtu një temë e rëndësishme e këtij kapitulli. Do të përshkruhen dy modelet kryesore tek të cilët ne kemi mbështetur studimin tonë dhe fund do të analizohen seritë kohore të fushës magnetike dhe do të bëhet përshkrimi i metodave parashikuese.
2.1 Fusha gjeomagnetike Si çdo fushë vektoriale, edhe fusha gjeomagnetike karakterizohet nga vektori i Induksionit B ose vektori i intensitetit H, të cilat lidhen me relacionin: B = m×m0×H Meqë këto madhësi maten zakonisht në ajër, (ku konstantja magnetike m = 1), vlera e intensitetit dhe induksionit ndryshojnë me konstanten e boshllëkut m0, prandaj shpesh të dy madhësitë konfodohen me njera tjetrën.[5]
Fig.2.1.1 Fusha magnetike e ka origjinën në bërthamën fluide të saj. Në figurë jepet një pamje e Tokës, bërthamës fuide dhe vijave të fushës magnetike. Në syrin tonë ajo ngjan me një magnet gjignat.
Ne do të përdorim vetëm vektorin e induksionit B, madhësia e të cilit në gjeomganetizëm shënohet shpesh me F. Në një sistem boshtesh kartezianë gjeografikë (ku boshti horizontal X është sipas drejtimit të veriut, boshti horizontal Y është sipas drejtimit të lindjes, dhe drejtimi vertikal Z është sipas rezes së Tokës me kah për në brendësi të saj), përbërëset e fushës shënohen X, Y, Z. Pavarësisht se vetëm tre përbërëse janë të pavarurara, shpesh në gjeomagnetizëm përdoren 7 elementë (shih fig.2.1.2). Deklinacioni D, është këndi i formuar midis drejtimit të veriut gjeografik me projeksionin e vektorit B në planin horizontal Bh (shpesh kjo shënohet H). Inklinacioni I, është këndi që formon vektori B me planin horizontal.
23
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Fig.2.1.2 Shtatë elementët e fushës magnetike që përdoren në gjeomagnetizëm. X, Y, Z, komponentet e fushës, inklinacioni I, deklinacioni D, vlera F e fushës gjeomagnetike, H projeksioni i B në planin horizontal
Këto elementë D , I dhe F mund të shprehen nga komponentet ortogonale duke përdorur relacionet:[6] D = arctan
Y X
I = arctan
Z F = ( H2 + Z2 )1/2 B
2.1.1
Dhe ku H do të jepet nga: H = (X2 + Y2 )1/2 Madhësia e fushës gjeomagnetike është e vogël në krahasim me fushat që krijojnë magnetë të tillë si ato që përdoren rëndom në laboratorët e fizikës. Ajo është e rendit të ersted, ku 1 ersted = 10-7 T. Prandaj në praktikën e matjeve në terren, përdoret zakonisht njësia 1nT = 10-9 T. Sipas kontributeve që kanë origjinë të ndryshme, fusha gjeomagnetike ndahet në: 1. Fusha kryesore, e gjeneruar nga bërthama fluide nëpërmjet një mekanizmi gjeodinamik 2. Fusha e kores , e gjeneruar nga shkëmbinjtë magnetik në koren e Tokës. 3. Fusha e jashtme, e gjeneruar nga rrymat elektrike në jonosferë dhe në magnetosferë. 4. Fusha e induksionit elektromagnetik, e gjeneruar nga rryma të induktuara në kore dhe në mantel si pasojë e fushës së jashtme të ndryshueshme në kohë. Variacioni hapësinor
Variacionet hapësinore të fushës magnetike klasifikohen sipas distancës nga sipërfaqja e Tokës dhe nga pozicioni gjeografik. Meqënëse ne nuk do të studjojmë fushën magnetike në distanca shumë të mëdha nga sipërfaqja e e Tokës, atëherë fusha magnetike është funksion i tre koordinatave hapësinore, gjatësisë gjeografike, gjërësisë gjeografike dhe distancës nga sipërfaqja e tokës.
24
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Variacioni kohor
Variacionet në kohë të fushës magnetike të Tokës që kanë burime të natyrave të ndryshme, kanë spektër shumë të gjerë frekuencash (periodash) që fillojnë nga 10-15 Hz deri në 105 Hz, ose perioda nga 10-5 s në 1015 s (miliona vjet). Më shumë se variacionet hapsinore, diferencat e mëdha në shkallë kohore tregojnë një larmi të madhe fenomenesh fizike që i shkaktojnë. Mesataret vjetore të regjistrimeve të fushës magnetike në observatorë të ndryshëm japin një ndryshim (rritje apo zvogëlim) të qëndrueshëm prej disa nT në vit, që quhet variacion shekullor (SV) 2.2. Modelet e fushës gjeomagnetike Modelet e fushës gjeomagnetike modelojnë ndryshimin hapsinor dhe kohor të fushës gjeomagnetike duke u bazuar në të dhënat e matjeve të komponenteve të fushës gjeomagnteike: 1. Në observatorë stabël gjeomagnetike të shpërndarë jouniformisht (shih fig. 2.2.1) në gjithë ruzullin dhe regjistrojnë çdo minutë ose ½ minute vlerat e kompnenteve dhe kanë seri kohore vlerash që vazhdojnë me vite (disa e kalojnë edhe shekullin)
Fig. 2.2.1 Harta globale e observatorëve për vitin 2005. [6]
2. Në matjet e kryera në rrjete stacionesh të përsëritëshme që kanë shtete të ndryshme të shpërndara brenda kufijve të tyre. 3. Matje aeromagnetike që masin kryesisht vlerën absolute (F) të fushës në lartësi disa kilometra. 4. Matje historike të kryera në udhëtimet e shekujve të kaluar (zakonisht deklinacioni dhe inklinacioni). 5. Matjet satelitore që fillojnë qysh nga fillimi i viteve 80, me matjen e vlerës absolute të fushës e duke vazhduar me satelitët e sotëm që masin të tre komponentet nëpër gjithë trajektoret që ata ndjekin mbi tokë. Modelet klasifikohen në modele rajonale dhe globale, sipas shkallës së teritorrit që përfshijnë. Modelet rajonale dhe globale përdorin teknika të ndryshme numerike për të përqasur sa më mirë vlerat e modeluara me vlerat reale të fushës. Nga këto teknika 25
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
përmendim përfarmin në polinome të gjatësisë dhe gjerësisë gjeografike, [7] ose SCHA *Spherical Cap Harmonic Analyses[8]. Modelet globale përdorin zakonisht zbërthimin në harmonika sferike (shih më poshtë). Të gjitha modelet përdorin zakonisht polinome kohore për modelimin e variacionit kohor të fushës gjeomagnteike, psh IGRF përdor tekinkën e paraqitjes së koefiçientëve të Gaussit nëpërmjet polinomeve kohore. Ka qenë i pari modeli Gufm1 që përdori edhe teknikën e “kubik splajn” (“cubic spline”) për varësinë kohore Për parashikimin e variacioneve të fushës magnetike, modelet ekstrapolojnë vlerat e parametrave (psh koeficientët e Gaussit) përtej intervalit kohor që përfshijnë matjet e kryera. Për herë të parë në parashikimin e variacioneve kohore të fushës gjeomagnetike janë zbatuar teknika e “dimension embeding” të dinamikës jolineare nga A. De Santis [9]. Mandej në 2005 B. Duka[10], duke ndjekur një teknikë të përqasjes së vlerave të fushës me vlerat që japin sistemet e ekuacioneve dinamike (pasi testohen një numër i madh tipe funksionesh të dinamike jolineare), arriti të modelonte fushën për zonën e Europës [11]. Por, aplikimi i rrjetave neuronike në studimin dhe parashikimin e evolucionit të fushës gjeomagnetike nuk ka qenë shumë i njohur, përjashto rastet kur rrjetat neuronike janë përdorur për të mbushur vlerat e serive kohore që kanë munguar për arsye të ndryshme në ndonjë observator gjeomagnetik. Analiza me harmonika sferike. Modeli IGRF
Për të krijuar një ide mbi modelet e fushës gjeomagnetike, po paraqesim se si arrihet modeli IGRF. Si çdo fushë edhe fusha gjeomagnetike, të cilën do ta karakterizojmë me induksionin magnetik B, kënaq ekuacionet e Maxwell-it:[11] Ñ´B = µ0 J 2.1.1 Ñ·B = 0. 2.1.2 Densiteti i rrymës së përcjellshmërisë J, në rastin kur fusha gjeomagnetike matet në ajër ( midis sipërfaqes së Tokës dhe jonosferës), është i neglizhueshëm: Ñ´B = 0
2.1.3
Prandaj fusha mund të konisiderohet si potenciale. Pra, për të mund të futet kuptimi i një potenciali skalar V , gradienti i të cilit është induksioni i fushës B: B = - ÑV 2.1.4 Nga ekuacioni (2.1.2) , divergjenca e induksionit B është zero, pra potenciali skalar V kënaq ekuacionin e Laplasit : Ñ2 V = 0.
2.1.5
Nëse e ndajmë fushën gjeomagnetike në vendet ku ajo matet, sipas llojit të burimeve që e krijojnë atë, induksioni i saj shkruhet:
26
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
B = Bb + Bj
2.1.6
ku Bb është fusha që formohet nga burime të brendëshme të Tokës. Bj është nga burime jashtë zonës ku janë marrë të dhënat, Bb + Bj mund të paraqitet nga një potencial skalar. Kështu potencialin skalar, në ekuacionin e Laplasit (2.1.5) do ta konsiderojmë që karakterizon pikërisht dy komponentët Bb dhe Bj. Zgjidhja e ekuacionit (2.1.5), në rastin e një gjeometrie sferike siç mund të konsiderohet rasti i Tokës, jepet në shumë tekste. Në gjeomagnetizëm, për herë të parë, kjo zgjidhe është dhënë nga Gauss(1839). Në përgjithësi, dihej se zgjidhja është një seri e pafundme e harmonikave sferike, por Gauss tregoi edhe kuptimin fizik të kësaj zgjidhjeje. Ajo sot njihet në elekrodinamikë si zbërthimi multipolar i fushës. Në koordinata sferike ( r, θ ,f )7 ekuacioni (2.1.5) mund të shkruhet :
1 ¶ 2 (rV ) ¶ 2V 1 ¶ ¶V 1 + =0 )+ (sin q ¶q r ¶r 2 r 2 sin q ¶q r 2 sin 2 q ¶f 2
2.1.7
Zgjidhja e këtij ekuacioni, që merret nga metoda e ndarjes së variablave, janë harmonikat sferike të formës: Vn,m( r,q , f ) = [ Anrn + Bnr -(n+1)] [amcos(m f ) + bmsin(m f )]Pn,m(cos q )
2.1.8
Ku indekset m dhe n marrin vlera të plota (n = 1, 2, ... dhe m = 0, 1, 2, ... n). Pn,m janë polinomet shoqërues të Lezhandrit. Forma më e zakonshme e këtyre funsioneve, duke përdorur variablin µ = cos θ , është: d m Pn ( m ) 2.1.9 dm m Ku Pn( m ) janë shënuar polinomet e zakonshme të Lezhandrit. Duke kombinuar konstantet dhe duke futur madhësinë (a/r) , ku a është rrezja e Tokës (a = 6371 km), zgjidhja e përgjithëshme është superpozimi i të gjitha zgjidhjeve të veçanta: Pn,m(µ) = (1- m 2)m/2
¥
n
a [ An ,m cos(mf ) +Bn, m sin(mf )]( ) n+1 r i = 1 m= 0 r +[Cn ,m cos(mf ) + Dn ,m sin( mf )]( ) n ]Pn, m (cos q ) a
V (r ,q , j ) = a å
å
7
2.1.10
Me θ shënojmë këndin polar, i cili në gjeomagnetizëm njihet si colatitude ( 90° minus gjerësinë gjeografike: latitude), dhe me f shënojmë këndin azimutal që në gjeomagnetizëm njihet si gjatësia gjeografike lindore (longitude). Ky sistem koordinatash që do ta përdorim shpesh njihet si sistemi gjeocentrik i kordinatave.
27
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Funksionet Pn,m( q )cos(m f ) dhe Pn,m sin(m f ) janë quajtur harmonika sferike, n quhet shkalla (degree) dhe m rendi (order) i harmonikës. Siç thamë më lart, potenciali skalar , pranë sipërfaqes së Tokës mund të konsiderohet si shumë:(2.1.6) V = Vb + V j
2.1.11
ku Vb dhe Vj paraqesin potencialet skalare të fushës me burime të brendëshme dhe asaj me burime të jashtme. Kjo do të thotë se në shprehjen (2.1.10) termi i parë paraqet potencialin e fushës me origjinë brenda sferës me rreze a dhe termi i dytë paraqet potencialin e fushës me origjinë jashtë sferës me rreze a: Ni
max
n a Vb = a å ( ) n+1 å ( g nm cos(mf ) + hnm sin( mf )) Pnm (cos(q )) n =1 r m=0
2.1.12
N emax
r n V j = a å ( ) n å (q nm cos(mf ) + s nm sin( mf )) Pnm (cos(q )) n =1 a m -0
2.1.13
Ku a është rrezja e Tokës, prandaj r kemi shënuar largësinë nga qendra e Tokës. Matjet e fushës magnetike të bëra në Tokë ose në hapsirë (nga matjet aeromagnetike dhe ato satelitore) janë përdorur për të vlerësuar të ashtuquajturit koefiçentët e harmonikave sferike të Gauss-it [( g nm , hnm ) për burimet e brendëshme, dhe( q nm , s nm ) për burimet e jashtme, të cilët përshkruajnë fushën gjeomagnetike në një zonë pa burime të fushës.Theksojmë se në terren nuk maten vlera të potencialit, por maten elementet e fushës magnetike siç janë përbërset e saj, ose deklinacioni dhe inklinacioni. Prandaj, në praktikë koefiçentët e Gauss-it gjenden duke kryer fitting e përbërseve të fushës si derivate të potencialit, me vlerat e matura nga observatorët magnetik, (matjet në terren apo satelitët). Duke përdorur ekuacionet (2.1.4) dhe (2.1.13) ne do të marrim komponenen veriore BN (ose komponentja X e cila është e drejtuar nga veriu), komponenten lindore BE (ose Y e cila është e drejtuar nga lindja ) dhe komponenten vertikale BV .(ose Z e cila është e drejtuar vertikalisht poshtë) BN (= Br ) =
n+2 n-1 ¶V ¥ n ìï æ aö æ r ö üï = ååí(n +1) gnm cos(mf) + hnm sin(mf) ç ÷ - n qnm cos(mf) + snm sin(mf) ç ÷ ýPnm (q ) ¶r n=1 m=0 ïî èrø è a ø ïþ
[
]
[
]
2.1.14 n+2 n-1 m ¥ n ì 1 ¶V ï m æaö æ r ö üï dPn (q ) m m m BE (= Bq ) = = -ååí gn cos(mf) + hn sin(mf) ç ÷ + qn cos(mf) + sn sin(mf) ç ÷ ý r ¶q èrø è a ø ïþ dq n=1 m=0 ï î
[
]
[
]
2.1.15
28
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
BV (= Bf ) =
1 ¶V ¥ =å r sinq ¶f n=1
n+2 n-1 m ìï m æ aö æ r ö üï Pn (q) m m m m g m h m sin( ) cos( ) [ q sin( m ) s cos( m )] + f n fç ÷ f n f ç ÷ ý í n å n èrø è a ø ïþ sinq m=0 ï î n
[
]
2.1.16 Në praktikën e modelimeve të fushës me harmonika sferike, seria e pafundme e harmonikave ndërpritet deri në një Nmax (n=1,2,...,N) atëherë numri i koefiçentëve të Gauss-it g nm , hnm , q nm , s nm është 2N(N+2). Kaq është numri i të panjohurave në sistemin e ekuacioneve algjebrike (2.1,14, 2.1.15, 2.1.16) ku secili ekuacion në anën e majtë ka vlerën (e matur) e një elementi të fushës, dhe në anën e djathtë janë funksione të njohura të kordinatave të pikës ku kryhet matja. Zakonisht numri i ekuacioneve është shumë më i madh se numri i të panohurave dhe duke zbatuar një proçedurë të metodës së katrorëve më të vegjël (minimizimi i χ2) arrihet në një sistem me aq ekuacione sa janë dhe të panjohurat (numri i koefiçientëve të Gauss-it). Në analizat e kohëve të fundit përjashtohen nga shuma ( në rastin e komponentes Y) koefiçentët e jashtëm e si rrjedhim varësinë nga raporti (r/a)n edhe për n=1. Ky përjashtim i koefiçentëve të jashtëm e redukton numrin e koefiçentëve në N(N+2). Në përgjithësi, në bazë të vendit ku kryhet matja mund të hiqet kontributi i burimeve të jashtme (sidomos në rastin e matjeve satelitore) dhe llogariten koefiçientët e Gauss-it g nm , hnm vetëm për burimët e brendshme. Informacioni i parë fizik qe del nga analiza e harmonikave sferike është vërtetimi i hipotezës të origjinës së brendëshme të fushës gjeomagnetike por edhe një kontribut të lehtë të burimeve të jashtme që manifestohet mbi të gjitha nëpërmjet termave të rendit të parë. Informacione të tjera janë marrë duke studjuar shpërndarjen e koefiçentëve g nm , hnm në funksion të rendit n. P.sh studimi i potencialit ¥
V = å Vn
2.1.17
n =1
ku termat e potencialit, shprehin përkatësisht: për n = 1 potencialin e fushës së dipolit, n= 2 potencialin e fushës së kuadrupolit etj. Harmonikat sferike për r të fiksuar (sipërfaqe të sferës me rreze r) me shkallë n kanë gjatësi valore horizontale afërsisht 2pa/(n+1/2), dhe kjo tregon se çfarë kontributi jep në fushë harmonika e shkallës n-je. Në praktikë, gjatë llogaritjeve të koefiçientëve të Gausit, në modelet e ndryshme, ndalohet në vlera të fundme të n. Me kompjuterat e sotëm arrihet llogaritja deri në n të rendit 50-100. Fusha referuese gjeomagnetike ndërkombëtare (IGRF The Intrnational Geomagnetic Reference Field ) u fut në përdorim nga Shoqata Ndërkombëtare e Gjeomagnetizimit dhe Aeronomisë (IAGA) në 1968 si përgjigje ndaj kërkesës për një paraqitje standarte të harmonikave sferike të fushës kryesore të Tokës ( Earth’s main field). Ajo është në fakt bashkësia e koefiçientëve të Gauss-it, të llogaritur duke bërë fit-ing e të dhënave të matjeve të elementeve të fushës gjeomagnetike të matur kudo në Tokë ose në lartësi, me shumën e fundme të zbërthimit në harmonika sferike. Modelet IGRF janë përmirësuar vazhdimisht, sidomos me futjen e teknikave të reja në matjet satelitore, si dhe me përmirësimin e teknikës llogaritëse. Megjithatë IGRF është një model jo perfekt. 29
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Së pari, duke qenë se koefiçentët numerikë të llogaritur janë me gabimet përkatëse, atëherë edhe fusha e llogaritur do të ndryshojë nga ajo aktuale që ne përpiqemi të modelojmë. Së dyti , për shkak të ndërprerjes, modelet IGRF paraqesin vetëm frekuencat hapsinore të ulëta (gjatësi vale të mëdha ) të fushës. Së treti, ka dhe kontribute të tjera në fushën e vëzhguar që IGRF nuk përpiqet ti modelojë. Për shkak të variacionit kohor të fushës, modele shumë të mirë mund të merren për kohën kur ka një mbulim global nga ana e satelitëve të cilët matin vektorin e fushës. Kjo ka ndodhur në 1979-1980 (MAGSAT), dhe nga 1999 (Ørsted,CHAMP). Modeli Gufm18
Është bazuar në të dhënat e observuara të fushës magnetike nga matjet tokësore dhe satelitët nga viti 1600 – 1996. Për periudhën para viteve 1800, janë kryer mbi 83000 observime të veçanta të deklinacionit të kryera në mbi 64000 zona. Mbi 8000 observime të reja janë kryer në vetëm në shekullin e XVIII-të. Modeli i varësisë kohore të fushës, u ndërtua nga të gjitha të dhënat dhe përdor zbërthimi në harmonika sferike dhe sidomos në B-splines duke marrë një total prej 36512 parametrash. Ky model është programuar më Fortran9, kështu duke kryer ndryshimet e nevojshme në të, bëhet e mundur llogaritja e fushës mgnetike në çdo kohë dhe në çdo pikë të globit. Modeli Gufm1 është i vetmi që realizon llogaritjen e fushës magnetike në periudha kaq të gjata kohore, (1650 – 1990). Në kapitullin 3, do të bazohemi në vlerat e fushës të llogaritura nga ky model për ndërtimin e modelit neuronik prashikues. Në vazhdim do të përdoret edhe modeli IGRF 10 për krahasimin e vlerave të fushës midis dy modeleve, ( modeli neuromik dhe IGRF10)10. 2.3. Seritë kohore të fushës magnetike Një seri kohore është një sekuncë vlerash vektoriale ose skalare të cilat janë funksione të kohës të matura në intervale të barabarta të saj[12]. Ndër seritë kohore më të njohura përmendim: vlerat e temperatrës, ecuria e çmimeve, vlerat e fushës magnetike etj. Për fushën magnetike, seritë kohore formohen me vlerat e mesatarizuara të çdo viti te të secilës komponente të marra për një periudhë disa vjeçare. Gjithashtu këto seri mund të formohen edhe me mesataren ditore (të cilat kanë një ecuri stokastike [14]), mujore të fushës magnetike, me variacionin shekullor etj. Ne në studimin tonë do të përdorim mestaren vjetore të fushës magnetike. Me fjalën mesatarizim do të kuptojmë mesataren vjetore të një numri të madh matjesh të kryera gjatë një viti për çdo komponente të fushës. Këto janë vlerat e fushës që i përkasin vitit t. 8
A. Jackson – 2000. Programi në Fortran u vu në dispozicionin tone nga Dr. R. Holme. 10 IGRF 10th (2005). Mark W.Hounslow, G.Kluge, Dieter Bilitza, A. zunde. http://gegraphy.lancaster.ac. 9
30
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Shënojmë me S(t) një seri kohore me vlerat e një prej komponenteve çfarëdo të fushës gjeomagnetike. t = 1, 2, 3, ....................N, paraqet periudhën kohore disa vjeçare që në rastin e modelit Gufm1, është 1650 – 1990. P.sh një seri e tillë kohore jepet në tabelën 2.3.1 t S(t)/nT
1961 17093
1962 17121
1963 17142
1964 1965 1966 17188 17201 17204 Tab.2.3.1 Disa vlera të një sere kohore të llogaritura nga modeli Gufm1.
1967 17221
... …
Modelet parashikuese ndërtohen në funksion të vlerave të së kaluarës për të dhëmë një parashikim për të ardhmen. Ekzistojnë disa metoda për parashikimin e serive kohore. Ne u bazuam ne dy metodat më kryesore të cilat po i paraqesim shkurtimisht 1. Metoda e parë. Përdoret seria kohore S(t) prej t elementësh. Trajnohet rrjeta parashikuese me vlera hyrëse nga kjo seri dhe si vlerë e synuar/target merret një vektor me elementë përsëri nga kjo seri por i zhvendosur nga i pari me d, ku d është një numër i cili quhet horizont i parashikimit. Gjatë simulimit vektori simulues merr përsëri vlera nga seria kohore dhe vlera e parashikuar është e zhvendosur përsëri me d nga ky vektor. Në rastin më të thjeshtë d = 1, modeli parashikues paraqitet në fig.2.3.1 Ekuacioni i parashikimit të vlerës pasardhëse është: Y(t + 1) = F{(x(t),x(t-1)....x(t-m-d).} 2.3.1 ku Y(t+1) paraqet vlerën e parashikuar dhe F është një funksion që lind gjatë trajnimit të rrjetës dhe përfshin tërësinë e veprimeve të kryera gjatë këtij proçesi. {(x(t),x(t-1)....x(t-m)} Î S(t). x(t) x(t-1)
Rrjeta parashikuese
...
y(t+1)
x(t-m) Fig.2.3.1 Modeli neuronik parashikues sipas metodës së parë.
2. Metoda e dytë Kjo metodë është vazhdim i metodës së parë për sa i përket futjes së të dhënave por ndryshimi qëndron në faktin se vihet një kufi në horizontin e parashikimit duke parashikuar vetëm një vlerë pasardhëse. Më tej kjo vlerë shërben si vlerë hyrëse për parashikimin e vlerës së dytë dhe vazhdohet përsëri me të njëjtën logjikë për parashikimin e një numri më të madh vlerash. Skematikisht kjo metodë paraqitet në fig.2.3.2.
31
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Y(t+1) x(t)
Rrjeta parashikuese
x(t-1) ...
Y(t+2)
x(t-m-1) Fig.2.3.2 Modeli neuronik parashikues sipas metodës së dytë
Flillimisht do të aplikohet metoda e parë dhe më pas metoda e dytë për të parë se cila prej tyre është më efikase në rastin e parashikimit të fushës magnetike dhe pse. Më pas do të shfrytëzohët kjo metodë për parashikimin e vlerave të fushës magnetike në të ardhmen.
32
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Kapitulli 3 Kapitulli 3 do të jetë një përmbledhje e të gjithë proçedurës së ndejkur prej nesh për gjetjen e rrjetës neuronike më të mirë e cila do të përdoret për parashikimin e fushës magnetike. Pastaj do të kalohet në parashikimet e fushës magnetike në një pikë të globit dhe në fund do të bëhet një krahasim midis modelit tonë parashikues dhe modeleve të tjera.
3.1. Ndërtimi i modelit neuronik për parashikimin e fushës magnetike Ashtu si fjalët kombinohen brenda fjalive për tu dhënë atyre kuptimin e duhur, edhe neuronet kombinohen brenda rrjetës për të dhënë rrjetën që funksionon më mirë. Kjo në kuptimin e rezultatit përfundimtar që do të marrim prej saj. Sa më të saktë të jemi në kombinimin e elementëve të rrjetës, aq më të suksesshëm do të jemi në marrjen e rezultateve. Për këtë arsye, është e këshillueshme që para se të kalohet në përdorimin e rrjetave neuronike, të bëhen disa aplikimie të thjeshta me to. Kështu krijohet një ide më e mirë për funksionimin e tyre. Duke dhënë në Matlab komandën ‘nntool’ kalohet në një ‘dritare’ e cila quhet ‘Graphical User Interface’11 dhe përmban disa nga rrjetat kryesore me mundësi te lehtë ndryshimi të numrit të neuroneve, funksioneve transferuese, funksioneve trajnuese, epokave etj. Fillimisht me anën e modelit Gufm, u llogaritën vlerat e tre komponentev të fushës magnetike në pikën me kordinata 520 4’ dhe 120 41’, e cila i përket observatorit Niemeck/NGK. Seria kohore përmban 330 vlera. Vlera e 330-të do të identifikohet me vlerën e fushës së vitit 1980 dhe 1 i përket vlerës së fushës së vitit 1650. Këto vlera janë paraqitur në grafikët e fig.3.1.1.a,b,c dhe i përkasin një periudhë kohore nga viti 16501980. Paraqitja x 10 4
1.9
grafike 1650 - 1980 komponentja X
1.8 vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1.7
1.6
1.5
1.4 1650
1700
1750
1800 1850 vitet
1900
Fig.3.1.1 a).
11
GUI - Graphical User Interface
33
1950
2000
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
0
Paraqitja grafike 1650 - 1980 komponentja Y
vlerat e fushes
-1000 -2000 -3000 -4000 -5000 -6000 1650
1700
1750
1800 1850 vitet
1900
1950
2000
Fig.3.1.1 b). x Paraqitja 10 4
5.8
grafike 1650 - 1980 komponentja Z
5.6 5.4 vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5.2 5 4.8 4.6 4.4 4.2 1650
1700
1750
1800 1850 vitet
1900
1950
2000
Fig.3.1.1 c).
Në paragrafin 2.3 u treguan dy metodat kryesore që ndiqen në parashikimin e serive kohore. Aplikimi i tyre është bërë hap pas hapi në dy paragrafët e mëposhtëm.
3.2. Aplikimi i metodës së parë për gjetjen e rrjetës më të mirë parashikuese Fillimisht ndërtohen vektorët me vlerat hyrëse, vlerat e synuara dhe vektori me vlerat simuluese me vlera nga seria kohore S(t). Thekosjmë që S(t) në rastin tonë është seria kohore e përbërë nga vlerat e një prej komponenteve X, Y, Z të fushës gjeomagnetike. Marrim SX(t) e cila përmban 330 vlera (1650-1980). Fillimisht ndërtuam këtë strukturë të dhënash: a320 = 1x320→Nga 1 në 320 (nga 1 deri tek vlera e 320 e serisë ose ndryshe, nga viti 1650deri në vitin 1970) – vektori me vlerat hyrëse. t320 = 1x320 →Nga (1+1) në (320+1) – vektori me vlerat e synuara i cili është i zhvendosur nga a320 me një vit. b320 = 1x320→ Nga (1+1+1) deri (300+1+1) - vlerat simuluese i cili zhvendoset me një vit nga vektori i vlerave simuluese. Sipas skemës së parashikimit vektori Y (output-i) i rrjetës duhet të ketë si vlerë të fundit të tij vlerën 323 të serisë SX(t).
34
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Pasi u bënë shumë prova në GUI me rrjeta të ndryshme u arrit në përfundimin se rrjetat që dhanë rezultat më të mirë në parashikimin e vlerës 323 të serisë, janë rrjetat newcf, newff, newelm ( të cilat hyjnë në grupin e rrjetave feed-forward, shih kapitullin 1). Më tej, u bënë prova me rrjetat e përzgjedhura duke ndryshuar elementët përbërës të tyre. Rezultati më i mirë i mundshëm nga të gjithë provat e bëra, u arrit nga rrjetat newcf dhe newff. necf → dy shtresa me nga një neuron secila, me funksione transferimi tansig, purelin dhe funksion trajnimi trainbr12. newcf → dy shtresa me nga një neuron secila, me funksione transferimi tansig, purelin dhe funksion trajnimi trainbr. Parametrat e trajnimit të rrjetës janë: Numri i epokave, performanca e trajnimit, saktësia e performancës, funksioni i trajnimit etj. Atëherë, nga trajnimi rrjetës së mësipërme newcf, vlera e 323–të e serisë parashikohet me një gabim ±10 nT. Duke ditur që DS X S X=(t j ) - S X (ti ) është e rendit të dhjetsheve13 nT, rezultati i arritur nuk është i kënaqshëm. Në vazhdim u ndryshua formati i të dhënave duke provuar vektorë me përmasa të ndryshme por duke mbajtur të pandryshuar rrjetën neuronike.Rezultati u përmirësua dukshëm kur përdorëm formatin e mëposhtëm të a, t, b. ìa320 (1,1: 320) ï a320 =3x320 → vlerat hyrëse ía320 (2, 2 : 321) ïa (3,3 : 322) î 320 çdo rrjesht i a zhvendoset me një vit nga rrjeshti paraardhës.
t320 = 1x320 → 4:323 janë vlerat e synuara të zhvendosura me një vit nga rrjeshti i fundit i a-së ìb320 (1,5 : 324) ï b320 = 3x320 → vlerat simuluese íb320 (2, 6 : 325) ïb (3, 7 : 326) î 320 rrjeshti i parë i b-së është i zhvendosur më një nga t dhe vetë rrjeshtat e b-së zhvendosen po me një nga njëri – tjetri . Vlera që parashikohet në këtë rast është vlera pasardhëse e rrjeshtit të tretë të b-së e cila përkon me vlerën e 327-të të serisë SX. Pas disa trajimesh të rrjetës së përdorur më sipër, u arrit në përfudimin se rezultati më i mirë i parashikimit të kësaj vlerë u gjendet me saktësi ± 1.2 nT. Po theksojmë se zgjedhja e këtj formati të a, t, b ka qënë praktike dhe nuk është e bazuar diku. Gjithsesi ka një logjikë në funksonimin më të mirë të rrjetës kur futen në trajnim vektorë me shumë përmasa. Arsyeja qëndron në faktin që sa më shumë vlera të futen në rrjetë aq më të lehtë e ka kjo e fundit për të dhënë vlera që devijojnë pak nga ato me të cilat është simuluar. 12 13
Matlab\toolbox\nnet\trainbr. Shih tab 2.1.3
35
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Megjithatë formati i zgjedhur nuk është standart. Dikush mund të përdorë formate të tjera në varësi të problemit që studion dhe saktësisë së rezultatit që kërkon të marrë. Do të quajmë gabim të rrjetës diferencen midis vlerës reale dhe vlerës që jep rrjeta. Pra, dX = T -O = ±1.2 nT ku T është vlera e llogaritur nga modeli Gufm1, O output/vlera dalëse të rrjetës. Në të njëjtën mënyrë veprohet për komponenten Y dhe Z dhe gabimet janë d Y = ±1.4 nT dhe d Z = ±1.3 nT përkatësisht. Të paraqitura grafikisht, vlerat reale dhe të parashikuara janë dhënë në fig.3.2.1 a,b,c. 4
1.9
parashikimi 1975-1976 i koponentes X
x 10
parashikimi simulimi
vlerat e fushes
1.8
1.7
1.6
1.5
1.4 1650
1700
1750
1800 1850 vitet
1900
1950
2000
Fig.3.2.1 a) Parashikimi 1975-1976 i komponentes Y 0 -1000
vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
-2000 -3000 -4000 -5000 -6000 1650
parashikimi simulimi 1700
1750
1800 1850 vitet
Fig.3.2.1 b)
36
1900
1950
2000
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
5.6
x 10
4
Parashikimi 1975-1976 i komponentes Z parashikimi simulimi
5.4 5.2 vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5 4.8 4.6 4.4 4.2 1650
1700
1750
1800 1850 vitet
1900
1950
2000
3.2.1 c) Në figurat 3.2.1 a, b, c është dhënë parashikimi 1975-1976, dhe vlera me të cilat është simuluar rrjeta neuronike për të tre komponentet e fushës magnetike X, Y, Z.
Meqënëse qëllimi ynë kryesor është parashikimi i fushës magnetike nga observatorët realë dhe duke ditur që seritë kohore me vlerat e matura janë relativisht të shkurtra, 30 deri 50 vjet, (përjashto disa observatorë tek të cilët seritë kohore janë më të gjata), atëherë duhet studjuar sjellja e rrjetës me seri të këtij rendi. Duke mos hyrë në detaje të përshkrimit të proçedurës, (pasi është e njëjtë me atë të ndjekur për serinë e gjatë), po tregojme vetëm se në këtë rast a, b, t janë: a35 = 3x35, t35 = 1x35, b35 = 3x35 dhe d = 0.7 nT. Ky rezultat është mjaft i mirë, por për ne është gjithashtu e rëndësishme që të arrihet një horizont sa më i madh parashikimi ( d >1). Rikthehemi përsëri në studimin e rrjetës me seritë e gjata. Shohim se ç’ndodh me parashikimin e rrjetës nëse rritim horizontin e parashikimit. Fillimisht marrim d = 5. Pra, vektori t me vlerat e synuara është i zhvendosur nga vektori a14 me vlerat që trajnohen, me 5 vjet. Kështu, a, b, t do të jenë : ìa300 (1,1: 300) ï a300 =3x300 → ía300 (2, 2 : 301) - vlerat hyrëse. ïa (3,3 : 302) î 300 t300 = 1x300 → 8:327 - vlerat e synuara
14
I zhvendosur nga a, do të kuptojmë nga rrjeshti i fundit i a-së.
37
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
ìb300 (1,9 : 308) ï b300 = 3x300 → íb300 (2,10 : 309) - vlerat simuluese, parashikohen vlerat 311, 312, ïb (3,11: 310) î 300 313, 314, 315. Pas proçesit trajnim-simulim (u ndërtua në Matlab program1), këto vlera u parashikuan me një gabim: d x = ±7 nT për X, d y = ±4 për Y dhe d z = ±4.8 për Z nT.
Grafikisht komponentet X, Y, Z jepen në fig.3.2.2. a, b, c. 4
1.9
x 10
Parashikimi 1960-1965 i komponentes X parashikimi vlera reale simulimi
vlerat e fushes
1.8
1.7
1.6
1.5
1.4 1650
1700
1750
1800 1850 vitet
1900
Fig.3.2.2 a)
Parashikimi 1960-1965 i komponentes Y 0 -1000
vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
-2000 -3000 -4000 parashikimi vlera reale simulimi
-5000 -6000 1650
1700
1750
1800 1850 vitet
Fig.3.2.2 b)
38
1900
1950
2000
1950
2000
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
4
5.6
x 10
Parashikimi 1960-1965 i komponentes Z parashikimi vlera reale simulimi
5.4 5.2 vlerat e fushes
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5 4.8 4.6 4.4 4.2 1650
1700
1750
1800 1850 vitet
1900
1950
2000
Fig.3.2.2 c) Në grafikët 3.2.2 a, b, c, jepet parashikimi 5 vjeçar, 1960-1965, për çdo komponente si dhe vlerat e modelit të këtyre serive. Është bërë një zmadhim i zonës së parashikimit për të parë më mirë detajet.
Ajo ç’ka mund të dallojmë lehtësisht është se për komponenten X kemi një gabim më të madh në parashikimin e vlerave 1960 – 1965. Meqënëse rrjeta e përdorur dhe parametrat e trajnimit janë të njëjtë për të tre komponentët, atëherë arsyeja e vetme që ndikon në këtë përkeqësim të parashikimit është vetë ecuria e kësaj komponenteje. Është e rëndësishme të njihet një ecuri paraprake e një serie kohore. Kjo do e thjeshtonte së tepërmi problemin, pasi duke ditur zonat me oshilacione të mëdha (nëse ato ekzistojnë), detyrimisht do të presim një përkeqësim të parashikimit të rrjetës, nëse këto zona do të ndodhen në zonën ku ne duam të parashikojmë . Në këtë rast, bëhen disa prova me rrjetën e përdorur dhe duke bërë kahasimet në vlerat e dala, merret vlera më e mirë e tyre. Siç shihet, është e vështirë të thuhet në mënyrë të ‘ngurtë’ se një rrjetë me numër të fiksuar shtresash dhe neuronesh mund të përdoret në çdo rast edhe sikur kjo të ketë dhënë rezultat të mirë në një rast të veçantë. Rrjedhimisht, është e nevojshme të ndryshohet metoda e trajnimit duke shtuar numrin e shtresave, numrin e neuroneve, epokat, duke bërë normimin e serisë kohore etj. Është detyrë e përdoruesit të rrjetës të gjejë në këto raste specifike se kush janë parametrat më të mirë të trajnimit të saj. Në vazhdim, u përdor përsëri program1 por duke ndryshuar përmasat e vektorëve me vlera nga një seri e shkurtër të modelit Gufm1 për parashikimin e vlerave 1960 – 1965. Për të mos e rënduar materialin nuk po i paraqesim grafikisht këto parashikime por po themi që gabimi i llogaritur në këtë rast për secilën komponente është: d x = ±1 2, d z = ±8 , d z = ±9.8 . Krahasuar me vlerat e parashikuar më sipër me serinë e gjatë, kemi një rritje gabimi. Kush është shkaku? Shpjegimi qëndron në krijimin e koeficientëve peshë. Për seritë e shkurtra influenca e një pike të zgjedhur në vlerën pasardhëse është dominuese në lidhje me pikat larg saj. Për rrjedhojë, vlera pasardhëse parashikohet me një saktësi të madhe. Për seritë e gjata, influenca e kësaj pike nuk është dominuese për shkak të numrit të madh të vlerave fqinje që ekzistojnë rrotull saj. Kjo ide do të përforcohet më qartë gjatë studimit global të fushës në kapitullin 4.
39
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Konkluzioni i rëndësishëm që nxirret nga krahasimi i rezultateve të marra kur përdoren seri të gjata dhe të shkurtra është se rrjeta sillet më mirë kur operojmë me seri të gjata kohore. Ky është një nga konkluzionet më të rëndësishëm të funksionimit të rrjetave neuronike i cili do të shfrytëzohet gjërësisht në paragrafët pasardhës. Duke rritur horizontin e parashikimit d = 10, d = 15, trajnuam rrjetën neuronike dhe simuluam atë me vlerat nga seritë e gjata të modelit Gufm1. Në fig.3.2.3, a, b, c, paraqiten grafikisht parashikimet për horizontin d = 10, nga viti 1955 -1965 . Komponentja X 4
1.9
vlerat e fushes /nT
4
parashikimi 10 vjet 1956-1965, X
x 10
1.8
x 10
parshikimi 10 vjet, 1955-1655, X X: 1965 Y: 1.86e+004
1.86
parashikimi G-modeli simulimi
1.855 X: 1965 Y: 1.855e+004
1.7
1.85
X: 1955 Y: 1.847e+004
1.6
1.845 1.5
X: 1956 Y: 1.838e+004
1.84 1.4 1650
1700
1750
1800 1850 vitet
1900
1950
2000
1945
1950
1955 vitet
1960
1965
Fig.3.2.4. a).
Komponentja Y parashikimi 10 vjet, 1955 - 1965, Y
parashikimi 1955-1965, Y 0
-550
vlerat e fushes/nT
-2000 -3000 -4000
1700
1750
1800 1850 vitet
1900
1950
-650 -700 -750 -800
X: 1955 Y: -780.3
parashikimi G-modeli simulimi
-850
simulimi parashikimi G-modeli
-5000 -6000 1650
X: 1965 Y: -549.9
-600
-1000 vlerat e fushes/nt
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
-900 -950 1954
2000
Fig.3.2.4. b).
40
1956
1958
1960 vitet
1962
1964
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Komponentja Z 4
4.43
5.4
4.42
5.2
4.41 vlerat e fushes/nT
vlerat e fushes/nT
4
parashikimi 10 vje 1955 - 1965, Z
x 10
5.6
5 4.8 4.6
parashikimi 10 vje 1955 - 1965, Z
x 10
X: 1965 Y: 4.423e+004
X: 1955 Y: 4.403e+004
4.4 X: 1955 Y: 4.396e+004
4.39 4.38 4.37
4.4 4.36
4.2 1650
1700
1750
1800 1850 vitet
1900
1950
1950
2000
1955 vitet
1960
1965
Fig.3.2.4. a). Në të majtë jepet ecuria e gjithë serisë me vlerat e modelit dhe ecuria e serisë së parashikuar nga rrjeta neuronike. Në të djathtë jepet e zmadhuar zona ku është bërë parashikimi.
d = 15, parashikohet 1955 -1970 Komponentja X 1.9
4Parashikimi 15 vjet1955-1970,X x 10
4 Parashikimi
1.88
1.8
1.87
1.7
1.86
1.6
1.85
1.5
1.84
1650 1700 1750 1800 1850 1900 Vitet
1950 2000
x 10
1900
15 vjet 1955-1970, X
X: 1906 Y: 1.871e+004
X: 1970 Y: 1.869e+004
X: 1906 Y: 1.859e+004
X: 1970 Y: 1.858e+004
parashikimi G-modeli 1920
1940
1960
Vitet
Fig.3.2.5. a).
Komponentja Y parashikimi 15 vjet 1955 - 1970, Y
parashikimi 15 vjet 1955 - 1970, Y
0 parashikimi G-modeli simulimi
-1000
X: 1970 Y: -432.9
-400 -500
-2000
vlerat e fush/nT
vlerat e fush/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
-3000 -4000
X: 1970 Y: -490.4
-600 -700 -800
-5000
X: 1955 Y: -780.3
parashikimi G-modeli simulimi
-900
-6000 1650
1700
1750
1800 1850 vitet
1900
1950
1955
2000
1960
1965 vitet
Fig.3.2.5. a).
41
1970
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Komponentja Z 4
5.6
4
parashikimi 15-vjet,1955-1970
x 10
4.43 vlerat e fushes/nT
5
4.6
X: 1741 Y: 4.719e+004
X: 1741 Y: 4.67e+004
X: 1970 Y: 4.431e+004
4.42 4.41
X: 1955 Y: 4.405e+004
4.4 X: 1955 Y: 4.396e+004
4.39
parashikimi G-modeli simulimi
4.38
4.4 4.2 1650
X: 1970 Y: 4.433e+004
4.44
5.2
4.8
parashikimi 15-vjet,1955-1970
x 10
G-modeli simulimi parashikimi
5.4
vlerat e fushes/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
4.37
1700
1750
1800 1850 vitet
1900
1950
1950
2000
1955
1960 vitet
1965
1970
Fig.3.2.5. a). Në të majtë jepet ecuria e gjithë serisë me vlerat e modelit dhe ecuria e serisë së 15 vjeçare e parashikuar nga rrjeta neuronike. Në të djathtë jepet e zmadhuar zona ku është bërë parashikimi.
Në fund të kësaj metode është llogaritur devijimi standart i rrjetës nga vlerat e modelit sipas formulës: d
dst =
å( T - O )
d
2
i =1
d
=
åd
2
i =1
d
Llogaritja e devijimit standart për vlerat e parashikuar nga rrjeta horizonti i parashikimit d 10 15 1 5 dst X(nT) 1.2 12.8 59 68.15 dstY(nT) 1.4 2.95 6.58 31.6 dstZ(nT) 1.3 3.74 33.53 51.9 Tab.3.2.1
Rritja e mëtejshme e horizontit të parashikimit, çon në rritjen e gabimit mbi 100 nT Duke parë se d f DS S (=t j ) - S (ti ) , themi se horizonti maksimal i parashikimit me metodën e parë është d max = 15 vjet.
3.3. Aplikimi i metodës së dytë për gjetjen e rrjetës më të mirë parashikuese Në metodën e parë treguam parashikimin e vlerave të fushës magnetike të gjeneruara nga modeli Gufm1 duke marrë horizontin e parashikimit d =1, 5, 10, 15. Metoda e dytë, siç e përmendëm tek paragrafi i serive kohore, është një vazhdim i metodës së parë.
42
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Vendoset kufiri minimal në horizontin e parashikimit d =1, parashikohet vlera pasardhëse e vektorit simulues, vlerë e cila futet në serinë kohore dhe në të njëjtën mënyrë parashikohët vlera pasaardhëse e kësaj vlere. Një skemë e thjeshtë që përdoret për parashikimin e vlerave të mësipërme jepet në fig.3 3.1. x (t) x(t-1) … x(t-m)
y (t + 1) x(t) x(t-1) … x(t-m)
Rrjeta parashikuese
y ( t+ 1 )
Rrjeta parashikuese
y ( y + 2)
a = {x(t),x(t-1)…x(t-m) }< X(t) a→3xm→3 rrjeshta, m shylla t = a+1→1xm→1 rrjeshta, m shylla b = a+4 →3xm→3 rrjeshta, m shylla
Fig.3.3.1 Skema e parashikimit me metodën e dytë. Vlera e parashikuar futet në hyrje dhe vazhdohet me parashikimin e vlerave të tjera. Horizonti i parashikimit është konstant, d = 1.
Në këtë rast, përmasat e vektorëve a, b, t nuk mbahen konstante. Kjo ndodh për shkak të futjes së vlerës që del pas simulimit si vlerë hyrëse. P.sh, në rast se përmasa filllestare e a-së është 3x300 dhe janë parashikuar 5 vlera pasardhëse atëherë në fund të proçesi, përmasa e a bëhet 3x305. Duke pasur parasysh skemën e parashikimit të medodës 2, u ndërtua në Matlab program2, me anën e të cilit u parashikuan 1 ,5, 10, 15 vlerat pasardhëse të vektorit simulues. Grafikisht do të paraqesim vetëm vlerat e parashikuar për horizontin 5, 10, 15. Vlerën e parë të parashikuar nuk po e paraqesim pasi ajo parashikohet me një saktësi shumë të madhe dhe rrjedhimish nuk vihen re ndryshimet në grafik. 1. Parashikimi i 5 vlerave pasardhëse 1955-1960. Komponentja X x 10
Parashikimi 1955 - 1960
4
x 10
komponentja X (nT)
4
1.9
komponentja X(nT)
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1.8 1.7 1.6 1.5 1.4 1650 1700 1750 1800 1850 1900 1950 2000
parashikimi 1955 - 1960 X: 1960 Y: 1.852e+004
1.855 1.85 1.845
X: 1960 Y: 1.851e+004 X: 1950 Y: 1.84e+004
1.84 Neural prediction Gufm model
1.835 1945
1950
1955
vitet
Vitet
43
1960
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
d X = T1960 - O1960 =18520 - 18510 = 10nT Komponentja Y Parashikimi 1955-1960, Y
Parashikimi 1955-1960, Y
0 -550 -600 Vlerat e fushes Y/nT
Vlerat e fushes Y/nT
-1000 -2000 -3000 -4000 -5000
X: 1960 Y: -646.2
-650 X: 1960 Y: -649
-700 -750 -800
X: 1955 Y: -780.3
-850
-6000 1650
1700
1750
1800 1850 Vitet
1900
1950
2000
Parashikimi G-modeli 1955
1956
1957
1958 Vitet
1959
1960
1961
d Y = T1960 - O1960 =18520 - 18510 = 3nT Komponentja Z 4
5.6
4
Parashikimi 1955-1960, Z
x 10
4.42
5.4
4.415
5.2
4.41
vlerat e fushes Z/nT
vlerat e fushes Z/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5 4.8 4.6
4.2 1650
Parashikimi 1955-1960, Z
X: 1960 Y: 4.411e+004
X: 1960 Y: 4.409e+004
4.405 4.4 4.395 4.39
4.4
x 10
X: 1955 Y: 4.395e+004
G-modeli Parashikimi
4.385
1700
1750
1800 1850 vitet
1900
1950
1954 1955 1956 1957 1958 1959 1960 1961 1962 vitet
2000
d Z = T1960 - O1960 =18520 - 18510 = 20nT Fig.3.3.1. Grafikët e vlerave të parashikuara dhe të modelit Gufm1 1955-1960, për komponentet X, Y, Z.
44
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
2. Parashikimi i 10 vlerave pasardhëse 1955-1965. Komponentja X 4
1.9
Parashikimi 1955-1965, X
x 10
4
Parashikimi 1955-1965, X
x 10
X: 1964 Y: 1.859e+004
1.86 vlerat e fushes, X/nT
vlerat e fushes, X/nT
1.8
1.7
1.6
1.855 X: 1964 Y: 1.855e+004
X: 1955 Y: 1.848e+004
1.85 1.845
X: 1955 Y: 1.847e+004
1.84
1.5
G-modeli parashikimi 1954 1956 1958 1960 1962 1964 1966 1968 Vitet
1.835
1.4 1650
1700
1750
1800 1850 Vitet
1900
1950
2000
d = T1965 - O1965 =18520 - 18510 = 40nT Komponentja Y parashikimi 1955-1965, Y
parashikimi 1955-1965, Y
0
X: 1965 Y: -530.6
-500
-1000 Vlerat e fushes Y/nT
Vlerat e fushes Y/nT
-550
-2000 -3000 -4000 -5000
X: 1965 Y: -549.9
-600 -650 -700 -750
-6000 1650
1700
1750
1800 1850 Vitet
1900
1950
G-modeli Parashikimi 1956
2000
1958
1960
1962 Vitet
1964
1966
d = T1965 - O1965 =18520 - 18510 = 19nT Komponentja Z 4
5.6
4
Parashikimi 1955-1965, Z
x 10
4.42 Vlerat e fushes Z/nT
5.2 5 4.8 4.6
X: 1965 Y: 4.422e+004
4.41 4.4
X: 1955 Y: 4.396e+004
4.39 4.38
4.4 4.2 1650
Parashikimi 1955-1965, Z
x 10
5.4 Vlerat e fushes Z/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1700
1750
1800 1850 Vitet
1900
1950
2000
parashikimi G-modeli 1950
1955
1960 Vitet
d = T1965 - O1965 =18520 - 18510 = 1.2nT Fig.3.3.2 Grafikët e vlerave të parashikuara nga rrjeta neuronike dhe të modelit Gufm1 1955-1965, për komponentet X, Y, Z.
45
1965
1970
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
3. Parashikimi i 15 vlerave pasardhëse 1955-1970. Komponentja X 4
4
Parashikimi 15 vjet 1955 - 1970, X
x 10
Parashikimi 15 vjet 1955-1970, X
x 10 1.875
1.85 1.8
Vlerat e fushes X/nT
Vlerat e fushes/nT
X: 1970 Y: 1.869e+004
1.87
1.75 1.7 1.65 1.6 1.55 1.5
1.865
X: 1970 Y: 1.867e+004
1.86 1.855 1.85 1.845 1.84
1.45
G-model Parashikimi
1.835
1.4
1700
1750
1800
1850 Vitet
1900
1950
1955
1960
1965 Vitet
1970
1975
Komponentja Y Parashikimi 15 vjet 1955-1970, Y
Parashikimi 15 vjet 1955-1970, Y
0
-400
Vlerat e fushes Y/nT
Vlerat e fushes Y/nT
X: 1970 Y: -460.9
-450
-1000 -2000 -3000 -4000 -5000
-500
X: 1970 Y: -490.4
-550 -600 -650 -700 -750 -800
X: 1955 Y: -780.7
-850
-6000 1650
1700
1750
1800 1850 Vitet
1900
1950
2000
1955
G- model Parashikimi 1960
1965
1970
Vitet
Komponentja Z 4
x 10
Parashikimi 1955-1970, Z
4
Parashikimi 1955-1970, Z
x 10
X: 1970 Y: 4.433e+004
4.44
5.4
4.43
5.2
Vlert e fushes, Z/nT
Vlert e fushes, Z/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5 4.8 4.6 4.4
4.42 4.41 4.4 4.39
1700
1750
1800 1850 Vitet
1900
1950
X: 1970 Y: 4.432e+004
X: 1955 Y: 4.395e+004
1955
1960
G-modeli hz 1965 Vitet
Fig.3.3.3 Grafikët e vlerave të parashikuara nga rrjeta neuronike dhe të modelit Gufm1 1955-1970, për komponentet X, Y, Z.
46
1970
1975
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Llogaritim edhe për metodën e dytë të parashikimit devijimin standart të rrjetës Llogaritja e devijimit standart për vlerat e parashikuar nga rrjeta horizonti i parashikimit 1 5 10 15 dst X(nT) 1.5 4.58 16.5 11.88 dsty(nT) 1.2 1.71 8.77 6.81 dstZ(nT) 1.3 11.9 7.07 7.09 Tab.3.3.1. Devijimi standart i vlerave të parashikuar nga vlerat e modelit Gufm1.
Krahasimi i dy metodave parashikuese
Është fare e qartë përparësia e metodës së dytë ndaj të parës. Kjo për dy arësye. Së pari nga metoda e dytë merret një parashikim më i saktë i vlerave të fushës gjeomagnetike për horizont të njëjtë parashikimi. Së dyti vlerat dalëse të rrjetës kanë një përputhje të shkëlqyer me vlerat me të cilat ajo trajnohet (shih grafikët e parashikimit të metodës 2). E meta e kësaj metode është koha e gjatë e trajnimit sepse pas çdo vlerë parashikuese bëhët ritrajnimi i rrjetës. Metoda e parë është efikase kur përdoret në parashikime me horizont të vogël. Është e thjeshtë në përdorim pasi mund të përdoret edhe në GUI. Si përfundim, në parashikimin e fushës magnetike me vlerat reale të vëzhguara nga obsevatorët ne do të përdorim rrjetat parashikuese newcf me metodë parashikimi metodën 2.
3.4. Aplikime të modelit neuronik në parashikimin e vlerave reale të fushës gjeomagnetike Do të përdorim një zbatim konkret në parashikimin e fushës magnetike me vlera reale të vëzhguar nga një observator. Observatori në të cilin do të studiohet fusha magnetike është Niemegk/NGK me kordinata 520 4’ dhe 120 41’. Vlerat e fushës magnetike janë matur nga viti 1932.5 – 2005.5. Seria kohore S(t) përmban 74 vlera. Për të bërë një krahasim midis modeli tonë të parashikimit dhe modeleve të tjerë parashikues, përzgjodhëm modelin IGRF 10 i cili gjeneron vlerat e fushës magnetike për periudhën kohore 1940 – 2014. Përdoret përsëri program2 dhe do të parashikojmë vetëm periudhën 15 vjeçare, 1990-2005
47
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
Parashikimi 15 vjet për secilën komponente të fushës në observatorin Niemgk/NGK Komponentja X 4
x 10
Parashikimi 15 vjet(1990 - 2005) ne observatorin NGK
1.89
1.88
Vlerat e fushes X/nT
Vlerat e fushes X/nT
Parashikimi 15 vjet(1990 - 2005) ne observatorin NGK
4
x 10
1.89
1.87 1.86 1.85
X: 2005 Y: 1.889e+004
1.885
X: 2005 Y: 1.88e+004
1.88 1.875
X: 1990 Y: 1.876e+004
Parashikimi i NN E vezhguar nga NGK
1.84
X: 2005 Y: 1.878e+004
Parashikimi i NN E vezhguar nga NGK
1.87
Llogaritur nga IGRF 10
Llogaritur nga IGRF 10
1980
1940 1950 1960 1970 1980 1990 2000 2010
1985
1990
1995
2000
2005
Vitet
Vitet
Komponentja Y Parashikimi 15 vjet (1990 - 2005)ne ne observatorin Niemegk NGK
Parashikimi 15 vjet (1990 - 2005)ne ne observatorin Niemegk NGK
500
Vlerat e fushes Y/nT
Vlerat e fushes Y/nT
800
0 -500 E vrojyuar nga NGK
-1000
X: 2005 Y: 597
X: 2005 Y: 528.9
400 X: 1990 Y: 127.5
200 0
1940 1950 1960
E vrojyuar nga NGK
X: 1990 Y: -5.2
-200
E llogariturnga IGRF 10
X: 2005 Y: 568.7
600
Parashikimi i NN
Parashikimi i NN E llogariturnga IGRF 10
1970 1980 1990 2000
1985
Vitet
1990
1995
2000
2005
Vitet
Komponentja Z 4
x 10
Parashikimi 15 vjet (1990 -2005) ne observatorin NGK
4
x 10 4.53 vlerat e fushes Z (nT)
4.55 vlerat e fushes Z (nT)
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
4.5 4.45 4.4 Llogaritur nga IGRF 10 Parashikimi i NN E vrojtuar nga NGK
4.35 1940
1950
1960
1970 1980 Vitet
1990
2000
4.52
Parashikimi 15 vjet (1990 -2005) ne observatorin NGK Llogaritur nga IGRF 10 Parashikimi i NN E vrojtuar nga NGK
X: 2005 Y: 4.525e+004
X: 2005 Y: 4.518e+004
4.51 4.5 4.49
X: 1990 Y: 4.483e+004
4.48
2010
1990
1995
2000
2005
Vitet
Fig.3.4.1. Në grafikët e mësipërm jepet ecuria e fushës magnetike në observatorin NGK për: vlerat reale të observuara nga observatori, vlerat e llogaritura nga IGRF dhe vlerave të parashikuara nga modeli ynë parashikues.
Deivijimi standart midis vlerave të parashikuara nga rrjeta neuronike dhe vlerave reale të observatorit është: stdx = 38.56 nT, stdy = 17.12 nT , stdz = 32.04 nT.
48
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Në lidhje me devijimet standarte të vëzhguara në rastin e përdorimit të rrjetës me vlerat e gjeneruara nga modeli Gufm, shohim një rritje të gabimit. Kjo pritej pasi është në përputhje me konkluzionet e nxjerra më sipër. Rritja e këtij gabimi vjen si pasojë: 1. E ecurisë më të çrregullt të serive me vlera reale të fushës magnetike krahasuar me ato të gjeneruar nga modeli Gufm1. 2. Në përkeqësim ka ndikuar gjithashtu dhe dimesioni i serisë i cili është relativisht i shkurtër po të krahasohet me dimesionin e serive të përftuar nga modeli Gufm Krahasimi midis vlerave dhe i grafikëve të parashikimit midis modelit neuronik të ndërtuar pej nesh dhe modelit IGRF 10 çon në përfundimin se modeli i rrjetës neuronike parashikon më saktë nga sa llogarit modeli IGRF 10. Në të vërtetë, jo në çdo rast do të jemi të sigurtë për të thënë se modeli i rrjetës neuronike është superior ndaj modelit IGRF. Për këtë rikujtojmë konkluzionin e rëndësishëm që nxorëm në kapitullin 3 ku vihet në pah ecuria e një serie kohore. Nga përfundimet e marra më sipër arrjimë në konkluzioni se rrjeta më e mirë që do të përdoret në parashikimin global të fushës magnetike është newcf ( shih fig.3.4.2) me 3 shtresa neuronike, 3 neurone në shtresën e parë, 2 neurone në shtresën e dytë, një neuron në shtresën e tretë. Funksionet e trasferimit janë tansig në 2 shtesat e para dhe purelin në shtresën e fundit. Në raste të veçanta mund të ndryshohen elementët e rrjetës duke futur edhe funksionin transferues logsig ose duke rritur numrin e shtresave. Funksioni trajnues është trainbr dhe si metodë parashikimi do të përdoret metoda 2 shtresa 1 1 1
n
hyrje W 1
1,1
1 W1,2
P
Σ Σ
1 1,3
W
n12
f11
b
Wi 2,j
shtresa 3
n12
Σ
a12
f12 bi2
Wi 3,1
n22 a13
f 1 i
a
f 21
n13
Σ
shtresa 2 1 1
1 3
Σ
tansig
f22
a
2 2
Σ
n3
f13
b3
Y = f(LW▪a+b) tansig
Fig.3.4.2. Skema e rrjetës së përdorur newcf.
49
dalje
purelin
Y
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Kapitulli 4 Studimi global i fushës magnetike ka për qëllim parashikimin e vlerave të fushës gjeomagnetike në çdo pikë të globit për një periudhë disa vjeçare duke përdorur vlerat reale të matura nga observatorët. Praktikisht kjo gjë është e pamundur pasi kemi theksuar ekzistencën e një numri të pakët observatorësh dhe shpërndarjen jo uniforme të tyre në të gjithë globin. Ndërtimi i observatorëve imagjinarë është mënyra që do të ndiqet në parashikimin e fushës magnetike globale. Fillimisht do të merremi me përpunimin e vlerave të observatorëve dhe më pas do të ndërtohet modeli neuronik për parashikimin hapësiror dhe kohor të fushës magnetike. 4.1. Vlerat reale të fushës magnetike të matura nga observatorët dhe përpunimi i tyre Në përgjithësi observatorët kryejnë shumë matje15 gjatë një periudhe 1 vjeçare. Bëhet mesatarizimi i të gjitha matjeve të kryera dhe kjo vlerë mesatare njihet si vlerë e fushës magnetike e një viti të caktuar. Jepen gjithashtu vlerat e deklinacionit, intesitetit etj, të cilat ne nuk do t’i studjojmë. Të dhënat reale për secilin observator u morën në: http://Web.dmi.dk/fsWeb/ProjectsWdcc1/homepage.html Numri fillestar i observatorëve të marra nga adresa e mësipërme është 152. Problemi i parë që u shafaq ishtë mospërputhja e periudhave kohore të matjes (observatorët nuk kanë filluar matjet në të njëjtin vit). Kjo për shkaqe të ndryshme si psh. probleme teknike, ndryshimi i vendodhjes së observatorit, ndryshim i teknikës se matjes etj. Problem tjetër është mungesa e matjeve për periudha të gjata kohore. Nga një analizë fillestare u vu re se numri i observatorëve që kanë kryer matje në periudha të gjata (mbi 100 vjet) është shumë i vogël. Duke parë se shumica e observatorëve kishin një periudhe 45 vjeçare matjeje, u vendos të bëhet përzgjedhja e atyre observatorëve që plotësonin dy kushtet e mëposhtme. 1. Periudha e matjeve të kryera nga observatori të ndodhej në intervali kohor 1960.5 – 2000.5 ±5 vjet. 2. Shpërndarja gjeografike të ishte sa më uniforme (aty ku ishte e mundur përzgjedhja). Plotësimi i kërkesës 2, është i vështirë për shkak të mosekzistencës së observatorëve në disa zona të globit për arsyet që i kemi dhënë më lart. Numri i obervatorëve të përzgjedhur është 10516 por në 68 prej tyre, brenda intervalit 1960.5 – 2005.5, ka vite që nuk janë kryer matje.
15 16
Shih paragrafin ‘Modelet e llogaritjes së fushës gjeomagnetike’ kapitulli 2. Lista e plotë e gjithë observatorëve që janë përdorur për studimin global të fushës jepet në shtojcë.
50
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Përpunimi i vlerave reale të fushës
Observatorët e vedosur në pika të ndryshme të globit kanë lartësi të ndryshme mbi nivelin e detit. Duke ditur që fusha magnetike është funksion i largësisë nga qëndra e tokës, atëherë për të njëjtin observator do te kemi një ndryshim në vlerën reale të fushës për shkak të disnivelit që ekziston. Fillimisht u bë reduktimi i vlerave të komponenteve të fushës magnetike në sipërfaqen e Tokës ku h = 0 m, duke konsideruar vetëm fushën dipolare, e cila përbën rreth 93 % të fushës globale gjeomagnetike. Ky reduktim u bë duke zbatuar formulën: h DBx , y , z = 3Bx , y , z RT ku: Bx,y,z është fusha , h lartësia e vendodhjes së observatorit, RT rrezja e Tokës. Në vijim, të gjitha vlerat e fushës që do të parashikohen në një pikë të globit do të mendohet sikur janë matur nga një observator të ndodhur në nivelin h = 0. Fillimisht duhet zgjidhur problemi i mungesës së matjeve në disa vite të 68 observatorëve. Plotësimet e këtyre vlerave u bënë me rrjetën dhe metodën e përdorur në kapitullin 3, në të cilin u studjua sjellja e rrjetave neuronike me vlerat reale të observatorit NGK. Metoda dhe rruga e ndjekur është e qartë dhe nuk po hyjmë në detajet e parashikimit. U ndërtuan 68 programe në Matlab (për secili obsrvator në të cilin kishte mungesë të matjeve), u ekzekutuan me vlerat përkatëse të çdo observatori dhe u parashikuan vlerat e munguara. Disa nga observatorët ku u bënë plotësimet janë: ABK(1960.5-1966.5, 2005.5), ALE(1960.5, 2004.5-2005.5), TAN(1977.5-1982.5, 1987.5, 1991.5), BEL(1960.5-1965.5), BDV(1960.5-1966.5) etj. 4.2. Krijimi i observatorëve imagjinarë. Paraqitja e fushës gjeomagnetike globale për një periudhë të caktuar bëhet zakonisht me anën e izolinjave ( vijat në të cilat fusha magnetike ka vlerë të njëjtë). Për të patur një paraqitje sa më të saktë dhe për të mos u shmangur vlerave reale e fushës magnetike kërkohet një numër shumë i madh pikash të shpërndara uniformisht në sipërfaqen e globit. Duke parë hartën globale (shih fig 4.3) të shpërndarjes së observatorëve, e shohim të pamundur ndërtimin e izolinjave me numrin aktual që kemi për shkak se ky numër i përzgjedhur nga ana jonë është shumë i vogël dhe shpërndarja e tyre është jo uniforme Pikat në hartë në të vërtetë përfaqësojnë observatorë me koordinata gjeografike gjatësi dhe gjërësi gjeografike. Marrim një pikë A(m,n) të cilën e identifikojmë me një observator diku në sipërfaqen e Tokës. m është gjatësia gjeografike dhe n është gjërësia gjeografike. m Î [-900 ;900 ] dhe n Î [00 ;3600 ] . Numri i observatorëve të marrë në studim N A( m;n ) = 105 . Meqënëse qëllimi ynë kryesor është studimi i fushës magnetike duke shfrytëzuar vlerat e observatorëve realë, dhe mëqënëse numri i tyre është i vogel për një studim të tillë,
51
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
atëherë lind nevoja e krijimit të observatorëve të rinj të shpërndarë uniformisht në sipërfaqen e Tokës të cilët ne do t’i quajmë obsevatorë imagjinarë17. Përdorimi i rrjetave neuronike për krijimin e observatorëve imagjinarë
Duke përftuar nga eksperienca e krijuar në përdorimin e rrjetave neuronike për parashikimin e vlerave të fushës magnetike lindi ideja e përdorimit të tyre në parashikimin hapësiror të fushës magnetike. Në të vërtetë ndryshimet midis dy proçeseve janë shumë të mëdha sepse: 1. Seritë e formuara nga kordinatat gjeografike nuk janë një seri kohore dhe si të tilla ato nuk e gëzojnë vetinë e të qënurit funksion i vlerave të barazlarguara . 2. Vlerat e fushës magnetike janë funksion i 3 kordinatave. Gjatësisë gjeografike, gjërësisë gjeografike, largësisë nga qëndra e tokës. Varësinë nga koordinata e tretë e zgjidhëm me anën e reduktimit të lartësisë (shih më lart). Zhvendosja sipas njërës kordinatë duke mbajtur tjetrën të pandryshuar është e pamundur pasi në një paralel ose meridian të fiksuar, mund të ndodhen e shumta 1 ose 2 obsevatorë (në disa raste nuk ka, shih fig.2.2.1). Rrjeta nuk mund të funksionojë me kaq pak vlera. Pas shumë përpjekjesh të bëra dhe falë ndihmës së udhëheqësit të kësaj diplome, Prof. B. Duka u arrit të ndërtohej një strukture e re të dhënash sipa të cilës vlerat hyrëse janë kordinata gjeografike, vlerat e synuara janë vlerat koresponduese të fushës magnetike, vlerat simuluese janë kordinata gjeodrafike. p është një matricë e përbërë nga dy vektorë p[p1;p2], ku: p1→ ka për elementë të gjitha gjatësitë gjeografike të observatorëve të marrë në studim. dim(p1) = 105. p2→ka për elementë të gjitha gjërësitë gjeografike të observatorëve të marrë në studim. dim(p2) = 105. t → vektori i vlerave të synuara, ka për elementë vlerat respektive të fushës magnetike të koordinatave të p. d = [d1; d2]→ matrica e vlerave simuluese ku; d1→ merr çdo vlerë të gjatësisë gjeografike në segmentin d1Î [-900 ;900 ] dhe d2→ merr çdo vlerë të gjërësisë gjeografike në segmentin d2 Î [00 ;3600 ] . Dimesionet e d1 dhe d2 janë të pavarura nga dimesionet e p1 dhe p1. Ne do të trajnojmë rrjetën neuronike me koordinatat gjeografike p dhe si vlera të synuara marrim vlerat respektive të këtyre kordinatave t. Kështu, gjatë trajnimit rrjeta e ka ndërtuar funksionin e saj F (duke u bazuar në gjithçka që është thënë më lart) dhe rrjedhimisht n.q.se simulojmë rrjetën me koordinatat e një pikë të çfarëdoshme A(m,n), duhet të marrim vlerën përkatëse të fushës në atë pikë. Por si arrin rrjeta neuronike të ‘gjejë’ këtë vlerë të fushës? Do të kujtojmë përsëri një konkluzion të rëndësishëm që është nxjerrë në kapitullin 3 mbi ndikimn e secilës vlerë të serisë në parashikimin e vlerës pasardhëse. Kemi thënë se vlera e parashikuar është më e afërt në vlerë me paraardhësen e saj.
17
Nuk ekzistojnë realisht por do të krijohen.
52
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Situata është e njëjtë. Kur simulohet rrjeta me kordinatat e pikës/observatorit imagjinar A, vlera e fushës magnetike në atë pikë do të ndikohet më shumë nga vlera e fushës së pikës me kordinata gjeografike që ndodhet më afër A. Nisur nga ideja e mësipërme u bënë prova të shumta me rrjetat feed-forward backpropagation me fuksione të ndryshme trajnimi (trainbfg, trainlm, trainbr etj), për gjenerimin e vlerës se fushës së një observatori koordinatat e të cilit ishin futur në trajnim. Më thjesht, u përqëndruam në pikën A(520 4’ , 120 41’ ) e cila është vendodhja e observatorit NGK (NGK është në listën e observatorëve të përzgjedhur nga ne). Rrjetat e zgjedhura janë newff dhe newcf (të tjerat nuk dhanë rezultatin e dëshiruar) të përdorura në kapitullin 3. Vlerat hyrëse p [p1;p2] → u morën të gjithë kordinatat e observatorëve të përzgjedhur. t→ target u morën të gjithë vlerat e respektive të fushës (për njërën komponente) magnetike e të gjithë observatorëve të përzgjedhur, për vitin 2005.5. Pas trajnimit, u bë simulimi i rrjetës me kordinatat e pikës A = d[d1; d2] = d[520 4’; 120 41’]. Rezultati i marrë ishte larg vlerës reale të kompinentes X e cila është : X(2005.5) = 18805 nT. Në kapitullin 3 u vu re një element shumë i rëndësishëm që ndoshta nuk është theksuar shumë. Formati i të dhënave (vektori hyrës, trajnues, dalës) është i të njëjtit rend por kur përdoret e njëjta rrjetë neuronike për parashikimin e të tre komponenteve të fushës magnetike ky format ndryshon. Për rrjedhojë devijimi standart i rrjetës nuk është i njëjtë. Shkaku është ndryshimin midis vlerave të fushës të komponenteve X, Y, Z . Për të shmangur këtë ndryshim, bëhet pjestimi i vlerave trajnuese dhe simuluese, me një numër18 për t’i sjellë ato në rend të njëjtë, kështu ne mund të përdorim të njëjtën rrjetë për parashikimin e të tre komponenteve të fushës magnetrike. Kjo artificë e përdorur pak në kapitullin 3, është mjaft e rëndësishmne të aplikohet në këtë moment, pasi do të bëjë të mundur që vlerat hyrëse dhe vlerat e synuara të kenë rend të njëjtë. Kujtojmë që d1 Î [-900 ;900 ] , d2 Î [00 ;3600 ] , dhe kufijtë në të cilët lëviz secila komponente janë: { X Î [-17000; 42000], Y Î [-18000;18000], Z Î [-67000;61000]}nT . [5]. Duket qartë ndryshimi midis vlerave që trajnohet dhe atyre që simulohet rrjeta. Duke pasur parasysh ç’ka u tha më lart, u realizuan shumë prova me dy rrjetat (newff , newcf) duke ndryshuar vzhdimisht numrin e shtresave neuronike, numrin e neuroneve, epokat e trajnimit, numrin e pjestimit të vlerave etj, dhe u arrit në përfundimin se rrjeta që jep parashikimin më të mirë është newcf dhe për përdorimin i saj u ndërtua program3 të cilin do ta përdorim gjërësisht më në vazhdim. net = newcf(minmax(p),[14,1,1,1,1,1,1,1,1,1,1,1,1,1,1],{'tansig','tansig','tansig','tansig',.. 'tansig', 'tansig', 'tansig','tansig','tansig','tansig', 'tansig', 'tansig','tansig','tansig',... 'purelin'},'trainbr'); Numri i madh i shtresave dhe i neuroneve nga e cila përbëhet rrjeta, bën të pamundur paraqitjen skematike të saj.
18
Zgjedhja e tij është në dorë të përdoruesit të rrjetës.
53
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Nga ekzekutimi i program3, vlera X u arrit të parashikohej me një gabim d = 50nT X(sim)(2005.5) = 18855 nT. Ky është një rezultat mjaft i mirë. Në vazhdim u bënë prova të tjera me observatorë që ndodhen në zona me dendësi të vogël. Psh. simulimi i rrjetës me kordinatat e obsrvatorit Huancayo/HUA , [-120.05’;2840.6’], jep Xsim = 25902 nT, Ysim = -786.7 nT, Zsim = 441.66 nT, ndërsa vlerat reale janë: Xreal = 25802 nT, Yreal = -420 nT, Zreal = 450 nT, nga ku: d x = 100nT , d y = 326nT , d z = 9nT . Nga sa shihet, kemi një përkeqësim të rezultatit të parashikimit. Në vazhdim, simulimi i rrjetës u bë në zonat ku nuk ekzistojnë observatorë (Oqeani Paqësor). Kështu, nga simulimi i rrjetës me kordinatat e pikës A( -400,2020) (e cila obervatorin real më të afërt e ka 450 larg në gjatësi gjeografike dhe po kaq larg në gjërësi gjografike), u morën rezultatet: Xsim = 20912 nT, Ysim = 10112 nT, Zsim = -45065 nT . Në pamundësi për të krahasuar vlerat e gjetura me vlerat reale, u bë krahasimi midis rezultateve të rrjetës neuronike dhe vlerat që gjeneron modeli IGRF. Këto vlera sipas IGRF janë: XIGRF = 22736 nT, YIGRF = 9302 nT, ZIGRF = - 42916 nT, dhe gabimet përkatëse janë: d x = 1824nT , d y = 820nT , d z = 2149nT . Duke mos përjashtuar një gabim të madh edhe të modelit IGRF 10 në këtë zonë të globit, përsëri rezultati i marrë nga rrjeta është shumë larg parashikimeve që u morën nga e njëjta rrjetë për observatorët NGK dhe HUA. Për të qënë më të sigurtë për këtë rezultat të papritur , u bënë trajnim simulime të tjera (duke bërë edhe ndryshime në rrjetën neuronike) dhe u vërtetuan afërsisht të njëjtat përfundime. Ajo çka u vu re gjithashtu gjatë këtyre provave, është se rrjeta neuronike nuk jep të njëjtin rezultat kur trajnohet dhe simulohet me të njëjtat vlera. Ndryshimet nga njëri parashikim në tjetrin për të njëjtat kushte shkonin deri në 100 nT në disa raste. Këto përfundime, edhe pse negative, krijuan një vizion të ri mbi funksionimin e rrjetave neuronike për parashikimet hapësirore të fushës magnetike dhe në bazë të tyre u arrit në dy konkluzione shumë të rëndësishme: 1. Parashikimi i vlerave të fushës së një observatori imagjinar, është më i sakë nëse ky observator ndodhet në zona ku dendësia e observatorëve realë është me e madhe dhe e kundërta, ky parashikim i largohej mjaft vlerës reale të fushës kur obesvatori imagjinar ndodhet në zona të golbit në të cilat nuk ka observatorë realë. 2. Rrjeta e trajnuar dhe e simuluar disa herë në të njëjtën pikë të globit, nuk jep të njëjtin rezultat në parashikim. P.sh, në ekzekutimin e parë të program3 më lart treguam që vlera e parashikuar Bx(sim)(2005.5) = 18855 nT. Kur ekzekutimi i program3 kryhet disa herë pa bërë asnjë ndryshim, Bx(sim)(2005.5) nuk përsëritet por ndryshon nga vlera reale me ± 30 nT. Le të analizojmë secilin nga konkluzionet e nxjerra. Në rasti e parë, devijimi nga vlera reale në ato zona ku nuk ka observatorë është i justifikueshëm, pasi nuk ekziston një pikë e afërt vlera e së cilës të ndikojë në vlerën që parashikojmë por ndikimi kryesor vjen nga pikat e largëta e për rrjedhojë vlera e parashikuar do të jetë e krahasueshme me vlerën e fushës magnetike që iu korespondon këtyre pikave. Shkaku i dytë për mos përsëritjen e vlerës së parashikuar është rezultat i inicjimit fillesatr të peshave. Kemi thënë se peshat fillestare të çdo trajnimi të rrjetës inicjohen në mënyrë të rastësishme në vlera të vogla. Kështu, nga trajnimi në trajnim, funksioni F i krijuar nga
54
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
rrjeta nuk është në çdo rast ekzaktësisht i njëjtë, për rrjedhojë, edhe vlerat në dalje do të ndryshojnë midis tyre. Gjithashtu, në rastet ku distancat midis observatorëve janë të mëdha, edhe kufijtë në të cilët ndryshon fusha magnetike janë të konsiderueshëm, rrjeta e ka të ‘vështirë’ që në trajnime të ndryshme të japë të njëjtën vlerë brenda këtyre kufijve. Si realizohen korigjimet e këtyre dy defekteve të konkluzioneve 1 dhe 2? Mënyrat janë dy: 1. Meqënëse rezultati që jep rrjeta është më i mirë kur ajo simulohet me kordinata që ndodhen në zonën me dendësi të madhe të observatorëve, atëherë duhet të fillohet krijimi i observatorëve imagjinarë në një zonë të globit ( psh Evropë) ku realisht kemi një dendësi të madhe të observatorëve realë dhe observatori i krijuar të futet në trajimin e rrjetës, duke e konsideruar atë si një observator ‘real’. Kështu, numri i observatorëve ‘realë’ do të jëtë N = 105 + 1. Më tej krijimi i observatorëve imagjinarë të bëhet duke u zhvendosur drejt zonave me më pak observatorë realë. Zhvendosja duhet të bëhet me anën e një funksioni të ndërtuar prej nesh ku hapi i zhvendosjes sipas gjatësisë dhë gjërësisë gjeografike të merrt sa më i vogël i mundshëm për të patur një rezultat sa më të mirë. Në fund të këtij proçesi do të kishim N = 105 + i, ku i është numri i observatorëve imagjinarë të krijuar prej nesh. 2. Korigjimi për shkak të trajnimit arrihet duke bërë të mundur një inicjim fillestr të peshave të kontrolluar prej nesh (nuk e provuam) ose mesatarizimin e disa vlerave që 1 k merren nga disa trajnim-simulime të së njëjtës pikë. Në këtë rast, O p = å o j , ku O p k j =1 është vlera përfundimtare e parashikuar nga rrjeta, k është numri i trajnim-simulimeve. Po të kryejmë një llogaritje të thjeshtë të kohës që i duhet rrjetës për të kryer proçesin e trajnim-simulimit për krijimin e një numri minimal observatorësh prej 1500, arrihet në konkluzioni se praktikisht është e pamundur të realizoheshin të dy mënyrat rigorozisht nga ana jonë, jo vetëm për arsye teknike19 por edhe për shkak të kohës së shkurtër që kishim në dispozicion. Duke analizuar problemin e krijimit të observatorëve imagjinarë, në të vërtetë ekzistojnë 2 metoda që mund të ndiqen: Metoda 120
Të krijohen fillimisht disa obervatorë në Europë, pastaj në Azi, Amerikën e Veriut dhe në fund në hemisferën jugore. Pra, të parashikohet fusha magnetike e observatorit të parë imagjinar për një vit të caktuar, (p.sh për vitin 2005.5) i cili të merret sa më afër një observatori real. i = 1 dhe ky observator të futet përsëri për parashikimin e vlerës së fushës për observatorin e dytë imagjinar, përsëri për 2005.5 dhe kështu vazhdohet për të gjithë observatorët. E njëjta proçedurë ndiqet për vitin 2004.5 dhe kështu me radhë deri në vitin 1960. Kjo është dhe metoda e ndjekur prej nesh për krijimin e këtyre observatorëve. Fillimisht krijuam disa observatorë imagjinarë në Evropë (më vonë një pjesë e tyre nuk u mor me qëllim që të krijohej një homogjenitet me pjesën tjetër të globit). Observatori i 19
Mugesa e kompjuterave me aftësi të madhe përpunuese Metoda 1 është ndjekur orej nesh në krijimin e observatorëve imagjinarë. Shpjegimi i zgjeruar jepet më poshtë. 20
55
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
parë i krijuar ishte A(550, 80) për vitin 2005.5, i cili u fut përsëri në trajnimin e rrjetës për krijimin e observatorit të dytë imagjinar përsëri për vitin 2005.5 dhe kështu me radhë deri sa u krijuan 137 të tillë ku i fundit ndodhej në Polin e Jugut. Mandej u vazhdua me parashikimin e vlerave të fushës të këtyre observatorëve për vitin 2004.5 dhe kështu me radhë deri në vitin 1960.5. Zhvendosja në sipërfaqen e tokës u bë pa ndonjë funksion të veçantë por thjesht u përpoqëm të bënim një mbulim sa më mirë të gjithë sipërfaqes së Tokës. Trajektorja e ndjekur jepet në fig.4.1, ku janë treguar zonat në të cilat sipas radhës( nga 1 – 7) janë krijuar observatorët imagjinarë. Ne nuk kemi marrë mesataren e vlerave dalëse të disa tranjnimeve( për mungesë kohe), kështu do të pranojmë një luhatje nga vlera reale për shkak të trajnim - simulimit. Për të bërë një krahasim midis vlerave të fushës të parashikuar nga rrjeta neuronike dhe vlerave të fushës që llogarit modeli IGRF 10 për një observator imagjinar të rastit, u mor observatori imagjinar A(65; 80) dhe në grafikët e fig.4.1, jepet ecuria e të tre komponenteve të fushës magnetike nga viti 1960.5 – 2005. x 10
Parashikimi i vlerave tw fushw nw observatorin imagjinar A(65;80)
Parashikimi i vlerave tw fushw nw observatorin imagjinar A(65;80) 3700
1.03
3600 Vlerat e fushes, Y/nT
1.02 1.01 1 0.99 0.98 0.97 0.96 1960
1980
Llogaritur nga IGRF 10 Parashikuar nga NN
3500 3400 3300 3200
1990
2000
2010
3000 1960
x 10
5.89
3100
Llogaritur nga IGRF 10 Parashikuar nga NN 1970
5.9
Vlerat e fushes, Z/nT
4
1.04
Vlerat e fushes, X/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
4
Parashikimi i vlerave tw fushw nw observatorin imagjinar A(65;80) Llogaritur nga IGRF 10 Parashikuar nga NN
5.88 5.87 5.86 5.85 5.84 5.83
1970
1980
Vitet
1990 Vitet
2000
2010
5.82 1960
1970
1980
1990
2000
Vitet
Fig.4.1. Ecuria e komponentëve të fushës magnetike nga 1960.5-205.5 në observatorin imagjinar A(65; 80).
Në grafikët e mësipër, ajo që vihet re është një luhatje nga vlera në vlerë e vlerave të fushës magnetike të parashikuara nga rrjeta neuronike. Në fakt edhe vlerat reale të studiuara në observatorin NGK kanë luhatje të tilla por jo kaq të theksuara. Shkaku i parë i luhatjeve që vërehen në parashikimin e rrjetës janë rezultat i mos marrjes së mesatares së disa trajnim-simulimeve. Shkaku i dytë është zhvendosja me hap të madh në sipërhaqen e globit. Metoda 2
Ekziston një mënyrë tjetër më efikase të cilën ne e provuam për tre observatorë për të parë përmirësimet që do të sillte. Zhvendosja (mundësisht sa më e vogël) në sipërfaqen e globit duhet bërë në mënyrë të tillë që në observatorin imagjinar që krijohej të parashikoheshin të gjitha vlerat e fushës nga 1960.5 – 2005.5, (kurse ne parashikuam vlerat e fushës për vitin 2005.5 për të gjithë observatorët, vazhduam për 2004.5 e kështu me radhë). Në fakt nuk duhej të kishte ndryshim midis dy metodave, por rezultatet tregojnë një përmirësim në rast se aplikohet metoda e dytë. Për të parë ndryshimin, në grafikët e fig.4.2, është dhënë parashikimi dhe vlerat reale të matura në tre observatorë, COI, DOB,GCK për komponenten Z të fushës, me metodën e dytë.
56
2010
w.
A B B Y Y.c
om
Y
F T ra n sf o
bu to re he
om
w
4
3.68
x 10
Parashikimi i fushes ne observatorin COI(40.19; 351.58)
4
4.9
Vleart e llogaritur nga COI Parashikimi i NN
3.66 3.65 3.64 3.63 3.62 3.61 1960
x 10
Parashikimi i fushes nw obs DOB/dombas 1960-2005, 62.06; 9.11
4.88 vlerat e fushes, Z/nT
3.67 Vlerat e fushes, Z/nT
4.86 4.84 4.82 4.8 4.78
1970
1980
1990
2000
Parshikimi nga NN Vlera reale e matur nga DOB
4.76 1960
2010
1970
1980
Vitet
1990
2000
2010
Vitet 4
4.18
x 10
Parashikimi i fushes per obs GCK/grocka 1960.5 - 200.5, 44.63;20.76
4.16 vlerat e fushes/nT
A B B Y Y.c
C
lic
k
he k lic C w.
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
4.14 4.12 4.1 4.08 4.06 4.04 1960
Vlera e matur nga GCK parashikimi 1970
1980
1990
2000
2010
vitet
Fig.4.3. Parashikimi i ecurisë kohore në observatorët COI, DOB, GCK, (për komponenten Z) 1960.5- 2005.5 me anën e rrrjetës neuronike duke ndjekur metodën e dytë.
Duket një përmirësim i madh nga zbatimi i kësaj metode. Metoda 2 do të jetë objekt i studimit në të ardhmen duke bërë të mundur dhe përmirësimin e mëtejshëm të saj. E theksojmë edhe një herë pamundësinë tonë për aplikimin e saj në kushtet në të cilat ndodhemi. Krijimi i një numri më të madh observatorësh duke u zhvendosur me një hap më të vogël nga ai që është ndjekur prej nesh (rreth 200 në disa raste) do të silltë një risk më të vogël gabimi21 dhe rrjedhimisht një përmirësim në rezultatin e marrë nga rrjeta neuronike. Harta globale përfundimtare e të gjithë observatorëve realë dhe imagjinarë jepet në fig.4.3, ku pikat me ngjyrë të bardhë janë observatorët realë dhe ato me ngjyrë të zezë janë observatorët imagjinarë.
21
Për krijimin e 137 observatorëve na janë dashur 411 trajnime të rrjetës për një vit për të tre komponent e fushës magnetike. Parashikimi bëhet për 46 vjet. Me një llogaritje të thjeshtë kuptohet pamundësia jonë për të krijuar një numër më të madh observatorësh
57
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1 4
3
5
2 6
7 8 Fig.4.3. Harta globale e observtorëve realë dhe imagjinarë. Pikat me ngjyrë të bardhë janë observatorët realë, pikat me ngjyrë të zezë janë observatorët imagjinarë. Konturët mbi glob, tregojnë ecurinë e ndjekur prej nesh në krijimin e observatorëve imagjinarë. Zhvendosja është kryer nga zona 1 – zona 7. Pra, janë krijuar observatorët e parë në Evropë (1). U kalua në Azi (2 dhe 3), në Amerikën e Veriut (4), në zonën ekuatoriale (6) dhe u vazhdua drejt Polit të Jugut (7, 8). Çdo observator i krijuar merrej përsëri për krijimin e observatorit pasardhës
Në total numri i observatorëve reale dhe imagjinarë është N = 105 + 137 = 242. Për të parë saktësinë më të cilën ne krijuam observatorët imagjinarë, llogaritëm devijimi standart midis vlerave të fushës të parashikuar nga rrjeta neuronike dhe vlerave reale të fushës magnetike të matura nga observatorët. U llogarit gjithashtu devijimi standart midis vlerave të fushës të llogaritura nga modelet IGRF 10, Gufm1 dhe vlerave të fushës të 105 observatorëve realë. Tabela 4.1, tregon në mënyrë të përmbledhur devijimet standarte22 për tre komponentet e të tre modeleve për vitet 1960.5, 1980,5 2005.5.
22
Devijimi është llogaritur në këtë mënyrë: Është marrë katërori i diferencës midis vlerave fushës të 105 observatorëve realë me vlerat respektive të parashikuara nga rrjeta për vitet e mësipërme. Në fund është bërë rrënja katërore e mesatares së këtyre shmangieve për çdo vit.
58
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Devijimi standart midis vlerave të llogaritura nga modeli IGRF 10 dhe vlerave reale të matura nga observatorët X _IGRF_60_80_05 Y _IGRF_60_80_05 Z_IGRF_60_80_05 stdX IGRF(1960) = stdY IGRF(1960) = stdZ IGRF(1960) = 277.399100 976.499500 618.5634 stdX IGRF(1980) = stdY IGRF(1980) = stdZ IGRF(1980) = 275.319100 216.406900 509.5739 stdX IGRF(2005) = stdY IGRF(2005) = stdZ IGRF(2005) = 1060.418000 283.573000 514.0534 Devijimi standart midis vlerave të llogaritura nga modeli Gufm1 dhe vlerave reale të matura nga observatorët X _Gufm1_60_80 Y _Gufm1_60_80 Z _Gufm1_60_80 stdX Gufm1(1960) = stdY Gufm1(1960) = stdZ Gufm1(1960) = 275.805500 971.667100 616.0535 stdX Gufm1(1980) = stdX Gufm1(1980) = stdZ Gufm1(1980) = 278.098200 212.153800 510.4279 Devijimi standart midis vlerave të parashikuara nga modeli neuronik dhe vlerave reale të matura nga observatorët X _NN_60_80_05 Y _NN_60_80_05 Z _NN_60_80_05 stdX NN(1960) = stdY NN(1960) = stdZ NN(1960) = 58.413780 964.419900 325.4897 stdX NN(1980) = stdY NN(1980) = 91.188510 111.804300 stdZ NN(1980) = 105.037 stdX NN(2005) = stdY NN(2005) = stdZ NN(2005) = 113.838600 206.482800 178.4789 Devijimi standart midis vlerave të modelit IGRF 10 dhe modeli Gufm1 X _NN_Gufm_60_80_05 Y _NN_Gufm_60_80_05 stdX Gufm - IGRF1(1960) = stdY Gufm - IGRF1(1960) 33.497360 = 32.305370 stdX Gufm - IGRF1(1980) stdY Gufm - IGRF1(1980) = 21.257650 = 18.807680
Z _NN_Gufm_60_80_05 stdZ Gufm - IGRF1(1960) = 56.05963 stdZ Gufm - IGRF1(1980) = 27.16419
Shihet lehtësisht se parashikimi i rrjetës neuronike është më i saktë (veçanërisht për komponenten X) se llogaritjet e kryer nga dy modelet e tjera. Mund të themi me siguri të plotë se aplikimi i metodës së dytë dhe marrja e një numri më të madh observatorësh, do ta përmirësojë së tepërmi rezultatitn e rrjetës neuronike.
59
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
4.3. Parashikimi i fushës magnetike globale për periudhën kohore 2005 – 2015 Proçesi i parashikimit të fushës magnetike për ne është i njohur nga kapitulli 3. Situata është e njëjtë sikundër vepruam për parashikimin e fushës magnetike për observatorin NGK. Tani numri N i observatorëve është 242 dhe vlerat e fushës gjeomagnetike nga viti 1960.5 – 2005.5, përbëjnë grupin e serive kohore e të gjithë observatorëve. Në fakt, proçesi i parashikimit për një numër të tillë observatorësh, është i vështirë sepse kërkon për secilin observator një program të veçantë ekzekutimi dhe shumë kohë trajnimi. Për këtë u përdor një teknikë e re parashikimi. Observatorë të veçantë u grupuan në 24 grupe me nga 10 observatorë me kushtin e vetëm që vlerat e fushës për secilën komponente të ishin midis tyre në rend afërsisht të njëjtë (këtë kusht e plotësojnë zakonisht observatorët që ndodhen afër njëri-tjetrit). Kjo aq sa ishte e mundur të realizohej, (pikat në të cilat komponentja X ka vlera negative u trajnuan veçmas). E gjithë teknika e parashikimit të vlerave të fushë magnetike, u përmblodh në program4 i cili u ekzekutua 24 herë për parashikimin e fushës globale nga viti 2005.5 – 2015.5. Me përfundimet e marra u ndërtuan tabelat globale të fushës për secilën komponente23 nga viti 1960.5 – 2015.5. Kështu, për parashikimin e fushës magnetike për vitin 2015.5 (d = 10) në një pikë të globit e cila nuk ndodhet në grupin e 242 observatorëve, mjafton ekzekutimi i program3 duke e trajnuar rrjetën me të gjithë vlerat e fushës e të gjithë observatorëve të vitit 2015.5, e më pas bëhet simulimi i saj me kordinatat e pikës ku duam të parashikojmë këtë fushë. Gabimi i rrjetës neuronike në parashikimin e fushës magnetike për vitin 2015.5
Në kapitullin 3 për d = 15, ne llogaritëm devijimin standart të parashikimit të vlerave të fushës magnetike nga vlerat reale të saj në observatorin NGK. stdx = 38.56, stdy = 17.12 , stdz = 32.04. Këto gabime janë të pranushme për një kufi të tillë parashikimi. Më sipër, ne kemi marrë horizontin e parashikimit d = 10 dhe jo d = 15. Arsyeja është se gabimi i parashikimit 2005.5 – 2015.5 pritet të jetë më i madh se në rastin e parashikimit të kryer në obsrvatorin NGK për arsyet që do të nënvizohen më poshtë. Në situatën që ndodhemi, nuk kemi ndonjë mundësi për llogaritjen e drejpërdrejtë të gabimit dhe as të krahasimit me ndonjë model tjetër. Ne do të bazohemi në një mënyrë të tërthortë në llogaritjen e gabimit përfundimtar të rrjetës. Gjatë gjithë proçesit të ndjekur, vlerat e 150 observatorëve realë nga 1960.5 -2005.5, kanë qënë origjina e të gjithë përfundimeve të marra në vitin 2015.5. Kështu, gabimi i përgjithshëm që është bërë për parashikimin e fushës në 2015.5 është shuma e të gjitha gabimeve të veçanta e të gjithë hapave të ndjekura në kapitullin 4. Realisht kjo nuk është e vërtetë, pasi gabimet nuk janë të pavarura nga njëri – tjetri por ndikimi i tyre është prezent në vlerën e tjetrit. Kështu, gabimi i llogaritur në hapin e fundit (që është parashikimi i fushës 2005.5 – 2015.5), influencohet direkt edhe gabimet e bëra në hapat e mëparshëm. Ne do ta neglizhojmë këtë ndikim dhe do të llogaritim gabimin total si shumë e gabimeve të veçanta. 23
GLOBTAB_X, GLOBTAB_Y, GLOBTAB_Z.
60
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1.
gabim1→gabimi për shkak të reduktimit të lartësisë, h = 0. Është bërë një rrumbullakim deri në shifrën e dytë pas presjes dhjetore. Kjo sjell efektivisht një shmangie nga vlera reale por që është relativisht i vogël dhe mund të mos merret parasysh. gabim1 £ ±1nT për secilën komponente. 2. gabim2→gabimi për shkak të përdorimit të rrjetës në plotësimin e serive kohore të 68 observatorëve reale. Meqënëse periudhat e plotësimit nuk kanë qënë të njëjta për këta observatorë, është llogaritur një mesatare e horizontit d24 e të gjithë viteve të plotësuara. d m = 4 . Duke ditur që për d = 15, stdx = 38.56, stdy = 17.12 , stdz = 32.04, prej këtej llogaritet që për d m = 4 , stdx = 10, stdy = 5 , stdz = 9. 3. gabim3→gabimi në proçesin e krijimit të obsrvatorëve imagjinarë. Ne kemi llogaritur më sipër devijimet standarte për observatorët realë për vitet 1960.5, 1980.5 dhe 2005.5. Po i referohemi vitit 2005.5. stdx = 113.83, stdy = 206.48 , stdz = 178.47. 4. gabim4→gabimi që kryhen rrjeta për shkak të trajnimit. Kemi thënë se ky gabim është i rendit ±30nT 25. 5. gabim5→gabim që kryen rrjeta në parashikimin e vleravë të fushës 2005.5 – 2015.5. Ky gabim është në rend të njëjtë me gabimin e llogaritur për observatorin NGK por duhet të kemi parasysh që në disa observatorë imagjinarë ‘luhatjet’ janë më të mëdha se tek observatorët realë. Kështu, në bazë të një konkluzioni të nxjerrë në kapitullin 3, një ecuri e tillë e rrit gabimin në parashikim. Meqënëse në parashikimin 10 vjeçar u bë një përzjerje midis observatorëve realë dhe imagjinarë, atëherë ndikimi i ecurive të çrregullta tek observatorët realë do të jetë i madh në parashikimin e vlerave të fushës për vitin 2015.5. Ne po marrim një gabim të rendit d x , y , z = ±50nT (kujtojmë që kjo vlerë ka qënë stdx = 38.56 nT, stdy = 17.12 nT , stdz = 32.04 nT. në rastin e NGK-së, shih paragrafin 3.4) por nuk jemi të sigurtë për këtë. 6. gabim6→gabimi që bëhet në krijimin e observatorëve me shpërndarje homogjene për ndërtimin e izolinjave. Rendi i gabimit në këtë rast është sa gabim3. stdx = 113.83, stdy = 206.48 , stdz = 178.47. Nuk do të futim në gabimin total gabim6, për arsye se ai bëhet në rast se ne duam të ndërtojmë izolinjat. Gabimi total i parashikimit të vlerave të fushës gjeomagnetike( X, Y, Z) për periudhën kohore 2005.5 – 2015.5 është: 5
5
Gx = å gabim(i ) = 204nT , G y = å gabim(i ) = 272nT i =1
i =1
5
,
G y = å gabim(i ) = 268nT i =1
ku G është gabimi total për çdo komponente dhe i është numri i gabimeve. Sipas përfundimeve të nxjerra prej nesh, vlerat e fushës magnetike të parashikuara për vitin 24
E shënojmë horizontin mesatar me dm, dhe do të nënkuptohet sikur të 68 observatorët në të cilët ne kemi plotësuar vlerat e munguara, kanë periudhën e moskryerjes së matjeve të njëjtë. 25 Jo në çdo rast
61
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
2015.5 do të kenë një shmangie nga vlerat reale të po atij viti me Gx, Gy, Gz për çdo komponente. Përfundimisht, vlerat e komponenteve të fushës magnetike në vitin 2015.5 në observatorët realë dhe imagjinarë do të jenë: X real (2015) = { X NN ± Gx } nT
Yreal (2015) = {YNN ± G y } nT
,
,
Z real (2015) = {Z NN ± Gz } nT
E theksojmë përsëri se, gabimi nuk është llogaritur në mënyrë analitike për shkak të pamundësisë për të kryer një gjë të tillë. Kështu ne do të pranojmë të mirëqëna këto rezultate për sa kohë nuk jemi në gjendje të llogarisim saktësisht atë në mënyra të tjera.
4.4. Ndërtimi i izolinjave të fushës magnetike. Evoluimi i fushës magnetike globale 2005 – 2015. Ndërtimi i izolinjave sikundër përmendëm në fillim të kapitullit, kërkon një numër të madh pikash/observatorësh të shpërndarë uniformisht në sipërfaqen e tokës. Për ne kjo gjë tashmë nuk është e vështirë. Në paragrafn 4.2, morëm shembull se si mund të gjejmë fushën magnetike në një pikë çfardo të globit. Nisur nga kjo ne mund të simulojme rrjetën neuronike me sa vlera të duam. Meqënëse nevojitet një shpërndarje sa më uniforme për një paraqitje sa më të mirë të izolinave, atëherë është e nevojshme gjetja e një funksioni i cili do të na krijojë aq pika sa duam me distancë gjeografike ekzaktësisht të njëjtë nga njëra tjetra. Hapi i zhvendosjes sipas gjatësisë gjeografike (m) u zgjodh 40 dhe kufijtë janë nga -880 në +880 kurse gjërësia gjeografike (n) ndryshon me hap h sipas funksionit: 5 h= 4.4.1 æ m ×p ö cos ç ÷ è 180 ø në kufijtë nga 00 në 3600 Numri i pikave/observatorëve që përftohen në sipërfaqen e Tokës duke u zhvendosur sipas hapave të mësipërm është 2083, i cili është i mjaftueshëm për ndërtimin e izolinjave të fushës gjeomagnetike. Në Matlab u ndërtua program526 që bën të mundur parashikimin e fushës magnetike për të tre komponentet për 2083 observatorët e krijuar. Trajnimi i rrjetës bëhet me kordinatat gjeografike të 242 obervatorëve që kemi në dispozicion dhe si target merren vlerat respektive të fushës. Simulimi i rrjetës bëhet me kordinatat e 2083 observatorëve imagjinarë. Në figurën 4.4.1, është treguar shpërndarja uniforme e të gjithë observatorëve imagjinarë. Për ndërtimin e izolinjave nuk janë marrë observatorët 242 observatorët e parë. 26
Ky program është paraqitur në shtojcë.
62
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Fig.4.4.1 Harta globale e 2083 observatorëve imagjinarë që u krijuan për ndërtimin e izolinjave.
Ndërtimi i izolinjave u realizua me programin komjuterik GMT 27. Më poshtë janë paraqitur izolinjat e fushës magnetike për vitet 1960.5, 1980.5, 2000.5, 2005.5, 2010.5, 2015.5.
27
GMT – Global Maping Tools. Projeksionet që mund të ndërtohen me anën e këtij programi janë Hamer dhe Mercator. Hartat globale të obsrvatorëve janë paraqitur në projeksionin Hamer, ndërsa izolinjat janë ndërtuar në projeksionin Mercator.
63
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
1. Evoluimi i komponentes X të fushës magnetike nga viti 1960.5 – 2015.5 e paraqitur me anën e izolinjave në projeksionin Mercator. Intervali midis kontureve 2000 nT. X-1960.5
X-1980.5
X-2000.5
X-2005.5
X-2010.5
X-2015.5
64
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
2
Evoluimi i i komponentes Y të fushës magnetike nga viti 1960.5 – 2015.5 e paraqitur me anën e izolinjave në projeksionin Mercator. Intervali midis kontureve 2000 nT. Y-1960.5
Y-1980.5
Y-2000.5
Y-2005.5
Y-2010.5
Y-2015.5
65
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
3
Evoluimi i i komponentes Z të fushës magnetike nga viti 1960.5 – 2015.5 e paraqitur me anën e izolinjave në projeksionin Mercator. Intervali midis kontureve 4000 nT Z-1980.5
Z-1960.5
Z-2000.5
Z-2005.5
Z-2010.5
Z-2015.5
66
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
Kapitulli 5 5.1. Konkluzionet Studimi i fushës gjeomagnike në shkallë globale ka rëndësi jo vetëm teorike për njohjen e vlerave të saj në të ardhmen, por edhe për qëllime praktike, p.sh gjeologjike, gjeofizike etj. Përdorimi i rrjetave neuronike solli risi në studimin e ecurisë vjetore të fushës magnetike. Përveç kësaj, rezultatet e arritura ishin mjaft pozitive po të kemi parasysh vështirësitë e hasura gjatë këtij studimi. (fillimisht mungesa e njohurive fillestare mbi funksionimin e rrjetave neuronike, mungesa e kompjuterave të fuqishëm dhe mungesa e kohës së studimit ndikuan në mos testimin e metodave të tjera që ne mendojmë se do të përmirësojnë dukshëm rezultatin). Për të parë nivelin e studimit tonë, do të bëhet publikimi i tij në disa revista shkencore dhe paraqitja në dy konferenca që do të zhvillohen në Itali dhe Belgjikë. Disa nga konkluzionet kryesore të dala nga ky studim janë: · · ·
·
· ·
Përdorimi i rrjetave neuronike në parashikimin e fushës magnetike rezultoi i suksesshëm. Modeli ynë parashikues rezulton të jetë më i saktë se modelet IGRF10 dhe Gufm1 veçanërisht në kur horizonti i parashikimit është brenda kufijëve [1 – 10] vjet. Ndërtimi i observatorëve imagjinarë në pika të ndryshme të Tokës bën të mundur studimin e fushës magnetike dhe llogaritjen e saj në çdo pikë të saj me një shmangie nga vlera reale me stdx = 113.83 nT, stdy = 206.48 nT, stdz = 178.47 nT. Kështu, studimi i fushës magnetike mund të bëhet në çdo pikë të globit ku mungojnë observatorët realë. U arrit të studjohej evoluimi i fushës magnetike nga viti 2005.5 deri në vitin 2015.5. Shmangia nga vlera reale që do të ketë fusha magnetike në vitin 2015.5 është Gx = 204nT , GY = 272nT , GZ = 268nT . Përmirësimi i metodave të parashikimit dhe përsosja e mëtejshme e modelit neuronik parashikues, do të shtojë akoma më shumë saktësinë e parashikimit të fushës magnetike. Duke përmirësuar modelin neuronik, do të synohet rritja e horizontit të parashikimit përtej 15 viteve që u arrit në këtë studim.
67
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5.2. Referencat [1] Howard Demuth, Mark Beale. Neural Netuork Toolbox. [2] NRES-798 Geophysical data analysis. Nonlinear Regresion-Neural netuork. [3] Manolis I. A. Lourakis. A Brief Description of the Levenberg – Marquard Algorithm Implemendet by levmar. [4] Foresee, F.D., and M.T. Hagan, “Gauss-Newton approximation to Bayesian regularization,” Proceedings of the 1997 International Joint Conference on Neural Networks, 1997, pp. 1930–1. [5] Andrew Jackson, Art R. T. Jonkers and Matthew R. Walker, Four centuries of geomagnetic secular variation from historical records by Phil. Trans. R. Soc. Lond. A (2000) 358, 957-990. [6]. S. McLaren, S. Macmillan. The US/UK World Magnetic Model for 2005 – 2010. [7]. B.Duka. Comparison of different methods of analysis of satelite geomagnetic anomalies over Italy.(1988) [8]. B.Duka. A trial model that used non linear dynamical systems. (2005) [9]. Barraclough D.R, De Santis A. Some possible evidence for a chaotic geomagnetic field from observational data.(1997). [10]. B.Duka. Models of geomagnetic secular variations and its prediction.(2005) [11] B. Duka, “Modeling the geomagnetic field at different observatories with nonlinear dynamical system of equations”, presented in the 10th Scientific Assembly of the International Association of Geomagnetism and Aeronomy, July 18-29, 2005, Toulouse – France. [12] R.J. Frank, N.Davey, S.P.Hunt. Time series prediction and neural networks. [13] Kornel Laskowski. Neural Netuorks for Time Series Prediction. [14] Hongre, L., P. Sailhac, M. ALEXANDRESCU, and J. Dubois, Nonlinear and multifractal approaches of the geomagnetic field, Phys. Earth Planet. Inter., 110, 157190, 1999. Mioara etc. [15]. http://Web.dmi.dk/fsWeb/ProjectsWdcc1/homepage.html Materiale të tjera www.mathworks.com Matlab\toolbox\help Earth’s Gemagnetic Field “ Përmbledhje artikujsh “ (1988) D.E Rumelhart, G.E. Hinton, R.J. Williams, "Learning internal representations by error propagation”, the M.I.T. Press, Cambridge, MA 1986. M.T. Hagan, H.B. Demuth, M.H. Beale, “Neural Network Design” , PWS Publishing Company, Boston, MA 1996. NRES-78. Geophysical data analysis, Nonlinear Regresion-Neural Netuork. P.R.Sutclife. The development of a regional geomagnetic daily variation model using neural networks. E.W.Worthington, J.J.Love. Geomagnetic Field Monitoring at Barroë, Alaska. R.J.frank, N.Davey, S.P.Hunt. Time series prediction and neural networks. ECONOMICS 7344, 2006, Bent E.Sorensen. Short introduction to time series. Dimitris Kugiumtzis. Πρoβλεψή Χρoνιkών Σειρών.
68
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
5.3. Shtojcë Në çdo etapë tëstudimin tonë, janë krijuar një numër i madh programesh në Matlab. Në pamundësi për të dhënë të gjithë këto programe, po japim vetëm një pjesë të program5, me anën e të cilit krijuam 2083 observatorët imagjinarë për ndërtimin e izolinjave.
Program5 % Program për krijimin e observastorëve imagjinarë në të gjithë globin për ndërtimin e izolinjave në vitet 1960, 1980, 2000, 2005, 20010, 2015. clear clc load GLOB_X load GLOB_Y load GLOB_Z % Ndërtimi i izolinave për vitin 20015 x1=160; y1=1000;
%
p = ([GLOB_X(2:243,1)';... ;GLOB_X(2:243,2)'])/x1; tx = (GLOB_X(2:243,59)')/y1;; rrjeta newcf; net=newcf(minmax(p),[14,1,1,1,1,1,1,1,1,1,1,1,1,1,1],{'tansig',... 'tansig','tansig', 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig', 'purelin'},'trainbr'); net = init(net); net.performFcn = 'msereg'; net.performParam.ratio = 0.5; net.trainParam.show = 5; net.trainParam.epochs = 1500; net.trainParam.goal = 0; [net,tr]=train(net,p,tx); ik=0; for i=-88:4:88; hap=5/cos(i*pi/180); for j=0:hap:360; ik=ik+1; cij=([i;j])/x1; tij=sim(net,cij); tx=[tx tij]; p=[p cij]; display(i); display(j); end; end; % Komponentja Y % % % % % % % % % % % % % % % % % % % % x2=16000; y2=(-2500); p = ([GLOB_Y(2:243,1)';... ;GLOB_Y(2:243,2)'])/x2; ty = (GLOB_Y(2:243,59)')/y2; net=newcf(minmax(p),[14,1,1,1,1,1,1,1,1,1,1,1,1,1,1],{'tansig',... 'tansig','tansig', 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig', 'purelin'},'trainbr'); net = init(net); net.performFcn = 'msereg'; net.performParam.ratio = 0.5; net.trainParam.show = 5; net.trainParam.epochs = 1500;
69
w.
A B B Y Y.c
om
Y
F T ra n sf o
A B B Y Y.c
bu to re he C
lic
k
he k lic C w.
om
w
w
w
w
rm
y
ABB
PD
re
to
Y
2.0
2.0
bu
y
rm
er
Y
F T ra n sf o
ABB
PD
er
Y
net.trainParam.goal = 0; [net,tr]=train(net,p,ty); ik=0; for i=-88:4:88; hap=5/cos(i*pi/180); for j=0:hap:360; ik=ik+1; cij=([i;j])/x2; tij=sim(net,cij); ty=[ty tij]; p=[p cij]; display(i); display(j); end; end; % % Komponentja Z % % % % % % % % % % % % % % % % % x3=260; y3=1600; p = ([GLOB_Z(2:243,1)';... ;GLOB_Z(2:243,2)'])/x3; tz = (GLOB_Z(2:243,59)')/y3; net=neëcf(minmax(p),[14,1,1,1,1,1,1,1,1,1,1,1,1,1,1],{'tansig',... 'tansig','tansig', 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig','tansig', 'tansig', 'tansig','tansig',... 'tansig', 'purelin'},'trainbr'); net = init(net); net.performFcn = 'msereg'; net.performParam.ratio = 0.5; net.trainParam.show = 5; net.trainParam.epochs = 1500; net.trainParam.goal = 0; [net,tr]=train(net,p,tz); ik=0; for i=-88:4:88; hap=5/cos(i*pi/180); for j=0:hap:360; ik=ik+1; cij=([i;j])/x3; tij=sim(net,cij); tz=[tz tij]; p=[p cij]; display(i); display(j); end; end; %%%%%%%%%%%%%%%% tx=tx*y1; ty=ty*y2; tz=tz*y3; p=p'*x3; cc2015(1:(ik+242),5)=tz(1:(ik+242)); cc2015(1:(ik+242),4)=ty(1:(ik+242)); cc2015(1:(ik+242),3)=tx(1:(ik+242)); cc2015(1:(ik+242),2)=p(1:(ik+242),2); cc2015(1:(ik+242),1)=p(1:(ik+242),1); C=[cc2000 cc2005 cc2010 cc2015]; open C;
70
w.
A B B Y Y.c
om