Cuprins
1. Tipuri de modele economice ................................................................................
3
2. Construirea modelelor .........................................................................................
28
3. Complexitatea modelelor ....................................................................................
47
4. Gestiunea modelelor .............................................................................................
68
5. Generatoare de modele .......................................................................................
84
6. Gestiunea seturilor de date ...............................................................................
108
7. Gestiunea problemelor de modelare ................................................................
134
8. Tipuri de aplicaţii ..................................................................................................
149
9. Proceduri ................................................................................................................
166
10. Sistem de gestiune a bazelor de modele ......................................................
188
11. Studii de caz .........................................................................................................
202
Anexa 1 – Lista de variabile definite şi referite în modele ............................
209
Anexa 2 – Formule de bază .....................................................................................
213
Anexa 3 – Lista de acronime şi de proceduri .....................................................
215
Anexa 4 – Album de grafice ...................................................................................
216
Anexa 5 – Determinarea coeficienţilor ecuaţiei dreptei de regresie liniară prin metoda celor mai mici pătrate .....................................
223
Anexa 6 – Metoda celor mai mici pătrate în două trepte ................................
225
Anexa 7 – Generator de modele liniare – secvenţe ...........................................
227
Anexa 8 – Generator de modele liniare cu argument întârziat – secvenţe .
235
Bibliografie .................................................................................................................
239
1. TIPURI DE MODELE ECONOMICE 1.1 Modele economice Studiul cantitativ pentru fenomenele economice presupune construirea de modele în care apar variabilele independente X 1 , X 2 ,..., X n şi variabilele independente Y1 , Y2 ,..., Ym . Modelele economice sunt asociate unor evoluţii corespunzătoare intervalelor de timp delimitate prin momentul iniţial T0 , respectiv , momentul final TF . Datele cu ajutorul cărora se elaborează modelele economice sunt organizate conform tabelului 2.1. Organizarea datelor economice Moment de timp
Tabel 1.1 Y2 ... Yk … Ym
X1 X 2 … X j … X n
Y1
T0
x 01 x 02 … x 0 j … x0 n
y 01 y 02 … y 0 k … y 0 m
T1
x11 x12 … x1 j … x1n
y11 y12 … y1k … y1m
M Ti
M xi1 xi 2 … x ij … xin
M yi1 y i 2 … y ik … y im
M TF
x F1
M x F 2 .. x Fj … x Fn
M
y F1 y F 2 .. y Fk … y Fm
S-au notat: x ij - nivelul măsurat pentru variabila independentă X j la momentul Ti ; y ik - nivelul măsurat pentru variabila dependentă Yk la momentul Ti . În modelele economice sunt definite ecuaţii de comportament pentru factori, ecuaţii tehnice care descriu starea sistemelor, ecuaţii instituţionale 3
care descriu relaţiile dintre componentele sistemelor şi relaţii de tip contabil în care sunt prezentate legăturile cu natură valorică dintre intrările şi ieşirile sistemului economic. Există numeroase modele economice utilizate în practică şi, dintre acestea, unele înregistrează sub forma ecuaţiilor cu coeficienţi determinaţi, în mod exact, niveluri valorice, niveluri ale stocurilor, fonduri utilizate etc. şi care au forma: n
y k = ∑ ai xi i =1
Pentru calculul stocului final y se notează:
x1 - stocul iniţial; x 2 - intrări; x3 - ieşiri;
a1 = 1 ; a2 = 1 ; a 3 = −1 . Totalul populaţiei României y se obţine prin numărarea locuitorilor xi din cele n judeţe, J 1 , J 2 ,..., J n : 41
y = ∑ xi i =1
În activitatea de salarizare se calculează salariul net y pornind de la valoarea totală a drepturilor angajatului prin scăderea reţinerilor şi adăugarea drepturilor stabilite prin lege: n
y = ∑ a i xi i =1
unde: xi - suma căreia i se aplică coeficientul ai . Poate fi: salariul de bază, total drepturi, deducere personală de bază etc.; ai - coeficient care denotă fie o datorie a angajatului, caz în care este negativ, de exemplu: CAS, sănătate, ajutor şomaj, impozit etc., fie un drept al acestuia, caz în care este pozitiv. 4
Analiza economică impune construirea de modele pentru previzionarea evoluţiei fenomenelor în ipoteze date. De exemplu, pentru prognozarea evoluţiei productivităţii muncii, W , se utilizează numeroase modele, fiecare dintre ele fiind operaţionale în ipoteze definite. Astfel, dacă se înregistrează W0 , W1 , …, WF reprezentând nivelurile W pentru o perioadă de timp şi dacă se calculează indicele mediu al evoluţiei:
I W = αF
WF W0
În ipoteza în care W se obţine în aceleaşi condiţii rezultă: WF +1 = WF I W şi WF + K = WF ( I W ) K
Modificând ipotezele de lucru, evident, se modifică şi structura modelului. Dacă se observă, de exemplu, că evoluţia e neliniară, exponenţială, se construieşte modelul y = ae bt care e bun numai în ipoteza dată. Un alt model, este cel al balanţei legăturilor dintre ramuri. Dacă se consideră nram , numărul de ramuri ale unei economii, notate cu RA1 , RA2 ,..., RAnram , se construieşte matricea fluxurilor MRA , având nram linii şi nram coloane, în care un element mraij arată valoarea produsului sau serviciului furnizat de ramura RAi ramurii RA j . Se contruiesc modelele:
TMRAi. = TMRA. j =
TMRA.. =
nram
∑ mra j =1
ij
nram
∑ mra i =1
ij
nram nram
∑ ∑ mra i =1 j =1
ij
5
unde: TMRAi. - totalul ieşirilor ramurii i spre celelalte ramuri. TMRA. j - totalul intrărilor în ramura j.
TMRA.. - totalul general. Modelele economice se construiesc folosind solide cunoştinţe privind dependenţele dintre factori. Există modele de prognoză economică în care variabila dependentă y la momentul t depinde de nivelul variabilei independente la acelaşi moment t. Sunt cazuri în care variabila dependentă la momentul t, yt , depinde de nivelurile de la momentele t − 1, t − 2,... ale variabilelor independente, constituindu-se în modele cu argument întârziat. Experienţa economică arată că sunt create premise pentru dezvoltarea unor tehnici de construire a modelelor economice pentru prognozare folosind un produs software adecvat.
1.2 Criterii de clasificare Există numeroase criterii de clasificare a modelelor economice. După criteriul liniarităţii sunt: - modele liniare, în care între variabilele exogene şi cele endogene se defineşte o expresie analitică de forma: n
y = ∑ ai xi i =0
- modele neliniare, în care apar operatori de înmulţire, împărţire, extragere radicali, exponenţiere, logaritmare, precum şi expresii alte analitice cu grad de complexitate ridicat. Astfel, după obiectivul urmarit, modelele sunt: - modele de calcul, care constau într-o relaţie, iar utilizatorul înlocuieşte variabilele cu niveluri măsurate, obţinând un indicator agregat: formula de calcul a volumului unei sfere, modelul pentru eşalonarea dobânzilor, formula de calcul a impozitului pe venitul
6
global, sunt numai câteva dintre modelele de calcul, modele frecvent definite în abordările cantitative din ştiinţele economice; - modele de optimizare care includ o funcţie obiectiv ce trebuie maximizată / minimizată, o serie de restricţii pe baza cărora se elaborează algoritmi care permit obţinerea soluţiei unice în stare să satisfacă criteriul de performanţă definit: cercetările operaţionale au capitole speciale dedicate modelelor liniare, formând domenii precum programarea liniara, programarea în numere întregi, programarea neliniară, programarea convexă; este fundamental ca algoritmii de optimizare să fie performanţi şi să demonstreze că soluţia găsită este într-adevar optimă; - modele de simulare sunt construcţii care permit reproducerea derulării unor procese folosind consumuri, frecvent generate sub forma de numere pseudoaleatoare, se identifică legile de repartiţie care guvernează producerea de evenimente; simularea conduce la obţinerea de consumuri medii, durate medii, riscuri medii, în ipoteze bine definite. Modelele de simulare optimizează structuri, număr de componente sau conduc la studierea unor situaţii care în condiţii reale sunt însoţite de costuri foarte ridicate; - modele euristice includ condiţii complexe, coeficienţi de importanţă şi condiţionări multiple; soluţia obţinută îmbunătaţeşte rezultatele, existând cel mult o informaţie privind distanţa solutiei faţă de o soluţie optimă obţinută cu un model de optimizare.Avantajul utilizarii de modele euristice este dat de capacitatea de a obţine descrieri ce includ aspecte calitative ale evoluţiei sistemelor, iar algoritmii conţin un volum de prelucrări care îi fac operaţionali chiar dacă dimensiunile modelului sunt foarte mari; - modelul de prognoza are coeficienţi estimaţi folosind serii de date înregistrate pentru momentele de timp
t, t 1
coeficienţii estimaţi, niveluri generate fundamentate ale variabilelor exogene prognozate ale variabilei endogene. De construieşte o prognoză trebuie specificate
2
, …,
t
k
, folosind
pentru ipoteze bine se obţin nivelurile fiecare dată când se următoarele elemente: 7
tipul de model folosit, setul de date cu care s-a efectuat estimarea coeficienţilor şi ipotezele după care au fost generate nivelurile variabilelor exogene. Modelele de prognoză trebuie validate. După criteriul dimensiunii, se identifică: - modele de mici dimensiuni în care numărul de variabile exogene este redus, sub 5; manipularea acestor modele este lejeră; seriile de date sunt cuprinse între 30 şi 100 de termeni, iar gradul de omogenitate al acestora este ridicat; - modele de dimensiuni medii, în care numărul variabilelor exogene este cuprins între 5 şi 20, volumul de calcule este ridicat şi necesită din partea utilizatorilor o bună organizare a datelor şi a proceselor de prelucrare; seriile de date sunt cuprinse între 50 şi 200 de termeni, înregistrând un nivel de neomogenitate ridicat, ceea ce conduce la utilizarea de proceduri destinate atenuării neomogenităţii; - modele de mari dimensiuni în care variabilele exogene depăşesc ca număr limita de 20; gestionarea unui astfel de model presupune un mod adecvat de organizare a seturilor de date şi software pentru estimare, pentru prognoză şi pentru manipularea rezultatelor intermediare; seturile de date sunt prelucrate pentru a deveni omogene, făra însă a înregistra lungimi mai mari de 200 – 300 de termeni; dacă este vorba de serii de timp foarte lungi, sau de colectivităţi de indivizi numeroase se impune analiza reprezentativităţii datelor. Dupa criteriul naturii variabilelor, se identifică: - modele deterministe, în care variabilele au niveluri ce depind strict de factorii stabiliţi, iar formele analitice redau perfect dependenţele dintre factori; modelul pentru calculul taxei pe valoarea adaugată, modelul pentru eşalonarea ratelor unui credit, modelul pentru bilanţul unui agent economic, sunt doar câteva dintre modelele deterministe cu care se lucrează curent în analiza economică; - modele stochastice în care variabilele reflectă soluţii guvernate de legi de distribuţie. Soluţiile acestor modele evidenţiază evoluţii 8
probabile în funcţie de apartenenţa la intervale a nivelurilor unor variabile. După criteriul obţinerii, există: - modele de bază, care includ variabile, coeficienţi şi operatori în combinaţii ce nu se regăsesc în alte modele; - modele derivate, care, pe lângă construcţiile ce se regăsesc în categoria modelelor de bază, se includ variabile, coeficienţi şi operatori noi. Criteriile de clasificare a modelelor sunt numeroase, importantă este, mai intâi, atitudinea de a le colecţiona, de a le stoca, de a stabili seturile de date necesare, de a activa proceduri de estimare a coeficienţilor, de a defini criterii de ierarhizare şi de a vedea care sunt tipurile de probleme unde aceste modele intervin. Există şi alte criterii care au suprapuneri cu cele precedente, motiv pentru care sunt mai puţin întrebuinţate. După criteriul structurii: - modele cu o ecuaţie - modele cu mai multe ecuaţii - modele cu restricţii şi funcţie obiectiv După natura soluţiilor: - modele cu soluţie aproximativă; - modele fuzzy; - modele bazate pe reţele neuronale; - modele bazate pe algoritmi genetici; - modele cu soluţie exactă. Bazele de modele includ toate tipurile de modele, dar nu pentru toate sunt implementate proceduri care să asigure reproductibilitatea şi testabilitatea rezultatelor.
9
1.3 Modele directe Economia modernă utilizează numeroase tehnici şi metode de analiză, dintre care cele orientate spre latura cantitativă a evoluţiei proceselor, sunt cele mai importante. Construirea de modele economice are ca obiectiv analiza corelaţiilor dintre factorii de influenţă şi variabilele rezultative din care rezultă forme analitice ale dependenţelor identificate. Există o mare diversitate de modele, fiecare dintre ramurile ştiinţelor economice rezervând spaţii de prezentare deosebit de largi rezultatelor obţinute pe baza modelării. Modelele directe sunt rezultatul percepţiei nemijlocite a variabilelor asociate factorilor de influenţă. Dacă se consideră un proces P căruia i se asociază variabila rezultativă y şi care este determinat în evoluţia sa de numeroşi factori F1 , F2 ,..., FN cărora li se asociază, respectiv, variabilele X 1 , X 2 ,..., X N , un model direct are forma: N
y = ∑ ai X i , i =1
unde ai este un coeficient de contribuţie, definit pe mulţimea {−1,1} . Astfel, evoluţia stocurilor materialelor M 1 , M 2 ,..., M f se modelează prin construcţia: y j = a1 X 1 j + a 2 X 2 j + a 3 X 3 j , j = 1,2,..., f unde: yj
- stocul final al materialului M j ;
X 1 j - stocul iniţial al al materialului M j ; X 2 j - intrările prin aprovizionare din materialul M j ; X 3 j - ieşirile spre consum din materialului M j ;
Coeficienţii de contribuţie au nivelurile: a1 = 1; a 2 = 1; a3 = −1 .
10
În
contabilitate,
pentru
conturile
CON1 , CON 2 ,..., CON r , se
înregistrează în partea de debit cheltuielile CDij , i = 1,2,..., r , j = 1,2,..., Ri , iar în partea de credit cheltuielile CC ik , i = 1,2,..., r , k = 1,2,..., Oi . Pentru calculul soldului contului debitor CON p , notat S p , se evaluează expresia: Rp
Ok
j =1
o =1
S p = ∑ a j ⋅ CD pj + ∑ bo ⋅ CC po ,
unde coeficienţii de contribuţie au valorile: a1 = a 2 = ... = a R p = 1 , b1 = b2 = ... = bOk = −1 .
În analiza economică clasică pentru modelarea reproducţiei în care se definesc două sectoare, se foloseşte modelul: S1 + V1 > F2 F1 + S1 + V1 > F1 + F2 S1 + V1 + S2 + V2 > F2 + S2 + V2 unde: S1 – produsul necesar în sectorul întâi S2 – produsul necesar în sectorul al doilea V1 – plusprodusul din primul sector V2 – plusprodusul din sectorul al doilea F1 – fondul de înlocuire din primul sector F2 – fondul de înlocuire din sectorul al doilea Tuturor proceselor economice pentru care se dezvoltă algoritmi, se asociază modele de acest tip. În primul rând, se construiesc tabele cu datele de intrare. În al doilea rând, se ataşează coloane şi linii ale rezultatelor intermediare şi ale rezultatelor finale. În al treilea rând, se definesc formule de calcul pentru toţi termenii liniilor şi coloanelor destinate rezultatelor. Aceste formule sunt, de fapt, modelele directe. Este deosebit de important ca modelele directe să fie validate prin exemple de date de test, pentru a arăta că ele conduc la rezultate complete şi corecte. 11
De exemplu, modelul direct pentru calculul indicatorilor dintr-o factură presupune: - construirea unui tabel cu 7 coloane pentru: număr curent, denumire produs, unitate de măsură, număr bucăţi, preţ unitar, valoare fără TVA, valoare cu TVA, total valoare; - adăugarea la tabel a coloanelor pentru valoare fără TVA, valoare cu TVA, total valoare; - adăugarea unei linii pentru total TVA şi total valoare fără TVA; - adăugarea unei linii pentru total valoare cu TVA inclusă. Numărul curent este o variabilă i, cu valori 1,2,3,...,n. Denumirea produsului este un şir de caractere notat P1,P2,...,Pi, ...,Pn. Unitatea de măsură este un şir de caractere notat cu U1, U2, ..., Un. Cantitatea este un număr notat cu Q1, Q2, ..., Qn. Preţul unitar este un număr notat cu PR1, PR2,...,PRn. Valoarea TVA este un număr care rezultă dintr-o formulă de calcul, notat cu TVA1, TVA2, ...,TVAn, folosind un coeficient qtva. Valoarea produsului este un număr rezultat prin calcul şi se notează cu VV1,VV2,...,VVn. Totalul valorii produselor fără TVA este un rezultat notat TVAL. Totalul TVA este o valoare calculată şi se notează TTVA. Totalul valorii facturate cu TVA inclus este o variabilă rezultată din calcul şi se noteză TOTV. Formulele de calcul care se constituie în modelul direct sunt: Vi = Qi ∗ Pi TVAi = qtva ∗ VVi n
TTVAi = ∑ TVAi i =1 n
TVAL = ∑VVi i =1
TOTV = TTVA + TVAL
12
Folosind setul de date din tabelul 1.2 se aplică formulele şi se completează coloanele ce corespund rezultatelor intermediare şi rezultatelor finale. Setul de date pentru elaborarea unei facturi Tabel 1.2 Nr. crt. 1 2 3 .... .... i ... ... n Totaluri Valoare totală
Denumire produs
Preţ unitar
Valoare produs
U.M.
Cantitate
P1 P2 P3
U1 U2
Q1 Q2 Q3
PR1 PR2 PR3
VV1 VV2 VV3
Pi
Ui
Qi
PRi
VVi
Pn
Un
Qn
PRn
VVn TVAL TOTV
TVA TVA1 TVA2 TVA3
TVAn TTVA
Pe baza formulelor şi pentru datele iniţiale din tabelul 1.3 Rezultă faptul că modelul direct este valid, se construieşte schema logică şi se elaborează program pentru prelucrarea automată a facturilor. Datele corespunzătoare facturii de componente hardware
Tabel 1.3 Nr. crt. 1 2 3 Totaluri Valoare totală
Denumire produs HDD 40GB HDD 80GB CD-ROM 52x -
U.M.
Cantitate
Preţ unitar
Valoare produs
TVA
buc buc buc
2 4 5
51$/buc 61$/buc 20$/buc
102$ 244$ 100$
19.38$ 46.36$ 19$
-
-
-
TVAL=446$ TOTV= =530.74$
TTVA=84.74
În funcţie de numărul de variabile, de numărul de coeficienţi, de modul de agregare al coeficienţilor se asigură un grad de generalitate mai 13
mare sau mai mic modelelor directe. De exemplu, modelul direct pentru calculul salariului net include: - o funcţie treaptă pentru impozite; - o sumă cu atâţi termeni câte sporuri, respectiv, reţineri sunt definite prin algoritmul de calcul. Dacă numărul sporurilor şi, respectiv, reţinerilor creşte sau scade, structura modelului nu se modifică. Coeficienţii variabilelor asociate sporurilor, respectiv, reţinerilor, devin 1, respectiv 0. Funcţia treaptă se regăseşte într-o structură repetitivă de format fix.
1.4 Modele de regresie Există procese economice în care între variabila exogenă şi variabila endogenă este o legătură directă. Datele culese pentru momentele T1,T2,...,Tn evidenţiază această legătură în sensul că dacă variabila exogenă are o tendinţă de creştere şi variabila endogenă, are de asemenea, o tendinţă de creştere. Sunt situaţii în care cele două variabile au tendinţă de descreştere simultană, precum sunt şi situaţii ăn care una dintre variabile are tendinţă crescătoare, iar cealaltă variabilă are tendinţă descrescătoare. Datorită complexităţii unor procese, numeroase variabile exogene sunt agregate într-una singură şi anume factorul timp. Productivitatea muncii W, este influenţată de nivelul experienţei acumulate, de nivelul calificării, de generaţia de echipamente cu care se lucrează, de calitatea procedurilor care trebuie urmate în cadrul fiecărei operaţii. Toate acestea depind strict de timp şi prin agregare se construieşte un model dinamic al productivităţii muncii având forma: W = a *t + b Se culeg date pentru momentele de timp T1,T2,...,Tn. Estimarea coeficienţilor acestui model se realizează prin metoda celor mai mici pătrate:
a=
∑t ⋅ W ∑t
t
2
14
b=
∑W
t
n
=W
unde:
t – momentul de timp Wt – productivitatea la momentul t. Modelul de regresie simplă are forma: y= a*x +b. unde:
y – variabilă endogenă sau rezultativă sau dependentă; x – variabilă exogenă sau independentă; a – coeficientul variabilei x din ecuaţia de regresie; b – termenul liber al ecuaţiei de regresie. După efectuarea calculelor cu metoda celor mai mici pătrate se obţin estimatorii aˆ şi bˆ . Este important să se analizeze calitatea acestor estimatori, intensitatea corelaţiei dintre variabila exogenă şi variabila endogenă şi calitatea rezultatelor ce se obţin dacă modelul de regresie liniară este folosit în prognoza variabilei endogene y, pentru ipoteze de variaţie ale variabilei exogene x.
1.5 Modele econometrice Modelele econometrice reprezintă o categorie deosebit de importantă de modele utilizate preponderent pentru studierea fenomenelor şi proceselor la nivel macroeconomic. Se consideră o mulţime de variabile rezultative Y1 , Y2 ,..., YM , şi o serie de factori F1 , F2 ,..., FN , cărora li se asociază respectiv variabilele X 1 , X 2 ,..., X N . Atât pentru variabilele rezultative, cât şi pentru variabilele exogene se efectuează măsurători pentru k momente, rezultând un număr de MN serii de timp, unde MN=M+N cu: M - numărul de variabile rezultative; N - numărul de variabile exogene. Aceste serii de date sunt înscrise în tabelul 1.4. 15
Înregistrarea seriilor de date Tabel 1.4 Moment de timp
X1 X 2 … X l … X N
Y1 Y2 ... Y j … YM
T1
x11 x 21 … xl1 … x N 1
y11 y 21 … y j1 … y M 1
T2
x12 x 22 … xl 2 … x N 2
y12 y 22 … y j 2 … y M 2
M Ti
M x1i x 2i … x li … x Ni
M y1i y 2i … y ji … y Mi
M TK
M
x1K x 2 K .. xlK … x NK
M
y1K y 2 K .. y jK … y MK
Este important să se stabilească: • lungimea seriilor de timp; • modul în care se alege momentul T1 ;
• uniformizarea intervalelor de culegere a datelor; • procedurile de culegere a datelor. Econometria studiază procese complexe şi elaborează modele econometrice pentru producţie în care separat sunt incluse variabile ce se referă la uzură şi la progresul tehnic. De asemenea, sunt elaborate modele econometrice ale cererii şi ofertei în ipoteze privind structurile de produse şi comportamentul consumatorilor. Tot în categoria modelelor econometrice intră modelele sectoriale şi modelele globale pentru întreaga economie. Modelele stabilesc relaţii între variabile şi după estimarea coeficienţilor sunt utilizate în studiul sistemelor în ipoteze privind atât variaţiile variabilelor endogene, cât şi variaţiile variabilelor exogene. Altfel spus, după stabilirea unei valori pentru variabila exogenă se identifică niveluri ale variabilelor exogene care o generează pe aceasta. Sunt situaţii în care se impune efectuarea de schimbări structurale în sistemele economice pentru a modifica nivelurile coeficienţilor estimaţi din modelul econometric în vederea încadrării nivelurilor propuse pentru variabile exogene în intervalele lor naturale. De exemplu, modelele asociate proceselor de producţie iau în considerare forţa de muncă (variabla exogenă), capitalul (variabila exogenă 16
C), iar variabila endogenă P este nivelul producţiei. Pentru modelarea producţiei se utilizează o formă analitică în care între variabilele exogene există operatorul de înmulţire, ceea ce impune ca pentru a obţine variaţia variabilei endogene P într-un interval realist pentru momente de timp rezonabil alese, să se definească, de asemenea, intervale realiste pentru variabilele exogene. Este realist ca pentru un moment de timp t+k, k ∈ {1,2,3,4,5} , producţia cel mult să se dubleze. Triplarea producţiei este deja o ipoteză nerealistă care conduce la lărgirea intervalelor pentru variabilele exogene L şi C, deplasând întreaga abordare a analizei econometrice spre abordări fanteziste [MAILL71]. Analiza economică determină stabilirea structurilor modelelor econometrice, rezultând matricea E , a dependenţelor, dată în tabelul 1.5. Legături între variabile Tabel 1.5
X1 X 2 … X j … X N Y1
e11 e12 … e1 j … e1N
Y2
e21 e22 … x j 2 … e2 N
M Yk
M ek1 ek 2 … ekj … ekN
M YM unde
M
eM 1 e M 2 .. e Mj … eMN
⎧1, daca _ exista _ o _ legatura . ekj = ⎨ ⎩0, in _ rest
În modelul econometric Klein-Goldberger, este prezentat următorul sistem de ecuaţii structurale: COt = y10 + y11PFt + y12 PFt −1 + β11 (WS tp + WGVt g ) + ς 1t
IN t = y20 + y21PFt + y22 PFt −1 + β 21MKt −1 + ς 2t WS tp = y30 + y31 ATRt + β 31 XQt + β 32 XQt −1 + ς 3t
XQt = COt + IN t + GVt 17
PFt = XQt − TAX t − WStp
MK t = MKt −1 + IN t Variabilele folosite au următoarele semnificaţii: COt - consumul în anul t ;
INt
- investiţiile;
WStp
- salariile private;
XQt
- cererea la echilibru;
PFt
- profiturile private;
MKt
- masa de capital;
GVt
- cheltuieli guvernamentale altele decat salariile;
TAX t - taxe indirecte pe profit şi exporturi nete; WGVt g - salarii guvernamentale;
ATRt - tendinţa anuală. Parametrii ζ sunt variabile de eroare, fiind numite distorsiuni structurale. Parametrii y sunt parametri structurali (coeficienţi de regresie), care leagă variabilele endogene de cele exogene. În mod similar, parametrii β sunt parametri structurali care leagă unele de altele variabilele endogene. Matricea dependenţelor este dată în tabelul 1.6. Matricea dependenţelor
COt
INt
WSt
COt
0
0
INt
0
WStp
XQt
Tabel.1.6 WGVt g ATRt
XQt
PFt
MKt
GVt
TAX t
1
0
1
0
0
0
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
0
0
1
0
0
0
p
18
COt
INt
WStp
XQt
PFt
MKt
GVt
TAX t
WGVt g
ATRt
PFt
0
0
1
1
0
0
0
1
0
0
MKt
0
1
0
0
0
1
0
0
0
0
Rezultă că dacă se estimează coeficienţii ecuaţiilor modelelor econometrice, pentru variabila rezultativă Yi , se trece la calculul nivelurilor estimate ale acestor variabile prin relaţia: N
yˆ i = ∑ aij α ij xij , i = 1,2,..., M , numărul de ecuaţii. j =1
a ij - coeficienţi de contribuţie a ij ∈ {−1,0,1} ;
α ij - coeficienţii modelului, estimaţi prin metoda celor mai mici pătrate; yˆ i - nivelul estimat al variabilei rezultative yˆ i , din modelul KleinGoldberger. În econometrie, se lucrează şi cu modele ale seriilor de timp [HOSPO01] de forma ∞
xt = η (t ) + ∑ Ψ j ⋅ at − j j =0
unde:
η (t ) - componenta deterministă a seriei de timp; at – secvenţă de variabile aleatoare de tip zgomot alb; Ψ j ∈ ℜ astfel încât
∞
∑Ψ l =*
1
2
< ∞ şi Ψ0 = 1 .
Modelul Auto Regresiv de ordinal întâi are forma:
xt = at + θ ⋅ xt −1
19
unde:
θ - pondere at – asemanator cazului anterior. Modelul ARMA are forma: θ ( B) xt = ⋅ at φ ( B) unde:
B – operator de translatare în trecut; φ (B ) - un polinom finit. Există şi modele econometrice neliniare în care apar operatori şi funcţii care conduc la creşterea nivelului de complexitate a acestor modele. De exemplu, pentru dependenţa inflaţiei de factorul timp, se construieşte modelul econometric 1 y = a ⋅ t2 + b ⋅ +c 1+ t2 Un alt model neliniar este definit de ecuaţia: 1 f ( xt − d ) = 1 1 + e γ ( xt − d − c ) reprezentând modelul STAR (Smooth Transition Arutoregression), unde: xt − d - variabilă directoare;
d – întârzierea variabilei directoare; c – parametru. Pentru seriile de timp pentru care s-au construit modele stochastice neliniare se asociază modele de forma ∞
∞
∞
∞
∞
∞
xt = ∑ψ iut − i + ∑ ∑ψ ij ⋅ ut − i ⋅ ut − j + ∑∑∑ψ ijk ⋅ ut − i ⋅ ut − j ⋅ ut − k t =0
i =0 j =0
i =0 j =0 k =0
unde:
u - variabilă stochastică. 20
Indiferent de nivelul de complexitate al modelului trebuie stabilit algoritmul de estimare a coeficienţilor şi trebuie verificate ipotezele privind calitatea acestora. Modelele econometrice se folosesc atât la modelarea proceselor şi fenomenelor la nivel microeconomic, cât şi la modelarea la nivel macroeconomic. Soluţiile obţinute au un caracter orientativ. Este esenţial sistemul de ipoteze cu care sunt construite modelele econometrice şi concordanţa acestui sistem de ipoteze cu ipotezele de alimentare a modelului cu date curente în vederea studierii consecinţelor comportamentului procesului sau fenomenului economic.
1.6 Modele de optimizare Modele de optimizare liniară includ în structura lor funcţii de forma: n
{min/ max} f ( x) = ∑ a j c j x j j =1
unde:
n a ij
- numărul de produse; - coeficienţii de contribuţie definiţi pe mulţimea {−1,0,1} ;
cj
- coeficienţii de multiplicare;
xj
- nivelul variabilelor asociate factorilor, care influenţează
procesele de maximizare sau de minimizare. Restricţiile modelelor liniare au forma: m
∑a α j =1
ij
ij
x j ≤ bi , i = 1,2,..., n ,
unde: a ij - coeficienţii de contribuţie pentru ecuaţia i ; bij - nivel limitativ pentru definirea unui capăt al intervalului de
variabile pentru resursele utilizate; α ij - consumul unitar de resursă de tip i . 21
m - numărul de restricţii. Sunt situaţii în care optimizarea presupune minimzarea sau maximizarea unei funcţii neliniare. Există numeroşi algoritmi care aproximează soluţia optimă. Tipurile de modele de optimizare dezvoltă capitole distincte ale disciplinei de Cercetări operaţionale, precum: • modele de programare liniară; • modele ale problemei de transport; • modele de drum critic; • modele de stocare; • modele de programare discretă; • modele de programare pătratică; • modele de programare dinamică; • modele de programare stochastică; • probleme de programare convexă; • probleme de înlocuire a utilajelor; • probleme de alocare şi nivelare resurse; • modele de programare multicriterială. Pentru fiecare dintre aceste modele există o descriere riguroasă a variabilelor şi ecuaţiilor. Se fac aprecieri privind complexitatea calculelor pentru a stabili efortul de obţinere a soluţiei în raport cu dimensiunea problemei. Se construiesc algoritmi pentru soluţionare şi se stabilesc caracteristicile privind performanţa acestora. În mod corespunzător se elaborează pachete software pentru implementare.
1.7 Modele liniare Modele liniare, de forma: y = f ( x1 , x2 ,..., xn ) = f ( x) , în care: y = f (cx ) = cf ( x) 22
y = f ( x + w) = f ( x) + f ( w)
Cele mai uzuale modele sunt: y = ax + b ,model unifactorial; y=
n
∑a x
1 1
+ a 0 , model multifactorial.
i =1
Modele liniare în care intervin operatorii de înmultire între coeficienţi şi variabile, operatorii de adunare a termenilor şi un operator de atribuire. Forma extinsă a modelului liniar este: y= a0 + a1 x1 + ... + an xn iar forma concentrata este: n
y= a 0 + ∑ a i x i i =1
Modelele liniare se manipulează cu uşurinţă, au proprietăţi interesante privind descompunerea şi rafinarea. Există numeroase metode de estimare a coeficienţilor pentru modelele liniare. În ştiinţele economice, modelele liniare sunt construite pentru a realiza agregări de date în vederea efectuării de plăţi. Pentru obţinerea fondului de salarii FSAL se construieşte un model de forma: n
FSAL= ∑ SALi i =1
unde: n – numărul variabilelor exogene, egal cu numărul salariaţilor; SALi– salariul muncitorului i. Volumul de vânzări VIN, într-un lanţ de n magazine în cele 30 de zile ale unei luni, folosind volumul vânzărilor vzij, din ziua i ale magazinului j, este dat de modelul: 30
n
VIN= ∑∑ vz ij . i =1 j =1
23
Modelele liniare se regăsesc în numeroase ramuri ale ştiinţei economice întrucât metodele de obţinere a indicatorilor agregaţi presupun efectuarea de operaţii de adunare. Se consideră un sistem S cu structură ierarhizată pe trei niveluri. La nivelul 0, se găseşte indicatorul A cu gradul de agregare maxim. La nivelul 1, se găsesc indicatorii B1, B2, …, Bn. La nivelul ultim se găsesc indicatorii: {C11,C12,…,C1m1},{C21,C22,…,C2m2},…,{Cn1,Cn2,…,Cnmn}, cărora le corespund structura ierarhizată din figura 1.1. S
nivel 0
… B1
C11
…
B2
C1
m1
C21
…
nivel 1
Bn
C2
m2
…
Cn1
…
Cn
mn
nivel 2
Figura 1.1 Structură organizată pe două niveluri de agregare Datele Cij reprezintă nivelul primar şi sunt rezultatul culegerii prin măsurare, observare sau transcriere. Datele de pe nivelul 1 reprezintă indicatori agregaţi după modelul ni
Bi = ∑ Cij . j =1
Pentru al doilea nivel de agregare se obţine indicatorul :
A=
n
∑B
i =1=1
i
24
În categoria modelelor liniare se înscriu şi modelele de regresie liniară de forma: Y=a*x+b Y=a0+a1*x1+a2*x2+….+an*xn Modelele liniare se construiesc şi se manipulează folosind calculul matriceal iar algoritmii existenţi se utilizează direct sau modificările care trebuie realizate nu ridică probleme esenţiale.
1.8 Modele neliniare Modelele neliniare reprezintă o largă categorie utilizată în studierea interdependenţelor dintre factori. Marea varietate de modele neliniare produce efecte variate în colectarea şi dezvoltarea sistematizată a lor, întrucât descrierea modelelor de acest tip trebuie definite reguli care să conducă la descrieri corecte şi la implementări cu grad de cuprindere deosebit de ridicat. Dintre cele mai cunoscute modele neliniare sunt cele care au forma: f ( x, y ) = Axα y β , funcţii de producţie Cobb-Douglas. De asemenea, modelele polinomiale: n
y = ∑ ai x i i =0
sau cele pătratice: n
y = ∑ xi
2
i =1
sunt des întâlnite în metodele de interpolare sau în obţinerea de modele în care evoluţia fenomenului în mod intuitiv are fie un minim, fie un maxim. Diversitatea modelelor neliniare este foarte mare, de la caz la caz impunându-se o tratare distinctă pentru fiecare model, chiar dacă este o forma patratică sau include funcţii elementare sau funcţii compuse. Tot în clasa modelelor neliniare sunt incluse şi modelele cu argument întârziat date de o relaţie. 25
Sunt situaţii în care modelele neliniare, prin transformări convenabile sunt transformate în modele liniare. Pentru bxmodelul: Y=a* e este liniarizabil prin logaritmare: ln y=ln a + bx prin substituţie se obţine: ~
~
y = A+ bx De exemplu, pentru un alt model neliniar: y = A ⋅ X α ⋅W β , prin logaritmare se obţine structura: log y = log A + α log X + β log Y . Efectuând înlocuirile y '= log y , A'= log A , X '= log X , W '= log W , se obţine modelul liniar: y ' = A'+αX '+ β W '
care se rescrie în forma: n
y ' = ∑ ai bi X i , i =1
unde:
X 1 = A' , X 2 = X ' , X 3 = W ' , b1 = 1, b2 = α , b3 = β şi a1 = a 2 = a3 = 1 . Toate acestea conduc la ideea găsirii unor tehnici şi metode de stocare şi gestionare a diversităţii de modele economice, folosind software-ul adecvat. În cazul modelelor neliniare, problemele de elaborare de software vizează: • construirea modulului care preia forma analitică a modelului; • construirea modulului care analizează corectitudinea formei analitice; • construirea modulului care încorporează forma analitică ca parametru în proceduri de estimare; 26
• implementarea metodei de estimare a coeficienţilor modelului neliniar; • construirea modelului de analiză a calităţii estimării; • elaborarea modulului pentru gestionarea modelului neliniar cu coeficienţi estimaţi. În general, specialiştii se familiarizează cu unele dintre modele, achiziţionează software pentru soluţionarea unor clase de probleme şi caută ca toate problemele pe care doresc să le rezolve să le încadreze în tipurile de probleme cu care s-au familiarizat şi să folosească software-ul din dotare. În particular, prin restrângerea diversităţii, se obţine folosirea mecanică a modelelor liniare şi a software-ului aferent. Baza de modele economice are menirea de a fluidiza traseul de la fenomen la soluţie prin crearea a numeroase puncte în care economistul analist selectează sisteme de ipoteze, tipuri de variabile, clase de modele, algoritmi şi software pentru implementarea modelelor. Sunt eliminate restricţiile generate de folosirea repetată a unor modele şi algoritmi indiferent de context.
27
2. CONSTRUIREA MODELELOR 2.1 Componente de bază Un model economic este o construcţie complexă care se descrie cu ajutorul următoarelor elemente: • variabilele exogene al căror nume este asociat factorilor ce influenţează un fenomen sau un proces; • variabilele endogene sau rezultative care sunt asociate obiectivului urmărit prin eleborarea modelului; • coeficienţii, obţinuţi prin utilizarea unor algoritmi de estimare; • operatori cu ajutorul cărora se construiesc factorii şi termenii expresiei analizate ai modelului economic; • funcţii elementare care sunt înglobate în modelele neliniare; • funcţii compuse care intră în alcătuirea modelelor economice deosebit de complexe; • argumente cu ajutorul cărora se stabileşte apartenţa la o anumită colectivitate sau la un anumit interval pentru variabile şi pentru coeficienţi; • seturi de date asociate variabilelor modelului; • numele modelului, dat sub forma unui şir de caractere care indică fie autorul, fie structura, fie variabila rezultativă, fie tipul de neliniaritate indus; • numele problemei de rezolvat este dat ca şir de litere şi cifre, din care primul caracter este litera, utilizat în identificarea obiectivului urmărit de cel care activează resursele bazei de modele; • lungimea seriilor de date utilizate în estimarea de coeficienţi şi în efectuarea de calcule; • reperele, prin care se selectează părţi ale seriilor de date pentru a fi utilizate în procesele de estimare, în derularea de prognoze şi în studiul stabilităţii coeficienţilor. 28
Variabilele exogene ale unui model economic au fie un nume standard, fie un nume atribuit de elaboratorul de model. Numele standard pentru variabilele exogene sunt x1 , x 2 , …, x 2 , unde n reprezintă numărul de variabile exogene incluse în model. Numele atribuite de elaboratorul de model sunt acronime de la indicatorii economici precum: TVA – taxa pe valoarea adaugată; PIB – produs intern brut; Sem – semestru; TRIM – trimestru; JUD – judeţ; PROD – producţie; W – productivitatea muncii; K – capitalul; d – rata dobânzii. Unele dintre acronimele variabilelor se află într-o listă predefinită a bazei de modele şi utilizatorul trebuie să ştie că există seriile de date aferente lor. Variabila endogenă a modelului economic cu o singură ecuaţie este identificată cu litera y. În cazul în care utilizatorul foloseşte un nume dat de el, acest nume se construieşte ca acronim de la numele complet al indicatorului sau fenomenului de modelat. Dacă se construieşte un model cu ecuaţii simultane, variabilele endogene ale ecuaţiilor se marchează cu y1 , y 2 ,..., y m , unde m este numărul de ecuaţii ale modelului. Şi în cazul variabilelor endogene, utilizatorul are la dispoziţie facilitatea de a defini, folosind acronime proprii, numele variabilelor endogene sau de a le prelua dintr-o listă inclusă în baza de modele, având acces la seriile de date asociate. Coeficienţii modelului au numele a1 , a 2 ,..., a n fiind puşi în corespondenţă cu variabilele exogene. Coeficientul ai corespunde variabilei exogene xi într-un model liniar. Termenului liber i se asociază coeficientul
29
a 0 . În cazul modelelor neliniare, coeficienţii se pun în corespondenţă în secvenţă conform structurii modelului. Astfel, modelul iniţial: Y = ax + bu + cz + d este preluat în baza de modele, fie utilizând acronimele x, u, z şi coeficienţii denumiţi de utilizator a, b, c, d, fie sub forma Y = a 0 + a1 x1 + a 2 x 2 + a3 x3 . Modelul iniţial: Y = Ax α u β w δ
devine: Y = Ax a1u a 2 w a 3 Când se dă un model cu n variabile, numarul coeficienţilor estimaţi
este m. Dacă m>n, modelul conţine numeroase combinaţii ale variabilelor în cadrul termenilor. De exemplu, în modelul: y = a 0 + a1 x1 + a 2 x 2 + a 3 x1 x 2 + a 4 x12 + a 5 x 22
numărul de variabile exogene n=2, iar numărul de coeficienţi ai termenilor m=6, dacă se include şi coeficientul termenului liber. Dacă m=n rezultă fie absenţa termenului liber, fie se impune ca un coeficient să fie cu o valoare dată. În cazul modelului: Y= a1 x1 + a 2 x 2 numarul de coeficienţi m=2, este egal cu numărul variabilelor n=2. Operatorii utilizaţi în obţinerea structurii unui model sunt operatorii aritmetici pentru adunare, înmulţire, scădere, împarţire, ridicarea la o putere, extragerea de radical. Exista un singur operator de atribuire la o ecuaţie. Modelul: Y= a 0 + a1 x1 + a 2 x 2 Conţine operatorii de adunare, de înmulţire şi de atribuire.
30
Modelul: Y= a 0 + a1 x12 + a 2 x 22 contine operatorii de adunare, înmulţire, ridicare la putere şi atribuire. Modelul: Y= a 0 + a1
1 2 − a 2 x1 x2
conţine operatorii de adunare, înmulţire, împărţire, scădere, ridicare la pătrat şi atribuire. Modelul: Y= a1 x1 + a0 conţine operatorii de adunare, înmulţire, extragere de rădăcină pătratică şi de atribuire. Funcţiile incluse în modelele economice au menirea să aproximeze mai riguros factorii de influenţă. Modelul: Y= a 0 + a1e a2 x1 + a 3 log x 2 conţine operatorii de adunare, de înmulţire, de atribuire şi funcţiile simple, exponenţiale şi logaritmică. Modelul: Y = a 0 sin( a1 x12 + a 2 x 2 ) are un nivel de complexitate mai ridicat, întrucât argumentul funcţiei este o expresie ce include variabile exogene şi coeficienţi ce trebuie estimaţi. Modelul: Y= a 0 sin( a1 x1 + e a2 x2 + a 3 ) este, de asemenea, complex prin includerea unei funcţii trigonometrice, sin( ), al cărui argument este o expresie ce conţine coeficienţi de estimat şi chiar o funcţie exponenţială. Modelarea economică cunoaşte structuri deosebit de complexe în care se includ operatori de derivare şi de integrare.
31
Structurile de date se asociază cu lista de variabile exogene şi endogene date de elaboratorul de modele. Un set de date apare sub forma unui tablou definit prin număr de linii şi număr de coloane. De exemplu, pentru modelul: Y= a 0 + a1 x1 + a 2 x 2 + a 3 x 3 unde: Y – volumul acumulărilor pe durata când persoana este activă; x1 – durata când persoana este activă; x2 – nivelul de complexitate a activităţii desfăşurate; x3 – rata de acumulare specifică persoanei. Corespunzător se inregistrează pentru un grup de 20 de persoane setul de date din tabelul 2.1. Date privind activităţile şi volumul acumulărilor Tabel 2.1 Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12 13
Y
y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13
x1 x1 1 x1 2 x1 3 x1 4 x1 5 x1 6 x1 7 x1 8 x1 9 x1 10 x1 11 x1 12 x1 13
x2 x2 1 x2 2 x2 3 x2 4 x2 5 x2 6 x2 7 x2 8 x2 9 x2 10 x2 11 x2 12 x2 13
x3 x3 1 x3 2 x3 3 x3 4 x3 5 x3 6 x3 7 x3 8 x3 9 x3 10 x3 11 x3 12 x3 13 32
Nr. crt. 14 15 16 17 18 19 20
Y
y14 y15 y16 y17 y18 y19 y 20
x1 x1 14 x1 15 x1 16 x1 17 x1 18 x1 19 x1 20
x2 x2 14 x2 15 x2 16 x2 17 x2 18 x2 19 x2 20
x3 x3 14 x3 15 x3 16 x3 17 x3 18 x3 19 x3 20
În cazul în care se doreşte extragerea unui bloc se precizează sub forma unei liste de variabile pentru a indica poziţiile coloanelor extrase şi se definesc intervale pentru a specifica liniile blocului selectat. Blocului de date i se asociază un nume format dupa aceleaşi reguli pe care le are numele problemei. Când se solicită estimarea de coeficienţi, se specifică: - numele blocului de date; - lista de variabile; - structura modelului. Se obţin după prelucrare, rezultatele: coeficienţi, verificări ale ipotezelor de lucru şi valori agregate privind calitatea modelului. Este important ca utilizatorul de modele economice să-şi regăsească atât datele iniţiale, cât şi rezultatele, reunite în probleme pe care le generează prin nume. Este, de asemenea, important ca în procesul de modelare să existe conservată experienţa acumulată şi să se facă apel la ea ori de câte ori este nevoie.
33
2.2 Tehnologie pentru construirea modelului Există tentaţia utilizării clasei de modele cunoscute, cu care s-a mai lucrat. Uneori acest mod de lucru conduce la obţinerea de modele adecvate, de cele mai multe ori însă se obţin modele simpliste, neadecvate, care nu reflectă cerinţele obiective ale fenomenului studiat. Pentru a evita existenţa unor situaţii neconvingătoare, se impun: - studierea de clase de modele existente pentru fenomenul considerat sau pentru fenomene înrudite, pentru stabilirea unui nivel de cultură în zona modelării economice; - crearea unui context complet, prin enumerarea ipotezelor care au condus la selectarea variabilelor, la imprimarea unor traiectorii privind evoluţia probabilă pe un interval de timp impus; - analiza comparată a unor variante cu specificarea de fiecare dată a situaţiilor în care unul dintre modele este mai bun decât celelalte; - ierarhizarea restricţiilor de implementare a modelelor, prin stabilirea efortului necesar culegerii de date, definirea de interdependenţe şi mai ales, efortul necesar derulării etapelor de obţinere a informaţiilor privind condiţiile necesare pentru aplicarea procedurilor de estimare şi de testare a calităţii estimatorilor. Pentru construirea unui model economic trebuie parcurse etapele următoare: e1 – definirea obiectivului, specificând dacă modelul este utilizat pentru prognoză, pentru optimizare, pentru calcul, pentru aproximarea unei soluţii, pentru definirea unei structuri sau pentru obţinerea de informaţii de comportament a unui sistem. Prin intermediul unor niveluri medii; de exemplu, pentru modelul de prognoză a populaţiei, obiectivul urmărit este cunoaşterea evoluţiei populaţiei pe intervalul 2004-2010; e2 – studierea factorilor de influenţă şi luarea în considerare a legăturilor directe; în acest sens sunt luate în calcul modele deja existente în literatura de specialitate, în aşa fel incât noua construcţie să reprezinte un plus de calitate în structurarea acestei tipologii. Populatia la momentul t ,yt, depinde de numărul femeilor cu vârsta intre 18-40 de ani, variabilă notată 34
xt −1 , precum şi de persoanele cu vârsta peste 60 de ani, variabilă notată vt ; graful asociat este dat în figura 2.1. xt −1 yt vt Figura 2.1 Graful dependenţelor pentru modelul productivităţii în cazul modelelor complexe, graful se organizează pe mai multe niveluri apărând astfel factori cu influentă indirectă; e3 – culegerea de date este o problema dificilă, întrucât este greu sa se asigure serii de timp cu o lungime suficient de mare, gradul de detaliere este restricţionat de organizarea teritorială, de metodologiile de culegere a datelor şi de procedurile de agregare existente la un moment dat, pentru prognoza populatiei şi constituie setul de prezentat în tabelul 2.2 Dinamica populaţiei Tabel 2.2 Anul t 1960 1970 1980 1990 2000 2003
Nr locuitori Nr femei cu vârste între Nr loc de peste (mii loc) 18-40(mii loc) în anul t-1 60 ani (mii loc) 19525 5882,5 3915 19775 5967,5 4022 20025 6067,5 4095 20275 6162,5 4175 20525 6247,5 4155 20775 6325,5 4243
Este destul de important să se verifice sursele de provenienţă pentru a vedea gradul de omogenitate a seriilor şi încrederea care se acordă acestora. e4 – trasarea de grafice pentru a vedea evoluţia în timp a tuturor variabilelor. Se trasează graficul populaţiei pentru a vedea cum a evoluat aceasta în timp. De asemenea, se trasează grafice şi pentru evoluţia 35
variabilelor x,w. Graficele privind evoluţia în timp a numărului de locuitori sunt prezentate în figurile 2.2, 2.3 şi 2.4 .
Evolutiaînintimp timpa anumărului numarului locuitori Evoluţia de de locuitori 21000 20500
Evolutia in Evoluţia în timp timp a a numărului de numarului de locuitori locuitori
20000 19500 19000 2003
2000
1990
1980
1970
1960
18500
Figura 2.2 Evoluţia în timp a numărului de locuitori
6300 6200 6100 6000 5900 5800 5700 5600
2003
2000
1990
1980
1970
Evolutia Evoluţia în in timptim a pa populatiei populaţiei fertile fertile
1960
Numarul populatiei fertile
Evolutia timp a populatiei fertile Evoluţia în in timp a populaţiei fertile
Anii
Figura 2.3 Evoluţia în timp a populaţiei fertile
36
4200 4100
Evolutia Evoluţia în in timptim a pa populaţiei populatiei vârstnice varstnice
4000 3900 3800 2003
2000
1990
1980
1970
3700 1960
Numarul persoanelor varstnice
Evolutia populatieivârstnice varstnice Evoluţia in în timp timp aa populaţiei
Anii evolutiei
Figura 2.4 Evoluţia în timp a populaţiei vârstnice e5 – calculul coeficienţilor de corelaţie liniară; în cazul în care aceştia au niveluri care conduc la acceptarea ipotezei privind o legatură foarte stransă între variabila timp şi variabilele care vor fi incluse în model, se consideră rezonabilă acceptarea ipotezei privind liniaritatea modelului de prognoza a populaţiei. Modelul liniar va avea structura: y t = axt −1 + bvt + c folosind datele din tabelul 2 se estimează cu metoda celor mai mici pătrate coeficienţii, obţinându-se modelul: y t = 2.86 xt −1 − 0.13vt + c De asemenea, se calculează nivelul populatiei y estimat pentru coeficienţii estimaţi şi se adaugă o coloană tabelului 2.2 obţinând tabelul 2.3.
37
Datele modelului pentru estimarea parametrilor Tabel 2.3 Y estimat x t-1 vt 19518 5882,5 19747,19 5967,5 20023,7 6067,5 20285 6162,5 20530,7 6247,5 20742,34 6325,5
3915 4022 4095 4175 4155 4243
e6 – se calculează suma pătratelor de diferenţe SS1 şi coeficientul normat SS 2
SS1 = ∑ ( yt − yˆ t ) 2 = 2023.25
∑ ( y − y ^) t
SS 2 =
2
t
2
(T − t 0 + 1) max{( y t − y t^) }
=0.04
t 0 ≤t ≤T
aceste rezultate sunt utile pentru analiza comparată a modelului cu alte modele, cu alte variante ale modelului. SS 1 şi SS 2 sunt indicatori cu care se analizează performanţa modelului. e7 – definirea ipotezelor privind evoluţia variabilelor xt şi vt pentru perioada de prognoză 2004-2010; aceste ipoteze trebuie specificate explicit; una dintre ipoteze presupunea creşterea cu o raţie determinată ca medie aritmetică a variaţiilor în valoare absolută de la un an la altul: T −1
∑v
t +1
− vt
t=
t0 rv =
=2,49
T − t0
T
∑ x −x t
rx =
t=
t1 T − t0
t −1
=138,267
38
e8 - folosind raţii r v , r x precum şi coeficienţii estimaţi ai modelului, se procedează la construirea tabelului 2.4. Prognoza populaţiei în ipoteze constante pentru variaţia factorilor Tabel 2.4.
Moment
y estimat
2003 20742.34 2004 21137.46 2005 21532.58 2006 21927.7 2007 22322.82 2008 22717.94 2009 23113.06 2010 23508.179
Xt-1 estimat
Vt estimat
6325.5 6463.767 6602.034 6740.301 6878.568 7016.835 7155.102 7293.369
4243 4245.49 4247.98 4250.47 4252.96 4255.45 4257.94 4260.43
În cazul în care se adoptă ipoteze pesimiste, raţiile se obţin ca valori minime ale variaţiilor. −
r x = min { xt +1 − xt } t1 ≤ t ≤ T
−
r v = min { vt +1 − vt } t 0 ≤ t ≤ T −1
Pentru modelul populaţiei se obţin −
rx = 78 −
rv = 20
Şi se obţin nivelurile prognozate din tabelul 2.5.
39
−
−
Prognoza pesimistă a populaţiei pentru rx = 78 şi rv = 20 Tabel 2.5
Moment 2003 2004 2005 2006 2007 2008 2009 2010
y estimat
Xt-1 estimat
20742.34 20962.82 21183.3 21403.78 21624.26 21844.74 22065.22 22285.7
Vt estimat
6325.5 6403.5 6481.5 6559.5 6637.5 6715.5 6793.5 6871.5
4243 4263 4283 4303 4323 4343 4363 4383
În mod asemănător se construieşte o variantă optimă, selectând variaţiile maxime. ~
r x = max { xt − xt −1 } = 100 t1 ≤ t ≤ T
~
r v = max { vt +1 − vt } = 107 t0 ≤t ≤T Se obţin datele din tabelul 2.6. ~
~
Prognoza optimistă a populaţiei pentru r x = 100 şi r v Tabel 2.6
Moment 2003 2004 2005 2006 2007 2008 2009 2010
y estimat 20742.34 21014.43 21286.52 21558.61 21830.7 22102.79 22374.88 22646.97
Xt-1 estimat 6325.5 6425.5 6525.5 6625.5 6725.5 6825.5 6925.5 7025.5
Vt estimat 4243 4350 4457 4564 4671 4778 4885 4992 40
−
~
~
−
Se obţin prognoze cu rx , rv , rx , rv precum şi alte combinaţii care iau în consideraţie variaţiile medii; e9 – trecerea la creşterea calităţii modelului este bazată pe modul în care sunt luate în considerare variabilele xt −1 şi vt ; dacă se produc schimbări ale intervalelor de includere, cele două variabile vor avea niveluri diferite; astfel, prin includerea în populatia fertilă numai a populaţiei de sex feminin cu vârsta cuprinsă între 20 şi 35 de ani şi în categoria vârstnicilor a persoanelor cu vârsta de peste 65 de ani, se obţin datele din tabelul 2.7. Date pentru construirea modelului cu argument întârziat Tabel 2.7 t 1960 1970 1980 1990 2000 2003
(mii loc) 20-35(mii loc) in anul t-1 65 ani (mii loc) 19525 3383 3815 19775 3368 3872 20025 3272 3795 20275 3713 3975 20525 3398 3985 20775 2426 4013
Se estimează astfel coeficienţii şi se obţine modelul: yt = − 0.29 xt −1 + 3.88 vt + 5259 −
−
~
~
În mod corespunzător se obţin raţiile r , r , r ' , r ' , r ' , r ' pentru x v x v ' x
' v
care se construiesc tabelele de prognoză 2.8, 2.9 şi 2.10. T −1
∑v
rw =
t +1
− vt
t=
t0
T − t0
=1.33
T
∑ x −x t
t=
t1 rx = T − t0
t −1
=22.953
41
Estimarea populaţiei când variabila y este cu argument întârziat pentru r w = 1.33 şi r x =22.953 Tabel 2.8
Moment 2003 2004 2005 2006 2007 2008 2009 2010
y estimat
Xt-1 estimat
19887.445 19885.949 19884.453 19882.957 19881.461 19879.965 19878.469 19876.973
Vt estimat
6325.5 6348.453 6371.406 6394.359 6417.312 6440.265 6463.218 6486.171
4243 4244.33 4245.66 4246.99 4248.32 4249.65 4250.98 4252.31
−
r x = min { xt +1 − xt } =15 t1 ≤ t ≤ T −
r v = min { vt +1 − vt } =10 t 0 ≤ t ≤ T −1 −
−
Estimarea populaţiei pentru r x = 15 , r v = 10 Tabel 2.9
Moment 2003 2004 2005 2006 2007 2008 2009 2010
y estimat
Xt-1 estimat
19887.445 19921.895 19956.345 19990.795 20025.245 20059.695 20094.145 20128.595
6325.5 6340.5 6355.5 6370.5 6385.5 6400.5 6415.5 6430.5
Vt estimat 4243 4253 4263 4273 4283 4293 4303 4313
~
r x = max { xt − xt −1 } = 972 t1 ≤ t ≤ T ~
r v = max { vt +1 − vt } = 180 t0 ≤t ≤T
42
~
~
Estimarea populaţiei pentru r x = 972 şi r v = 180 Tabel 2.10
Moment 2003 2004 2005 2006 2007 2008 2009 2010
y estimat
Xt-1 estimat
19887.445 20303.965 20720.485 21137.005 21553.525 21970.045 22386.565 22803.085
6325.5 7297.5 8269.5 9241.5 10213.5 11185.5 12157.5 13129.5
Vt estimat 4243 4423 4603 4783 4963 5143 5323 5503
Se calculează indicatorii de performanţă ai modelului S S 1' , S S '2 şi se compară cu nivelurile obţinute la modelul anterior, observându-se ca modelul iniţial este mai bun sau mai slab decât acesta din urmă. 2
S S 1' = ∑ ( y t − yˆ t ) = 2 889 988.9
' SS 2 =
∑ ( y t − yˆ t )
2
= 0.07
(T − t 0 + 1) max{( y t − yˆ t ) } t 0≤t ≤T Este foarte important ca în etapa de analiză a fenomenului economic să fie înţelese integral toate mecanismele, pentru a dezvolta ipoteze de lucru cât mai realiste, care să simplifice structurile de modele, fără a le face simpliste şi, deci neoperaţionale. 2
2.3 Rafinarea modelului Rafinarea modelului economic este un proces complex, însoţit de efecte dintre cele mai variate şi profunde. Rafinarea unui model constă fie din reducerea numărului de variabile exogene, fie din înlocuirea unor termeni cu o complexitate ridicată, 43
cu unii mult mai simpli. În cazul modelelor cu ecuaţii simultane, rafinarea este însoţită şi de reducerea numărului de ecuaţii. Se consideră modelul pentru estimarea productivităţii muncii, w, dat de ecuaţia M0: wt = a0 + a1 S t2−1 + a 2 I t2−1 + a3 V t *U t unde: S t – salariile muncitorilor; I t – investiţiile cu calificarea continuă; V t – vechimea medie a muncitorilor; U t – gradul de utilizare a fondului de timp; Cu datele din tabelul 2.11 se procedează la estimarea coeficienţilor modelului. Date de bază necesare estimării productivităţii Tabel 2.11 Anul 1980 1984 1988 1992 1996 2000 2003
Wt (USD/munc) St-1 (USD) It-1(USD) Vt 13 10 15 12 12 16 15 15 16,5 18 100 17 17 150 18 20 200 18,5 25 225 19
Ut 20 19,8 19,2 18 17 17,5 16
0,1 0,2 0,3 0,4 0,5 0,6 0,7
Rezultă modelul: wt = 39.024 + 0.00018 S t −1 − 0.135 I t −1 + 2.132 V t *U t Se calculează indicatorii: SS 1 = 10.705 2
2
SS 2 = 0.08 Se trece la rafinarea modelului eliminând neliniarităţile. Se construieşte modelul: M1: wt = a 0 + a1 S t −1 + a 2 I t −1 + a3 V t + a 4 U t
44
Folosind datele din tabelul 2.8 se obţine modelul: wt = 160.44 − 0.005 S t −1 − 9.88 I t −1 − 0.4 V t + 84 U t Se calculează indicatorii de performanţă: SS1 = 167.053,3 SS 2 = 0.24 O altă etapă a rafinării constă în eliminarea unor variabile din model. Din analiza economică rezulta că vechimea şi gradul de utilizare a timpului, prin variaţiile lor reduse în tabelul 2.8 vor fi eliminate. Se produce rafinarea în cascadă pe modelul liniar. Modelul cu număr mai redus de variabile exogene are structura: M2: wt = a0 + a1 S t −1 + a1 I t −1 care după estimarea coeficienţilor folosind datele din tabelul 2.11 conduce la forma: wt = 2.40 + 0.03 S t −1 + 0.65 I t −1 pentru care indicatorii de analiză conduc la valorile SS 1 = 21.07 SS 2 = 0.07 Dacă se produce rafinarea prin eliminarea de variabile în modelul M0 se obţine: M3: wt = a 0 + a1 S 2 t −1 + a1 I 2 t −1 Folosind datele din tabelul 8 se estimează coeficienţii, obţinând: wt = 7.39 + 0.0001 S 2 t −1 + 0.03 I 2 t −1 şi indicatorii: SS 1 = 23.32 SS 2 = 0.102 Combinând cerinţele de rafinare, de eliminare a neliniarităţii şi de eliminare de variabile se obţin structuri de modele: M4: wt = a0 + a1 S 2 + a 2 I 2 wt = 1.43 + 0.0002 S + 0.76 I SS 1 = 26.31
SS 2 = 0.09 45
M5: wt = a0 + a1 S + a 2 I 2 wt = 27.38 + 0.023S − 0.04 I 2 pentru care se efectuează estimarile de coeficienţi şi se calculează indicatorii SS 1 şi SS 2 . SS 1 = 115.271
SS 2 = 0.101 Toate datele sunt incluse în tabelul 2.12 Indicatorii de performanţă ai modelelor
SS1 SS2
M0 10.705 0.08
M1 167053.3 0.24
M2 21.07 0.07
M3 23.32 0.102
M4 26.31 0.09
Tabel 2.12 M5 115.271 0.101
Rezultă că modelul M2 rafinat prin eliminare de variabile, eliminare de neliniarităţi este bun şi efortul de gestionare a sa este rezonabil. Structurile de modele, liniare sau neliniare sunt esenţiale în dezvoltarea de baze de modele economice. Generarea de structuri de modele şi dezvoltarea de procese de rafinare prezintă interes în masura în care sunt insoţite de algoritmi eficienţi care să înlocuiască munca de rutină a tuturor celor care participă la elaborarea de instrumente pentru analiza economică de ordin cantitativ.
46
3. Complexitatea modelelor 3.1 Complexitatea în sens Halstead a modelelor Complexitatea în sens Halstead pentru un model M, este dată de relaţia:
C1 ( M ) = n1 log 2 n1 + n2 log 2 n2 , unde:
n1 - numărul de operanzi (variabile şi coeficienţi); n 2 - numărul de operatori. Modelul liniar, definit prin ecuaţia: y = a 0 + a1 x1 + a 2 x 2 + ... + a n x n , conţine: •
a 0 , a1 ,..., a n nc , n c = n + 1 ;
- coeficienţii estimaţi ai modelului, în număr de
x1 , x 2 ,..., x n , y
•
- variabilele exogene ale modelului şi variabila rezultativă, în total în număr de nv , nv = n + 1 ;
•
* - operatorii de înmulţire a coeficienţilor cu variabilele exogene, în număr de ncv , ncv = n ;
• •
+ - operatorii care leagă variabilele exogene formând membrul drept al ecuaţiei modelului liniar, în număr de nt , nt = n ;
= - operatorul de atribuire. n a = 1 . Efectuând înlocuirile, se obţin: n1 = ne + nv , n 2 = ncv + nt + n a .
În cazul modelului liniar de mai sus, dat prin ecuaţia: y = a 0 + a1 x1 + a 2 x 2 + ... + a n x n , 47
se obţin: n1 = 2(n + 1) n2 = n + 1 . Rezultă că nivelul complexităţii în sens Halstead a modelului economic de regresie liniară este: C = 2(n + 1) log 2 [2(n + 1)] + (n + 1) log(n + 1) . După efectuarea calculelor elementare se obţine: C = (n + 1)[2 log 2 2 + 2 log 2 (n + 1) + log 2 (n + 1)] ,
C = (n + 1)[2 + 3 log 2 (n + 1)] .
Pentru ecuaţia y = a 0 + a1 x1 , rezultă n = 1 şi complexitatea în sens Halstead a modelului este C = 2[2 + 3 log 2 2] = 10 Pentru modelul y = a 0 + a1 x1 + a 2 x 2 + a 3 x3 , cu n = 3 , complexitatea în sens Halstead a acestui model este: C = 4[2 + 3 log 2 2 2 ] = 4(2 + 6) = 32 3.2 Complexitatea Halstead cu operatori ponderaţi Modelul general al complexităţii în sens Halstead este: m
m
n
n
i =1
i =1
j =1
j =1
C 2 = (∑ f i pi ) log 2 (∑ f i pi ) + (∑ h j q j ) log 2 (∑ h j q j ) , unde
m - numărul de operanzi; f i - frecvenţa de apariţie a operandului i ; pi - ponderea asociată operandului în construcţia; n - numărul de operatori; hj - frecvenţa de apariţie a operatorului j ; qj - ponderea asociată operatorului j ; în exemplul considerat, ponderea s-a construit pornind de la prioritatea operatorilor.
48
Dacă se consideră priorităţile operatorilor PO1 , PO2 ,..., POn , cu PO1 < PO2 < ... < POn , indicând că operaţia asociată priorităţii POi se P execută înaintea celei asociate ponderii i +1 , se procedează la construirea unui nou sistem de ponderi care asociază coeficienţi de importanţă în ordine descrescătoare în raport cu priorităţile. Dacă se consideră, de exemplu, tabelul 3.1 de priorităţi: Priorităţile operatorilor Tabel 3.1 Operatorul () α *,/ +,=
Prioritatea 1 2 3 4
În evaluarea complexităţii în sens Halstead, frecvenţele de apariţie ale operatorilor se înlocuiesc cu ponderile asociate, tabelul 3.2. Ponderile operatorilor Tabel 3.2 Operator () α *,/ +,=
Pondere pi 4 3 2 1
Astfel, modelul: y = ax 2 + bz 2 + c ,
are frevcenţele corespunzătoare date în tabelul 3.3.
de
apariţie
şi
ponderile
Frecvenţe şi ponderi ale componentelor Tabel 3.3 Componenta
a b c 2
Frecvenţa fi 1 1 1 2
Ponderea pi 1 1 1 1
fi * pi 1 1 1 2 49
Frecvenţa fi
Componenta
Ponderea pi
fi * pi 5
nc y x z nv
1 1 1
n1 = nv + nc = + * () α n2
1 1 1
1 1 1 3 8
1 2 2 2
1 2 3 4
1 4 6 8 19
C = 8 log 2 8 + 19 log 2 19 = 104.71 În timp ce modelul: y = ax + bz + c , are datele în tabelul 3.4. Frecvenţe şi ponderi ale componentelor Componenta
a b c nc y x z nv
Frecvenţa fi 1 1 1
Ponderea pi 1 1 1
1 1 1
1 1 1
n1 = nv + nc = +
1 2
1 2
*
2
3
n2
Tabel 3.4 fi * pi 1 1 1 3 1 1 1 3 6 1 4 6 11
50
C 2 = 6 log 2 6 + 11log 2 11 = 69.48 C 2 > C1 Pentru modelele: M 1 : y = ax + b M 2 : y = ax b C1 = 4 log 2 4 + 3 log 2 3 = 12.75 C 2 = 4 log 2 4 + 6 log 2 6 = 33.21 Se obţine C 2 > C1 , ceea ce arată că modelul este senzitiv la diferenţierea operatorilor. 3.3 Complexitatea modelelor neliniare În cazul modelului neliniar y = A ⋅ Bα ⋅ C β .
y , A, B, C , α , β , rezultând n1 = 6 ; α β - operatorii sunt: =,*, () ,*, () , rezultând n2 = 5 . α β S-au notat cu () , () , ridicările la o putere, iar operatorul de înmulţire, a fost scris explicit de două ori pentru că de două ori apare în ecuaţie. Complexitatea în sens Halstead a acestui model neliniar este: C = 6 log 2 6 + 5 log 2 5 = 27.12 .
- operanzii sunt:
Trebuie impus un mod unitar de calcul al complexităţii, pentru a nu se produce confuzii. De exemplu, în cazul modelului: y = ( Ax + Bt )(au 2 + bz 3 + cw 4 ) + d , înainte de a se calcula complexitatea, trebuie prelucrată exinsă prin efectuarea calculelor algebrice:
obţinută
forma
y = A ⋅ x ⋅ u 2 + A ⋅ x ⋅ b ⋅ z3 + A ⋅ x ⋅ c ⋅ w 4 + B ⋅ t ⋅ a ⋅ u 2 + B ⋅ t ⋅ b ⋅ z3 + + B⋅ t ⋅c⋅ w4 + d
Frecvenţele de apariţie ale elementelor ce apar în ecuaţia modelului în forma extinsă sunt în tabelul 3.5.
51
Frecvenţele de apariţie din modelul extins Tabel 3.5 Frecvenţa 3 3 2 2 2 1 2 2 2 19
Componenta A B a b c d 2 3 4 Total coeficienţi nc y u z w x t Total variabile nv
1 2 2 2 3 3 13
n1 = nv + nc = 33 Operatori şi frecvenţe Tabelul 3.6 Operator * + () α = Total n 2
Frecventa 18 6 6 1 31
Complexitatea în sens Halstead a modelului este: C = 32 log 2 32 + 31log 31 = 313.58
52
Rafinarea modelului economic conduce la scăderea complexităţii în sens Halstead. Dacă un model liniar are în forma iniţială n variabile exogene şi respectiv complexitatea C n = (n + 1)[2 + 3 log 2 (n + 1)] , prin scăderea numărului de variabile exogene la n − k , k < n , se obţine o complexitate: C n − k = (n − k + 1)[2 + 3 log 2 (n − k + 1)] , diferenţa de complexitate: ∆ = C n − C n − k = 2[(n + 1) − (n − k + 1)] + 3(n + 1) log 2 (n + 1) − − 3(n − k + 1) log 2 ( n − k + 1)
.
Efectuând calculele se obţine: n +1 . Deoarece un model rafinat are între ∆ = 2( k − 1) + log 2 n − k +1 2 şi n variabile, 2 ≤ n − k + 1 < n , ceea ce conduce la inegalitatea n +1 n +1 . > ∆ > 2(k − 1) + 3(n + 1) log 2 2(k − 1) + 3( n + 1) log 2 2 2 n +1 Deoarece 2(k − 1) + 3(n + 1) log 2 > 0 , rezultă ∆ > 0 în cazul în care se 2 obţine o reducere a complexităţii. În cazul în care prin rafinare se trece de la un model neliniar la un model liniar, de asemenea, scade complexitatea modelului. Fie modelul neliniar: M 1 : y = a x 2 + b z 2 + c xy + d 1
1
1
1
1
iar prin liniarizare se obţine: M2: y = a x + b z + c . 2 2 2 2 Frecvenţele de apariţie ale operanzilor şi operatorilor celor două modele sunt date în tabelul 3.7. Frecvenţe operanzi şi operatori pentru două modele Componenta
a b c d nc
Frecvenţa în modelul M 1 1 1 1 1 4
Tabel 3.7 Frecvenţa în modelul M 2 1 1 1 3 53
Componenta y x z nv
n1 = nc + nv + = * () α n2
Frecvenţa în modelul M 1 1 2 2 5
Frecvenţa în modelul M 2 1 1 1 3
10
6
3 1 4 2
2 1 2 -
10
5
C1 = 10 log 2 10 + 10 log 2 10 = 66.43 C 2 = 6 log 2 6 + 5 log 2 5 = 27.11 C1 > C 2 . Este important să se analizeze complexitatea relativă a modelului în raport cu o complexitate maxim posibilă care se obţine prin agregarea operanzilor şi operatorilor. Se calculează complexitatea relativă, C r , prin relaţia:
n1 log 2 n1 + n2 log 2 n2 (n1 + n2 ) log 2 (n1 + n2 ) De exemplu, pentru modelul y = ax + b , cu 4 operanzi şi 3 operatori, C = 4 log 2 4 + 3 log 2 3 , C t = 7 log 2 7 , rezultă: C = 0.649 . Cr = Ct Pentru modelul: y = ax b se observă că acesta conţine operanzii y , a, x, b , cu n1 = 4 şi operatorii =,*, ()α , n2 = 3 şi are deci acceiaşi complexitate calculată cu indicatorul precedent, deşi modelele nu au aceeaşi operatori iar operanzii au funcţiuni diferite. Cr =
Pentru ecuaţia polinomială de gradul n , prin: y = a 0 + a1 x + a 2 x 2 + a 3 x 3 + ... + a n x n , 54
se identifică: a 0 , a1 ,..., a n - coeficienţii care trebuie estimaţi în număr de n + 1 ; coeficienţii putere 1,2,...,n - în număr de n ; în total, nc = 2n + 1 ; x, y variabilele modelului; nv = 2 ; = - un operator de atribuire cu frecvenţa f1 = 1 ; + - operator de însumare cu frecvenţa f 2 = n ; () α - operatorul de ridicare la putere cu frecvenţa f = n − 1 . 3 Rezultă: n1 = nc + nv = 2n + 3 n 2 = f 1 + f 2 + f 3 = 2n Complexitatea C în sens Halstead pentru modelul economic de regresie polinomială este dată de relaţia: C = (2n + 3) log 2 (2n + 3) + (2n) log 2 (2n) Având în vedere faptul că evaluarea unei funcţii are prioritatea cea mai mare, ponderea asociată evaluării unei funcţii este p5 , cu p5 = 5 . Dacă se menţin priorităţile operatorilor, tabelul 3.8. Priorităţi ale operatorilor Tabel 3.8 = +,*,/
p1 = 1 p2 = 2 p3 = 3
() α f (.)
p4 = 4 p5 = 5
pentru evaluarea complexităţii modelului, y = a+b+c mai întâi, modelul se scrie sub forma y = SQRT (a + b + c ) după care se construiesc liniile tabelului 3.9 în vederea calculului complexităţii ponderate a acestuia.
55
Date pentru complexitatea ponderată Componenta y a b c n1 = + f (.) n2
Frecvenţa 1 1 1 1
Ponderea 1 1 1 1
1 2 1
1 2 5
Tabelul 3.9 Frecvenţa X Ponderea 1 1 1 1 4 1 4 5 10
C = 4 log 2 4 + 10 log 2 10 = 41.21 Pentru modelul: y = sin( ax + bz + c ) + cos( ax + bz + c ) se înregistrază datele în tabelul 3.10. Date pentru complexitatea ponderată Componenta a b c x y z n1 = + * f (.) n2
Frecvenţa 2 2 2 2 1 2
Ponderea 1 1 1 1 1 1
1 5 4 2
1 2 3 5
Tabelul 3.10 Frecvenţa X Ponderea 2 2 2 2 1 2 11 1 10 12 10 33
Complexitatea în sens Halstead este: C = 11log 2 11 + 33 log 2 33 56
Pentru modelele din tabelul 3.11, ultimele două coloane conţin complexitatea Halstead şi complexitatea cu luarea în considerare a ponderilor. Complexităţile unor modele neliniare Tabel 3.11 Nr. crt. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
Denumire model funcţia parabolică 1 funcţia parabolică 1 funcţia parabolică 3 funcţia parabolică 4 parabola lui Neile funcţia putere funcţia exponenţială 1 funcţia exponenţială 2 funcţia exponenţială 3 funcţia exponenţială 4 funcţia logaritmică 1 funcţia logaritmică 2 funcţia semilogaritmică funcţia loginversă
Complexitate Halstead 35.16
Complexitate ponderată 78.25
y = a + bx
19.60
44.82
y = 3 a + bx
19.60
44.82
y = a + bx 3
27.11
64.91
y = 3 ax α + bx + c
43.65
104.71
y = ax b
12.75
32
y = e ax +b
19.60
54.62
y = ae bx
19.60
49.66
y = ab x
12.75
32
y = e ax ⋅ x b
27.11
74.11
ln y = a + b ln x
19.60
72
y = a ln x
9.50
33.28
y = a + b ln x
16
46.05
16
46.05
Forma analitică
y = ax α + bx + c
ln y = a +
b x
57
Nr. crt. 15.
Denumire model funcţia log-loginversă
16.
funcţia inversă
17.
funcţia Prais
18.
funcţia de ordinul 3
19.
funcţia hiperbolică 1
20.
funcţia hiperbolică 2
21.
funcţia Tornqvist 1
22.
funcţia Tornqvist 2
23.
funcţia Tornqvist 3
24.
funcţia Johnson
25.
funcţia logparabolică
26.
funcţia logistică
27.
funcţia logistică pătratică
28.
funcţia CobbDouglas 1 funcţia CobbDouglas 2 funcţia CES 1
29. 30.
Forma analitică
b + c ln x x b y =a+ x
ln y = a +
y=e
a−
b x
x (ax + bx + c) 1 y= (a + bx) b y =a+ (c + x ) kx y= ( x + a) k ( x + a) y= ( x + b) bx( x − c) y= ( x + a)
y=
Complexitate Halstead 35.16
Complexitate ponderată 100.23
12.75
23.50
19.60
44.82
43.65
99.05
19.60
40.13
19.60
35.60
19.60
40.13
31.01
74.11
39.30
94.71
27.11
58.52
2
y=e
k−
a (b+ x )
y = a (ln x) α + b ln x + c 43.65
135.74
48
116.23
57.05
144.62
y = Ax1α x 2β e γx3
52.52
144.62
y = Ax1α x 2β
27.11
74.11
117.30
300.43
y=
k (1 + be − ax )
y=
k2 (1 + be − ax ) 2
(
y = A dx1− ρ + (1 − d ) x 2− ρ
58
Nr. crt. 31.
Denumire model funcţia CES 2
32.
funcţia CES 3
33.
funcţia CES 3
34.
Funcţia Allen
35.
Funcţia Sato
Complexitate Halstead 86.15
Complexitate ponderată 244.18
(
112.10
302.18
(
81.32
219.33
76.23
174.10
71.27
191.63
Forma analitică
(
y = A dx1− ρ + (1 − d ) x 2− ρ
y = A dx1− ρ + (1 − d ) x 2− ρ y = A dx1− ρ + (1 − d ) x 2− ρ
y = 2hx1 x 2 − ax12 − bx 22
y=
x12 x 22 (ax13 + bx 23 )
Se observă diferenţe semnificative între complexităţile Halstead şi complexităţile cu priorităţi. 3.4 Complexitatea modelelor cu ecuaţii simultane Complexităţii modelelor cu ecuaţii simultane i se asociază o serie de indicatori, cu luarea în considerare a unui set de ipoteze de lucru. Se consideră modelul liniar cu ecuaţii simultane: n
y j = a 0 j + ∑ aij xi , j = 1,2,..., m i =1
.
Se construieşte o matrice Bm ,n +1 , în care ⎧1, aij ≠ 0 bij = ⎨ ⎩0, altfel k Se notează j numărul elementelor nenule ale ecuaţiei j din model, n
k j = ∑ bij , j = 1,2,..., m i =1
j Complexitatea ecuaţiei j , notată C1 este dată de relaţia: n1j = k j + d j + 1
59
1
n2j = (k j − 1) + (d j − 1) + 1 C1j = n1j log 2 n1j + n2j log 2 n2j
. Dacă modelul economic este privit ca un conglomerat de ecuaţii, T complexitatea totală C1 este dată de relaţia m
C1T = ∑ C1j
. Pentru o ecuaţie se identifică: • o singură apariţie a operatorului de atribuire =; • k j -1 apariţii ale operatorului de adunare; j =1
• d j -1 apariţii ale operatorului de înmulţire; • k j coeficienţi ai modelului; • d j variabile exogene utilizate în ecuaţia j ; • o singură variabilă endogenă; unde: n
d j = ∑ cij i =1
,
c ij = 1
, dacă în ecuaţia i figurează variabila j sau 0, în
caz contrar. Se consideră următorul model cu ecuaţii simultane: y1 = a 0 + a1 x1 y 2 = b0 + b1 x1 + b2 x 2 Matricea B corespunzătoare modelului este: 1 1
1 1
0 1
Se calculează: k1 = 2 , d1 = 1 k2 = 3 , d 2 = 2 rezultând: n11 = 4 , n12 = 2 n12 = 6 , n 22 = 4 . Complexităţile celor două ecuaţii vor fi: C11 = 2 log 2 2 + 4 log 2 4 = 10 C12 = 6 log 2 6 + 4 log 2 4 = 23.50 60
În acelaşi mod se construiesc tabele cu operatori, variabile, frecvenţe, ponderi pentru modelele cu argument întârziat, după care se calculează complexitatea folosind relaţia generalizată a complexităţii în sens Halstead. 3.5 Inegalităţile de complexitate În cazul în care modelul economic cu ecuaţii simultane este privit ca un întreg datorită independenţelor generate de variabilele comune, se obţine ecuaţia complexităţii: m
m
m
m
j =1
j =1
j =1
j =1
C T 2 = (∑ n1j ) log 2 (∑ n1j ) + (∑ n2j ) log 2 (∑ n2j ) . Complexitatea, văzută ca diversitate, C 3 , este dată de relaţia m
m
j =1
j =1
C3T = [∑ (n1j + n2j )] log 2 [∑ (n1j + n2j )] . Rezultă că între cele trei modele de complexitate există relaţia: C1T < C 2T < C 3T . Se consideră modelul: y1 = a11 x1 + a12 x 2 + + a14 x 4 + a10 y 2 = a 21 x1 + + a 23 x3 + + a 25 x5 m = 2; n = 4
Ec.1 Ec.2
Coef x1 1 1
Coef x 2 1 0
Matricea D Coef x3 Coef x 4 0 1
1 0
Coef x5 0 1
Termen liber 1 0
n11 = 8 , n12 = 7 n12 = 7 , n 22 = 6 C1T = (8 log 2 8 + 7 log 2 7) + (7 log 2 7 + 6 log 2 6) = 78.81 C 2T = (8 + 7) log 2 15 + (7 + 6) log 2 13 = 106.7 C 3T = 28 log 2 (15 + 13) = 134.6 C1T < C 2T < C 3T
61
3.6 Ortogonalitatea modelelor Se consideră o bază de modele în care sunt deja stocate modelele M 1 , M 2 ,..., M n . Se pune problema adăugării unui nou model, M n +1 . Acest lucru se efectuează dacă şi numai dacă modelul M n +1 este diferit de modelele deja existente. Modelele cu structură identică sunt modelele care au acelaşi număr de variabile, acelaşi număr de ecuaţii, acelaşi număr de operatori, iar prin dezvoltarea scrierii poloneze inverse, poziţiile operanzilor şi operatorilor sunt aceleaşi. Modelele: M1 : y = a ⋅ x + b ⋅ z + c M 2 : w = d ⋅u + h ⋅v + g , sunt cu structură identică. Şi modelele: M 3 : y = ax + be t
M 4 : u = ce w + dw , sunt identice din punct de vedere structural, adunarea fiind comutativă. Pentru a vedea dacă două modele sunt identice, se procedează, mai întâi, la calculul complexităţii neponderate. C ( M 1 ) = 6 log 2 6 + 5 log 2 5 = 27.11 C ( M 2 ) = 6 log 2 6 + 5 log 2 5 = 27.11 C ( M 3 ) = 6 log 2 6 + 5 log 2 5 = 27.11 C ( M 4 ) = 6 log 2 6 + 5 log 2 5 = 27.11 La o primă analiză, rezultă că modelele au complexităţi neponderate identice. Pentru modelele M 1 şi M 2 , complexităţile ponderate sunt date de relaţia: C ( M 1 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56 C ( M 2 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56 ceea ce arată că modelele M 1 şi M 2 au un grad de asemănare foarte ridicat, mai mult, din punct de vedere structural sunt identice: C ( M 3 ) = 6 ⋅ log 2 6 + 13 ⋅ log 2 13 = 63.61
C ( M 4 ) = 6 ⋅ log 2 6 + 13 ⋅ log 2 13 = 63.61 62
Modelele M 3 şi M 4 sunt identice din punct de vedere structural şi diferite de M 1 şi M 2 . Modelele incluse sunt acelea care în scrierea poloneză inversă apar sub formă de subşiruri ale unor şiruri. Pentru modelele, M 5 : y = ax + bz + c M 6 : y = a ⋅ x + b ⋅ z + d ⋅u + c se observă că M 6 se deduce din M 5 la care se adaugă termenul d ⋅ u . Înseamnă că modelul M 5 este inclus în modelul M 6 . Complexităţile sunt: C ( M 5 ) = 6 ⋅ log 2 6 + 5 ⋅ log 2 5 = 27.11 C ( M 6 ) = 8 ⋅ log 2 8 + 6 ⋅ log 2 6 = 39.5 . Raportul de asemănare, A , este dat de relaţia: K A = , unde: N • N este numărul maxim de componente; • M este numărul de componente identice. Pentru modelele M 5 şi M 6 , N = max{11,14} = 14 , unde valorile din paranteze reprezintă numărul de variabile şi de operatori. Elementele comune se reunesc într-o mulţime: { y, =, a,⋅( produs ), x,+ ( adunare ), b,⋅( produs ), z ,+, c} al cărei cardinal este 11. 11 A= = 0,78 . 14 Complexităţile ponderate sunt: C ( M 5 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56 C ( M 6 ) = 8 ⋅ log 2 8 + 19 ⋅ log 2 19 = 104.71 . Dacă modelul liniar M k este inclus în modelul M j , unde: n
M k : y = a 0 + ∑ ai xi k =1 n
M j : y = a 0 + ∑ ai xi + k =1
n+ r
∑a x
i = n +1
i
i
,
complexităţile calculate sunt: C ( M k ) = (n + 2) ⋅ log 2 (n + 2) + (2n) ⋅ log 2 (2n) 63
C ( M j ) = ( n + r + 2) ⋅ log 2 (n + r + 2) + 2( n + r ) ⋅ log 2 2( n + r )
Modelele ortogonale sunt acelea în care operanzii şi operatorii sunt diferiţi, fără a lua în considerare operatorul de atribuire: M 7 : y = a ⋅ bt M 8 : y = cx + dz + h Operatorii modelului M 7 sunt constituiţi în şirul: * şi (), iar operatorii modelului M 8 alcătuiesc şirul: *,+,*,+. Este evident că şirurile sunt total diferite. Operanzii din modelul M 7 se constituie în şirul: y, a, b, t, pe când cei din modeleul M 8 se regăsesc în: z, c, x, d, z, h. Şirurile sunt, de asemenea, diferite. Gradul de ortogonalitate se obţine din relaţia: O ( M k , M j ) = 1 − A( M k , M j ) . Dacă indicatorul
O ( M k , M j ) = 1 , rezultă că modelele sunt
ortogonale. În cazul în care în baza de modele ce conţine modelele M 1 , M 2 ,..., M n şi se doreşte adăugarea modelului M n +1 , dacă O( M i , M n +1 ) = 1, ∀i = 1,2,.., n , modelul M n +1 este într-adevăr un model nou şi prin includerea lui în baza de modele, aceasta sporeşte din punct de vedere calitativ. Modelele de aceeaşi clasă sunt acelea care nu diferă din punct de vedere structural. Modelele: M 8 : y = ax + bz + cw + d M 9 : y = ax + d sunt modele liniare, provin din aceeaşi clasă pentru că includ în alcătuirea lor: • coeficienţi; • variabile; • operatori de adunare; • operatori de înmulţire; • termeni de acelaşi grad egal cu 1.
64
Se calculează complexitatea: C = n1 log 2 n1 + n 2 log 2 n 2 + n3 log 2 n 3 , unde: • n1 este numărul de termeni diferiţi; • n 2 este numărul de operanzi diferiţi; • n3 numărul de grade diferite. C ( M 8 ) = 2 log 2 2 + 3 log 2 3 + 2 log 2 2 = 8.75 C ( M 9 ) = 2 log 2 2 + 3 log 2 3 + 2 log 2 2 = 8.75 Modelele: M 10 : y = ax12 + bx 22 + cx 32 + d + ex1 + fx 2 + gx 3
M 11 : y = ax + bx 22 + cx 32 + dx 42 + ex 52 + gx 62 + hx 72 + i + jx1 + kx 2 + lx 3 , 2 1
sunt definite prin: • coeficienţii modelului M 10 : a, b, c, d , e, f , g . • coeficienţii modelului M 11 : a, b, c, d , e, g , h, i, j , k , l . • variabilele modelului M 10 : y, x1 , x 2 , x3 . • variabilele modelului M 11 : y, x1 , x 2 , x3 , x 4 , x5 , x6 , x7 . • operatorii diferiţi ai modelului M 10 : =,+, () 2 ,* . • operatorii diferiţi ai modelului M 11 model are: =,+,*, () 2 . • gradele termenilor modelelor M 10 şi M 11 : 0,1,2 . Se calculează complexităţile modelelor de mai sus: C ( M 10 ) = 3 log 2 3 + 4 log 2 4 + 3 log 2 3 = 17.5
C ( M 11 ) = 3 log 2 3 + 4 log 2 4 + 3 log 2 3 = 17.5 . Rezultă că M 10 şi M 11 aparţin aceleiaşi clase. Modelele asemenea sunt acelea care conţin structuri dominante comune. Modelele:
M 12 :
y = ax1 + bx 2 x 3 + ce x4 + dx 5 ⋅ log( x 6 ) + g
şi M 13 : y = ax12 + b
x2 + ce x4 + dx 5 ⋅ log( x 6 ) + g x3 65
au în structura lor termenii comuni reuniţi în subexpresia ce x4 + dx 5 ⋅ log( x 6 ) + g . Complexităţile neponderate ale celor două modele sunt: C ( M 12 ) = 12 log 2 12 + 12 log 2 12 = 86.03 C ( M 13 ) = 13 log 2 13 + 13 log 2 13 = 96.21 Complexitatea subexpresiei comune este: C (comun) = 6 log 2 6 + 7 log 2 7 = 35.16 . Ponderea complexităţi subexpresiei comune în totalul complexităţii lui M 12 este: 6 log 2 6 + 7 log 2 7 ρ12 = = 0.4 12 log 2 12 + 12 log 2 12 şi ponderea complexităţi subexpresiei comune în totalul complexităţii lui M 13 este:
ρ13 =
6 log 2 6 + 7 log 2 7 = 0.36 . 13 log 2 13 + 13 log 2 13
Dacă ρ ∈ [0,0.82] , se concluzionează că modelele au în comun elemente nesemnificative. Dacă ρ ∈ [0.82,0.92] , se concluzionează că modelele au în comun elemente semnificative. Dacă ρ ∈ [0.92,1) ,modelele au un grad foarte ridicat de asemănare. Pentru ρ i = 1 , un anumit model, M i este inclus în alt model, M j , cu
ρ j > 0 . Dacă ρ i = ρ j = 1 , modelele sunt identice. În general, ponderea complexităţii subexpresiei comune a două modele M i şi M j se calculează astfel: C (M i ∩ M j ) C (M i ∩ M j ) ρi = , ρj = C (M i ) C (M j ) În concluzie, bazele de modele includ: • modele ortogonale; • modele generative pentru o clasă, de exemplu: n
n
i =1
i =1
y = a 0 + ∑ a i x i , y = a 0 + ∑ a i x12 ,
66
modele cu subexpresii comune cu pondere limitată; • modele cu un nivel de includere sub o limită impusă. Limitele sunt impuse atunci când se configurează baza de modele, pentru a se gestiona riguros varietăţile de modele. Unele dintre rezultate au fost publicate în [POPAM04].
67
4. GESTIUNEA MODELELOR 4.1 Intrările în model Gestiunea unui model se referă la acele activităţi care trebuie realizate în vederea atingerii obiectivului pentru care modelul a fost conceput. În cazul în care aceste activităţi trec pe un plan secundar, datele de intrare îşi pierd calitatea, fundamentele modelului sunt distruse, iar rezultatele obţinute nu au o legătură solidă cu fenomenul modelat. Gestiunea unui model înseamnă construirea şi utilizarea unui sistem de reguli pentru traversarea tuturor etapelor specifice unei tehnologii de construire şi utilizare de modele. Sunt definite detalii privind manipularea datelor, alegerea de proceduri de estimare, conservarea coeficienţilor şi obţinerea de rezultate folosind modelele. Datele de intrare se constituie sub forma unor serii SD1, SD2, ..., SDm având N1, N2, ..., Nm termeni. Când se analizează seriile de date este necesar să se pună în corespondenţă fie cu elementele unor colectivităţi, fie cu momente de timp. Se construiesc perechi în care apar câte un element de identificare şi câte un termen din seria de date sau câte un moment de timp şi, respectiv, un termen al seriei de date. O astfel de pereche se descrie prin: (Ei, Xij) sau (Ti, Xij) unde: Ei – elementul i din colectivitate; Ti – momentul de timp i; Xij – nivelul măsurat în seria SDj pentru elementul Ei. Se identifică diferite situaţii în funcţie de lungimile seriilor de date. Toate seriile au acelaşi număr de termeni N1=N2=…=Nm, nu lipseşte nici un termen din serie, iar dacă elementul de identificare este moment de timp, atunci Ti+1=Ti+k, unde k este o raţie, seria fiind definită pe intervale echidistante; în cazul în care elementele de identificare se referă la o colectivitate, aceasta are un grad de omogenitate foarte ridicat; termenii 68
seriilor de date aparţin unui interval suficient de restrâns încât să fie acceptată ipoteza că datele nu sunt afectate de erori medii sau de erori grosolane în procesul de culegere; datele se organizează într-o structură dată în tabelul 4.1. Serii de date cu momente de timp echidistante Tabel 4.1 Timp 1994 1995 1996 1997 1998 1999
Profit net (mil.$) 1.2 1.1 1.2 1.3 1.4 1.6
Asupra acestui tabel utilizatorii nu trebuie sa efectueze operaţii de transformare; Seriile de date au aceeaşi lungime însă intervalele de timp nu sunt echidistante; în acest caz se impune efectuarea unor transformări care să le transforme în serii echidistante; o modalitate foarte simplă de atingere a obiectivului este interpolarea după o dreaptă; se alege intervalul minim şi se stabileşte numărul de termeni care fac obiectul interpolării; se consideră, de exemplu, datele din tabelul 4.2. Serii de date cu intervale neegale Timp 1 3 6 7 8 12 13
SD1 105 118 225 240 253 420 441
SD2 6 16 21 20 18 40 39
SD3 2000 2001 2200 2300 2350 2600 2800
Tabel 4.2 SD4 30 40 50 60 70 80 90 69
Se observă că intervalele neegale din tabel afectează calitatea rezultatelor pe care modelul le generează; intervalul minim este de lungime 1; se construieşte tabelul 4.3. Serii de date cu intervale egale şi termini lipsă Timp 1 2 3 4 5 6 7 8 9 10 11 12 13
Tabel 4.3 SD4 30
SD1 105
SD2 6
SD3 2000
118
16
2001
40
225 240 253
21 20 18
2200 2300 2350
50 60 70
420 441
40 39
2600 2800
80 90
Completarea se realizează prin interpolare după o dreaptă; se consideră: xkj – termenul care defineşte limita inferioară a intervalului xsj – termenul care defineşte limita superioară a intervalului S-k – lungimea intervalului Relaţia: x sj − x kj xij = ⋅ (i − k ) + x kj s−k aplicată datelor din tabelul 4.3 conduce la obţinerea seriilor complete cu intervale egale, din tabelul 4.4.
70
Serii de date cu intervale egale şi termeni interpolaţi după o dreaptă Timp 1 2 3 4 5 6 7 8 9 10 11 12 13
SD2 6 11 16 17.66 19.33 21 20 18 23.5 29 34.5 40 39
SD1 105 111.5 118 153.66 189.32 225 240 253 294.75 336.5 378.25 420 441
SD3 2000 2000.5 2001 2067.33 2133.66 2200 2300 2350 2412.5 2475 2537 2600 2800
Tabel 4.4 SD4 30 35 40 43.33 46.66 50 60 70 72.5 75 77.5 80 90
Datele de intrare sunt analizate şi din punctul de vedere al legăturilor dintre ele, căutându-se ca între serii să nu existe corelaţii evidente sau unele serii să fie agregări de date. De exemplu, se consideră seriile de date din tabelul 4.5. Serii de date interdependente Timp 1 2 3 4 5 6 7 8
SD1 105 121 118 190 160 225 240 253
SD2 525 605 590 950 800 1125 1200 1265
SD3 605 701 683 1115 935 1325 1415 1493
SD4 1785 489,7619 557,2222 179,4444 226,6667 153 145,7143 140,5556
Tabel 4.5 SD5 -43468 -57836 -54986 -143258 -101438 -201148 -228958 -254516 71
Timp 9 10 11 12 13
SD1 271 250 380 420 441
SD2 1355 1250 1900 2100 2205
SD3 1601 1475 2255 2495 2621
SD4 134,7076 141,6667 115,3571 111,5625 109,9267
SD5 -292136 -248498 -575318 -703078 -775276
În faza de analiză a datelor, se identifică forme analitice care generează serii de date pornind de la termenii unor serii de date primare. De exemplu, seria SD2 rezultă din înmulţirea termenilor seriei SD1 cu constanta 5. Termenii seriei SD3 se obţin din adunarea termenilor seriilor SD2 şi SD3 din care se scade constanta 25. Termenii seriei SD4 se obţin din relaţia: xi 4 =
xi1 ⋅ 85 xi1 − 100
Dacă relaţiile între serii sunt complexe, se calculează coeficienţii de corelaţie. Astfel, r(SD1,SD2)=1 r(SD1,SD3)=1 r(SD1,SD4)=-0.56482 r(SD1,SD5)=-0.98301 r(SD2,SD3)=1 r(SD2,SD4)=-0.56482 r(SD2,SD5)=-0.98301 r(SD3,SD4)=-0.56482 r(SD3,SD5)=-0.98305 r(SD4,SD5)=-0.45889
72
Aceste rezultate impun în mod clar eliminarea seriilor SD2 şi SD3, tabelul 4.6 conţinând seriile de bază : Setul de date de bază Tabel 4.6. SD4 SD5 Timp SD1 1 105 1785 -43468 2 121 489,7619 -57836 3 118 557,2222 -54986 4 190 179,4444 -143258 5 160 226,6667 -101438 6 225 153 -201148 7 240 145,7143 -228958 8 253 140,5556 -254516 9 271 134,7076 -292136 10 250 141,6667 -248498 11 380 115,3571 -575318 12 420 111,5625 -703078 13 441 109,9267 -775276 În cazul în care momentele de timp sunt echidistante, pentru studierea dependenţei dintre seriile SD1şi SD4 sunt necesare metode ale analizei numerice. De exemplu, pentru seria SD5 se calculează diferenţe la dreapta de ordin 1 şi 2: ∆ i = f ( xi +1 ) − f ( xi ) ∆2 i = f ( xi + 2 ) − 2 ⋅ f ( xi +1 ) + f ( xi ) .
Analiza economică utilizează date agregate provenind din componentele sistemului ierarhizat pe agenţi economici, departamente, ramuri şi sectoare. Formulele de calcul ale indicatorilor agregaţi sunt cunoscute. Fiecare coloană a matricei în care se organizează datele are semnificaţia unei variabile. Fiecare linie din matrice fie caracterizează un element al unei colectivităţi, fie descrie evoluţia unui proces economic pentru un moment de timp. Dacă se procedează la interschimburi de linii şi coloane din matrice semnificaţia rezultatelor rămâne nemodificată. Este 73
necesar ca interschimbului dintre coloane să-i corespundă acelaşi interschimb între componentele listei cu numele variabilelor modelului. De exemplu, se consideră un tablou având 30 de linii ce corespund intervalului 1970-1999 şi 4 coloane ce corespund variabilelor: PIB – produsul intern brut; NRM – număr muncitori; INV – volum investiţii; CAP – capitalul social. Interschimbul dintre coloanele 2 şi 3 ale matricei de date impune ca lista variabilelor să fie: PIB, INV, NRM, CAP. Gestiunea datelor de intrare se bazează pe operaţii care nu perturbă semnificaţia modelului şi calitatea rezultatelor. Operaţii precum: - interschimbul numai a două elemente dintr-o serie; - interschimbul numai a unor grupuri de elemente dintre coloane; - interschimbul de coloane fără interschimb de denumiri de variabile; - inversarea cifrelor din elementele masivului, valoarea 72 se înregistrează 27, de exemplu; - eliminarea unei linii din matrice; - înlocuirea unei valori cu un număr oarecare; - concatenarea a două numere, valorile 25 şi 44 devin 2544 şi 44; - decalarea de pe linie sau de pe coloană a unei valori; - neincluderea unor chei de control şi a unor proceduri de verificare; conduc la obţinerea unor noi date de intrare diferite de datele reale, ce reflectă alt fenomen economic. Pe baza noilor date de intrare se construiesc modele pentru noul fenomen economic inexistent, se obţin rezultate şi se fundamentează decizii. Transferul output-urilor corespunzătoare unui fenomen inexistent către un fenomen real conduce la rezultate cu mult mai slabe decât cea mai slabă decizie bazată pe experienţa empirică. 4.2 Coeficienţi Baza de modele conţine referiri prin nume la modelele M1, M2, ..., Mk. La generarea de modele, fiecare model generat are asociat un nume Mi. Pentru estimarea coeficienţilor se construieşte setul de date prin asocierea 74
variabilelor V1,V2,...,Vm constituindu-se o listă de nume de variabile, respectiv, o reuniune de serii de date constituite într-o matrice. De exemplu, modelului de estimare a produsului intern brut i se asociază numele PROD_BRUT, modelului de prognoză a productivităţii din industrie i se asociază numele W_IND, modelului de analiză a progresului tehnic i se asociază numele PROG_THE, urmărindu-se construirea de mnemonice uşor de reţinut de către utilizator şi uşor de manevrat. De exemplu, variabilelor: productivitate, capital social, număr de locuitori, suprafaţă arabilă, li se asociază, respectiv, denumirile W, C, L, SA. Procesele de estimare în modele conduc la obţinerea: - listei de coeficienţi; - valori a unor indicatori privind calitatea procesului de estimare; - indicatori agregaţi privind performanţa modelului. Toate aceste informaţii sunt structurate după nivelul de omogenitate şi sunt referite cu ajutorul unor proceduri. Pentru referirea coeficienţilor estimaţi se utilizează procedura Coef(nume_model[,lista_de_variabile]) Parantezele drepte indică opţionalitatea introducerii listei de variabile. Dacă se doreşte extragerea tuturor coeficienţilor modelului PROD_BRUT procedura este folosită astfel: Coef(PROD_BRUT). Se stabileşte că rezultatul estimării, coeficienţii modelului, este memorat sub forma unui masiv unidimensional C[n], primul element corespunzând termenului liber. În cazul operării cu mai multe modele se construieşte o structură mai complexă, listă de vectori ce se traversează pentru a identifica modelul şi pentru a extrage valorile coeficienţilor, figura 4.1.
75
nume model 1
nume model 2
nume model n
C[0]
C[0]
C[0]
C[1]
C[1]
C[1]
C[k1]
C[k2]
C[kn]
Figura 4.1 Listă înlănţuită de modele Referirea coeficientului unei variabile se realizează prin: Coef(nume_model,nume_variabila). De exemplu, referirea: Coef(PROD_BRUT,W) afişează coeficientul variabilei productivitatea muncii W din modelul de prognoză a produsului intern brut. În cazul în care software-ul asociat bazei de modele are un nivel de complexitate ridicat se definesc facilităţi ce se preiau de către un compilator c++ compatibil şi utilizatorul construieşte secvenţe proprii pentru a manipula rezultatele returnate de funcţiile specifice bazei de modele. De exemplu, se construieşte secvenţa: float D1,D2,D3; D1=coef(PROD_BRUT,W); D2=coef(PROD_BRUT,L); D3=D1*D2-D1+7/D2. 76
Operează într-o manieră flexibilă cu coeficienţii estimaţi ai modelului PROD_BRUT. Înzestrarea sistemului de gestiune cu astfel de resurse care să-l facă sistem deschis corespunde unei strategii de perspectivă, priorităţile primelor versiuni actuale fiind generarea de modele, operaţii pe seturi de date şi gestiunea de probleme. Accesul la coeficienţii modelelor permite preluarea unor coeficienţi şi definirea de variante de structuri de modele în noi ipoteze. Indicatorul de performanţă suma pătratelor de diferenţe are asociată procedura: SD2(lista_de_nume_de_modele) şi extrage valorile sumelor pătratelor de diferenţe ale modelelor indicate. De exemplu, pentru a cunoaşte nivelul sumei pătratelor de diferenţe pentru modelul PROD_BRUT utilizatorul foloseşte procedura: SD2(PROD_BRUT). Dacă utilizatorul doreşte afişarea sumelor pătratelor de diferenţe pentru modelele W_IND, PROG_TEH. Se referă procedura prin: SD2(W_IND, PROG_TEH). Dacă trebuie ordonate modelele după nivelul de performanţă, la proiectarea sistemului de gestiune se defineşte o procedură SORT() care are ca listă de parametri: - vectorul de coeficienţi după care se efectuează sortarea; - vectorul numelor modelelor; - tipul de sortare, crescătoare/descrescătoare; O altă variantă revine la a utiliza structura de date din figura 4.2 la care se adaugă şi câmpul unde se memorează valoarea coeficientului de performanţă, iar sortarea se va face în cadrul listei astfel încât elementele să fie ordonate crescător, primul model fiind cel cu suma pătratelor de diferenţe minimă.
77
nume model 1
S1
nume model 2
S2
nume model n
Sn
C[0]
C[0]
C[0]
C[1]
C[1]
C[1]
C[k1]
C[k2]
C[kn]
Figura 4.2 Listă de modele cu indicator de performanţă În cazul în care designerii sistemului de gestiune a bazei de modele optează pentru compuneri de proceduri, construcţia: SORT(SD2(lista_de_modele)) produce efecte similare. Având în vedere stadiul cercetărilor în zona dezvoltaării şi implementării bazelor de modele economice, elementele de design fac obiectul unor dezbateri, urmărindu-se ca finalitate obţinerea unui produs închegat.
4.3 Restricţii Există modele economice în care sunt definite restricţii privind: - niveluri ale coeficienţilor unor variabile; sunt variabile ai căror coeficienţi aparţin mulţimii {0, 1}; - încadrarea unor indicatori agregaţi într-un interval dat; de exemplu: m
bi ≤ ∑ aij ⋅ x j ≤ ci ; j =1
78
- impunerea unei relaţii între coeficienţii modelului; de exemplu, pentru modelul: m
y = ∑ a i xi i =0
este impusă relaţia: m
∑a i =0
i
= A;
- ecuaţiile simultane ale unor modele econometrice. Restricţiile sunt preluate de către sistemul de gestiune a bazei de modele şi în funcţie de tipul fiecărei restricţii se selectează procedura de estimare a coeficienţilor.
4.4 Rezultate Rezultatele proceselor de modelare sunt serii de date, valori agregate, intervale şi calificative ce vizează acceptarea sau respingerea unei ipoteze. De la un model se obţin mai multe rezultate, fiecare rezultat corespunzând unor ipoteze de lucru. Se consideră setul de date prezentat în tabelul 4.7. Dinamica producţiei în funcţie de timp şi de numărul de muncitori Timp T 1 2 3 4 5
Număr de muncitori (mil. pers) NRM 3,5 3,7 3,6 3,7 3,8
Tabel 4.7 Producţia (mld. lei) PROD 300 320 340 330 380 79
Timp T 6 7 8 9 10 11 12 13 14 15
Număr de muncitori (mil. pers) NRM 3,8 4 4,1 4,1 4,3 4,2 4,4 4,3 4,5 4,5
Producţia (mld. lei) PROD 370 410 390 390 390 430 440 440 460 480
Modelul liniar: PROD = 378.77 − 22.94 ⋅ NRM + 13.14 ⋅ T Conduce la obţinerea unor rezultate sub forma seriilor de date în ipoteze care privesc evoluţiile variabilei NRM pentru momentele de timp 16, 17, 18, 19 şi 20. Ritmul de creştere mediu RNRM obţinut prin relaţia: max( NRM ) − min( NRM ) =0.0714 R NRM = max(T ) − min(T ) conduce la obţinerea nivelurilor estimate pentru variabila NRM din tabelul 4.8 Evoluţia numărului de muncitori cu o raţie constantă Tabel 4.8 Număr de muncitori Timp Producţia T (mil. pers) (mld. lei) NRM PROD 1 2 3 4 5 6 7 8
3,5 3,7 3,6 3,7 3,8 3,8 4 4,1
300 320 340 330 380 370 410 390
80
Timp T
Număr de muncitori (mil. pers) NRM
Producţia (mld. lei) PROD
9 10 11 12 13 14 15 16 17 18 19 20
4,1 4,3 4,2 4,4 4,3 4,5 4,5 4,5+0.0714 4,5+2*0.0714 4,5+3*0.0714 4,5+4*0.0714 4,5+5*0.0714
390 390 430 440 440 460 480
Folosind estimările se obţin niveluri, de asemenea, estimate pentru variabila PROD. Baza de modele trebuie să gestioneze atât ipoteza privind variabila NRM, cât şi nivelurile estimate ale acesteia pentru momentele 16, 17, 18, 19, 20. În acelaşi timp se gestionează şi nivelurile variabilei PROD obţinute în ipoteza stabilită. Arhivarea rezultatelor estimate este necesară analizei calitative a modelelor. După trecerea anilor se înregistrează nivelurile efective pentru variabilele NRM şi PROD corespunzătoare momentelor 16, 17, 18, 19, 20 şi se analizează abaterile nivelurilor estimate faţă de nivelurile reale, conchizând în final că ipoteza ritmului mediu de creştere a numărului de muncitori a fost corectă dacă nivelul abaterilor este acceptabil sau a fost falsă în caz contrar. În procesele de modelare se lucrează cu numeroase variante de modele şi rezultatele obţinute trebuie comparate. Gestiunea rezultatelor presupune identificarea şi asigurarea comparabilităţii acestora. Sunt situaţii în care se doreşte ca modelul să conducă strict la un anumit rezultat şi pentru atingerea acestui obiectiv, analiştii ajustează sistematic sistemul de ipoteze de lucru. Gestiunea rezultatelor trebuie să ia în considerare caracterul sistemului de ipoteze ajustat pentru a fundamenta diferenţele foarte mari dintre nivelurile estimate şi nivelurile efective ale unor variabile. 81
De exemplu, dacă obiectivul strategic este ca la momentul T=20 să se dubleze nivelul variabilei PROD de la momentul T=15, trebuie luată în considerare ipoteza creşterii accelerate a numărului de muncitori. Se procedează la rezolvarea ecuaţiei: PROD20 − a 0 − b0 ⋅ T20 NRM 20 = c0 rezultată din modelul de regresie liniară: PROD = a 0 + b0 ⋅ T + c0 ⋅ NRM În realitate, la momentul T=20, nivelul efectiv al variabilei PROD20 este 735 mld. lei iar nivelul variabilei NRM20 este 4.9 mil. pers. Caracterul nerealist al obiectivului dublării producţiei este bazat pe ipoteza creşterii numărului de muncitori de la 4,5 mil. pers. la .... mil. pers, când în realitate ritmul anual optimist de creştere nu depăşeşte 0.2 mil. pers. Gestiunea rezultatelor are rolul de a responsabiliza derularea proceselor de modelare orientate spre prognoze, penalizând echipele de analişti ale căror construcţii înregistrează erori din cauza ipotezelor false, a obiectivelor nerealiste, a calităţii sau insuficienţei datelor de intrare, a structurilor de modele selectate şi a procedurilor activate. Modelele economice, datele de intrare şi rezultatele formează un întreg, supus unei analize calitative prin efectele pe care le generează, asemenea actului medical. 4.5 Modele de mari dimensiuni În economie dar şi în tehnică sunt construite modele de mari dimensiuni, care includ sute de variabile, sute de restricţii, foarte mulţi coeficienţi şi termeni liberi. A gestiona aceste modele înseamnă: • a defini corect dimensiunile; • a iniţializa cu date corecte şi complete matrice, vectori de mari dimensiuni; • a verifica modul în care sunt puse în corespondenţă componentele modelului cu reprezentările asociate structurilor de date omogene care implementează algoritmi; 82
• a stoca pe lungă durată, în fişiere, constante, nume de variabile, tipuri de restricţii; • a manipula corect matrice, vectori cu date parţial sau integral; • a referi, în concordanţă cu cerinţele algoritmilor, elemente sau subşiruri de elemente; • a conserva datele de intrare care definesc corect şi complet modelul; • a verifica dacă modelul real este identic cu modelul rezultat din iniţializările structurilor de date; • a identifica erorile de introducere a datelor, erorile de transpunere a inegalităţilor şi erorile de dimensionare. Pentru modelele de mari dimensiuni, un rol deosebit de important îl au procedurile pentru: • validarea datelor, pe trepte de exigenţă definite de particularităţile aplicaţiilor, concretizate prin intervale de apartenenţă sau prin mulţimi de valori; • iniţializarea pe blocuri a masivelor şi concatenarea blocurilor în vederea obţinerii seturilor complete; • introducerea simultană şi independentă a datelor cu compararea seturilor obţinute şi cu identificarea neconcordanţelor în vedera stabilirii de cauze; • localizarea de elemente, blocuri în vederea modificării de valori, inserării de valori, ştergerii de valori; • gestiunea de variante de date de intrare; • vizualizarea datelor iniţiale, a indicatorilor de control şi a structurilor considerate complete şi corecte. Se impune construirea de proceduri care să gestioneze rezultatele finale, care sunt, de asemenea, de dimensiuni mari. Procedurile pentru gestionarea rezultatelor intermediare depind strict de algoritm, fiind preferaţi algoritmii care operează cu blocuri din masivele de mari dimensiuni, asigurând derularea unor prelucrări în memorie. Se reduce volumul de schimburi memorie internă – memorie externă. Este important ca prin gestionarea modelului de dimensiuni mari, acesta să reflecte exact realitatea, iar soluţia lui să fie operaţională. 83
5. GENERATOARE DE MODELE 5.1 Generator de modele liniare Generatorul de modele este un produs software care pe baza unor date de intrare privind natura, structura şi complexitatea modelelor, construieşte variante de modele aparţinând unei clase. Colecţiile de modele economice evidenţiază existenţa unor familii de modele. Se consideră un model M care are în structură un set de variabile exogene. Trecerea la modelul M ' se realizează prin includerea în setul de variabile a unui subset de variabile noi. Trecerea de la modelul M , prin eliminarea unei variabile, conduce la obţinerea unui model cu o structură mai simplă, ' M . Atunci când modelului I se adaugă variabile, procesul este de dezvoltare, iar operatorul este notat D (.) . D(M ) = M ' .
Când se trece de la un model M la un alt model ' M , prin eliminarea unei variabile, procesul este de simplificare, iar operatorul este S (.) . S ( M ) =' M .
Se observă că în cazul în care variabila adăugată este X i +1 la modelul M , care conţine deja variabilele X 1 , X 2 ,..., X i D ( M ) X i +1 = M ' S ( M ) X i +1 = ' M
iar, S ( D ( M ) X i +1 ) X i +1 = M
În cazul în care prin simplificare informaţia obţinută din model este în continuare relevantă, procesul se numeşte rafinarea modelului. 84
Generatoarele de modele liniare reprezintă mecanisme deosebit de importante pentru obţinerea de modele economice reprezentative. Se consideră variabilele independente X 1 , X 2 ,..., X n şi variabila dependentă Y . Practica economică a condus, în general, la elaborarea de modele liniare pentru că: • fenomenele studiate urmăresc o dependenţă liniară; • metodele de estimare a parametrilor sunt uzuale pentru aceste tipuri de modele; • interpretarea rezultatelor este uşurată dacă sunt luate în calcul ipotezele de liniaritate. Se construiesc modele cu o variabilă, de forma: y ( k ) = a1( k ) xi + a 0( k ) , i = 1,2,..., n iar k este un număr de ordine al modelului. Se construiesc modele cu două variabile:
y ( k ) = ai( k ) xi + a (jk ) x j + a0( k ) i, j = 1,2,..., n i ≠ j , , . În acelaşi fel se construiesc modele cu trei, patru variabile, iar cel mai complet dintre modele include cele n variabile independente, având forma: n
y ( k ) = a 0( k ) + ∑ a i( k ) xi
, unde în total, pentru cele n variabile independente, structurile de modele i =1
n liniare sunt în număr de 2 − 1 . Se asociază fiecărei structuri de model un
vector B cu n componente, bi = 1 dacă variabila X i aparţine modelului, bi = 0 în rest. Folosind metoda celor mai mici pătrate se procedează la estimarea n coeficienţilor celor 2 − 1 modele M 1 , M 2 ,..., M 2 n −1 .
M1 :
y (1) = a 0(1) + a1(1) x1
M2 :
y ( 2 ) = a 0( 2 ) + a 2( 2 ) x 2
85
… y ( n ) = a 0( n ) + a n( n ) x n
Mn :
M n +1 : y ( n +1) = a 0( n +1) + a1( n +1) x1 + a 2( n +1) x 2 M n + 2 : y ( n + 2 ) = a 0( n + 2 ) + a1( n + 2 ) x1 + a 3( n + 2 ) x3 … M 2 n −1 :
y (2
n
−1)
= a 0( 2
n
−1)
n
+ ∑ ai( 2
n
i =1
−1)
xi
(k ) (k ) (k ) unde a 0 , a1 ,..., a n sunt coeficienţii care trebuie estimaţi pentru modelul k.
n Pentru cele 2 − 1 structuri de modele, folosind datele aranjate conform tabelului 2 se calculează sumele: R
S k = ∑ ( y i − f k ( x1 , x 2 ,..., x n )) 2 i =1
unde f k (.) reprezintă expresia analitică a modelului M k cu coeficienţii estimaţi, R este
număul de observaţii efectuate, yi valoarea variabilei
dependente Y la momentul Ti , iar k este numărul de ordine al modelului. Pentru estimarea coeficienţilor modelelor liniare M 1 , M 2 ,..., M 2 n −1 s-a elaborat un produs software care rulează sub sisteme de operare Windows. Produsul efectuează următoarele prelucrări: • preluarea de date privind variabila dependentă la momentele T1 , T2 ,..., TR , adică y1 , y 2 ,..., y R ; • preluarea
de
niveluri
pentru
variabilele
independente
X 1 , X 2 ,..., X n . Utilizatorul poate adăuga, respectiv poate şterge variabile independente. Generarea termenului liber este implicită; • datele pot fi preluate din fisiere create anterior de către program, ceea ce permite reluarea definirii de modele;
86
• generarea tuturor configuraţiilor de structuri de modele şi calculul coeficienţilor corespunzători fiecărui model; • calcularea, pentru fiecare structură de model k , a sumei S k a ) ) pătratelor diferenţelor y i − y i , unde yi este valoarea la momentul Ti a variabilei dependente, estimată cu ajutorul parametrilor calculaţi anterior; • ordonarea descrescătoare a modelelor după S;
Sk >α S k max , unde • neglijarea acelor modele pentru care raportul α ∈ (0,1] şi este o valoare aleasă de către utilizator, iar S max = max(S k ), k = 1,2 n − 1 . Calitatea modelelor este pusă în evidenţă prin intermediul datelor de test. Se consideră că variabila dependentă Y depinde de X , U , W după o lege de forma:
factorii
y i = 10 + 2 xi − 3u i + 5wi , cu i = 1, R , R fiind numărul de observaţii. (5.1) Sunt culese un număr de R = 20 de observaţii cu privire la nivelurile variabilelor independente X , U , W şi a încă unei variabile, Z care nu influenţează nivelul lui Y , folosindu-ne de generatorul de date de test. Datele experimentale se regăsesc în tabelul numărul 6.1. Nivelul variabilei dependente Y la momentul i consemnat în tabel este cel obţinut prin înlocuirea nivelurilor variabilelor X , U , W la momentul i în formula de mai sus.
87
Date experimentale Tabel 5.1 Momentul de timp 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Y
X
U
Z
W
223 172 277 35 150 531 509 306 239 154 131 80 196 101 242 420 223 107 270 329
41 28 40 58 83 31 88 4 57 47 25 15 20 30 59 56 59 23 6 66
53 73 26 32 67 12 9 24 90 45 23 100 23 98 37 24 90 38 49 61
28 21 42 52 20 3 85 58 90 90 84 1 42 80 25 90 71 89 19 78
58 65 53 1 35 99 70 72 77 37 28 68 43 65 45 74 73 33 79 74
Se doreşte verificarea faptului că modelul cel mai bun este acela în care doar variabilele X , U , W influenţează pe Y . Pentru datele de test de mai sus, folosite ca date de intrare pentru generatorul de modele, şi pentru α = 0.01 s-au obţinut următoarele rezultate: • primul rezultat întors de generator este o formă analitică pentru variabila rezultativă Y , identică cu cea propusă pentru testare, y i = 10 + 2 xi − 3u i + 5wi ,
ceea ce confirmă capacitatea generatorului de a alege modelul cel mai potrivit; se observă că 88
sunt luaţi în calcul toţi factorii ce influenţează nivelul lui Y şi sunt neglijaţi factorii neimportanţi indiferent de numărul lor; suma S a pătratelor diferenţelor dintre nivelurile efective ale lui Y şi nivelurile estimate cu ajutorul coeficienţilor calculaţi este teoretic −25 nulă, practic având ordinul de mărime 10 datorită erorilor de rotunjire introduse de reprezentarea internă a numerelor în sistemul de calcul. • al doilea rezultat întors de generator este aproape identic cu primul, fiind introdusă în forma analitică şi variabila Z cu coeficientul
2.94 ⋅ 10 −15 ; acest coeficient insignifiant corelat şi cu ordinul de mărime al valorilor corespunzătoare acestei variabile nu fac decât să sublinieze influenţa practic nulă a lui Z asupra lui Y ; ordinul de
mărime al sumei S este, de asemenea, neglijabil. • pentru valoarea α = 0.01 generatorul nu mai oferă şi alte structuri de modele, în schimb rezultatele obţinute sunt şi cele mai relevante. Un alt test la care este supus generatorul de structuri de modele este şi prin introducerea de abateri de diferite magnitudini, într-un sens sau altul, la nivelurile calculate ale variabilei Y prin formula (5.1) pentru a verifica dacă acesta este capabil să identifice corect factorii de influenţă. Practic, păstrându-se în tabelul 5.1 valorile variabilelor corespunzătoare variabilelor independente, s-au operat modificări asupra coloanei Y aceasta devenind: ^
Y = (240,172,260,34,155,520,505,310,236,150,130,85,200,100,240,425, ,220,102,265,329)T. 20
Măsura acestor modificări este
S test = ∑ ( y i − ~ yi ) 2 i =1
, S test = 904 .
Aceasta corespunde unei abateri medii pătratice de 6.72 unităţi faţă de valoarea iniţială. În acest caz, rezultatele au fost următoarele: • primul rezultat întors de generator a fost y i = 10.1867 + 2.0013 xi − 2.9402u i − 0.0226 z i + 4.9513wi
S = 822.22 ; forma analitică se apropie foarte mult de (5.1); 89
prezenţa variabilei Z în model se datorează unei corelaţii întâmplătoare între aceasta şi variabila studiată Y care însă e atât de semnificativă încât este inclusă chiar în soluţia optimă; influenţele principalilor factori sunt redate corect, fapt observat prin coeficienţi, influenţa din partea lui Z fiind mai mică luând în calcul ordinul de mărime al valorilor ei şi pe cel al coeficientului. • nu foarte departe de soluţia optimă se află o formă analitică în care sunt prezente variabilele considerate de la început a fi factori de influenţă, X , U , W , având: y i = 9.0558 + 1.9934 xi − 2.9391u i + 4.9548wi , S = 831.16 ; generatorul identifică factorii de influenţă corect, modelul construit cu ajutorul acestora fiind sensibil apropiat de soluţia cea mai bună. Părţi principale ale textului sursă pentru generatorul de modele liniare sunt date în anexa 7.
5.2 Generator de modele liniare cu argument întârziat Generatoarele de modele liniare cu argumente întârziat permit elaborarea de construcţii care permit modelarea efectelor de antrenare multiplă care se regăsesc pe termen scurt în influenţe din toate seturile. Se consideră o mulţime formată de momentele de timp echidistante
t = t k −1 + ∆, k = 2, n . Restricţia , unde t1 < t 2 < ... < t n şi k privind echidistanţa nu afectează generalitatea abordării de faţă. Se consideră un element oarecare t din mulţimea momentelor de T = {t1 , t 2 ,..., t n }
timp şi variabilele exogene X 1 , X 2 ,..., X m pentru care au fost efectuate măsurători în momentele t1 < t 2 < ... < t n . De asemenea, pentru variabila endogenă Y, s-au efectuat măsurători în aceleaşi momente de timp, rezultând datele din tabelul 5.2.
90
Set de date pentru mulţimea T Tabel.5.2 Moment de timp t1
Y
X1 X 2 … X j … X m
y1
t2
y2
x11 x12 … x1 j … x1m x 21 x 22 … x 2 j … x 2 m
M ti
M yi
M tn
M yn
M xi1 xi 2 … x ij … x im M x n1 x n 2 .. x nj … x nm
unde, yi - nivelul măsurat al variabilei dependente Y la momentul t i ; x ij - nivelul măsurat al variabilei independente X j la momentul t i . Evoluţia fenomenelor arată că factorii influenţează diferenţiat variabila rezultativă. Mai mult, variaţiile la un moment t k ale unui factor se propagă cu întârziere asupra evoluţiei variabilei rezultative. În continuare se consideră modele de forma: m
yi = a0 + ∑ a j xk , j j =1
{ } , k ∈ t1 , t 2 ,..., t n
De exemplu, productivitatea muncii, W , la un moment dat, t , este influenţată de nivelul investiţiilor în învăţământul superior de la momentul t − h , unde h este durata studiilor unei promoţii, la care se adaugă timpul necesar integrării absolvenţilor. Modelul liniar este: Wt = a 0 + a1 I t − h Dar modelele cu argument întârziat mai pot fi şi de forma: y t = a 0 + a1 xt −1 + a 2 xt − 2 Atunci când structura modelului nu este cunoscută, se impune efectuarea unei analize calitative şi a unei analize cantitative 91
corespunzătoare. În acest scop, trebuie definiţi algoritmi pentru generarea de modele cu argument întârziat, care să conducă la structuri operaţionale de modele. Pentru generarea modelelor liniare cu un singur argument întârziat, se consideră variabila independentă X şi variabila dependentă Y pentru care s-au efectuat măsurători corespunzătoare momentelor de timp t1 , t 2 ,..., t n , conform tabelului 5.3.
Date pentru modelul liniar cu un singur argument întârziat Tabel 5.3 Moment de timp Y X t1 y1 x1 t2 y2 x2 M M M ti yi xi M tn
M yn
M xn
Folosind metoda celor mai mici pătrate, se estimează coeficienţii ˆ (1) modelului y i = a 0 + a1 xi şi se calculează: n
S1 = ∑ ( y i − yˆ i(1) ) 2 i =1
.
ˆ unde yi este valoarea variabilei dependente estimată la momentul t i , iar (1) este numărul de ordine al modelului. La următorul pas al algoritmului, se transformă tabelul iniţial de date într-un tabel modificat, prin glisarea cu o poziţie a termenilor corespunzători variabilei independente, obţinându-se tabelul 5.4.
92
Argumentul este întârziat cu o perioadă Tabel 5.4 Moment de timp t1 t2 t3 M ti M tn
Y y1 y2 y3
X -
x1 x2 M xi M x n −1
M yi M yn
Ignorând prima linie şi folosind metoda celor mai mici pătrate, (2) (2) ˆ ( 2) rezultă modelul y i = a 0 + a1 xi −1 şi suma diferenţelor de pătrate n
S 2 = ∑ ( y i − yˆ i( 2 ) ) 2
. Pentru o întârziere a argumentului de două perioade rezultă modelul
i =1
yˆ i( 3) = a 0(3) + a1(3) xi − 2
, datele fiind reprezentate în tabelel numărul 5.5.
Argumentul este întârziat cu două perioade Tabel 5.5 Moment de timp t1 t2 t3
Y y1 y2 y3
t4 M ti M tn
y4 M yi M yn
Procedeul
se
repetă,
obţinându-se
X -
x1 x2 M xi M xn−2 modele
de
forma
yˆ i( s ) = a 0( s ) + a1( s ) xi − k şi sumele S s unde s indică ordinul modelului, iar k ,
93
întârzierea luată în considerare. Se ordonează crescător aceste modele în funcţie de sumele calculate şi se aleg primele l modele cu argument întârziat pe care le considerăm bune. Pentru generarea modelelor liniare ca sume de argumente întârziate, se consideră variabila independentă X şi variabila dependentă Y pentru care s-au efectuat măsurători corespunzătoare momentelor de timp t1 , t 2 ,..., t n , conform tabelului 2. Se face ipoteza că variabila dependentă Y t la un moment dat i este influenţată de nivelul variabilei dependente X la diferite momente anterioare, construindu-se modele de forma yˆ i = a 0 + a1 xi + a 2 xi −1 + a 3 xi − 2 + ... + a k xi − k +1 .
Generatorul produce combinaţii de argumente întârziate construind modelele corespunzătoare. De exemplu, pentru modelul cu două argumente, unul fără întârziere, iar celălalt întârziat cu o perioadă, modelul este yˆ i = a 0 + a1 xi + a 2 xi −1 , având asociat tabelul numărul 5.6. ˆ Date pentru modelul y i = a 0 + a1 xi + a 2 xi −1 Tabel 5.6 Moment de timp t1 t2 t3 M ti M tn
Y
y1 y2 y3 M yi M yn
X fără întârziere x1 x2 x3
M xi M xn
X întârziat o perioadă -
x1 x2 M xi −1 M x n −1
Asemănător algoritmului anterior se vor calcula coeficienţii modelului prin metoda celor mai mici pătrate, se vor calcula sumele diferenţelor de pătrate şi se vor ordona crescător, după care se vor alege un număr arbitrar dintre primele care vor fi considerate bune. 94
Pentru estimarea coeficienţilor modelelor liniare cu argument întârziat s-a elaborat un produs software. Produsul efectuează următoarele operaţii: • preluarea de date privind variabila dependentă la momentele t1 , t 2 ,..., t n , adică y1 , y 2 ,..., y n ; • preluarea de niveluri pentru variabila independentă X ;generarea termenului liber este implicită; • datele pot fi preluate din fişiere create anterior de către program, ceea ce permite reluarea definirii de modele; • atât pentru modelele cu un singur argument întârziat, cât şi pentru cele cu sume de argumente întârziate provenind de la aceeaşi variabilă se generează configuraţii de modele cu argumente întârziate cu maxim jumătate din numărul total de perioade deoarece aşa cum s-a observat, întârzierile produc o reducere a numărului de linii al matricei de observaţie care intră în calcul, ceea ce poate face ca rezultatele să nu mai fie concludente pentru întreaga serie de date; • calculul coeficienţilor asociaţi modelelor generate; ) ) • calculul sumelor S k a pătratelor diferenţelor y i − y i , unde yi este valoarea la momentul t i a variabilei dependente, estimată cu ajutorul parametrilor calculaţi anterior; • ordonarea modelelor descrescător după S ; • alegerea unui număr de modele specificat de utilizator. Produsul software este supus testelor pentru a urmări capacitatea acestuia de a alege modele potrivite. Se consideră că variabila dependentă Y depinde de variabila independentă X după o lege de forma y i = 2 + 3 xi − 2 . Se culeg un număr de 20 de observaţii care se regăsesc în tabelul numărul 5.7.
95
Date experimentale pentru modelul cu un singur argument întârziat Tabel 5.7 Moment de timp 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Y 90 76 125 86 65 122 80 128 119 62 107 95 38 74 143 137 113 77 71 86 47
X 41 28 21 40 26 42 39 20 35 31 12 24 47 45 37 25 23 28 15 14 24
În urma rulării datelor de test, rezultatul obţinut este chiar cel corect, modelul ales fiind y i = 2 + 3 xi − 2 , suma corespunzătoare acestui model fiind 0. Se modifică observaţiile asupra variabilei dependente Y , introducând influenţe aleatoare într-un sens sau altul rezultând o abatere medie pătratică de 1.55 unităţi faţă de valoarea iniţială. Rulând cu noul set 96
de date, s-a obţinut rezultatul y i = 3.35 + 2.9695 xi − 2 . Se remarcă faptul că, în continuare, algoritmul identifică influenţa principală a argumentului cu întârzierea de două perioade. Părţi principale ale textului sursă pentru generatorul de modele liniare cu argumet întârziat sunt date în anexa 8.
5.3 Generator de modele liniare cu ecuaţii simultane Generator de modele cu ecuaţii simultane. Se consideră variabilele endogene y1 , y 2 ,..., y M şi variabilele exogene x1 , x 2 ,..., x N , pentru care au fost efectuate înregistrări de date, obţinându-se m + n serii cu k termeni. Variabilele considerate sunt supuse unei analize pentru a se vedea dacă între ele nu există dependenţe liniare sau directe. După efectuarea verificării acestei ipoteze din listele de variabile exogene şi endogene, se exclud unii termeni, rămânând m variabile endogene y1 , y 2 ,..., y m şi n variabile exogene x1 , x 2 ,..., x N . Variabilele eliminate erau în dependenţă liniară sau directă cu variabilele rămase. Pentru construirea modelului econometric cu variabile simultane, se utilizează procedura pentru generarea modelelor liniare al cărui prototip este: Tip PROGEN (tip X,tip Y, int m,int n ,int k,int y poz,foot a[]{N}int X poz []) Variabilele y poz stabilesc variabila endogenă luată în considerare pentru generarea de modele. Variabila compusă a[p][] va conţine coeficienţii estimaţi y poz. Variabila Xpoz[] va conţine indicii variabilelor exogene incluse în modelul pentru care raportul:
{ {
min S12 , S 22 ,...S h2 rs = max S12 , S 22 ,...S h2
} }
n este minim, pentru h = 2 .Rând pe rând, procedura PROGEN() este apelată
pentru toate variabilele endogene. Masivul bidimensional a[ ][N ] al coeficienţilor modelelor trebuie supus analizei. 97
Se stabilesc următoarele cazuri: • liniile i şi j ale matricei a sunt identice, caz în care înseamnă că variabilele yI şi yj au condus la obţinerea aceloraşi dependenţe; în consecinţă, una dintre ecuaţii se elimină • liniile i şi j au componentele nule pe poziţii diferite,ceea ce conduce la includerea ecuaţiilor corespunzătoare în model dacă nu sunt în contradicţie cu alte linii • liniile i şi j au unele elemente nenule diferite pentru variabile exogene comune, nedepăşind 50% din numărul maxim al variabilelor incluse în cele două ecuaţii; cele două ecuaţii incluzăndu-se în model De exemplu, pentru un set de 5 variabile endogene si 7 variabile exogene,după apelarea procedurii PROGEN() se obţine matricea a[][]din tabelul 5.8. Matricea coeficienţilor unui model
Y1 Y2 Y3 Y4 Y5
X1 0 13.1 0 0 17.4
X2 2.3 0 0 1.3 0
X3 0 12.7 0 5.4 0
X4 0 0 8.17 -6.3 0
X5 -1.7 0 0 11.2 0
X6 -7.5 0 0 0 18.7
Tabel 5.8 X7 X8 0 19.1 -5.2 20.6 0 -3.8 1.8 5.5 0 9.3
Pentru α = 50% Din analiza perechilor (i,j) rezultă: • (1,2) nu sunt elemente comune de structură; • (1,3)nu sunt elemente comune de structură; • (1,4) sunt două elemente comune de structură; numărul maxim de coeficienţi nenuli din ecuaţia 4 este 5,iar raportul 2/5<50% ceea ce conduce la acceptarea ipotezei prin care cele două ecuaţii sunt diferite; • (1,5)numai un element diferă. 98
Pe ansamblu, ecuaţia: y1 = 2.3 x 2 − 1.7 x5 − 7.5 x 6 + 19.1 este inclusă în modelul econometric. Se procedează la analiza celei de a doua ecuaţii: • (2,3)nu conţin elemente commune; •
•
2 < 50%
(2,4) conţin două elemente comune ,iar raportul 5 ,ceea ce conduce la acceptarea ipotezei prin care cele două ecuaţii sunt diferite; (2,5) numai un element este comun.
Rezultă că ecuaţia : y 2 = 13.1x1 + 12.7 x3 − 5.2 x7 + 20.6 se include în modelul econometric. Din analiza perechilor: • (3,4)o singură componentă este comună (X4); • (3,5)nici o componentă nu este comună; y = x − rezultă ca ecuaţia: 3 8.17 4 3.8 se include în modelul econometric. Din analiza perechii (4,5) inexistând elemente comune în lista de variabile ,ecuaţiile: y 4 = 1.3x 2 + 5.4 x3 − 6.3x 4 + 11.2 x5 + 1.8 x7 + 5.5 ; y 5 = 17.4 x1 + 18.7 x6 + 9.3 ; se include în modelul econometric. Toate aceste rezultate pregătesc procesul de elaborare a modelelor econometrice cu ecuaţii simultane. Structurile generate sunt memorate şi definindu-se criterii de extragere referitoare la niveluri ale raportului rs ,se obţin părţi din listele de structuri. Procesul de analiză econometrică beneficiază în acest fel de un instrument eficient de generare a variantelor pentru diferite niveluri ale coeficientului de acceptare α .
99
5.4 Generator de modele cu funcţii punct Funcţiile punct se definesc sub forma unor tabele având pe linii şi pe coloane definite intervale asociate unor variabile. De exemplu, pentru variabila exogenă XX se consideră intervalele II1, II2,..., IIKI, iar pentru variabila exogenă WW, se consideră intervalele JJ1, JJ2,..., JJKJ. La intersecţia liniei i şi coloanei j a tabloului se găseşte un coeficient sau o expresie analitică folosită în calcul, pentru obţinerea nivelului variabilei endogene YY. În cazul în care pentru variabila endogenă sunt necesare şi alte combinaţii de variabile exogene, se vor construi, de asemenea, tablouri cu număr de linii şi coloane câte corespund combinaţiilor respectivelor variabile exogene. De exemplu, se consideră variabilele exogene XX, WW, ZZ şi VV pentru care se definesc tablourile date în tabelele 5.9, respectiv, 5.10 care evidenţiază legăturile cu variabilele endogene YY1 şi YY2. Dependenţele YY1=f(XX,WW) WW
Tabel 5.9 >=205
<-10
[-10;+10]
(+10;205)
123
XX 2 + WW 3
123
1 WW + 1 2 XX + WW 2
XX + WW 2
XX WW + XX WW 1 1 + WW XX
123
XX <0 [0,100] >100
XX +
123
XX
100
Dependenţele YY2=g(ZZ,VV) VV ZZ <100 [100,306] >306
ZZ +
<0
[0;23]
1
ZZ 2 + VV 3
1 XX + ZZ
ZZ − VV 2
1
ZZ 2 + VV 2
Tabel 5.10 >=23 ZZ ZZ + VV 1 1 1 + ZZ VV
Dacă XX=7 şi WW=7, atunci, corespunzător tabelului 5.9, YY1=f(7,7)= XX + WW 2 =56. Pentru ZZ=7 şi WW=7, atunci, corespunzător tabelului 5.10, YY2=g(7,7)= ZZ 2 + VV 3 =392. Dacă variabilele endogene YY1 şi YY2 sunt la rândul lor argumente ale unei funcţii YY3=h(YY1,YY2) definită în tabelul 5.11, pentru YY1=56 şi YY2=392, se obţine: Dependenţele YY3=h(YY1,YY2) YY2
YY1 <50
<100 10
[50,200] >200
YY1*YY2 YY1 + YY1 *YY2
Tabel 5.11 >=100 YY12 + YY23 YY1+YY2 20+YY1-YY2
valoarea YY3 = h(56,392) = YY1+YY2 = 448. Generatorul de modele de acest tip realizează: • studierea seriilor de date asociate variabilelor exogene; • împărţirea seriilor de date asociate variabilelor exogene în subserii; • alegerea celui mai bun model pentru fiecare pereche de subserii;
101
• construirea tabloului bidimensional cu subseriile şi cu expresiile analitice ale dependenţei variabilei endogene. La nivel macroeconomic, pentru construirea modelului cu ajutorul căruia se studiază PIB, din analiza seriilor de date privind productivitatea muncii şi investiţiile, rezultă evoluţii diferite care impun luarea în considerare a unor clase de modele distincte pentru intervalele de timp [1933;1940], [1941;1953], [1954;1962], [1963;1988], [1989;2001]. Funcţiile punct sunt utilizate frecvent în elaborarea proiectelor de construcţii, tabelele de dependenţă includ rezultate experimentale privind rezistenţe, consumuri, dimensiuni. Calculele de devize conţin proceduri de compunere a funcţiilor punct.
5.5 Generator de modele de tip balanţa legăturilor dintre ramuri Modelele de tip balanţa legăturilor dintre ramuri presupun: • stabilirea numărului de ramuri; • stabilirea numelor ramurilor; • definirea modului de agregare a datelor primare ce definesc fluxurile dintre agenţii economici în vederea obţinerii transferului de la o ramură definită în model către o altă ramură, de asemenea, definită în model; • construirea procedurii de agregare pentru alte variabile considerate endogene, prin indicarea modului de extragere, actualizare şi cumulare dintr-o bază de date. Generatorul de modele are menirea de a construi intrările procedurilor de calcul specifice modelării balanţei legăturilor dintre ramuri, folosind datele dintr-o bază de date ce descrie agenţii economici prin: tip de producţie, profit, număr salariaţi, cifră de afaceri, consumuri de materiale pe categorii, consumuri energetice, livrări către alţi agenţi economici. Se consideră, de exemplu, o bază de date ce conţine informaţii privind agenţii economici AE1, AE2, ..., AEne. Fiecărui agent economic i se asociază un cod privind tipul de producţie pe care le realizează, respectiv COD1, COD2, ..., CODne. Fiecare agent economic are înregistrat profitul 102
PRO1, PRO2, ..., PROne, consumurile CONS1, CONS2, .., CONSne şi livrările LIV1, LIV2, ..., LIVne. Pentru acest exemplu, în ipoteza unei economii cu patru ramuri trebuie specificate patru mulţimi MCOD1, MCOD2, MCOD3 şi MCOD4 în care se includ după anumite criterii de omgenitate a obiectului de activitate codurile COD1, COD2 ..., CODne. Economiei i se asociază o matrice cu patru linii şi patru coloane. Prin traversarea bazei de date se selectează apartenenţa unui agent economic AEi cu ajutorul codului său CODi la una dintre mulţimile MCOD1, MCOD2, MCOD3 sau MCOD4, valorile CONSi şi LIVi adăugându-se liniei şi coloanei corespunzătoare agentului economic care a furnizat intrări pentru agentul AEi, respectiv, agentului căruia i s-au livrat produse realizate de agentul AEi. În acelaşi fel se construişte şi vectorul profitului agregat, având patru componente.
5.6 Generator de modele neliniare standard Generatoarele de modele neliniare vizează utilizarea unor structuri de forme analitice. Se consideră un set de forme analitice dat în tabelul 5.12. Forme analitice ale modelelor neliniare Nr. crt.
Denumire model
Tabel 5.12 Forma analitică
1. funcţia parabolică 1
y = ax α + bx + c
2. funcţia parabolică 1
y = a + bx
3. funcţia parabolică 3
y = 3 a + bx
4. funcţia parabolică 4
y = a + bx 3
5. parabola lui Neile
y = 3 ax α + bx + c
6. funcţia putere
y = ax b
7. funcţia exponenţială 1
y = e ax +b
8. funcţia exponenţială 2
y = ae bx 103
Nr. crt.
Denumire model 9. funcţia exponenţială 3
10. funcţia exponenţială 4 11. 12. 13. 14.
funcţia logaritmică 1 funcţia logaritmică 2 funcţia semilogaritmică funcţia log-inversă
15. funcţia log-log-inversă 16. funcţia inversă 17. funcţia Prais 18. funcţia de ordinul 3 19. funcţia hiperbolică 1 20. funcţia hiperbolică 2 21. funcţia Tornqvist 1 22. funcţia Tornqvist 2 23. funcţia Tornqvist 3 24. funcţia Johnson 25. funcţia log-parabolică 26. funcţia logistică 27. funcţia logistică pătratică
Forma analitică y = ab x y = e ax ⋅ x b ln y = a + b ln x y = a ln x y = a + b ln x b ln y = a + x b ln y = a + + c ln x x b y =a+ x y=e
a−
b x
x (ax + bx + c ) 1 y= (a + bx) b y =a+ (c + x ) kx y= ( x + a) k ( x + a) y= ( x + b) bx ( x − c) y= ( x + a) y=
y=e
2
k−
a (b+ x )
y = a (ln x) α + b ln x + c k y= (1 + be − ax ) y=
k2 (1 + be − ax ) 2 104
Nr. Denumire model crt. 28. funcţia Cobb-Douglas 1 29. funcţia Cobb-Douglas 2 30. funcţia CES 1 31. funcţia CES 2 32. funcţia CES 3 33. funcţia CES 3 34. funcţia Allen 35. funcţia Sato
Forma analitică y = Ax1α x 2β e γx3 y = Ax1α x 2β
( y = A(dx y = A(dx y = A(dx
y = A dx1− ρ + (1 − d ) x 2− ρ −ρ 1
+ (1 − d ) x 2− ρ
−ρ 1
+ (1 − d ) x 2− ρ
−ρ 1
+ (1 − d ) x 2− ρ
) ) ) )
−
− −
−
1
ρ
⋅ e γx3
1
ρ h
ρ
⋅ e γx3
h
ρ
y = 2hx1 x 2 − ax12 − bx 22
y=
x12 x 22 (ax13 + bx 23 )
Pentru un set de variabile endogene format din y1 , y 2 ,..., y M şi un set de variabile exogene format din x1 , x 2 ,..., x N se generează un model neliniar cu o necunoscută, variantele fiind: yi = f ( X j ) , obţinându-se M ⋅ N structuri de modele. Aşa cum rezultă din tabelul 6.12, sunt predefinite R forme analitice cu o singură variabilă exogenă, aceasta implicând faptul că generatorul va conduce la obţinerea unui număr de G structuri de modele dat de relaţia:
G = R⋅M ⋅N . De exemplu, pentru M = 2 , N = 3 y1 = f ( X 1 ) y 2 = f ( X 1 )
y1 = f ( X 2 ) y 2 = f ( X 2 ) y1 = f ( X 3 ) y 2 = f ( X 3 ) . Dacă există formele analitice ⎧ln x, x > 0 f ( x) = ⎨ x ⎩e , x ≤ 0 , 105
atunci structurile de modele generate sunt:
y1 = ln x1 y1 = e x1 y1 = ln x2 y1 = e x2 y1 = ln x3 y1 = e x3
y 2 = ln x1 y 2 = e x1 y 2 = ln x 2 y 2 = e x2 y 2 = ln x3 y 2 = e x3 Este deosebit de important ca pe lângă formele analitice definite în tabelul 5.12, utilizatorul să aibă la dispoziţie facilităţi pentru a defini forme analitice proprii, cărora să le aplice mecanismele de generare de structuri deja existente. De exemplu, pentru modele de forma: n
y = ∏ X iα i
, generarea se efectuează atât în interiorul structurilor pentru valori impuse ale numărului de variabile, cât şi pentru transformări ale variabilelor cu un i =1
set dat de funcţii f1 (.), f 2 (.),..., f m (.) . De exemplu, pentru variabilele X 1 , X 2 , X 3 , pentru n = 2 şi pentru funcţiile f1 = ln x şi f 2 ( x) = x , generatorul de modele conduce la obţinerea următoarelor structuri de modele neliniare:
y = x1 x2
y = x1 x2
y = x1 ⋅ ln x2
y = x1 x3
y = x1 x3
y = x1 ⋅ ln x3
y = x 2 x3
y = x 2 x3
y = x 2 ⋅ ln x3
y = x1 ln x 2
y = x2 x1
y = x1
y = x1 ln x3
y = x3 x1
y = x2
y = x 2 ln x3
y = x3 x 2
y = x3
y = ln x1 ⋅ x2
y = x1 ⋅ x2 y = ln x1 106
y = ln x1 ⋅ x3
y = x1 ⋅ x3 y = ln x2
y = x3 ln x 2
y = x 2 ⋅ x3 y = ln x3
y = ln x1 ln x2 y = ln x1 ⋅ x2
y = x1
y = ln x1 ln x3 y = ln x1 ⋅ x3
y = x2
y = ln x 2 ln x3 y = ln x 2 ⋅ x3
y = x3
Generatoarele de modele au menirea de a furniza liste complete de expresii analitice diferite, care să acopere întreaga diversitate a combinaţiilor. O dată cu dezvoltările spre inteligenţa artificială a unei aplicaţii informatice, generatoarele de modele neliniare vor include şi elemente de autoinstruire extrase din analiza colecţiilor de modele stocate în baze de modele şi se va creea premisa obţinerii de noi clase de modele, ceea ce corespunde realizării unui salt calitativ în structura modelelor economice. Generatorul de modele neliniare oarecare se construieşte pe principiul definirii ca intrare a unei forme analitice de bază, a unei mulţimi de operatori şi a unei mulţimi de variabile exogene. Folosind priorităţile operatorilor se construiesc combinaţiile posibile. Întrucât numărul de combinaţii pentru o listă de NOP operatori, o listă de NVAR variabile şi o listă de NFC funcţii elementare, este foarte mare, iar foarte multe dintre aceste combinaţii nu sunt validate prin criteriile de reprezentativitate ale modelelor, se impune abandonarea algoritmilor de generare mecanică de modele neliniare oarecare şi înlocuirea acestora cu algoritmi genetici.
107
6. GESTIUNEA SETURILOR DE DATE 6.1 Seturi de date Modelele economice vizează laturile calitative şi laturile cantitative ale evoluţiei unor fenomene sau ale definirii de structuri, în vederea obţinerii de informaţii privind efectele apariţiei unor modificări în timp. Orice model economic presupune înregistrarea de date pentru a vedea nivelurile caracteristicilor cu care sunt descrise dinamica unui fenomen şi factorii care o determină. Setul de date asociat unei probleme de dinamică este dat sub forma unui tabel ce include: - o coloană în care se specifică momentele de timp în care au fost efectuate măsurătorile; - câte o coloană de date reprezentând nivelurile măsurate ale fiecărui factor de influenţă; - o coloană de date reprezentând nivelul măsurat pentru variabila rezultativă; Pentru a realiza o prelucrare de calitate trebuie ca seriile incluse în tabel să aibă acelaşi număr de termeni şi măsurarea lor să se realizeze exact la momentul de timp indicat în tabloul construit conform structurii date în tabelul 6.1. Structură set de date specific proceselor dinamice Factor Moment Variabilă de de timp rezultativă y influenţă T X1 T1 y1 X11 T2 y2 X12 T3 y3 X13 … … …
… … … … …
Factor de influenţă Xj Xj1 Xj2 Xj3 …
… … … … …
Tabel 6.1 Factor de influenţă Xm Xm1 Xm2 Xm3 … 108
Moment Variabilă Factor de timp rezultativă de T y influenţă X1 Tk yk X1k … … … Tn yn X1n
… … … …
Factor de influenţă Xj Xjk … Xjn
Factor de influenţă Xm Xmk … Xmn
… … … …
Dacă diferenţele: T2 - T1 = T3 - T2 = … = Tk+1 - Tk = … = Tn - Tn-1 rezultă că înregistrările de date au fost efectuate la intervale egale de timp. Înregistrarea evoluţiei unui proces de obţinere a unui produs de sinteză PRO a permis construirea setului de date dat în tabelul 6.2. Dinamica procesului de sinteză pentru produsul PRO
Moment de timp 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 1
y Volum de producţie tone 15 16 14 15,8 13,9 14,3 16,1 14,6 15,2 16,3 15,9 16 16,4 14,7 15,2 14 14,9 15
X1 Temperatura °C
X2 Presiune atm
Tabel 6.2 X3 Concentraţie %
61° 55,5° 63° 72,5° 67,5° 74° 65° 58,5° 60° 78° 64,5° 66° 72° 54,5° 57° 52,5° 59° 60,5°
6,2 5,8 6,3 7,1 6,8 7,2 6 5,9 6,1 7,5 6,9 6,1 7,3 5,7 5,9 5,5 6,1 6,2
79,4 88,2 90 85,3 82,7 92,1 79,8 84,5 91,3 84,6 86,1 81,2 87 89,4 92,7 93,4 88,8 78,7 109
Moment de timp 2 3 4 5 6 7 8 9
y Volum de producţie tone 15,7 16,2 15,3 14,8 14,5 14,2 15,2 16,3
X1 Temperatura °C
X2 Presiune atm
X3 Concentraţie %
65,5° 68° 73° 65,5° 62,5° 59,5° 61,1° 55°
7,1 6,6 8 7,8 6,5 5,8 6,3 5,9
79 78,9 83 86,7 89,3 90,6 79,8 87,9
Având în vedere faptul că înregistrările datelor în domeniul tehnic se efectuează folosind aparatură specializată şi personalul are un nivel de calificare certificat, se subînţelege că pentru realizarea înregistrărilor sunt repetate proceduri şi deci, seturile de date reflectă corect evoluţia fenomenelor. Orice nepotrivire afectează calitatea rezultatelor pe care le va furniza modelul. Orice eroare sistematică odată depistată, trebuie definit un procedeu de efectuare a corecţiilor, încât ea să nu afecteze calitatea estimatorilor şi deci a rezultatelor obţinute prin modelare. Este preferabil ca pe acest tip de seturi de date să se definească operaţii precum: - adăugarea de noi linii, ceea ce corespunde la efectuarea de măsurători pentru momentele Tn+1, Tn+2,… - adăugarea de vechi măsurători efectuate la momente ce au precedat momentul T1, respectiv T0, T-1, T-2,… - eliminarea de coloane din tabel în cazul în care variabilele nu se dovedesc a fi esenţiale pentru proces prin faptul că fluctuaţiile nivelurilor lor sunt nesemnificative. Problema adăugării de noi variabile de influenţă presupune reorganizarea unui nou proces de culegere de date, pentru alte momente de timp şi înregistrarea de noi niveluri pentru toate variabilele, incluzând deci şi noile variabile adăugate pentru a obţine un nou set de date. 110
Pentru procesul PRO se consideră important numărul de turaţii/min (X3) a paletelor de omogenizare şi puritatea materiei prime de bază, respectiv, variabila adăugată în tabelul 6.3, notată X4. Dinamica procesului de sinteză cu extensia variabilelor Tabel 6.3 Moment de timp 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 1 2 3 4 5 6 7 8 9 10 11
Volum de producţie tone 16,5 15,7 14,3 15,2 16,1 13,9 15,7 13,8 14,1 16,3 14,4 15,3 16,5 15,6 16,2 16,3 14,6 15,1 14,3 14,7 15,1 15,5 16,3 15,2 14,8 14,6 14,2 15,3 16,4 16,6 15,9
Temperatura °C
Presiune atm
Concentraţie %
Rotaţii/min
Puritate %
63,5° 65° 59,5° 61,5° 55° 63,5° 72° 68° 73,5° 65,5° 58° 60,5° 78,5° 64° 66,5° 72,5° 54° 57,5° 53,5° 59,5° 60° 66° 68,5° 72,5° 65,5° 62,5° 59° 61,1° 55,5° 74,5° 62,5°
6,5 6,8 5,8 6,4 5,7 6,1 7 6,7 7,1 6,1 5,5 6 7,6 6,3 6,2 7,2 5,6 5,9 5,7 6,2 6,2 7,3 6,7 8 7,6 6,4 5,7 6,2 5,8 7,9 6,6
77,2 73,1 80,2 79,2 88 90,3 85,2 82,6 92 79,6 84,3 91,2 84,8 86,4 81,3 87,2 89,3 92,9 93,3 88,6 78,6 79,2 79,1 83,1 86,3 89,2 90,5 79,6 87,8 84,2 90,1
1200 1100 1350 1400 1250 1270 1320 1100 1250 1400 1200 1000 1050 1090 1140 1230 1300 1150 1200 1250 1300 1100 1150 1200 1320 1100 1240 1300 1200 1000 1180
96,5 95,6 98,6 97,1 98,3 97,5 96,4 96,9 98,3 97,6 95,8 96,5 98,5 95,9 96,7 96 95,9 99 99,2 97,4 98,3 97,1 96,3 95,2 98,6 97 98,8 98,1 97,3 97,6 98,7
În tabelul 6.3 au fost adăugate două linii la finalul înregistrărilor şi trei linii la început, obţinându-se serii de timp mai lungi cu 5 termeni faţă de seriile definite în tabelul 6.2. De asemenea, în tabelul 6.3 sunt definite coloane pentru variabilele X3 şi X4 adăugate. Când se înregistrează datele pentru a se completa o coloană a tabelului se utilizează o singură procedură. În caz contrar, datele nu sunt omogene, deci, nu sunt comparabile. 111
Al doilea tip de seturi de date vizează o colectivitate A formată din elementele a1, a2,…, an, pentru care se înregistrează niveluri ale caracteristicilor CQ1, CQ2, …, CQm. Datele se înregistrează sub forma unui tablou reprezentat în tabelul 6.4. Set de date pentru descrierea colectivităţii A Tabel 6.4 Element a1 a2 … ai … an
Caracteristica CQ1 X11 X21 … Xi1 … Xn1
Caracteristica CQ2 X12 X22 … Xi2 … Xn2
… … … … … …
Caracteristica CQj X1j X2j … Xij … Xnj
… … … … … …
Caracteristica CQm X1m X2m … Xim … Xnm
Operaţiile pe acest tablou sunt: - adăugarea unor noi elemente an+1, an+2, … - adăugarea de noi caracteristici CQm+1, CQm+2, … cu reluarea măsurătorilor - eliminarea unor elemente din mulţime - eliminarea unor caracteristici, de regulă acele caracteristici ale căror niveluri sunt identice pentru toate elementele colectivităţii. Şi în cazul în care se urmăreşte descrierea elementelor colectivităţii A trebuie definite şi utilizate riguros proceduri pentru măsurare. Pentru persoanele dintr-o colectivitate se înregistrează datele din tabelul 6.5. Înregistrarea datelor privind colectivitatea recruţilor Tabel 6.5 Persoana
Data naşterii
Înălţime cm
Greutate kg
Nr. încălţăminte
P1 P2 P3 P4 P5 P6 P7 P8
15.01.1995 17.06.1994 26.12.1993 11.07.1994 20.01.1995 01.07.1994 12.11.1994 11.09.1994
170 190 180 192 174 185 179 189
85 80 74 83 72 75 70 74
42 44 42 45 41 43 42 44
Circumfe-rinţa gâtului cm 42 39 40 38 41 40 39 38
Circumfe-rinţa toracelui cm 110 103 96 104 100 93 95 92
112
P9 P10 P11 P12 P13 P14 P15 P16 P17 P18 P19 P20
19.04.1994 28.12.1993 23.07.1994 07.08.1994 17.01.1995 05.06.1994 21.03.1994 08.10.1994 19.12.1993 02.05.1994 05.04.1994 10.01.1995
167 195 191 174 190 183 180 176 184 183 168 172
70 91 86 74 83 90 82 70 75 81 68 74
41 46 45 42 44 43 44 42 44 43 40 41
43 41 40 43 40 43 42 40 39 39 41 42
96 103 105 100 101 107 99 95 94 96 91 98
Modelarea economică defineşte probleme legate de corelaţia între variabile, de stabilirea variabilelor rezultative şi de construirea de ecuaţii pentru a stabili modul de variaţie a variabilei rezultative dacă variabilele independente vor avea niveluri stabilite conform unor ipoteze de lucru. În cazul în care colectivităţile sunt alcătuite dintr-un număr foarte mare de componente, pentru care au fost efectuate măsurători în cazul unei sau două caracteristici obţinându-se date cu structura dată în tabelul 6.6, Măsurătorile a două caracteristici Tabel 6.6 Element E1 E2 … En
CQ1 CQ11 CQ21 … CQn1
CQ2 CQ12 CQ22 … CQn2
se procedează la numărarea frecvenţelor apartenenţei la intervale parcurgând următorii paşi: p1 - se calculează nivelurile maxime pentru caracteristicile CQ1 şi CQ2 respectiv max CQ1, max CQ2; p2 - se calculează nivelurile minime pentru cele două caracteristici min CQ1, min CQ2; p3 - se calculează lungimile L1, L2 ale celor K1 respectiv K2 intervale: max CQ1 - min CQ1 L1 = ; K1 113
max CQ2 - min CQ2 L2 = K2
;
p4 - se construiesc cele două mulţimi de intervale; p5 - se construieşte matricea F de frecvenţe, având K1 linii şi K2 coloane, unde elementul fij arată numărul de elemente din tabloul 6 care aparţin intervalului i în raport cu caracteristica CQ1, respectiv aparţin intervalului j în raport cu caracteristica CQ2. De exemplu se consideră o colectivitate A, a bărbaţilor de 25 de ani pentru care s-au înregistrat înălţimea şi greutatea, în tabelul 6.7. Caracteristicile colectivităţii bărbaţilor de 25 de ani Cod persoană A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20
Înălţime C1 180 175 176 191 185 181 175 177 194 170 185 191 178 173 171 193 180 179 183 191
Tabel 6.7 Greutate C2 70 75 60 78 80 79 80 75 90 68 75 80 79 80 75 88 81 74 77 98 114
max CQ1 = 194 min CQ1 = 170
K1 = 3
max CQ2 = 98 min CQ2 = 60
K2 = 2
L1 = (194 - 170) / 3 = 8
L2 = (98 - 60) / 2 = 19
Se construieşte tabloul cu frecvenţe 6.8. Frecvenţele de grupare a persoanelor după două caracteristici Tabel 6.8 [60 ; 79) [79 ; 98] Total [170 ; 178) 5 2 7 [178 ; 186) 4 4 8 [186 ; 194] 1 4 5 Total 10 10 20 Seturile de date se constituie după o atentă cercetare a fenomenului economic pentru a proiecta un plan de structurare şi pentru a defini procedurile de culegere în vederea asigurării acestora a unui nivel de calitate ridicat care să le facă utilizabile.
6.2 Caracteristici de calitate a seturilor de date Seturile de date utilizate în elaborarea de modele şi în studierea proceselor economice trebuie să îndeplinească o serie de caracteristici de calitate, caracteristici ce trebuie măsurate, identificate şi care influenţează întreaga abordare a modelării ca proces şi ca practică şi ca bază a unor dezvoltări coerente. Completitudinea este caracteristica esenţială a setului de date, care este evidenţiată în raport cu un interval de timp definit în prealabil sau în raport cu totalitatea elementelor care compun o colectivitate.
115
Se stabileşte limita inferioară a intervalului, se defineşte un pas şi se precizează momentul final, adică limita superioară a intervalului. De asemenea, se construieşte lista caracteristicilor sau indicatorii pentru care se efectuează înregistrările. Rezultă un tablou cu atâtea linii câte momente are intervalul sau câte componente are colectivitatea studiată. Numărul coloanelor este dat de numărul de caracteristici sau de indicatori pentru care se efectuează măsurătorile. Setul de date nu este complet în cazul în care nu s-au efectuat măsurători pentru un element din interval sau pentru un element al colectivităţii. Datele din tabelul 6.9 reprezintă un set de date complete. Înregistrările de vânzări dintr-o săptămână (mil. lei) Ziua Luni Marţi Miercuri Joi Vineri Sâmbătă Duminică
Produse alimentare 140 151 155 153 147 178 160
Produse electrice 60 73 92 110 60 95 30
Tabel 6.9 Detergenţi 20 31 31 48 25 22 15
Atunci când lipsesc unele componente ale tabloului, setul este considerat că are date incomplete, el fiind un set incomplet de date. Completitudinea datelor este dată, de asemenea de definirea corectă a limitelor intervalului sau de stabilirea criteriului de constituire a colectivităţii pentru care se efectuează măsurătorile. Pentru a asigura o estimare bună este necesară utilizarea de serii de date de lungime rezonabilă. Seriile de date de lungime 3 termeni sunt deja foarte scurte şi estimatorii sunt puţin reprezentativi. Seriile de date cu câte 1000 de termeni sunt prea lungi. Datele sunt considerate complete dacă sunt formate din serii de date de lungime rezonabilă în raport cu obiectivul urmărit. Pentru prognoză, seriile de date trebuie să aibă cel puţin 10 termeni. 116
Completitudinea tabloului apare şi în legătură cu numărul coloanelor. Sunt indicatori importanţi care nu trebuie să lipsească. Dacă pentru o variabilă rezultativă există modele elaborate şi toate includ un anumit factor, este puţin probabil să fie elaborat un nou model şi factorul respectiv să nu fie inclus. Un tablou în care coloana respectivului factor de influenţă lipseşte, este un set de date incomplet. În faza de analiză a problemei, structura setului de date se tratează foarte serios pentru a executa o dimensionare foarte bună a lungimii seriilor de date şi pentru a stabili pentru câte caracteristici sau indicatori se efectuează culegerea. Este preferabil ca unele procese de rafinare sau de agregare să conducă la reducerea numărului de linii sau de coloane ale tabloului care alcătuieşte setul de date. Corectitudinea datelor care alcătuiesc setul de date evidenţiază acea caracteristică de calitate care asigură faptul că setul de date reflectă realitatea obiectivă, fără să existe alte date diferite de cele din setul de date analizat care să efectueze în acelaşi mod această reflectare obiectivă. Se definesc proceduri care să fie utilizate de către cei care culeg date. Caracterul obiectiv al reflectării realităţii este dat de respectarea procedurilor de utilizarea de aparate de măsură verificate, care sunt acceptate de către toţi cei care vor folosi datele. Toate condiţiile fiind îndeplinite, probabilitatea ca două sau mai multe echipe care efectuează simultan şi independent măsurătorile să conducă la seturi de date identice este foarte mare, depăşind 0,95 de exemplu. Corectitudinea datelor este afectată de o serie de factori care generează: - erori sistematice de înregistrare concretizate prin a adăuga sau a scade mereu un anumit nivel tuturor datelor consemnate pe o coloană sau în toate coloanele tabloului; - erori de apartenenţă definite în ipotezele de lucru, prin care sunt precizate graniţele intervalului sau graniţele colectivităţii; 117
- erori de înregistrare în tablou prin schimbarea liniei sau coloanei în care trebuie să fie înscrisă valoarea obţinută ca urmare a măsurătorii; - erori de aproximare care nu se încadrează în regula după care se efectuează rotunjirile; - erori de creare a condiţiilor privind poziţia sau pregătirea subiecţilor de măsurat; în medicină de exemplu, se impun o serie de condiţii privind pregătirea pacienţilor, substanţe de contrast, poziţia pacientului, aparate utilizate, ore de recoltare probe. Corectitudinea este o caracteristică de calitate care se certifică. Comparabilitatea datelor este rezultatul utilizării de proceduri, de mijloace de măsură şi de un sistem de coordonate unitar. Seturile de date includ serii privind aceleaşi caracteristici sau indicatori, fie pentru alte colectivităţi, fie pentru alte intervale de timp, fie pentru alte ţări sau regiuni. Translatarea modelelor economice de la un set de date la altul nu trebuie să fie afectată de carenţele generate de absenţa comparabilităţii datelor generate de: - utilizarea unităţilor de măsură diferite de la un set de date la altul; - formule diferite de calcul a indicatorilor; - unităţi de timp diferite, intervale diferite; - proceduri diferite, cu aspecte incomplete de pregătire şi de efectuare a măsurătorilor; - schimbarea ariei de cuprindere a elementelor în colectivităţi. De exemplu, pentru seturile de date SET1, SET2, SET3 sunt prezentate trei colectivităţi de studenţi pentru care s-au calculat mediile generale.
118
Dispersarea studenţilor după medie - SET1 Marcă student A131 B407 C234 A324 D107 B309 C280 E120 F124 A321 C420 A121 B227 C105 A175
Tabel 6.10 Media generală (MG1) 9,70 9,65 9,50 9,45 9,45 9,26 9,00 9,00 8,80 8,40 8,25 8,00 8,00 7,80 7,16
Lista ordonată descrescător a studenţilor - SET2 Marcă student C401 D345 B254 A101 C221 A378 B321 C124 A233 D409 D326 A265 B299 B281 A323
Tabel 6.11 Media generală (MG2) 9,65 9,65 9,50 9,40 9,20 9,05 8,90 8,75 8,60 8,60 8,45 8,30 8,16 7,75 7,50 119
Cele două colectivităţi prezintă date necomparabile pentru că pentru studenţii din setul de date SET1, media aritmetică generală MG1 este calculată după relaţia: n
MG 1 =
∑p
1
i =1
n
unde: n - numărul de note obţinute la disciplinele obligatorii pi - nota obţinută la disciplina obligatorie i. Pentru colectivitatea SET2 media generală MG2 se obţine după relaţia: n
MG 2 =
∑
pi +
i =1
m
∑r
j
j=1
n+m
unde: m - numărul disciplinelor facultative rj - nota obţinută la disciplina opţională j Lista ordonată descrescător a studenţilor -SET3 Marcă student A201 D408 C113 B312 A207 A287 B137 C136 C150 A271 B129 B199 A211 D187 E165
Tabel 6.12 Media generală (MG3) 9,60 9,55 9,50 9,40 9,30 9,25 9,10 8,90 8,80 8,75 8,70 8,60 8,50 7,85 7,60 120
În cazul colectivităţii SET3 media generală MG3 este o medie a mediilor din anii de studii, unele dintre ele incluzând disciplinele facultative, altele nu, în funcţie de regulile stabilite de la un an universitar la altul. Dacă există o bază de date iniţiale şi dacă se stabileşte o regulă clară, se definesc algoritmi de reluare a calculelor pentru cele trei colectivităţi de studenţi, obţinându-se date comparabile. Omogenitatea datelor care alcătuiesc un set este acea caracteristică de calitate prin care se desemnează faptul că: - datele unei serii se referă la acelaşi proces, fenomen, colectivitate, perioadă sau eveniment; - eroarea de culegere nu depăşeşte un prag de acceptare stabilit, unic, pentru toate seriile care alcătuiesc setul; - procedurile după care au fost efectuate măsurătorile şi înregistrările sunt acceptate; - fiecare termen al unei serii de date are exact semnificaţia pe care o au ceilalţi termeni, încât compararea termenilor, adunarea valorilor se efectuează, oferind o dată agregată căreia i se atribuie un sens economic clar; - există garanţia neafectării de erori sistematice sau de erori grosolane, intenţionate a termenilor unora dintre seriile care alcătuiesc setul; - seriile care intră în componenţa setului de date au asigurată regruparea în n-tuple în vederea caracterizării aceluiaşi moment de timp, aceluiaşi element al unei colectivităţi, aceluiaşi eveniment sau aceleiaşi perioade. Seriile de date din tabelele 6.13, 6.14 nu formează un set pentru că se referă la momente de timp diferite şi la modalităţi diferite de înregistrare.
121
Evoluţia producţiei de porumb Tabel 6.13 Anul
Producţia de porumb (mii tone) 1500 1300 1420 1505 1307 1210
1970 1972 1974 1976 1978 1980
Evoluţia precipitaţiilor din oraşe Tabel 6.14 Anul 1971 1973 1975 1977 1979 1981
Precipitaţii ( l/m² ) 0,5 1,7 0,8 2,3 1,1 1,4
În tabelul 6.15 chiar în interiorul seriei datele nu sunt omogene datorită faptului că unităţile lor de măsură sunt diferite. Vânzările de carne de vită în săptămâna 33 a anului X Tabel 6.15 Ziua UM Cantitate Luni kg 1250 Marţi kg 1300 Miercuri pachete 800 Joi kg 1120 Vineri pachete 920 Sâmbătă pachete 1005 Duminică kg 780
122
Trebuie definite o serie de criterii, dintre care apartenenţa la un domeniu este cel mai important, pentru a asigura comparabilitatea datelor. Celelalte caracteristici ale datelor precum mentenabilitatea, fiabilitatea, operaţionalitatea, scalabilitatea, se extind şi asupra seturilor de date dacă toţi termenii care alcătuiesc seriile au aceste caracteristici, respectiv, dacă toate seriile care alcătuiesc setul de date au, de asemenea, aceste caracteristici de calitate. Problematica modelării calităţii seturilor de date se soluţionează numai prin funcţionarea un timp suficient de îndelungat a bazei de modele, pentru a înregistra evenimentele ce se produc pe seturi de date, pentru a stabili legi de repartiţie şi pentru a stabili cu rigurozitate legăturile cauzăefect în fiecare situaţie a scăderii calităţii modelului economic, în raport cu obiectivul definit.
6.3 Operaţii cu seturi de date Fiecărui set de date i se asociază un nume format din litere şi cifre, primul caracter fiind o literă. S.2, 1S, PIB+VAL nu sunt nume ale seturilor de date pentru că fie au un alt caracter încorporat fie încep cu o cifră. Identificatorul setului de date nu depăşeşte 30 caractere. Şirurile S1, PIB, PIB-ROMANIA, S-2 sunt nume ale unor seturi de date. În interiorul şirului uneori pentru a face mai clară semnificaţia se utilizează linia de unire (caracterul minus). Referirea setului de date este operaţia care apare cel mai frecvent în elaborarea de probleme de către utilizatori sau de către cei care proiectează modele. Seturile de date fie că există deja încorporate bazei de modele, fie că sunt încărcate în baza de modele, pe parcursul elaborării unui model economic sunt referite de multe ori pentru: - estimarea coeficienţilor modelului - analiza calităţii modelului construit - pentru efectuarea prognozei; uneori dacă setul de date conţine serii cu câte n termeni, pentru estimare sunt utilizaţi primii n-3 termeni 123
ai seriilor; se estimează coeficienţii modelului şi pentru prognoză se folosesc termenii n-2, n-1, n ai seriilor, se obţin valorile prognozate ŷn-2, ŷn-1, ŷn care se compară cu valorile yn-2, yn-1, yn din setul de date şi se trag unele concluzii asupra calităţii prognozei. Referirea setului de date se efectuează prin nume. O dată cu specificarea numelui se definesc variabilele care intră în alcătuire, numărul de termeni ai seriilor Definirea setului de date presupune specificarea numelui atribuit, care este unic. De asemenea, se specifică seriile de date care intră în componenţa setului, numărul de termeni. De exemplu, pentru modelarea unei caracteristici de definire a unei colectivităţi formată din persoane se costituie un set de date astfel: nume: persoana-1 număr termeni: 20 variabila rezultativă: greutatea număr variabile exogene: 3 variabila exogenă 1: înălţimea variabila exogenă 2: vârsta variabila exogenă 3: circumferinţa bustului Trebuie specificat modul de introducere a datelor. Datele se organizează sub forma unui tablou cu 20 linii şi 4 coloane. Datele se introduc coloană după coloană sau linie după linie. Crearea setului de date se efectuează dacă şi numai dacă termenii seriilor sunt corecţi în raport cu unele criterii de validare precum: - apartenenţa la un interval; - apartenenţa la o anumită mulţime dată ca enumerare de elemente; - respectarea unor condiţii ce derivă din evaluarea de expresii; - conservarea unor proprietăţi privind corelaţii cu alte elemente din serie sau din alte serii de date, desemnate. Setul de date odată avut se stochează în baze de modele. Este asociat unei probleme specifice. În cazul în care setul de date este înzestrat cu proprietăţi care să-l facă accesibil pentru mai multe modele se produc prelucrări care permit gestionarea redundanţei în baza de modele. 124
Redefinirea setului de date se produce prin adăugarea de noi serii de date sau prin adăugarea de noi componente pentru toate seriile de date existente. De exemplu, datele din tabelul 6.16 care alcătuiesc setul de date DAT-15 se se redefineşte sub numele DAT-105 prin adăugarea coloanei destinate producţiei de ovine şi a măsurătorilor pentru anii 1981-1990. Evoluţia producţiei agricole, setul DAT-15 Tabel 6.16 Anul 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
Producţia grâu mii tone 1750 1840 1620 1585 1700 1750 1630 1620 1800 1830 2040
Producţia porumb mii tone 2100 2050 2000 1800 1850 1600 1380 2150 2150 1790 1980
Efectiv de bovine nr. mii capete 780 900 920 910 850 730 900 850 850 1100 1700
Efectiv de porcine nr. mii capete 1200 1300 1300 1350 1300 1400 1200 1100 2100 1800 2000
Tabelul 6.17 conţine setul de date redefinit prin adăugarea unei noi coloane şi a zece linii. Evoluţia producţiei agricole, setul DAT-105 Tabel 6.17 Anul
Producţia grâu mii tone
Producţia porumb mii tone
1970 1971 1972 1973 1974 1975 1976 1977 1978 1979
1750 1840 1620 1585 1700 1750 1630 1620 1800 1830
2100 2050 2000 1800 1850 1600 1380 2150 2150 1790
Efectiv de bovine nr. mii capete 780 900 920 910 850 730 900 850 850 1100
Efectiv de porcine nr. mii capete 1200 1300 1300 1350 1300 1400 1200 1100 2100 1800
Efectiv de ovine nr. mii capete 2890 2910 2950 3040 3010 3050 3030 3020 3120 3160
125
Anul
Producţia grâu mii tone
Producţia porumb mii tone
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
2040 2070 2110 2130 2180 2220 2210 2240 2280 2290 2100
1980 2010 2060 2090 2130 2170 2160 2200 2260 2270 2070
Efectiv de bovine nr. mii capete 1700 1790 1940 2130 2250 2370 2330 2460 2650 2670 2640
Efectiv de porcine nr. mii capete 2000 2110 2260 2300 2430 2580 2570 2710 2820 2840 2790
Efectiv de ovine nr. mii capete 3200 3400 3490 3540 3670 3730 3720 3800 3940 3980 3920
Redefinirea unui set de date presupune existenţa unui set şi obţinerea unui nou set prin adăugare de elemente. În cazul în care au loc operaţii de îndepărtare de serii de date sau de termeni din serii, se produce redefinire prin eliminare. În tabelul 6.18 se trece de la setul de date DAT-15 la setul DAT-300 care conţine date pentru intervalul 1973-1979 referitoare la producţiile de grâu şi de porumb. Producţia agricolă, setul de date DAT-300 Anul 1973 1974 1975 1976 1977 1978 1979
Producţia grâu mii tone 1585 1700 1750 1630 1620 1800 1830
Tabel 6.18 Producţia porumb mii tone 1800 1850 1600 1380 2150 2150 1790
Celelalte operaţii de actualizare a seturilor de date ca modificare de termeni, interschimb, inserare, ştergere de termeni, nu sunt definite întrucât 126
logica lucrului cu seturi de date elimină construirea de serii cu termeni eronat definiţi, care să impună pentru corecţii astfel de operaţii. Concatenarea seturilor de date conduce fie la creşterea numărului de termeni ai seriilor de date, fie la creşterea numărului de serii de date. În tabelul 6.19 este dat setul de date PIB-1, iar în tabelul 6.20 este dat setul de date PIB-A ale unei economii naţionale ipotetice. Concatenarea celor două seturi de date conduce la un nou set de date PIB-TOT ce conţine atât seriile primului set, cât şi seriile celui de-al doilea set de date, dispuse în continuare. Setul de date PIB-1 Anul 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
Produsul intern brut mld $ 22.4 21.8 22.6 23.1 23.7 24.3 24.5 24.8 25.2 25.6
Tabel 6.19 Populaţia 10000 loc 11343 11295 11302 11311 11324 11376 11381 11384 11393 11385
Setul de date PIB-A Anul 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Produsul intern brut 25.5 26.7 27.4 26.8 27.1 27.5 28.4 28.9 29.2 29.1
Tabel 6.20 Populaţia 11387 11392 11394 11392 11393 11396 11399 11403 11402 11406 127
Setul de date PIB-TOT Anul 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Produsul intern brut 22.4 21.8 22.6 23.1 23.7 24.3 24.5 24.8 25.2 25.6 25.5 26.7 27.4 26.8 27.1 27.5 28.4 28.9 29.2 29.1
Tabel 6.21 Populaţia 11343 11295 11302 11311 11324 11376 11381 11384 11393 11385 11387 11392 11394 11392 11393 11396 11399 11403 11402 11406
Concatenarea seturilor de date prin creşterea numărului de date permite creşterea complexităţii modelelor. Setul de date din tabelul 6.22 este concatenat cu setul de date din tabelul 6.23 şi conduce la setul rezultat din tabelul 6.24.
128
Caracteristicile fizice ale persoanelor Cod persoană A100 A110 A120 A130 A140 A150 A160 A170 A180 A190 A200 A210 A220 A230 A240
Înălţime cm 183 179 175 173 188 180 184 190 178 186 191 177 185 189 176
Greutate kg 80 75 78 71 92 70 77 81 73 75 90 69 80 94 83
Tabel 6.22 Vârstă ani 25 41 28 20 26 35 29 24 38 40 31 27 35 36 45
Caracteristici salariale Cod persoană A100 A110 A120 A130 A140 A150 A160 A170 A180 A190 A200 A210 A220 A230 A240
Vechime ani 6 15 7 1 3 14 4 1 18 16 10 4 7 8 20
Salariu € 170 310 190 100 140 300 200 120 300 200 200 140 190 240 210
Tabel 6.23 Punctaj din 100 79 95 88 91 82 96 95 78 90 89 84 77 93 77 83 129
Concatenarea prin extensia numărului de serii utilizează date de identificare pentru a realiza punerea corectă în corespondenţă. Pentru exemplul considerat, codul persoanei are această semnificaţie. Date complete ale persoanelor Tabel 6.24 Cod persoană A100 A110 A120 A130 A140 A150 A160 A170 A180 A190 A200 A210 A220 A230 A240
Înălţime cm 183 179 175 173 188 180 184 190 178 186 191 177 185 189 176
Greutate kg 80 75 78 71 92 70 77 81 73 75 90 69 80 94 83
Vârstă ani 25 41 28 20 26 35 29 24 38 40 31 27 35 36 45
Vechime ani 6 15 7 1 3 14 4 1 18 16 10 4 7 8 20
Salariu € 170 310 190 100 140 300 200 120 300 200 200 140 190 240 210
Punctaj din 100 79 95 88 91 82 96 95 78 90 89 84 77 93 77 83
Concatenarea este o operaţie la nivel logic, fără a obţine copieri de seturi de date şi creşterea redundanţei în baza de modele economice. Constituirea unui set de date este operaţia prin care din baza de modele sunt analizate seturi de date şi se extrag numai acele serii care sunt utile obiectivului definit pentru un model economic. Astfel, dacă seturile de date SD1, SD2, …, SDr conţin date referitoare la elementele aceleiaşi colectivităţi, iar pentru dezvoltarea unui model sunt necesare numai anumite date din fiecare, se constituie un nou set de date SDr+1 prin preluarea din fiecare dintre seturile de date existente a seriilor necesare noului proces de modelare. De exemplu, pentru rezolvarea unui model M sunt necesare seriile de date corespunzătoare variabilelor X, U, W, V, Y, Z. Seriile de date pentru variabilele X, U, şi Y se află în setul de date SD7. Seriile de date W şi Z se află în setul de date SD103 iar seria de date V se află în setul de date SD1. Se 130
selectează seturile de date SD7, SD103 şi SD1. Sunt referite seriile de date din fiecare set. Se construieşte un nou set de date indicând: - numele prin care va fi referit (SD1000); - seriile de date şi apartenenţa la setul de date de bază. Noul set de date constituit este o construcţie logică, fără a ocupa zone de memorie prin copiere de serii de date. Este o construcţie realizată dinamic, prin referiri de seturi de bază şi serii în aceste seturi. Dezvoltările vizează extrageri parţiale din seriile de date cu specificarea poziţiilor termenilor preluaţi. Operaţiile pe seturile de date sunt complexe din punct de vedere a gestionării, a asigurării integrităţii şi securităţii. Prin niveluri de acces diferenţiat se asigură menţinerea operaţionalităţii acestei componente din baza de modele, care este mulţimea seturilor de date de intrare pentru procesele de modelare.
6.4 Rezultatele modelării Seturilor de date de intrare pentru procesele de modelare le corespund seturi de rezultate precum: seturi de coeficienţi, seturi de date calculate pentru variabilele rezultative prin utilizarea coeficienţilor estimaţi, indicatori agregaţi pentru caracterizarea modelului construit. Coeficienţii modelului sunt o serie de constante obţinute în procesul de estimare. Elaboratorul modelului trebuie să aibă acces la întreaga listă de coeficienţi dar şi la fiecare coeficient în parte. Acest acces se referă atât la vizualizare, cât şi la utilizare în expresii de evaluare proprii. Se stabilesc convenţii privind atribuirea unui nume listei de coeficienţi şi definirea unor expresii de referire a coeficienţilor. De exemplu, pornind de la caracterul uzual al întrebuinţării în modele a simbolurilor a0, a1, a2, … ,an pentru coeficienţi, se stabileşte convenţia că masivul unidimensional definit prin: tip a [ ] are semnificaţia coeficienţilor estimaţi, iar cu expresiile a [ 0 ], a [ 1 ], …se referă la alegere coeficienţi. 131
Referirea dintr-o problemă Pi a coeficienţilor estimaţi pentru modelul elaborat în problema Pj, sunt utilizate expresii de forma Pj.a [ 0 ], Pj.a [ 1 ], …, Pj.a [ k ],… Valorile calculate ale variabilelor rezultative, ŷi, pe baza coeficienţilor estimaţi se obţin la cerere folosind un operator definit. Seria de date obţinută se gestionează distinct, pentru vizualizare, pentru concatenarea într-un set de date şi pentru efectuarea de calcule. Indicatori de performanţă ai estimării se definesc şi se implementează în aşa fel încât să fie evaluaţi, vizualizaţi, stocaţi în vederea referirilor ulterioare. Filosofia bazei de modele conduce la moduri flexibile de utilizare şi reutilizare a modelelor, a seturilor de date de intrare dar şi a rezultatelor unui proces de modelare anterior. În procesul de generare a modelelor, setul de date de intrare rămâne neschimbat, în timp ce pentru fiecare model generat se obţin: - câte o listă a coeficienţilor estimaţi - niveluri ale indicatorilor de performanţă - câte o serie de valori calculate ŷ. Toate acestea trebuie gestionate distinct, comparate şi se produce o selecţie, rămânând un model sau un grup restrâns de modele, însoţite de rezultatele procesului de modelare. Toate celelalte variante de modele nereţinute şi rezultatele lor se pierd. Se observă că realizarea bazei de modele economice presupune dezvoltarea de mecanisme complexe şi pentru gestiunea rezultatelor procesului de modelare. Se concluzionează în acest context că toate componentele bazei de modele sunt la fel de importante, iar baza de modele este un sistem complex şi coesiv. Se observă că seturile de date trebuie gestionate în aşa fel încât să se obţină un echilibru între: - nivelul de redundanţă pe ansamblul bazelor de date; - spaţiul pe suport ocupat;
132
- durata de căutare şi regăsire; - volumul de prelucrări necesar reconstituirii. În cazul în care se urmăreşte minimzarea volumului stocat de date rezultat din calcule, ori de câte ori se doreşte referirea unui rezultat nestocat este necesar să se lanseze în execuţie toate procedurile care conduc la obţinerea lui. S-a minimizat spaţiul ocupat de rezultate dar creşte volumul prelucrărilor. În cazul în care datele sunt stocate o singură dată, recompunerea seturilor virtuale presupune iniţializarea de variabile pointer şi referirea acestora, ceea ce conduce la creşterea duratei de regăsire a datelor.
133
7. GESTIUNEA PROBLEMELOR DE MODELARE 7.1 Probleme de modelare O problemă de modelare presupune existenţa unei persoane care se identifică şi care primeşte accesul la renumele bazei de modele. Problema de modelare este un conglomerat, definit prin: - numele problemei; - ecuaţie sau ecuaţii ale modelului; - setul de date utilizat pentru estimare; - setul de date extins estimat pentru prognoza; - multitudinea coeficienţilor estimaţi; - set de indicatori care vizează performanţa modelului în raport cu criteriile date. Problemele de modelare se constituie prin: - specificarea tuturor componentelor conglomeratului de către utilizatorul bazei de modele; - preluarea tuturor componentelor din baze de modele, fie în vederea reproducerii unui proces de modelare in context dat, fie pentru a defini un nou context cu resurse reutilizabile; - preluarea din baze de modele a tuturor resurselor, mai puţin modelul, care se defineşte de către analistul de system; - preluarea din baza de modele a tuturor resurselor mai puţin setul de date, pe care îl iniţializează analistul; - preluarea din bază a modelului, a setului de date cu definirea de către analist a procedurilor de estimare, de analiza a performanţei modelului şi a procedurilor de prognoză. În cazul în care analistul unui proces pentru care se construieşte model economic operează cu seturi de date cu ecuaţii cu coeficienţi, cu valori calculate, toate aceste componente sunt reunite sub un nume – problema. 134
Referirea acestora se efectuează prin selectarea din listă a problemei. În cazul în care modelul conţine mai multe ecuaţii, a defini o problemă înseamnă: - a preciza numărul de ecuaţii; - a selecta forma ecuaţiei; - a construi setul de date ca reuniune a seturilor aferente fiecărei ecuaţii a modelului; - a declanşa estimarea de coeficienţi; - a calcula performanţa modelului; - a efectua prognoze sau a calcula pentru niveluri date ale variabilelor exogene în condiţiile utilizării coeficienţilor estimaţi. Definirea problemei presupune componentele si succesiunea de paşi pentru prelucrări.
7.2 Tehnologie pentru structurarea unui model Tehnologia elaborării modelului economic presupune traversarea unor etape, iar în final se obţine modelul ce va fi considerat ca fiind cel mai bun în raport cu o mulţime dată şi în raport cu un criteriu ales. E1: stabilirea obiectivului pe care trebuie să-l atingă elaborarea modelului, în cazul în care obiectivul este prognoza, trebuie stabilite ipotezele de generare a nivelurilor variabilelor exogene, în cazul în care informaţia furnizată de model serveşte la fundamentarea deciziilor, trebuie făcută diferenţierea între optimizare si ameliorare; în cazul în care este utilizat la evaluarea nivelului unei variabile, trebuie luaţi în considerare factorii subiectivi. E2: dimensionarea numărului de serii de date care intră în structura setului de date; se au în vedere factorii obiectivi dar şi factorii subiectivi care determină numărul seriilor de date dar şi lungimea acestora; limitările care apar pentru utilizarea procedurilor de măsurare şi politicile de derulare a controlului evoluţiei în timp a proceselor, sunt numai două cauze majore care afectează atât lungimea seriilor, cât şi numărul şi, mai ales, diversitatea factorilor ale căror caracteristici le înregistrează. 135
E3: structurarea modelului şi apartenenţa la o clasă sau la un număr restrâns de clase are menirea de a restrânge procesul de generare în interiorul clasei, respectiv, în interiorul claselor restrânse specificate; baza de modele conţine o listă de modele implementate, din analizele setului de date şi din acurateţea cu care se doreşte să se obţină soluţia, utilizatorul bazei de modele selectează o sublistă de modele, în cazul în care nu există suficiente informaţii asupra procesului continuarea sublistei este dată de numărul seriilor care alcătuiesc setul de date; de exemplu, dacă setul e date conţine numai seriile asociate variabilelor X si Y, din lista de modele se selectează automat numai modelele ce includ în structură o singură variabilă exogenă. E4: efectuarea estimărilor şi calculul unor indicatori de performanţă privind estimările, şi, respectiv, calitatea modelului se procedează la efectuarea de calcule pentru întreaga suită de modele construite, generate sau selectate din baza de modele; se procedează la ordonarea modelelor descrescător în raport cu un criteriu ales sau cu un criteriu agregat, obţinându-se atât cel mai performant model, cât şi cel mai puţin performant; modelele se grupează în aşa fel încât numai acele modele care satisfac cerinţe proprii, de exemplu, dacă sunt considerate modelele M1, M2, M3, M4 şi M5 şi în mod corespunzător sunt calculaţi indicatorii: n
S1i = Σ (yij - ỹij)2 j=1
şi:
n+k
S2i = Σ (yij - ỹij)2 j=n+1
i= 1, 2, 3, 4, 5 obţinând datele din tabelul 7.1.
136
Indicatorii de performanţă ai modelelor Modelul M1 M2 M3 M4 M5
Tabel 7.1 S2 611 832 586 945 326
S1 7230 453 6650 12915 5701
Din punctul de vedere al primului criteriu, modelul M2 este cel mai bun şi modelul M4 este cel mai slab; din punct de vedere al celui de al doilea criteriu, modelul M5 este cel mai bun, iar modelul M4 este cel mai slab; dacă se asociază ponderile p1 = 0,3 şi p2 = 0,7 celor două criterii rezultă indicatorul agregat: Ai = p1*S1i + p2*S2i, i = 1, 2, 3, 4, 5 , cu valorile date în tabelul 7.2. Indicatorii de performanţă ponderaţi ai modelelor Tabel 7.2 Modelul M1 M2 M3 M4 M5
A 2596,7 1957,3 2405,2 4536 1938,5
Prin ordonare crescătoare după valorile criteriului A rezultă că modelul M4 este cel mai bun, iar modelul M5 este cel mai slab; punctajele p1 şi p2 sunt date de specialişti cu experienţă în aprecierea importanţei criteriilor. E5: utilizarea modelelor este orientată spre destinaţii diverse; sunt modele utilizate în simularea comportamentului unui sistem economic; în acest context, analistul construieşte ca date de intrare un set de date cu niveluri ce reprezintă valori posibile ale variabilelor exogene în diferite ipostaze; dacă nivelurile respective sunt atinse de sistemul real, variabila 137
endogenă Y va avea un nivel estimat; când se definesc politici economice se elaborează mai întâi ipoteze şi după aceea se efectuează simulări; se selectează acele traiectorii care converg spre realizarea obiectivului stabilit, de exemplu, dacă se stabileşte dublarea productivităţii se procedează astfel: ¾ se consideră momentul de start t0 şi nivelul său de productivitate W0; ¾ se stabileşte momentul final tf când productivitatea Wf = 2*W0; se calculează lungimea intervalului L = Wf – W0; ¾ se definesc ipoteze privind creşterea valorii producţiei realizate şi, respectiv, structura de personal; ¾ se calculează pe baza ipotezelor nivelurile de productivitate, din aproape în aproape; ¾ se repetă etapele privind generarea de ipoteze, până când se obţine, fie că obiectivul este posibil, fie că obiectivul nu este realizabil; pentru datele concrete: t0 – corespunde anului 2004, tf – corespunde anului 2009, L – este un interval de 5 ani, N0 – numărul de muncitori, 10 000; V0 – volumul producţiei, 25 000 000 unităţi valorice; W0 = 25 000 000 uv / 10 000 muncitori = 2500 uv; Conform modelului enunţat: Wf = 2 * 2500 uv = 5000 uv/muncitor; Primul sistem de ipoteze vizează creşterea uniformă a volumului producţiei: ∆ = Wf – W0 q=∆/L Pentru datele problemei Wf = 5000 uv/muncitor, rezultă că an de an, productivitatea muncii trebuie să crească cu o raţie rw=500 uv/muncitor, conform tabelului 7.3.
138
Productivitatea muncii în ritm constant de creştere Tabel 7.3 Anul W (uv/muncitor) 2004 t0 25 000 2005 t1 30 000 2006 t2 35 000 2007 t3 40 000 2008 t4 45 000 2009 t5 50 000 Se notează: Vf – volumul producţiei la momentul tf Nf – numărul de muncitori la momentul tf. Al doilea sistem de ipoteze vizează atât creşterea uniformă a producţiei cu o raţie rV, cât şi descreşterea uniformă a numărului de muncitori cu o raţie rN: Wf = (V0 + L*rV) / (N0 – L*rN) = 2 * W0 Rezultă:
rN =
N 0 V0 + L * rV − L 2 * L * W0
1
în ipoteza în care rv= 2 500 000, rezultă rN = 500. Rezultă o evoluţie a productivităţii muncii pe cei cinci ani, ca în tabelul 7.4. Evoluţia productivităţii muncii în ipoteze de uniformitate Tabel 7.4 T W 2004 2500,00 2005 2894,73 2006 3333,33 2007 3823,53 139
T 2008 2009
W 4375,00 5000,00
Politicile economice trebuie să se bazeze pe numeroase ipoteze de lucru, modelele care includ multe variabile exogene iau în considerare ipoteze optimiste, ipoteze pesimiste sau combinaţii ale acestora, în situaţiile în care se construiesc modele cu soluţii propagandistice, variabilelor exogene li se atribuie niveluri rezultate din aplicarea unor coeficienţi de multiplicare precum: 10, 100, 1/10, 1/100, care impresionează, dar care sunt lipsiţi de suport real; modelele de prognoză reprezintă o altă categorie de modele, iar estimările au menirea de a arăta cum va evolua în timp un proces, de asemenea, în ipoteze definite; de exemplu, producţia de ţiţei PT este influenţată de consumul de produse petroliere CU, conform modelului: PT = 0,25 * CU2 + 11 Prognoza pe intervalul 2005 – 2010 ia în considerare nivelurile CU2003 = 7 şi CU2004 = 10q (q este o unitate de măsură echivalent pentru produsele petroliere); în ipoteza unei creşteri liniare cu menţinerea sporului ∆ = CU2004 – CU2003 = 3, rezultă nivelurile prognozate, tabelul 7.5. Evoluţiile pentru producţia de ţiţei şi consumul de produse petroliere Tabel 7.5 Anul CU PT 2005 13 53,25 2006 16 75,00 2007 19 101,25 2008 22 132,00 2009 25 167,25 2010 28 207,00
140
În ipoteza creşterii în progresie geometrică: QT = CU2004/CU2003 = 10/7 = 1,42; rezultă prognoza din tabelul 7.6. Prognoza producţiei de ţiţei în ipoteza creşterii consumului CU în progresie geometrică Tabel 7.6 Anul CU PT 2005 14,21 14,55 2006 20,19 16,04 2007 28,69 18,17 2008 40,77 21,19 2009 57,94 25,48 2010 82,33 31,58 Sistemul de ipoteze se construieşte şi în funcţie de experienţa acumulată şi mai ales în funcţie de obiectivul urmărit prin modelare; calitatea soluţiei este dată în primul rând de ipotezele avansate, în al doilea rând de structura modelului construit, în al treilea rând sunt datele folosite pentru estimare şi în al patrulea rând de calitatea estimării. Această tehnologie trebuie urmată pas cu pas pentru a obţine o construcţie coerentă, utilă, de fapt pentru a avea la dispoziţie pentru un proces de analiză eficient, un instrument eficient.
7.3 Colecţii de probleme Baze de modele este o construcţie complexă, care include proceduri de prelucrare, seturi de date şi structuri de modele. Utilizatorii bazelor de modele economice definesc probleme prin: - seturi de date, - structuri de modele, - succesiuni de paşi de prelucrare, - rezultate finale, 141
- sistem de ipoteze pentru construirea de rezultate. Toate acestea presupun referirea de construcţii deja existente, fără a fi necesară realizarea de duplicate. Seturile de date se gestionează de către procedurile bazei de modele. Un set de date este definit prin: - nume, - număr de sesiuni, - lungimea seturilor de date, - conţinut. Două seturi de date SETi şi SETj sunt considerate identice dacă: - au acelaşi număr de serii, - seriile au acelaşi număr de termeni, - elementele corespondente ce formează seriile de date sunt aceleaşi. De exemplu, se consideră seturile de date SD1 şi SD2 definite în tabelele 7.7, 7.8, 7.9 Caracteristicile globale ale seturilor de date Tabel 7.7 SD2 4 13
SD1 4 13
Nr de serii Lungime serie
Conţinutul setului SD1 Nr. crt. 1 2 3 4 5 6 7 8
Y1 5 12 11 8 6 10 10 8
Y2 3 5 8 9 10 6 5 5
Y3 11 10 5 4 9 9 2 5
Tabel 7.8 Y4 6 8 2 7 9 10 11 6 142
Nr. crt. 9 10 11 12 13
Y1 10 7 3 5 6
Y2 8 1 12 6 7
Y3 7 3 8 9 4
Y4 2 9 1 3 8
Conţinutul setului SD2 Nr. crt 1 2 3 4 5 6 7 8 9 10 11 12 13
X1 3 5 8 9 10 6 5 5 8 1 12 6 7
X2 11 10 5 4 9 9 2 5 7 3 8 9 4
X3 5 12 11 8 6 10 10 8 10 7 3 5 6
Tabel 7.9 X4 6 8 2 7 9 10 11 6 2 9 1 3 8
Atunci când se acceptă un set de date, în baze de modele se memorează: - numele setului de date; - numărul de serii de date; - lungimea seriilor de date; - seriile de date, coloană de coloană; - amprenta setului de date. Amprenta unui set de date conţine elemente caracteristice. În continuare este propusă amprenta bazată pe valori externe. 143
Un set de date este privit ca un tablou A format din m linii şi n coloane, având elementele notate aij, i=1, 2, 3, … m; j=1, 2, 3, … n. Amprenta acestui tablou se construieşte astfel: - se aleg elementele minim si maxim ale tabloului, Amax = max max {aij} 1≤i≤m
1≤j≤n
Amin = min min {aij} 1≤i≤m
1≤j≤n
- se calculează diferenţa ∆ = amax – amin, - se aleg elementele maxime şi minime de pe linii şi, respectiv de pe coloane: Emini = min {aij} 1≤j≤n
Emaxi = max {aij} 1≤i≤m
Cmaxi = max {aij} 1≤j≤n
Cmini = min {aij} 1≤j≤m
- se calculează diferenţele: ∆li = lmaxi – lmini
i = 1, 2, 3, …m
∆Cj = Cmaxi – Cminj
j = 1, 2,3, …n
- se ordonează descrescător diferenţele: ∆li, i = 1, 2, 3, …m; separat, diferenţele ∆Cj, j = 1, 2, 3, …n.
144
Tratarea seturilor de date se efectuează pornind de la amprente care includ: - număr de serii, - număr de termeni, - diferenţele ∆, ∆li, i = 1, 2, 3, …m; ∆Cj, j = 1, 2, 3, …n. De asemenea se înregistrează frecvenţele de apariţie a elementelor aij în tablou şi complexităţile în sens Halstead. Pentru seturile de date SD1 şi SD2 amprentele sunt prezentate în tabelul 7.10. Amprentele seturilor de date
Nr. serii Nr. termeni ∆ ∆C1 ∆C2 ∆C3 ∆C4 ∆L1 ∆L2 ∆L3 ∆L4 ∆L5 ∆L6 ∆L7 ∆L8 ∆L9 ∆L10 ∆L11 ∆L12 ∆L13
SD1 4 13 6 11 9 10 8 7 9 5 4 4 9 3 8 8 11 6 4
Tabel 7.10 SD2 4 13 11 9 6 10 8 7 9 5 4 4 9 3 8 8 11 6 4 145
Se observă din tabelul 8.10 că amprentele seturilor de date SD1 şi SD2 sunt identice. Numai în acest caz se trece la analiza complexitaţilor în sens Halstead. Dacă şi complexităţile sunt identice se trece la comparările de conţinut, la nivel de serie de date. În cazul în care la nivelul amprentelor apar diferenţe, seturile de date sunt tratate ca diferite. În cazul în care seturile de date sunt identice, memorarea se efectuează o singură dată. Noul set de date este preluat numai ca nume şi se menţine referirea setului de date vechi. Cel mult se specifică noile poziţii ale seriilor de date. De exemplu, setul de date SET2 se defineşte: - nume: SET2; - set referit: SET1; - poziţie serii: 3, 1, 2, 4. Adică seria a 3-a din SET1 este pe poziţia 1 din setul SET2, seria 1 din SET1 este pe poziţia a doua din SET2, seria a doua din SET1 este pe poziţia a 3-a din SET2 iar seria a patra se afla pe ultima poziţie atât în SET1 cât şi în S2. În cazul în care se construiesc instrumente puternice de tratare la nivel de serie de date şi amprentele coboară în analiză la acest nivel. Problematica structurii modelelor apare, de asemenea, la nivel cantitativ, prin utilizarea de indicatori agregaţi. Se procedează la compararea de structuri de modele, succesiuni de referiri ale procedurilor şi seturile de rezultate. Problemele sunt identice dacă simultan: - operează cu aceleaşi seturi de date; - utilizează aceleaşi structuri de modele; - traversează aceleaşi etape de prelucrare; - stochează aceleaşi structuri de rezultate. În cazul problemelor identice, validitatea apare exclusiv în listele cu dimensiuni ale seturilor de date, ale variabilelor, ale denumirilor de rezultate obţinute. Colecţiile de probleme conţin componente care au un nivel de ortogonalitate ridicat. Dacă ortogonalitatea seturilor de date este: OS(SETi, SETj) = α1
146
Ortogonalitatea structurilor de modele: OM(Mi, Mj) = αm În ortogonalitatea rezultatelor: OR(Ri, Rj) = αr Rezultă că indicatorul agregat de ortogonalitate este: OAij =
3
OS ij * OM ij * ORij
Dacă în colecţie sunt stocate problemele PROB1, PROB2, …, PROBn; pentru a adăuga problema PROBn+1, trebuie ca OAi,n+1 є (0,78; 1] pentru oricare ar fi i = 1, 2, 3, … n.
7.4 Ordonarea listelor Baza de modele operează cu o serie de liste, dintre care se enumeră: • lista problemelor; • lista variabilelor; • lista modelelor; • lista procedurilor; • lista rezultatelor. Fiecare listă este formată din identificatori cu care se referă fiecare dintre elementele pentru care a fost construită. Un element al listei conţine: • identificatorul de recunoaştere; • adresa componentei pentru referirea efectivă; • frecvenţa de referire, care este o variabilă al cărei conţinut se majorează cu o unitate la fiecare referire. Pentru a realiza o mai bună folosire a conţinutului informaţional din baza de modele, periodic se procedează la sortarea descrescătoare a identificatorilor listelor după frecvenţele cu care au fost activaţi de utilizatorii bazei. 147
A gestiona probleme de modelare, revine la a manipula mai întâi cu liste de identificatori în sens de: - a adăuga noi identificatori asociaţi noilor probleme, noilor seturi de date, noilor modele, noilor proceduri şi noilor seturi de rezultate; - a sorta după frecvenţele de activare, elementele din listele de identificatori; - a calcula gradul ortogonalităţii problemelor noi în raport cu cele existente, în cazul în care modelele sunt ortogonale se introduc în lista de modele, în cazul în care seturile de date sunt ortogonale se introduc în lista seturilor de date, în cazul în care procedurile realizează prelucrări noi, evident se introduc în lista de proceduri; în cazul în care una dintre condiţii nu este îndeplinită, se adaugă în lista de probleme cu caracter local a utilizatorului; - a obţine variante de probleme pornind de la o problemă iniţială prin schimbări fie în setul de date, fie în structura modelului, fie în succesiunea prelucrărilor, variantele se referă asemenea noilor probleme, însă prin structura de bază de la care se dezvoltă, nu duplică setul de date, operează numai schimbările în structura modelului, fiecare variantă reprezintă reflectarea unei idei noi, o încercare de a perfecţiona o construcţie deja existentă, rezultatele obţinute în cadrul fiecărei varietăţi se prelucrează independent. Baza de modele conţine un nucleu standard, iar utilizatorii au la dispoziţie vocabulare pe care le selectează. Cuvintele vocabularelor – identificatori – sunt elemente din liste iniţial ordonate alfabetic. Regulile de construire a identificatorilor sunt preluate de la limbajele de programare. Pentru a nu produce distorsiuni majore la nivelul acceptării unor construcţii, se preferă prelucrarea dimensiunilor din literatura economică şi acronimele deja acceptate în lumea specialiştilor. Gestiunea problemelor este elementul esenţial pe care îl percepe utilizatorul bazei de date. La prima întrebuinţare a bazei de modele, lista de probleme a utilizatorului este vidă. Pe măsura avansării, acestei liste i se adaugă problemă după problemă şi variante ale problemelor. Utilizatorul are la dispoziţie şi opţiunea de ştergere a problemei. O problemă ştearsă este o problemă pierdută, adică setul de date dispare, dispare modelul, sunt pierdute şi rezultatele. Ştergerea problemei este un proces ireversibil. 148
8.TIPURI DE APLICAŢII 8.1Utilizare model Utilizatorii bazei de modele cunosc foarte bine lista modelelor stocate în bază şi mecanismele de generare. Ei vor utiliza numai modelele din lista sau cele care se generează în a obţine rezultatele proprii. Se consideră un set de date ce conţine seriile SD1, SD2,....,SDk, unde SD1 este seria de date ce corespunde variabilei endogene, SD2, SD3,..., SDk sunt seriile de date ce corespund variabilelor exogene. Aceste serii de date sunt rezultatul unei analize a fenomenului modelat, utilizatorul bazei de modele are certitudinea că există legături logice şi foarte puternice între factorii asociaţi variabilelor din setul de date. Baza de modele conţine, de asemenea, o listă formată din modelele M1,M2,...,Mn. Utilizatorul selectează din această listă unul dintre modele, ţinând seama de rezultatele analizei setului de date privind liniaritatea sau neliniaritatea. În alegerea modelului sunt luate în considerare rezultate din literatura de specialitate legate de modelarea procesului considerat. Utilizatorul parcurge următorii paşi: • selectează sau introduce setul de date; • selectează modelul din lista de modele; • estimează coeficienţii modelului; • analizează indicatorii de performanţă ai modelului; • generează date corespunzătoare sistemului de ipoteze; • calculează nivelurile estimate ale variabilei endogene corespunzătoare ipotezelor. De exemplu, se selectează setul de date existent în baza de modele ce corespunde variabilelor din tabelul 8.1.
149
Set cu două serii de date Tabel 8.1 Variabila exogenă (X)
Variabila endogenă (Y) 4 13,5 2 19,652 23,328 24,51395 27,00508 33,7 69,30556 52,88 55,296 55,296 53,61 58,10714
1,00 1,50 1,55 1,70 1,80 1,83 1,89 2,00 2,31 2,33 2,40 2,40 2,39 2,44
Lista de modele implementată în baza de modele corespunde tabelului 8.2. Table 8.2 Denumirea modelului Mnemonică Ecuaţii model y = ax + b funcţia liniară M1 funcţia parabolică 1
M2
y = ax α + bx + c
funcţia parabolică 2
M3
y = a + bx
funcţia parabolică 3
M4
y = 3 a + bx
funcţia parabolică 4
M5
y = a + bx 3
parabola lui Neile
M6
y = 3 ax α + bx + c
funcţia putere
M7
y = ax b
funcţia exponenţială 1
M8
y = e ax +b
funcţia exponenţială 2
M9
y = ae bx
funcţia exponenţială 3
M10
y = ab x 150
Denumirea modelului funcţia exponenţială 4
Mnemonică model M11
Ecuaţii
funcţia logaritmică 1
M12
ln y = a + b ln x
funcţia logaritmică 2
M13
y = a ln x
funcţia semilogaritmică
M14
y = a + b ln x
funcţia log-inversă
M15
ln y = a +
y = e ax ⋅ x b
b x
Din analiza datelor folosind reprezentarea grafică din figura 8.1, rezultă că este potrivit modelul M7, corespunzător funcţiei putere.
Variabila endogena
Reprezentarea prin puncte a evoluţiei variabilei Y 80 70 60 50 40 30 20 10 0 0,00
Series1
0,50
1,00
1,50
2,00
2,50
3,00
Variabila exogenă
Figura 8.1 Dependenţa dintre variabilele setului de date Folosind datele din tabelul 8.1, prin apelarea procedurii de estimare a coeficienţilor modelului M7 se obţine construcţia: y = 2.426 x 3.59 Utilizatorul bazei de modele defineşte pentru evoluţia variabilei X ipoteza de creştere în progresie geometrică având raţia: x 2,44 q = 15 = = 1,02. x14 2,39 151
Pentru prognoza variabilei Y în această ipoteză se construieşte tabelul 8.3. Set de date cu x generat Tabel 8.3 Variabila endogenă (Y) Variabila exogenă (X) 4 13,5 2 19,652 23,328 24,51395 27,00508 33,7 69,30556 52,88 55,296 55,296 53,61 58,10714
1,00 1,50 1,55 1,70 1,80 1,83 1,89 2,00 2,31 2,33 2,40 2,40 2,39 2,44 2,4888 2,538576 2,589348 2,641134 2,693957 2,747836
Folosind estimările coeficienţilor modelului M7, se procedează la calculul nivelurilor estimate ale variabilei endogene yˆ 16 , yˆ 17 , yˆ 18 , yˆ 19 , yˆ 20 , yˆ 21 , incluse în tabelul 8.4. Set de date cu x generat şi y estimate Variabila endogenă (Y) 4 13,5 2 19,652 23,328 24,51395 27,00508 33,7
Tabel 8.4 Variabila exogenă (X) 1,00 1,50 1,55 1,70 1,80 1,83 1,89 2,00
152
Variabila endogenă (Y) 69,30556 52,88 55,296 55,296 53,61 58,10714 64.04642 68.76533 73.83196 79.27175 85.11248 91.3835
Variabila exogenă (X) 2,31 2,33 2,40 2,40 2,39 2,44 2,4888 2,538576 2,589348 2,641134 2,693957 2.747836
Pentru o mai performantă abordare a procesului de selecţie din lista de modele, analiştii economici îşi construiesc albume cu reprezentări grafice pentru modelele M1,M2,...,Mn cu date având ordine de mărime apropiate celor existente în seturile de date, dar variabilele endogene au nivelurile calculate. Pentru seturi de date empirice se construieşte un grafic de acelaşi tip cu graficele din album. Se compară graficele din album cu graficul construit cu date empirice şi utilizatorul bazei de modele apreciază că unul dintre graficele din album este cel mai apropiat de graficul cu date empirice. Selectează modelul asociat graficului din album şi trece la parcurgerea etapelor corespunzătoare utilizării modelului. În anexa 3 sunt prezentate grafice ale modelelor din tabelul 9.2 pentru valorile 1,2,3,...,100 ale variabilei x şi pentru valori corespunzătoare calculate ale variabilei dependente y în condiţiile în care a=2, b=2, c=2. Funcţie de gama problemelor, utilizatorul îşi construieşte un album propriu. Versiuni dezvoltate ale sistemului de gestiune pentru baza de modele trebuie să includă şi analize pe grafice care să conducă la selecţia celui mai potrivit model.
153
8.2 Analiză comparată a modelelor Cercetarea economică pentru un proces a condus la construirea mai multor modele, autorii lor evidenţiind diferite aspecte ale evoluţiilor structurale şi ale dinamicii. Se pune problema reluării analizei unui proces în noile condiţii definite de un interval de timp nou, cu utilizarea unuia dintre modelele deja existente. În acest caz, se construieşte tabelul cu seriile de date pentru noul interval de timp, incluzând totalitatea variabilelor exogene cerute de modelele luate în considerare. Se consideră, de exemplu, intervalul Tk,Tk+1,…,Tk+r, pentru care este necesară modelarea procesului economic PE. În literatura de specialitate sunt cunoscute modelele MP1,MP2,...,MP9. În afara variabilei endogene Y având asociată seria de date SD1, care este aceeaşi pentru toate modelele setul de date complet, se construieşte studiind necesarul de serii de date asociat variabilelor exogene din modelele MP1,MP2,...,MP9, aşa cum rezultă în tabelul 8.5. Variabilele exogene în modele Modelul MP1 MP2 MP3 MP4 MP5 MP6 MP7 MP8 MP9
SD2 * * * *
SD3 * * * *
SD4
SD5
* * * *
*
SD6
SD7
Tabel 8.5 SD8
* * *
* *
*
* *
* *
* *
Utilizatorul bazei de modele procedează la parcurgerea următorilor paşi: • Construirea ipotezelor de generare a seriilor de date pentru variabilele exogene. • Generează date pentru momentele Tk+r+1, Tk+r+2, Tk+r+3,…, Tk+r+v. • Estimează coeficienţii pentru modelele MP1,MP2,...,MP9. 154
• Calculează nivelurile estimate ale variabilei endogene pentru fiecare model corespunzător ipotezelor. • Trasează grafice pentru momentele Tk+r+1, Tk+r+2, Tk+r+3,…, Tk+r+v ale variabilei endogene. • Compară evoluţiile efective ale variabilei endogene pentru cu tendinţele, folosind graficele momentele Tk,Tk+1,…,Tk+r obţinute. În continuare se consideră modelele pentru analiza productivităţii muncii, din tabelul 8.6, unde productivitatea muncii W este variabila endogenă şi factorul timp are asociată variabila exogenă, întrucât agregă creşterea numerică a muncitorilor, ridicarea calitativă a pregătirii acestora, acumularea experienţei şi nivelul de înzestrare a locurilor de muncă prin investiţii pentru automatizare şi robotizare. Modele ale productivităţii muncii în funcţie de timp Modelul
Denumirea modelului funcţia liniară funcţia putere funcţia semilogaritmică
M1 M2 M3
Tabel 8.6 Expresia analitică w = at + b w = at b w = a + b ln t
Folosind datele din tabelul 8.7, se procedează la estimarea coeficienţilor celor trei modele, obţinându-se datele din tabelul 9.8. Productivitatea muncii W în funcţie de timp t Timpul 1 2 3 4 5 6 7 8 9
Tabel 8.7 Productivitatea muncii W 9,6 22,4 41,6 67,2 99,2 137,6 182,4 233,6 291,2
155
Timpul
Productivitatea muncii W
10 11 12 13 14 15
355,2 425,6 502,4 585,6 675,2 771,2
Rezultatul procesului de estimare Modelul M1 M2 M3
Tabel 8.8 Expresia analitică w = 54.4t − 141.867 w = 5,34t 2, 0041 w = 270,6 − 209,97 ln t
Pentru intervalul de timp format din momentele T=16, T=17, …, T=20 se calculează nivelurile estimate ale productivităţii folosind valorile obţinute din tabelul 9.8, estimări prezentate în tabelul 8.9. Productivitatea estimată a muncii Tabel 8.9 Timpul W(M1) W(M2) W(M3) 16 728.533 1382.669 540.2925 17 782.933 1561.291 556.6975 18 837.333 1750.785 572.1646 19 891.733 1951.153 586.7952 20 946.133 2162.397 600.6752 Printr-o analiză complexă a evoluţiilor din alte economii se extrag tendinţe cu nivelul cât mai ridicat al probabilităţii de realizare. Pentru fiecare model se prezintă rezultatul productivităţii estimate în raport cu un obiectiv stabilit. De exemplu, dacă se urmăreşte dublarea productivităţii muncii la momentul T=20, iar modelul M1 se apropie de atingerea acestui obiectiv, analistul economic trebuie să aprofundeze studiul pentru a descifra influenţele pe care structura modelului le determină asupra mecanismelor economiei în aşa fel încât economia să atingă nivelul de performanţă estimat. 156
8.3 Elaborarea modelelor În procesul de analiză, apare necesitatea construirii de noi modele care să preia ipoteze asupra cărora teoriile precedente nu s-au oprit. Noile ipoteze vizează noi factori, noi interdependenţe între factori. Necesitatea elaborării de modele presupune cunoaşterea fenomenului modelat şi a rezultatelor analizei economice, a modelelor existente, până în momentul de faţă. Baza de modele conţine clase de modele, iar elaborarea noilor modele ia în considerare ceea ce există în vederea adăugării de noi expresii analitice. În procesul de analiză economică, pentru un nou model, se stabilesc proprietăţi, seturi de serii de date, se identifică modul în care se efectuează estimările de coeficienţi şi se fac predicţii asupra calităţii soluţiei oferite de model. Se justifică elaborarea unui nou model dacă şi numai dacă, noul model aduce un spor de calitate asupra întregului proces de analiză a fenomenului economic. De exemplu, productivitatea muncii W, este influenţată de numărul de muncitori direct productivi L, de volumul investiţiilor în creşterea gradului de calificare IC şi de volumul investiţiilor pentru creşterea gradului de înzestrare a locurilor de muncă II. Analiza separată a influenţelor conduce la modele de forma: w = a +b⋅L w = a + b ⋅ IC * IC w = a + b ⋅ exp(II ) În procesul de analiză economică rezultă că investiţiile la momentul k pentru creşterea gradului de calificare se regăsesc în productivitatea muncii ceva mai târziu, după r ani, când a fost acumulată şi experienţa. În acelaşi fel, realizarea investiţiilor la momentul k influenţează productivitatea muncii, câţiva ani mai târziu, având în vedere faptul că un utilaj trebuie comandat, transportat, instalat şi adus la parametrii de funcţionare, obiectiv care se atinge dupa s ani. Dacă se doreşte construirea unui nou model pentru estimarea productivităţii muncii care să ia în considerare toţi factorii, trebuie să fie luate în calcul şi întârzierile de propagare a efectelor. 157
Modelul: wt = a + b ⋅ L + c ⋅ IC t2− r + d ⋅ exp( II t − s )
Acest nou model trebuie să aibă asociate serii de date prelucrate. De la setul de date iniţial, din tabelul 8.10, prin glisarea de termeni pentru r=5 şi s=3 se obţin datele din tabelul 8.11. Datele iniţiale pentru modelul productivităţii Timpul
W
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
L 300 310 315 317 320 321 321 330 350 350 360 380 385 420 480 485 500 510 530 540
Tabel 8.10 II
IC 3 3,2 3,3 3,2 3,4 3,4 3,4 3,5 3,5 3,6 3,6 3,6 3,7 3,8 4 4,11 4,12 4,2 4,25 4,30
50 70 110 105 90 100 100 90 100 110 115 120 120 135 140 140 135 150 140 145
100 110 110 130 135 170 150 160 175 175 190 190 200 220 200 250 220 240 230 240
Datele care ţin seama de decalajele de timp Timpul 1 2 3 4 5
Wt
Lt
ICt-5
321 321 330 350 350
3,4 3,4 3,5 3,5 3,6
50 70 110 105 90
Tabel 8.11 IIt-3 110 130 135 170 150
158
Timpul 6 7 8 9 10 11 12 13 14 15
Wt
Lt
ICt-5
IIt-3
360 380 385 420 480 485 500 510 530 540
3,6 3,6 3,7 3,8 4 4,11 4,12 4,2 4,25 4,30
100 100 90 100 110 115 120 120 135 140
160 175 175 190 190 200 220 200 250 220
Folosind datele din tabelul 8.11 se procedează la estimarea coeficienţilor obţinându-se modelul: wt = −536,017 + 251 ⋅ L − 0.00031 ⋅ IC t2− r + 8.2939 ⋅ 10 −109 ⋅ exp( II t − s )
Noul model trebuie comparat cu modele existente şi rezultatul analizei conduce fie la reţinerea lui ca un model mai bun fie la concluzii privind nivelurile de întârziere s şi r care prin modificări din aproape în aproape conduc la soluţii acceptabile în raport cu un criteriu de calitate stabilit. Pentru acest tip de problemă, un rol important îl are capacitatea analistului economic de a interpreta, de a sintetiza şi de a stăpâni instrumentele de bază ale artei modelării.
8.4 Validarea modelelor Se calculează indicatorul Isat privind gradul de satisfacţie în utilizarea unui produs prin relaţia: NPR ni
I sat =
∑∑ k i =1 j =1
ij
NPR ni
∑∑ p i =1 j =1
ij
159
unde: NPR – număr proprietari ai produsului software care implementează modelul; ni - numărul lansărilor în execuţie a produsului software la proprietarul i; kij – numărul persoanelor care sunt satisfăcute de rezultatul oferit de model la proprietarul i după efectuarea lansării în execuţie j; pij – numărul total al persoanelor care au primit rezultatul oferit de model la proprietarul i după efectuarea lansării în execuţie j. În cazul în care se stabileşte un interval [A;1] cu 0
ni
∑∑ p i =1 j =1
ij
≥B
unde: B reprezintă un număr semnificativ de beneficiari direcţi ai modelului, stabilit atunci când se implementează funcţia de validare modele. În cazul modelelor de prognoză, la fiecare activare, se înregistrează seriile de date corespunzătoare variabilelor endogene, pentru intervalul prognozat. Cu trecerea timpului, se înregistrează nivelurile efective ale variabilelor endogene. Se compară nivelurile prognozate cu nivelurile efective şi se calculează indicatorul Ierr ce corespunde comparării erorilor de estimare, dat de relaţia: Tf
T f +r
i =T f − r
i =T f
∑ ( yi − yˆ i ) 2 , ∑ ( yi − yˆ i ) 2 }
min{ I err =
Tf
max{
∑(y
i =T f − r
i
T f +r
− yˆ i ) , ∑ ( y i − yˆ i ) 2 } 2
i =T f
160
unde: T1,T2,…,Tf – momentele de timp pentru care au fost înregistrate date utilizate în construirea modelului de prognoză şi în procesul de estimare a coeficienţilor; yi – nivelul variabilei endogene măsurat la momentul Ti; yˆ i - nivelul estimat al variabilei endogene la momentul Ti folosind modelul şi coeficienţii estimaţi cu datele înregistrate pentru T1,T2,…,Tf. Tf+1, Tf+2,..., Tf+r - momentele de timp pentru care s-a efectuat prognoză folosind modelul construit, coeficienţii estimaţi şi setul de date înregistrate pentru T1,T2,…,Tf. Tf-r, Tf-r+1, Tf-r+2,…, Tf – momentele de timp ce definesc intervalul simetric, intervalului de prognoză, în raport cu care se realizează analiza calităţii modelului în vederea validării. Se consideră N numărul utilizatorilor modelului. Dacă dintre aceştia K utilizatori consideră indicatorul Ierr ca fiind satifăcător în raport cu criteriile proprii şi dacă raportul K I sat = N aparţine intervalului [0;A] rezultă că modelul este validat. Validarea unui model oferă o garanţie în plus viitorilor utilizatori că rezultatele pe care le vor obţine le vor satisface nevoile. Procesul de validare nu elimină cu totul riscul de a plasa utilizatorii în zona rezultatelor nesatisfăcătoare. Se consideră modelul pentru prognoza produsului intern brut – PIB, în funcţie de investiţii - INV. Se consideră ţările H1,H2,H3,H4,H5 pentru care au fost înregistrate datele din tabelul 8.12. Nivelurile PIB şi investiţii Tim p 1 2 3
PIB 1
170 190 200
PIB 2
391 412 433
PIB 3
275 286 298
PIB 4
146 151 153
PIB 5
870 870 882
INV 1
100 110 115
INV 2
210 220 230
INV 3
150 155 160
Tabel 8.12 INV INV 4
69 72 73
5
400 400 405
161
Tim p 4 5 6 7 8 9 10 11 12 13 14
PIB 1
202 210 220 214 220 224 232 240 250 260 266
PIB 2
454 460 475 485 489 517 523 525 527 538 559
PIB 3
312 311 321 327 348 355 360 369 369 369 376
PIB 4
155 155 155 157 159 165 167 163 168 176 182
PIB 5
900 896 918 930 918 920 930 942 944 966 978
INV 1
116 120 121 122 125 127 131 133 140 145 148
INV 2
240 241 250 255 257 270 273 274 275 280 290
INV
INV
3
4
165 166 170 173 182 183 187 191 191 191 194
73 74 74 75 76 77 80 78 81 85 88
INV 5
410 411 420 425 420 420 425 430 431 440 445
Din analiza economică, folosind inclusiv un album de grafice, este selectat modelul PIB=a*INV+b Folosind datele din tabelul 9.12 se estimează coeficienţii modelelor pentru economiile H1,H2,H3,H4,H5, rezultând: PIB1=1,998*INV1 - 29 PIB2=2,089*INV2 - 47 PIB3=2,3*INV3 - 69 PIB4=1,892*INV4 + 15,5 PIB5=2,375*INV5 - 79 Folosind ipoteza ritmului mediu de creştere al volumului de investiţii se prognozează nivelul produsului intern brut pentru momentele de timp T=15, T=16, T=17, …, T=20, aşa cum rezultă din tabelul 8.13. Prognoza investiţiilor în ipoteza creşterii cu ritm mediu Tabel 8.13 Timp INV1 INV2 INV3 INV4 INV5 15 151,6923 296,1538 197,3846 89,46154 448,4615 16 155,3846 302,3077 200,7692 90,92308 451,9231 17 159,0769 308,4615 204,1538 92,38462 455,3846 18 162,7692 314,6154 207,5385 93,84615 458,8462 19 166,4615 320,7692 210,9231 95,30769 462,3077 20 170,1538 326,9231 214,3077 96,76923 465,7692 162
Folosind modelele cu coeficienţii estimaţi pentru PIB1,PIB2,PIB3,PIB4,PIB5 şi datele din tabelul 9.13, se procedează la estimarea produsului intern brut pentru T=15, T=16, T=17, …, T=20, obţinându-se datele din tabelul 8.14. Prognoza produsului intern brut – PIBp Timp 15 16 17 18 19 20
PIB1
PIB2
274,0812 281,4585 288,8357 296,2129 303,5902 310,9674
PIB3
571,6654 584,5208 597,3762 610,2315 623,0869 635,9423
PIB4
384,9846 392,7692 400,5538 408,3385 416,1231 423,9077
184,7612 187,5265 190,2917 193,0569 195,8222 198,5874
Tabel 8.14 PIB5 986,0962 994,3173 1002,538 1010,76 1018,981 1027,202
Nivelurile efective înregistrate la momentul T=21, pentru produsul intern brut după scurgerea timpului corespunzător intervalului de prognoză sunt date în tabelul 8.15. Produsul intern brut efectiv – PIBe Timp
PIB1
15 16 17 18 19 20
274 262 289 296 306 310
PIB2 571 585 600 610 623 638
PIB3 385 393 400 408 417 424
PIB4 185 188 190 191 196 199
Tabel 8.15 PIB5 986 997 1004 1011 1020 1025
Se calculează sumele pătratelor de diferenţe SPIBi dintre produsul intern brut al economiei Hi prognozat şi produsul intern brut efectiv folosind relaţia: 20
SPIBi = ∑ ( PIBp i − PIBei ) 2 i =15
obţinându-se: SPIB1=385,4538 163
SPIB2=11,85223 SPIB3=1,252308 SPIB4=4,799147 SPIB5=15,28726 Folosind modelele cu coeficienţii estimaţi se procedează la obţinerea valorilor calculate ale produsului intern brut pentru momentele T=9, T=10, T=11, …, T=14, redate în tabelul 8.16. Nivelurile calculate ale produsului intern brut Timp 9 10 11 12 13 14
PIB1
PIB2
224,746 232,738 236,734 250,72 260,71 266,704
517,03 523,297 525,386 527,475 537,92 558,81
PIB3 351,9 361,1 370,3 370,3 370,3 377,2
PIB4
Tabel 8.16 PIB5
161,184 166,86 163,076 168,752 176,32 181,996
918,5 930,375 942,25 944,625 966 977,875
Se calculează sumele pătratelor de diferenţe SPIBi dintre produsul intern brut al economiei Hi prognozat şi produsul intern brut efectiv folosind relaţia: 14
SPIBi = ∑ ( PIBp i − PIBei ) 2 i =9
obţinându-se: 13,28603
0,50623
17,33 15,25515 2,859375
SPIB1=13,28603 SPIB2=0,50623 SPIB3=17,33 SPIB4=15,25515 SPIB5=2,859375 Se calculează indicatorii Ierr obţinându-se următoarele valori: 0,034469 0,042712 0,072262 0,314592 0,187043
164
Ierr(H1)= 0,034469 Ierr(H2)= 0,042712 Ierr(H3)= 0,072262 Ierr(H4)= 0,314592 Ierr(H5)= 0,187043 În ipoteza că intervalul de validare este definit ca [0;0,2], rezultă că din cele 5 utilizări ale modelului liniar, 4 sunt satisfăcătoare ceea ce conduce la un indice de satisfacţie cu nivelul de 0,8. În concluzie modelul PIB=a*INV+b este validat. Tipurile de aplicaţii acceptate de baza de modele evoluează prin trecerea de la o versiune la alta a sistemului ei de gestiune.
165
9. PROCEDURI 9.1 Proceduri pentru estimarea şi rafinarea modelelor Procedurile destinate estimării coeficienţilor au ca date de intrare: • lungimea seriilor de date asociate factorilor de influenţă şi variabilelor rezultative; • seriile de date propriu-zise; • structura modelului pentru care se estimează coeficienţii, codul asociat metodei de estimare utilizate. Rezultatele oferite de aceste proceduri sunt: • şirul de coeficienţi estimaţi; • nivelul sumei pătratelor diferenţelor dintre nivelurile reale şi cele estimate ale variabilei rezultative ; • valori asociate rezultatului testării unor ipoteze statistice privind calitatea estimatorilor; • informaţii privind derularea estimării. În cazul în care sunt utilizate metode de estimare care impun unele restricţii asupra seriilor de date de intrare ale modelului, înainte de derularea algoritmului de estimare respectiv, se verifică ipotezele referitoare la acele restricţii. Dacă sunt verificate ipotezele se lansează procesul de estimare. În caz contrar, se trece la utilizarea altor algoritmi de estimare, liberi de aceste restricţii. După utilizarea acestor proceduri, trebuie analizate informaţiile returnate de proceduri pentru a valida modelul în care s-a derulat procesul de estimare şi pentru a utiliza estimatorii într-un mod consistent, în raport cu ansamblul activităţilor de proiectare, analiză, realizare şi utilizare curentă a modelelor economice. Procedurile pentru rafinarea modelelor include ca intrări: • numărul iniţial de variabile; • seturile de date; • mulţimea criteriilor după care se face analiza calitativă. 166
Rezultatul rafinării este un model cu număr de variabile exogene mult mai mic decât cel iniţial. Procedurile includ următorii paşi: • ordonarea coeficienţilor estimaţi; • calculul ponderii fiecărei variabile asociată unui factor de influenţă; • eliminarea variabilelor ale căror ponderi sunt în afara intervalului definit. De exemplu, se consideră un model liniar având în structură 20 de variabile exogene. Printr-o metodă a analizei factoriale se ierarhizează variabilele. Ponderile pozitive subunitare asociate factorilor ordonaţi descrescător sunt F1, F2,...,F20. În ipoteza în care intervalul delimitat este [0; 0.95] se procedeză la însumarea ponderilor, reţinându-se toate variabilele până când suma ponderilor depăşeşte limita de 0.95. Se presupune că suma ponderilor pentru primii 5 factori este mai mare decât 0.95, iar suma ponderilor pentru primii 4 factori este mai mică decât 0.95. Procedura stabileşte că modelul rafinat conţine 5 factori şi se procedează la estimarea coeficienţilor noului model. O altă procedură de rafinare constă în a considera modelul iniţial ca model de bază. Se elimină rând pe rând câte o variabilă din model. Se calculează sumele de pătrate de diferenţe şi se alege modelul pentru care suma este minimă. Procedeul de eliminare continuă şi din aproape în aproape se va obţine un model cu un număr de variabile exogene mai mic. Criteriul de întrerupere a procesului de rafinare este dat de încadrarea sumelor pătratelor de erori într-un interval obţinut pe cale experimentală. O formă evoluată de rafinare constă în reestimarea coeficienţilor ecuaţiilor generate şi calculul sumelor pătratelor de difernţe folosind noii coeficienţi. Rafinarea modelului nu este complementară operaţiei de generare. În cazul generării se dau variabile şi se doreşte identificarea unei structuri de model care să reflecte cel mai bine legătura dintre factori. În cazul rafinării, modelul există şi se doreşte obţinerea unei structuri cât mai operaţionale. Rezultatul rafinării trebuie să conducă la o structură cât mai apropiată de rezultatul unui proces de generare, pornind pe drumul invers. 167
9.2 Proceduri pentru regruparea datelor Atunci când se definesc probleme, utilizatorii introduc date de intrare sub forma unor matrice stocate în fişiere. Procedurile pentru regruparea datelor vizează: • stabilirea seturilor de date identice; în acest scop se analizează fişierele FIS1,FIS2,...,FISm care conţin datele utilizatorilor, comparînd lungimile fişierelor, comparând numărul de variabile exogene îngistrate; în caz de egalitate se trece şi la compararea conţinutului fişierelor calculându-se gradul de ortogonalitate ca raport între numărul elementelor identice ca poziţie şi valoare şi numărul total al elementelor; dacă gradul de ortogonalitate este 0 se conchide că fişierele sunt identice şi se procedează la punerea în corespondenţă a unui singur set de date cu două nume de fişiere; unul dintre fişierele identice este şters; • identificarea operaţiilor mecanice de interschimb coloane asociate variabilelor care afectează ortogonalitatea fişierului; se efectuează o analiză statistică asupra frecvenţelor de apariţie a valorilor şi se măsoară nivelurile de complexitate; dacă există fişiere cu complexităţi egale se detaliază analiza la nivelul seriilor de date asociate variabilelor identificându-se care au fost interschimburile ce afectează ortogonalitatea; se alege nivelul minim şi nivelul maxim al datelor din fişierul FIS1; se stabilesc k intervale având raţie egală; se calculează frecvenţele de aparteneţă a valorilor din fişier la cele k intervale; se calculează complexitatea în sens Halstead ca sumă de k termeni, pentru fiecare din cele m fişiere, FIS1,FIS2,...,FISm; se aleg fişierele pentru care complexităţile sunt identice; se ia fiecare serie de date şi se calculează complexitatea Halstead folosind frecvenţele ce rezultă prin stabilirea apartenenţei termenilor fiecărei serii la intervale, de asemenea, egale, obţinute din diferenţa dintre maximul şi minimul la nivel de serie împărţit la numărul de intervale; şirul de complexităţi la nivelul seriilor se ordonează descrescător pentru fiecare fişier în parte; dacă există 168
două fişiere FISi şi FISj pentru care şirurile de complexităţi au aceiaşi termeni se procedează la compararea fişierelor termen cu termen şi la evaluarea ortogonalităţii totale; • obţinerea părţilor comune din fişiere; prin compararea complexităţilor la nivel de serii se reţin cele egale şi dacă prin compararea seriilor rezultă valori identice ca mărime şi poziţie, înseamnă că într+un set de date se vor stoca aceste serii şi în celălalt se vor face referiri la ele; de exemplu, se consideră fişierele FIS1,FIS2 şi FIS3; FIS1 conţine seriile de date asociate variabilelor X,Y,Z; fişierul FIS2 conţine seriile de date asociate variabilelor X,Z,V; fişierul FIS3 conţine seriile de date asociate variabilelor X,Y,W; după analiza complexităţilor, cele 3 seturi de date FIS1,FIS2 şi FIS3 vor conţine: FIS1: seriile de date X,Y,Z; FIS2: referiri la seturile de date X,Z din FIS1 şi seria de date proprie V; FIS3: referiri la seturile de date X,Y din FIS1 şi seria de date proprie W. • completarea unor seturi de date; se consideră fişierele FISi şi FISj în care numărul de serii de date este identic şi momentele de timp sunt complementare, în setul de date FISi momentele de timp sunt t1,t2,...,tk iar în FISj momentele de timp sunt tm+1, tm+2,…,tm+r; ordinele de mărime şi numele variabilelor asociate sunt identice sau nivel de similaritate acceptabil; regruparea seturilor de date revine la a concatena fişierele FISi şi FISj obţinându-se un nou fişier FISij ce se referă atât ca întreg cât şi prin părţile lui iniţiale. Seturile de date se constituie ca fişiere ce conţin un preambul cu informaţii generale privind numărul de serii de date, numărul de termeni din serie şi informaţii de legătură cu alte fişiere. Informaţiile din preambul stau la baza procesului de regrupare.
169
9.3 Proceduri pentru stabilirea ortogonalităţii Forma canonică a modelului economic este elementul de bază în analiza ortogonalităţii oricărui model. Un model economic are forma generală y = f ( x1 , x2 ,..., xn )
Expresia analitică a funcţiei f (.) trebuie prezentată folosind o serie de reguli, pentru evaluarea complexităţii şi pentru compararea de modele. Se identifică următoarele reguli: R1 - modelul se scrie în forma extinsă, fără a se folosi parantezele, de exemplu, modelul: y = (ax + bz + c )( dw + e) , devine y = adxw + bdzw + cdw + aex + bez + ce
R2 - termenii conţin coeficienţii şi mai apar variabile: termenul a 0 x1 a1 x 2 a 2 a3 x3 , devine a 0 a1 a 2 a3 x1 x 2 x3 ; R3 - modelul economic trebuie să fie sub forma y = T1 + T2 + ... + Tm , fie sub forma y = −T1 − T2 − ... − Tm , fie sub forma y = T1 + T2 + ... + Tm − Tm +1 − Tm + 2 − ... − Tm + k , primii fiind termenii care se adună iar ultimii sunt termenii care se scad;
R4 - termenii se dispun în ordinea crescătoare a gradului, de exemplu, modelul iniţial: y = ax + bz 2 + cy + d , devine y = d + ax + cy + bz 2 ; R5 - lungimea unui termen este dată de numărul de operatori; termenii se descompun în ordinea crescătoare după lungime. De exemplu, în modelul: y = xzu + bx 2 + e , termenii au lungimile date în tabelul 9.1. 170
Lungimi termini Tabel 9.1 Termen axzu bx 2 e
Numar operatori 3 2 o
Acest model devine: y = e + bx 2 + axyz R 6 - un termen care conţine numai constante trebuie evaluat sau înlocuit şi lungimea sa devine nulă; de exemplu, produsul coeficienţilor a ⋅ b ⋅ c se înlocuieşte cu A ; modelul y = abx + acdz + mnp devine y = Ax + Bz + C , unde:
A = ab B = acd C = mnp R7 - Expresia care defineşte termenul va conţine mai întâi şirul α operatorului *, apoi şirul operatorului / şi apoi şirul operatorului () şi în ultimul rând operatori f (.) . De exemplu, în tabelul 9.2 sunt prezentaţi termeni în forma iniţială şi în forma normalizată.
Transformarea în formă normalizată a termenilor Tabel 9.2 Termen iniţial x* z /u *v x2 * z *u3 x * e z / u * w2 x / y / z /u *v
Termen normalizat x* z *v /u z * x2 *u3 x / u * w2 * e z x*v/ y / z /u
171
R8 - numele variabilelor se trec în ordine alfabetică în şirul operanzilor cu acelaşi operator; de exemplu, termenul: T = wxusay devine T = asxyw . Fiind dat modelul: y = ax 2 + bz 2 + ct 2 + ds 2 + er 2 + g Matricea asociată termenilor: * / () α f (.) TOTAL
ax 2 1 0 1
bz 2 1 0 1
ct 2 1 0 1
ds 2 1 0 1
er 2 1 0 1
g
0 2
0 2
0 2
0 2
0 2
0 0
0 0 0
Întrucât termenii T1 , T2 , T3 , T4 , T5 au acelaşi nivel de frecvenţă (lungimea secvenţelor) şi aceeaşi operatori, ordonarea lor se face după numele variabilei, grupate după poziţie. Poziţia Variabilei
ax 2 k +5
bz 2 k +6
ct 2 k+2
ds 2 k +1
er 2 k
Se realizează ordonarea descrescătoare, modelul devenind: y = g + er 2 + ds 2 + ct 2 + ax 2 + bz 2 . Folosirea variabilelor în căutarea termenilor conduce la elaborarea unei matrice booleene de forma: ...
Tj
...
Tm
T1
T2
X1
b11
b12
b1 j
b1m
X2
b21
b22
b2 j
b2 m
M Xi
bi1
bi 2
bij
bim
M Xn
bn1
bn 2
bnj
bnm 172
unde: bij
este 1, dacă variabila X i apare în termenul T j şi 0 în caz contrar. Pentru modelul: y = ax + bu + cz + dxu + euz + gxuz + h , matricea B se defineşte astfel:
x u z TOTAL
ax 1 0 0 1
cz 0 0 1 1
bu 0 1 0 1
dxu 1 1 0 2
euz 0 1 1 2
gxuz 1 1 1 3
TOTAL 3 4 3 10
h 0 0 0 0
Matricea A a operatorilor asociată modelului este:
* / () α f (.) TOTAL
ax 1 0 0
bu 1 0 0
cz 1 0 0
dxu 2 0 0
euz 2 0 0
gxuz 3 0 0
h 0 0 0
0 1
0 1
0 1
0 2
0 2
0 3
0 0
Ordonând crescător după numărul operanzilor, matricea A devine:
* / () α f (.) TOTAL
h 0 0 0
ax 1 0 0
bu 1 0 0
cz 1 0 0
dxu 2 0 0
euz 2 0 0
gxuz 3 0 0
0 0
0 1
0 1
0 1
0 2
0 2
0 3
Termenii cu aceeaşi structură de operatori, se dispun în ordinea variabilelor: şirul: ax + bu + cz devine: bu + ax + cz ; şirul: dxu + euz devine dux + euz iar termenul gxuz devine guxz . 173
Pornind de la matricea B se obţine matricea B ' transformată, care este:
ax 0 1 0
bu 1 0 0
u x z
cz 0 0 1
guxz 1 1 1
euz 1 0 1
dux 1 1 0
Matricea A transformată cu considerarea poziţiei variabilelor devine A' , cu următorul conţinut: * / () α f (.) TOTAL
h 0 0 0
bu 1 0 0
ax 1 0 0
cz 1 0 0
dux 2 0 0
euz 2 0 0
guxz 3 0 0
0 0
0 1
0 1
0 1
0 2
0 2
0 3
Matricele A' şi B ' , se utilizează pentru compararea modelelor şi pentru identificarea modelelor cu structuri identice. Se consideră modelele: M 1 : y = ax 2 + bz 3 + ce t şi
M 2 : y = me x + hs 2 + ct 3 Se construiesc matricele A şi B pentru modelul M 1 : * / () α f (.) TOTAL
x z t
ax 2 1 0 1
bz 3 1 0 1
ce t 1 0 0
0
0
1
2
2 ax 2 1 0 0
2 bz 3 0 1 0
ce t 0 0 1
174
t x z
* / () α f (.)
Se construieşte matricea B ' , ţinând seama de ordinea variabilelor: ce t ax 2 bz 3 1 0 0 0 1 0 0 0 1 Se construieşte matricea A' a modelului: ce t ax 2 1 1 0 0 0 1 1
0
bz 3 1 0 1
0
Modelul M 1 devine: M 1 ' : y = ce t + ax 2 + bz 3 . Pentru modelul M 2 se construiesc matricele A şi B . * / () α f (.) TOTAL
x s t
me x 1 0 0
hs 2 1 0 1
ct 3 1 0 1
1 2
0 2
0 2
me x 1 0 0
hs 2 0 1 0
ct 3 0 0 1
Matricele B ' şi A' sunt:
s t x
hs 2 1 0 0 me x
ct 3 0 1 0 hs 2
me x 0 0 1 ct 3
175
* / () α f (.)
1 0 0
1 0 1
1 0 1
1
0
0
R10 - Matricea A rămâne neschimbată pentru că dispunerea termenilor se face mai întâi începând cu termenii ce conţin funcţie, apoi cei ce conţin puteri, în ordine crescătoare, apoi cei ce conţin produse.
M 2 ' = M 2 , y = me x + hs 2 + ct 3 . Datorită
faptului
că
matricea
B' ( M 1 ) = B' ( M 2 )
şi
A' ( M 1 ) = A' ( M 2 ) , modelele au aceeaşi structură. Analiza cantitativă, folosind diferite matrice asociate modelelor, permite obţinerea informaţiilor necesare stabilirii măsurii în care modelele sunt sau nu cu aceeaşi structură sau aparţin aceleiaşi clase. Aplicând aceste reguli, modelul economic devine uşor analizabil şi de comparat. Unui model de forma: y = T1 + T2 + ... + Tm , i se asociază matricea booleană A , ai cărei termeni
a ij
conţin frecvenţa de apariţie a operatorului de pe linia i pentru
termenul T j .
T1
T2
...
Tm
* / () α f (.) 2 z w Modelului y = axzw + b /( x) + ce + de ⋅ sin( x) ,
* / () α
T1 3 0 0
T2 0 1 1
T3 1 0 0
T4 2 0 0 176
T1 0 0
f (.) sin(.)
T2 0 0
T3 1 0
T4 1 1
Liniile şi coloanele matricei sunt comutative. Se ordonează liniile şi coloanele în aşa fel încât să se obţină sume de frecvenţe pe linii şi pe coloane care îndeplinesc o anumită condiţie. Astfel, pentru matricea frecvenţelor:
* / () α f (.) Total
T1 2 0 1
T2 1 1 0
T3 1 0 0
T4 3 2 1
Total
1 4
0 2
0 1
3 9
4 16
7 3 2
Dacă se ordonează coloanele crescător după frecvenţe, se obţine matricea de dispunere a termenilor:
* / () α f (.) Total
T3 1 0 0
T2 1 1 0
T1 2 0 1
T4 3 2 1
Total
0 1
0 2
1 4
3 9
4 16
7 3 2
Modelul cu forma iniţială: y = T1 + T2 + T3 + T4 devine: y = T3 + T2 + T1 + T4 . Reprezentarea tuturor regulilor conduce la obţinerea unei forme normale unice absolut comparabile, fără ambiguitate.
M 1 : y = ax + bx 2 + cx 3 z + dx 4 z 2 177
* / () α f (.) Total
x z
ax 1 0 0
bx 2 1 0 1
cx 3 z 2 0 1
dx 4 z 2 2 0 2
0 1
0 2
0 3
0 4
bx 2 1 0
ax 1 0
cx 3 z 1 1
dx 4 z 2 1 1
2 3 4 2 Modelul M 2 : y = aw + bw + cw u + dw u
* / () α f (.) Total
w u
aw 1 0
aw 1 0 0
bw 2 1 0 1
cw 3 u 2 0 1
dw 4 u 2 2 0 2
0 1
0 2
0 3
0 4
bw 2 1 0
cw 3 u 1 1
dw 4 u 2 1 1
Comparând matricele, rezultă că modelele au aceeaşi structură. Dacă matricea B nu mai este de tip Boolean, şi include gradul pe care îl are variabila în termenul în care apare, informaţia este mai riguroasă la analizele modelului. Pentru modelul M 1 :
x z
bx 2 2 0
cx 3 z 3 1
dx 4 z 2 4 2
Pentru modelul M 2 : aw bw 2
cw 3 u
dw 4 u 2
ax 1 0
178
w u
1 0
2 0
3 1
4 2
9.4 Proceduri pentru analiza expresiilor Pentru analiza expresiilor se prodcedează la transformare folosind regulile scrierii poloneze inverse sau obţinerii formei postfixate. Regulile pentru obţinerea formei postfixate sunt date în manualele de compilatoare. Fiind dată expresia:
a = b + c * d + e , scrierea postfixată a expresiei este: abcd * e + + = . Pentru evaluarea expresiei: a = b + c + d + e , scrierea postfixată conduce la expresia: abcde + ++ = . Pentru expresia e = a + b − c + d − f , eabcdf + − + − = . Pentru expresia eab * cd * g + + = .
forma
postfixată
este
e = a * b + c * d + g , expresia postfixată este
Se construiesc expresii postfixate inclusiv pentru expresii în care apar operatori de comparare şi cuvinte cheie ale instrucţiunilor care sunt trataţi, de asemenea, ca operatori. Se consideră modelele:
M1 : y = a * x + b M2: y = a* x + b* z + c M3: y = a * z + b* w + c
M4: y = a* z + b Pentru aceste modele se construiesc expresiile postfixate, după cum urmează:
M 1 : yax * b + = M 2 : yax * bz * c + + = 179
M 3 : yaz * bw * c + + =
M 4 : yaz * b + = Se construiesc matricele în care coloanele indică poziţia operatorului sau operandului în expresia postfixată, iar liniile enumeră operanzii şi operatorii. Matricea A1 asociată formei postfixate a modelului M 1 este: y a x * b + =
1 1 0 0 0 0 0 0
2 0 1 0 0 0 0 0
Matricea A4 asociată modelului 1 2 y 1 0 a 0 1 0 0 z * 0 0 0 0 b + 0 0 = 0 0
3 0 0 1 0 0 0 0
4 0 0 0 1 0 0 0
5 0 0 0 0 1 0 0
6 0 0 0 0 0 1 0
7 0 0 0 0 0 0 1
M 4 , dat în forma postfixată este: 3 0 0 1 0 0 0 0
4 0 0 0 1 0 0 0
5 0 0 0 0 1 0 0
6 0 0 0 0 0 1 0
7 0 0 0 0 0 0 1
Matricele A1 şi A4 au acelaşi ordin şi sunt egale, înseamnă că modelele M 1 şi M 4 au structură identică. Dacă estimarea coeficienţilor pentru modelul M 1 a fost efectuată cu o procedură P(), aceeaşi procedură va fi utilizată şi pentru estimarea coeficienţilor modelului M 4 .
180
Pentru modelul M 2 se construieşte matricea A2 a poziţiilor, având conţinutul: 5 0 0 0 0 1 0 0 0 0
6 0 0 0 0 0 1 0 0 0
7 0 0 0 0 0 0 1 0 0
8 0 0 0 0 0 0 0 0 0
9 0 0 0 0 0 0 0 1 0
10 0 0 0 0 0 0 0 1 0
11 0 0 0 0 0 0 0 0 1
Matricea A3 pentru modelul M 3 : 1 2 3 4 5 y 1 0 0 0 0 a 0 1 0 0 0 0 0 1 0 0 z 0 0 0 1 0 b w 0 0 0 0 1 c 0 0 0 0 0 * 0 0 0 1 0 + 0 0 0 0 0 = 0 0 0 0 0
6 0 0 0 0 0 1 0 0 0
7 0 0 0 0 0 0 1 0 0
8 0 0 0 0 0 0 0 0 0
9 0 0 0 0 0 0 0 1 0
10 0 0 0 0 0 0 0 1 0
11 0 0 0 0 0 0 0 0 1
y
a x b z c * + =
1 1 0 0 0 0 0 0 0 0
2 0 1 0 0 0 0 0 0 0
3 0 0 1 0 0 0 0 0 0
4 0 0 0 1 0 0 1 0 0
Comparând valorile rezultă că modelele au aceeaşi structură. În acelaşi fel se compară şi alte modele, rezultând din aproape în aproape care sunt modelele identice ca structură.
181
9.5 Proceduri pentru selecţia modelelor Se consideră o listă de modele economice formată din elementele M1, M2, ..,Mn descrise prin: • nume unic de identificare asociat fiecărui model; • număr de variabile; • număr de operator; • listă de operatori; • formă analitică. Dacă un utilizator îşi defineşte o problemă de modelare şi dispune de un număr k de serii de date, din lista de modele, se extrag numai modelele care operează cu cel mult k variabile. Pentru aceste modele se procedează la estimare de coeficienţi şi la calculul sumelor pătratelor de diferenţe. Se ordonează modelele crescător după criteriul de performanţă considerat şi sunt reţinute pentru a fi folosite de către utilizator numai acele modele pentru care nivelul de performanţă respectă o condiţie impusă de acesta. În cazul în care utilizatorul, în urma analizei, stabileşte restricţii asupra operatorilor se va produce selecţia din lista de modele şi după acest criteriu. De exemplu, utilizatorul dispune de 4 serii de date şi operatorii din listă sunt adunare şi înmulţire. Se presupune că din lista de modele se extrag componentele M15, M81, M300 şi M422 care operează cu 3 variabile exogene iar în model acestea sunt legate cu operatorii de adunare şi înmulţire. Pentru modelele M15, M81, M300 şi M422 se estimează coeficienţii, se calculează sumele pătratelor de diferenţe şi se alege modelul M300 pentru care suma este minimă. Există 3 criterii de selecţie a modelelor: • cel mai bun model, corespunde minimului sumei pătratelor de diferenţe; se extrage modelul care corespunde primului element din şirul sumelor pătratelor de diferenţe ordonat crescător; • primele s modele rezultând din extragerea primelor s componente ale şirului format din sumele pătratelor de difernţe ordonat crescător; • modelele pentru care sumele pătratelor de diferenţe sunt mai mici decât o valoare specificată de utilizator. 182
Utilizatorul are la dispoziţie o opţiune pentru selecţia criteriului.
9.6 Proceduri pentru operare pe seturi de date Procedurile pentru operare pe seturi de date vizează realizarea următoarelor: • preluarea seturilor de date; • omogenizarea seriilor de date prin interpolare, extrapolare şi prin transformări elementare; • concatenarea seturilor obţinând seturi de date cu un număr sporit de serii de date; • extensia seturilor de date pentru a obţine serii cu un număr mai mare de termeni; • asigurarea comprehensibilităţii datelor prin aplicarea de coeficienţi de transformare termenilor; • agregarea seturilor de date pentru obţinerea de indicatori noi. Datele de intrare conţin: • numărul seriilor de date; • lungimile seriilor de date; • tipologiile de prelucrări. Rezultatele obţinute se concretizează în: • noile serii de date; • lungimile noilor serii de date; • destinaţiile de stocare a seriilor; • informaţii privind calitatea procesului de operare.
9.7 Proceduri pentru generarea de date de test Procedurile pentru generarea de date de test au menirea de a pregăti date de intrare care să fie utilizate pentru studierea modelelor. Există numeroase situaţii în care structurile de date existente sunt incomplete, deşi 183
sunt cunoscute tendinţele de evoluţie a fenomenelor şi limite de variaţie a nivelurilor variabilelor asociate. De asemenea, lungimile seriilor de date existente, la un moment dat, sunt insuficiente pentru a produce estimări de calitate. Pentru a pregăti un model economic, trebuie generate seturi de date şi studiate proprietăţile modelului folosind seturile de date generate. Se simulează în acest fel comportamentul modelului. Se utilizează proceduri pentru generarea de numere pseudoaleatoare, care urmează diferite legi de distribuţie. Date de intare ale procedurilor pentru generarea seturilor de date sunt: • numărul de serii de date ce trebuie generate; • lungimile seriilor de date de generat; • legile de repartiţie pe care trebuie să le urmeze numerele pseudoaleatoare generate, direcţiile de urmat (oarecare, crescătoare, descrescătoare); • limitele intervalului pe care se efectuează generarea. Rezultatele obţinute vizează: • seriile de date generate; • suportul de stocare a datelor şi referinţelor; • modul în care a decurs procesul. De exemplu, dacă se doreşte generarea unei serii de date S , formată din n termeni x1 , x 2 ,..., x n , cu xi ∈ [ A, B ] şi x1 < x 2 < ... < x n , o procedură care realizează o astfel de cerinţă include: • mecanismul de alegere a secvenţei de instrucţiuni pentru generarea numerelor pseudoaleatoare ce urmează legea de distribuţie pentru seria S ; • stabilirea raţiei r , cu care se construieşte setul intervalelor [ai , bi ] , în care se generează seria de numere
184
pseudoaleatoare unde: [a1 , b1 ] = [ A, A + r ]
[a 2 , b2 ] = [ A + r , A + 2r ] …………………….. [a n , bn ] = [ A + (n − 1)r , B] B−A r= B = A + ( n − 1 ) r n − 1 , bi = ai + r rezultă , • referirea secvenţei de generare de numere pseudoaleatoare pe
intervalul [ai , bi ] pentru obţinerea valorii α i ; • repetarea procesului de generare cu obţinerea şirului α 1 , α 2 ,..., α n ; • repetarea procesului pentru obţinerea de seturi de date; Există posibilitatea generării de seturi de date în care: • toate seturile de date au tendinţă crescătoare; • toate seturile de date au tendinţă descrescătoare; • unele seturi de date au tendinţă crescătoare iar altele au tendinţă descrescătoare;; • tendinţele crescătoare sau descrescătoare se manifestă pe subintervale pentru toate seriile de date. Seturile de date se constituie în manifestări simulate ale unor ipoteze de lucru privind evoluţia unui proces economic. Modelul va fi testat pe seturile de date generate şi se va vedea comportamentul în diferitele ipoteze.
9.8 Proceduri pentru calculul valorilor Procedurile pentru calculul valorilor preiau modele, coeficienţi estimaţi şi seturi de date ale variabilelor exogene şi calculează termenii simulărilor, yˆ i1 , yˆ i 2 ,..., yˆ in , i = 1,2,..., m pentru modelele M 1 , M 2 ,..., M m .
185
9.9 Proceduri pentru selecţia de modele Procedurile pentru selecţia de modele se folosesc în condiţiile în care există: • seria de date conţinând valorile înregistrate ale unei variabile rezultative; • seriile de date cu date estimate ale variabilei rezultative obţinute prin utilizarea modelelor din baza de modele; • procese de asigurare a compatibilităţii tuturor seriilor de date. Se defineşte un algoritm de selectare din mulţimea modelelor a acelora care aparţin unui subinterval de omogenitate de lungime specificată. De exemplu, folosind datele din tabelul 9.3, se calculează sumele S12 , S 22 ,..., S m2
. Valori reale şi estimate ale variabilei rezultative Tabel 9.3 Niveluri estimate cu modelele Mj Mm M 2 ... ... yˆ j1 yˆ m1 yˆ 21
Nivel efectiv
M1
T1
y1
yˆ11
T2 M Ti
y2
yˆ 12
yi
yˆ1i
M Tn
yn
yˆ 1n
yˆ 2 n
yˆ jn
yˆ mn
Suma pătratelor diferenţelor
S12
S 22
S 32
S 2j
S m2
Moment
yˆ 22
yˆ 2i
....
yˆ j 2
yˆ ji
...
yˆ m 2
yˆ mi
unde: n
S 2j = ∑ ( yˆ ij − y i ) i =1
.
Se ordonează crescător şirul de sume de pătrate de diferenţe, obţinându-se un clasament al modelelor din care se reţin numai primele
186
k sume,
rezultând care sunt primele k modele cu care se vor efectua în continuare analize econometrice. De exemplu, dacă pentru pentru modelele M 1 , M 2 , M 3 , M 4 , M 5 , M 6 , M 7 , M 8 , M 9, M 10
destinate studiului productivităţii muncii în diferite ipoteze de lucru se obţin sumele de pătrate de diferenţe din tabelul 9.4: Sume de pătrate de diferenţe pentru modele Tabel 9.4
După
Modelul
S i2
M1
4000
M2
2000
M3
3500
M4
11000
M5
6000
M6
5500
M7
4500
M8
8000
M9
7000
M 10
2500
ordonarea
după
M 2 , M 10 , M 3 , M 1 , M 7 , M 6 , M 5 , M 9 , M 8, M 4 .
valoarea
S i2 ,
se
obţine
În ipoteza reţinerii primelor trei
modele, rezultă că modelele M 2 , M 10 , M 3 vor fi utilizate în continuare pentru studiul productivităţii muncii. În analiza calităţii modelelor se definesc numeroase criterii. Prezintă interes analiza subşirurilor de modele rezultate prin aplicarea simultană a cât mai multor criterii. Dacă intersecţia subşirurilor este nevidă, rezultă existenţa unor modele eficiente în raport cu toate criteriile de selecţie, aspect deosebit de important pentru toţi cei care dezvoltă analize economice folosind modele. 187
10. SISTEM DE GESTIUNE A BAZELOR DE MODELE 10.1 Funcţiile bazei de modele Baza de modele este implementată într-o concepţie care să permită accesul unui număr cât mai mare de utilizatori. În acest scop, sunt utilizate resursele internetului. Se defineşte o interfaţă care permite parcurgerea din aproape în aproape a tuturor paşilor, de la definirea unei probleme până la obţinerea estimărilor pentru structuri de modele considerate eficiente. În ipoteze de lucru selectate se simulează evoluţii probabile ale variabilelor endogene. Sistemul de gestiune al bazei de modele include următoarele tipuri de funcţii: - funcţii pentru preluarea datelor furnizate de utilizator; - funcţii pentru selecţia de opţiuni cu rolul de a configura schema de prelucrare; - funcţii de prelucrare; - funcţii de definire şi generare a modelelor; - funcţii de rafinare / optimizare; - funcţii de prognoză; - funcţii de gestiune a seturilor de date iniţiale şi a rezultatelor.
10.2 Arhitectura Definirea unei arhitecturi presupune, pe de o parte identificarea resurselor necesare utilizării curente a produsului şi, pe de altă parte stabilirea componentelor care alcătuiesc produsul şi legăturile dintre acestea.
188
Baza de modele este implementată folosind: - programe C# destinate pentru: generarea de modele, estimare de coeficienţi, preluare de serii de date, analiza complexităţii modelelor, analiza ortogonalităţii modelelor, validări de date, gestiunea redundanţei seriilor de date; - programe C# pentru tratarea interacţiunilor dintre utilizatori şi produs; - componente C# pentru tratarea interacţiunilor dintre programele de prelucrare, în funcţie de opţiunile selectate - componente C# pentru ierarhizarea utilizatorilor printr-un sistem de drepturi de acces organizat pe trei niveluri; - programe pentru accesarea unor servicii internet specifice: poştă electronică, transfer de fişiere. Filozofia definirii acestei arhitecturi are la bază obţinerea unui produs deschis, la care se ataşează noi componente atât sub formă de software cât şi sub formă de structuri de seturi de date. Baza de modele este o construcţie complexă care trebuie să îndeplinească o serie de cerinţe de ordin funcţional: ¾ să ofere utilizatorilor instrumente necesare prin intermediul unei interfeţe accesibile; ¾ să fie accesibilă unui număr mare de utilizatori; ¾ să perimită conectarea la surse de date eterogene ca natură şi distribuite în reţea sau în internet. Se separă astfel trei niveluri pe care se structurează această construcţie complexă aşa cum este prezentat în figura 10.1.
189
Interfaţa (instrument
sistemul de gestiune al
Surse de date
MsSql
MySql
Oracle
Access
altele..
Figura 10.1 Arhitectura pe straturi a bazei de modele La nivelul interfeţei se regăsesc elemente specifice pentru controlul aplicaţiei. Aceasta este prietenoasă în sensul că permite accesul uşor la funcţiile aplicaţiei, este intuitivă, îndeplineşte condiţii de lizibilitate şi ergonomie. Cerinţa de largă accesibilitate este satisfăcută dacă utilizatorii au acces prin internet prin intermediul unui browser care să afişeze sistemul de meniuri, controalele şi formularele aplicţiei. Prin tehnologia de livrare a paginilor web dinamice capacitatăţile de prelucrare şi personalizare cresc. Ia naştere o construcţie de tip aplicaţie web, care este scheletul bazei de modele, ale cărei extensii sunt funcţionalităţile apelate ale serviciilor web. La nivelul sistemului de gestiune al bazei de modele se regăsesc modulele care au ca obiectiv: ¾ managementul utilizatorilor şi drepturile de acces; ¾ gestiunea surselor de date de diferite tipuri care conţin seturi de date; aceasta presupune protocoale şi interfeţe specifice pentru fiecare SGBD în parte; ¾ gestiunea modelelor care presupune stocarea, regăsirea, actualizarea acestora; ¾ generarea de modele; ¾ prelucrarea propriu-zisă a datelor. 190
Modelul ales pentru construirea acestei părţi este cel al serviciilor web care comunică. Sursele de date sunt servere de baze de date sau fişiere de date care oferă posibilităţi diferite de conectare, de acces la date şi de prelucrare. O arie largă de cuprindere care să permită accesul la un număr cât mai mare de surse de date eterogene şi chiar constituirea de seturi de date din surse eterogene prin operaţii de concatenare, constituie o condiţie esenţială pentru ca baza de modele să fie o construcţie cu un grad mare de generalitate.
10.3 Reprezentarea internă a modelelor Baza de modele pune la dispoziţia utilizatorilor posibilitatea de a defini, stoca şi referi modele. Se pune problema reprezentării interne a acestora într-un mod flexibil care să satisfacă cerinţele enunţate. Aşa cum s-a enunţat în capitolul Construirea modelelor, un model economic este alcătuit dintr-o mulţime de entităţi matematice: variabile, coeficienţi, constante, operatori, funcţii elementare sau definite de utilizator etc. Această diversitate de elemente grupate într-un model are semnificaţie pentru utilizator. De exemplu, la momentul definirii modelului, folosind un instrument de editare a ecuaţiilor inclus în baza de modele se trece de la forma vizibilă, grafică, matematică, la o reprezentare internă care, în baza unor reguli stricte, permite ca aceasta să fie interpretată de aplicaţie. Consorţiul World Wide Web a emis o recomandare pentru descrierea notaţiilor din matematică sub forma limbajului de descriere MathML, aplicaţie a metalimbajului XML. Scopul pentru care a fost creat MathML este separarea conţinutului notaţiilor matematice de forma de prezentare. Dintre avantajele utilizarii MathML pentru reprezentarea modelelor se pot enumera: ¾ codificarea elementelor matematice într-un mod simplu şi eficient; ¾ reprezentarea atât a sintaxei matematice cât şi a semanticii; ¾ independenţa modalităţii de reprezentare de suportul de afişare, de sistemul de operare şi de alte restricţii date de platformă; 191
¾ utilizare facilă în vederea prelucrării şi editării. MathML defineşte o serie de marcatori pentru delimitarea diferitelor elemente dintr-o expresie matematică. De exemplu, pentru modelul: y = ax 2 + bu + c forma corespunzătoare MathML este: <mrow rel="nofollow"> <mi>y <mo>= <mrow> <mi>a <mo>* <msup> <mi>x <mn>2 <mo>+ <mi>b <mo>* <mi>u <mo>* <mi>c Semnificaţia construcţiilor de mai sus este: ¾ <mrow>… delimitează un bloc precum un termen sau o înşiruire de termeni separaţi de operatori; ¾ <mi>… delimitează un identificator precum un nume de variabilă sau de constantă; ¾ <mo>… delimitează un operator; ¾ <msup>… delimitează o construcţie de genul bază – exponent în care primul marcator este baza, iar al doilea exponentul; ¾ <mn>… delimitează o constantă numerică. 192
Marcatorii prezentaţi aparţin mulţimii de marcatori de prezentare folosiţi de MathML. Există şi posibilitatea reprezentării prin elemente de conţinut. De data aceata, marcatorii realizează construcţii asemănătoare limbajelor declarative, reprezentarea fiind în formă poloneză. Este mai simplu de prelucrat o astfel de formă, fiind utilă pentru interpretarea facilă a expresiilor specificate de utilizator la definirea modelului. <eq/>
y a <power/> x 2 b u c Marcatorii folosiţi la conţinut se aseamănă cu cei de la prezentare, diferenţe apărând la operatori şi funcţii care au nevoie de specificarea în formă poloneză a operanzilor, respectiv a argumentelor: ¾
… delimitează un identificator precum un nume de variabilă sau de constantă corespunzând <mi>, respectiv ; ¾
… delimitează aplicarea unui operator sau a unei funcţii; 193
¾
,
, <power/> desemnează un operator care, împreună cu operanzii care îl urmează, formează o construcţie în formă poloneză. De remarcat că pentru a defini un model este necesar ca baza de modele să implementeze: ¾ un editor grafic care să preia expresiile introduse de utilizator întro formă accesibilă acestuia şi să le transforme în reprezentarea MathML; ¾ un set de reguli care să acţioneze ca restricţii de limbaj pentru utilizator şi care să fie cunoscute acestuia. De exemplu, forme fixe pentru atribuire, referire de nume de variabile; ¾ un interpretor care să analizeze construcţia MathML şi care să verifice corectitudinea semantică a acesteia prin prisma regulilor definite a priori şi care să evalueze numeric expresiile; ¾ un mediu de afişare a modelului care este acelaşi sau independent de mediul de definire. Efortul de realizare a componentelor de editare – afişare revine în mai mare măsură celor care se ocupă cu dezvoltarea acestui limbaj de marcare care oferă instrumente în acest sens, în timp ce, la o aplicaţie specifică, cum este baza de modele economice, efortul de prelucrare a documentului, revine dezvoltatorilor acesteia. Stocarea unui model, în formă MathML, în baza de modele, precum şi regăsirea acestuia nu ridică probleme. Fişierele de acest tip circulă foarte uşor şi în internet, formatul fiind o intrare potrivită pentru aplicaţii din categoria serviciilor web. 10.4 Interfaţa Întreaga concepţie a sistemului de gestiune pentru baza de modele este fundamentată pe cunoaşterea grupului ţintă. Grupul ţintă este format din specialişti care activează în domeniul economiei reale, în domeniul cercetării economice şi în învăţământul economic. 194
Toţi utilizatorii bazei de modele au un limbaj de specialitate unanim acceptat, posedă o experienţă în utilizarea de produse software pentru modelare, pentru prognoză, pentru evaluări, pentru estimări şi pentru optimizări. Pentru a asigura continuitatea proceselor de utilizare a calculatorului în soluţionarea de probleme economice, s-a avut în vedere studierea limbajului utilizat de fiecare produs existent, cuvintele cheie care definesc operaţii pe care utilizatorii le activează. Trecerea la utilizarea bazei de modele include cuvinte cheie utilizate deja în produsele software, ceea ce asigură deja familiarizarea utilizatorilor, aceştia regăsind funcţii de prelucrare cu care sunt deja familiarizaţi. Interfaţa sistemului de gestiune a bazei de modele constă într-o abordare gradată, care mai întâi defineşte pe utilizator şi atribuie acestuia elemente de identificare în vederea realizării unui acces continuu la resursele bazei de modele precum şi la resursele proprii care constau în seturi de date iniţiale proprii, seturi de rezultate ale proceselor de estimare, care devin proprii şi reutilizabile, precum şi accesul la structuri de modele construite sau obţinute în procesul de rafinare, care, de asemenea, devin proprii. Menţinearea în actualitate a bazei de modele este un proces complex de mentenanţă software, de mentenanţă seturi de date, de mentenanţă structuri de modele. Interfaţa include o componentă distinctă de administrare a bazei de modele, care permite: - modificarea sistemului de atribuire a accesului la resurse; - menţinerea nivelului de redundanţă a seturilor de date între limite stabilite prin activarea unei componente care elimină seriile identice şi care recompune seriile parţiale care au numai anumite secvenţe comune; - introduce noi proceduri de estimare a coeficienţilor modelelor; - adaugă generatoare pentru noi clase de modele; - extinde funcţionalitatea bazei de modele prin noi servicii; - asigură creşterea fiabilităţii sistemului prin preluarea de mesaje privind erori şi prin eliminarea acestora; - creşte gradul de apropiere a utilizatorilor de produs prin introducerea de elemente specifice limbajului natural. 195
10.5 Asigurarea caracterului deschis Baza de modele economice este o construcţie complexă şi perfectibilă. De aceea este necesar să i se asigure caracterul deschis încă din faza de proiectare. Caracterul deschis se obţine pe trei niveluri: - primul nivel corespunde definirii de opţiuni prin care utilizatorii introduc seturi de date proprii, definesc structuri proprii de modele, construiesc ipoteze privind evoluţia variabilelor exogene, de asemenea, proprii; - al doilea nivel corespunde încorporării de modele ale utilizatorilor dacă aceste modele au o frecvenţă de referire foarte mare; includerea de programe care diversifică funcţiile de prelucrare existente; adăugarea de noi funcţii de prelucrare, funcţii a căror necesitate decurge din aprofundarea cunoaşterii grupului ţintă; - al treilea nivel se referă la procedurile specifice administrării sistemului de gestiune a bazei de modele.
10.6 Rezultatele testării Obţinerea unui produs operaţional, având un nivel de complexitate deosebit de ridicat, presupune abordarea gradată a proceselor de proiectare, de realizare şi de implementare. Proiectarea bazei de modele conduce la o structură ce include o arborescenţă, fiind detaliată o ramură în figura 11.2.
196
Baza de modele
Definire modele
…… …..
Generatoare de modele
Generator de modele liniare
Generator de modele liniare cu argument întarziat
Clase pentru lucrul cu matrice
Generare combinaţii de factori de influenţă
…… …..
Gestiune seturi de date
Generator de modele neliniare
Generare de întârzieri
......... .
Figura 10.2 Ramură ce detaliază o structură a bazei de modele Fiecărui bloc de pe ultimul nivel îi corespund construcţii bine definite din punct de vedere al rolului, intrărilor, ieşirilor şi al interdependenţelor de adiacenţă. Testarea se realizează pe niveluri astfel: - testarea componentei folosind seturi de date de intrare şi având ca obiectiv verificarea completitudinii şi corectitudinii prelucrărilor; - testarea unui lanţ finit de componente în vederea obţinerii de informaţii asupra modului în care interfaţa, sistemul de administrare, ansamblul prelucrărilor răspund unor criterii impuse; - testarea întregii construcţii mai întîi la nivelul echipei de realizare şi după aceea folosind un eşantion de utilizatori cu asigurarea unui 197
sistem de comunicare care permite eliminarea tuturor disfuncţionalităţilor şi care conduc spre un produs destinat implementării în regim online. Se acordă o importanţă specială testării componentelor care efectuează estimările coeficienţilor pentru modele. De exemplu, procedura pentru estimarea coeficienţilor ecuaţiei de regresie prelucrează variabilele: N – lungimea seriilor de date mX - matricea variabilelor exogene mY - matricea variabilelor endogene m – numărul variabilelor exogene Se porneşte de la ideea că lungimea seriilor de date trebuie să fie mai mare de 10 componente pentru a obţine estimări cu caracter operaţional. Testarea variabilei N vizează senzitivitatea procedurii de a evidenţia neapartenenţa la intervalul [10,1000]. Testarea neapartenenţei se obţine prin introducerea de valori mai mici ca 10 şi prin introducerea de valori mai mari ca 1000. Se afisează un mesaj specific neaparteneţei şi se reia solicitarea de a introduce lungimea seriei de date. Aplicaţia este proiectată astfel încât M să aparţină mulţimii {1,2,..,64}. Testele vizează introducerea de valori în afara mulţimii, afişarea mesajelor de eroare şi reluarea solicitării de introducere a numărului de variabile exogene. Utilizatorul bazei de modele trebuie să specifice intervalele de variaţie ale variabilelor modelului, indicând limita inferioară Linf şi limita superioară Lsup . La iniţializarea seriilor de date se testează apartenenţa variabilei Xij la interval [Linf;Lsup]. Neapartenenţa la interval este însoţită de solicitarea de a reintroduce valoarea până când aceasta este corectă. Algoritmul pentru estimarea coeficienţilor necesită ca datele să fie corecte şi complete. Secvenţa de program pentru validarea a apartenenţei la un interval [lim_inf; lim_sup] este dată în figura 10.3:
198
private int validare(int lim_inf,int lim_sup,int valoare) { if (valoare
lim_sup) return 1; //daca valoarea este mai mare decat limita superioara return 0; //daca valoarea apartine intervalului } Figura 10.3 Text sursă pentru testarea apartenenţei la interval Validarea procedurilor de estimare este un proces complex care necesită parcurgerea tuturor treptelor de testare. Se consideră modele cu coeficienţii daţi. Pentru niveluri date, de asemenea, ale variabilelor exogene se calculează folosind coeficienţii daţi niveluri ale variabilei endogene. Datele asociate variabilelor exogene împreună cu seria de date calculată se introduc în procedura de estimare a coeficienţilor. Se obţin coeficienţii estimaţi şi se compară cu coeficienţii daţi ai modelului. În cazul în care apar diferenţe, înseamnă că procedura de estimare conţine o serie de erori care trebuie înlăturate. De exemplu, se consideră modelul: Y=7*X+5*Z+22 Pentru datele din tabelul 10.1, se obţine prin evaluarea expresiei 7*X+5*Z+22, coloana corespunzătoare variabilei y.
199
Variabile exogene X şi Z şi variabila calculată Y X
Z
21 27 30 4 15 26 7 8 39 10 11 12 13 14 15
50 48 46 30 25 5 32 18 4 29 44 11 5 33 14
Tabel 10.1 Y=7*X+5*Z+22 419 451 462 200 252 229 231 168 315 237 319 161 138 285 197
Prin testare pe acest exemplu de control se obţin coeficienţii estimaţi Coef[0]=22,Coef[1]=7 şi Coef[2]=5. În acelaşi fel se procedează şi în cazul celorlalte modele. Dacă în literatură sunt identificate serii de date, coeficienţi estimaţi şi structuri de modele, se procedează la completarea în specificaţiile procedurii aceste exemple pentru a fi utilizate, pe de o parte, seriile de date ca intrări, pe de altă parte coeficienţii preluaţi din surse bibliografice, în vederea comparării cu coeficienţii obţinuţi prin procedură. Dacă sursele bibliografice sunt credibile, diferenţele dintre coeficienţii preluaţi din literatură şi coeficienţii obţinuţi din calculele procedurii impun revederea algoritmilor, identificarea erorilor şi eliminarea lor. 10.7 Tipologii de mesaje Întrucât aplicaţia este gândită pentru lucrul online, fiecare utilizator îşi defineşte un username şi o parolă. Accesul repetat depinde de aceste două elemente. În cazul în care utilizatorul nu este identificat, mesajele care 200
apar sunt comune cu ale celorlalte sisteme existente, asigurând continuitatea. Celelalte mesaje de eroare vizează neapartenenţe, imposibilitatea de a efectua prelucrări precum şi informarea utilizatorului asupra paşilor parcurşi. Alte mesaje vizează liste de opţiuni, mulţimi de modele, mulţimi de seturi de date pe care utilizatorul le selectează în vederea rezolvării problemelor sale. Aplicaţia este proiectată pentru a fi robustă în exploatare, administratorul sistemului de gestiune revenindu-i sarcina de a actualiza proceduri, de a îmbunătăţi structurile mesajelor şi de a reduce distanţa dintre utilizator şi facilităţile produsului.
201
11. STUDII DE CAZ 11.1 Estimarea coeficienţilor unui model ales În baza de modele există o listă de expresii analitice corespunzătoare unei diversităţi de modele. Selecţia modelului se realizează asemenea oricărei opţiuni dintr-un meniu.
Figura 11.1 Controlul pentru selecţia de modele De asemenea, setul de date este selectat dintr-o listă descrisă în figura a.11.2.
Figura 11.2 Lista seturilor de date compatibile cu modelul selectat Când se selectează un model din listă se stabileşte numărul de serii care trebuie să alcătuiască setul de date. 202
Pentru modelul: y = ax + b este necesară o serie de date. Pentru modelul: y = ax + bz + cu + d sunt necesare trei serii de date. Se selectează setul de date. Pentru punerea în corespondenţă a seriilor de date se generează cuvintele "seria 1", "seria 2" ş.a.m.d. sau se folosesc denumirile coloanelor din tabela corespunzătoare, şi lista de variabile.
Figura 11.3 Punerea în corespondenţă serie-variabilă. Se trece la estimarea coeficienţilor modelului făcând click pe butonul "estimare". Se afişează coeficienţii estimaţi şi forma analitică a modelului.
Figura 11.4 Rezultatele procesului de estimare Pentru afişarea seriilor de date y , yˆ
y
şi
yˆ
se selectează butonul "afişare
".
203
+
Figura 11.5 Butonul de afişare a valorilor y şi yˆ . n
S = ∑ ( y i − yˆ i ) 2
i =1 Calculul şi afişarea sumei pătratelor de diferenţe sunt făcute automat. Toate aceste elemente se regrupează încă de la început sub forma unei probleme.
Figura 11.6 Atribuirea de nume problemei Acest tip de probleme este des întâlnit, mai ales, în fazele de instruire a celor care doresc să dezvolte modele economice. 11. 2 Generarea modelelor liniare Se defineşte problema aşa cum a fost prezentat deja. Se definesc caracteristicile setului de date: - numele setului; - numărul seriilor de date; - numărul de termeni.
Se realizează punerea în corespondenţă a variabilelor cu seriile de date. 204
Se introduc datele. Se selectează butonul pentru generarea modelelor liniare. Afişarea modelelor şi a coeficienţilor se realizează grupat selectând butonul de afişare a modelelor generate
Pentru alegerea modelelor celor mai bune se efectuează ordonarea crescătoare după Si a modelelor. Fiecărui model generat i se asociază un nume M 1 , M 2 ,..., M n , nume cu care se referă pentru utilizare. Afişarea estimării. Se selectează modelul şi se afişează valorile tabelare şi valorile estimate ale variabilei rezultative ca în tabelul 11.1. Valori tabelare şi valori estimate corespunzătoare unui set de coeficienţi din lista ordonată Tabel 11.1 Y
Yˆ
223 172 277 35 150 531 509 306 239 154
222.94 171.82 276.59 34.67 151.11 530.64 510.03 304.68 239.98 153.83
11.3 Lucrul cu un model propriu Utilizatorul bazei de modele a construit un model propriu şi doreşte să efectueze analize economice bazate pe rezultatele oferite de acest model. 205
Se defineşte problema.
Se defineşte modelul specificând: - mulţimea variabilelor; - structura modelului; - mulţimea coeficienţilor; - mulţimea operatorilor. Pentru a construi modelul: y = ax 3 + bz 2 + cx / z + d fără a folosi un editor grafic specializat, se procedează astfel: - se selectează coeficientul a ; - se selectează operatorul *; - se selectează variabila x ; - se selectează operatorul *; - se selectează variabila x ; - se selectează operatorul *; - se selectează variabila x ; - se selectează operatorul +; - se selectează coeficientul b ; - se selectează operatorul *; - se selectează variabila z ; - se selectează operatorul *; - se selectează variabila z ; - se selectează operatorul +; - se selectează coeficientul c ; - se selectează operatorul *; - se selectează variabila x ; - se selectează operatorul /; - se selectează variabila z ; - se selectează operatorul +; - se selectează coeficientul d. Acest mod de lucru este specific utilizării interpreterelor. Expresia corespunzătoare va fi: y = a* x* x* x + b* z* z + c* x / z + d 206
Pentru definirea setului de date se specifică: - adresa serverului de baze de date; - numele de utilizator; - parola de acces; - numele setului de date; - numărul de termeni ai seriilor; - se introduc datele. Estimarea şi afişarea coeficienţilor modelului se fac ca la paragraful precedent. Până acum se observă că se lucrează cu modele formate dintr-o singură ecuaţie. 11.4 Efectuarea prognozei Se defineşte o problemă:
Se selectează un model din lista existentă.
Se defineşte structura setului de date şi se introduc datele:
207
Se estimează coeficienţii şi apoi, pentru valori date de utilizator ale variabilelor exogene, folosind coeficienţii estimaţi rezultă şi valorile estimate ale variabilei endogene. Pentru afişarea rezultatelor se procedează ca la tipurile celelalte de aplicaţii.
11.5 Includerea în baza de modele Pentru includerea de modele: - se defineşte problema prin nume - se introduc ecuaţiile modelului şi se memorează; - se defineşte setul de date; - se completează opţiuni pentru model, legate de algoritmii folosiţi, restricţii de dimensiune, nume etc. Efectuând aceşti paşi, la listele cu componente incluse sunt adăugate altele noi. Includerea se efectuează atât pentru modele cât şi pentru date atunci când acestea sunt ortogonale. Concepţia de realizare a bazei de modele ca sistem arborescent triplu deschis permite dezvoltarea progresivă a structurii de module prin: - includerea în interiorul modulului de noi secvenţe, cu creşterea complexităţii acestuia; - asocierea pe acelaşi nivel cu un modul a altor module, obţinându-se o dezvoltare pe orizontală a structurii; - stabilirea de relaţii de descendenţă ale modulului cu module aparţinând nivelului următor, dezvoltare pe verticală a structurii.
208
Anexa 1 Lista de variabile definite şi referite în modele
WGVt G
Semnificaţie - ponderea complexităţii subexpresiei comune modelelor Mi şi Mj - salarii guvernamentale
WS tp
- salariile private
AEi ATRt CAP CCik CDij Ci(M) CODi CONSi COt CQi CU d D(M) Ei ei F fi Fi FISi FSAL GWt Hi hi I
- agentul economic I - tendinţă de evoluţie - capital social - cheltuieli de credit - cheltuieli de debit - complexitate de tip i a modelului M - cod activitate agent economic i - consumul agentului economic i - consumul la momentul t - caracteristica de calitate i - consumul de produse petroliere - rata dobânzii - proces de dezvoltare a modelului - elementul i dintr-o colectivitate - etapă din ciclul de dezvoltare a modelului - momentul final de timp - frecvenţa de apariţie a operandului i - fondul de înlocuire din sectorul i - fişierul i - fondul de salarii - cheltuielilie guvernamentale altele decât salariile - economia naţională i - frecvenţa de apariţie a operatorului de tip i - investiţii pentru calificarea continuă
ρ ij
Nume
209
IC Ierr II INt INV Isat Iw JUD K L Li LIVi m MCt MGi Mi MPi MRA mraij mX mY n n1 n2 Ne NPR nram NRM O(Mk,Mj) OAij OM(Mi,Mj) OR(Ri,Rj) OS(SETi,SETj) PE
- gradul de calificare - indicele de eroare - gradul de înzestrare a locurilor de muncă - investiţiile la momentul t - volum de investiţii - gradul de satisfacţie în utilizarea unui produs software - indicele mediu al evoluţiei productivităţii muncii - judeţ - capital - numărul de muncitori direct productivi - lungimea intervalului pentru caracteristica CQi - livrările agentului i - numărul de factori de influenţă - masa de capital - media aritmetică pentru setul de date i - modelul i - model economic al procesului i - matricea fluxurilor - ieşirea de la ramura RAi către ramura RAj - matricea variabilelor exogene - matricea variabilelor endogene - numărul momentelor de timp - numărul de operanzi - numărul de operatori - număr agenţi economici - număr de proprietari ai unui produs software -numărul de ramuri ale unei economii - număr de muncitori - gradul de ortogonalitate dintre modelele Mk şi Mj - indicatorul agregat de ortogonalitate - ortogonalitatea modelelor - ortogonalitatea rezultatelor Ri,Rj - ortogonalitatea seturilor de date - proces economic 210
PFt pi Pi PIB POi PRi PROBi PROD PROi q qi Qi QT RAi Ri rN RNRM rv rx S S(M) SALi SDi Sem SETi Si SS1 SS2 T t0 TAXt Ti TMRA.j
- profiturile private - ponderea asociată operandului i - denumirea produsului de tip i - produs intern brut - prioritatea operatorului i - preţ unitar din produsul Pi - problema i - producţie - profitul agentului economic i - raţie progresie geometrică - ponderea asociată operatorului i - cantitate de produse Pi - raţia creşterii în progresie geometrică a consumului de ţiţei - ramura i a economiei - rezultatul i - rata de creştere a numărului de muncitori - ritmul de creştere a numărului de muncitori - raţia de ceştere a valorii producţiei - raţia cu care variază variablia x - salariu muncitor - process de simplificare a modelului - salariul muncitorului i - seria de date i - semestru - setul de date i - produsul necesar în sectorul i - indicator de performanţă a modelului - indicator normat de performanţă a modelului - moment de timp - moment iniţial - taxe indirecte pe profit - momentul de timp i -totalul valoric al fuxurilor de intrare ale ramurii Raj 211
TMRAi. TRAM.. TRIM TVA TVAL u v Vi VIN VV VVi vzij w WW x Xi Xij XQt XX Y Yi YYi ZZ
- totalul valoric al fluxurilor de ieşire ale ramurii RAi - valoarea totală a producţiei economiei - trimestru - taxa pe valoare adăugată - total valoare produse - grad utilizare a fondului de timp - vechimea medie a muncitorilor - plusprodusul în sectorul i - volumul total de vânzări - variabila exogenă - valoarea produselor de tip Pi - volumul vânzărilor din ziua i ale magazinului j - productivitatea muncii - variabila exogenă - variabilă exogenă - factorul exogen i - nivelul factorului j la momentul i - cererea la echilibru - variabila exogenă - variabilă exogenă - nivelul variabilei endogene la momentul i - variabila endogenă i - variabila exogenă
212
Anexa 2 Formule de bază •
Media aritmetică n
x=
∑x i =1
i
n
unde: xi – niveluri înregistrate ale unei caracteristici n – numărul de înregistrări •
Media aritmetică ponderată n
x=
∑f i =1
i
⋅ xi
n
∑f
i
i
•
Dispersia r
σ2 =
∑ (x i =1
i
− x)2 fi
r
∑f i =1
•
i
Covarianţa între variabilele X şi Y n
cov( X , Y ) = •
∑ (x i =1
i
− x )( y i − y ) n
Coeficientul de corelaţie cov( X , Y ) ρ XY = σ XσY
213
•
Ecuaţia de regresie liniară simplă Y=a*x+b
unde: Y – variabilă endogenă; A – coeficient estimat; X – variabilă exogenă; B – termen liber.
214
Anexa 3 Lista de acronime şi de proceduri ARMA CMMP CMMP2 MathML STAR www XML
AutoRegressive Moving Average Cele Mai Mici Pătrate Cele Mai Mici Pătrate în 2 paşi Mathematical Markup Language Smooth Transition Arutoregression World wide web Extensible Markup Language
215
Anexa nr. 4 ALBUM DE GRAFICE Albumul cuprinde grafice de funcţii, pentru valorile parametrilor a=2, b=2, c=2, α =2 y = ax + b
funcţia liniară 202
4 00
2 00 f1( x )
0
198 200
100
50
0
100
50
x
1 00
y = ax α + bx + c
funcţia parabolică 1 6 2 .10
1 00
6 4 .10
6 2 .10
0
f2( x )
6 2 .1 0 6 2 .10 4 .1 06
1 00
10 0
50
0 x
50
10 0 10 0
216
funcţia parabolică 2
y = a + bx
15
14.213
10 f3( x ) 5
0
0
50
0
1
50 x
funcţia parabolică 3 5.867
1 00 1 00
y = 3 a + bx
6
4 f5( x ) 2
0
0
50 1
0
50 x
100 100
217
funcţia parabolică 4
y = a + bx 3
1500 . 03 1 .41 41
1000 f4( x ) 5 00
0
0
50
0
50
1
x
parabola lui Neile 2 7.2 3 5
100 100
y = 3 ax α + bx + c
30
20 f6( x ) 10
1 .2 6
0
1 00 100
50
0 x
50
1 00 1 00
218
funcţia putere
y = ax b
4 2 .10 4 2 .10
4 f7( x ) 1 .10
0
0
1 00
50
0
10 0
50
1 00 1 00
x
funcţia exponenţială 1
y = e ax +b
4 1 .10 10 000
f8( x )
0
50 00
0 0
0
2
4 x
5
219
funcţia exponenţială 2
y = ae bx
4 1 .10 10 000
5 000
f9( x )
0
0
0
0
2
4
funcţia exponenţială 3 10 0
6
x
7
y = ab x
1 00
f1 0( x )
50
0
0
0
0
5
10
x
10
220
funcţia exponenţială 4
y = e ax ⋅ x b
4 1 .1 0 10 000
f11( x ) 50 00
1
0
0
x
funcţia logaritmică 2 10
10
5
0
10
y = a ln x
10
f1 2( x )
5
0
0
0 0
50
100
x
100
221
y = a + b ln x
funcţia semilogaritmică 15
15
10 f1 3( x ) 5
2
0
0 0
50
10 0
x
10 0
funcţia log-inversă 60
ln y = a +
b x
60
40
f14( x ) 20
1
0
0
0
5
10
x
15
20
20
222
Anexa 5 Determinarea coeficienţilor ecuaţiei dreptei de regresie liniară prin metoda celor mai mici pătrate Se consideră Y, un şir cu termenii reprezentând nivelurile variabilei endogene şi X, un masiv bidimensional având pe coloane seriile de date ce conţin nivelurile variabilelor exogene. A reprezintă şirul coeficienţilor care trebuie estimaţi. Y = AX + B Se demonstrează că algoritmul pentru obţinerea termenilor şirului A se reduce evaluarea expresiei matriceale: A = ( X T * X ) −1 * X T *Y Fragmentul de cod asociat acestui calcul este: public static Matrice Rezolva(Matrice mX,Matrice mY) { Matrice c=(mX.Transpus()*mX). Inverseaza() *mX.Transpus() *mY; c.criteriu=mX.criteriu; return c; }// intoarce vectorul coef estimati pt model lin
Ipotezele în care aceasta este semnificativă sunt: ¾ vectorul X este independent de vectorul termenilor de eroare (Y − Yˆ ) ; ¾ elementele vectorului (Y − Yˆ ) sunt normal distribuite; ¾ media elementelor (Y − Yˆ ) este zero; ¾ elementele vectorului (Y − Yˆ ) sunt independente din punct de vedere statistic. O eroare asociată cu o valoare a lui Y nu are efect asupra altor erori asociate cu Y; ¾ elementele (Y − Yˆ ) au dispersie constantă. Pentru implementarea în baza de modele a metodei celor mai mici pătrate este necesară stabilirea următoarelor ipoteze de lucru: • seriile de date au cel mult 100 de termeni; • numărul variabilelor exogene este cel mult 30; • datele iniţiale sunt de tip întreg sau de tip real simplă precizie. 223
Produsul program, realizat mai întâi ca aplicaţie independentă, integrabilă însă în sistemul de gestiune al bazei de modele include următoarele proceduri: • iniţializarea cu validare a unei variabile elementare de tip întreg; • iniţializarea cu validare a unei variabile elementare de tip real simplă precizie; • iniţializarea unui masiv bidimensional cu date de la tastatură; masivul este de tip real şi se realizează conversie de la întreg la real; • masivele unidimensionale sunt tratate cazuri particulare ale masivelor bidimensionale având, respectiv, o line şi mai multe coloane sau mai multe linii şi o coloană; • afişarea unui număr întreg; • afişarea unui număr real; • copierea unui masiv în alt masiv; • afişarea unui masiv bidimensional pe blocuri; • transpunerea unui masiv; • produs matrice; • inversare de matrice; • scădere de matrice; • adunare de matrice; • iniţializarea unei linii a unei matrice cu o constantă; • iniţializarea unei coloane a unei matrice cu o constantă; Produsul program este elaborat în limbajul C# şi este prezentat în anexa 5. Sunt definite clasele Matrice şi RegresieOptima şi pentru operaţiile cu matrice sunt definite metodele a căror identificare în textul sursă este directă întrucât comentariile facilitează acest lucru.
224
Anexa 6 Metoda celor mai mici pătrate în două trepte În [JOHNS00] este prezentată celor mai mici pătrate în două trepte care presupune efectuarea calculelor matriceale următoare. Se consideră variabilele endogene yi şi Xi vectorul variabilelor exogene pentru ecuaţia i a unui model cu ecuaţii simultane. Variabila yi depinde atât de nivelul variabilelor exogene, cât şi de variabile endogene ca în sistemul următor: y1 = Y1 β1 + X 1γ 1 + e1 …….. y m = Ym β m + X m γ m + em unde: Yi - vectorul variabilelor endogene care influenţează variabila yi β i , γ i - parametrii ei - eroare Se construiesc Z i = (Yi , X i ) şi δ i = ( β i , γ i ) prin concatenare. Modelul devine: y i = Z i ⋅ δ i + ei Estimarea δ i prin metoda celor mai mici pătrate nu dă rezultate potrivite deoarece o parte dintre variabilele din membrul drept sunt endogene şi corelate cu termenul de eroare. Etapele pentru metoda celor mai mici pătrate în doi paşi sunt: • variabilele endogene din membrul drept sunt estimate prin metoda celor mai mici pătrate folosind toate variabilele exogene. Matricea observaţiilor tuturor variabilelor exogene se notează cu X. Pentru ecuaţia i: ˆ Yi = X {( X T ⋅ X ) −1 ⋅ X T Yi } ; • se efectuează regresia lui y folosind valorile estimate Yˆ şi i
i
matricea variabilelor exogene X i . Coeficienţii estimaţi ai ecuaţiei i sunt:
δˆi = {( Z iT X )( X T X ) −1 ( X T Z i )}−1 Z i X ( X T X ) −1 X T yi = {Zˆ iT Zˆ i }−1 Zˆ iT yi 225
Pentru implementarea metodei celor mai mici pătrate în două trepte sunt necesare proceduri destinate: • copierii de blocuri din masive bidimensionale; • generării de blocuri în masive bidimensionale; • operarea cu masive bidimensionale de mari dimensiuni. Produsul program destinat implementării acestei metode preia numeroase elemente utilizate pentru implementarea metodei celor mai mici pătrate.
226
Anexa 7 Generator de modele liniare – secvenţe – – Clasa Matrice oferă funcţionalitatea de bază pentru lucrul cu matrice. Se implementează: operatori de adunare, înmulţire, metode de copiere, calcul ale transpusei şi inversei. Metoda GenComb primeşte ca parametru un număr întreg. Reprezentarea binară a numărului este folosită pentru a marca o combinaţie de coloane. Fiecare cifră binară corespunde unei coloane indicând absenţa sau prezenţa acesteia în combinaţie. Este folosit tipul de dată întreg pe post de vector caracteristic. Performanţa este crescută datorită operaţiilor foarte rapide de deplasare şi operaţiilor logice "şi". using System; namespace ModelOptim { /// <summary> /// Summary description for Matrice. /// public class Matrice { public int lin,col;//nr de linii si de coloane ale matrice double [,] elem; //elementele matricei public int []criteriu;// int nrcrit; public Matrice(int l,int c) { // // TODO: Add constructor logic here // lin=l;col=c; elem=new double[lin,col];//se aloca matricea for(int i=0;i
227
public double this[int linie, int coloana] { get { return elem[linie,coloana]; } set { elem[linie,coloana]=value; } }//supraincarcare [] public void afiseaza() { for(int i=0;i /// intoarce transpusa unei matrice /// internal Matrice Transpus() { Matrice tmp=new Matrice(this.col,this.lin); for(int i=0;i
228
return c; }//supraincarcare operator+ /// <summary> /// intoarce inversa unei matrice /// public Matrice Inverseaza() { int i,j; Matrice a=this.Clone(); //a.afiseaza(); double amax; //initializare matrice unitate Matrice b=new Matrice(this.lin,this.col); for( i=0;i
a[i,j]=a[i,j]+c*a[k,j]; b[i,j]=b[i,j]+c*b[k,j]; } } }//for i,j k++; }//while mare
229
return b; }//inverseaza matricea /// <summary rel="nofollow"> /// intoarce maximul de pe coloana c, de pe o linie >=lmax /// public double Max(ref int lmax, int col) { double u; double max=this[lmax,col]; for(int i=lmax;imax) { lmax=i; max=u; } return max; } /// <summary> /// cloneaza o matrice /// public Matrice Clone() { Matrice tmp; tmp=new Matrice(this.lin,this.col); for(int i=0;i
230
return c; }//supraincarcare operator inmultire public Matrice GenCombinatie(int cmb) { //cmb contine cifrele binare coresp combinatiei //0 – variabila exogena(criteriul) participa //1 - nu participa Matrice Xtmp; criteriu=new int[col]; //vector care pastreaza //coloanele care participa la combinatie int cb=cmb; int coldim=0; //de atatea ori cate criterii sunt for(int i=0;i>1; } nrcrit=coldim; int []a=new int[nrcrit]; for(int i=0;i
231
Clasa Regresie este o clasă utilitară care implementează metode pentru algoritmii folosiţi în procesul de obţinere a rezultatelor. public class RegresieOptima { //X – matrice variabile exogene //Y – matrice variabile endogene //Coef – vectorul coeficientilor estimate //S – vector sume patrate diferente //nrcomb – numar de combinatii posibile public Matrice X,Y,Coef; // public double []S; public int nrcomb; public RegresieOptima(Matrice mX,Matrice mY) { // // TODO: Add constructor logic here // X=mX;Y=mY; nrcomb=(int)Math.Pow(2,X.col); //sunt 2 la col combinatii de col factori S=new double[nrcomb];// 2 la col sume } public static Matrice Rezolva(Matrice mX,Matrice mY) { Matrice c=(mX.Transpus()*mX).Inverseaza()*mX.Transpus()*mY; c.criteriu=mX.criteriu; return c; }// intoarce vectorul coef estimate pt model lin public static double SumaPatrateDif(Matrice XX,Matrice YY) { double sdp=0; for(int j=0;j<XX.lin;j++) { sdp=sdp+(XX[j,0]-YY[j,0])*(XX[j,0]YY[j,0]); }//for return sdp; } //calc suma patratelor de diferente intre primele coloanele a doua matrice public int []TopTen(double alfa)
232
{ for(int i=1;imax) {max=S[i];imax=i;} } int []rez=new int[nrcomb]; int contor=0; for(int i=1;iS[v[i+1]]) { int t=v[i]; v[i]=v[i+1]; v[i+1]=t;
233
inv=true; } } }//sorteaza crescator un vector
} }
234
Anexa 8 Generator de modele liniare cu argument întârziat - sevenţe Clasa NrMare este folosită pentru a genera atât combinaţii de coloane, cât şi întârzieri. Dacă la generatorul de modele liniare era suficent un număr întreg care prin reprezentare binară indica absenţa sau prezenţa unei coloane corespunzătoare unui factor de influenţă, aici, pe lângă această indicaţie, mai este necesară o informaţie care să arate ordinul de întîrziere, în perioade. De aceea, se mai foloseşte şi un vector caracteristic ale cărui poziţii corespund coloanelor, iar valorile elementelor arată întîrzierea introdusă. Se generează toate variantele prin adăugarea câte unei unităţi, respectând însă restricţii de integritate şi reprezentativitate a datelor. using System; namespace ArgInt { /// <summary> /// Summary description for NrMare. /// public class NrMare { int []comb; // elementele vectorului caracteristic public int plafon; //intarziere max=>adunare modulo p public NrMare(int dim,int p) { // // TODO: Add constructor logic here // comb=new int[dim]; plafon=p; } public void Next() { int T=1; for(int i=0;i
235
comb[i]=c%plafon;//adunare modulo p T=c/plafon; } }// genereaza urmatoarea combinatie public void afis() { for(int i=comb.Length-1;i>=0;i--) System.Console.Write(comb[i].ToString()); System.Console.WriteLine(); }// scrie la consola public int this[int i] { get { return comb[i]; } set { comb[i]=value; } }// acces simplificat la elemente /// <summary> /// intarzierea maxima generata /// public int IntarzMax { get { int max=this[0]; for(int i=1;i
În clasa Matrice se adauga metode pentru extragerea unei matrice cu întârzieri date ca parametru. public Matrice Extrag(NrMare nM)
236
{ int l=nM.IntarzMax; Matrice A=new Matrice(this.lin-l,this.col); for(int i=0;i /// extrage din matricea var dep primele n-l /// public Matrice ExtragY(int l) { Matrice Ytmp=new Matrice(this.lin-l,1); for(int i=l;i
În clasa RegresieOptim apare o metodă pentru determinarea combinaţiei optime, specifică argumentelor întârziate: public int []TopTenArg(double alfa) {//cate combinatii am for(int i=1;i
237
if (S[i]<1000) { Console.WriteLine("varianta"); for(int k=0;kmax) {max=S[i];imax=i;} } int []rez=new int[nrcomb]; int contor=0; for(int i=1;i
238
BIBLIOGRAFIE [BALOG97]
Alexandru BALOG – Analiza statistică şi evaluarea calităţii software-ului, Bucureşti, Editura Calipso 2000, 1997
[BIJIE99]
Elena BIJI, Paul WAGNER, Eugenia LILEA, Mihaela VĂTUI – Statistică, Bucureşti, Editura Didactică şi Pedagogică, 1999
[BOJAC04]
Cătălin BOJA, Ion IVAN – Metode statistice în analiza software, Bucureşti, Editura ASE, 2004
[DUTAD72]
Doru DUŢĂ, Csaba FABIAN – Manual de utilizare a pachetului de programe, VERONICA, Bucureşti, LITO ASE, 1972
[HALST77]
M. H. HALSTEAD – Elements of Software Science, Elsevier – North Holland, Amsterdam, 1977
[HOSPO01]
Adrian HOSPODAR – Software pentru analiza dinamicii modelelor econometrice, Bucureşti, Editura INFOREC, 2001
[ISAIC03]
Alexandru ISAIC-MANIU, Constantin MITRUŢ, Vergil VOINEAGU – Statistică, Bucureşti, Editura Universitară, 2003
[IVANI04]
Ion IVAN, Adrian VIŞOIU – Baza de modele economice, Economistul, supliment Economie teoretică şi aplicativă, 10 mai 2004, nr.1614(2640)
[IVANI84]
Ion IVAN, Romulus ARHIRE, Marian MACESANU – Program Complexity Analysis, Hierarchy, Classification, SIGPLAN NOTICES, vol 22, nr. 4, 1984, p. 94-102
[IVANT04]
Ion IVAN, Cristian TOMA, Adrian VIŞOIU Particularităţi ale securităţii bazelor de modele economice distribuite, Informatica Economică, vol. 8, nr. 1, 2004, p. 125 – 129 239
[IVANV04]
Ion IVAN, Adrian VIŞOIU – Generator de modele liniare cu argument întârziat, Revista de Comerţ, vol. 5, nr.1, 2004, p. 47-50
[JOHNS00]
John Johnston – Econometric Methods, The McGraw – Hill Companies, 2000
[MACES85]
Marian MACEŞANU, Romulus ARHIRE, Ion IVAN – Clase de complexitate pentru produseprogram, Buletinul Roman de Informatica, nr. 1, 1985, pg. 63-68
[MAILL71]
Pierre MAILLET – L’econometrie, Paris, Presses Universitaire de France, 1971
[NICAV02]
Vasile NICA, Virginia MĂRĂCINE - Modelarea firmei, Bucureşti, Editura ASE, 2002
[PECIC94]
Eugen PECICAN - Econometrie, Bucureşti, Editura ALL, 1994
[POPAM04]
Marius POPA, Ion IVAN, Adrian VIŞOIU Ortogonalitatea – caracteristică a calităţii bazei de modele economice, Revista Română de Informatică şi Automatică, vol. 14, nr. 3, 2004, p. 89-100
[SMEUR02]
Ion SMEUREANU., Marian DARDALA Programarea orientată obiect în limbajul C++, Bucureşti, Editura CISON, 2002
[TOMAC04]
Cristian TOMA, Ion IVAN, Marius POPA, Adrian VIŞOIU – Analiza ortogonalitatii, A IX a Sesiune de Comunicări Ştiinţifice a Universităţii RomânoAmericane, 28 – 29 mai 2004, Secţiunea INFORMATICĂ APLICATĂ
[TOMAC04]
Cristian TOMA, Ion IVAN, Marius POPA, Cătălin BOJA – Data Metrics Properties – Proceedings of International Symposium October 22-23, 2004, Iaşi, Romania, p. 45-56 240
[TOVIS82]
Ludovic TOVISSI, Ion IVAN, Emil MOSCOVICI, Utilizarea analizei entropice in studiul complexităţii programelor cu aplicaţii la normarea activităţii de programare, Buletinul Român de Informatică, nr. 4, 1982, p. 39-44
[VISOI04]
Adrian VIŞOIU, Ion IVAN - Model Orthogonallity, SIMPEC, 2004, The proceedings of the 5th Biennial International Symposium 14 – 15th of May, 2004, pp 332 – 337, Braşov, ROMÂNIA
[VOINE02]
Vergil VOINEAGU, Felix FURTUNĂ, Mariana VOINEAGU, Codrin ŞTEFĂNESCU – Analiza factorială a fenomenelor social-economice în profil regional, Bucureşti, Editura Aramis, 2002
[www001]
mis.temple.edu/sigdss/icis03/ proceedings/DSSWorkshop03-Bhrammanee.pdf An XML-based Representation Framework for Modelbases – Thadthong Bhrammanee and Vilas Wuwongse..
[www002]
http://www.w3.org/Math/
241