CUPRINS NOTĂ INTRODUCTIVĂ
PAG. 1
CAPITOLUL 1 ELEMENTE DE TEORIA MATEMATICĂ A OPTIMIZĂRII LINIARE ŞI PĂTRATICE
2
1.1. Considerente generale 1.2. Optimizare liniară 1.2.1. Forme de prezentare a unei probleme de optimizare liniară 1.2.2. Tipuri de soluţii. Proprietăţile soluţiilor unei probleme de optimizare liniară 1.2.3. Algoritmul simplex. Exemple de calcul 1.2.4. Determinarea unei baze iniţiale. Degenerare şi ciclaj 1.2.5. Probleme rezolvate
CAPITOLUL 2 ELEMENTE DE ANALIZĂ MATEMATICĂ
2 4 4 9 12 15 17
24
2.1. SERII NUMERICE: DEFINIŢII ŞI REZULTATE DE BAZĂ 2.1.1.Serii cu termenii pozitivi 2.1.2. Serii cu termeni oarecare. Serii alternante 2.1.3. Probleme rezolvate 2.1.4. Probleme propuse
24 26 32 34 35
2.2. Şiruri şi serii de funcţii 2.2.1.Şiruri de funcţii 2.2.2. Serii de funcţii . Serii de funcţii particulare 2.2.3. Exemple de dezvoltări în serie Mac-Laurin ale unor funcţii cunoscute 2.2.4 Probleme rezolvate 2.2.5 Probleme propuse
36 36 40 43 47 48
2.3 Funcţii de mai multe variabile 2.3.1 Considerente privind funcţiile reale de variabilă vectorială şi funcţiile vectoriale de variabile vectorială 2.3.2 Problema limitei şi a continuităţii 2.3.3 Derivarea funcţiilor de mai multe variabile 2.3.4 Câteva aplicaţii economice importante ale noţiunii de derivate: valoare marginală, ritm de variaţii, elasticitate 2.3.5. Probleme rezolvate 2.3.6. Probleme propuse 2.4. Puncte de extrem 2.4.1. Extreme de funcţii nesupuse la legături 2.4.2. Extreme cu legături 2.4.2.1. Formularea problemei 2.4.2.2. Rezultate şi interpretarea economică a acestora 2.4.3. Probleme rezolvate 2.4.4. Probleme propuse
49 53 60 67 71 72
75 83 85 89 92
NOTĂ INTRODUCTIVĂ
Lucrarea se adresează într-o manieră modernă şi accesibilă studenţilor de la învăţământul economic dar şi altor categorii interesate în aprofundarea cunoştinţelor de specialitate. Este structurată în cinci capitole: Elemente de algebră liniară, Elemente de analiză matematică, Optimizare liniară şi pătratică, Elemente de categoria probabilităţilor, Elemente de teoria balanţelor. Fiecărui capitol i s-au asociat, corespunzător, câte un subcapitol special dedicat problemelor rezolvate, respectiv problemelor propuse. La sfârşitul lucrării se prezintă un set de întrebări pentru autoevaluarea cunoştinţelor, scopul acestuia fiind acela de a fixa corect notaţiile de bază şi de însuşire a tehnicilor de lucru importante. Un element de noutate al lucrării îl reprezintă interpretarea economică a unor rezultate de referinţă precum şi indicarea posibilităţii de aplicare a unor rezultate teoretice în diverse domenii tehnico - economice.
CAPITOLUL 1 ELEMENTE DE TEORIA MATEMATICĂ A OPTIMIZĂRII LINIARE ŞI PĂTRATICE 1.1. Considerente generale Nu există problemă importantă cu caracter tehnic sau economic care să nu conducă din punct de vedere matematic la o problemă de optimizare. Problemele de dimensionare, alocare a resurselor, gestiune a stocurilor, stabilire a programelor de revizii şi reparaţii ale utilajelor sunt doar câteva exemple în care conceptul de optimizare nu poate lipsi. În capitolul 2 au fost prezentate importante legate de problema determinării punctelor de extrem, atât pentru funcţii supuse la restricţii de tip egalitate (şi pe care le-am numit extreme cu legături), cât şi pentru funcţii, care în afara unor condiţii de derivabilitate parţială, nu trebuie să verifice şi alte cerinţe (restricţii). Disciplina matematică în care se studiază metodele de rezolvare a problemelor de extrem condiţionat, se numeşte programare matematică. Particularitatea cea mai importantă a problemelor de programare matematică este existenţa restricţiilor de tip inegalitate printre condiţiile impuse. Uzual termenul de programare matematică este folosit şi sub forma de optimizare matematică, însă este clar că ne aflăm în faţa unui abuz de limbaj. În sens larg optimizarea se ocupă de determinare punctelor de extrem (maxim sau minim) pentru orice tip de funcţie, pe când optimizarea matematică (atunci când acest termen îl înlocuieşte pe cel de programare matematică) se referă la probleme de extrem pentru funcţii supuse la restricţii. În cele ce urmează se va folosi termenul de optimizare matematică în loc de programare matematică. Fiind date funcţiile f , g i : n → , i = 1, m o problemă de optimizare matematică se formulează astfel: Să se determine maximul (sau minimul) funcţiei de eficienţă f ştiind că trebuie verificate restricţiile:
⎧ g1 ( x1 , x2 ,..., xn ) ≤ 0 ⎪ ⎪ g 2 ( x1 , x2 ,..., xn ) ≥ 0 ⎨ ⎪ ⎪ g ( x , x ,..., x ) = 0 n ⎩ m 1 2
(*)
Desigur, în sistemul de restricţii (*) au fost adoptate inegalităţi (într-un sens sau altul) şi egalităţi în mod arbitrar. Esenţial este doar faptul că în sistemul de restricţii o problemă de optimizare matematică conţine măcar o restricţie de tip inegalitate (în caz contrar ne situăm din punct de vedere teoretic în cazul problemelor de optim cu legături analizate în capitolul 2, iar din punct de vedere practic ne găsim fie în faţa unei probleme formulare incorect, fie în cazul unei probleme lipsită de importanţă practică – deoarece orice problemă de factură tehnico-economică
2
importantă conduce în final la o problemă de optimizare care conţine cel puţin o restricţie de tip inegalitate). Concentrat problema de optimizare formulată anterior se notează astfel: ⎧ max ( min ) f ( x1 , x2 ,..., xn ) ⎪ ⎪ g1 ( x1 , x2 ,..., xn ) ≤ 0 ⎪ ( P ) ⎨ g 2 ( x1 , x2 ,..., xn ) ≥ 0 ⎪ ⎪ ⎪ g m ( x1 , x2 ,..., xn ) = 0 ⎩
(**)
Observaţia 1.1 Dacă se notează cu D mulţimea soluţiilor sistemului de restricţii (*), a optimiza funcţia de eficienţă f în condiţiile respectării restricţiilor (*) (sau echivalent, a rezolva problema (**)) înseamnă practic vorbind, a găsi punctele de extrem (maxim sau minim) ale funcţiei de eficienţă f care se găsesc în mulţimea D (fig. 1.1). n
D f
Figura 1.1
Optimizarea matematică este o disciplină relativ tânără. Primele lucrări în acest domeniu datează din 1939 şi se datorează lui Kantorovici. Marele având al acestei discipline are loc începând cu 1947 în urma rezultatelor datorate lui Dantzig, Lemke, Orden, Wolfe Beale. La prima vedere pare curios că astfel de probleme, aparent simple, s-au impus atât de târziu, când se ştie că de foarte multă vreme problemele de extrem au făcut obiectul cercetării cu ajutorul calculului diferenţial. Explicaţia este însă imediată: în problemele de extrem studiate cu ajutorul calculului diferenţia, punctele de extrem se află de regulă în interiorul domeniului de existenţă (al funcţiei de eficienţă sau al soluţiilor sistemului de restricţii) şi numai în cazuri excepţionale, care nu prezentau în general mare interes, pe frontieră. Dimpotrivă, în cazul problemelor de optimizare (programare matematică) punctele de extrem se află de regulă pe frontiera lui ( D ) şi prin urmare calculul efectiv al extremelor cu metodele obişnuite este practic imposibil de realizat. O scurtă sinteză asupra situaţiilor ce pot fi întâlnite în problemele de optimizare cu restricţii (şi care vor fi analizate mai detaliat în subcapitolele ce urmează) constă în precizarea următoarelor cazuri. 1. Dacă în sistemul de restricţii (*) întâlnim restricţii doar de tip egalitate, atunci rezolvarea problemei (**) se poate face cu ajutorul multiplicatorilor lui Lagrange (desigur, în anumite condiţii de derivabilitate parţială impuse funcţionalei de eficienţă f şi a funcţiilor de restricţii gi , i = 1, m ). Acest caz a fost analizat în capitolul 2. În situaţia în care sistemul de restricţii conţine cel puţin o restricţie de tip inegalitate, punctele de extrem căutate se găsesc îndeosebi pe frontiera domeniului ( D ) şi prin urmare metoda multiplicatorilor lui Lagrange cunoscută din analiza matematică nu se poate aplica.
3
2. Dacă atât funcţia de eficienţă f cât şi funcţiile restricţii gi , i = 1, m sunt liniare, atunci
problema ( P ) se numeşte problemă de optimizare liniară. În legătură cu o astfel de problemă se pot
face câteva scurte consideraţii: - primul algoritm de rezolvare a fost elaborat în 1947 de Dantzig (algoritmul complex); - domeniul D este un poliedru convex, iar soluţiile problemei ( P ) se găsesc în vârfurile poliedrului convex (fig. 3.2) - mulţimea soluţiilor problemei ( P ) este o mulţime convexă.
Soluţii
D Figura 1.2
3. Dacă funcţia de eficienţă f sau cel puţin una dintre funcţiile restricţii gi , i = 1, m , este
neliniară, atunci problema ( P ) se numeşte problemă de optimizare neliniară.
O astfel de problemă nu poate fi totdeauna rezolvată (cel puţin în stadiul actual al cunoştinţelor teoretice în acest domeniu). Se cunosc totuşi numeroase metode de rezolvare a unei astfel de probleme în situaţia în care funcţia de eficienţă şi funcţiile de restricţii sunt convexe (în acest caz problema ( P ) se numeşte problemă de optimizare convexă) sau, în cazul şi mai particular, când funcţia de eficienţă şi funcţiile de restricţii sunt pătratice (în acest caz suntem în faţa unei probleme de optimizare pătratică).
1.2. Optimizare liniară 1.2.1. Forme de prezentare a unei probleme de optimizare liniară Problema de optimizare liniară este un caz particular al problemei de optimizare, mai precis corespunde cazului când, atât funcţia de eficienţă cât şi funcţiile restricţiei, sunt liniar (variabilele sunt la puterea întâi). Considerăm funcţia de eficienţă:
f ( x1 , x2 ,..., xn ) = C1 x1 + C2 x2 + ... + Cn xn Coeficienţii C1 , C2 ,..., Cn g1 , g 2 ,..., g m sunt de forma:
se numesc constante caracteristice. Funcţiile restricţiei
4
g1 ( x1 , x2 ,..., xn ) = a11 x1 + a12 x2 + ... + a1n xn − b1 g 2 ( x1 , x2 ,..., xn ) = a21 x1 + a22 x2 + ... + a2 n xn − b2 g m ( x1 , x2 ,..., xn ) = an1 x1 + an 2 x2 + ... + ann xn − bn
În felul acesta forma generală a unei probleme de optimizare liniară este următoarea: n ⎧ max min ( ) ∑ Ci xi ⎪ i =1 ⎪ ⎪a11 x1 + a12 x2 + ... + a1n xn ≶ b1 ⎪ ⎨a21 x1 + a22 x2 + ... + a2 n xn ≶ b2 ⎪ ⎪ ⎪an1 x1 + an 2 x2 + ... + ann xn ≶ bn ⎪ ⎩
(1.1)
Concentrat, problema (1.1) se scrie sub forma: n ⎧ max min Ci xi ( ) ∑ ⎪ ⎪ i =1 ⎨ n ⎪∑ a x ≶ b , i = 1, m i ⎪⎩ j =1 ij i
(1.2)
O problemă de optimizare în forma (1.1) sau (1.2) se spune că este o problemă de optimizare liniară în forma generală, scrierea făcându-se în raport cu coordonatele carteziene. În afară de această reprezentare, o problemă de optimizare liniară în formă generală se poate scrie sub forma matricială şi sub forma vectorială. Forma generală sub forma matricială. Considerăm matricile:
⎛ a11 ⎜ a A = ⎜ 21 ⎜ ⎜ ⎝ am1
a12 a22 am 2
a1n ⎞ ⎟ a2 n ⎟ ⎟ ⎟ amn ⎠
⎛ C1 ⎞ ⎜ ⎟ C C =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ Cn ⎠
⎛ x1 ⎞ ⎜ ⎟ x X =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ xn ⎠
⎛ b1 ⎞ ⎜ ⎟ b b=⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ bm ⎠
Cu aceste matrici introduse, forma generală în reprezentare matricială a unei probleme de optimizare liniară este: ⎧⎪max ( min ) C ′X ⎨ ⎪⎩ AX ≶ b
unde C ′ este transpusa matricei C . Forma generală în reprezentarea vectorială.
5
(1.3)
Considerăm vectorul C = ( C1 , C2 ,..., Cn ) , vectorul X = ( x1 , x2 ,..., xn ) şi notăm:
⎛ a11 ⎞ ⎜ ⎟ a V1 = ⎜ 21 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ am1 ⎠
⎛ a12 ⎞ ⎜ ⎟ a22 ⎟ ⎜ V2 = ⎜ ⎟ ⎜ ⎟ ⎝ am 2 ⎠
⎛ a1n ⎞ ⎜ ⎟ a2 n ⎟ ⎜ Vn = ⎜ ⎟ ⎜ ⎟ ⎝ amn ⎠
⎛ b1 ⎞ ⎜ ⎟ b b=⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ bm ⎠
Forma generală în reprezentarea vectorială a unei probleme de optimizare liniară este:
⎧max ( min ) CX ⎪ n ⎨ ⎪∑ xiVi ≶ b ⎩ i =1
(1.4)
unde CX este produsul scalar în n dintre vectorii C şi X . În afara reprezentării generale a unei probleme de optimizare liniară, în practică se lucrează uzual cu alte două forme de reprezentare: - forma standard - forma canonică. Forma standard Este acea formă în care restricţiile sunt de tip egalitate, iar variabilele x1 , x2 ,..., xn sunt supuse condiţiei de nenegativitate. Avem următoarele forme de reprezentare: a. În coordonate carteziene:
( P)
n ⎧ max min Ci xi ( ) ∑ ⎪ i =1 ⎪ ⎪ n ⎨∑ aij x j = bi , i = 1, m ⎪ j =1 ⎪ x ≥ 0, i = 1, n ⎪ i ⎩
(1.5)
b. În reprezentarea matricială:
( P)
⎧max ( min ) C ' X ⎪ ⎨ AX = b ⎪X ≥ 0 ⎩
Forma canonică Caracteristic pentru această formă de prezentare este faptul că variabilele sunt supuse condiţiei de nenegativitate (ca la forma standard) iar restricţiile sunt concordante. Restricţiile sunt considerate a fi concordante dacă sunt de tip ≥ pentru o problemă de minim şi de tip ≤ pentru o problemă de maxim.
6
a. În coordonate carteziene: - pentru o problemă de maxim
( P)
-
n ⎧ max Ci xi ∑ ⎪ i =1 ⎪ ⎪ n ⎨∑ aij x j ≤ bi , i = 1, m ⎪ j =1 ⎪ x ≥ 0, i = 1, n ⎪ i ⎩
(1.6)
pentru o problemă de minim: n ⎧ min Ci xi ∑ ⎪ i =1 ⎪ ⎪ n ⎨∑ aij x j ≥ bi , i = 1, m ⎪ j =1 ⎪ x ≥ 0, i = 1, n ⎪ i ⎩
(1.7)
b. Reprezentarea matricială - pentru o problemă de maxim
( P)
⎧max C ' X ⎪ ⎨ AX ≤ b ⎪X ≥ 0 ⎩
(1.8)
⎧min C ' X ⎪ ⎨ AX ≥ b ⎪X ≥ 0 ⎩
(1.8’)
- pentru o problemă de minim:
( P)
Observaţia 1.2 O restricţie se zice că este coordonată dacă este de tip ≤ pentru o problemă de maximizare şi de tip ≥ pentru o problemă de minimizare. Prin urmare, o problemă de optimizare liniară în forma canonică conţine doar restricţii concordante. Observaţia 1.3 La prima vedere s-ar părea că există trei forme distincte de reprezentare a unei probleme de optimizare liniară. În realitate se poate trece destul de comod de la o formă de reprezentare la alta având în vedere următoarele: 1) Sensul unei inegalităţi se poate schimba prin înmulţirea cu -1 2) Inegalităţile de tip ≤ se pot transforma în egalităţi prin adăugarea unei variabile nenegative, numită variabilă de compensare. De exemplu inegalitatea:
a11 x1 + a12 x2 + ... + a1n xn ≤ b1
7
se poate transforma în egalitate introducând variabila de compensare xn +1 ≥ 0 astfel: a11 x1 + a12 x2 + ... + a1n xn + xn +1 = b1 3) Inegalităţile de tip ≥ se pot transforma în egalităţi prin scăderea unei variabile nenegative numită variabilă de compensare. De exemplu inegalitatea: a11 x1 + a12 x2 + ... + a1n xn ≥ b1 se poate transforma în egalitate prin scăderea variabilei de compensare xn +1 ≥ 0 astfel: a11 x1 + a12 x2 + ... + a1n xn − xn +1 = b1 4) Egalităţile se pot transforma întotdeauna în câte două inegalităţi de sens contrar. De exemplu egalitatea: a11 x1 + a12 x2 + ... + a1n xn = b1 este echivalentă cu inegalităţile
⎧a11 x1 + a12 x2 + ... + a1n xn ≤ b1 ⎨ ⎩a11 x1 + a12 x2 + ... + a1n xn ≥ b1 5) Variabilele negative se pot transforma în variabile pozitive prin introducerea unei variabile suplimentare astfel: dacă xi ≤ 0 se notează xi′ = − xi . 6) Variabilele oarecare se pot scrie totdeauna ca diferenţe dintre două variabile nenegative, adică dacă xi ∈ se introduc xi′, xi′′ ≥ 0 , aşa încât xi = xi′ − xi′′ .
7) Având în vedere că min f = − max ( − f ) orice problemă de minimizare se poate transforma într-o problemă de maximizare şi invers. Exemplu Să se scrie sub formă standard, deci canonică, următoarea problemă de optimizare liniară.
⎧ min ( x1 − 2 x2 + x3 ) ⎪ ⎪ x1 + 2 x2 = 5 ⎪ ⎨ x1 − 3x2 + x3 ≤ 2 ⎪2 x + x − x ≥ 3 ⎪ 1 2 3 ⎪⎩ x1 ≥ 0, x2 ∈ , x3 ≤ 0 Observaţia 1.4 Această problemă este dată sub forma generală în reprezentare carteziană.
8
Forma standard
x2 = x4 − x5 , x4 , x5 ≥ 0 x3 = − x6 , x6 ≥ 0
⎧min ( x1 − 2 ( x4 − x5 ) + 3 ( − x6 ) ) ⎪ ⎪ x1 + 2 ( x4 − x5 ) = 5 ⎪ ⎨ x1 − 3 ( x4 − x5 ) + ( − x6 ) + x7 = 2 ⎪ ⎪2 x1 + ( x4 − x5 ) − ( − x6 ) − x8 = 3 ⎪ x ≥ 0, i = 1,8 ⎩ i
⎧min ( x1 − 2 x4 + 2 x5 − 3x6 ) ⎪ ⎪ x1 + 2 x4 − 2 x5 = 5 ⎪ ⎨ x1 − 3x4 + 3x5 − x6 + x7 = 2 ⎪2 x + x − x + x − x = 3 ⎪ 1 4 5 6 8 ⎪⎩ xi ≥ 0, i = 1,8 Forma canonică
x2 = x4 − x5 , x4 , x5 ≥ 0 x3 = − x6 , x6 ≥ 0
⎧ min ( x1 − 2 ( x4 − x5 ) + 3 ( − x6 ) ) ⎪ ⎪ x1 + 2 ( x4 − x5 ) ≥ 5 ⎪ ⎪ x1 + 2 ( x4 − x5 ) ≤ 5 ⇔ − x1 − 2 ( x4 − x5 ) ≥ −5 ⎨ ⎪ − x1 + 3 ( x4 − x5 ) − ( − x6 ) ≥ −2 ⎪2 x + x − x − − x ≥ 3 ⎪ 1 ( 4 5) ( 6) ⎪ x ≥ 0, i = 1, 6 ⎩ i
⎧min ( x1 − 2 x4 + 2 x5 − 3x6 ) ⎪ ⎪ x1 + 2 x4 − 2 x5 ≥ 5 ⎪⎪− x − 2 x + 2 x ≥ −5 1 4 5 ⎨ ⎪− x1 + 3x4 − 3x5 + x6 ≥ −2 ⎪2 x1 + x4 − x5 + x6 ≥ 3 ⎪ ⎪⎩ xi ≥ 0, i = 1, 6
1.2.2. Tipuri de soluţii. Proprietăţile soluţiilor unei probleme de optimizare liniară Considerăm problema de optimizare liniară dată în forma standard, reprezentarea carteziană. Definiţiile care urmează sunt variabile şi pentru celelalte reprezentări, dar mai ales această formă fiind mai uşor de reprezentat.
9
n ⎧ max min ( ) ∑ Ci xi ⎪ i =1 ⎪ n ⎪ ⎨∑ aij x j = bi , i = 1, m ⎪ j =1 ⎪ x ≥ 0, i = 1, n ⎪ i ⎩
(*)
Definiţia 1.1 Vectorul X = ( x1 , x2 ,..., xn ) se zice soluţie posibilă dacă verifică condiţia de nenegativitate şi
restricţiile problemei date (adică verifică condiţiile (*)). Definiţia 1.2 Vectorul X = ( x1 , x2 ,..., xn ) se zice soluţie de bază dacă are exact m componente nenule
(presupune rangul matricei A = m şi m ≤ n ). Definiţia 1.3 Vectorul X = ( x1 , x2 ,..., xn ) se zice soluţie degenerată, adică are mai puţin de m
componente nenule. Definiţia 1.4 Vectorul X = ( x1 , x2 ,..., xn ) se zice soluţie optimă dacă este soluţie posibilă (adică verifică
restricţiile (*)) şi optimizează funcţia de eficienţă (o minimizează sau maximizează în funcţie de formularea problemei). Observaţia 1.5 O noţiune foarte importantă în optimizarea liniară este cea de bază. Considerăm matricea A corespunzătoare sistemului de restricţie (*). Presupunem rang ( A ) = m < n .
Se numeşte bază orice matrice B nesingulară de m linii şi n coloane în care vectorii coloană sunt liniar independenţi. Soluţia de bază corespunzătoare bazei B este dată de vectorul x B ale cărui componente corespund coloanelor matrici bază. Se notează cu S matricea obţinută prin extragerea din matricea A a matricei B şi cu x S vectorul rămas pe care îl vom numi vector de nebazic. În cazul problemei de optimizare liniară forma standard – reprezentarea matricială, egalitatea AX = b este echivalentă cu egalitatea matricială: B −1
Bx + Sx = b ⇒ x B = B −1b − B −1Sx S B
S
Se observă că o soluţie imediată a acestei egalităţi matriciale este: B −1 ⎪⎧ x = B b ⎨ S ⎪⎩ x = 0
10
Aceste egalităţi justifică de fapt noţiunea de soluţie de bază (în care am precizat că numărul componentelor nenule pentru astfel de soluţie este exact m ). Proprietăţi ale soluţiilor Considerăm o problemă de optimizare liniară dată de reprezentarea matricială, forma standard:
⎧max ( min ) C ′X ⎪ ⎨ AX = b ⎪X ≥ 0 ⎩
(1.9)
Rezultatele pe care le vom da în continuare sunt valabile şi pentru celelalte reprezentări, dar demonstraţiile sunt mai simple în cazul acestui tip de problemă. Teorema 1.1 Au loc rezultatele: 1. Mulţimea soluţiilor posibile este o mulţime convexă. 2. Mulţimea soluţiilor optime este o mulţime convexă. Demonstraţie 1. Fie x , y două soluţii posibile ale problemei (1.9) (evident x şi y sunt matrici coloană).
Avem:
Ax = b Ay = b x, y ≥ 0 Vrem să arătăm că şi z = λ x + (1 − λ ) y , λ ∈ [ 0,1] este de asemenea soluţie posibilă a problemei (1.9). Evident z ≥ 0 . Avem:
Az = A ( λ x + (1 − λ ) y ) = A ( λ x ) + A ( (1 − λ ) y ) = λ Ax + (1 − λ ) Ay = λb + (1 − λ ) b = b Deci Az = b ⇒ z soluţie posibilă, deci mulţimea soluţiilor posibile este o mulţime convexă. 2. Fie x , y soluţii optime ale problemei (1.9). Pentru comoditate presupunem că problema de optimizare este de maximizare. Prin urmare x , y sunt soluţii posibile, deci verifică: ⎧ Ax = b ⎪ Ay = b ⎪ ⎨ ⎪ x, y ≥ 0 ⎪⎩C ′x = C ′y = f max
Vrem să arătăm că şi z = λ x + (1 − λ ) y , λ ∈ [ 0,1] este de asemenea soluţie optimă. De la punctul anterior se ştie că z este soluţie posibilă. Calculăm C′z . Avem:
11
C ′z = C ′ ⎡⎣ x + (1 − λ ) y ⎤⎦ = C ′ ( λ x ) + C ′ (1 − λ ) y = λ C ′x + (1 − λ ) C ′y = λ f max + (1 − λ ) f max = f max f max
f max
Am obţinut că z este soluţie optimă şi ţinând seama cum a fost construit z şi că x , y au fost aleşi arbitrar, înseamnă că mulţimea soluţiilor optime este o mulţime convexă. Observaţia 1.6 Se poate demonstra relativ uşor că dacă o problemă de optimizare liniară are soluţie optimă, atunci admite întotdeauna şi o soluţie optimă de bază (adică o soluţie optimă care are m componente nenule şi n − m componente nule).
1.2.3. Algoritmul simplex. Exemple de calcul Se consideră problema de optimizare liniară în formă standard: ⎧min ( C1 x1 + C2 x2 + ... + Cn xn ) ⎪ ⎪a11 x1 + a12 x2 + ... + a1n xn = b1 ⎪⎪a21 x1 + a22 x2 + ... + a2 n xn = b2 ⎨ ⎪ ⎪an1 x1 + an 2 x2 + ... + ann xn = bn ⎪ ⎪⎩ xi ≥ 0, i = 1, n
(1.10)
Dacă se notează C , A, b, X următoarele matrici: ⎛ C1 ⎞ ⎜ ⎟ C C =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ Cn ⎠
⎛ a11 ⎜ a A = ⎜ 21 ⎜ ⎜ ⎝ am1
a12 a22 am 2
a1n ⎞ ⎟ a2 n ⎟ ⎟ ⎟ amn ⎠
⎛ b1 ⎞ ⎜ ⎟ b b=⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ bm ⎠
⎛ x1 ⎞ ⎜ ⎟ x X =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ xn ⎠
atunci problema (1.10) se poate scrie echivalent în următoarea formă matricială:
⎧min C ′X ⎪ ⎨ AX = b ⎪X ≥ 0 ⎩
(1.11)
Presupunem m < n , rang ( A ) = m . Fie b o bază asociată matricei A a bazei B . Se notează X B , X S vectorii ale căror componente sunt componente bazice, respectiv nebazice. În acest caz egalitatea AX = b se poate scrie sub formă echivalentă: BX B + SX S = b
Din egalitatea (1.12) obţinem imediat că o soluţie posibilă de bază este:
12
(1.12)
B −1 ⎪⎧ X = B b ⎨ S ⎪⎩ X = 0
(1.13)
Observaţia 1.7 Vom lucra numai cu soluţii de bază (posibile şi optime) deoarece am văzut că o problemă de optimizare liniară dacă admite soluţii (posibile sau optime) atunci admite şi soluţii de bază (posibile sau optime). O metodă teoretică de rezolvare a problemei (1.10) sau (1.11) este determinare tuturor bazelor B care se pot extrage din matricea A , apoi la baza egalităţilor (1.13) se pot construi soluţiile posibile (toate). Urmează apoi găsirea acelor soluţii care optimizează funcţia de eficienţă. Deoarece, această metodă este extrem de incomodă, se apelează la metoda lui Dantzig (matematician german) numită metoda simplex. Această metodă are avantajul că nu explorează toate bazele ce se pot extrage din matricea A , ci numai pe acelea care: - dacă problema este de minim, metoda simplex conduce la o succesiune de baze aşa încât soluţiile de baze corespunzătoare fac ca funcţia de eficienţă să descrească succesiv; - dacă problema este de maxim, metoda simplex conduce la o succesiune de baze ale căror soluţii de bază ( X B = B −1b , X S = 0 ) fac ca funcţia de eficienţă să crească succesiv. Metoda simplex constă, practic, de la o bază posibilă (admisibilă) B şi se construiesc următoarele elemente:
X B = B −1b y Bj = B −1a j z B = CB′ B −1b z j − C j = CB′ B −1a j − C j
unde a j reprezintă vectorii coloană ai bazei B . Cu ajutorul acestor elemente se construieşte un tablou de m + 2 linii şi n + 2 coloane. Vectorii bazei (VB) XB
Valorile corespunzătoare bazei (VVB) X − B = B −1b z B = C B′ B −1b
x1
x2
xn
y1B = B −1a1
y2B = B −1a 2
ynB = B −1a n
z1 − C1
z 2 − C2
z n − Cn
Dacă pentru toţi indicii j avem z j − C j ≤ 0 , pentru o problemă de minim, respectiv z j − C j ≥ 0 , pentru o problemă de maxim, atunci baza aleasă B va fi optimă, iar soluţia optimă
(care va fi de fapt o soluţie de bază) este: ⎧⎪ X B = X − B ⇒ X B = B −1b ⎨ S ⎪⎩ X = 0
13
Dacă există indici j pentru care z Bj − C j ≥ 0 se calculează acel indice k aşa încât
max ( z Bj − C j ) = zkB − Ck . Indicele k astfel găsit ne arată că vectorul coloană a k va intra în bază.
Observaţia 1.8 Pentru o problemă de maxim ne vom orienta după acei indici j pentru care . Indicele k care dă vectorul coloană a k ce va intra în noua bază se găseşte printre acei indici care realizează: min ( z Bj − C j ) = zkB − Ck j
În următoarea etapă se determină vectorul coloană ce va părăsi baza. Se notează cu I mulţimea indicilor pentru care yikB ≥ 0 . Se determină acel indice l cu proprietatea că: min ( xiB / yikB ) = xlB / ylBk i∈I
Vectorul xl va părăsi baza. Vom nota noua bază B , iar mărimile corespunzătoare acestei bare care sunt: xiB , yiB ,
ziB − ci , z B se calculează astfel: xiB ………… yijB ………… yiBk xlB ………… yljB ………… ylBk z B ……… z Bj − C j ……… zkB − Ck xiB = xiB − y =y − B ij
B ij
z =z − B
xkB = y = B kj
B
xlB yikB ylkB yljB yikB ylkB
xlB ( zkB − Ck ) ylkB
xlB ylkB yljB ylkB
Elementul ylkB se numeşte pivot, iar indicii l şi k sunt caracterizaţi de indicii vectorilor ce ies din bază, respectiv ce intră în bază. Toate elementele erau calculate corespunzătoarea noii baze B se determină aplicând regula dreptunghiului. Cu aceste elemente calculate se construieşte un nou tablou şi se reia algoritmul de la etapa a doua.
14
Observaţia 1.9 Practic, linia pivotului în noua bază se obţine împărţind linia pivotului în vechea bază la elementul pivot. Coloana elementului pivot va avea peste tot (în noua bază) zerouri, mai puţin elementul poziţionat în locul fostului pivot (care va fi 1).
1.2.4. Determinarea unei baze iniţiale. Degenerare şi ciclaj Se consideră problema de optimizare liniară în forma standard. ⎧min ( C1 x1 + C2 x2 + ... + Cn xn ) ⎪ ⎪a11 x1 + a12 x2 + ... + a1n xn = b1 ⎪⎪a x + a x + ... + a x = b 21 1 22 2 2n n 2 ⎨ ⎪ ⎪an1 x1 + an 2 x2 + ... + ann xn = bn ⎪ ⎪⎩ xi ≥ 0, i = 1, n
(1.14)
Problema (1.14) se poate scrie sub forma echivalentă în următoarele faze:
⎧min C ′X ⎪ ⎨ AX = b ⎪X ≥ 0 ⎩ ⎛ C1 ⎞ ⎜ ⎟ C C =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ Cn ⎠
⎛ a11 ⎜ a A = ⎜ 21 ⎜ ⎜ ⎝ am1
a1n ⎞ ⎟ a2 n ⎟ ⎟ ⎟ amn ⎠
a12 a22 am 2
(1.15) ⎛ b1 ⎞ ⎜ ⎟ b b=⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ bm ⎠
n ⎧ min Ci xi ∑ ⎪ i =1 ⎪ ⎪ n ⎨∑ aij x j ≥ bi , i = 1, m ⎪ j =1 ⎪ x ≥ 0, i = 1, n ⎪ i ⎩
⎛ x1 ⎞ ⎜ ⎟ x X =⎜ 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ xn ⎠
(1.16)
Teoretic, rezolvarea oricăreia dintre problemele echivalente de mai sus se poate rezolva determinând toate bazele ce se pot construi cu ajutorul matricei A . (Numărul acestor baze este finit deoarece am presupus matricea A de m linii şi n coloane, m şi n fiind finiţi). Fiecărei baze i se asociază corespunzător soluţia posibilă de bază. Se calculează valoarea funcţiei de eficienţă corespunzătoare fiecăreia din aceste soluţii posibile de bază şi se determină astfel (teoretic) soluţiile optime. Deoarece această metodă este extrem de greoaie s-a apelat la algoritmul simplex care prezintă proprietatea că selectează acele baze ale căror soluţii posibile de bază fac să scadă succesiv valorile funcţiilor de eficienţă (pentru o problemă de minimizare) respectiv să crească valorile funcţiilor de eficienţă succesiv (pentru o problemă de maximizare).
15
Cu toate aceste facilităţi algoritmul simplex prezintă dezavantajul de a porni de la o bază iniţială aleasă arbitrar. Alegerea acestei baze iniţiale se face la rândul ei potrivit unei metodologii aparte. Această metodologie se numeşte metoda celor două faze. Metoda celor două faze (metoda prin care se determină baza iniţială) constă în parcurgerea următoarelor etape: 1) Toate restricţiile problemei (1.16)(sau sub formă echivalentă, problemele (1.14) şi (1.15)) se scriu în aşa fel încât ecuaţiile: n
∑a x j =1
ij
j
= bi , i = 1, m
să aibă membrul drept ≥ 0 . Practic aceasta înseamnă că ecuaţiile rămân neschimbate dacă membrul drept este ≥ 0 sau se înmulţeşte cu −1 dacă membrul drept este negativ. 2) Se introduc variabilele auxiliare x1a , x2a ,..., xna ≥ 0 şi se consideră problema: n ⎧ min xia ∑ ⎪ i =1 ⎪ n ⎪ a ⎨∑ aij x j + xi ≥ bi , i = 1, m ⎪ j =1 ⎪ x , x a ≥ 0, i = 1, n ⎪ i i ⎩
(1.17)
Se observă că această problemă admite baza iniţială matricea unitate de n linii şi n coloane. ⎛1 0 ⎜ 0 1 B=⎜ ⎜ ⎜ ⎝0 0
0⎞ ⎟ 0⎟ ⎟ ⎟ 1⎠
Deoarece pentru problema (1.17) matricea asociată restricţiilor este: ⎛ a11 a12 ⎜ ⎜ a21 a22 ⎜ Al = ⎜ ⎜ am1 am 2 ⎜ ⎜⎜ ⎝ an1 an 2
a1n
1 0
a2 n
0 1
amn
0 0
ann
0 0
3) Rezolvând problema (1.17) obţinem: ⎛ n ⎞ min ⎜ ∑ xia ⎟ = 0 ⎝ i =1 ⎠
16
0⎞ ⎟ 0⎟ ⎟ ⎟ 1⎟ ⎟ ⎟ 0 ⎟⎠
atunci în baza condiţiilor de nenegativitate ale variabilelor x1a , x2a ,..., xna rezultă imediat: x1a = x2a = ... = xna = 0
În acest caz ultima bază a tabelului simplex va fi baza iniţială pentru problema (1.16). Observaţia 1.10 În esenţă, în cazul în care dispunem de o bază iniţială imediată, rezolvarea propriu-zisă a problemei de optimizare liniar iniţială (1.16) se realizează după rezolvarea în prealabil a unei alte probleme de optimizare liniară construită suplimentar (problema (1.17). ⎛ n ⎞ În cazul în care soluţia problemei (1.17) nu realizează min ⎜ ∑ xia ⎟ = 0 , atunci problema ⎝ i =1 ⎠ iniţială (1.16) nu are soluţii sau are soluţia infinită şi prin urmare abordarea ei este inutilă. Degenerare şi ciclaj În mod uzual algoritmul simplex conduce la o succesiune de baze ale căror soluţii de baze corespunzătoare modifică succesiv funcţia de eficienţă în funcţii de tipul problemei alese (minim sau maxim). În majoritatea cazurilor după un număr finit de paşi algoritmul se opreşte. Uneori se întâmplă însă ca după câţiva paşi succesivi valoarea funcţie de eficienţă să nu se schimbe. În acest caz este posibil să ajungem din nou la o bază găsită anterior şi prin urmare procedeul să se continue la infinit. Spunem în acest caz că algoritmul ciclează. Una din cauzele ciclării algoritmului simplex este degenerarea soluţiei de bază. Avem o soluţie degenerată în cazul în care pornind de la egalitate:
z =z B j
(z variaţia
B k
− Ck ) xl ylkB
B j
(z −
B k
− Ck ) ylkB
este nulă.
În acest caz ylkB ≠ 0 fiind pivot, iar în baza modului în care a fost construită această diferenţă. Prin urmare xl = 0 şi deci relaţia este degenerată. Este evident că în cazul degenerării valoarea funcţiei de eficienţă nu se schimbă şi în consecinţă există riscul de a intra într-un proces de ciclare.
1.2.5. Probleme rezolvate 1. Să se rezolve problema următoare:
( P)
⎧ max ( 2 x1 + x2 ) ⎪ ⎪ x1 − x2 + x3 = 4 ⎪ ⎨3 x1 − x2 + x4 = 18 ⎪− x + 2 x + x = 6 2 5 ⎪ 1 ⎪⎩ xi ≥ 0, i = 1,5
17
Rezolvare: Construim matricea asociată restricţiilor problemei:
⎛ 1 −1 1 0 0 ⎞ ⎜ ⎟ A = ⎜ 3 −1 0 1 0 ⎟ ⎜ −1 2 0 0 1 ⎟ ⎝ ⎠ Se aplică algoritmul simplex, parcurgându-se etapele următoare: Etapa 1 Se observă că o bază admisibilă este:
⎛1 0 0⎞ ⎜ ⎟ B = ⎜0 1 0⎟ ⎜0 0 1⎟ ⎝ ⎠ Într-adevăr este o matrice nesingulară rang ( A) = rang ( B ) = 3 = număr de linii
⎛0⎞ ⎜ ⎟ a4 = ⎜ 1 ⎟ ⎜0⎟ ⎝ ⎠
⎛0⎞ ⎜ ⎟ a3 = ⎜ 0 ⎟ ⎜1⎟ ⎝ ⎠ ⎛ x3 ⎞ ⎜ ⎟ B Prin urmare vectorii bazei vor fi x3 , x4 , x5 . De unde x = ⎜ x4 ⎟ . ⎜x ⎟ ⎝ 5⎠ Calculăm elementele necesare primului tablou simplex: ⎛ 1 0 0 ⎞⎛ 4 ⎞ ⎛ 4 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ X = B b = ⎜ 0 1 0 ⎟⎜ 18 ⎟ = ⎜18 ⎟ ⎜ 0 0 1 ⎟⎜ 6 ⎟ ⎜ 6 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠ B −1 j j yj = B a = a −B
1
⎛4⎞ ⎜ ⎟ z = CB′ B b = ( 0 0 0 ) B ⎜18 ⎟ = 0 ⎜6⎟ ⎝ ⎠ B
−1
−1
18
z Bj − C j = CB B −1a j − C j = ( 0 0 0 ) B −1a j − C j = −C j
V.B. x3
V.V.B.
x1
x2
x3
x4
x5
4
1
-1
1
0
0
x4
18
3
-1
0
1
0
x5
6 0
-1 -2 B z1 − C1 =
2 -1 B z 2 − C2 =
0 0
0 0
1 0
= C1
= C2
z3B − C3
z4B − C4
z5B − C5
zB
Etapa 2 Avem o problemă de maxim, dar se observă că nu toţi z j − C j ≥ 0 . Prin urmare, baza
considerată nu este optimă şi prin urmare soluţia de bază X B este doar admisibilă şi nu optimă. Determinăm vectorul coloană ce intră în bază. min ( z Bj − C j ) = min ( −2, −1) = −2 = z1B − C1 j
Deci va intra în bază vectorul a1 . Etapa 3 Determinăm vectorul ce va ieşi din bază. ⎛ 4 18 ⎞ min ⎜ , ⎟ = 4 → l = 1 ⎝1 3 ⎠
Elementul pivot va fi atunci: ylk = yl1 = 1
V.B. x3
V.V.B.
x1
x2
x3
x4
x5
4
1
-1
1
0
0
x4
6
0
2
-3
1
0
x5
10 8
0 0
1 -3
1 2
0 0
1 0
V.B. x3
V.V.B.
x1
x2
x3
x4
x5
7
1
0
-1/2
1/2
0
x4
3
0
1
-3/2
1/2
0
x5
7 17
0 0
0 0
5/2 -5/2
-1/2 3/2
1 0
19
min ( z j − C j ) = z2 − C2 = −3 ⇒ k = 2 j
⎛ 6 10 ⎞ min ⎜ , ⎟ = 3 ⇒ l = 4 ⎝2 1 ⎠
Linia pivotului se împarte cu pivotul min ( z j − C j ) = − j
5 = z3 − C3 ⇒ k = 3 2
V.B. x3
V.V.B.
x1
x2
x3
x4
x5
42/5
1
0
0
-2/5
1/5
x4
31/5
0
1
0
1/5
3/5
x5
14/5 24
0 0
0 0
1 0
-1/5 1
2/5 1
42 ⎧ ⎪ x1 = 5 ⎪ 36 ⎪ soluţii optime; ecuaţia optimă =24 ⎨ x2 = 5 ⎪ 14 ⎪ ⎪ x3 = 5 ⎩ 2. Să se rezolve problema următoare:
( P)
⎧min ( 2 x1 + 2 x2 − x3 ) ⎪ ⎪3x1 + x2 = 2 ⎪ ⎨− x1 + x3 = 1 ⎪2 x + x = 5 ⎪ 1 4 ⎪⎩ xi ≥ 0, i = 1, 4
Rezolvare: Se parcurg etapele realizate în problema precedentă:
⎛ ⎞ ⎜ 3 1 0 0⎟ A = ⎜ −1 0 1 0 ⎟ ⎜ ⎟ ⎜ 2 0 0 1⎟ ⎜ ⎟ B ⎝ ⎠ a2 a3 a4 ⎛1 0 0⎞ ⎜ ⎟ B = B = ⎜0 1 0⎟ ⎜0 0 1⎟ ⎝ ⎠ −1
20
⎛1⎞ ⎜ ⎟ a2 = ⎜ 0 ⎟ ⎜ 0⎟ ⎝ ⎠
⎛ 0⎞ ⎛ 0⎞ ⎜ ⎟ ⎜ ⎟ a3 = ⎜ 1 ⎟ a4 = ⎜ 0 ⎟ ⎜ 0⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ ⎛1 0 0⎞⎛ 2⎞ ⎛ 2⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ −B −1 WB = x = B b = ⎜ 0 1 0 ⎟ ⎜ 1 ⎟ = ⎜ 1 ⎟ ⎜0 0 1⎟⎜ 5⎟ ⎜5⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠ B −1 j j yj = B a = a ⎛1 0 0⎞⎛ 2⎞ ⎜ ⎟⎜ ⎟ z = CB′ B b = ( 2 −1 0 ) ⎜ 0 1 0 ⎟ ⎜ 1 ⎟ = 3 ⎜0 0 1⎟⎜ 5⎟ ⎝ ⎠⎝ ⎠ −1 j z j − C j = CB′ B a − C j = ( 2 −1 0 ) a j − C j −1
B
aj
z1 − C1 = ( 2
z 2 − C2 = ( 2
z3 − C3 = ( 2
z 4 − C4 = ( 2 V.B. x2
⎛3⎞ ⎜ ⎟ −1 0 ) ⎜ −1⎟ − 2 = 5 ⎜2⎟ ⎝ ⎠ ⎛1⎞ ⎜ ⎟ −1 0 ) ⎜ 0 ⎟ − 2 = 0 ⎜0⎟ ⎝ ⎠ ⎛0⎞ −1 0 ) ⎜⎜ 1 ⎟⎟ − ( −1) = 0 ⎜0⎟ ⎝ ⎠ ⎛0⎞ ⎜ ⎟ −1 0 ) ⎜ 0 ⎟ − 0 = 0 ⎜1⎟ ⎝ ⎠ x1 V.V.B.
x2
x3
x4
2
3
1
0
0
x3
1
-1
0
1
0
x4
5 3
2 5
0 0
0 0
1 0
x1
x2
x3
x4
1
1/3
0
0
0
1/3
1
0
0 0
-2/3 -5/3
0 0
1 0
max ( z Bj − C j ) = 5 = z1 − C1 ⎛2 5⎞ 2 min ⎜ , ⎟ = ⇒ x2 ⎝3 2⎠ 3 V.B. V.V.B. x2 2/3 x3 5/3
x4
11/3 -1/3
21
Deci z Bj − C j ≤ 0 ⇒ soluţiile optime sunt: 2 ⎧ ⎪ x1 = 3 ⎪ ⎪ x2 = 0 1 ⎪ ⎨ 5 valoarea funcţiei de eficienţă f opt = − 3 ⎪ x3 = 3 ⎪ ⎪ x = 11 ⎪⎩ 4 3 3. Să se rezolve problema următoare:
( P)
⎧max ( 3 x − 5 y + 7 ) ⎪ ⎪2 x + y ≤ 4 ⎨ ⎪− x + y ≤ 1 ⎪ x, y ≥ 0 ⎩
Rezolvare: Problema poate fi rezolvată prin metoda grafică deoarece există doar două variabile. Se parcurg etapele următoare: Etapa 1 Se reprezintă domeniul restricţiilor problemei: - pentru prima restricţie 2 x + y ≤ 4 (care reprezintă din punct de vedere geometric un semiplan) se asociază dreapta de separaţie corespunzătoare:
( D1 )
2x + y = 4
Această dreaptă se va reprezenta grafic cel mai comod determinând punctele de intersecţie cu axele Ox şi Oy. x = 0 ⇒ y = 4 ⇒ A ( 0, 4 ) y = 0 ⇒ x = 2 ⇒ B ( 2, 0 )
- pentru a doua restricţie − x + y ≤ 1 se procedează asemănător. Se consideră mai întâi dreapta de separaţie:
( D2 )
− x + y =1 şi se determină punctele de intersecţie ale acesteia cu axele Ox şi Oy. x = 0 ⇒ y = 1 ⇒ C ( 0,1) y = 0 ⇒ x = −1 ⇒ D ( −1, 0 )
Vom fi conduşi la poligonul următor (porţiunea haşurată).
22
y
A
D
C O
E
x
B
Conturul acestui poligon este determinat practic de dreptele ( D1 ) , ( D2 ) şi axele Ox şi Oy. Interiorul poligonului se determină imediat ţinând seama de restricţiile 2 x + y ≤ 4 , − x + y ≤ 1 , x ≥ 0, y ≥ 0 . Practic, pentru primele două restricţii se verifică faptul că originea O(0,0) aparţine interiorului poligonului (adică originea se găseşte sub dreptele D1 şi D2). Etapa 2 Se determină coordonatele vârfurilor C, O, B, E care determină poligonul COBE. - Coordonatele vârfurilor C, O, B au fost determinate anterior; - Vârful E este dat de intersecţia dreptelor D1 şi D2 şi prin urmare coordonatele acestui vârf se determină ca soluţie a sistemului următor:
⎧2 x + y = 4 ⎧3 x = 3 ⎧x = 1 ⇒ ⎨ ⇒ ⎨ ⎨ ⎩y = 2 ⎩− x + y = 1 ⎩− x + y = 1 Prin urmare avem: E(1,2). Etapa 3 Funcţia de eficienţă este dată de relaţia determină f ( x, y ) = 3 x − 5 y + 7 .
Se calculează valorile funcţiei de eficienţă în fiecare din vârfurile poligonului COBE: C ( 0,1) ⇒ f ( 0,1) = 2 O ( 0, 0 ) ⇒ f ( 0, 0 ) = 7 B ( 2, 0 ) ⇒ f ( 2, 0 ) = 13 E (1, 2 ) ⇒ f (1, 2 ) = 0
Problema de optimizare este de tip maxim; se constată imediat că max {2, 7,13, 0} = 13 , deci punctul de maxim este B ( 2, 0 ) iar valoarea funcţiei de eficienţă în acest punct este 13.
23
CAPITOLUL 2 ELEMENTE DE ANALIZĂ MATEMATICĂ 2.1.
SERII NUMERICE: DEFINIŢII ŞI REZULTATE DE BAZĂ
Se consideră şirul de numere reale (a n )n∈N . Cu ajutorul acestui şir se construieşte un alt şir de numere reale (s n )n∈N în felul următor: s1 = a1 s 2 = s1 + a 2 s3 = a1 + a 2 + a3 n
s n = a1 + a 2 + ... + a n = ∑ a k k =1
Dacă şirul (s n )n∈N este convergent, atunci limita lui pe care o vom nota cu s se numeşte uzual suma seriei şi are loc scrierea formală: ∞
s = ∑ an
(2.1)
k =1
Membrul drept al egalităţii (2.1) se numeşte în acest caz serie iar an se numeşte termen general al seriei. Şirul (s n )n se numeşte şirul sumelor parţiale. Prin urmare seria este convergentă sau divergentă dacă şirul (s )n este convergent sau divergent (în cazul în care şirul sumelor parţiale este convergent atunci seria se zice convergentă iar s din egalitatea (2.1) se numeşte suma seriei). Exemplul 1 ∞
Să presupunem, că avem seria ,
∑q n =1
n
, q ∈ R , deci a n = q n (această serie se numeşte serie
geometrică). Avem: ⎧ 1− qn ,q ≠1 ⎪q s n = a1 + a 2 + ... + a n = q 1 + q 2 + ... + q n = ⎨ 1 − q ⎪n ⋅ a ,q = 1 ⎩
24
q 1 lim(1 − q n ) = n 1− q 1− q 2 n Dacă , q = 1 , atunci s n = 1 + 1 + ... + 1 = n , deci lim s n = ∞
Dacă q < 1 , atunci lim s n =
Concluzie dacă q ≥ 1, (s n )n este divergent ⇒ serie divergentă.
dacă q < 1, (s n )n este convergent ⇒ serie convergentă.
Pentru q < 1 suma seriei geometrice este s =
q . 1− q
Exemplu 2
Considerăm seria
∞
1
∑n. n =1
Termenul general al acestei serii este a n =
1 construim şirul numerelor parţiale n
1 1 1 + + ... + 2 2 n k =1 Se observă că lim s n = ∞ deci seria este divergentă. n
s n = ∑ a k , deci s n = n
Criteriul general de convergenţă al lui Cauchy
Considerăm seria
∞
∑a n =1
n
Teorema 2.1. Condiţia necesară şi suficientă ca această serie să fie convergentă este următoarea: ∀ε > 0, ∃N (ε ) aşa încât ∀n > N (ε ), ∀p ≥ 1, p ∈ N are loc inegalitatea:
a n +1 + a n + 2 + ... + a n + p < ε Demonstraţie Considerăm şirul numerelor parţiale ∞
sn = ∑ ak
s n = a1 + a 2 + ... + a n
k =1
Pentru acest şir se poate aplica criteriul general de convergenţă al lui Cauchy de la şiruri numerice. Acest şir este convergent dacă şi numai dacă pentru ∀ε > 0, ∃N (ε ) aşa încât ∀n ≥ N (ε ), ∀p ≥ 1, ⇒ s n + p -s n < ε ⇒ (a1 + a 2 + ... + a n + a n +1 ) − (a1 + a 2 + ... + a n ) < ε ⇒ ⇒ a n +1 + a n + 2 + ... + a n + p < ε şi teorema este demonstrată.
25
Observaţia 2.1 (foarte importantă)
Condiţia necesară ca seria
∞
∑a n =1
n
să fie convergentă este ca termenul general an să tindă la 0
(adică lim a n = 0 ). n
Acest lucru rezultă din criteriul general al lui Cauchy făcând p = 1 ⇒ inegalitatea a n +1 < ε ⇒ lim a n = 0 n
În concluzie dacă există o serie în care termenul general nu tinde la 0 atunci această serie este sigur divergentă. Dacă termenul general tinde la 0 atunci seria poate fi convergentă sau divergentă (deoarece condiţia lim a n = 0 este doar o condiţie necesară). n
Observaţia 2.2 Natura unei serii (de a fi convergentă sau divergentă) nu se schimbă dacă la seria dată adaugăm un număr finit de termeni sau la seria dată suprimăm un număr finit de termeni. 2.1.1. Serii cu termenii pozitivi O serie se zice că este cu termenii pozitivi dacă există rang N0 aşa încât începând de la acest rang toţi termenii sunt pozitivi. Pentru seriile cu tremenii pozitivi se cunosc mai multe criterii de stabilitate a naturii seriei (fapt ce conferă o mare aplicabilitate acestor tipuri de serii).
1. Criteriul monotoniei ∞
Se consideră seria cu termenii pozitivi
∑a n =1
n n
Asociem acestei serii şirul sumelor parţiale s n = a1 + a 2 + ... + a n = ∑ a k k =1
Teorema 2.2. Dacă şirul sumelor parţiale (s n )n este mărginit atunci seria este convergentă. Dacă şirul sumelor parţiale (s n )n este nemărginit seria este divergentă.
(s n )n
Demonstraţie 1) Presupunem că şirul sumelor parţiale este mărginit, prin urmare există M > 0 aşa încât < M , ∀n ∈ N Calculăm diferenţa s n +1 − s n (în vederea studierii monotoniei şirului s n ).
s n +1 = a1 + a 2 + ... + a n + a n +1 ⎫ ⎬ ⇒ s n +1 − s n = a n +1 > 0 s n = a1 + a 2 + ... + a n ⎭ (pentru că avem serie cu termenii pozitivi). Deoarece s n +1 − s n > 0 rezultă că şirul s n este monoton crescător. Deoarece avem: (s n )n este mărginit şi (s n )n este monoton crescător ⇒ (s n )n este convergent, deci seria este convergentă. 2) Presupunem că şirul sumelor parţiale este nemărginit. Arătăm că este asemănător cazului 1) că şirul (s n )n este monoton crescător.
26
(s n )n
este nemărginit şi (s n )n este monoton descrescător ⇒ (s n )n este divergent, deci seria este divergentă. 2. Criteriul comparaţiei
Considerăm seriile cu termenii pozitivi
∞
∞
n =1
n =1
∑ an , ∑ bn .
Teorema 2.3 Dacă există un rang N0, de la care are loc inegalitatea atunci:
1. Dacă seria 2. Dacă seria
∞
∑ an este divergentă atunci şi seria n =1 ∞
∑b
n
n =1
∞
∑b n =1 ∞
este convergentă atunci şi seria
n
este divergentă;
∑a n =1
n
este convergentă.
Demonstraţie Deoarece natura seriei nu se schimbă prin adăugarea sau suprimarea unui număr finit de termeni se poate considera că N0 = 1. ∞
∑a
Cazul 1. Seria
n =1
n
fiind divergentă înseamnă că şirul sumelor parţiale corespunzător
s n = a1 + a 2 + ... + a n . Şirul sumelor parţiale corespunzătoare S n = b1 + b2 + ... + bn > a1 + a 2 + ... + a n = s n , deci:
seriei
a
doua
(s n )n
divergent ⎫ ⎬(S n )n divergent S n > sn ⎭
Prin urmare
∞
∑b n =1
n
seria este divergentă.
Cazul 2 Avem: (S n )n convergent ⇒ (S n )n este mărginit.
S n > s n ⇒ (s n )n este mărginit şi deci în baza criteriului monotoniei seria
∞
∑a n =1
n
este
convergentă. În afara criteriului monotoniei şi a criteriului comparaţiei pentru seriile cu termeni pozitivi se cunosc şi alte criterii care permit stabilirea naturii seriei. Criteriul rădăcinii (Cauchy)
Fie seria cu termeni pozitivi
∞
∑a n =1
n
.
Au loc rezulatele: 1. Dacă există un rang N0, aşa încât oricare ar fi n > N 0 avem atunci seria este convergentă;
27
n
an ≤ q < 1
2. Dacă există un rang N0, aşa încât oricare ar fi n > N 0 avem atunci seria n
a n ≥ q > 1 este divergentă.
Demonstraţie 1). Deoarece ştim că dacă adăugăm sau suprimăm un număr oarecare de termeni ai unei serii, natura seriei nu se schimbă, putem considera (pentru comoditatea calculelor) N0 = 1. Avem în acest caz:
⎫ ⎪ n = 2 ⇒ a2 ≤ q ⇒ a2 ≤ q 2 ⎪ ⎪⎪ n = 3 ⇒ a3 ≤ q ⇒ a3 ≤ q 3 ⎬ ............................................. ⎪⎪ n = k ⇒ a k ≤ q ⇒ a k ≤ q k ⎪⎪ ⎭ n = 1 ⇒ a1 ≤ q
(2.2)
Inegalităţile (2.2) se pot scrie concentrat sub forma următoare:
a n ≤ q n , ∀n ∈ N
(2.3)
n
∑q
Construim seria (seria geometrică)
n
n =1
Deoarece: ⎧a n ≤ q n ⎪n ⎨ n ⎪∑ q ⎩ n =1
este serie convergentă
pentru q < 1 rezultă (în baza ordinului comparaţiei) că seria
∞
∑a n =1
n
este convergentă.
2) Considerăm pentru comoditatea calculelor N0 = 1. În acest caz inegalităţile (2.3) îşi schimbă sensul a n ≥ q n , ∀n ∈ N n
Considerăm seria geometrică
∑q
n
,q >1
n =1
Se ştie de la cursul trecut că această serie este divergentă. Avem:
an > q n ,
n
∑q
n
este serie divergentă pentru q > 1 , deci seria este de asemenea
n =1
divergentă. Criteriul practic Se calculează K = lim n a n n
Avem situaţiile: K < 1 ⇒ serie convergentă K > 1 ⇒ serie divergentă K = 1 ⇒ nu se poate preciza natura seriei
28
Exemplu:
Considerăm seria
⎛ n +1⎞ an⎜ ⎟ ,a > 0 ∑ ⎝ n ⎠ n =1 n
n
⎛ n +1 ⎞ În cazul nostru termenul general este a = ⎜ a⎟ . ⎝ n ⎠ Aplicăm criteriul practic: n +1 ⋅a = a K = lim n a n = lim n n n
n
Discuţie pentru: a < 1 ⇒ serie convergentă a > 1 ⇒ serie divergentă a = 1 ⇒ nu se poate preciza natura seriei n
n
⎛ n + 1⎞ ⎛ n +1 ⎞ Observăm că a = ⎜ a⎟ = ⎜ ⎟ adică este un şir a cărui limită este de tipul din e. ⎝ n ⎠ ⎝ n ⎠ n
⎛ 1⎞ ⎛ n +1⎞ = lim⎜1 + ⎟ = e lim⎜ ⎟ n n ⎝ n⎠ ⎝ n ⎠ n
n
Am obţinut că : lim a n = e ≠ 0 prin urmare (în baza criteriului Cauchy de convergenţă a seriilor) termenul n
general netinzând la 0 înseamnă că seria este divergentă. Deci pentru a = 1 seria este divergentă. Criteriul raportului
Fie seria cu termeni pozitivi
n
∑a n =1
n
. Au loc rezultatele:
1. Dacă există un rang N0, aşa încât ∀n > N 0 avem
a n +1 ≤ q < 1 , atunci seria este an
convergentă; 2. Dacă există un rang N0, aşa încât ∀n > N 0 avem divergentă. Demonstraţie 1) la fel ca şi criteriul precedent vom considera N0 = 1. Avem:
29
a n +1 ≥ q > 1 , atunci seria este an
⎫ ⎪ ⎪ ⎪ a3 ≤ q ⇒ a3 ≤ a 2 ⋅ q ≤ a1 ⋅ q 2 n=2⇒ ⎪ a2 ⎪ ⎪ a4 ≤ q ⇒ a 4 ≤ a3 ⋅ q ≤ a 2 ⋅ q 2 ≤ a1 ⋅ q 3 ⎬ n =3⇒ a3 ⎪ ⎪ .................................................................... ⎪ a k +1 k ⎪ ≤ q ⇒ a k +1 ≤ a k ⋅ q ≤ ... ≤ a1 ⋅ q ⎪ n=k⇒ ak ⎪ ⎭ a2 ≤ q ⇒ a 2 ≤ a1 ⋅ q a1
n =1⇒
(2.4)
Concentrat, inegalităţile (2.4) se scriu sub forma: a n ≤ a1 ⋅ q n −1 , ∀n ∈ N ∞
Construim seria
∑ a1q n−1 . Această serie are aceeaşi natură cu seria geometrică n =1
∞
∑q
n
care
n =1
ştim că este convergentă pentru q < 1. Avem:
∞
a n > a1 ⋅ q n −1 , ∑ a n q n −1 este serie convergentă şi deci (în baza criteriului n =1
∞
comparaţiei) seria
∑a n =1
n
este convergentă.
2. În acest caz vom considera de asemenea N0 = 1. a În baza inegalităţii n +1 ≥ q inegalităţile (2.4) şi (2.5) îşi vor schimba sensul: an a n ≥ a1 ⋅ q n −1 , ∀n ∈ N ∞
Considerând seria
∑a q 1
n =1
n −1
(2.6) ∞
, această serie va avea aceeaşi natură cu seria geometrică
∑q n =1
Deoarece q > 1. , seria geometrică este divergentă şi prin urmare seria
∞
∑a q n =1
∞
Avem a n ≥ a1 ⋅ q n −1 , ∑ a1 q n −1 este divergentă şi deci n =1
n =1
n
este divergentă.
este divergentă.
a n +1 . n an Avem situaţiile următoare: K < 1 ⇒ serie convergentă K > 1 ⇒ serie divergentă K = 1 ⇒ nu se poate preciza natura seriei prin acest criteriu.
30
n −1
∞
∑a
Criteriul practic
Se calculează: K = lim
1
n
.
Observaţia 2.3 Criteriul rădăcinii este un criteriu mai tare decât criteriul raportului. Aceasta înseamnă că dacă aplicăm criteriul raportului şi putem preciza natura seriei în mod cert putem preciza natura seriei şi aplicând criteriul rădăcinii. Dacă K = 1 în urma aplicării criteriului raportului este posibil ca aplicând criteriul rădăcinii să putem totuşi determina natura seriei. Exemplu Să se studieze natura seriei următoare: ∞
an ,a > 0 ∑ n =1 n!
Termenul general al acestei serii este a n =
an . n!
Aplicând criteriul raportului: a n +1 a n +1 (n + 1)! a n +1 n! a = = ⋅ n = n (n + 1) a n + 1 an a n! a a K = lim n +1 = lim = 0 < 1 ⇒ serie convergentă. n n +1 n an Criteriul Raabe – Duhamel Acest criteriu este un criteriu mai tare decât criteriul raportului şi este indicat a fi folosit în cazul în care aplicând criteriul raportului obţinem: K= 1. ∞
Fie seria cu termini pozitivi
∑a n =1
n
.
Au loc rezultatele: 1) Dacă există un rang N0, aşa încât ∀n > N 0 , avem inegalităţile
⎞ ⎛ a n⎜⎜ n − 1⎟⎟ > q > 1 , ⎠ ⎝ a n +1
atunci seria este convergentă; ⎞ ⎛ a 2) Dacă există un rang N0, aşa încât ∀n > N 0 , avem inegalităţile n⎜⎜ n − 1⎟⎟ ≤ q < 1 , ⎠ ⎝ a n +1 atunci seria este divergentă.
Criteriu practic K < 1 ⇒ serie convergentă K > 1 ⇒ serie divergentă K = 1 ⇒ nu se poate preciza natura seriei prin acest criteriu. Exemplu ∞
Fie seria:
2 ⋅ 4 ⋅ 6 ⋅ 2 ⋅ ... ⋅ n
1
∑ 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1) ⋅ n + 3 n =1
Avem: a n =
2 ⋅ 4 ⋅ 6 ⋅ 2 ⋅ ... ⋅ n 1 ⋅ 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1) n + 3
31
Aplicăm criteriul raportului: 1 a n +1 n + 4 (2n + 2 )(n + 3) = = 1 (2n + 1)(n + 4) an n+3 a (2n + 2)(n + 3) = 1 ⇒ serie nedeterminată K = lim n +1 = lim n n (2n + 1)(n + 4 ) an Aplicăm criteriul Raabe – Duhamel ⎛ a ⎞ ⎛ (2n + 1)(n + 4) ⎞ 2(2n + 1)(n + 4) − (2n + 2)(n + 2) K = lim n⎜⎜ n ⎟⎟ = lim n⎜⎜ = − 1⎟⎟ = lim n n n n (2n + 2)(n + 3) ⎝ (2n + 2)(n + 3) ⎠ ⎝ a n +1 ⎠
n n(n + 2) 1 2n 2 + 9n + 4 − 2n 2 − 8n − 6 = lim = <1⇒ n (2n + 2 )(n + 3) n (2 n + 2 )(n + 3) 2 serie divergentă. = lim
(
)
2.1.2. Serii cu termeni oarecare. Serii alternante În afara seriilor cu termeni pozitivi adică a seriilor în care termenul general este pozitiv, în probleme practice se întâlnesc şi serii cu termeni oarecare (adică serii în care sunt şi termeni pozitivi şi termeni negativi), precum şi serii alternante (în care termenii pozitivi şi negativi se succed). Definiţia 2.1 O serie se zice absolut convergentă dacă seria modulelor este convergentă. O serie se zice semiconvergentă dacă seria este convergentă iar seria modulelor este divergentă. O serie se zice alternantă dacă termenul general an este de forma a n = (− 1) ÷ bn , bn > 0, ∀n ∈ N n
Teorema 2.4. Dacă o serie este absolut convergentă atunci este convergentă. Demonstraţie
Considerăm seria
∞
∑ an absolut convergentă. Aceasta înseamnă că seria modulelor n =1
este convergentă. Prin urmare şirul sumelor parţiale S n = a1 + a 2 + ... + a n Aplicând criteriul de convergenţă al lui Cauchy obţinem: ∀ε > 0, ∃N (ε ) aşa încât ∀n > N (ε ), ∀p > 1, avem: S n+ p − S n < ε adică:
a n +1 + a n + 2 + ... + a n + p < ε
∞
∑a n =1
n
este convergent.
(2.7) (2.8)
Se ştie din liceu că modulul seriei este totdeauna majorat de suma modulelor, prin urmare avem:
32
a n +1 + a n + 2 + ... + a n + p ≤ a n +1 + a n + 2 + ... + a n + p
(2.9)
Se observă că membrul stâng al inegalităţii (2.9) este de fapt: s n + p − s n unde s n = a1 + a 2 + ... + a n Ţinând seama de (2.8) şi (2.9) obţinem majorarea următoare: sn+ p − sn < ε Inegaliatatea (2.10) dovedeşte că şirul sumelor parţiale al seriei iniţiale
(2.10) ∞
∑a n =1
n
este
convergent şi prin urmare seria dată este convergentă. Teorema 2.5 Au loc următoarele proprietăţi: 1) Dacă o serie este absolute convergentă atunci schimbând ordinea termenilor se obţine tot o serie absolute convergentă care are aceeaşi sumă ca şi seria iniţială. 2) Pentru o serie semiconvergentă se poate schimba ordinea termenilor într-un mod convenabil aşa încât să se poată obţine: a) o serie convergentă cu o sumă dată; b) o serie divergentă; c) o serie oscilantă (alternantă). Observaţia 2.4 Punctul 2) al acestei teoreme este cunoscut sub numele de teorema lui Riemann. Teorema 2.6. (Criteriul lui Leibnitz) ∞
∑ (− 1)
n +1
n =1
an , an > 0
Condiţia necesară şi suficientă ca această serie să fie convergentă este ca şirul (a n )n să fie monoton descrescător la 0. Exemplu ∞
∑ (− 1) n =1
Avem Stoltz:
n
ln n n+2
ln n , limita acestui şir se calculează cel mai comod utilizând criteriul lui an = n+2
ln n ln(n + 1) − ln n n +1 n + 1⎞ ⎛ = lim = lim ln = ln⎜ lim ⎟ = ln 1 = 0 n n n (n + 3) − (n + 2) n+2 n n ⎠ ⎝ Prin urmare, în baza criteriului lui Leibnitz seria dată este convergentă. lim a n = lim n
n
33
2.1.3. Probleme rezolvate 1. Să se stabilească natura seriei
∞
1
∑ (α + k )(α + n + 1)
, α fiind un număr real diferit de
n =1
orice întreg negativ. Rezolvare
1
1 1 1 1 − − , obţinem S n = , de (α + k )(α + n + 1) α + k α + n + 1 α + k α + n +1 1 1 . unde deducem că lim S n = . Aşadar, seria dată este convergentă şi are suma n→∞ 1+α 1+α Din identitatea
=
∞
2. Să se arate că seria armonică generalizată
1
∑ nα
, α ∈ R este divergentă petru α ≤ 1 şi
n =1
convergentă pentru α > 1 . Rezolvare
Cazul α < 0
. Deoarece lim n α =
este divergentă pentru α < 0 .
n→∞
1 1 1 = ,−α > 0 avem lim α = ∞ −α n →∞ n ∞ lim n
deci seria
n→∞
∞ 1 1 1 < α şi cum seria ∑ este divergentă n n n =1 n ∞ 1 conform primului criteriu al comparaţiei avem că seria ∑ α este divergentă. n =1 n ∞ ∞ ⎡ 1 1 1 ⎤ Cazul α > 1 . Considerăm seriile ∑ ⎢ şi . − ∑ α α −1 α −1 ⎥ n ⎦ n =1 n n = 2 ⎣ (n − 1) 1 1 1 Notăm v n = − α −1 şi u n = α . α −1 n n (n − 1)
Cazul α ∈ [0,1] . Deoarece n α < n , avem
α −1 un ( n − 1) 1 1 Deoarece lim = lim ⋅ α −1 = ∈ (0, ∞ ) , conform celui de-al treilea α − 1 n →∞ v n →∞ n n α −1 − (n − 1) n criteriu al comparaţiei rezultă că cele două serii au aceeaşi natură. ∞ ∞ ⎡ 1 1 1 ⎤ Deoarece seria ∑ ⎢ este convergentă rezultă că şi seria ,α > 1 − ⎥ ∑ α α −1 α −1 n ⎦ n =1 n n = 2 ⎣ (n − 1) este convergentă.
3.Să se stabilească natura seriilor următoare: ∞ n a) ∑ 2 n =1 n + 2n + 7 ∞ 1 b) ∑ n n =1 7 n n
34
Rezolvare
n n 1 < 2 = 3 2 , ∀n ∈ N , conform primului criteriu al comparaţiei, n + 2n + 7 n n ∞ 1 rezultă că seria dată este convergentă (seria armonică generalizată ∑ 3 2 este convergentă). n =1 n 1 1 1 1 1 7nn n b) Întrucât = n = n şi lim n = , rezultă în baza criteriului al treilea al → ∞ n 1 7 n 7 7n n 7 n n ∞ 1 comparaţiei, că seria dată are aceeaşi natură cu seria ∑ . Dar aceasta este seria armonică, care n =1 n este divergentă. Aşadar, seria dată este divergentă. a) Deoarece
2
2.1.4. Probleme propuse 1. Să se stabilească suma seriilor următoare: ∞ ∞ − 2n + 1 1 a) ∑ arctg 2 b) ∑ 2n n =1 n =1 n(n + 1)(n + 2 ) ∞ ∞ 1 c) ∑ n + 2 − 2 n + 1 + n d) ∑ 2 n =1 n =1 n + 3n + 2
(
)
2. Să se stabilească natura seriilor următoare:
⎛ n2 + n +1⎞ ⎟⎟ a) ∑ a⎜⎜ n2 n =1 ⎝ ⎠ ∞
c)
e)
∞
π
n =1
2
∑ n 2 arcsin ∞
∑
(1
n =1
3
n
2
⎛ n +1⎞ n b) ∑ ⎜ ⎟ a , a>0 n =1 ⎝ n ⎠ ∞
d)
n
∞
∑ (n + 1)(a − 1) , a > 1 n
n =1
)
+ 2 3 + ... + n 3 n n 3n
f)
∞
1
∑ n(1 + a + ... + a ), a > 0 n
n =1
3. Să se stabilească natura seriilor următoare:
a)
(2n )! ∑ 3 n n =1 4 (n!) ∞
∞
c)
∑a
ln n
b)
, a>0
d)
n =1
∞
1 ⎛n⎞ ⎜ ⎟ ∑ n =1 n! ⎝ e ⎠ ∞
∑ n =1
∞
1 ⎞ ⎛ e) ∑ n 2 ln⎜1 + 2 ⎟ ⎝ n ⎠ n =1
f)
∞
∑ n =1
35
a2 n
n!
1+
n
, a>0
1 1 + ... + n 2 n
⎛ 4n 2 + 3n + 2 ⎞ ⎟⎟ h) ∑ ⎜⎜ 2 n =1 ⎝ 2n + n + 3 ⎠
∞
∞
a g) ∑ 2 sin n 3 n =1 n
n
4. Să se stabilească natura seriilor următoare:
a)
∞
∑ 16n n =1
c)
∞
2
1 − 8n − 3
b)
n =1
n
∑ n +1
d)
∞
1
∑ n(n + 3)
f)
n =1
g)
⎛ n +1⎞ a⎜ ⎟ ∑ n =1 ⎝ n ⎠ ∞
∞
∑3 n =1
n =1
e)
∞
∑ ln
3n + 5 n n −1 + 5 n −1
∞
∑a n =1
n +1 n
n
1 , a > −1 + 2n
n
2.2. Şiruri şi serii de funcţii 2.2.1.Şiruri de funcţii
Şirurile de funcţii reprezintă generalizarea notiunii de sir numeric. Se consideră mulţimea F x a tuturor funcţiilor definite peste aceeaşi mulţime X ⊆ R Definiţia 2.2 Se numeşte şir de funcţii orice aplicaţie definită pe N şi cu valori în F x Ca şi în cazul şirurilor numerice, notaţia unui şir de funcţii va evidenţia doar codomeniul, mai precis un şir de functii îl vom nota ( f n )n Definiţia 2.3. a ∈ X se numeşte punct de convergenţă al şirului de functii ( f n )n dacă şirul numeric ( f n (a ))n este convergent. Deoarece este posibil ca un şir de functii să aibă mai multe puncte de convergenţă se notează cu A mulţimea punctelor de convergenţă ale şirului de funcţii dat ( evident A ⊆ X) Definiţia 2.4 Fie şirul de funcţii ( f n )n definite peste aceeaşi mulţime X . Fie A mulţimea punctelor de convergenţă . Se numeşte funcţie limită , funcţia f : A → R , dată de egalitatea f ( x ) = lim f n ( x ) .
36
Exemple:
1) Considerăm şirul funcţiilor ( f n ) n , unde f n (x) =
sin nx ; x∈R(X = R) . Este evident că n +1
sin nx0 este convergent şi are limita 0 ( faptul că n +1 are limita 0 se poate dovedi uşor aplicînd criteriul majorării):
pentru x 0 ∈ E fixat şirul numeric a n = f n (x 0 ) =
an =
sin nx0 n +1
≤
1 →0 n +1
Aceasta înseamnă că mulţimea de convergenţă pentru şirul ( f n ) n este A = R . Funcţia limită este f(x) = lim n
sin nx =0 . Deci f : R = A → R , f (x) = 0 n +1
2) Fie şirul ( f n ) n unde f n : R → R f n (x ) = În cazul nostru
n2 x2 +1 n2 + 1
X = R şi se poate arăta că pentru orice x 0 ∈R fixat , şirul a n =
n x +1 este convergent având lim a n = x 02 . Deci A= R şi funcţia limită este f : R = A → 2 n n +1 2 2 n x +1 = x2 R , f (x ) = lim 2 n n +1 f n (x0 ) =
2
2 0
Observaţia 2.5 Am arătat până acum că un şir de funcţii este convergent dacă şirurile numerice dând valori variabilei x ( valori ce aparţin mulţimii de convergenţă ) sunt şiruri numerice convergente. Această informaţie va fi detaliată in cele ce urmează prin introducerea noţiunii de convergenţă simplă şi convergenţă uniformă. Definiţia 2.5 Fie şirul de funcţii ( f n ) n definit pe mulţimea X. Spunem că acest şir este simplu convergent ( convergent punctual ) la funcţia f : X → R ; dacă ∀ x ∈ X , ∀ ε > 0 , ∃N 0 (ε x ) aşa incât ∀ n > N 0 ( ε ,x) avem: f n (x ) − f (x ) < ε ( 2.11 ) Definiţia 2.6 Fie şirul de funcţii ( f n )n definit pe mulţimea X . Spunem că acest şir este uniform convergent la funcţia f : X → R ; dacă ∀ x ∈ X , ∀ ε > 0 , ∃N 0 (ε ) aşa încât ∀ n > N 0 (ε ) avem : f n (x ) − f (x ) < ε
37
( 2.12 )
Observaţia 2.6 Faptul că şirul ( f n )n este simplu convergent pe mulţimea X la funcţia f , îl notăm astfel : s
fn → f x
Faptul că şirul de funcţii f n converge uniform pe mulţimea X la funcţia f îl notăm : u
fn
> f
x
Observaţia 2.7 Convergenţa uniformă se deosebeşte de convergenţa simplă ( punctuală ) prin faptul că rangul N 0 nu depinde decât de ε şi nu de punctul x0 .Din acest motiv convergenţa uniformă implică convergenţa simplă ( punctuală ) , reciproca nefiind adevărată . Exemplu
x2 1) Fie şirul ( f n )n , f n : R → R , f n ( x ) = . În acest caz X este R , iar mulţimea de n +1 convergenţă A = R . Şirul acesta este deocamdată simplu convergent la funcţia f : R → R , f ( x ) = 0 . Să calculăm rangul N 0 ( ε , x). Dacă acest rang va depinde numai de ε vom avea convergenţă uniformă, dacă depinde şi de x vom avea convergenţă simplă . x2 x2 f n (x ) − f (x ) < ε ⇒ < ε ⇒ n +1 > −0 < ε ⇒ n +1 n +1
>
x2
ε
⇒>
x2
ε
−1
⎡ x2 ⎤ N 0 ( x , ε ) = ⎢ − 1⎥ , deci convergenţa este simplă . ⎦ ⎣ε cos nx 2) Fie şirul ( f n )n , f n : R → R , f n ( x ) = 2 n +1
În cazul nostru X = R , A = R . Funcţia limită este evident f : R → R , f (x ) = 0 . Vrem să vedem dacă acest şir este simplu sau uniform convergent după cum rangul N 0 depinde sau nu de x . cos nx cos nx f n (x ) − f (x ) < ε ⇒ 2 −0 < ε ⇒ 2 <ε n +1 n +1 Deoarece cos nx ≤ 1 , obţinem majorarea următoare
38
1 1 1 1− ε 1− ε ⇒ < ε ⇒ n2 + 1> ⇒ n2 > − 1 = ε ε ε ε n +1 2
Prin urmare rangul va fi : ⎡ 1− ε ⎤ N 0 (ε ) = ⎢ ⎥ şi deci f n converge uniform la 0 ( am notat prin [a ] partea întreagă a ⎣ ε ⎦ lui a ). Teorema 2.7 Fie şirul de funcţii ( f n )n definite pe mulţimea X şi funcţia limită f : X → R . Dacă există şirul (a n )n de numere reale pozitive convergent la 0 aşa încât
f n ( x ) − f ( x ) < a n , ∀ x ∈ X atunci :
u
fn
⎯ ⎯→
f
x
Demonstraţie Şirul (a n )n avînd limita 0 , înseamnă că ∀ ε > 0, ∃N 0 (ε ) aşa încât ∀ n > N 0 (ε ) avem: an < ε ⇒ an < ε
(2.13)
Ţinînd seama de inegalitatea (2.13) şi de inegalitatea f n ( x ) − f ( x ) < a n , ∀ x ∈ X , înseamnă
că ∀ n > N 0 (ε ) avem :
f n ( x ) − f ( x ) < ε ( ceea ce dovedeşte că f n
u
⎯ ⎯→ f
deoarece rangul N 0 depinde doar
x
de ε ). Teorema 2.8 u
Se dă şirul de funcţii f n ⎯ ⎯→ f . Dacă funcţiile f n sunt continue în punctul x0 ∈ X atunci x
funcţia limită f este continuă în punctul x0 . Demonstraţie Şirul ( f n )n fiind uniform convergent pe mulţimea X la funcţia limită f avem că ∀ ε > 0, ∃N 0 (ε ) aşa încât ∀ n > N 0 (ε ) are loc inegalitatea : f n ( x ) − f ( x ) < ε /3 , ∀ x ∈ X
Din:
( 2.14 ) ⇒ f n ( x ) − f ( x0 ) < ε / 3
(2.14) (2.15)
Funcţiile ( f n )n fiind continue în x0 înseamnă că pentru ε > 0 ales , există o vecinătate V x0 a punctului x0 aşa încât ∀ x ∈ V x0 ∩ X avem :
39
f n (x0 ) − f (x ) < ε / 3
(2.16)
Scriem diferenţa f ( x ) − f ( x0 ) într-o formă convenabilă f ( x ) − f ( x0 ) = ( f ( x ) − f n ( x )) + ( f n ( x ) − f n ( x0 )) + ( f n ( x0 ) − f n (x 0 )) Deci : f ( x ) − f n ( x 0 ) = ( f (x ) − f n (x )) + ( f n ( x ) − f n ( x0 )) + ( f n ( x0 ) − f n ( x0 )) <
< f (x ) − f n (x ) + f n (x ) − f n (x0 ) + f n (x0 ) − f n (x0 ) < ε / 3 + ε / 3 + ε / 3 = ε , adică funcţia f continuă în punctul x0 şi prin urmare teorema este demonstrată. Un rezultat important legat de studiul şirurilor de funcţii îl furnizează teorema următoare : Teorema 2.9 Considerăm şirul de funcţii ( f n )n definit pe mulţimea X ⊂ R şi funcţia limită f . Au loc rezultatele următoare: 1) Dacă funcţiile f n sunt derivabile şi şirul ( f ' n )n este uniform convergent către g , atunci f este derivabilă şi f ' = g ; 2) Dacă X = [a, b] , f n sunt integrabile , ∀ n ∈ N şi convergenţa la f este uniformă, atunci f este integrabilă pe [a, b] şi are loc egalitatea : b
b
a
a
lim ∫ f n ( x )dx = ∫ f ( x )dx . n
2.2.2. Serii de funcţii . Serii de funcţii particulare
Considerăm şirul de funcţii ( f n )n definit pe mulţimea X . Cu ajutorul acestui şir se construieşte un nou şir de funcţii (S n )n în felul următor : S1 = f 1 S 2 = f1 + f 2 S n = f1 + f 2 +
(S n )n
+ fn
îl vom numi şirul numerelor parţiale şi convenim să notăm , ca la serii numerice
∞
∑f n =1
n
seria de funcţii construită . Definiţia 2.7 a ∈ X se zice un punct de convergenţă pentru seria de funcţii dacă seria numerică
∞
∑ f (a ) n =1
n
este convergentă . Vom nota cu A mulţimea punctelor de convergenţă pentru seria de funcţii dată.
40
Definiţia 2.8
Seria
∞
∑f n =1
este simplu ( uniform ) convergentă la funcţia f : A → R dacă şirul sumelor
n
parţiale (S n )n este simplu ( uniform ) convergent la funcţia f . Avem deci : ∞
∑f n =1
s
n
⎯ ⎯→ f dacă ∀ x ∈ A , ∀ ε > 0 , ∃N 0 ( x, ε ) aşa încât ∀ n > N 0 (x, ε ) avem: A
s
⎯→ f . Sn ⎯ A
∞
∑f n =1
u
n
⎯ ⎯→ f dacă ∀ x ∈ A , ∀ ε > 0 , ∃N 0 (ε ) aşa încât ∀ n > N 0 (ε ) avem: A
u
⎯→ f . Sn ⎯ A
Definiţia 2.9
Fie seria
∞
∑f n =1
n
. Se notează cu Rn restul seriei de ordin n asociat acestei serii. Acest rest
este de fapt seria de funcţii f n +1 + f n +1 +
+
. Se poate arăta că mulţimea de convergenţă a seriei ∞
date coincide cu mulţimea de convergenţă a seriei
∑f n =1
n
.
De asemenea are loc următoarea proprietate importantă . ∞
Seria
∑ n =1
s
fn ⎯ ⎯→ f ( seria A
∞
∑ n =1
u
s
u
A
A
A
fn ⎯ ⎯→ f ) ⇔ Rn ⎯ ⎯→ 0 ( respectiv Rn ⎯ ⎯→ 0 ).
În cele ce urmează, vom prezenta o condiţie suficientă de convergenţă uniformă precum şi o proprietate de continuitate a funcţiei limită. Cazurile particulare ale seriilor de funcţii ( Taylor şi Mac Laurin ) sunt des întâlnite în diverse probleme concrete. Unele probleme au un caracter teoretic, iar altele au un conţinut practic (de exemplu probleme legate de serii dinamice, probleme legate de evoluţia unor fenomene economice , probleme de echilibru economic etc.) . Teorema 2.10
Dacă există seria cu termeni pozitivi
∞
∑a n =1
n
aşa încât f n ( x ) < a n , ∀ n ∈ N , ∀ x ∈ X atunci
∞
seria de funcţii
∑f n =1
n
este uniform convergentă dacă seria numerică este convergentă .
Demonstraţie Seria numerică fiind convergentă , înseamnă că şi restul ei ( vom lua restul de ordin n ) este convergentă la 0 , adică ar fi ε > 0 , ∃N (ε ) aşa încât ∀ n > N (ε ) avem :
a n +1 + a n + 2 +
41
<ε
Pe de altă parte , dacă vom considera restul de ordin n al seriei de funcţii date ( adică ∞
Rn = ∑ f n + k ( x ) ) avem : k =1
∑ f (x ) ≤ ∑ k =1
n+k
f n + k ( x ) < ∑ a n + k < ε , ∀ n > N 0 (ε ) , ∀ x ∈ X
k =1
( 2.17 )
k =1
Inegalităţile ( 2.17 ) dovedesc că restul de ordinul n al seriei de funcţii date este uniform, convergent , prin urmare seria de funcţii este uniform convergentă . Teorema 2.11 ∞
∑f
Fie seria de funcţii
n =1
1)
∞
∑ n =1
n
. Dacă sunt îndeplinite proprietăţile : u
⎯→ f ; fn ⎯ X
2) f n sunt continue în x0 ∈ X , ∀ n ∈ N . Atunci funcţia limită f este de asemenea continuă în x0 . Demonstraţie Această teoremă este o consecinţă imediată a teoremei 2.8. Într-adevăr, seria de funcţii este uniform convergentă la funcţia limită f , dacă şirul sumelor parţiale este uniform convergent la funcţia limită f . Deci am redus problema convergenţei uniforme pentru seria dată la convergenţa uniformă a unui şir de funcţii . Seria Taylor Considerăm funcţia f : I → R , I este interval şi punctul a ∈ I . Presupunem că f este indefinit derivabilă în punctul a ( adică este derivabilă de orice ordin în punctul a ). Funcţiei f i se poate construi într-un anumit mod un polinom de gradul n numit polinomul lui Taylor .
(x − a ) f ' ' (a ) + x−a Pn ( x ) = f (a ) + f ' (a ) + 1! 2!
n ( x − a) +
2
n!
f (n ) (a )
şi seria de funcţii numită seria Taylor : ∞
∑ f (x ) , unde n =1
n
fn
n ( x − a) (x ) =
n!
f (n ) (a )
Dacă această serie de funcţii este convergentă la funcţia iniţială f , avem egalitatea:
(x − a ) f ' ' (a ) + x−a f ( x ) = f (a ) + f ' (a ) + 1! 2! 2
n ( x − a) +
n!
Considerăm că Rn ( x ) este restul seriei : 42
f
(n )
n +1 ( x − a) (a ) + (n + 1)!
f (n +1) (a ) +
Rn =
(x − a )n+1 (n + 1)!
f (n +1) (a ) +
( x − a )n + 2 (n + 2)!
f (n + 2 ) (a ) +
Evident, că dacă restul seriei este convergent la 0 atunci seria de funcţii Taylor este convergentă având funcţia limită f . Mai mult, de aici se poate trage concluzia că dacă restul Rn poate fi neglijat începând de la un rang n înainte , atunci funcţia f poate fi aproximată prin polinomul lui Taylor de gradul n asociat funcţiei f . Observaţia 2.8 Este evident că punctul a ∈ I este punct de convergenţă pentru seria Taylor asociată funcţiei f . Se pune problema de a găsi şi alte condiţii care ne asigură că mulţimea de convergenţă a seriei Taylor asociată lui f conţine şi alte puncte în afară de punctul a . Teorema 2.12 Dacă în vecinătatea Va a punctului a derivatele de orice ordin ale lui f sunt egal mărginite
( adică există M > 0 aşa încât f (n ) ( x ) < M , ∀ x ∈ Va , ∀ n ∈ N ), atunci Va este o mulţime de convergenţă pentru seria Taylor asociată lui f . Observaţia 2.9 Făcând a = 0 în seria Taylor , obţinem seria Mac-Laurin . Observaţia 2.10 Pentru evaluarea restului Rn ( x ) se cunosc mai multe metode . Cea mai utilizată exprimare este cea a restului în formă Lagrange :
Rn ( x ) =
(x − a )n+1 (n + 1)!
f (n +1) (ξ ) , ξ ∈ (a, x )
2.2.3. Exemple de dezvoltări în serie Mac-Laurin ale unor funcţii cunoscute
f ( x ) = e ax f ' ( x ) = ε e ax f ' ' (x ) = α 2 e ax f (n ) ( x ) = α n e ax Luăm o vecinătate a originii V0 = (− b, b ) .
Derivatele de orice ordin în punctul x, f (n ) (x ) , x ∈ V0 verifică inegalităţile : f (n ) ( x ) = α n e ax = α n e ax < α n e ab m arg init
43
Deci se aplică teorema 2.10. ∞
Avem : f ( x ) = ∑ f n ( x ) n =1
unde : f n ( x ) =
(x − 0 )
n
f
n!
n n n (0) = x α n = α x
∞
α n xn
n =1
n!
ex = ∑
Deci :
n
n!
n!
(2.18)
Făcând în egalitatea (2.18) x = − x obţinem : e
−αx
∞
(− 1)n α n x n
n =1
n!
=∑
(2.19)
2) f ( x ) = shα x sh x =
shα x =
e x − e−x 2
(− 1) α n x n = α n x n 1 + (− 1)n+1 = α 2 n+1 x 2 n+1 α n xn e α x − e − αx =∑ −∑ ∑ ∑ 2 n! n! n! n =1 n =1 n =1 n =1 (2n + 1)! n
f ( x ) = chα x
Avem ch x =
chα x =
e x + e−x . Procedînd ca mai înainte avem : 2
∞ e α x + e −α x α 2n x 2n =∑ 2 n =1 (2n )!
3) f ( x ) = sin x
π⎞ ⎛ f ' ( x ) = cos x = sin ⎜ x + ⎟ 2⎠ ⎝ π⎞ ⎛ f ' ' ( x ) = − sin x = sin ⎜ x + 2 ⎟ 2⎠ ⎝ π⎞ ⎛ f (n ) ( x ) = sin ⎜ x + n ⎟ 2⎠ ⎝ π⎞ ⎛ f (n ) ( x ) = sin ⎜ x + n ⎟ < 1 2⎠ ⎝
44
(
)
Se aplică teorema 2.10 ∞
f (x ) = ∑ f n (x ) n =1
unde: f n
n ( xn nπ x − 0) n (x ) = . f (0 ) = sin
n!
f n ( x ) = (− 1)
n
xn = 2 n!
n!
x 2 n +1 şi prin urmare avem: (2n + 1)!
n ( − 1) x 2 n +1 sin x = ∑ n =1 (2n + 1)!
∞
(− 1)n α 2 n+1 x 2 n+1 (2n + 1)! n =1 ∞
În general : sin α x = ∑
nπ ⎞ ⎛ n ( pentru că (sin α x ) = α n sin ⎜ α x + ⎟ 2 ⎠ ⎝
prin inducţie ) 4) f ( x ) = cos x nπ ⎞ ⎛ Se demonstrează prin inducţie că f (n ) ( x ) = cos⎜ x + ⎟ 2 ⎠ ⎝ π⎞ ⎛ f (n ) ( x ) = cos⎜ x + n ⎟ < 1 ( se verifică teorema 2.10 ) şi deci 2⎠ ⎝ ∞
cos x = ∑
(x − a )n f (n ) (0) = n!
n =1
În general avem
∞
∑ (− 1)n n =1
x 2n (2n )!
n ( − 1) α 2 n x 2 n cos α x = ∑ (2n )! n =1
∞
nπ ⎞ ⎛ n (pentru că (cos α x ) = α n cos⎜ α x + ⎟ - prin 2 ⎠ ⎝
inducţie ) . 5). Să se dezvolte în serie Mac – Laurin funcţia :
(
)
1 f ( x ) = x arctg x − ln 1 + x 2 2 În mod uzual astfel de probleme nu se rezolvă calculînd derivata de ordinul n a funcţiei date. Practic se derivează ( se integrerază ) funcţia de atâtea ori până în momentul în care se găseşte o funcţie pentru care se cunoaşte dezvoltarea în serie Mac-Laurin . Apoi operăm în sens invers : integrăm ( derivăm ) de atâtea ori cât este necesar pentru a ajunge la funcţia dată. f ' ( x ) = arctg x +
x 1 2x − = arctg x 2 2 1+ x2 1+ x
45
(
∞ 1 1 f ' ' (x ) = = = − x2 ∑ 2 2 1+ x 1− − x n =1
(
)
∞
∞
f ' ( x ) = ∫ f ' ' ( x )dx = ∫ ∑ (− 1) x 2 n = ∑ (− 1) n
n =1
n
n
) = ∑ (− 1 ⋅ x ) = ∑ (− 1) x ∞
n
2
n =1
n
n =1
∞
2n
.
n =1
∞
2n ∫ x dx =∑ (− 1)
n =1
n
x 2 n +1 + C1 2n + 1
2 n +1 ∞ ⎞ ⎛ ∞ 1 n x f ' ( x )dx = ∫ ⎜⎜ ∑ (− 1) x 2 n +1 dx + C1 ∫ dx = + C1 ⎟⎟dx = ∑ (− 1) ∫ 2n + 1 2n + 1 n =1 ⎠ ⎝ n =1
n
f (x ) = ∫
∞
= ∑ (− 1) n =1
Avem x = 0 ⇒ f (0 ) = 0
n
x 2n + C x + C2 (2n + 1)(2n + 2) 1
f ' (x ) = arctg x
Avem x = 0 ⇒ f ' (0 ) = 0 x =0 (− 1)n x 2 n+ 2 + C x + C ⇒ C2 = 0 1 2 n =1 (2n + 1)(2n + 2 )
∞
f (x ) = ∑
x =0 x 2 n +1 f ' (x ) = ∑ (− 1) = C1 ⇒C1 = 0 2n + 1 n =1
∞
n
∞
Prin urmare f ( x ) = ∑ (− 1)
n
n =1
x 2n+2 (2n + 1)(2n + 2)
Numim serie de puteri o serie de forma : ∞
∑a n =0
n
x n = a 0 + a1 x +
+ an x n −
, x ∈ R , an ∈ R
Numărul a n se numeşte coeficientul termenului de rang n . Toate rezultatele privind seriile de funcţii sunt valabile şi pentru serii de puteri. Seriile de puteri au în plus următoarele proprietăţi : 1.Teorema lui Abel Pentru orice serie de puteri ∃R ≥ 0 ( numărul R se numeşte rază de convergenţă ) astfel
încât : a) ∀ x ∈ R , x < R , seria este absolut convergentă; b) ∀ x ∈ R , x < R , seria este absolut divergentă; c)
∀ x ∈ R , pentru care
x ≤ r < R , seria este uniform convergentă. Intervalul
(− R , R ) se numeşte intervalul de convergenţă al seriei.
46
2. Suma unei serii de puteri este o funcţie continuă în orice punct interior al intervalului de convergenţă. ∞
∑a
3. Dacă
n =0
n
x n este o serie de puteri şi R raza sa de convergenţă , atunci:
Seria derivatelor de ordinul k are aceeaşi rază de convergenţă; a) b) Suma 1 a seriei este indefinit derivabilă pe intervalul de convergenţă şi derivata sa de ordin k , este egală cu suma seriei derivatelor de ordin k ; Pentru determinarea razei de convergenţă a unei serii de puteri avem următoarele rezultate: Teorema lui Cauchy-Hadamard
Fie
∞
∑a n =0
R=
1
ω
n
x n o serie de puteri, R raza sa de convergenţă. Dacă ∃ lim n a n = ∞ , atunci n →∞
pentru 0 < ω < ∞ , R = 0 pentru ω = ∞ şi R = ∞ pentru ω = 0 Teorema lui D’Alembert ∞
Fie
∑a n =0
R=
x
∑ n =0
n
a n +1 = 1 , atunci n →∞ a n
x n o serie de puteri, R raza sa de convergenţă. Dacă ∃ lim
1 pentru l = ∞ şi R = ∞ pentru l = 0 . l Dezvoltări în serie . Fie I un interval , a un punct interior lui I şi f ∈ C ∞ (I ) . Seria (1)
f (n ) (a ) (x − a )n se numeşte serie Taylor a funcţiei f în punctul a . n!
2.2.4 Probleme rezolvate 1. Să se arate că şirul
( f n )n∈N
cu
f n (x ) =
f = 0.
sin 2nx este uniform convergent pe R către n2
Rezolvare:
sin 2nx 1 u ≤ → 0 , conform criteriului lui Weierstrass rezultă că: f n ⎯ ⎯→ 0. 3 3 n
Deoarece
2. Să se arate că şirul ( f n )n∈N cu f n ( x ) =
f ≡ 0.
1 e
2 nx
3n
este uniform convergent pe [ 0 , ∞ ) către
Rezolvare:
Pentru
0 ≤ x < ∞ , avem
e 2 nx ≥ 1 , aşadar
u Weierstrass rezultă că f n ⎯ ⎯→ 0.
47
f n (x ) <
1 , şi conform criteriului lui 3 →0 n
3. Să se arate că şirul
( f n )n∈N
cu f n ( x )
f ≡ 0.
2x este uniform convergent pe [1, 2] către 3x + n
Rezolvare :
4 4 u < → 0 . Conform criteriului lui Weierstrass rezultă f n ⎯ ⎯→ 0 6+n n
f n (x ) ≤
(
)
4. Să se arate că şirul de funcţii ( f n )n∈N ; f : [0,1] → R, f n ( x ) = x n 1 − x n , este convergent, însă nu uniform convergent pe [0,1] . Rezolvare: 0 ≤ x < 1 . Deoarece lim x n = 0 , rezultă lim f n ( x ) = 0 , apoi
Fie
n →∞
n→∞
f n (1) = 0 de unde
lim f n (1) = 0 . Deci lim f n ( x ) = 0 , ∀ x ∈ [0,1] . Şirul nu este uniform convergent. n→∞
n→∞
1
− 1 1 şi x n = 2 n ∈ [0,1] avem f n ( x ) = , ∀ n ∈ N , aşadar inegalitatea Într-adevăr, luând ε < 4 4 din anunţul convergenţei uniforme nu este satisfăcută pentru x = x n .
2.2.5 Probleme propuse 1. Să se determine intervalul de convergenţă pentru următoarele serii de puteri:
a)
∞
3n x n
∑ (n + 1)
3
n=0
;
b)
∞
xn ; ∑ n n n=0 4 + 5
n3 n + 2 n n x . c) ∑ n2 n =1 ∞
Indicaţii:
3n
a) a n =
(n + 1)
3
∞
, ω = lim n→∞
a n +1 1 ⎛ 1 1⎞ = 3, R = , ⎜ − , ⎟ intervalul de convergenţă ; an 3 ⎝ 3 3⎠
1 1 ∞ x = convergentă, - convergentă . ,∑ 3 3 n =0 (n + 1)3 (n + 1) 1
1 x=− , 3
n ∑ (− 1)
b) a n =
a 1 1 , ω = lim n +1 = , R = 5.(− 5,5) intervalul de convergenţă ; n n→∞ a 5 4 +5 n
n=0
∞
n
x = −5, ∑ (− 1) n=0
n
∞ 5n 5n = divergentă , x 5 , - divergentă. ∑ n n 4n + 5n n =0 4 + 5
48
a n +1 n5 n + 2 n 1 ⎛ 1 1⎞ ω = = 5 ; R = , ⎜ − , ⎟ intervalul de convergenţă ; , lim 2 n → ∞ an 5 ⎝ 5 5⎠ n n n ∞ 1 1 ∞ n5 n + 2 n n n5 + 2 x = − , ∑ (− 1) = convergentă; - divergentă. ,∑ x 5 n =1 5 n =1 n 2 5 n n 2 5n
c) a n =
2. Să se studieze caracterul convergenţei seriei : ∞
∑ n =1
sin nx n3 + x 2
, x∈R.
Indicaţii:
Se aplică criteriul lui Weierstrass , seria este uniform convergentă. 3. Să se arate că şi funcţiile următoare sunt dezvoltabile în seria de puteri şi să se găsească această dezvoltare , specificându-se intervalul în care este valabilă.
a) f ( x ) = ln
1+ x , x < 1; 1− x
c) f ( x ) = ln 5 1 + 3 x, x > −
b) f ( x ) = 3 1 + x 2 , x ∈ R ;
1 ; 3
d) f ( x ) =
3x , x ∈ R \ {− 3,−2} . x + 5x + 6 2
Indicaţii :
(
a) f ' ( x ) = 1 − x 2
)
−1
, pentru x < 1
x 2 n +1 , x < 1. n = 0 2n + 1 ∞
f (x ) = ∑
∞
b) f ( x ) = 1 + ∑ (− 1) n =1
∞
n
2 ⋅ 5 ⋅ 8 ⋅ ⋅ ⋅ (3n − 4 ) , x <1 3 n ⋅ n!
3n n x . 5n n =1 ∞ 1 n +1 ⎛ 1 d) f ( x ) = 3∑ (− 1) ⎜ n − n 3 ⎝2 n=0
c) f ( x ) = ∑ (− 1)
n
⎞ n ⎟x , x < 2. ⎠
2.3 Funcţii de mai multe variabile 2.3.1 Considerente privind funcţiile reale de variabilă vectorială şi funcţiile vectoriale de variabile vectorială Considerăm mulţimea R n = {X = ( X 1 , X 2 ,....., X n ), X i ∈ R, i = 1, n. . Această mulţime poate fi înzestrată , într-o primă fază , cu două operaţii : adunarea şi înmulţirea cu un scalar. Adunarea elementelor din R n
49
Fie x = ( x1 , x 2 ,...., x n ) ∈ R n , y = (y1 , y 2 ,...., y n ) ∈ R n x + y = ( x1 + y1 , x 2 + y 2 ,...., x n + y n ) ∈ R n Înmulţirea cu un scalar a unui element din R n Fie x = ( x1 , x 2 ,...., x n ) ∈ R n , α ∈ R
α ⋅ x = (αx1 , αx 2 ,...., αx n ) ∈ R n
Împreună cu aceste două operaţii, mulţimea R n devine spaţiu vectorial peste corpul numerelor reale ( adică R n , R,⋅ = spaţiu vectorial ).
(
)
Pe R n se poate introduce şi un produs scalar . x = ( x1 , x 2 ,..., x n ) ∈ R n , y = ( y1 , y 2 ,..., y n ) ∈ R n n
< x, y >= ∑ xi y i ⇒< x, y >= x1 y1 + i =1
+ xn y n
(2.20)
Împreună cu acest produs scalar, R n capătă o structură de spaţiu prehilbertian. Pe R n se poate introduce şi o normă: x = ( x1 , x 2 ,..., x n ) x = < x, y > ⇒ x =
n
∑x i =1
2 i
⇒ x = x12 + x 22 +
+ x n2
(2.21)
Cu această normă , spaţiul R n devine spaţiu normat. Cu ajutorul normei date de egalitatea (2.21) , pe mulţimea R n se poate introduce şi o metrică ( distanţă ): x = ( x1 , x 2 ,..., x n ) ∈ R n , y = ( y1 , y 2 ,...., y n ) ∈ R n d ( x, y ) = x − y =⇒ d ( x, y ) =
n
∑ (x i =i
d ( x, y ) =
(x1 − y1 )2 + (x 2 − y 2 )2 +
i
− yi )
2
+ (x n − y n )
2
Cu metrica dată de egalitatea (2.22) spaţiul R n devine spaţiu metric. Concluzie
Spaţiul R n este :
50
(2.22)
1) Spaţiu vectorial peste R n
2) Spaţiu prehilbertian , cu produsul scalar < x, y >= ∑ xi y i ; i =1
3) Spaţiu normat , cu norma x =
n
∑x i =1
4) Spaţiu metric , cu metrica d (x, y ) =
2 i n
∑ (x i =i
− yi ) . 2
i
În continuare vom defini funcţii pe R n (sau submulţimi ale lui R n ) şi vom analiza câteva proprietăţi mai importante legate, în principal, de operaţiile ce se pot defini cu aceste funcţii. Definiţia 2.10 Fie X ⊆ R n Se numeşte funcţie reală de variabilă vectorială, orice funcţie f : X → R Justificarea faptului că este vectorială se realizează prin aceea că argumentul x este vector n din R . Dacă x = ( x1 , x 2 ,...., x n ) , valoarea funcţiei f în acest punct se notează cu f (x ) sau f ( x1 , x 2 ,..., x n ) . Graficul unei astfel de funcţii este:
G = {( x1 , x 2 ,..., x n ), f ( x1 , x 2 ,..., x n )}∈ R n +1 . Definiţia 2.11 Fie funcţiile f1 , f 2 ,...., f m : X → R. Se numeşte funcţie vectorială de variabilă vectorială, funcţia notată f ( f 1 , f 2 ,..., f m ) sau f = ( f1 , f 2 ,...., f m ) şi definită prin corespondenţa:
x ∈ X → ( f 1 ( x ), f 2 ( x ),..., f m ( x ) = f ( x ) ∈ R m Justificarea acestei definiri se explică prin faptul că atât argumentul, cât şi valoarea funcţiei sunt vectori ( din R n , respectiv R m ) . Atât funcţiile reale de variabilă vectorială, cât şi funcţiile vectoriale de variabilă vectorială sunt, de fapt funcţii de mai multe variabile vectoriale sunt un caz particular al funcţiilor vectoriale de variabile vectoriale ( cazul m = 1 ). Din acest motiv, operaţiile care le vom introduce le vom face numai privitor la funcţiile vectoriale de variabilă vectorială : Adunarea : Fie X ⊆ R n şi funcţiile f1 , g i : X → R, i = 1, n
f ( f 1 , f 2 ,..., f m ), g ( g1 , g 2 ,..., g m ) ( adică f , g : X → R m ) Adunarea funcţiilor f şi g se defineşte astfel:
51
(f
+ g )( x ) = f ( x ) + g ( x )
(2.23)
Dar f ( x ) = ( f 1 ( x ), f 2 ( x ),..., f m ( x )) g ( x ) = (g1 ( x ), g 2 ( x ),..., g m (x )) În baza egalităţii (2.23) avem:
(f
+ g )( x ) = ( f1 ( x ) + g1 ( x ), f 2 ( x ) + g 2 ( x ),..., f m (x ) + g m ( x ))
Operaţia de adunare a funcţiilor f şi g se notează astfel: f + g = ( f 1 + g1 , f 2 + g 2 ,..., f m + g m ) Înmulţirea cu un scalar Fie X ⊆ R n , f i : X → R, i = 1, m
şi
funcţia
vectorială
de
variabilă
vectorială
f ( f 1 , f 2 ,..., f m ) : X ⊆ R → R . Fie λ ∈ R Înmulţirea cu scalarul λ a funcţiei f se defineşte astfel: n
m
(λ f )(x ) = λ f (x ),
∀ x∈ X
(2.24)
Dar f ( x ) = ( f 1 ( x ), f 2 ( x ),..., f m ( x )) În baza egalităţii (2.24) avem:
λ f ( x ) = (λ f1 ( x ), λ f 2 (x ),..., λ f m ( x )) Înmulţirea cu scalarul λ a funcţiei f se notează astfel:
λ f = (λ f1 , λ f 2 ,..., λ f m ) Compunerea Fie mulţimile X ⊆ R n , Y ⊆ R m , Z ⊆ R p şi funcţiile
f ( f 1 , f 2 ,..., f n ) : X → Y g ( g1 , g 2 ,..., g n ) : Y → Z Compunerea funcţiilor f şi g se defineşte astfel:
(g
x )( x ) = g ( f (x ))
Avem: f ( x ) = ( f 1 ( x ), f 2 ( x ),..., f m ( x )) 52
(2.25)
g ( y ) = (g1 ( y ), g 2 ( y ),..., g p ( y )) În baza egalităţii (2.25) avem:
(g
(g f )(x ) = g1 ( f (x )), g 2 ( f (x )),..., g p ( f (x )) f )( x ) = (g1 ( f1 ( x ), f 2 ( x ),..., f m ( x )), g 2 ( f1 ( x ), f 2 ( x ),..., f m ( x )),..., g p ( f 1 ( x ), f 2 ( x ),..., f m ( x )))
Compunerea funcţiilor f şi g se notează astfel: g
f = g( f )
2.3.2 Problema limitei şi a continuităţii Problema liniară Analizăm doar cazul funcţiilor vectoriale de variabilă vectorială. Cazul funcţiilor reale de variabilă vectorială este un caz particular al celui precedent şi se obţine făcând m = 1 . În cazul limitelor vor fi analizate două cazuri : 1. limita globală şi limita pe componente; 2. limite iterate a. Limita globală şi limita pe componente Considerăm x ⊆ R n şi funcţiile f i : X → R, i = 1, m . Fie funcţia vectorială de variabilă
vectorială f ( f 1 , f 2 ,..., f m ) : X → R m şi a punctelor de acumulare al mulţimii X .
Observaţia 2.11 a este punct de acumulare pentru mulţimea X dacă în orice vecinătate V a punctului a
avem:
(V \ {a} ∩ X
≠
(2.26)
(adică orice vecinătate am considera pentru punctul a , în această vecinătate se mai găseşte cel puţin un element din X diferit de a ). Definiţia 2.12
l ∈ R m se zice limita globală a funcţiei f în punctul a dacă ∀ ε > 0, ∃μ (ε ) aşa încât ∀ x cu proprietatea x ≠ a, x − a ≤ μ (ε ) să avem f ( x ) − 1 < ε (2.27) Faptul că l este limita funcţiei f în punctul a îl notăm astfel: l = lim f ( x ) x →a
(2.28)
Dacă vectorii x şi a au componentele cunoscute x = ( x1 , x 2 ,..., x n ), a = (a1 , a 2 ,..., a n ) atunci egalitatea (2.28) se poate scrie sub forma: l=
lim
x1 → a1 , x2 → a2 , xn → a n
f ( x1 , x 2 ,..., x n )
53
(2.29)
Definiţia 2.13 li se numeşte limita în punctul a a componentei f i a funcţiei f dacă ∀ ε > 0, ∃μ (ε ) aşa
încât ∀ x cu proprietatea x ≠ a, x − a ≤ μ (ε ) avem: f i (x ) − li < ε .
Dacă li este limita în punctul a a componentei f i , notăm acest lucru li = lim f i ( x ) sau li = x→a
lim
x1 → a1 , x2 → a2 , xn → an
f i ( x1 , x 2 ,..., x n )
(2.30)
Dacă l1 , l 2 ,..., l m sunt limitele în punctul a ale componentelor f1 , f 2 ,..., f m ale funcţiei f , vom nota cu l vectorul care are aceste componente , deci l = (l1 , l 2 ,..., l m ) . Se poate arăta că acest vector l care are componentele date de (2.29) sau (2.30) coincide cu vectorul l dat de egalitatea (2.28). Astfel spus, o funcţie are limita l într-un punct a dacă funcţiile componente au limită în acel punct. Limitele funcţiilor componente sunt la rândul lor componentele vectorului limită al funcţiei vectoriale f în punctul considerat. Proprietăţi ale limitelor de funcţii
1. Dacă l = lim f ( x ) atunci pentru orice şir (x n )n ⊂ R n , x n ≠ a, lim x n = a avem egalitatea l = lim f ( x n ) ;
n
x→ a
xn → a
2. l = lim f ( x ) atunci x→ a
l = lim f (x ) ; x→ a
3. Dacă funcţiile f şi g au limite în punctul a , atunci funcţiile f + g , f ⋅ g , λ f , şi λ g (λ ∈ R ) au de asemenea limită în punctul a şi au loc egalităţile: lim( f + g )( x ) = lim f ( x ) + lim g ( x ) x→a
x→a
x→a
lim( f ⋅ g )( x ) = lim f ( x ) ⋅ lim g (x ) x→a
x→a
x→a
lim(λ f )(x ) = λ lim f ( x ) x →a
x →a
lim(λ g )( x ) = λ lim g ( x ) x→a
x→a
Presupunem că au sens operaţiile din membrul drept. Limite iterate
Fie funcţia f : X ⊆ R n → R şi a = (a1 , a 2 ,..., a n ) un punct de acumulare al mulţimii X ; în afara limitelor prezentate mai înainte se pot prezenta şi aşa-numitele limite iterate (succesive). a fiind punct de acumulare se poate pune problema următoarei limite:
54
~ li = lim f (x1 , x 2 ,..., x n ) . Evident
~ li
x1 → a1
x1 , x 2 ,..., xi −1 , xi +1 ,..., x n rămase ~ l j = lim lim f ( x1 , x 2 ,..., x n ) .
.
În
va depinde de
continuare
se
poate
ai
şi celelalte variabile
pune
problema
limitei
x j → a j xi → a i
~ Evident l j va depinde de variabilele a j , ai şi celelalte n − 2 componente rămase, acestea
fiind x1 , x 2 ,..., xi −1 , xi +1 ,..., x j −1 , x j +1 ,..., x n . Continuând în acest mod, după n etape se ajunge să calculăm n limite succesive, rezultatul fiind evident un număr real. Vom numi aceste limite succesive, limite iterate, ordinea de citire a variabilelor fiind cea inversă modului de calcul (adică lim lim f ( x1 , x 2 ) vom spune că este limita x2 → a 2 x1 → a1
iterată a funcţiei f în raport cu variabilele x1 şi x 2 . Pentru o funcţie f ( x1 , x 2 ,..., x n ) se pot calcula în punctul a, a = (a1 , a 2 ,..., a n ) în total n! limite iterate. Se pune problema dacă există vreo legătură între aceste limite şi valoarea limitei în punctul a. Teorema 2.13 Dacă există funcţiei într-un punct de acumulare dat a şi această valoare este egală cu una din limitele iterate atunci toate celelalte limite iterate există şi sunt egale. Reciproca teoremei nu este adevărată. Exemplul 1
f : R2 → R ⎧ ⎪ f ( x, y ) = ⎨ ⎪⎩0 vom calcula limitele iterate:
x2 y , ( x, y ) ≠ 0 x2 + y , ( x, y ) = 0
⎛ x2 ⋅ 0 ⎞ ⎟ = lim(0 ) = 0 lim lim f (x, y ) = lim⎜⎜ 2 x →0 y →0 x →0 x + 0 ⎟ ⎝ ⎠ x →0 ⎛ 02 ⋅ y ⎞ ⎟ = lim(0 ) = 0 lim lim f (x, y ) = lim⎜⎜ 2 y →0 x →0 y →0 0 + y ⎟ ⎝ ⎠ y →0
şi limita lim f ( x, y ) x →0
y →0
Pentru a calcula valoarea limitei funcţiei f y = mx 2 , m ∈ R . Avem lim f ( x, y ) = lim x →0
y →0
x →0
x 2 mx 2 mx 2 = lim =0 x 2 mx 2 x →0 1 + m
55
în origine, ne vom situa pe parabola
Am obţinut lim lim f (x, y ) = lim lim f ( x, y ) = lim f (x, y ) = 0 x →0 y →0
x →0
y →0 x →0
y →0
Deci limitele iterate coincid cu valoarea limitei în origine. Exemplul 2
f : R2 → R
⎧ x2 y ⎪ , ( x, y ) ≠ 0 f ( x, y ) = ⎨ x2 + y2 ⎪⎩ 0 , ( x, y ) = 0 ⎛ x2 ⋅ 0 ⎞ ⎟ = lim(0 ) = 0 lim lim f (x, y ) = lim⎜⎜ 2 x →0 y →0 x →0 x + 0 ⎟ ⎝ ⎠ x →0 ⎛ 02 ⋅ y lim lim f (x, y ) = lim⎜⎜ 2 y →0 x →0 y →0 0 + y 2 ⎝
⎞ ⎟⎟ = lim(0 ) = 0 ⎠ y →0
Ne situăm pe aceeaşi formaţie de parabole de mai înainte y = mx 2 lim f ( x, y ) = lim x →0
y →0
x →0
x 2 mx 2 m m = lim = 4 4 2 x →0 1 + m x + mx 1 + m2
Deoarece limita găsită depinde de valoarea parametrului m deci depinde de alegerea curbei (care trece prin origine ) înseamnă că această limită nu există (pentru că dând valori arbitrare lui m obţinem rezultate deosebite, iar limita dacă există este unică) : lim lim f (x, y ) = lim lim f ( x, y ) = lim f (x, y ) = 0 x →0 y →0
x →0
y →0 x →0
y →0
Continuitatea funcţiilor de mai multe variabile. Deoarece funcţiile reale de variabile vectoriale sunt un caz particular al funcţiei vectoriale de variabilă vectorială , vom analiza doar cazul acestora din urmă. Există două cazuri : a) Continuitatea globală pe componente Fie X ⊆ R n , f i : X → R, i = 1, m . Considerăm funcţia vectorială de variabilă vectorială
f ( f 1 , f 2 ,..., f n ) : X → R m şi punctul a ∈ R .
Definiţia 2.14 Funcţia f se zice că este continuă în punctul a dacă ∀ ε > 0, ∃μ (ε ) aşa încât ∀ x cu proprietatea x − a < μ (ε ) să avem : f ( x ) − f (a ) < ε .
56
Faptul că funcţia f este continuă în punctul a îl notăm : lim f ( x ) = f (a ) x →a
(2.31)
Dacă x = ( x1 , x 2 ,..., x n ), a = (a1 , a 2 ,..., a n ), egalitatea (2.31) devine: lim f ( x1 , x 2 ,..., x n ) = f (a1 , a 2 ,...., a n )
x → a1
(2.32)
x2 → a2 xn → an
continuitatea pe componente a funcţiilor punctul a = (a1 , a 2 ,..., a n ) ∈ X . Definiţia 2.15 Funcţia f i : X ⊆ R n → R, i = 1, m încât ∀ x cu proprietatea:
f1 , f 2 ,..., f n : X ⊆ R n → R se defineşte asemănător în
este continuă în punctul a dacă ∀ ε > 0 , ∃μ (ε ) aşa
x − a < μ (ε ) ⇒ f ( x ) − f (a ) < ε
(2.33)
Din inegalitatea (2.33) obţinem dând valori din i următoarele inegalităţi: f 1 (x ) − f 1 (a ) < ε ⎫ ⎪ f 2 (x ) − f 2 (a ) < ε ⎪ ⎪ f 3 ( x ) − f 3 (a ) < ε ⎬ ⎪ ⎪ f n ( x ) − f n (a ) < ε ⎪⎭
(2.34)
evident, dacă variabila x verifică inegalitatea x − a < μ (ε ) . Observaţia 2.12 Se poate arăta că funcţia
f = ( f 1 , f 2 ,..., f m ) este continuă în a = (a1 , a 2 ,..., a n ) dacă şi numai dacă funcţiile componente f1 , f 2 ,..., f m sunt continue în punctul a (astfel spus continuitatea globală într-un punct este echivalentă cu continuitatea pe componente în acel punct). Definiţia 2.16 Funcţia f = ( f1 , f 2 ,..., f n ) este continuă pe mulţimea X dacă este continuă în fiecare punct al acesteia. Este evident că dacă funcţia f este continuă pe mulţimea X atunci şi funcţiile componente f1 , f 2 ,..., f n sunt continue pe mulţimea X (proprietatea are loc şi în sens invers)
57
Continuitatea parţială Fie funcţia vectorială de variabilă vectorială
punctul a = (a1 , a 2 ,..., a n ) ∈ R n .
f = ( f 1 , f 2 ,..., f m ), f : X ⊆ R n → R m şi
Fie vectorul x = ( x1 , x 2 ,..., x n ) ∈ R n în care fixăm variabilele x1 , x 2 ,..., xi −1 , xi −l ,..., x n în felul următor : x1 = a1 x2 = a2
xi −1 = ai −1 xi +1 = ai +1 xn = an Definiţia 2.17 Funcţia f este continuă în punctul a în raport cu variabila x , dacă ∀ ε > 0, ∃μ (ε ) aşa încât ∀ x ∈ X : xi − ai < μ (ε ) , avem: f (a1 , a 2 ,..., a i −1 , xi ai +1 ,..., a n ) − f (a1 , a 2 ,..., a n ) < ε
Observaţia 2.13 Se poate arăta că dacă funcţia vectorială de variabilă vectorială f este continuă parţial în raport cu variabilele xi în punctul a , atunci şi funcţiile componente f1 , f 2 ,..., f m sunt continue în punctul a în raport cu variabila xi . Teorema 2.14 Dacă funcţia f este continuă global în punctul a atunci ea este şi continuă parţial în acest punct în raport cu fiecare din variabilele x1 , x 2 ,..., x n . Reciproca acestei teoreme este falsă. Exemplu :
⎧ 2x 2 y ⎪ , ( x, y ) ≠ 0 f ( x, y ) = ⎨ x 2 + y 2 ⎪⎩ 0 , (x, y ) = 0
Analizăm continuitatea globală şi continuitatea parţială în punctul (0,0 ) . Continuitatea parţială
a) în raport cu x lim f ( x,0) = lim x →0
x →0
2x 2 ⋅ 0 = 0 = f (0,0) x4 + 02 58
b) în raport cu y 2 ⋅ 02 ⋅ y = 0 = f (0,0) y →0 0 4 + 3 y 2
lim f ( y,0) = lim y →0
Concluzie : f este continuă parţial în raport cu ambele variabile în punctul (0,0 ) . Continuitatea globală : analizăm problema limitei în (0,0 ) considerând familia de parabole y = mx 2 , m ∈ R.
lim f ( x, y ) = lim x →0 y →0
x →0 y →0
2x 2 y 2 x 2 mx 2 2m 2m lim = = lim = 4 2 4 2 4 2 x →0 x + 3m x x →0 1 + 3m x + 3y 1 + 3m 2
Deoarece această limită depinde de alegerea parametrului m înseamnă că în relitate ea nu există ; neexistând limită globală în (0,0 ) înseamnă că funcţia nu este continuă în (0,0 ) . Concluzii : 1) f continuă parţial în raport cu ambele variabile în punctul (0,0 ) 2) f nu este continuă global în punctul (0,0 ) Proprietăţi ale funcţiilor continue 10 . Dacă funcţia f este continuă în a , atunci este mărginită pe orice vecinătate a acestui punct. 2 0 . Dacă funcţia f este continuă în a , atunci există limita globală „ l ” în acest punct şi are loc egalitatea l = f (a ) 3 0 . Dacă funcţia f este continuă în a , atunci şi funcţia f este continuă în a .
4 0 . Dacă funcţiile f , g sunt continue în a , atunci şi funcţiile f + g şi f ⋅ g sunt continue în a . 5 0 . Dacă funcţia f este continuă în a şi λ ∈ R atunci funcţia λ f este continuă în a . 6 0 . Dacă funcţia f este continuă pe o mulţime compactă C ⊂ X (adică C este mărginită şi închisă) atunci f este mărginită şi îşi va atinge marginile pe mulţimea C . Observaţia 2.14 Schematic, legătura între limite şi continuitate este următoarea :
59
continuitate parţială
limite parţiale
continuitate globală
limite globale
continuitate pe componente
limite pe componente
limite iterate
2.3.3 Derivarea funcţiilor de mai multe variabile Derivate de ordin superior , derivarea funcţiilor compuse. Exemple de calcul Acest tip de derivare este o generalizare a noţiunii de derivată studiată în liceu. Fie f : X ⊆ R → R şi „ a ” punct interior mulţimii X . Din liceu se ştie că funcţia f este derivabilă în punctul a dacă există şi este finită
lim
f (x ) − f (a )
x →0
x−a
Valoarea acestei limite se notează cu f ' (a ) şi admite următoarea interpretare geometrică : Prin urmare derivata funcţiei în a reprezintă panta tangentei dusă la graficul funcţiei în punctul (a, f (a )) . Noţiunea de derivată prezentată anterior se poate generaliza prin introducerea noţiunii de derivată parţială : f : X ⊆ R 2 → R şi (a, b ) punct interior mulţimii X Definiţia 2.18 Funcţia f se zice derivabilă parţial în punctul (a, b ) în raport cu variabila x dacă există şi este finită limita :
lim x→a
f ( x, b ) − f (a, b ) x−a
Valoarea acestei limite se notează f ' x (a, b ) sau funcţiei f în raport cu x în punctul (a, b ) .
∂f (a, b ) şi se numeşte derivata parţială a ∂x
Definiţia 2.19 Funcţia f se zice derivabilă parţial în punctul (a, b ) în raport cu y dacă există şi este finită limita următoare :
60
lim y →b
f (a, y ) − f (a, b ) . y −b
Valoarea acestei limite se notează f ' y (a, b ) sau funcţiei f în raport cu y în punctul (a, b ) .
∂f (a, b ) şi se numeşte derivata parţială a ∂y
Definiţia 2.20 Funcţia f este derivabilă cu x pe X (respectiv y pe Y) dacă este derivabilă parţial în raport cu x (respectiv cu y) în orice punct din X. Aceste noţiuni pot fi generalizate atât pentru funcţiile reale de variabilă vectorială cât şi pentru funcţiile vectoriale de variabilă vectorială. Pentru funcţii reale de variabilă vectorială Fie funcţia reală de variabilă vectorială f : X ⊆ R n → R şi a = (a1 , a 2 ,..., a n ) un punct
interior mulţimii X. Construim vectorul variabil x = ( x1 , x 2 ,..., x n ) .
Definiţia 2.21 Funcţia f se zice derivabilă parţial în punctul a în raport cu variabila x k dacă există şi este finită limita: lim
xk → ak
f (a1 , a 2 ,..., a k −1 , x k , a k −1 − a n ) − f (a1 , a 2 ,..., a k −1 , a k , a k +1 ,..., a n ) xk − ak
∂f (a1 , a 2 ,..., a n ) sau f x'k (a1 , a 2 ,..., a n ) şi se numeşte ∂x k derivata parţială a funcţiei f în raport cu variabila x k în punctul a.
Valoarea acestei limite se notează
Definiţia 2.22 Funcţia f este derivabilă pe mulţimea X dacă este derivabilă parţial în raport cu fiecare componentă a vectorului variabil x în orice punct a ∈ X . Exemplu
Considerăm f : R 2 → R, f ( x, y ) = e x
2
+ cos 2 y
. Să se calculeze
∂f (0,0) şi ∂f (0, π 2) . ∂x ∂y
∂f f ( x,0 ) − f (0,0 ) e x +1 − e 2 xe x +1 (0,0) = lim Avem = lim = lim =0 x →0 x →0 x →0 ∂x 1 x−0 x 2 f (0, y ) − f (0, π 2) ∂f − 2 sin y cos y e cos y −1 (0, π 2) = ylim = lim = lim =0 →π 2 y →π 2 y − π 2 y →π 2 ∂x 1 y −π 2 2
2
Observaţia 2.15 Pentru a evita calculul derivatelor parţiale cu ajutorul limitelor se poate deriva direct, ţinând cont de variabila curentă (adică variabila în raport cu care se efectuează operaţia de trecere la limită) este singura mărime variabilă care intervine în calcul, celelalte componente ale vectorului variabil
61
∂f , ( f fiind funcţie x şi y) vom ∂x considera x mărimea variabilă (variabilă curentă), iar pe y îl considerăm parametru. Dacă vom ∂f calcula vom considera x parametru şi y variabil. ∂y
sunt considerate constante. De exemplu atunci când calculăm
Pentru funcţii vectoriale de variabilă vectorială Fie funcţia f = ( f1 , f 2 ,..., f m ); f : X ⊆ R n → R m şi punctul interior ,,a” al mulţimii X. Definiţia 2.23 Funcţia f se zice derivabilă parţial în raport cu variabila curentă x k în punctul a = (a1 , a 2 ,..., a n ) dacă există şi este finită: lim
xk → ak
f (a1 , a 2 ,..., a k −1 , x k , a k −1 − a n ) − f (a1 , a 2 ,..., a k −1 , a k , a k +1 ,..., a n ) xk − ak
Valoarea acestei limite se notează Practic are loc egalitatea
∂f (a1 , a 2 ,..., a n ) sau f x'k (a1 , a 2 ,..., a n ) . ∂x k
⎛ ⎞ ∂f (a ) = ⎜⎜ ∂f1 (a ),..., ∂f m (a )⎟⎟ ∂x k ∂x k ⎝ ∂x k ⎠
Adică derivata parţială a unei funcţii vectoriale de variabilă vectorială în punctul a în raport cu variabila x k este de fapt un vector din Rm care are drept componente derivatele componentelor f1 , f 2 ,..., f m ale funcţiei f în punctul a în raport cu variabila x k . Exemplu Să se calculeze derivata lui f în raport cu x în punctul (0, 1) ştiind că f ( x, y ) = sin 2 xy, x 2 + y 2 . Avem: ∂f (0,1) = ⎛⎜ ∂f1 (0,1), ∂f 2 (0,1)⎞⎟ ∂x ∂x ⎝ ∂x ⎠ x =0 x =0 ∂f1 ∂f 2 (0,1) = 2 sin xy ⋅ cos xy ⋅ y y =1 = 0; (0,1) = 2 x y =1 = 0 ∂x ∂x ∂f (0,1) = ⎛⎜ ∂f1 (0,1), ∂f 2 (0,1)⎞⎟ = (0,0) ∂x ∂x ⎝ ∂x ⎠
(
)
b) Derivate de ordin superior Considerăm f : X ⊆ R n → R m . Presupunem că f este derivabilă parţial în raport cu ambele variabile x şi y în orice punct a ∈ X , prin urmare putem considera funcţiile f x' şi f y' : X → R ( f x' şi f y' reprezintă funcţiile obţinute prin derivarea parţială a lui f în raport cu x
respectiv y). La rândul lor şi pentru aceste funcţii se poate pune problema derivabilităţii în raport cu x sau y. Se adoptă următoarele notaţii:
62
∂ ⎛ ∂f ⎞ not ∂ 2 f = f x' ⎜ ⎟= ∂x ⎝ ∂x ⎠ ∂x 2
( )
' x
∂ ⎛ ∂f ⎞ not ∂ 2 f = f x' ⎜ ⎟= ∂y ⎝ ∂x ⎠ ∂y∂x ∂ ⎛ ∂f ⎞ not ∂ 2 f ⎜⎜ ⎟⎟ = = f y' ∂x ⎝ ∂y ⎠ ∂x∂y
( )
' y
( )
' x
= f xx' = f xy'
= f yx'
' ∂ ⎛ ∂f ⎞ not ∂ 2 f ⎜⎜ ⎟⎟ = 2 = f y' y = f yy' ∂y ⎝ ∂y ⎠ ∂y Derivatele astfel introduse se numesc derivate parţiale de ordin 2 (sau derivate parţiale mixte ∂2 f ∂2 f şi ). de ordin 2: ∂x∂y ∂y∂x O problemă importantă care apare în legătură cu studiul derivatelor parţiale este aceea de a stabili condiţiile în care derivatele parţiale sau mixte sunt egale.
( )
Teorema 2.15 (Schwatz) Dacă sunt îndeplinite condiţiile: 1) f este continuă în punctul (a, b ) ∈ X ; 2) există derivate parţiale mixte într-o vecinătate V (a, b ) a punctului (a, b ) , atunci are loc egalitatea acelor derivate parţiale mixte, adică: 2 ∂2 f (a, b ) = ∂ f (a, b ) ∂x∂y ∂y∂x
Observaţia 2.16 Acest rezultat se poate generaliza astfel:
Dacă f este continuă în punctul (a, b ) , ∃
(a, b ) atunci are loc egalitatea:
∂ m+ k f ∂ m+ k f şi ∂x m ∂y k ∂y k ∂x m
într-o vecinătate a punctului
∂ m+ k f ∂ m+ k f (a, b ) = k m (a, b ) ∂x m ∂y k ∂y ∂x
Derivatele parţiale de ordin superior se pot introduce asemănător şi pentru funcţii de mai mult de 2 variabile. Fie f : X ⊆ R n → R şi x = ( x1 , x 2 ,..., x n ) vector variabil curent. Dacă derivăm f în raport cu : x1 de k1 ori x 2 de k 2 ori x n de k n ori
Atunci se noteză concentrat această derivată parţială în raport cu variabilele (x1 , x 2 ,..., x n ) astfel:
63
∂k f ∂x1k1 ∂x 2k 2 ...∂x nk n
unde: k = k1 + k 2 + ... + k n
Legat de derivabilitatea parţială de ordinul I şi ordin superior în probleme aplicative apar uzual două noţiuni importante: gradientul unei funcţii şi matricea hessiană. Gradientul: Fie f : X ⊆ R n → R şi punctul x ∈ a = (a1 , a 2 ,..., a n ) . Prin definiţie gradientul funcţiei f în punctul a este vectorul notat grad f (a ) şi dat de egalitatea: ⎛ ∂f ⎞ (a ), ∂f (a )..., ∂f (a )⎟⎟ grad f (a ) = ⎜⎜ ∂x 2 ∂x n ⎝ ∂x1 ⎠
Matricea hessiană – este matricea notată Hess f (a ) şi dată de următoarea egalitate:
⎛ ∂2 f ∂2 f ⎜ ( ) (a ) a 2 ∂x1 ∂x 2 ⎜ ∂x1 ⎜ ∂2 f ∂2 f ( ) (a ) a ⎜ Hess f (a ) = ⎜ ∂x 2 ∂x1 ∂x 22 ⎜ 2 ⎜ ∂2 f (a ) ∂ f (a ) ⎜⎜ ∂x n ∂x 2 ⎝ ∂x n ∂x1
⎞ ∂2 f (a )⎟ ∂x1 ∂x n ⎟ ⎟ ∂2 f (a )⎟ ∂x 2 ∂x n ⎟ ⎟ 2 ⎟ ∂ f ( ) a ⎟⎟ ∂x n2 ⎠
Exemplu: Să se determine gradientul şi matricea hessiană asociate funcţiei f ( x, y ) = e xy în punctul (0,
1). Gradientul
⎛ ∂f ⎞ ∂f grad f (0,1) = ⎜⎜ (0,1), (0,1). ⎟⎟ ∂y ⎝ ∂x ⎠ x =0
y =1 ∂f ∂f = ye xy ⇒ (0,1) = 1 ⋅ e 0 = 1 ∂x ∂x
x =0
y =1 ∂f ∂f = xe xy ⇒ (0,1) = 0 ⋅ e 0 = 0 ∂y ∂y grad f (0,1) = (1,0 )
Matricea hessiană
64
⎞ ⎛ ∂2 f ∂2 f ⎜ 2 (0,1) (0,1)⎟ ∂x∂y ⎟ ⎜ ∂x Hess f (0,1) = ⎜ 2 2 ⎟ ∂ f ∂ f ⎟ ⎜ ( ( ) 0,1) 0 , 1 2 ⎟ ⎜ ∂y∂x y ∂ ⎠ ⎝ ∂2 f ∂ ⎛ ∂f ⎞ ∂ ∂2 f xy 2 xy (0,1) = 12 e 0 = 1 = = ye = y ⋅ e ; ⎜ ⎟ 2 2 ∂x ⎝ ∂x ⎠ ∂x ∂x ∂x 2 ∂ f ∂ ⎛ ∂f ⎞ ∂ ∂2 f xy xy 2 ; = = xe = x ⋅ e ( 0,1) = 0 ( ) ⎜ ⎟ ∂y 2 ∂y ⎝ ∂y ⎠ ∂y ∂y 2 ∂2 f ∂ ⎛ ∂f ⎞ ∂ ∂2 f (0,1) = 1 = ⎜ ⎟ = ( ye xy ) = e xy + xy ⋅ e xy ; ∂x∂y ∂y ⎝ ∂x ⎠ ∂y ∂x∂y ∂2 f ∂ ⎛ ∂f ⎞ ∂ ∂2 f (0,1) = 1 + 0 = 1 = ⎜⎜ ⎟⎟ = xe xy = e xy + xy ⋅ e xy ; ∂y∂x ∂x ⎝ ∂y ⎠ ∂x ∂y∂x
(
)
(
)
Observaţia 2.17 2 ∂2 f (0,1) = ∂ f (0,1) = 1 . Această egalitate a derivatelor mixte de ordinul 2 Se observă că ∂x∂y ∂y∂x se explică prin faptul că funcţia dată f ce se defineşte prin egalitatea f ( x, y ) = e xy verifică condiţiile teoremei lui Schwartz referitor la punctul (0, 1). c) Derivarea funcţiilor compuse Considerăm pentru început funcţiile u, v : X ⊆ R → R şi funcţia f : R 2 → R cu ajutorul lui u, v şi f se poate defini funcţia F : X → R; F ( x ) = f (u ( x ), v( x )) . Se observă că funcţia F a fost definită ca o funcţie compusă. Se pune problema de a găsi F ' ( x ) . Observaţia 2.18
d , pentru dx funcţii de mai multe ori variabile vom utiliza pentru desemnarea derivatei parţiale simbolul ∂ . Pentru funcţii de o singură variabilă se face ca şi în liceu semnul de derivare
Teorema 2.16 Dacă sunt îndeplinite condiţiile: 1) u, v sunt derivabile şi cu derivatele continue în orice punct x ∈ X ; 2) f este derivabilă parţial în arport cu ambele argumente şi are derivatele parţiale continue în orice punct din R2. Atunci au loc rezultatele: 1) F este derivabilă şi are derivatele continue în orice punct x ∈ X ; 2) Are loc egalitatea: ∂f du ∂f dv F ' (x ) = + (2.35) ∂u dx ∂v dx Observaţia 2.19 Egalitatea (2.35) arată regula după care se calculează derivata de ordin I a funcţiei compuse F.
65
Pornind de la această egaliatate se poate determina derivata de ordinul II: d 2F d ⎛ dF ⎞ sau F " ( x ) = (F ' ( x ))' = ⎜ ⎟ 2 d x dx ⎝ dx ⎠ Avem: d ⎛ dF ⎞ d ⎛ ∂f du ∂f dv ⎞ F" (x ) = ⎜ + ⎟= ⎜ ⎟ dx ⎝ dx ⎠ dx ⎝ ∂u dx ∂v dx ⎠ Avem: d ⎛ ∂f ⎞ du ∂f d 2 u d ⎛ ∂f ⎞ dv ∂f d 2 v F " (x ) = ⎜ ⎟ + + ⎜ ⎟ + dx ⎝ ∂u ⎠ dx ∂u dx 2 dx ⎝ ∂v ⎠ dx ∂v dx 2
(2.36)
(2.37)
(ultimul membru al egalităţii (2.36) l-am scris ca o sumă de două derivate în raport cu x şi fiecare termen al acestei sume a fost derivat ca un produs). ∂f ∂f d ⎛ ∂f ⎞ d ⎛ ∂f ⎞ , vor fi ⎜ ⎟, ⎜ ⎟ ; deoarece ∂u ∂v dx ⎝ ∂u ⎠ dx ⎝ ∂v ⎠ derivate tot după regula de derivare a funcţiilor compuse dată de egalitatea (2.35), vom avea: Trebuie să determinăm în egalitatea (2.37)
d ∂f ∂ 2 f du ∂ 2 f dv + = dx ∂u ∂u 2 dx ∂u∂v dx d ⎛ ∂f ⎞ ∂ 2 f du ∂ 2 f dv + ⎜ ⎟= dx ⎝ ∂v ⎠ ∂v∂u dx ∂v 2 dx
(2.38) (2.39)
Înlocuind egalităţile (2.38) şi (2.39) în (2.37) obţinem: ⎛ ∂ 2 f du ∂ 2 f dv ⎞ du ∂f d 2 u ⎛ ∂ 2 f du ∂ 2 f dv ⎞ dv ∂f d 2 v ⎟⎟ ⎟⎟ + + + + ⎜⎜ + 2 F " ( x ) = ⎜⎜ 2 2 2 ∂ ∂ ∂ ∂ ∂ dx u v dx dx u v u dx dx ∂ ∂ ∂ u x v ⎝ ⎠ ⎝ ⎠ dx ∂v ∂x
(2.40)
Continuând procesul de derivare până la ordinul n inclusiv al funcţiei F se observă că acesta devine extrem de greoi în calcul. Din acest motiv reţinem doar formula de derivare generală: d nF d ⎛ d n −1 F ⎞ ⎜ ⎟ = dx ⎜⎝ dx n −1 ⎟⎠ dx n
(2.41)
Observaţia 2.20 În problemele concrete calculul derivatelor de ordin superior a funcţiilor compuse în puncte date se realizează utilizând algoritmi speciali pentru derivarea aproximativă (care poate fi utilizată în tehnica de calcul). Problema derivării funcţiilor compuse se poate pune într-un caz mai general: fie u1 , u 2 ,..., u n : X ⊆ R n → R, f : R n → R . Se consideră funcţia F : X → R, F ( x ) = f (u1 ( x ), u 2 ( x ),..., u m ( x )) În condiţii asemănătoare celor formulate în cadrul teoremei 1 se poate arăta că există F(x) şi are loc egalitatea: F ' (x ) =
∂f du1 ∂f du 2 ∂f du m + + ... + ∂u1 dx ∂u 2 dx ∂u m dx
66
(2.42)
Derivatele de ordin superior ale funcţiei F se determină aplicând egalitatea (2.41), este evident că în acest caz calculele se complică foarte mult. Din aceste motive se apelează iarăşi la algoritmi numerici, uşor programabili pe calculator, ceea ce aproximează derivatele de orice ordin. Problema derivabilităţii funcţiilor compuse se poate pune însă şi în cazul în care funcţia F este o funcţie compusă depinzând nu numai de o singură variabilă. Pentru început considerăm funcţiile u, v : X ⊆ R 2 → R şi f : R 2 → R . Fie F : X → R, F (x, y ) = f (u ( x, y ), v( x, y )) Funcţia F depinde de data aceasta de 2 variabile şi prin urmare se poate pune problema derivabilităţii sale parţiale. În condiţii asemănătoare teoremei 1 (adică u şi v sunt derivabile parţial, au derivatele parţiale continue, f este derivabilă şi are derivatele continue) atunci F este derivabilă parţial, are derivatele parţiale continue şi au loc egalităţile: ∂F ∂f ∂u ∂f ∂v = + ∂x ∂u ∂x ∂v ∂x ∂F ∂f ∂u ∂f ∂v = + ∂y ∂u ∂y ∂v ∂y
(2.43) (2.44)
Derivatele parţiale de ordin superior ale lui F se calculează derivând succesiv şi având în vedere egalităţile (2.43) şi (2.44). Calculele sunt extrem de greoaie. În general dacă avem u1 , u 2 ,..., u n : X ⊆ R n → R, f : R n → R se poate construi funcţia compusă F dată de egalitatea: F (x1 , x 2 ,..., x n ) = f (u1 (x1 , x 2 ,..., x n ), u 2 ( x1 , x 2 ,..., x n ),..., u m (x1 , x 2 ,..., x n )) În acest caz derivata parţială a funcţiei F în raport cu variabila x k se calculează după egalitatea: ∂F ∂f du1 ∂f du 2 ∂f du m (2.45) = + + ... + ∂x k ∂u1 dx k ∂u 2 dx k ∂u m dx k Sau mai concentrat: n ∂F ∂f ∂u i =∑ ∂x k i =1 ∂u i ∂x k
(2.46)
Derivatele de ordin superior se determină prin derivare parţială succesivă aplicând formulele (2.45) sau (2.46). 2.3.4 Câteva aplicaţii economice importante ale noţiunii de derivate: valoare marginală, ritm de variaţii, elasticitate În practica economică sub aspect cantitativ a multor fenomene se realizează prin analiza indicatorilor numerici asociaţi fenomenelor economice studiate. Aceşti indicatori permit exprimarea cantitativă a legităţilor economice ce generează domeniul studiat şi prin urmare pot fi utilizaţi în problemele de decizie corespunzătoare unei anumite politici economice din domeniul în cauză.
67
Valoarea marginală Să considerăm o intreprindere industrială care cercetează într-un interval de timp determinat o mulţime de programe de fabricaţie care diferă numai prin cantitatea fabricată q a unui anumit produs. Costul total c al unui asfel de program de fabricaţie este o funcţie foarte crescătoare în raport nu q, funcţia fiind presupusă a fi continuă într-un interval dat [a, b] . Prin urmare avem dependenţa c = f (q). Creşterea Δ q a cantitaţii de produs îi corespunde o crestere a costului Δ C = f (q+ Δ q) – f (q). Definiţii importante Se numeşte cost unitar mediu corespunzător variaţiei Δ q raportul următor:
Δc f (q + Δq) − f (q) Δq Δq Se numeşte cost marginal unitar, obişnuit numai prin numirea prescurtată cost marginal al produsului respectiv fabricat la nivelul q, limita costului unitar mediu ( dacă această limită există) când Δq → 0 , adică tocmai derivata f ' (q ) =
dc f (q + Δq) − f (q ) = lim dq Δ q →0 Δq
Dacă, de exemplu c este exprimat în u.b. iar q în kg, se observă că pentru costul unitar mediu unitatea în acest caz este u.b./kg şi reprezintă costul în u.b. a 1 kg produs suplimentar. Costul pentru 1 kg produs surplus este de fapt Δc = f (q + 1) − f (q ) ce corespunde la Δq = 1 . Având în vedere că f (q + Δq ) − f (q ) ≈ f ' (q )Δq , costul marginal se consideră a fi în valoare apropiată acceptabilă – practice pentru Δq = 1 , în cazul produselor fabricate în mare cantitate şi cu deosebire în unităţi indivizibile (automobile, tractoare, aparate de menaj, etc.). Observaţie importantă Derivata, respectiv costul marginal care redă viteza de variaţie a unei mărimi în raport cu cealaltă, au luat în considerare compararea variaţiilor absolute a celor două variabile (în limbaj economic două mărimi) x şi y. Generalizând pentru o funcţie f a cărei semnificaţie economică poate fi şi alta decât cea prezentă mai sus al cărei graphic este o curbă continuă şi netedă (ceea ce permite ca în domeniul de cercetare funcţia să admită derivata) sunt definiţi următorii indicatori: 1. Valoarea medie locală în punctual (x, y) este mărimea: v1 ( x, y ) definită prin egalitatea v1 ( x, y ) =
Δy Δx
2. Valoarea marginală în punctual (x, y) sau viteza de variaţie a variabilei y în raport cu variabila x mărimea v 2 ( x, y ) definită prin:
v 2 ( x, y ) =
dy dx În acelaşi timp se poate defini valoarea medie în intervalul [0, x] mărimea v3 ( x, y ) definită prin: 68
v 3 ( x, y ) =
y x
Ritm de variaţie, elasticitate Mărimile cu caracter economic introduce anterior nu sunt suficiente pentru a efectua deplin o analiză economică. Din acest motiv se impune necesitatea introducerii şi a altor mărimi economice. Δy Variaţia relativă a funcţiei y este , reprezentând rata de variaţie (de creştere) a y variabilei y. Compararea acestui raport cu variaţia absolută Δx , a variabilei independente determină Δy y . ritmul mediu de variaţie a funcţiei Rn = Δx Trecând la limită se obţine ritmul local de variaţie sau viteza relativă a lui y: Δy Δy dy d y = lim Δx = dx = ( ln y ) Ry , x = lim Δx → 0 Δx Δx → 0 y y dx Adică tocmai derivata logaritmică a funcţiei y = f ( x ) .
De exemplu, considerând indicele de consumaţie în funcţie de timp, derivata logaritmică se dovedeşte un indicator care înregistrează ritmul lui de variaţie. Δy Δx . Variaţiile relative ale celor două variabile x şi y = f ( x ) sunt , respectiv x y Compunerea lor conduce la elasticitatea medie: Δy Δy x Δy Δx y = = ⋅ Em = y Δx y Δx x x care reprezintă raportul valorii unitare a lui y în raport cu valoarea unitară a lui x, sau după prima expresie, raportul ratelor de variaţie ale celor două variabile. Trecând la limită se obţine indicatorul local al elasticităţii variabilei y în raport cu variabila x: Δy x dy d (ln y ) y = ⋅ = E y , x = lim Δx → 0 Δx y dx d (ln x ) x Interesul practic al elasticităţii este evidenţiat când analiza economică urmăreşte variaţia unui parametru economic a cărei creştere relativă este mult mai simplificativă decât variaţia absolută, în raport cu o variabilă cu un caracter asemănător. De exemplu, când se studiază cererea sau oferta în raport cu preţul. Elasticitatea este un indiator de analiză economică independent de unităţile de măsură pentru cele două variabile. De asemeni putem considera elasticitatea variabilei x în raport cu y:
69
E x, y =
y dx d (ln x ) ⋅ = x dy d (ln y )
Toţi indicatorii de analiză economică citaţi mai sus pot avea evident atât valori positive cât şi valori negative. Să analizăm prin prisma indicatorilor definiţi mai sus următoarele două situaţii: ⎧ x = 100, Δx = 100 1) ⎨ ⎩ y = 200, Δy = 40
⎧ x = 100, Δx = 10 2) ⎨ ⎩ y = 2000, Δy = 120
Se obţin rezultatele: Valoarea marginală Ritmul de creştere Δy Δy y R y,x = Δx Δy 20 40 1) =4 200 = 0,02 10 10 120 120 2) = 12 2000 = 0,006 10 10
Elasticitate E
E y,x =
x Δy ⋅ y Δx
100 40 ⋅ =2 200 10 100 120 ⋅ = 0,6 2000 10
În situaţia a doua, valoarea marginală, echivalentă vitezei de creştere a lui y faţă de x, este de 30 de ori mai mare. În schimb sistemul de creştere şi elasticitate sunt de aproximativ 3,3 ori mai mici. Aplicaţii ale derivatelor parţiale în economie Fiind dată funcţia definită prin x = f (x1 , x 2 ,..., x n ) care admite derivate parţiale de ordinal ∂f , i = 1, n , noţiunile de valoare marginală, ritm, elasticitate sunt generalizate şi pentru întâi ∂xi funcţiile de mai multe variabile. Astfel avem: ∂f Valoarea marginală în raport cu variabila x, este derivată parţială ; ∂xi 1 ∂f Ritmul în raport cu variabila x, este ; f ∂xi x ∂f Elasticitatea în raport cu variabila x, este i . f ∂xi Exemplu (considerând că în medie populaţia unui oraş consumă un bun material în cantităţi qi , fie ţinându-se seama de preţul pi , fie luând în considerare venitul mediu V, se poate calcula următorii economici:
- elasticitatea consumului qi a bunului material i în raport cu preţul pi :
70
p i ∂qi ⋅ , i = 1, n qi ∂pi - elasticitatea consumului qi , a bunului material i în raport cu preţul p j , a unui alt bun E qi , pi =
material: Eqi , p j =
p j ∂qi , j = 1, n, j ≠ i ⋅ qi ∂p j
- elasticitatea consumului qi în raport cu venit: E qi ,V =
V ∂q i ⋅ q i ∂V
Se pot calcula variaţiile cheltuielilor pentru consumul bunului în funcţie de preţuri sau venit, pentru care avem în general egalitatea ci = p i qi . Pentru variaţii rezultă (folosind elasticitatea): dci = pi d qi = pi qi E qi ,V
dV dV = ci E qi ,V ⋅ V V
De asemenea avem: dci = pi d qi + qi d pi = pi (1 + E ii ) E ii = E qi , pi =
dpi pi
pi ∂qi qi ∂pi
Expresiile de genul celor prezentate permit o analiză economică în interacţiunea variaţiilor mai multor factori economici, atunci când legităţile respective au fost în prealabil determinate. 2.3.5. Probleme rezolvate 1. Fie funcţia f : R 3 → R, f ( x, y, z ) = x 3 + y 3 + z 3 + xy + 3 xyz Să se calculeze: ∂f ∂f ∂f a) , , ; ∂x ∂y ∂z
d 2 f ∂2 f d 2 f d 2 f ∂2 f ∂2 f , , , , , ∂x 2 ∂x∂y ∂y 2 ∂z 2 ∂x∂y∂z ∂x∂z c) df b)
Rezolvare: ∂f ∂f ∂f a) = 3 y 2 + x + 3 xz; = 3 x 2 + y + 3 yz; = 3z 2 + 3xy; ∂y ∂x ∂z
b)
d2 f ∂ ⎛ df ⎞ ∂ = ⎜ ⎟= 3 x 2 + y + 3 yz = 6 x 2 ∂x ⎝ ∂x ⎠ ∂x ∂x
(
)
71
d2 f ∂ ⎛ df ⎞ ∂ 3 y 2 + x + 3 xz = 1 + 3 z = ⎜⎜ ⎟⎟ = ∂x∂y ∂x ⎝ ∂y ⎠ ∂x d2 f ∂ ⎛ df ⎞ ∂ 3 y 2 + x + 3 xz = 6 y = ⎜⎜ ⎟⎟ = 2 ∂y ⎝ ∂y ⎠ ∂y ∂y
(
)
(
)
d2 f ∂ ⎛ df ⎞ ∂ = ⎜ ⎟= 3 z 2 + 3xy = 6 z 2 ∂z ⎝ ∂z ⎠ ∂z ∂z
(
)
d2 f ∂ ⎛ df ⎞ ∂ = ⎜ ⎟= 3 z 2 + 3 xy = 3 x ∂y∂z ∂y ⎝ ∂z ⎠ ∂y
(
)
d2 f ∂ ⎛ df ⎞ ∂ = ⎜ ⎟= 3 z 2 + 3xy = 3 y ∂x∂z ∂x ⎝ ∂z ⎠ ∂x ∂f ∂f df c) df = dx + dy + dz = 3 x 2 + y + 3 yz dx + 3 y 2 + x + 3 xz dy + 3 z 2 + 3 xy dz ∂z ∂y ∂x
(
)
(
)
(
(
)
)
2.Fie funcţia f : R 2 \ {(0,0 )} → R, f ( x, y ) = ln x 2 + y 2 + arctg
(
)
y . x
Să se calculeze: ∂f ∂f a) , ; ∂x ∂y d 2 f ∂2 f d 2 f , , ∂x 2 ∂x∂y ∂y 2
b)
Rezolvare:
1 −y 2 2x 2 x − y ∂f 2y ∂f x x2 = 2y + x ; a) = 2 + = + = ∂x x + y 2 x2 + y2 y 2 x 2 + y 2 ∂y x 2 + y 2 y2 1+ 2 1+ 2 x x 2 2 2 d f ∂ ⎛ df ⎞ ∂ ⎛ 2 x − y ⎞ 2 x + y − (2 x − y )2 x − 2 x 2 + 2 y 2 + 2 xy ⎟= = b) = ⎜ ⎟ = ⎜⎜ 2 2 2 ∂x ⎝ ∂x ⎠ ∂x ⎝ x + y 2 ⎟⎠ ∂x 2 x2 + y2 x2 + y2
(
(
)
)
(
)
d2 f ∂ ⎛ df ⎞ ∂ ⎛ 2 y + y = ⎜⎜ ⎟⎟ = ⎜⎜ 2 ∂x∂y ∂x ⎝ ∂y ⎠ ∂x ⎝ x + y 2
⎞ x 2 + y 2 − (2 y + x )2 x − x 2 + y 2 − 4 xy ⎟⎟ = = 2 2 x2 + y2 x2 + y2 ⎠
d f ∂ ⎛ df ⎞ ∂ ⎛ 2 y + x ⎜ ⎟= ⎜ = ∂y ⎜⎝ ∂y ⎟⎠ ∂y ⎜⎝ x 2 + y 2 ∂y 2
⎞ 2 x + y − (2 y − x )2 y 2 x − 2 y 2 − 2 xy ⎟⎟ = = 2 2 x2 + y2 x2 + y2 ⎠
2
(
(
2
2
(
)
)
(
)
2
)
(
)
2.3.6. Probleme propuse 1. Să se verifice existenţa limitelor iterate şi a limitei globale în origine pentru funcţia f dată de:
72
a) f ( x, y ) =
x − y + x2 + y2 x+ y
c) f ( x, y ) = x sin
x + 2y + x2 − y2 2x + y ⎛ 1 1⎞ d) f ( x, y ) = ⎜⎜ sin sin ⎟⎟( x + y ) x y⎠ ⎝
b) f ( x, y ) =
1 y
x+ y x− y xy g) f ( x, y ) = 2 x + y2 e) f ( x, y ) =
f) f ( x, y ) =
x2 − y2 x2 + y2
(
)
h) f ( x, y ) = x 2 + y 2 sin
1 xy
2. Să se verifice pentru f : R 2 → R continuitatea parţială şi continuitatea globală în origine:
(
) (x, y ) ≠ (0,0)
⎧ xy 3 + sin x 3 + y 6 , ⎪ f ( x, y ) = ⎨ 2x 2 + y 4 ⎪0 , ⎩
⎧ 2 xy ⎪ f ( x, y ) = ⎨ 3 x 2 + y 2 ⎪0 ⎩ ⎧ 3xy 2 ⎪ f ( x, y ) = ⎨ x 2 + 2 y 4 ⎪0 ⎩
(x, y ) = (0,0)
, (x, y ) ≠ (0,0) ,
(x, y ) = (0,0) , (x, y ) ≠ (0,0)
,
(x, y ) = (0,0)
⎧ 2x + 3y ⎪ f ( x, y ) = ⎨ x 2 + y 2 ⎪0 ⎩
, ( x, y ) ≠ (0,0)
⎧ x2 y3 ⎪ f ( x, y ) = ⎨ x 2 + y 2 ⎪0 ⎩
, ( x, y ) ≠ (0,0)
,
,
(x, y ) = (0,0)
(x, y ) = (0,0)
⎛ x⎞ 3. Fie funcţia F ( x, y ) = f ⎜⎜ xy, ⎟⎟ y⎠ ⎝ Să se calculeze:
d 2F ∂2F d 2F , , ∂x 2 ∂x∂y ∂y 2
Indicaţie:
Notăm u = xy, v =
x . Avem: y
73
∂f x ∂f ∂f 1 ∂f ∂F ∂F ; =x − 2 + =y ∂u y ∂v ∂u y ∂v ∂y ∂x 2 1 ∂2 f ∂2 f ∂2F 2 ∂ f 2 y + + = ∂u∂v y 2 ∂v 2 ∂u 2 ∂x 2 2 2x 2 ∂ 2 f x 2 ∂ 2 f 2 x ∂f ∂2F 2 ∂ f x + + + = y 2 ∂u∂v y 4 ∂v 2 y 3 ∂v ∂u 2 ∂y 2
1 ∂f x ∂ 2 f ∂f ∂2 f ∂2F − 2 + = xy 2 − 3 2 ∂u y ∂v ∂x∂y y ∂v ∂u
(
)
4. Fie funcţia f ( x, y ) = ln x + y 2 . Să se calculeze derivatele parţiale de ordinal întâi şi al doilea: Indicaţie: 1 2y ∂f ∂f ∂2 f −1 ; ; = = = 2 2 2 ∂x x + y ∂y x + y ∂x x + y2
(
∂2 f x − y2 ∂2 f 2y = =2 2 ; 2 2 ∂x∂y ∂y x + y2 x + y2
(
)
(
5. Fie funcţia f ( x, y ) =
)
2
)
2
xy
. x + y2 Să se calculeze derivatele parţiale de ordinal întâi şi al doilea: 2
Indicaţie:
∂f y3 = ; ∂x ( x 2 + y 2 )3 2
∂f x3 ∂2 f −3 xy 3 = ; = ∂y ( x 2 + y 2 )3 2 ∂x 2 ( x 2 + y 2 )3 2
∂2 f − 3 xy 3 ∂2 f 3x 2 y 2 = = ; 32 32 ∂x∂y ∂y 2 x2 + y2 x2 + y2
(
)
(
)
6. Fie funcţia f ( x, y ) = x sin y . Să se calculeze derivatele parţiale de ordinal întâi şi al doilea: 2
2
Indicaţie: ∂f ∂f ∂2 f 2 2 = 2 x sin y; = x sin 2 y; = 2 sin 2 y 2 ∂x ∂y ∂x 2 2 ∂ f ∂ f = 2 x sin 2 y = 2 x 2 cos 2 y; 2 ∂x∂y ∂y
74
2.4. Puncte de extrem 2.4.1. Extreme de funcţii nesupuse la legături Fie f : I → R, I interval, f de n ori derivabilă. O condiţie necesară ca a ∈ I să fie punct de extrem este f ' ( a ) = 0 . Mai general avem următorul rezultat: ⎧⎪ f ' ( a ) = f " ( a ) = ... = f ( n −1) ( a ) = 0 dacă ⎨ (n) ⎪⎩ f ≠ 0
atunci: n 1. Dacă n este par şi f ( ) ( a ) > 0 atunci a este punct de minim. 2. Dacă n este impar şi f ( n ) < 0 atunci a este punct de maxim. 3. Dacă n este impar atunci a nu este punct de extrem pentru funcţia f ; el se numeşte punct de inflexiune. Observaţia 2.21 Convenim să numim puncte de extrem ale unei funcţii, punctele de maxim sau de minim ale acestei funcţii. Dacă dintre aceste puncte reuşim să separăm punctele care dau valoarea cea mai mare, respectiv cea mai mică a funcţiei, acestea le vom numi puncte de maxim respectiv de minim absolut. În cazul în care funcţia admite un singur maxim şi (sau) un singur minim acestea vor fi considerate totdeauna puncte de extrem absolute. Exemplu 1
f : [ −2, 2] → R f ( x ) = x2 f '( x) = 2x f '( x ) = 0 ⇒ 2x = 0 ⇒ x = 0 ( a = 0) f "( x ) = 2 f "( 0) = 2 > 0 f '(0) = 0 f ' ( 0 ) = 0 ⎫⎪ n = 2 ( par ) ⎫⎪ ⎬⇒ ⎬ ⇒ 0 = punct de minim f " ( 0 ) > 0 ⎪⎭ f " ( 0 ) = 0 ⎪⎭
Exemplu 2
75
f ( x ) = x3 f ' ( x ) = 3x f ' ( x ) = 0 ⇒ x = 0 ( a = 0) f "( x ) = 6 x f "( 0) = 0 f '" ( x ) = 6 f '" ( 0 ) = 6 Deci:
f ' ( 0 ) = 0 ⎫⎪ ⎬ ⇒ n = 3 ( impar ) ⇒ x = 0 este punct de inflexiune f '" ( 0 ) = 6 ⎪⎭
b) Puncte de extrem pentru funcţii de două variabile Se consideră funcţia de 2 variabile f : X ⊆ R 2 → R şi punctele ( a, b ) ∈ X . Definiţia 2.24 Spunem că punctul de minim al funcţiei f dacă există vecinătatea V a punctului ( a, b ) aşa
încât f ( x, y ) > f ( a, b ) , ∀ ( x, y ) ∈ V . În mod uzual un astfel de punct se numeşte punct de minim relativ sau punct de minim local. Dacă are loc inegalitatea: f ( x, y ) > f ( a, b ) , ∀ ( x, y ) ∈ V punctul ( a, b ) îl numim punct de minim absolut. Definiţia 2.25 Punctul ( a, b ) se numeşte punct de maxim pentru funcţia f dacă există o vecinătate V a
punctului ( a, b ) aşa încât f ( x, y ) < f ( a, b ) , ∀ ( x, y ) ∈ V Uzual un astfel de punct îl numim punct de maxim relativ sau punct de maxim local. Dacă: f ( x, y ) < f ( a , b ) , ∀ ( x , y ) ∈ V
acest punct îl numim punct de maxim absolut al funcţiei f . În cele ce urmează vom caracteriza analitic proprietăţile punctelor de extrem x şi vom da o metodologie de determinare a acestora. Teorema 2.17 Dacă sunt îndeplinite condiţiile: 1) ( a, b ) este punct de extrem (maxim sau minim) al funcţiei f .
2) Funcţia f este derivabilă parţial în raport cu ambele variabile (deci există derivatele parţiale de ordinul întâi). Atunci au loc egalităţile:
76
⎧ ∂f ⎪⎪ ∂x ( a, b ) = 0 ⎨ ∂f ⎪ ( a, b ) = 0 ⎪⎩ ∂y
(2.47)
Demonstraţie Considerăm funcţia f1 de o singură variabilă definită prin egalitatea: f1 ( x ) = f ( x, b )
Deoarece ( a, b ) este punct de extrem pentru funcţia f atunci x = a este punct de extrem pentru funcţia f 2 . Prin urmare avem: f1' ( a ) = 0 ⇒
∂f ( a, b ) = 0 ∂x
(2.48)
Considerăm funcţia f 2 de o singură variabilă definită prin egalitatea f 2 ( y ) = f ( a, y ) . Punctul ( a, b ) fiind punct de extrem pentru funcţia f implică faptul că y = b este punct de extrem pentru funcţia f 2 . Deci avem: f 2' ( b ) = 0 ⇒
∂f ( a, b ) = 0 ∂y
(2.49)
Egalităţile (2.48) şi (2.49) demonstrează teorema. Observaţia 2.22 Din această teoremă rezultă că o condiţie necesară (dar nu şi suficientă) a unui punct ( a, b )
să fie punct de extrem pentru funcţia f este îndeplinirea egalităţilor: ⎧ ∂f ⎪⎪ ∂x ( a, b ) = 0 ⎨ ∂f ⎪ ( a, b ) = 0 ⎪⎩ ∂y sau, ceea ce este echivalent, punctul ( a, b ) este soluţie a sistemului: ⎧ ∂f ⎪⎪ ∂x = 0 ⎨ ∂f ⎪ =0 ⎩⎪ ∂y
(2.50)
Un punct ( a, b ) care este soluţie a sistemului (2.50) se numeşte staţionar a funcţiei f , de aici putem trage concluzia că punctele de extrem ale funcţiei f se găsesc prin punctele staţionare ale funcţiei f .
77
Teorema 2.18 Presupunem că funcţia f admite derivate parţiale până la ordinul 3 inclusiv şi că punctul ( a, b ) este punct staţionar al funcţiei f .
Au loc proprietăţile: 1) Dacă: 2
⎛ ∂2 f ⎞ ∂2 f ∂2 f ∂2 f ( a, b ) ⋅ 2 ( a, b ) − ⎜ ( a, b ) ⎟ > 0 şi 2 ( a, b ) > 0 ∂x 2 ∂y ∂x ⎝ ∂x∂y ⎠ atunci punctul ( a, b ) este punct de minim pentru funcţia f . 2) Dacă: 2
⎛ ∂2 f ⎞ ∂2 f ∂2 f ∂2 f a , b ⋅ a , b − a , b > 0 şi ( ) ( ) ( ) ( a, b ) < 0 ⎜ ⎟ ∂x 2 ∂y 2 ∂x 2 ⎝ ∂x∂y ⎠
atunci punctul ( a, b ) este punct de maxim pentru funcţia f . 3) Dacă: 2
⎛ ∂2 f ⎞ ∂2 f ∂2 f a , b ⋅ a , b − ( ) ( ) ( a, b ) ⎟ < 0 ⎜ 2 2 ∂x ∂y ⎝ ∂x∂y ⎠
punctul ( a, b ) nu este punct de extrem pentru funcţia f . Demonstraţie Ca şi la funcţia de o singură variabilă, unei funcţii de două variabile i se poate construi polinomul lui Taylor de un anumit ordin, corespunzător unui punct fixat. Ordinul polinomului depinde de ordinul maxim admis de derivabilitatea funcţiei date. La noi fiind derivabile de cel mult 3 ori înseamnă că polinomul lui Taylor asociat lui f corespunzător punctului ( a, b ) va fi:
P2 ( x, y ) = f ( a, b ) +
⎞ 1⎛ ∂f ∂f ⎜ ( x − a ) ( a, b ) + ( y − b ) ( a, b ) ⎟ + 1! ⎝ ∂x ∂y ⎠
2 2 ⎞ 1⎛ ∂2 f 2 ∂ f 2 ∂ f , 2 , x a a b x a y b a b y b a, b ) ⎟ − + − − + − ( ) ( ) ( )( ) ( ) ( ) ⎜ 2 2 ( 2! ⎝ ∂x ∂x∂y ∂y ⎠ Dacă se pune problema aproximării funcţiei f prin acest procedeu vom avea egalitatea: f ( x, y ) = P2 ( x, y ) + R2 ( x, y )
+
3).
unde: R2 este restul (şi care are o exprimare cunoscută în care intervin derivatele parţiale de ordin Se poate demonstra că acest rest este neglijabil şi prin urmare avem egalitatea: ⎞ 1⎛ ∂f ∂f f ( x, y ) = f ( a, b ) + ⎜ ( x − a ) ( a , b ) + ( y − b ) ( a , b ) ⎟ + 1! ⎝ ∂x ∂y ⎠ 2 2 ⎞ 1⎛ ∂2 f 2 ∂ f 2 ∂ f a b x a y b a b y b a, b ) ⎟ , 2 , + ⎜ ( x − a) + − − + − ( ) ( )( ) ( ) ( ) 2 2 ( 2! ⎝ ∂x ∂x∂y ∂y ⎠
(2.51)
Din (2.51) şi din condiţia ca ( a, b ) să fie punct staţionar pentru f rezultă egalitatea: 78
f ( x, y ) − f ( a , b ) =
2 1 ∂2 f 2 ∂ f ( x − a ) 2 ( a, b ) + ( x − a )( y − b ) ( a, b ) + 2 ∂x ∂x∂y 2 1 2 ∂ f + ( y − b) ( a, b ) 2 ∂y 2
(2.52)
Se notează cu E ( a, b ) membrul drept din (2.52). Dacă punctul ( a, b ) ar fi punct de extrem, membrul stâng al egalităţii (2.52) va păstra semn constant pe o întreagă vecinătate a lui ( a, b ) . Aceasta înseamnă că şi membrul 2 al egalităţii (2.52) pe care l-am notat E va păstra semn constant. Scriem E sub forma următoare:
( x − a ) ∂ 2 f a, b + ∂ 2 f a, b 1 ∂2 f 2 ( x − a) E ( x, y ) = ( y − b ) + a , b + 2 ( ) ( ) ( ) 2 2 ∂y 2 ( y − b ) ∂x∂y ( y − b ) ∂x 2 2
x−a = z atunci semnul lui E ( x, y ) va depinde de semnul polinomului de y −b gradul doi în variabila z: ∂2 f ∂2 f ∂2 f P ( z ) = z 2 + 2 ( a, b ) + 2 z ( a, b ) + 2 ( a, b ) ∂x ∂x∂y ∂y Avem următoarele situaţii: 1. Dacă notăm
2
⎛ ∂2 f ⎞ ∂2 f ∂2 f a , b a , b Δ<0⇔⎜ − ⋅ ( )⎟ ) 2 ( a, b ) < 0 ⇒ 2 ( ∂y ⎝ ∂x∂y ⎠ ∂x 2 2 2 ∂ f ∂ f ∂ f ⇒ 2 ( a, b ) ⋅ 2 ( a, b ) − ( a, b ) > 0 ∂x ∂y ∂x∂y ∂2 f ( a, b ) > 0 trinomul va păstra semnul plus deci ∂x 2 E ( x, y ) > 0 ⇒ f ( x, y ) − f ( a, b ) > 0 ⇒ f ( x, y ) > f ( a, b ) ⇒ punct de minim.
2. 2
⎛ ∂2 f ⎞ ∂2 f ∂2 f Δ<0⇔⎜ ( a, b ) ⎟ − 2 ( a, b ) ⋅ 2 ( a , b ) < 0 ⇒ ∂y ⎝ ∂x∂y ⎠ ∂x ∂2 f ∂2 f ∂2 f ⇒ 2 ( a, b ) ⋅ 2 ( a, b ) − ( a, b ) > 0 ∂x ∂y ∂x∂y ∂2 f ( a, b ) < 0 ∂x 2 Deci E ( x, y ) < 0 ⇒ f ( x, y ) − f ( a, b ) < 0 ⇒ f ( x, y ) < f ( a, b ) ⇒ ( a, b ) e punct de maxim.
79
Observaţia 2.23 2
Dacă
⎛ ∂2 f ⎞ ∂2 f ∂2 f Δ = 0 ⇔ 2 ( a, b ) ⋅ 2 ( a, b ) − ⎜ ( a, b ) ⎟ = 0 ⇒ ∂x ∂y ⎝ ∂x∂y ⎠
Atunci despre punctul ( a, b ) nu se poate preciza nimic în legătură cu posibilitatea de a fi punct de extrem. a. Extremele funcţiilor de mai multe variabile (n > 2) Fie f ⊆ R n , f : X → R Definiţia 2.26 Punctul a = ( a1 , a2 ,..., a n ) este un punct de minim pentru funcţia f dacă există o vecinătate
V a punctului a aşa încât f ( x1 , x2 ,..., x n ) > f ( a1 , a2 ,..., a n ) , ∀ ( x1 , x2 ,..., x n ) ∈ V . Punctul a = ( a1 , a2 ,..., a n ) este un punct de minim pentru funcţia f dacă există o vecinătate V a punctului a aşa încât f ( x1 , x2 ,..., x n ) < f ( a1 , a2 ,..., a n ) , ∀ ( x1 , x2 ,..., x n ) ∈ V . Asemănător cazului funcţiilor de 2 variabile se poate demonstra următoarea teoremă : Teorema 2.19 Dacă a = ( a1 , a2 ,..., a n ) este punct de extrem pentru funcţia f şi dacă funcţia e derivabilă de
ordinul 1 în raport cu fiecare variabilă atunci : ∂f ( a1 , a2 ,..., a n ) = 0 ∂x1 ∂f ( a1 , a2 ,..., a n ) = 0 ∂x2
(2.53)
∂f ( a1 , a2 ,..., a n ) = 0 ∂xn
Pentru găsirea punctelor de extrem se cunosc mai multe metode, cea mai comodă fiind bazată pe presupunerea că funcţia f este derivabilă parţial până la ordinul 3 inclusiv. Procedeul de calcul este următor : Fie a = ( a1 , a2 ,..., a n ) un punct staţionar a lui f (adică un punct care verifică restricţiile (2.53)). Se calculează derivatele parţiale de ordinul 2 în punctul a şi se notează : ∂2 f Aij = ( a ) i, j = 1, n ∂xi ∂x j Se calculează determinanţii : Δ1 = A11 Δ2 =
A11 A21
A12 A22
80
A11
A12
A13
Δ 3 = A21 A31
A22 A32
A23 A33
Δn =
A11
A12 …
A21
A22 … A2 n
An1
An 2 … Ann
A1n Δ1 > 0; Δ 2 > 0; Δ 3 > 0; ⇒ ( −1, −2,3) punct de minim.
Există următoarele situaţii : 1) Δ1 > 0, i = 1, n . În acest caz punctul a = ( a1 , a2 ,..., a n ) este punct de minim. 2) Δ1 < 0, i = 1, n . În acest caz punctul a = ( a1 , a2 ,..., a n ) este punct de maxim. Observaţia 2.24 Pentru a fi punct de minim trebuie ca toţi determinanţii Δ1 , Δ 2 ,..., Δ n să fie pozitivi. Pentru a avea punct de maxim trebuie ca semnul acestor determinanţi să alterneze primul determinant fiind negativ. Exemplu 1 Să se determine punctele de extrem pentru funcţia f dată de f ( x, y ) = x 3 + y 3 − 3 xy .
Determinăm punctele staţionare ale acestei funcţii rezolvând sistemul următor : ⎧ ∂f ⎪⎪ ∂x = 0 ⎧⎪3x 2 − 3 y = 0 ⎧ x 2 − y = 0 ⎧⎪ y = x 2 ⎧⎪ y = x 2 ⇒⎨ 2 ⇒⎨ ⇒⎨ 4 ⇒⎨ ⇒ ⎨ ∂f 3 1 0 x x − = 0 y x − = 3 3 0 0 y x x x − = − = ( ) ⎪ ⎪ ⎩ ⎩ ⎪ =0 ⎩ ⎪⎩ ⎪⎩ ∂y ⎧⎪ y = x 2 ⎧x = 0 1) ⇒⎨ ⇒ ⎨ 2 ⎩y = 0 ⎪⎩ x ( x − 1) ( x + x + 1) = 0 Calculăm derivatele parţiale de ordinal II: ∂2 f ∂2 f = = 6 y; 6 x ; ∂x 2 ∂y 2
∂2 f = −3 ∂x∂y
⎧a = 0 Cazul I. Considerăm punctul staţionar ⎨ ⎩b = 0
81
⎧x = 1 2) ⎨ ⎩y =1
⎫ ⎪ ⎪ 2 ⎪⎪ ∂ 2 f ⎛ ∂2 f ⎞ ∂2 f ( 0, 0 ) ⎟ = 0 ⋅ 0 − 9 < 0 ⇒ ( 0, 0 ) ⎬ ⇒ 2 ( 0, 0 ) 2 ( 0, 0 ) − ⎜ ∂x ∂y ⎝ ∂x∂y ⎠ ⎪ 2 ⎪ ∂ f ( 0, 0 ) = −3⎪ ∂x∂y ⎪⎭ punct de extrem. ∂2 f ( 0, 0 ) = 0 ∂x 2 ∂2 f ( 0, 0 ) = 0 ∂y 2
nu
este
⎧a = 1 Cazul II. ⎨ ⎩b = 1 ⎫ ∂2 f = 1,1 6 ( ) ⎪ ∂x 2 ⎪ 2 ⎛ ∂2 f ⎞ ∂2 f ∂2 f ∂2 f ⎪⎪ ∂ 2 f = ⇒ − = ⋅ − = > 1,1 6 1,1 1,1 1,1 6 6 9 27 0 1,1) = 6 > 0 ( ) ( ) ( ) ( ) ⎬ ⎜ ⎟ 2 2 2 ( ∂y 2 ∂ ∂ ∂ ∂ ∂ x y x y x ⎝ ⎠ ⎪ ⎪ ∂2 f (1,1) = −3⎪ ∂x∂y ⎭⎪ Deci (1, 1) este punct de minim. Exemplu 2
f ( x, y , z ) = x 2 + y 2 + z 2 + 2 x + 4 y − 6 z
Calculăm punctele staţionare : ⎧∂f ⎪ ∂x = 0 ⎪ ⎧2 x + 2 = 0 ⎧ x = −1 ⎪ ∂f ⎪ ⎪ ⎨ = 0 ⇒ ⎨ 2 y + 4 = 0 ⇒ ⎨ y = −2 ⎪ ∂y ⎪ ⎪ ⎩2 z − 6 = 0 ⎩z = 3 ⎪ ∂f ⎪ =0 ⎩ ∂z Există punctul (-1, -2, 3). Calculăm derivatele parţiale de ordinal 2:
82
∂2 f = 2; ∂x 2
∂2 f =0 ∂x∂y
∂2 f = 2; ∂y 2
∂2 f =0 ∂x∂z
∂2 f = 2; ∂z 2
∂2 f =0 ∂y∂z
∂2 f A11 = 2 ( −1, −2,3) = 2 ∂x ∂2 f A12 = ( −1, −2,3) = 0 ∂x∂y ∂2 f ( −1, −2,3) = 0 ∂x∂z ∂2 f A22 = 2 ( −1, −2,3) = 2 ∂y A13 =
∂2 f A23 = ( −1, −2,3) = 0 ∂x∂y ∂2 f A33 = 2 ( −1, −2,3) = 0 ∂z Δ1 = A11 = 2 > 0 Δ2 =
A11 A21
A12 2 0 = =4>0 A22 0 2
A11 Δ 3 = A21
A12 A22
A13 2 0 0 A23 = 0 2 0 = 8 > 0
A31
A32
A33
0 0 2
Δ1 > 0; Δ 2 > 0; Δ 3 > 0; ⇒ ( −1, −2,3) punct de minim.
2.4.2. Extreme cu legături 2.4.2.1. Formularea problemei Problemele punctelor de extrem pentru funcţii supuse la restricţii (legături) reprezintă problema centrală în teoria punctelor de extrem. Acest rol central nu derivă din faptul că extremele cu legături şi-ar găsi o mare aplicabilitate în practică, ci faptul că studiind acest capitol, în afara rezultatelor specifice sunt prezentate o serie de rezultate teoretice utile în studiul problemei de exterior în general. Formularea corectă a unei probleme de extreme cu restricţii este următoarea: Fie f : R n → R funcţia de eficienţă căreia dorim să-i găsim punctele de maxim sau de minim. Considerăm de asemenea funcţiile F1 , F2 ,..., F m → R cu ajutorul cărora se definesc restricţiile problemei analizate. Astfel de restricţii apar uzual în forma următoare:
83
⎧ F1 ( x1 , x2 ,..., x n ) ≤ a1 ⎪ ⎪ F2 ( x1 , x2 ,..., x n ) ≥ a2 ⎨ ⎪ ⎪ ⎩ Fm ( x1 , x2 ,..., x n ) = am
unde a1 , a2 ,..., a m sunt mărimi cunoscute. O problemă de extrem cu restricţii în forma ei cea mai generală apare în felul următor: ⎧max ( min ) f ( x1 , x2 ,..., x n ) ⎪ ⎪ F1 ( x1 , x2 ,..., x n ) ≤ a1 ⎪ ⎨ F2 ( x1 , x2 ,..., x n ) ≥ a2 ⎪ ⎪ ⎪ Fm ( x1 , x2 ,..., x n ) = am ⎩
(2.54)
Dacă se notează cu D mulţimea soluţiilor sistemului de restricţii (2.54), atunci problema determinării punctelor de extrem ale funcţiei f supuse la restricţiile (2.54) se reduce de fapt la determinarea punctelor de extrem ale lui f pe domeniul D. Deoarece rezolvarea sistemului (2.54) este în general extrem de dificilă s-au încercat metode de determinare a punctelor de extrem pentru funcţia f supusă la restricţiile (2.54), care nu apelează la rezolvarea sistemului (2.54). Cazul cel mai simplu este acela în care restricţiile sistemului (2.54) sunt de tip egalitate. O astfel de problemă se numeşte uzual problemă de extrem cu legături şi face obiectul celor prezentate în continuare. Rezolvarea ei se face relativ comod utilizând rezultate cunoscute ale calcului diferenţial (îndeosebi noţiunea de derivabilitate parţială). În cazul în care în (2.54) apare cel puţin o inegalitate punctele de extrem ale funcţiei f se găsesc în mod obişnuit pe frontiera domeniului D (adică acolo unde practic nu se pune problema derivabilităţii parţiale) şi prin urmare metodele bazate pe rezultate ale calcului diferenţial nu mai sunt valabile. De aceea rezolvarea unor astfel de probleme (care sunt cele mai des întâlnite în practică) a fost realizată abia în ultimii ani. Prima metodă se datorează matematicianului Dantzig şi a apărut în 1947 în legătură cu rezolvarea unei probleme de optimizare liniară (adică a unei probleme de optimizare în care funcţiile F1 , F2 ,..., F n sunt liniare – adică variabilele x1 , x2 ,..., x n apar la puterea 1). Ulterior au fost elaborate şi alte metode pentru rezolvarea unei probleme de optimizare cu restricţii mai generale. Este bine de ştiut însă că o problemă oarecare de optimizare cu restricţii la acest moment nu se poate rezolva în general.
84
2.4.2.2. Rezultate şi interpretarea economică a acestora Considerăm o primă problemă de extrem în formă generală: ⎧max ( min ) f ( x1 , x2 ,..., x n ) ⎪ ⎪ F1 ( x1 , x2 ,..., x n ) = a1 ⎪ ⎨ F2 ( x1 , x2 ,..., x n ) = a2 ⎪ ⎪ ⎪ Fm ( x1 , x2 ,..., x n ) = am ⎩
(2.55)
Am considerat momentul drept 0 deoarece prin trecerea constantelor a1 , a2 ,..., a m în membrul stâng şi prin notarea Fi ( x1 , x2 ,..., x n ) = Fi ( x1 , x2 ,..., x n ) − ai , i = 1, m , suntem conduşi la o problemă echivalentă cu cea dată anterior. Pentru rezolvarea problemei (2.55) considerăm funcţia lui Lagrange L, definită prin m
egalitatea L ( x1 , x2 ,..., x n ; λ1 , λ2 ,..., λ m ) = f ( x1 , x2 ,..., x n ) + ∑ λi Fi ( x1 , x2 ,..., x n ) . i =1
Scalarii notaţi λ1 , λ2 ,..., λ m ce apar în construcţia funcţiei L se numesc multiplicatorii lui Lagrange şi din punct de vedere economic reprezintă aşa-numitele preţuri – umbră. Observaţia 2.25 Pentru comoditatea calculelor în loc de L ( x1 , x2 ,..., x n ; λ1 , λ2 ,..., λ m ) de cele mai multe ori se
notează L ( x1 , x2 ,..., x n ) . Se calculează punctele staţionare ale funcţiei lui Lagrange, adică se rezolvă sistemul: ⎧ ∂L ⎪ ∂x = 0, i = 1, n ⎪ i (2.56) ⎨ ∂ L ⎪ = 0, j = 1, m ⎪∂ λ j ⎩ Deoarece
∂L = Fj , j = 1, m ∂λ j
(2.57)
Sistemul (2.56) se poate scrie în următoarea reprezentare:
85
⎧ ∂L ⎪ ∂x = 0 ⎪ 2 ⎪ ∂L ⎪ ∂x = 0 ⎪ 1 ⎪ ⎪ ⎪ ∂L =0 ⎨ ∂ x ⎪ n ⎪ F ( x , x ,..., x ) = 0 n ⎪ 1 1 2 ⎪ ⎪ ⎪ Fm ( x1 , x2 ,..., x n ) = 0 ⎪ ⎪⎩
(
(2.58)
)
Fie x10 , x 20 ,..., x n0 ; x10 , λ10 , λ02 ,..., λ0m o soluţie a sistemului (2.58) aceasta înseamnă că acest punct este staţionar pentru funcţia lui Lagrange L. Se poate demonstra uşor că dacă x10 , x 20 ,..., x n0 ; x10 , λ10 , λ02 ,..., λ0m este punct staţionar pentru L atunci x10 , x 20 ,..., x n0 este punct staţionar pentru f supus restricţiilor F1 = F2 = ... = Fn = 0 . Adică: ⎧ ∂f 0 0 0 ⎪ ∂x x1 , x 2 ,..., x n = 0 ⎪ 1 ⎪ ⎪ ⎪ ∂f x 0 , x 0 ,..., x 0 = 0 n (2.59) ⎨ ∂x 1 2 ⎪ n ⎪ F1 x10 , x 20 ,..., x n0 = 0 ⎪ ⎪ ⎪ F x 0 , x 0 ,..., x 0 = 0 n ⎩ m 1 2
(
)
(
(
)
(
)
(
)
(
)
)
Deoarece punctele de extrem ale unei funcţii de mai multe variabile se găsesc printre punctele ei staţionare în baza celor spuse mai înainte, punctele de extrem ale lui f supuse la legăturile F1 = F2 = ... = Fm = 0 se vor găsi printre punctele staţionare ale funcţiei lui Lagrange. Fie ( a1 , a2 ,..., a n ) un punct staţionar pentru f supus la restricţiile F1 = F2 = ... = Fm = 0 .
Calculăm diferenţa f ( x1 , x 2 ,..., x n ) − f (a1 , a 2 ,..., a n ) pentru toate punctele x1 , x 2 ,..., x n supuse (2.60) restricţiilor F1 (x1 , x 2 ,..., x n ) = F2 ( x1 , x 2 ,..., x n ) = ... = Fm ( x1 , x 2 ,..., x n ) . În baza egalităţilor (2.60) rezultă imediat egalitatea: f (x1 , x 2 ,..., x n ) − f (a1 , a 2 ,..., a n ) = L(x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n )
(2.61)
Deci pentru a determina dacă punctul staţionar este punct de extrem, vom evalua diferenţa următoare: L(x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n )
86
Presupunem că funcţiile f , F1 , F2 ,..., Fm sunt derivabile parţial până la ordinul 3 inclusiv. Aplicând formula lui Taylor pentru funcţiile de mai multe variabile până la ordinul 2 (se mai spune de ordinul 2) avem egalitatea: ⎞ 1 ⎛ ∂L (x1 − a1 ) + ... + ∂L (x n − a n )⎟⎟ + L( x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n ) = ⎜⎜ ∂x n 1! ⎝ ∂x1 ⎠ (2.62) ⎞ 1 ⎛⎜ n ∂ 2 L (a )(xi − ai )(x j − a j ) + R2 ⎟⎟ + ∑ 2! ⎜⎝ i , j =1 ∂xi ∂x j ⎠ Derivatele parţiale de ordinul 1 şi 2 care apar în egalitatea (2.62) sunt calculate în punctul (a1 , a 2 ,..., a n ) = a . Deoarece punctul (a1 , a 2 ,..., a n ) este staţionar pentru L avem: ⎧ ∂L ⎪ ∂x (a1 , a 2 ,..., a n ) = 0 ⎪ 1 ⎪ ∂L (a1 , a 2 ,..., a n ) = 0 ⎪ ⎨ ∂x 2 ⎪ ⎪ ⎪ ∂L ⎪ ∂x (a1 , a 2 ,..., a n ) = 0 ⎩ n - restul R2 se poate demonstra că este neglijabil; - diferenţele xi − ai , x j − a j reprezintă creşterile argumentelor, le vom nota dxi , dx j ( dxi reprezintă de fapt diferenţiala funcţiei f ( x1 , x 2 ,..., x n ) = xi , i = 1, n ). Egalitatea (2.60) va deveni: L(x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n ) =
1 n ∂2L (a1 , a 2 ,..., a n )dxi dx j ∑ 2 i , j =1 ∂xi ∂x j
(2.63)
Se observă că membrul stâng din egalitatea (2.63) de fapt creşterea funcţiei L în punctul
(a1 , a 2 ,..., a n ) este ţinând seama de forma membrul drept o formă pătratică în variabilele dxi , dx j . Notăm această formă pătratică prin d 2 L(a1 , a 2 ,..., a n ) . Avem prin urmare egalităţile: f ( x1 , x 2 ,..., x n ) − f (a1 , a 2 ,..., a n ) = L( x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n ) = =
1 n ∂2L (a1 , a 2 ,..., a n )dxi dx j ∑ 2 i , j =1 ∂xi ∂x j
Deoarece punctul (x1 , x 2 ,..., x n ) verifică restricţiile problemei avem egalitatea:
87
(2.64)
⎧ F1 ( x1 , x2 ,..., xn ) = 0 ⎪ ⎪ F2 ( x1 , x2 ,..., xn ) = 0 ⎨ ⎪ ⎪ F ( x , x ,..., x ) = 0 n ⎩ m 1 2
(2.65)
Diferenţiem egalităţile (2.65): ∂F1 ∂F1 ⎧ ∂F1 ⎪ ∂x dx1 + ∂x dx 2 + ... + ∂x dx n = 0 2 n ⎪ 1 ⎪ ∂F2 ∂F ∂F dx1 + 2 dx 2 + ... + 2 dx n = 0 ⎪ ∂x 2 ∂x n ⎨ ∂x1 ⎪ ⎪ ∂Fm ∂Fm ⎪ ∂Fm ⎪ ∂x dx1 + ∂x dx 2 + ... + ∂x dx n = 0 2 n ⎩ 1
(2.66)
Egalităţile (2.66) pot fi interpretate ca ecuaţiile unui sistem de m ecuaţii şi n necunoscute, aceste necunoscute fiind dx1 , dx 2 ,..., dx n . Se poate demonstra că determinantul următor: ∂F1 ∂x1 ∂F2 Δ = ∂x1
∂F1 ∂x 2 ∂F2 ∂x 2
∂F1 ∂x m ∂F2 ∂x m
∂Fm ∂x1
∂Fm ∂x 2
∂Fm ∂x m
este nenul şi atunci sistemul (2.66) se poate rezolva în baza teoremei lui Cramer. Vom explicita m din cele n variabile dx1 , dx 2 ,..., dx n . Aceasta înseamnă că vom rămâne doar cu s = n – m variabile independente. Pentru comoditate vom presupune că aceste variabile independente sunt dx1 , dx 2 ,..., dx s . Introducând variabilele găsite (în sensul de a fi variabile găsite în urma rezolvării sistemului) în egalităţile (2.64) obţinem: 1 s L(x1 , x 2 ,..., x n ) − L(a1 , a 2 ,..., a n ) = ∑ Aij dxi dx j 2 i , j =1 Unde coeficienţii Aij sunt obţinuţi în urma înlocuirii în (2.64) regrupării şi renumerotării. Practic am obţinut o formă pătratică în variabilele dx1 , dx 2 ,..., dx s .
Dacă această formă pătratică păstrează semn constant atunci punctul ( a1 , a2 ,..., a n ) este
punct de extrem. Mai presus, dacă forma pătratică este pozitiv definită vom avea punct de minim, iar dacă forma pătratică este negativ definită vom avea punct de maxim. Observaţia 2.26 Condiţia ca forma pătratică să fie pozitiv definită este echivalentă cu condiţia: Δ 1 , Δ 2 ,..., Δ s > 0
88
(2.67)
unde: Δ1 = A11 A11 A21
A12 A22
A11
A12
A13
Δ 3 = A21 A31
A22 A32
A23 A33
Δ2 =
Δs =
A11
A12 …
A21
A22 … A2 s
As1
As 2 …
A1s
Ass
Concentrat condiţia (2.67) se scrie sub forma: Δ i > 0, i = 1, s Observaţia 2.27 Condiţia ca forma pătratică să fie negativă definită este echivalentă cu faptul că: (− 1)k Δ k > 0, k = 1, s
Determinanţii Δ 1 , Δ 2 ,..., Δ k sunt cei daţi anterior. Observaţia 2.28 Condiţiile date de la observaţia (2.26) şi (2.27) sunt de fapt condiţiile de la extremele funcţiilor de mai multe variabile (n > 2 ) . Uneori este mai comod să lucrăm cu forma pătratică, atunci este mai comod să lucrăm cu aceşti determinanţi. Dacă vom lucra cu aceşti determinanţi înseamnă că vom fi conduşi la un rezultat sigur (punctul staţionar este de maxim, este de minim sau nu este punct de extrem), dar metoda este incomodă din punct de vedere de calculat orice. 2.4.3. Probleme rezolvate 1. Să se găsească punctele de extrem ale funcţiei: f ( x, y , z ) = x 3 + y 3 + z 3 supus la legătura x 2 + y 2 + z 2 = 3 ⇔ x 2 + y 2 + z 2 − 3 = 0 F (x, y, z )
Construim funcţia lui Lagrange: L ( x , y , z , λ ) = f ( x , y , z ) + λ F ( x, y , z )
(
L ( x, y , z , λ ) = x 3 + y 3 + z 3 + λ x 2 + y 2 + z 2 − 3 Determinăm punctele staţionare pentru L:
89
) ( x, y , z ) = 0
⎧ ∂L ⎪ ∂x ⎪ ⎪ ∂L ⎪⎪ ∂y ⎨ ⎪ ∂L ⎪ ∂z ⎪ ⎪ ∂L ⎩⎪ ∂λ
=0 ⎧3 x 2 + 2λx = 0 ⎧ x(3x + 2λ ) = 0 ⎧3 x + 2λ = 0 ⎪ 2 =0 ⎪ y (3 y + 2λ ) = 0 ⎪3 y + 2λ = 0 ⎪3 y + 2λy = 0 ⎪ ⎪ ⇒ ⎨ 2 ⇒ ⎨ ⇒ ⎨ ⎪3z + 2λz = 0 ⎪ z (3 z + 2λ ) = 0 ⎪3 z + 2λ = 0 =0 2 2 2 ⎪x 2 + y 2 + z 2 = 3 ⎪⎩ x + y + z − 3 = 0 ⎪⎩ x 2 + y 2 + z 2 − 3 = 0 ⎩ =0
− 2λ ⎧ ⎪x = 3 ⎪ ⎪ y = − 2λ ⎪ 3 ⎨ ⎪ − 2λ ⎪z = 3 ⎪ 2 ⎪⎩ x + y 2 + z 2 − 3 = 0 3 Deci: λ2 =
4λ 2 −3 = 0 3
9 3 , λ=± 4 2
3 ⎧ ⎪λ = − 2 ⎪⎪ 1) ⎨ x = 1 ⎪y = 1 ⎪ ⎪⎩ z = 1
3 ⎧ ⎪λ = 2 ⎪⎪ 2) ⎨ x = −1 ⎪ y = −1 ⎪ ⎪⎩ z = −1
soluţie nesatisfăcătoare
⎧a = 1 ⎪ Există un singur punct staţionar: ⎨b = 1 ⎪c = 1 ⎩
Calculăm diferenţialele: dL = 3 x 2 + 2λx dx + 3 y 2 + 2λy dy + 3 z 2 + 2λz dz
((
)
(
)
(
) )
d L = (6 x + 2λ )(dx ) + (6 y + 2λ )(dy ) + (6 z + 2λ )(dz ) 3 λ=− 2 2 2 2 2 d L = (6 x − 3)(dx ) + (6 y − 3)(dy ) + (6 z − 3)(dz ) 2
2
2
Diferenţiem legătura:
90
2
dF = 2 xdx + 2 ydy + 2 zdz = 0 ⇒ dz = − Deci: d 2 L = ( 6 x − 3)( dx ) + ( 6 y − 3)( dy ) + ( 6 z − 3) ⋅ 2
2
Calculăm: d 2 L(1,1,1)
1 (dx + dy ) 2
1 2 ( dx + dy ) 4
(
d 2 L(1,1,1) = 3(dx ) + 3(dy ) + 3(dx + dy ) = 6(dx ) + 6(dy ) + 6dxdy = 6 (dx ) + (dy ) + dxdy A11 = 6 2
2
2
2
2
2
)
A12 = 6 2 = 3 A21 = 6 2 = 3 A22 = 6 Δ 1 = A11 = 6 Δ2 =
A11
A12
A21
A22
=
6 3 3 6
= 36 − 9 = 27 > 0
Δ1 > 0 ⎫ ⎬ ⇒ punctul M 0 (1,1,1) este punct de minim. Δ 2 > 0⎭
2. Să se determine extremele cu legături ale funcţiei: f ( x, y, z ) = x − 2 y + 2 z cu legătura x 2 + y 2 + z 2 = 9 . Rezolvare: Se construieşte funcţia lui Lagrange:
(
)
L(x, y, z , λ ) = x − 2 y + λ x 2 + y 2 + z 2 − 9 . Determinăm punctele staţionare condiţionate prin rezolvarea sistemului: ∂L ∂L ∂L = 1 + 2λx = 0, = −2 + 2λx = 0, = 2 + 2λx = 0, x 2 + y 2 + z 2 = 9 ∂x ∂y ∂z 1 1 1 Din primele trei relaţii obţinem: x = − , y= , z=− înlocuind în ultima relaţie, λ λ 2λ 1⎞ 1 ⎛ obţinem: λ = ± . Aşadar, găsim următoarele puncte staţionare condiţionate A1 ⎜ − 1,2,−2, ⎟ , 2⎠ 2 ⎝ 1⎞ ⎛ A2 ⎜1,−2,2,− ⎟ . Calculăm d 2 L( x, y, z , λ ) în punctele A1 şi A2 . 2⎠ ⎝ d 2L =
∂2L 2 ∂2L 2 ∂2L 2 ∂2L ∂2L ∂2L dx + dy + dz + 2 dxdy + 2 dxdz + 2 dydz ∂x∂y ∂x∂z ∂y∂z ∂x 2 ∂y 2 ∂z 2 ∂2L ∂2L ∂2L ∂2L ∂2L ∂2L = = = 2 λ , = = =0 ∂x∂y ∂x∂z ∂y∂z ∂x 2 ∂y 2 ∂z 2
(
d 2 L = 2λ dx 2 + dy 2 + dz 2
91
)
Diferenţiala legăturii ne dă 2 xdx + 2 ydy + 2 zdz = 0 , de unde dx =
−1 ( ydy + zdz ) . Înlocuind x
pe dx în expresia lui d 2 L obţinem: ⎡1 ⎤ 2 d 2 L = 2λ ⎢ 2 ( ydy + zdz ) + dy 2 + dz 2 ⎥ ⎣x ⎦ 1⎞ ⎛ În punctul A1 ⎜ − 1,2,−2, ⎟ obţinem: 2⎠ ⎝ d 2 L( A1 ) = 5dy 2 + 8dydz + 5dz 2 a11 = 5, a12 = a 21 = −4, a 22 = 5 . Deci Aşadar, pentru forma pătratică avem 2 Δ 1 = a11 = 5 > 0, Δ 2 = a11 a 22 − a12 = 9 > 0 . În concluzie (− 1,2,−2 ) este un punct de minim, f min = −9 . 1⎞ ⎛ În punctul A2 ⎜1,−2,2,− ⎟ obţinem d 2 L( A2 ) = −5dy 2 + 8dydz + 5dz 2 , aşadar, pentru forma 2⎠ ⎝ pătratică avem Δ 1 = a11 = −5 < 0, Δ 2 = a11 a 22 − a122 = (− 5)(− 5) − 4 2 = 9 > 0 . În concluzie (1,−2,2 ) este un punct de maxim, f max = 9 . 2.4.4. Probleme propuse 1. Fie f : R 2 → R, f ( x, y ) = xy . Să se determine extremele funcţiei f ştiind că 2x + 3y − 5 = 0 . ∂L ∂L Indicaţie: L( x, y, λ ) = xy + λ (2 x + 3 y − 5); = y + 2λ ; = x + 3λ ∂x ∂y 3 3 ⎛5 5⎞ ⎛5 5 5 ⎞ A1 ⎜ , ,− ⎟, d 2 L = dxdy, 2dx + 3dy = 0, dx = − dy rezultă că d 2 L = − dy 2 < 0, ⎜ , ⎟ 2 2 ⎝4 6⎠ ⎝ 4 6 12 ⎠ - punct de maxim.
2. Fie f : R 2 → R, f ( x, y ) = xy . Să se determine extremele funcţiei f ştiind că x + y = 1 . Indicaţie:
∂L ∂L = y + λ; = x+λ ∂x ∂y ⎛1 1 1⎞ ⎛1 1⎞ A1 ⎜ , ,− ⎟, d 2 L = dxdy, dx + dy = 0, d 2 L = −dy 2 < 0, ⎜ , ⎟ - punct de maxim. ⎝2 2 2⎠ ⎝2 2⎠ L(x, y, λ ) = xy + λ ( x + y − 1);
3. Fie f : R 2 → R, f ( x, y ) = ( x − 1) + y 2 . Să se determine extremele funcţiei f. ştiind că x2 − y2 = 1. 2
Indicaţie:
92
∂L ∂L = 2( x − 1) y + 2λx; = 2 y − 2λy ∂x ∂y A1 (1,0,0 ), d 2 L = (2 + 2λ )dx 2 + (2 − 2λ )dy 2 ; d 2 L( A1 ) > 0 (1,0) - punct de minim.
(
)
L(x, y ) = (x − 1) + y 2 + λ x 2 − y 2 − 1 ; 2
4. Fie f : R 3 → R, f ( x, y, z ) = x + 2 y − 2 z . Să se determine extremele funcţiei f. ştiind că x 2 + y 2 + z 2 = 16 . Indicaţie:
(
)
L(x, y, z ) = x + 2 y − 2 z + λ x 2 + y 2 + z 2 − 16 ;
∂L ∂L ∂L = 1 + 2λx; = 2 + 2λy; = −2 + 2λz ∂x ∂y ∂z
⎛ 4 8 8 8⎞ ⎛ 4 8 8 8⎞ A1 ⎜ , ,− ,− ⎟, A2 ⎜ − ,− , , ⎟, d 2 L = 2λdx 2 + 2λdy 2 + 2λdz 2 , d 2 L( A1 ) < 0. ⎝ 3 3 3 3⎠ ⎝ 3 3 3 3⎠ ⎛ 4 8 8⎞ ⎜ , ,− ⎟ punct de maxim ⎝ 3 3 3⎠ ⎛ 4 8 8⎞ d 2 L( A2 ) > 0, ⎜ − ,− , ⎟. punct de minim. ⎝ 3 3 3⎠
93
BIBLIOGRAFIE [1] Inacu, C., Pop, M., Probabilităţi şi statistică matematică, Ed. Servoset, Arad, 1996 [2] Iosifescu, M., Mihoc, Gh., Teodorescu, R., Teoria probabilităţilor şi statistică matematică, Ed. Tehnică, Bucureşti, 1966 [3] Mitran, I., Matematici aplicate în economie, vol. I,II, Lito. Universităţii din Petroşani, 1996 [4] Popescu, O., Matematici aplicate în economie, vol. I,II, E.D.P., Bucureşti, 1993 [5] Stanci, P., Criveam, Gh., Fiks, W., Matematici aplicate în economie, Ed. Facla, Timişoara, 1981 [6] Stovre, P., Matematici aplicate în economie, Ed. Serinul Românesc, Craiova, 1982