Lezioni Di Matematica

  • Uploaded by: Paperino Paperut
  • 0
  • 0
  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Lezioni Di Matematica as PDF for free.

More details

  • Words: 67,014
  • Pages: 202
Appunti di Matematica Simone Secchi Dipartimento di Matematica ed Applicazioni Università degli Studi di Milano–Bicocca 22 febbraio 2009

ii

Prefazione Le dispense che state leggendo nascono dall’esperienza di insegnamento del corso di Matematica per gli allievi biotecnologi dell’Università degli Studi di Milano–Bicocca. Il programma del corso è piuttosto vasto, e la prima difficoltà è stata quella di scegliere un libro di testo. Alcune esigenze hanno reso molto difficile questo compito: innanzitutto è opportuno utilizzare materiale in lingua italiana, onde evitare di aggiungere la difficoltà di apprendimento in una lingua straniera a quella intrinseca della materia. Inoltre, la presenza di argomenti piuttosto avanzati (introduzione alle equazioni differenziali ordinarie, cenni ai metodi di approssimazione) esclude la maggioranza delle opere attualmente presenti sul mercato. Dalle discussioni con alcuni insegnanti di scuola media superiore, è emerso chiaramente l’abbassamento del livello dei programmi scolastici rispetto a quelli di vent’anni fa. Basti dire che, nei licei scientifici e nei principali istituti tecnici degli anni ’90 del secolo scorso, era consuetudine insegnare tutti gli argomenti che tratteremo in queste dispense, sebbene con poche dimostrazioni rigorose. Non era raro, poi, studiare il calcolo combinatorico e qualche concetto di probabilità elementare. È chiaro che i testi più datati di Istituzioni di Matematica sono ormai inutilizzabili per i nuovi corsi. Questi appunti non sostituiscono in alcun modo un buon libro di testo, ad esempio quelli elencati in bibiliografia o quelli consigliati nelle informazioni sul corso all’URL http://www.matapp.unimib.it/~secchi nella sezione dedicata alla didattica. Piuttosto vengono proposti per non “perdere la bussola” durante lo studio dei testi più autorevoli. Ogni capitolo costituisce un argomento o una serie di argomenti affini, che costituiscono l’ossatura del corso di Matematica per la laurea di primo livello in Biotecnologie, Biologia, e più generalmente in tutti i corsi dove non si debba insegnare il calcolo matriciale e vettoriale. In questa versione ho inserito, per completezza, un breve capitolo sulle serie numeriche (di numeri reali). Difficilmente c’è il tempo per insegnare anche questo argomento, che in effetti sarebbe utile affrontare. Il capitolo sulle serie non è comunque indispensabile alla comprensione del resto delle dispense. iii

iv Gli argomenti trattati sono quelli classici, esposti nell’ordine più classico:1 brevi richiami di insiemistica e di teoria elementare delle funzioni, successioni e loro limiti, limiti di funzioni e funzioni continue, derivazione, integrazione secondo Riemann. I prerequisiti sono quelli di ogni corso di matematica a livello universitario, e comprendono l’algebra delle scuole superiori, i principi della geometria analitica nel piano, le più importanti formule della trigonometria e possibilmente la capacità di usare la logica elementare. In queste dispense mancano, salvo poche eccezioni, esempi ed applicazioni. D’altronde, libri di testo pieni di figure e di esempi banali abbondano in ogni biblioteca universitaria. Personalmente ho sempre faticato ad imparare la matematica su questo genere di libri, e posso garantire che molte applicazioni sono in realtà accademiche. Nell’ultimo decennio, l’università italiana ha subito molti cambiamenti. La (presunta) urgenza di aumentare il numero di laureati ha spinto il legislatore a ridurre e semplificare il percorso formativo degli studenti. Se prima avevamo – poniamo – cento laureati provenienti da lunghi corsi annuali di otto mesi, ora abbiamo centoventi laureati che hanno assorbito come spugne gli stessi contenuti esposti però superficialmente. Non è difficile comprendere che i corsi di matematica generale per le lauree scientifiche hanno sopportato tagli ed abusi di ogni sorta. Allo stato attuale delle cose (ma si sa che al peggio non c’è mai fine), l’antico corso di matematica che si estendeva da ottobre a giugno è ridotto ad un corso di dodici settimane all inclusive. Per amore o per forza, il programma si è apertamente sbilanciato verso il calculus delle università americane. Studiando su alcuni libri italiani più recenti, sembra che tutto si riduca a qualche tecnica di calcolo da apprendere alla stregua della ricetta per fare una torta. Questo approccio non sarebbe privo di utilità, purché al primo corso di calculus ne seguisse uno di mathematical analysis. Purtroppo (per chi scrive) o per fortuna (per chi deve ancora laurearsi), nel corso di laurea in biotecnologie non c’è spazio per un corso avanzato di matematica. Queste dispense si propongono come un ragionevole compromesso fra la praticità del calcolo e il rigore dell’analisi matematica. 1

Recentemente, sono apparsi sul mercato testi, non ancora tradotti in italiano, che vantano una presentazione dell’analisi matematica classica secondo un ordine “naturale”. Occorre dire che il cammino cronologico della matematica non rispecchia fedelmente quello dei capitoli delle nostre dispense. La derivabilità è stata studiata euristicamente prima che si fosse capito il concetto di continuità. Per molti anni ha fatto scuola l’approccio alla Bourbaki, in cui la deduzione logica prevale sulla storia: se tutte le funzioni derivabili risultano continue, è meglio allora spiegare innanzitutto che cosa sia una funzione continua. Personalmente penso che per fare matematica si più conveniente apprenderne le basi secondo la dipendenza logica. Uno storico della matematica ha probabilmente un’opinione diversa in materia.

v La teoria elementare delle successioni viene esposta come primo esempio per lo studio dei limiti. Infatti, la definizione di limite per una successione (di numeri reali) è più immediata di quella per una funzione reale di una variabile reale. Sebbene l’esperienza mi abbia dimostrato che le successioni non sono un argomento che eccita gli studenti, continuo a credere che cancellarle completamente dagli argomenti trattati sarebbe una perdita più che un guadagno. Nelle prime pagine ho inserito alcuni cenni, volutamente superficiali e pratici, di logica booleana elementare. Di fatto, è emerso che la più grande difficoltà per gli studenti del primo anno è l’abitudine a trarre conclusioni logiche da ipotesi astratte o sperimentali. È importante, in matematica, sapere che se un insieme di oggetti è descritto dalla “sovrapposizione” di due o più condizioni, gli oggetti che non cadono in questo insieme sono quelli che non soddisfano almeno una dell e suddette condizioni. Altrettanto inevitabile è l’uso delle espressioni “per ogni” ed “esiste”, che appaiono praticamente in ogni teorema. Ho comunque preferito non usare la simbologia della logica, come ∀ al posto di “per ogni”, ∃ al posto di “esiste”, ⇒ al posto di “implica”. La definizione di continuità per una funzione f : [a, b] → R in x0 si leggerebbe (∀ε > 0)(∃δ > 0)(∀x ∈ [a, b])(|x − x0 | < δ) ⇒ (|f (x) − f (x0 )| < ε). Qualunque studente inizia a barcollare di fronte a questa scrittura. Sebbene la notazione “logica” abbia un’eleganza fuori dall’ordinario, ho preferito attenermi a un linguaggio più discorsivo. In alcuni casi, ho privilegiato notazioni e convenzioni minoritarie nella letteratura italiana. Per fare qualche esempio, ho usato sistematicamente la notazione operatoriale Df per la derivata di una funzione f . Quasi tutti scrivono f 0 , ma per uno studente forse è meno evidente che la derivazione è un’operazione applicata alle funzioni. Nel contesto delle successioni, ho usato l’aggettivo “divergente” come negazione di “convergente”. Ciò contrasta con la tradizione italiana, che distingue le successioni divergenti (all’infinito) da quelle oscillanti fra due valori finiti o infiniti. Per essere espliciti, i testi italiani dicono che {n2 } è una successione divergente, mentre {(−1)n } è indeterminata. Capiterà spesso, tuttavia, di scrivere o pronunciare frasi come “la successione pn tende all’infinito”, al posto della più corretta “la successione pn diverge a infinito”. In questa versione aggiornata ho introdotto un breve paragrafo sull’integrazione indefinita. Coerentemente con l’impostazione adottata, mi limito a qualche cenno. La scelta di trascurare completamente questo argomento appariva forse arrogante e snob: se un matematico o un fisico possono giudicare perfino noiose le tecniche di calcolo delle primitive, un biotecnologo ha bisogno anche di imparare a fare qualche calcolo di routine.

vi Il capito sull’integrazione secondo Riemann fornisce una trattazione pi ù ampia di quella presente in molti libri di testo. Difficilmente c’è il tempo per discutere tutti i dettagli in aula, ma la scelta di riassumere l’integrazione definita in due o tre pagine di teoremi calati dall’alto non mi convince. L’ultimo capitolo è un assaggio di calcolo numerico e approssimato. Sono fortemente critico sull’opportunità di inserire questi argomenti in un corso di matematica generale. Delle due l’una: o si insegna un’analisi numerica rigorosa, fatta di teoremi e dimostrazioni, e allora occorrono molte ore di lezione; oppure si mostra qualche tecnica senza troppi dettagli, e allora servirebbe una ausilio informatico che renda interessanti i contenuti dal punto di vista sperimentale. Poiché risulta impossibile, per varie ragione, attuare entrambe le alternative, forse sarebbe meglio recuperare delle ore per approfondire argomenti già introdotti. Concludo con un’osservazione non particolarmente originale. La matematica è come uno sport: senza esercizio non si fa molta strada. Si impara la matematica facendola, cioè cimentandosi con gli esercizi proposti nelle esercitazioni, con le prove d’esame degli anni precedenti, con gli esercizi dei libri di testo consigliati, e anche sfruttando le ore di ricevimento dei docenti. L’uso della rete Internet non è stato inserito fra le fonti principali di apprendimento. Mentre i libri di testo danno una garanzia di correttezza dei contenuti, la ricerca di materiale on line può portare a spiacevoli sorprese. Consiglio pertanto di scaricare appunti e esercizi solo da siti ritenuti assolutamente affidabili. Con rammarico devo sconsigliare allo studente lo studio sui libri delle scuole superiori. In effetti, il concetto stesso di “dimostrazione rigorosa” appare molto vago in quei libri, e la validità di un teorema è giustificata sovente con un paio di esempi. Ricordiamo, come scherzoso ammonimento, la storiella dei tre scenziati che viaggiano in treno: un ingegnere, un fisico e un matematico. Passando accanto a un recinto di pecore, il primo esclama: “Tutte le pecore sono bianche”. Il fisico lo corregge: “Tutte le pecore di questo prato sono bianche”. Interviene infine il matematico: “No, possiamo solo dire che esiste un prato in cui ci sono delle pecore, e queste pecore hanno almeno un lato bianco”. A volte si sente dire che il matematico è quello scienziato a cui piacciono i controesempi più degli esempi. Per quanto riguarda gli esercizi, molti dei testi elencati in bibliografia (e in particolare [6] e [13]) ne contengono a volontà. Sul sito del corso sono inoltre raccolte le prove scritte e quasi tutte le relative soluzioni commentate. Ho preferito evitare di aggiungere, alla fine di ogni capitolo, la classica pagina di esercizi consigliati. Per uno studente alle prime armi, un esercizio è utile soprattutto se è accompagnato da una soluzione completa o almeno parziale. Tutti ricordiamo la frustrazione provocata da un esercizio che non sapevamo

vii proprio risolvere. Incoraggio dunque tutti gli studenti ad utilizzare gli esercizi proposti e risolti in [6]. Sono certo che molti dei miei studenti hanno letto fin qui nella speranza di trovare la frase che ogni Autore si sente in obbligo di inserire nell’introduzione alla propria opera: mi sono sforzato di rendere la matematica più interessante, inserendo svariati esempi e modelli presi dalla realtà. Si è molto discusso sull’opportunità di seguire il metodo “Mary Poppins” per insegnare la matematica alle matricole.2 L’opinione di chi scrive è che gli argomenti trattati sono sufficientemente classici e spesso familiari da lasciare spazio a quel poco di rigore indispensabile in tutte le discipline scientifiche moderne. Proprietà intellettuale del materiale Queste dispense sono rese pubbliche senza oneri aggiuntivi mediante pubblicazione sul sito internet dell’Autore. È consentito l’uso e la riproduzione per scopi personali di studio e senza fini di lucro. È altresì vietato apportare qualsiasi modifica al testo da parte di terzi. Di ogni errore e imprecisione è responsabile l’autore. Ringrazio fin d’ora quanti vorranno segnalare considerazioni e commenti sul contenuto di queste dispense.

Ringraziamenti tecnico–informatici Queste dispense sono state redatte utilizzando il sistema di scrittura 3 EX su computer dotati dei sistemi operativi Apple Mac Os 10.4 e 10.5, GNU/Linux Slackware 12.2, Microsoft Windows XP, e (saltuariamente) Sun Solaris 10 su piattaforma AMD64 e PcBSD-7. L’autore è profondamente grato a Donald Knuth per aver creato a sviluppato il sistema di videoscrittura TEX, senza il quale la stesura di queste note sarebbe stata molto più complicata. La variante LATEX è stata costruita da Leslie Lamport, ed è il “dialetto” utilizzato per scrivere queste dispense. Le figure sono state prodotte dall’autore mediante i programmi XFig4 e Maple.5 . La figura 5.1 è stata creata invece con il software Asymptote.6 LAT

Cantù e Milano, febbraio 2009. 2

Basta un poco di zucchero, e la pillola va giù. Si legge approssimativamente “latek”. L’URL di riferimento è http://www.tug.org 4 http://www.xfig.org 5 Maple è un marchio registrato di Maplesoft Inc. http://www.maplesoft.com 6 http://asymptote.sourceforge.net 3

viii

Capitolo 1 Insiemi e Funzioni 1.1

Cenni di logica elementare

Qualunque scienza esatta è fondata sul ragionamento logico– deduttivo. Per noi, questo significa che seguiremo alcune leggi di calcolo con le proposizioni. Non avendo né l’obiettivo, né tantomeno il tempo per occuparci della relativa teoria, ci limiteremo a brevi cenni. Innanzitutto, gli oggetti delle nostra logica for dummies sono le proposizioni, cioè frasi di senso compiuto. Indicheremo le proposizioni con lettere minuscolo, ad esempio p, q, r, ecc. Una proposizione potrebbe essere “se piove, prendo l’ombrello”, oppure “la mia squadra del cuore è l’Inter”. Esattamente come i numeri sono gli atomi del calcolo numerico, le proposizioni sono i mattoni con cui costruire il linguaggio della matematica.. Si pensi ad un teorema, che ha la forma “Se è vera p, allora è vera q”. Ogni proposizione assume, nella logica classica, due valori: vero (V) o falso (F).1 Esaminiamo rapidamente le principali operazioni con le proposizioni. Definizione 1.1. Data una proposizione p, la sua negazione è la proposizione ∼ p, che risulta vera quando p è falsa, e falsa quando p è vera. Quindi la sua tavola di verità è p ∼p V F F V Ovviamente, la negazione di una proposizione si effettua seguendo l’intuizione: la negazione di “oggi piove” è “oggi non piove”. Occorre prestare 1

Gli informatici usano 1 per la verità e 0 per la falsità. Segnaliamo che esiste una logica, detta “fuzzy”, in cui una proposizione può essere qualcosa di diverso da vero o falso.

1

2

CAPITOLO 1. INSIEMI E FUNZIONI

attenzione alle insidie del linguaggio comune. Infatti, sarebbe sbagliato affermare che la negazione di “oggi piove” è “oggi c’è il sole”. In effetti, potrebbe anche nevicare! Definizione 1.2. Date due proposizioni p e q, la loro congiunzione p ∧ q (si legge: p e q) è vera se e solo se sia p che q sono vere, e falsa in tutte le altre situazioni. La tavola di verità della congiunzione è pertanto p q p∧q V V V V F F F V V F F F In pratica, congiungere due proposizioni significa metterle a sistema: in particolare, p ∧ (∼ p) è sempre falsa. Definizione 1.3. Date due proposizioni p e q, la loro disgiunzione p ∨ q (si legeg: p o q) è vera quando almeno una fra p e q è vera, e falsa altrimenti. La tavola di verità risulta pertanto p q p∨q V V V V F V F V V F F F Osservazione 1.4. Lo studente faccia attenzione: l’operazione di disgiunzione è intesa in senso largo, non in senso esclusivo. Nel linguaggio comune, si usa “oppure” per escludere l’eventualità che entrambe le proposizioni siano vere. In matematica, “oppure” non esclude affatto la verità simultanea dei due argomenti. In particolare non è contraddittorio dire che “2 è un numero pari oppure 3 è dispari”. Veniamo infine all’operazione su cui si costruiscono i teoremi: l’implicazione. Definizione 1.5. Date due proposizioni p e q, l’implicazione p ⇒ q (si legge: p implica q, oppure “se p allora q”) risponde alla tavola di verità p q p⇒q V V V V F F F V V F F V

1.1. CENNI DI LOGICA ELEMENTARE

3

Infine, scriveremo brevemente p ⇔ q (da leggere “p se e solo se q”, oppure “p equivale a q”) per indicare la proposizione (p ⇒ q) ∧ (q ⇒ p). Lo studente legga bene la definizione precedente. Non è proprio in li nea con le aspettative della nostra intuizione, soprattutto nel momento in cui si afferma che “falso implica falso” è vero. In realtà, viene semplicemente sostenuto che da un’ipotesi falsa può essere tranquillamente dedotta una conclusione falsa. Si ricordi che la logica proposizionale non giudica il contenuto delle singole proposizioni, ma solo le regole con cui si opera su di esse. Come detto, i teoremi saranno sempre scritti nella forma, o in forme a questa rincoducibili, Se p allora q. Lo studente, per esercizio, scriva la tavola di verità di p ⇒ q e di (∼ q) ⇒ (∼ p). Il fatto che coincidano non è casuale, ed anzi costituisce la tecnica di dimostrazione per antinomia. Concludiamo con qualche parola sui quantificatori. Definizione 1.6. Il quantificatore universale ∀ si legge “per ogni”, mentre il quantificatore esistenziale ∃ si legge “esiste”. I quantificatori permettono di comporre proposizioni articolate. Ad e sempio (∀x ∈ R)(∃n ∈ N)(n > x) si legge “per ogni numero reale x esiste un numero naturale n tale che n è maggiore di x”. Inoltre i quantificatori si negano scambiandoli: la negazionei di “per ogni” è “esiste”, e viceversa. La negazione della precedente proposizione è dunque (∃x ∈ R)(∀n ∈ N)(n ≤ x), cioè “esiste un numero reale x tale che, per ogni numero naturale n, risulta n è minore o uguale a x”. Vediamo ora alcuni esempi. 1. Siano p = p(x) = (“x è un numero negativo”) e q = q(x) = (“x2 ≥ 2”). Allora l’insieme E = {x ∈ R | p(x) ∧ q(x)} è l’insieme dei numeri reali negativi, il cui quadrato è più √ grande (o uguale) di 2. Dunque stiamo descrivendo l’insieme (−∞, 2]. 2. Usando le rispettive tavole di verità, si verifica in pochi istanti che p ⇒ q è logicamente equivalente a (∼ p) ∨ q. A parole, affermare che p implica q significa affermare che o l’ipotesi p è falsa, oppure che è vera la tesi q. In particolare, l’implicazione ⇒ non è un concetto primitivo, alla pari di ∧ e ∨.

4

CAPITOLO 1. INSIEMI E FUNZIONI 3. Descriviamo il complementare dell’insieme E = {x ∈ Z | x è dispari e ex ≤ 7}. Posto p(x) = (“x è dispari”) e q(x) = (“ex ≤ 7”), osserviamo che E = {x ∈ Z | p(x) ∧ q(x)}. Quindi il suo complementare è, per definizione, Z \ E = {x ∈ Z |∼ p(x) ∧ q(x)} = {x ∈ Z | (∼ p(x)) ∨ (∼ q(x))} = {x ∈ Z | x è pari oppure ex > 7}. Poiché log 7 ≈ 1.9, abbiamo una descrizione esplicita del complementare: Z \ E = {x ∈ Z | x è pari} ∪ (Z ∩ [2, +∞)). 4. Vogliamo negare la proposizione “Per ogni numero reale ε > 0 esiste un numero reale δ > 0 tale che la propriet à P è vera”. Seguendo le regole di negazione dei quantificatori, possiamo concludere che la negazione di questa proposizione è “Esiste un numero reale ε > 0 tale che per ogni numero reale δ > 0 la proprietà P è falsa”. Nel seguito avremo occasione di applicare questo ragionamento abbastanza spesso.

Lo studente interessato ad approfondire la logica elementare e il calcolo proposizionale, può consultare il primo capitolo del libro [20].

1.2

Richiami di insiemistica

Un noto proverbio recita Chi ben comincia ha la metà dell’opera.2 È un modo gentile per sostenere che la parte più difficile di ogni impresa è l’inizio; il resto verrà da sé. L’apprendimento dela matematica non fa eccezione a questa regola, e addirittura si prendono delle scorciatoie. Alle scuole elementari tutti noi abbiamo imparato a fare i conticini, ma forse nessuno ha imparato la definizione di numero. Anche il concetto di insieme è considerato, nella matematica elementare, come un concetto primitivo. Questo significa che non faremo alcuno sforzo per definirlo in termini di altri concetti già noti. Brevemente, un insieme sarà per noi un raggruppamento3 di oggetti di natura ben specificata. Parleremo pertanto dell’insieme delle automobili di colore rosso, come pure dell’insieme dei gatti dagli occhi verdi. Nota linguistica. Nelle principali lingue neolatine il sostantivo per indicare l’insieme matematico ha lo stesso significato doppio che ha in italiano. 2

È forse più diffusa la versione in italiano moderno Chi ben comincia, è a metà dell’opera. 3 Oppure una collezione.

1.2. RICHIAMI DI INSIEMISTICA

5

Infatti, si usa conjunto in spagnolo, ensemble in francese, insieme in italiano. Questo si rispecchia nel significato intuitivo che un insieme è proprio un raggruppamento di oggetti, che sono “messi insieme”. Il rumeno si discosta leggermente con mulţime, chiaramente indicativo di una moltitudine di oggetti. In inglese, invece, si usa il sostantivo set, e si parla di set theory. Qui si coglie una sfumatura più pragmatica, come a voler sottolineare che un insieme è qualcosa che viene organizzato, disposto, quasi “pronto all’uso”. È consuetudine4 denotare gli insiemi con lettere maiuscole dell’alfabeto latino: A, B, C, X, Y, Z, . . . Come detto, ogni insieme è formato dai suoi elementi, di qualunque natura essi siano. In matematica, l’appartenenza di x all’insieme X è indicato dal simbolo x ∈ X. Quindi, per ogni insieme X, risulta che5 X = {x | x ∈ X}. Il fatto che l’elemento x non appartiene all’insieme X, si esprime scrivendo x∈ / X. Allo studente dovrebbero essere familiari le operazioni elementari sugli insiemi, cioè l’unione, l’intersezione, il complementare di insiemi. Ricordiamo che X ∪Y X ∩Y Xc X \Y

= = = =

{x | x ∈ X oppure x ∈ Y } {x | x ∈ X e x ∈ Y } {x | x ∈ / X} {x | x ∈ X e x ∈ / Y }.

Vogliamo chiarire che la congiunzione “oppure” viene usata dai matematici in senso lato: x ∈ X ∪ Y significa che x appartiene ad almeno uno dei due insiemi X ed Y , ed eventualmente ad entrambi. Nella lingua italiana, l’affermazione “esco oppure resto a casa” è interpretata in maniera esclusiva, essendo piuttosto improbabile che io possa essere contemporaneamente 4

In certi settori della matematica, capita di denotare un insieme con una lettera minuscola o addirittura con lettere di alfabeti non latini. 5 la sbarra verticale |, spesso sostituita dai due punti, si legge “tali che”. Quindi la scrittura seguente si legge “X è l’insieme degli elementi x tali che x appartiene ad X”.

6

CAPITOLO 1. INSIEMI E FUNZIONI

dentro e fuori casa. A volte può capitare di dover scrivere proprio un’unione esclusiva, e in matematica si usa la scrittura X∆Y

= {x | x appartiene a X o a Y ma non ad entrambi} = (X ∪ Y ) \ (X ∩ Y ).

Il fatto che gli elementi di un insieme E appartengano anche a un (altro) insieme X si scrive E ⊂ X oppure X ⊃ E. Osservazione 1.7. A scanso di equivoci, sottolineiamo che, per noi, scrivere E ⊂ X non esclude affatto che E = X. Alcuni testi usano il simbolo ⊂ in senso esclusivo, mentre usano E ⊆ X per dire quello che noi diciamo con E ⊂ X. Si tratta di convenzioni, e crediamo che il lettore di questi appunti non avrà mai occasione per rimpiangere le convenzioni adottate. Probabilmente meno nota è la costruzione del prodotto cartesiano di due insiemi. Nel nostro corso non avremo grandi occasioni di farne uso, ma preferiamo spendere qualche parola visti i legami con il piano cartesiano. Definizione 1.8. Dati due insiemi X ed Y , il loro prodotto cartesiano X ×Y è l’insieme i cui elementi sono coppie ordinate del tipo (x, y) dove x ∈ X ed y ∈Y. L’aggettivo “ordinate” si riferisce alla seguente proprietà: due coppie (x, y) e (x0 , y 0 ) sono uguali se e solo se x = x0 , y = y 0 . Lo studente che volesse approfondire ulteriormente le problematiche della moderna teoria degli insiemi, può riferirsi all’appendice di [19].

1.3

Insiemi numerici

Durante lo studio del nostro corso, lo studente si imbatter` quasi esclusivamente con insiemi di numeri. Ci sembra utile richiamare brevemente la terminologia dei principali insiemi numerici. L’insieme dei numeri naturali, i primi numeri che l’uomo ha utilizzato nella vita quotidiana, è indicato dal simbolo N. Pertanto,6 N = {0, 1, 2, 3, 4, 5, 6, . . . }. 6

Alcuni libri di testo preferiscono escludere lo zero 0 da N. È una scelta supportata solo dal proprio gusto.

1.3. INSIEMI NUMERICI

7

Se a questi numeri aggiungiamo anche i numeri negativi, otteniamo l’insieme dei numeri interi relativi Z, cioè Z = {. . . , −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5, . . . }. La necessità di dividere fra loro dei numeri interi relativi ha spinto a costruire un insieme più capiente di numeri, detti numeri razionali. Precisamente,   p | p, q ∈ Z, q 6= 0 . Q= q Daremo per scontati i discorsi sulla possibilità di scrivere lo stesso numero razione in infiniti modi diversi, sulla riduzione delle frazioni ai minimi termini, e così via.7 L’ultimo insieme numerico che introduciamo, è anche quello più importante. Purtroppo, la sua costruzione non è affatto elementare, né è possibile specificare semplicemente che cosa occorra aggiungere a Q per ottenerlo. Si tratta dell’insieme dei numeri reali R. Possiamo pensare a R come all’insieme dei punti di una retta.8 Nonostante questa difficoltà tecnica, i numeri reali sono ormai parte integrante della cultura di qulunque studente delle scuole superiori. È un dato di fatto che l’uso dei numeri reali è di facilissimo apprendimento, senza dubbio agevolato dalla diffusione delle calcolatrici tascabili negli ultimi vent’anni. Gli sparuti studenti interessati a capire meglio come nascano rigorosamente i numeri reali, possono consultare uno dei testi indicati in bibliografia, ad esempio [3, 6]. Non ci sembra il caso di insistere sul fatto che9 N ⊂ Z ⊂ Q ⊂ R. Nell’affrontare la teoria dei limiti, ci sarà utile la seguente proprietà dei numeri naturali rispetto ai numeri reali. La dimostrazione può essere letta in [24]. 7

Algebricamente, Q è il primo insieme numerico, a parte l’ovvietà della costruizione di Z, costruibile in maniera elementare ma non banale. Precisamente, i numeri razionali sono delle classi di equivalenza di coppie ordinate di numeri interi con segno. Se lo studente non ha capito nemmeno una parola dell’ultima frase, non è grave. In parole povere, la frazione 1/2 è la coppia ordinata (1, 2), e il fatto che 1/2 = 2/4 = 3/6 = . . . si rispecchia nell’introduzione di una “regola”, la relazione di equivalenza, che considera uguali le coppie (1, 2), (2, 4), (3, 6), ecc. 8 Già quarant’anni fa, Walter Rudin osservava nella prefazione del suo libro [24] che la maggior parte degli studenti non sente la necessità di costruire l’insieme dei numeri reali, almeno in prima battuta. 9 In realtà, non si tratta di vere inclusioni insiemistiche; piuttosto dovremmo parlare di immersioni.

8

CAPITOLO 1. INSIEMI E FUNZIONI

Proposizione 1.9 (Proprietà archimedea dei numeri reali). Per ogni y ∈ R ed ogni x > 0 reale, esiste n ∈ N tale che nx > y. Per i nostri scopi, applicheremo quasi esclusivamente il seguente Corollario 1.10. Per ogni numero reale x > 0, esiste un numero naturale n tale che n > x. Dim. Ovviamente è una conseguenza diretta della Proposizione precedente. Però si dimostra anche in modo elementare: immaginiamo che x sia scritto nella sua espansione decimale, e “arrotondiamolo” al numero intero n successivo. Per esempio, se x = 1475.1234567, lo arrotondiamo a n = 1476. Questo numero naturale n è quello cercato. Una proprietà meno nota dei numeri reali è la seguente. Proposizione 1.11. Fra due numeri reali qualsiasi e distinti, cade sempre un numero razionale. Non esponiamo la dimostrazione di questo fatto, che il lettore interessato potrà studiare in [24]. Ci limitiamo ad osservare che da questa proposizione deriva la possibilità di approssimare, con errore scelto a piacere, ogni numero reale con un numero razionale. Infatti, sia x un numero reale, e sia ε > 0 l’errore con cui vogliamo approssimare x mediante un numero reale. Dalla Proposizione precedente, applicata ai due numeri reali distini x − ε e x + ε, deduciamo c he esiste un numero razionale q tale che x − ε ≤ q ≤ x + ε. Pertanto |x − q| ≤ ε, come volevasi dimostrare. Nota tipografica: simboli altrettanto diffusi per denotare i precedenti insiemi numerici sono N, Z, Q e R. Concludiamo questo paragrafo con alcune considerazioni sul valore assoluto di un numero reale. Definizione 1.12. Il valore assoluto (spesso detto anche modulo) di un numero reale x è definito come ( x, se x ≥ 0 |x| = −x, se x < 0 Operativamente, la definizione del valore assoluto di un qualsiasi numero reale x è basata sul controllo del segno di x. Se x è positivo o nullo, viene restituito il valore x. Se x è negativo, viene restituito il valore −x. Qualche volta si trova scritto che “|x| è il numero x, senza segno”. Questa affermazione è suggestiva ma priva di senso: tutti i numeri reale hanno un segno!

1.3. INSIEMI NUMERICI

9

Lemma 1.13. Per ogni x, y, z ∈ R, vale la disuguaglianza triangolare |x − y| ≤ |x − z| + |z − y|.

(1.1)

Dim. Basta dimostrare che, per ogni a, b ∈ R, vale la disuguaglianza |a + b| ≤ |a| + |b|.

(1.2)

Infatti, scegliendo a = x−z e b = z−y, da questa segue subito |x−z+z−y| = |x − y| ≤ |x − z| + |z − y|, che è la tesi. Siano quindi a e b due numeri reali qualunque. Distinguiamo vari casi. 1. Se a = 0 oppure b = 0, la tesi è ovvia. 2. Se a > 0 e b > 0, allora a+b ≥ 0. Vogliamo dimostrare che a+b ≤ a+b, ma questo è ovvio. 3. Se a < 0 e b < 0, allora a + b < 0. Pertanto vogliamo dimostrare che |a + b| = −a − b ≤ −a − b, e ancora una volta questa relazione è ovvia. 4. Se i due numeri a e b sono l’uno positivo e l’altro negativo, a primo membro di (1.2) abbiamo la differenza fra due numeri positivi, e a secondo membro abbiamo la loro somma. Ovviamente il primo membro è minore del secondo. Avendo verificato la tesi in tutti i casi possibili, la dimostrazione è completa. Concludiamo con qualche informazione sulle diseguaglianze che coinvolgono i valori assoluti. Lo studente apprezzerà queste informazioni leggendo il capitolo sui limiti. Lemma 1.14. Per ogni ε > 0, {x ∈ R : |x| ≤ ε} = {x ∈ R : −ε ≤ x ≤ ε} {x ∈ R : |x| ≥ ε} = {x ∈ R : x ≤ −ε} ∪ {x ∈ R : x ≥ ε} Dim. Dimostriamo la prima uguaglianza. Essendo un’uguaglianza fra due insiemi, occorre dimostrare la doppia inclusione. Sia dunque x un numero reale tale che |x| ≤ ε. Questo vuol dire che x ≤ ε se x ≥ 0, e che −x ≤ ε se x < 0. Nel primo caso, 0 ≤ x ≤ ε, nel secondo −ε ≤ x < 0. L’insieme delle “soluzioni” sarà l’unione di queste condizioni, cioè −ε ≤ x ≤ ε. Abbiamo dimostrato che {x ∈ R : |x| ≤ ε} ⊂ {x ∈ R : −ε ≤ x ≤ ε}

10

CAPITOLO 1. INSIEMI E FUNZIONI

Viceversa, sia x un numero reale tale che −ε ≤ x ≤ ε. Allora |x| è un numero reale, non negativo, non superiore a ε. Quindi {x ∈ R : |x| ≤ ε} ⊃ {x ∈ R : −ε ≤ x ≤ ε} e pertanto i due insiemi a primo e a secondo membro coincidono. Lasciamo allo studente la verifica della seconda uguaglianza, imitando i ragionamenti appena visti. Passando dai simboli alle parole, il Lemma precedente ci dice che la relazione |x| ≤ ε equivale a −ε ≤ x ≤ ε. Similmente, la relazione |x| ≥ ε equivale a x ≤ −ε oppure x ≥ ε. Osservazione 1.15. Occorre fare attenzione quando si utilizzano quantità aribitrarie. Ad esempio, se x è un numero reale tale che |x| < ε per ogni ε > 0, allora x = 0. Se infatti x fosse diverso da zero, allora potremmo scegliere ε = |x|/2 e avremmo la contraddizione |x| ≥ ε. A parole, stiamo dicendo che l’unico numero non negativo arbitrariamente piccolo è lo zero.

1.4

Topologia della retta reale

In questa breve sezione, il lettore vedrà delle idee e dei simboli certamente già noti fin dalle scuole medie. Eppure, dubitiamo che i professori delle scuole medie gli abbiano mai parlato di topologie. La topologia 10 è un ramo della matematica che si occupa di studiare in astratto il concetto di “forma”. In che senso possiamo deformare un oggetto di gomma, cambiandone l’aspetto esteriore, senza però dire che si rtatta di un oggetto differente? A questa e ad altre domande tenta di rispondere proprio la topologia. Ovviamente, i nostri numeri reali sono un caso molto particolare di “spazio topologico”, e noi ci accontenteremo di formalizzare alcuni concetti utili nel resto del corso. 10

Dal greco topos e logos, dunque “conoscenza della forma”.

1.4. TOPOLOGIA DELLA RETTA REALE

11

Definizione 1.16. Siano a e b due numeri reali. Diciamo che a < b (a è minore di b) se b − a è un numero positivo. Se b − a è un numero negativo, diremo al contrario che a > b. Il simbolo a ≤ b indica il fatto che b − a è positivo oppure zero, e analogamente a ≥ b. 11 Definizione 1.17. Sia E ⊂ R un sottoinsieme dei numeri reali. Un numero M ∈ R è un maggiorante per E se x≤M

per ogni x ∈ E.

Analogamente, un numero m ∈ R è un minorante per E se x ≥ m per ogni x ∈ E. Un insieme E di numeri reali è limitato dall’alto se possiede un maggiorante, mentre è limitato dal basso se possiede un minorante. Per esempio, N è limitato dal basso poiché ogni numero naturale è maggiore o uguale a zero. Tuttavia N non è limitato dall’alto, perché esistono numeri naturali grandi quanto vogliamo. Definizione 1.18. Sia E un sottoinsieme di R, limitato dall’alto. L’estremo superiore di E, denotato con sup E, è definito come il più piccolo di tutti i maggioranti di E. Analogamente, l’estremo inferiore di E, inf E, è definito come il più grande di tutti i minoranti di E. Osservazione 1.19. In generale, inf E e sup E non appartengono ad E. Si confronti con la definizione di minimo e massimo nelle prossime pagine. Sarà comodo, nel seguito, usare delle notazioni meno rigide per inf e sup. Ad esempio, scriveremo 1 inf = 0 n∈N n invece di   1 | n ∈ N = 0. inf n 11

Questa definizione, a pensarci bene, fatica a stare in piedi. Come definire un numero positivo x, se non chiedendo che x > 0? È un circolo vizioso. Tuttavia, speriamo che lo studente sappia distinguere un numero positivo da uno negativo in maniera quasi inconscia.

12

CAPITOLO 1. INSIEMI E FUNZIONI

La prima notazione, che sembra interpretare inf come un’operazione sui numeri invece che sugli insiemi, fa il paio con la notazione per le unioni e le intersezioni di insiemi. Infatti, se A1 , A2 e A3 sno tre insiemi qualsiasi, si scrive 3 [ Ai i=1

invece di [

{A1 , A2 , A3 } =

[

{Aj | i ∈ {1, 2, 3}} .

Queste notazioni abbreviate hanno qualche risvolto curioso. Se E è un insieme di numeri reali, la scrittura sup x x∈E

coincide in tutto e per tutto con sup E, ma questa volta non possiamo dire che sia preferibile. Ne traiamo una morale: le notazioni con il pedice sono preferibili quando l’insieme su cui agiscono inf e sup hanno una descrizione di tipo “funzionale” {f (x) | x ∈ E}. Per un approfondimento delle notazioni insiemistiche, consigliamo il libro di P. Halmos [15] e quello di J. Kelley [19]. In quest’ultimo si suggerisce anche la notazione  E x2 < 1 x∈R

per significare l’insieme {x ∈ R | x2 < 1}. Possiamo ritenerci fortunati che questa notazione non abbia mai preso piede! Lemma 1.20. M ∈ R è l’estremo superiore di E se e solo se 1. M ≥ x per ogni x ∈ E; 2. per ogni ε > 0 esiste x ∈ E tale che M − ε ≤ x ≤ M . Una caratterizzazione analoga vale per l’estremo inferiore. Lemma 1.21. m ∈ R è l’estremo inderiore di E se e solo se 1. m ≤ x per ogni x ∈ E; 2. per ogni ε > 0 esiste x ∈ E tale che m ≤ x ≤ m + ε. Non dimostriamo in questi appunti i due lemmi precedenti. Spendiamo qualche parola sul loro significato. Il primo, ad esempio, ci dice che l’estremo superiore di un sottoinsieme E di R è quel numero M che innanzitutto è un maggiorante. E, in secondo luogo, ci devono essere elementi di E vicini a piacere a M .

1.5. L’INFINITO

13

Definizione 1.22. Sia E un sottoinsieme limitato (dall’alto e dal basso) di R, e poniamo m = inf E, M = sup E. Diciamo che m è il minimo di E se m ∈ E, e che M è il massimo di E se M ∈ E. Notiamo che questa definizione non è superflua. Nessuno ci garantisce che l’estremo superiore di un insieme sia un elemento di tale insieme. In generale, è solo un numero reale. Quindi, l’estremo superiore diventa il massimo esattamente quando appartiene all’insieme in considerazione. Simili considerazioni valgono ovviamente per l’estremo inferiore. Definizione 1.23. Siano a < b due numeri reali. Gli insiemi (a, b) = {x ∈ R | a < x < b} [a, b] = {x ∈ R | a ≤ x ≤ b} [a, b) = {x ∈ R | a ≤ x < b} (a, b] = {x ∈ R | a < x ≤ b}.

si chiamano rispettivamente intervallo aperto, chiuso, chiuso a sinistra, chiuso a destra, di estremi a e b. Osservazione 1.24. Per ricordare queste definizioni, possiamo dire che la parentesi quadra corrisponde ad un estremo compreso, mentre quella tonda corrisponde ad un estremo escluso. Alcuni libri usano la notazione ]a, b[ al posto di (a, b), ecc. Definizione 1.25. Sia x0 ∈ R un numero reale fissato. Si chiama intorno di x0 qualunque intervallo aperto (a, b) tale che x ∈ (a, b). Quindi ogni numero reale possiede infiniti intorni. Spesso conviene utilizzare intorni simmetrici, della forma (x0 − δ, x0 + δ), dove δ > 0 si chiama raggio dell’intorno. Esercizio. Invitiamo lo studente a dimostrare che, se E = (a, b), allora inf E = a, sup E = b. Inoltre, inf[a, b) = a = min[a, b), e sup[a, b) = b, ma b non è il massimo di [a, b).

1.5

L’infinito

Nello studio dell’analisi matematica, lo studente si imbatte in un concetto assolutamente nuovo: quello di infinito. Mentre Algebra e Geometria elementari si occupano di quantità finite (numeri, rette, piani, ecc.), l’Analisi

14

CAPITOLO 1. INSIEMI E FUNZIONI

vuole formalizzare l’idea vaga di avvicinarsi indefinitamente a qualcosa. Introduciamo in questa sezione, secondo una logica assai pratica, il simbolo ∞ e il suo significato. Definizione 1.26. Per i nostri scopi, ∞ è un simbolo privo di significato numerico. Invitiamo il lettore a trattenere il sorriso sarcastico che la definizione precedente potrebbe generare.12 Chiunque abbia studiato per qualche tempo la filosofia antica e medioevale ricorda certamente gli sforzi e le acrobazie messi in atto dai pensatori per motivare il conceto di infinito: qualcosa senza limiti spaziali o temporali, addirittura un ente metafisico vicino alla divinità. Nell’economia del nostro corso, non serve definire rigorosamente il simbolo ∞. A noi interessa piuttosto usare ∞ come abbreviazione per esprimere concetti già noti. Si tratta dunque di stipulare opportune convenzioni nelle quali ∞ è una mera abbreviazione tipografica, quasi un simbolo stenografico. Per esempio, se un insieme E ⊂ R non è limitato dall’alto, si conviene di scrivere sup E = +∞. e se E non è limitato dal basso, inf E = −∞. In particolare, +∞ sembra nascondere l’idea di muoversi indefinitamente verso destra lungo la retta (orientata) dei numeri reali. Per analogia, −∞ significa in qualche senso muoversi indefinitamente verso sinistra su tale retta. Vogliamo però mettere in guardia lo studente dal compiere un errore fra i più frequenti ed ingenui: +∞ e −∞ non sono numeri reali ! In particolare, ad essi non si applicano le consuete operazioni algebriche di somma, sottrazione, moltiplicazione e divisione.13 Vogliamo tuttavia ricordare che la Matematica moderna introduce il concetto di infinito anche con significati diversi. In Geometria Proiettiva e in Analisi Complessa si parla altrettanto spesso di infinito, sebbene da un punto di vista più geometrico. Osservazione 1.27. Molti libri introducono la cosiddetta retta reale estesa ¯ = R ∪ {−∞} ∪ {+∞}, ottenuta aggiungendo ai consueti numeri reali i due R 12

Chi scrive, ricorda una definizione sul proprio libro di Algebra, in cui si diceva “... dove x è un simbolo al quale non attribuiremo alcun significato”. 13 Sappiamo che qualche studente più esperto potrebbe dire che, con i limiti, si fanno le operazioni su ∞. Questo è parzialmente vero, e in certe discipline conviene definire 0 · ∞ = 0. L’esistenza delle forme di indecisione ci lascia però intendere che in questa definizione il simbolo ∞ ha un significato diverso da quello che gli abbiamo finora attibuito.

1.6. PUNTI DI ACCUMULAZIONE

15

infiniti dotati di segno. Ovviamente, si richiede che, per ogni numero reale x, −∞ < x < +∞. ¯ estendendo le quattro opeÈ possibile una (parziale) aritmetizzazione di R razioni: per ogni x ∈ R si definisce x + ∞ = +∞, +∞ + ∞ = +∞, e

( +∞ se x > 0 x · (+∞) = −∞ se x < 0, (+∞) · (+∞) = +∞,

x − ∞ = −∞ −∞ − ∞ = −∞ ( −∞ se x > 0 x · (−∞) = +∞ se x < 0,

(+∞) · (−∞) = −∞,

(−∞) · (−∞) = +∞

Non si dà invece alcun senso alle scritture +∞ − ∞,

−∞ + ∞.

Il caso 0·(±∞) è particolare: esistono settori della matematica in cui conviene porre 0 · (±∞) = 0, ad esempio la Teoria della Misura. Nell’Analisi Matematica elementare, è opportuno evitare di definire questo prodotto, poiché creerebbe pericolose confusioni al calcolo dei limiti. Per uno studente di un primo corso di matematica, l’uso della retta reale estesa non presenta particolari utilità, e nel resto delle dispense non utilizzeremo mai questo ambiente numerico.

1.6

Punti di accumulazione

Introduciamo un concetto che appartiene di diritto alla matematica moderna e che permette notevoli semplificazioni nei discorsi che faremo più avanti. Definizione 1.28. Sia E un sottoinsieme di R. Diremo che il punto x0 ∈ R è un punto di accumulazione per l’insieme E se, preso un qualsiasi intorno I di x0 , si verifica che (I \ {x0 }) ∩ E 6= ∅. A parole, ogni intorno I di x0 contiene un punto di E, diverso da x0 . Per esempio, il punto x0 = 0 è di accumulazione per   1 1 1 1 E = 1, , , , . . . , , . . . . 2 3 4 n Infatti, sia I = (a, b) un intorno di 0; in particolare a < 0. Scegliamo n naturale tale che 1/n < b. Perciò 1/n ∈ I ∩ E, e poiché 1/n 6= 0 abbiamo

16

CAPITOLO 1. INSIEMI E FUNZIONI

verificato la nostra affermazione. Lo studente potrà verificare senza sforzo che i punti di accumulazione per un intervallo chiuso qualsiasi [a, b] sono tutti e soli i punti di [a, b]. Invece, i punti di accumulazione di un intervallo aperto (a, b) sono i punti di [a, b] (ci sono anche i punti a e b!). Un esempio di natura opposta è il seguente. L’insieme N ⊂ R non possiede punti di accumulazione. Infatti, se scegliamo un qualsiasi numero naturale n ∈ N, l’intorno I = (n − 1/2, n + 1/2) non contiene alcun numero naturale ad eccezione di n stesso. Per mettere ulteriormente in luce il senso dell’esclusione del punto x0 nella definizione di punto di accumulazione, consideriamo l’insieme E = {0} ∪ (1, 2). A parole, E è composto dal singolo punto 0 e dall’intervallo aperto (1, 2). Domanda: quali sono i punti di accumulazione di E? La risposta è che i punti di accumulazione di E sono esattamente i punti dell’intervallo [1, 2]. Infatti, il punto “isolato” 0 non può essere di accumulazione, visto che ogni suo intorno (−δ, δ) con δ < 1 interseca E solo nel punto 0 stesso. Può essere utile, in certi casi, adattare al simbolo ∞ alcuni concetti propri dei punti al finito. Ad esempio, un intorno di +∞ è un qualsiasi intervallo della forma (a, +∞), e similmente un intorno di −∞ è un qualsiasi intervallo della forma (−∞, b). Lasciamo allo studente il seguente spunto di riflessione: se E è un sottinsieme di R, quando +∞ è un punto di accumulazione per E? E quando lo è −∞? Le risposte sono abbastanza semplici. In particolare, lo studente si convincerà che +∞ è un punto di accumulazione per E = N, l’insieme dei numeri naturali.

1.7

Appendice: la dimostrazione per induzione

Nello studio del calcolo, si incontrano spesso identità e formule che coinvologno i numeri naturali. Cerchiamo di formalizzare un metodo di dimostrazione valido in queste situazioni. Supponiamo che, per ogni valore dell’indice naturale n, P (n) sia una proposizione logica. Supponiamo inoltre di poter dimostrare le seguenti affermazioni: 1. esiste n0 ∈ N tale che P (n0 ) è vera; 2. Se è vera P (n), allora è vera anche P (n + 1). Le proprietà dell’insieme N dei numeri naturali permettono di dimostrare che la proposizione P (n) è allora vera per ogni n ≥ n0 .

1.7. APPENDICE: LA DIMOSTRAZIONE PER INDUZIONE

17

A parole, per dimostrare la validità di un’affermazione per ogni n naturale, basta dimostrarla per n = 1, e poi dimostrare che la validità di P (n) implica la validità di P (n + 1). Cerchiamo di chiarire il concetto con un esempio. Esempio: la disuguaglianza di Bernoulli. Dimostriamo che (1 + x)n ≥ 1 + nx,

per ogni x > −1 e per ogni n ∈ N.

Procediamo per induzione sul numero naturale n. Per n = 1, dobbiamo dimostrare che 1 + x ≥ 1 + x, il che è palesemente vero. Supponiamo che la disuguaglianza sia vera per n, e dimostriamo che deve essere vera anche per n + 1. Quindi, per ipotesi, (1 + x)n ≥ 1 + nx,

per ogni x > −1 e per ogni n ∈ N.

Che cosa dobbiamo dimostrare? Scriviamo n + 1 al posto di n nella disuguaglianza di Bernoulli, e troviamo (1 + x)n+1 ≥ 1 + (n + 1)x. Questo è il nostro obiettivo. Ma (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + x + nx + nx2 ≥ 1 + x + nx = 1 + (n + 1)x. Osserviamo che abbiamo usato la validità della disuguaglianza per n e abbiamo trascurato il termine nx2 ≥ 0 nell’ultimo passaggio. Il principio di induzione garantisce allora che la disuguaglianza di Bernoulli è sempre vera.14 Esempio: somme di quadrati. Vogliamo dimostrare l’identità15 n−1 X

k2 =

k=1

n(n − 1)(2n − 1) . 6

(1.3)

Procediamo per induzione su n. Per n = 2,16 l’identit à si riduce a 12 =

2·1·3 = 1. 6

La condizione x > −1 è stata usata nel passaggio (1 + x)n (1 + x) ≥ (1 + nx)(1 + x). Se il termine 1 + x fosse negativo, dovremmo invertire il senso della disuguaglianza, e il ragionamento perderebbe validità. 15 L’estremo superiore n − 1 appare in questa forma perché ci servirà in un esempio nel capitolo sull’integrale di Riemann. 16 Poiché l’estremo n − 1 della somma deve essere almeno pari a quello inferiore, occorre chiedere che n − 1 ≥ 1, cioè n ≥ 2. 14

18

CAPITOLO 1. INSIEMI E FUNZIONI

Supponiamo che l’identità sia vera per n, e dimostriamo che deve essere vera anche per n + 1. Per n + 1, il primo membro di (1.3) diventa n X k=1

2

k =

n−1 X

k 2 + n2 ,

k=1

e sfruttando l’ipotesi per n possiamo scrivere n X k=1

k2 =

n−1 X k=1

k 2 + n2 =

n(n − 1)(2n − 1) + n2 . 6

Se togliamo le parentesi a secondo membro e mettiamo a denominatore comune, troviamo dopo qualche passaggio elementare n(n + 1)(2n + 1) n(n − 1)(2n − 1) + n2 = , 6 6 espressione che coincide con il secondo membro di (1.3) in cui n è rimpiazzato da n+1. Questo significa esattamente che la nostra identità continua a valere anche per n + 1, e dunque il procedimento per induzione è terminato.17

17

La prima curiosità di molti studenti è chi abbia “indovinato” l’identità (1.3). Infatti, la per induzione non è costruttiva, e non serve a dedurre quanto valga Pn−1dimostrazione 2 k=1 k . Se nessuno ci scrivesse la formula, per induzione non riusciremmo mai a ricostruirla. Questo tipo di formule erano il divertimento di matematici del calibro di F. Gauss, che era solito calcolarle da bambino, mentre il maestro spiegava un’aritmetica evidentemente troppo noiosa. Nel libro di M. Spivak, Calculus, c’è un esercizio del primo capitolo che suggerisce un metodo costruttivo per calcolare somme finite come quella appena vista.

Capitolo 2 Funzioni fra insiemi Ora che abbiamo conquistato una certa familiarità con il linguaggio degli insiemi, rivediamo rapidamente il linguaggio della teoria delle funzioni fra insiemi. Definizione 2.1. Siano X ed Y due insiemi qualsiasi. Una funzione f : X → Y (si legge: f da X in Y ) è una legge che ad ogni x ∈ X associa precisamente uno ed un solo elemento y ∈ Y , denotato anche con f (x). La notazione completa è f: X → Y x 7→ f (x) Utilizzeremo sovente la notazione più compatta f : x ∈ X 7→ f (x) ∈ Y . L’insieme X si chiama dominio (di definizione) di f , mentre Y si chiama codominio di f . Notiamo che la definizione appena data nasconde una certa ambiguit à. Che cosa sarebbe una legge? In realtà, gli studenti del corso di Matematica imparano fin dall’inizio una definizione più rigorosa di funzione. Quella che abbiamo proposto ricalca la definizione ingenua delle scuole superiori, e si affida all’idea innata di legge che permette di mettere in corrispondenza due elementi di due insiemi noti. Purtroppo la definizione rigorosa richiederebbe l’introduzione di ulteriori concetti che non verrebbero più utilizzati nel nostro corso. Riportiamo il seguente commento, tratto da [1]. Possiamo pensare una funzione f : X → Y come una specie di scatola nera, con un ingresso e un’uscita. Ogni volta che in ingresso entra un elemento del dominio, la scatola nera – la funzione 19

20

CAPITOLO 2. FUNZIONI FRA INSIEMI – lo elabora e poi emette dall’uscita un elemento del codominio. Non è importante la natura degli elementi del dominio e del codominio (possono essere numeri, rette, patate, cavalleggeri prussiani o qualsiasi altra cosa) né il tipo di processi digestivi che avvengono all’interno della scatola. Siano somme, prodotti, classifiche o formine da sabbia, tutte è ammissibile purché il procedimento usato sia sempre lo stesso: ogni volta che in ingresso infiliamo la stessa patata, in uscita dobbiamo ottenere sempre la stessa cipolla – ad ogni elemento del dominio viene associato uno ed un solo elemento del codominio, appunto.

Avvertenza. Molti studenti, ma anche molti docenti e qualche libro di testo, hanno l’abitudine di riferirsi “alla funzione f (x)” invece che “alla funzione f ”. Come abbiamo visto, una funzione è una legge, mentre f (x) è semplicemente il valore che f assume in x. Per fare un paragone, sarebbe come confondere la persona Simone Secchi con le dispense scritte da Simone Secchi. Quindi non esiste la funzione sin x, né la funzione x2 . Più corretto, e senz’altro più accettabile, è parlare della funzione x 7→ x2 , indicata anche con (#)2 in alcun i libri. Quest’ultima notazione, o l’equivalente (·)2 , è ampiamente tollerata. La scrittura (sin #)/# significherebbe “la funzione x 7→ (sin x)/x”, e quindi # assumerebbe il valore di carattere “jolly” per la variabile indipendente. Sfortunatamente, questa notazione è comune in molti libri avanzati come [9], ma non ha mai fatto breccia nella tradizione dei testi elementari.1 Lo studente, a regola, non capisce perché occorra perdere tempo in queste disquisizioni, che non giovano molto alla sua premura di superare l’esame finale. Lasciando da parte il doveroso rimprovero a chi crede che gli esami universitari siano inutili scocciature da superare balbettando qualche frase davanti al professore, stiamo parlando di un concetto veramente profondo. La x non è una divinità, nessun medico ce ne prescrive l’uso, e solo la tradizione invoglia a usare tale lettera per la variabil e indipendente.2 Le due scritture x 7→ ex e ζ 7→ eζ denotano la stessa funzione: x e ζ, ma potremmo usare α, ρ o anche z, sono soltanto simboli. Una celebre battuta dice che, in matematica, un cappello rosso non è necessariamente un cappello, e anche se lo fosse non sarebbe necessariamente rosso. Quello che conta veramente è il significato attribuito ai simboli, nel nostro caso la legge, cioè la funzione, alla quale tali simboli vengono sottoposti. In alcuni contesti avanzati, la “funzione f (x)” 1

Purtroppo, la tendenza a confondere ciò che un soggetto è con ciò che quel soggetto fa, è un errore sempre più diffuso anche nella nostra società. 2 I fisici preferiscono usare t, come se parlassero di un tempo.

21 potrebbe anche indicare il nome di una funzione che agisce come f (x) : t 7→ f (x)(t). Sembra un paradosso, ma non lo è, ed anzi tali notazioni sono pressoché obbligatorie in Geometria Differenziale e in Analisi Funzionale. Domanda provocatoria per lo studente: chi parlerebbe della funzione g(1/2)? Se x denota un numero, g(1/2) dovrebbe essere tanto legittimo quanto g(x)... Per amore di verità, molti docenti continuano a ritenere essenzialmente (o totalmente) corretta un’espressione come “sia f (x) una funzione continua”. Seguendo la prassi italica che si fanno le regole e poi si tollerano le trasgressioni,3 i trasgressori non verranno perseguiti in sede d’esame. Esempi. Siano X l’insieme di tutti gli uomini della Terra, e Y l’insieme di tutti i colori. Se ad ogni uomo di X associamo il colore del suo occhio destro,4 abbiamo costruito una funzione da X in Y . Se X è l’insieme di tutte le scatolette di tonno di un certo negozio, e Y è l’insieme dei numeri razionali Q, possiamo associare ad ogni x ∈ X il suo prezzo y ∈ Q = Y , ottenendo una funzione. La scelta di Y = Q nasconde la presunzione che nessun negoziante ci farà mai pagare π euro per una scatoletta di tonno. Sembra perciò ragionevole che i prezzi delle scatole di tonno siano numeri con una quantità finita di numeri decimali, e dunque numeri razionali. Se infine X è l’insieme di tutte le circonferenze del piano cartesiano e Y = R, possiamo associare ad ogni circonferenza il suo raggio. Anche questa è una funzione. Scegliamo ora X = Y come l’insieme di tutti gli individui viventi sulla Terra. Associando ad ogni individuo vivente i suoi genitori, non definiamo una funzione: esistono gli orfani, e inotre potremmo associare a un x ∈ X due elementi di Y , madre e padre. Nel seguito, useremo quasi esclusivamente insiemi numerici e funzioni fra di essi. Definizione 2.2. Se f : X → Y è una data funzione, l’insieme f (X) = {y ∈ Y | esiste x ∈ X tale che y = f (x)} ⊂ Y si chiama immagine di X rispetto a f . Se invece V ⊂ Y , l’insieme f −1 (V ) = {x ∈ X | f (x) ∈ V } 3

Ogni riferimento socio–politico è pienamente voluto. Ci sono esseri umani – pochi – con occhi di colori differenti, dunque parlare di “colore degli occhi” non definirebbe una funzione. Escludiamo implicitamente gli individui privi dell’occhio destro. 4

22

CAPITOLO 2. FUNZIONI FRA INSIEMI

si chiama controimmagine (o preimmagine, o ancora anti-immagine) dell’insieme V . Il codominio Y è decisamente meno importante del dominio X. Effettivamente, per specificare una funzione, ci servono in maniera essenziale il dominio e la legge, mentre il codominio può essere “allargato” senza influire troppo sulla funzione. Infatti, ciò che conta sembra essere f (X): gli elementi di Y che non sono immagini di elementi di X possono essere sacrificati in prima battuta. Oppure, potremmo aggiungere ulteriori elementi all’immagine, senza alterare la funzione. Invitiamo il lettore a ritornare sull’esempio delle scatolette di tonno. È vero che i prezzi sono (ragionevolmente) numeri razionali, ma se avessimo scelto come codominio l’insieme dei numeri reali non avremmo compromesso la nostra funzione. Convenzione didattica. Abbiamo appena detto che una funzione si compone di tre elementi: un dominio, un codominio, e una legge. Ogni studente sa già, però, che in certi esercizi si chiede di “trovare” il dominio di definizione di una certa funzione, scritta solitamente f (x) = . . . È una richiesta poco chiara, a cui si conviene di attribuire un senso convenzionale molto chiaro. Quando si lavora con funzioni reali di una variabile reale, il dominio è inteso come il “dominio naturale”, cioè il più grande sottoinsieme di R in√cui tutte le operazioni scritte nella formula di f hanno senso. Se f (x) = x − 1, il dominio è l’insieme delle x tali che x−1 ≥ 0. Questo perché si può estrarre la radice quadrata solo di numeri maggiori o uguali a zero. Se f (x) = log(3x−1), il dominio è l’insieme delle x tali che 3x − 1 > 0, poiché solo i numeri strettamente positivi hanno un logaritmo. Chiedere di trovare il dominio di una data funzione significa chi edere allo studente di ricordare quali sono i domini di definizioni delle principali funzioni elementari, e di fargli risolvere alcune disequazioni. È vero che f (x) = log x può essere legittimamente definita sul dominio [1, π], ma non si tratta del dominio naturale. Nel linguaggio introdotto in questi appunti, sono semplicemente due funzioni diverse. Osservazione 2.3. Una situazione che solitamente risulta insidiosa per gli studenti è il caso delle funzioni contenenti potenze in cui sia la base che l’esponente sono variabili. Ad esempio, qual è il dominio di definizione di x 7→ xx ? O di x 7→ (sin x)log x ? La risposta è che per definire un’espressione quale f (x)g(x) occorre imporre la condizione f (x) > 0. La ragione si capisce solo ricordando quella teoria delle potenze che ormai non viene quasi più insegnata.

23 L’angolo dello smemorato: le potenze. Ricordiamo che, dato un qualsiasi numero reale (positivo, nullo o negativo) x, si definisce la sua potenza n– esima, per n ∈ N mediante la formula xn = x · x · . . . · x (n fattori). Indi, si definiscono le potenze con esponente intero relativo, dicendo che x−n =

1 . xn

Naturalmente, occorre richiedere che x 6= 0. I primi dubbi arrivano per esponenti razionali. Infatti, come definire x1/q , dove q ∈ N, q 6= 0? Di solito si dice che x1/q = y se e solo se x = y q . Pertanto, bisogna distinguere fra q pari e q dispari. Nel primo caso, poiché ogni numero elevato ad una potenza pari diventa non negativo, dovremo imporre x ≥ 0. Nel secondo caso, invece, ogni numero x ∈ R può essere elevato alla potenza 1/q, q dispari. Si pensi, per ricordarlo, alla radice cubica x1/3 , definita per ogni x reale. Ad esempio, l’espressione x1/8 ha senso solo per x ≥ 0, mentre x1/17 è definita per ogni x reale. Ultimo passaggio, il caso dell’esponente razionale qualunque: xp/q . Ovviamente, possiamo pensare che la frazione p/q sia già ridotta ai minimi termini. Poniamo allora xp/q = (xp )1/q se p ≥ 0, mentre xp/q =

1 x−p/q

se p < 0. Ovviamente, dobbiamo controllare che le potenze scritte abbiano significato: se q è un numero pari, (xp )1/q ha senso solo per xp ≥ 0, cioè per x ≥ 0. Se q è dispari, possiamo scrivere (xp )1/q per ogni x reale. Per p < 0, dobbiamo inoltre escludere x = 0 dalla definizione. Per esempio, x2/3 = (x2 )1/3 , definita dunque per ogni x reale (perché il denominatore 3 dell’esponente è dispari), mentre 1/2 x5/2 = x5 definita solo per x ≥ 0 perché il denominatore 2 dell’esponente è un numero pari. Infine, 1 x−4/3 = 4/3 , x

24

CAPITOLO 2. FUNZIONI FRA INSIEMI

definita per ogni x 6= 0: l’unica condizione è infatti che il denominatore x4/3 sia diverso da zero. Dopo qusta lunga digressione, non è affatto chiaro come definire xα , per un qualunque numero α ∈ R. La risposta è insita nella costruzione dell’insieme dei numeri reali.5 Ci limitiamo ad un cenno: fissato α, si approssima α con una successione di numeri razionali {pn /qn }n∈N . La tentazione è di definire xα = lim xpn /qn . n→+∞

Il problema però è che non possiamo avanzare pretese sui numeri qn : potrebbero essere alternativamente positivi o negativi. Allora, per essere certi che xpn /qn abbia senso, l’unica via d’uscita è chiedere che x > 0. Morale del discorso: possiamo elevare ad una potenza reale generica solo le basi positive. Un approccio alternativo, dovuto a Dedekind, propone di definire xα come il valore di sup {rα | r ∈ Q, r ≤ x} = inf {rα | r ∈ Q, r ≥ x} . Questa uguaglianza è però falsa per x < 0. Resta un ultimo, tremendo, dubbio: siccome N ⊂ Z ⊂ Q ⊂ R, come ci comportiamo davanti all’espressione x2/3 ? Pensiamo 2/3 come un numero razionale oppure come un numero reale? Già, perché le primo caso possiamo scegliere x reale, mentre nel secondo solo x > 0! La risposta è quella più complicata6 : quando l’esponente è un numero razionale, lo trattiamo come tale, senza pensarlo come un numero reale. Per togliere qualsiasi ambiguità, converrebbe distinguere rigorosamente e senza eccezioni la funzione esponenziale dalla funzione inversa delle potenze. In altri termini, dovremmo considerare separatamente (per esempio) le due funzioni f (x) = x2/3 √ 3 g(x) = x2 .

f : (0, +∞) → R, g : R → R,

Si può seguire senz’altro questa strada, ma i matematici amano ammorbidire le asperità della loro materia con qualche cedimento alle convenzioni. Per concludere, c’è una situazione che molti studenti non sanno come affrontare: come si calcola 00 ? È una domanda insidiosa, che in effetti ha già avuto implicitamente la risposta nella discussione precedente: l’operazione 00 5

Questo è uno dei momenti, non troppo frequenti per fortuna, in cui si rimpiange di non avere le basi di teoria dei sistemi numerici. 6 I matematici scelgono spesso la strada più ricca di bivi, almeno quando questi bivi arricchiscano la teoria.

2.1. OPERAZIONI SULLE FUNZIONI

25

non è definita. Per x 6= 0, possiamo pensare che x0 = xm−m = xm /xm , dove m è un numero intero (diverso da zero) qualunque. Allora, viene spontaneo dire che x0 = 1 per x 6= 0. Ma questo ragionamento non è convincente per x = 0, poiché x−m è già privo di significato. A volte, i matematici convengono di dare un senso ad un’espressione indefinita, e lo fanno con lo scopo di semplificare o unificare argomenti che richiederebbero una trattazione diversa caso per caso. Molti studiosi di analisi matematica usano la convenzione 00 = 1, pensando che 00 = limx→0 x0 = limx→0 1 = 1. Altri, invece, preferiscono pensare che 00 = limx→0 0x = limx→0 0 = 0. Questo, da un punto di vista avanzato, si interpreta con il fatto che la funzione di due variabili f (x, y) = xy , definita per x > 0 e y ∈ R, non è prolungabile per continuità in (0, 0). Chi scrive, se proprio è obbligato, ha una maggiore simpatia per la convenzione 00 = 1, ma si tratta di gusti. Definizione 2.4. Supponiamo che f : X → Y sia una funzione fra i due insiemi X e Y . Se Z è un sottoinsieme di X, la nuova funzione f |Z : Z → Y definita da f |Z(x) = f (x) per ogni x ∈ Z prende il nome di restrizione di f all’insieme Z.7 Restringere l’azione di una funzione a un dominio di definizione più piccolo può apparire inutile. Il punto è che, per noi, una funzione è individuata in modo univoco dal suo dominio, dal suo codominio, e dalla sua legge. Ad esempio, vedremo più avanti che la funzione f : R → R definita dalla legge   −1, se x < 0 f (x) = 0, se x = 0   1, se x > 0 è discontinua nel punto x = 0, ma la sua restrizione a qualsiasi intervallo che non contiene il punto x = 0 è continua. Questo ci convince che le restrizioni di una funzione possono godere di proprietà che la funzione di partenza non possiede.

2.1

Operazioni sulle funzioni

Quando lavoriamo con funzioni a valori reali, è facile estendere ad esse le quattro operazioni dell’aritmetica. Basta infatti operare sulle immagini, come nella definizione che segue. 7

A volte si usa il simbolo f|Z .

26

CAPITOLO 2. FUNZIONI FRA INSIEMI

Definizione 2.5. Sia X un insieme, e siano f : X → R e g : X → R due funzioni a valori reali. Definiamo la loro somma, il loro prodotto e il loro quoziente come 1. f + g : X → R, x 7→ f (x) + g(x) 2. f g : X → R, x 7→ f (x)g(x) 3. f /g : X \ {x ∈ X | g(x) = 0} → R, x 7→ f (x)/g(x), Anche le funzioni possiedono delle operazioni, senza dubbio meno familiari di quelle algebriche. A noi ne serviranno due: la composizione e l’inversione. Definizione 2.6. Siano f : X → Y e g : Y → Z due funzioni. La funzione g ◦ f : X → Z definita da g ◦ f : x ∈ X 7→ g(f (x)) ∈ Z si chiama funzione composta di g ed f . Osservazione 2.7. Qualche Autore, soprattutto quelli che si occupano di algebra, usano la convenzione della composizione in ordine inverso rispetto al nostro. Per costoro, f ◦ g significa calcolare prima f e poi g. Nella pratica, comporre due funzioni significa applicarle in successione, facendo attenzione all’ordine di scrittura. Graficamente, x ∈ X 7→ f (x) ∈ Y 7→ g(f (x)) ∈ Z, dove la prima freccia indica l’azione di f su x e la seconda freccia l’azione di g su f (x). Questa rappresentazione evidenzia l’ipotesi che il codominio di f coincidesse con il dominio di g.8 In generale, non ha senso scrivere f ◦ g, perché il codominio di g non è il dominio di f . E anche se questa condizione strutturale è soddisfatta, è facile costruire un esempio in cui f ◦ g e g ◦ f sono due funzioni ben distinte. Più macchinosa è la definizione di funzione inversa. Premettiamo una definizione fondamentale. Definizione 2.8. Sia f : X → Y una funzione. Diciamo che f è iniettiva se ad elementi x1 6= x2 di X sono associate sempre immagini f (x1 ) 6= f (x2 ) in Y . Diciamo invece che f è suriettiva se f (X) = Y , cioè se per ogni y ∈ Y esiste un x ∈ X tale che f (x) = y. Diciamo infine che f è biunivoca se è iniettiva e suriettiva. 8

In base a quanto detto poco sopra, basterebbe che f (X) fosse un sottoinsieme del dominio di g.

2.1. OPERAZIONI SULLE FUNZIONI

27

Supponiamo che f : X → Y sia una funzione biunivoca. Ad ogni y ∈ Y si associa un elemento x ∈ X tale che f (x) = y. Ora, tale elemento x è unico: se ce ne fossero due, chiamiamoli x1 e x2 , ovviamente x1 6= x2 e l’iniettività di f implicherebbe y = f (x1 ) 6= f (x2 ) = y, cioè y 6= y. Questo è chiaramente impossibile, dunque esiste uno (per la suriettività) ed uno solo (per l’iniettività) x ∈ X tale che f (x) = y. Ma allora abbiamo costruito una funzione da y in X. Questa funzione, che chiameremo f −1 , gode della proprietà che f ◦ f −1 : y ∈ Y 7→ y ∈ Y

(2.1)

f −1 ◦ f : x ∈ X 7→ x ∈ X.

(2.2)

e Definizione 2.9. Sia f : X → Y una funzione biunivoca. La funzione f −1 : Y → X costruita sopra si chiama funzione inversa di f , ed è caratterizzata dalle condizioni (2.1) e (2.2). Diversamente da alcuni libri di testo, saremo piuttosto rigidi sul concetto di funzione invertibile. Come visto, per noi una funzione è invertibile quando è biunivoca. Altri chiedono sono l’iniettività: il dominio della funzione inversa sarà l’immagine della funzione diretta. Questa è una convenzione legittima e addirittura comoda in certi contesti elementari. Noi privilegiamo la definizione più comune fra i matematici puri. Tuttavia, lo studente si convincerà facilmente di questo: qualsiasi funzione diventa suriettiva, a patto di scegliere come codominio l’immagine della funzione. Se ci viene data una funzione iniettiva f da un dominio X in un codominio Y , la nuova funzione f˜: X → f (X) è una funzione biunivoca e perciò invertibile. Sebbene f˜ sia una funzione diversa da f , è comodo indulgere in questa confusione. Riassumendo, le (2.1) e (2.2) dicono che la funzione inversa è effettivamente quell’operazione che “inverte” una funzione biunivoca rispetto alla composizione ◦. Quando allo studente dovrà dimostrare che una certa funzione è invertibile, dovrà verificare che la funzione è iniettiva e suriettiva. Può far comodo usare la caratterizzazione contenuta nella prossima proposizione. Proposizione 2.10. Sia f : X → Y . 1. f è iniettiva se e solo se dall’uguaglianza f (x1 ) = f (x2 ) discende x1 = x2 . 2. f è suriettiva se e solo se, per ogni y ∈ Y , l’equazione (nell’incognita x ∈ X) f (x) = y possiede almeno una soluzione.

28

CAPITOLO 2. FUNZIONI FRA INSIEMI 3. f è biunivoca se e solo se, per ogni y ∈ Y , l’equazione f (x) = y possiede esattamente una soluzione x ∈ X. In tal caso, x = f −1 (y).

Concretamente, tutto si riduce a risolvere equazioni. Purtroppo non tutte le equazioni sono risolvibili in termini espliciti,9 e i metodi del calcolo differenziale ci verranno in aiuto.

2.2

Funzioni monotòne e funzioni periodiche

Spendiamo qualche parola sui rapporti fra le funzioni reali di variabile reale e la relazione d’ordinamento fra numeri reali. Dati due numeri reali x1 e x2 , esattamente una delle seguenti affermazioni deve essere vera: x1 < x2 , oppure x1 = x2 , oppure x1 > x2 . Definizione 2.11. Sia X ⊂ R un sottoinsieme, e sia f : X → R una funzione reale di una variabile reale. Diremo che f è monotona crescente (risp. crescente in senso stretto) se è soddisfatta la condizione seguente: se x1 , x2 ∈ X e se x1 < x2 , allora f (x1 ) ≤ f (x2 ) (risp. f (x1 ) < f (x2 )). Diremo che f è monotona decrescente (risp. decrescente in senso stretto) se è soddisfatta la condizione seguente: se x1 , x2 ∈ X e se x1 < x2 , allora f (x1 ) ≥ f (x2 ) (risp. f (x1 ) > f (x2 )). A parole, le funzioni monotone crescenti rispettano l’ordinamento dei numeri reali, mentre quelle monotone decrescenti lo invertono. Osservazione 2.12. Attenzione alla pronuncia dell’aggettivo “monotona”: l’accento cade sulla seconda lettera o. Il professore di matematica può essere monòtono (accento sulla prima o), mentre le funzioni sono monotòne (accento sulla seconda o). Teorema 2.13. Sia [a, b] un intervallo, e sia f : [a, b] → R una funzione strettamente crescente (oppure strettamente decrescente). Allora f è iniettiva. Dim. Siano x1 e x2 due elementi distinti di [a, b]. Non è restrittivo supporre che x1 < x2 . Siccome f è strettamente crescente (oppure decrescente), avremo che f (x1 ) < f (x2 ) (oppure f (x1 ) > f (x2 )), e in particolare f (x1 ) 6= f (x2 ). Pertanto f è una funzione iniettiva. Corollario 2.14. Una funzione strettamente monotona è invertibile sulla sua immagine, e la funzione inversa è strettamente monotona nello stesso senso della funzione diretta. 9

Per esempio, sin x = x ha soluzione, ma non esiste una scrittura esplicita della soluzione.

2.3. GRAFICI CARTESIANI

29

Lasciamo allo studente piò volenteroso la dimostrazione di questo corollario. Una sola avvertenza: la funzione inversa rispetta il senso della monotonia. Per qualche suggestione psicologica, molti studenti sono convinti che l’inversa di una funzione crescente debba essere una funzione decrescente. Basta pensare all’esempio della funzione esponenziale e della funzione logaritmo per non sbagliarsi. Introduciamo infine un’ulteriore proprietà di alcune funzioni che incontreremo spesso. Definizione 2.15. Una funzione f : R → R è periodica di periodo T > 0 se f (x + T ) = f (x),

per ogni x ∈ R.

e T è il più piccolo numero positivo che soddisfi questa uguaglianza. Ne consegue che, per conoscere una funzione T –periodica, basta conoscerla su un qualunque intervallo di ampiezza T , ad esempio [0, T ] o [−T /2, T /2]. La clausola di minimalità di T è parte integrante della definizione di periodicità. La funzione seno ha periodo T = 2π, ma sin(α + T ) = sin α è vera anche per tutti i multipli interi di 2π.

2.3

Grafici cartesiani

Il piano cartesiano sarà, per noi, l’insieme dei punti di un piano nel quale sono stati scelte due rette perpendicolari. Queste rette si intersecano in un punto detto origine, e sono chiamati assi cartesiani. I punti di questo piano sono copppie ordinate di numeri reali, ed è suggestivo usare il simbolo R2 = R × R per indicare brevemente il piano cartesiano. Definizione 2.16. Sia f : X → Y una funzione, dove X, Y sono due insiemi. Il grafico di f è il sottoinsieme di X × Y Γ(f ) = {(x, f (x)) ∈ X × Y | x ∈ X}. In pratica, il grafico di una funzione è costituito dalle coppie ordinate il cui primo elemento appartiene al dominio, e il secondo elemento è l’immagine del primo elemento. Per le nostre funzioni reali di una variabile reale, il grafico è una sottoinsieme di R2 . Di solito si tratta di una curva (nel senso intuitivo del termine), ma √ potrebbe anche essere un solo punto. Pensiamo infatti alla funzione x 7→ −x2 , definita evidentemente solo in {0}. Il suo grafico è formato dal punto {(0, 0)} ∈ R2 . Ci sembra opportuno insistere su un punto: non tutte le curve che si possono disegnare nel piano cartesiano sono grafici di funzioni. Prendiamo

30

CAPITOLO 2. FUNZIONI FRA INSIEMI

per esempio una circonferenza o un’ellisse: sono rappresentanti delle ben note coniche, ma non sono certamente grafici di funzioni reali di una variabile reale. Esistono infatti rette verticali che intersecano tali curve in due punti distinti, contro la definizione di funzione. Ma come si “leggono”, su un grafico cartesiano, le proprietà di una funzione? In genere, tutte le principali caratteristiche di una data funzione hanno una visibilità notevole nel grafico cartesiano. Per esempio, la suriettività corrisponde al fatto che qualunque retta orizzontale interseca il grafico almeno una volta. Se ogni retta orizzontale interseca il grafico al massimo una volta,10 la funzione è iniettiva. Se ogni r etta orizzontale interseca il grafico una ed una sola volta, allora la funzione è biunivoca. La periodicità si rispecchia invece in una ripetizione esatta del grafico ogni volta che l’ascissa si sposta di una quantità pari al periodo. Come detto sopra, basta pertanto tracciare il grafico su un intervallo di ampiezza pari al periodo.

2.4

Funzioni elementari

In quest’ultima sezione introduttiva, riepiloghiamo le caratteristiche di alcune funzioni di natura elementare. Queste costituiranno in un certo senso un archivio a cui attingere esempi e controesempi nel corso del programma. Innanzitutto, lo studente ricorderà le funzioni lineari affini, cio è le rette del piano. Fatta eccezione per le rette verticali11 , la generica funzione linere affine ha la forma x 7→ mx + q, per opportuni valori di m, q ∈ R. Le funzioni rappresentate invece da polinomi di secondo grado sono invece parabole, e hanno la forma x 7→ ax2 + bx + c, dove i coefficienti a, b e c sono numeri reali. Il lettore dovrebbe avere una certa familiarità anche con le funzioni esponenziali, quelle rappresentate dalla formula x 7→ ax , 10 11

Cioè non lo interseca oppure lo interseca esattamente una volta. Che non sono funzioni!

2.4. FUNZIONI ELEMENTARI

31

dove a ∈ (0, +∞).12 Il caso a = 1 non merita tante parole: la funzione è chiaramente costante, poiché 1x = 1 qualunque sia l’esponente x. Nel caso 0 < a < 1, la funzione esponenziale di base a è positiva, monotona decrescente. Nel caso a > 1, essa è invece positiva ma monotona crescente. Per quanto visto, la funzione esponenziale di base a ∈ (0, 1) ∪ (1, +∞) è invertibile, e la sua funzione inversa si chiama logaritmo in base a. Si scrive x ∈ (0, +∞) 7→ loga x. Per a > 1, la funzione logaritmica è strettamente crescente, attraversa l’asse delle ascisse per x = 1, è negativa per 0 < x < 1 e positiva per x > 1. Per 0 < a < 1, la funzione logaritmica è strettamente decrescente, positiva per 0 < x < 1 e negativa per x > 1. L’unico valore in cui si annulla è x = 1. Concludiamo la panoramica con le funzioni goniometriche. Poiché una definizione rigorosa di tali funzioni può essere data solo avendo a disposizione strumenti che introdurremo più avanti, ci affidiamo alle conoscenze pregresse dello studente. Probabilmente, saprà che il seno di un angolo è il rapporto fra cateto opposto e ipotenusa di un certo triangolo rettangolo, e così via. Per iniziare, questa “definizione” geometrica ci basta. Abbiamo dunque a nostra disposizione due funzioni, x∈R → 7 sin x x∈R → 7 cos x, chiamate rispettivamente seno e coseno, definite sull’intero insieme dei numeri reali, periodiche di periodo 2π. A queste si affianca la funzione tangente, definita come sin x tan x = cos x 13 per ogni x ∈ R \ {kπ/2 | k ∈ Z}. La tangente è una funzione periodica di periodo π, e sull’intervallo (−π/2, π/2) è strettamente crescente, nulla in x = 0. Osservazione 2.17. Gli angoli saranno sempre misurati in radianti. L’uso dei gradi sessagesimali, cui lo studente è forse più abituato, si adatta male al calcolo differenziale. Ricordiamo che la relazione fra la misura αgradi in gradi sessagesimali e quella αrad in radianti di un angolo α è stabilita dalla seguente proporzione: αrad : αgradi = 2π : 360. 12

La base a è un numero positivo per ipotesi. Infatti, è problematico elevare un numero negativo ad un esponente reale, e questo ci costringerebbe a distinguere vari casi. 13 Questa scrittura apparentemente complicata è la scrittura simbolica per la frase “x diverso da tutti i multipli interi di π/2”.

32

CAPITOLO 2. FUNZIONI FRA INSIEMI

Quindi αrad =

π αgradi . 180

Capitolo 3 Successioni di numeri reali In questo capitolo, introdurremo uno degli strumenti più importanti di tutta l’Analisi Matematica, le successioni. Ci imbatteremo per la prima volta nella definizione di limite, e dimostreremo un certo numero di teoremi fondamentali che avranno dei corrispettivi nella teoria dei limiti per le funzioni.

3.1

Successioni e loro limiti

Definizione 3.1. Una successione di numeri reali è una qualunque funzione p : N → R. Per consuetudine, useremo la scrittura pn invece della più rigida notazione funzionale p(n) per denotare il valore della funzione p in n ∈ N. Parleremo poi, sempre con un certo abuso di notazione, della successione {pn }. Una successione viene spesso presentata come un allineamento (infinito) di numeri reali p1 , p2 , p3 , . . . , pn , pn+1 , . . . Per questo motivo, si trova frequentemente la notazione {p1 , p2 , p3 , . . . , pn , pn+1 , . . . }

(3.1)

per indicare la successione {pn }. C’è sfortunatamente un aspetto che richiede molta attenzione da parte dello studente. La notazione (3.1) si confonde del tutto con l’insieme {p1 , p2 , p3 , . . . , pn , pn+1 , . . . } ⊂ R. Tutto ciò è spiacevole, dato che una funzione è un oggetto ben diverso dalla sua immagine. A costo di essere ripetitivi, consideriamo la successione così definita: ( 1, se n è pari pn = −1, se n è dispari. 33

34

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

L’immagine di {pn } è formata dall’insieme {−1, 1}, mentre la successione è costituita da infiniti numeri reali. In questo senso l’uso delle parentesi graffe per denotare tanto la successione quanto l’insieme dei punti sulla retta reale da essa individuati è azzardata. La tradizione didattica, così consolidata, rende inutile ogni battaglia contro questo abuso di notazione. Osservazione 3.2. Osserviamo che qualunque successione è in realtà la restrizione a N di infinite funzioni di una variabile reale. Data infatti una qualunque successione {pn }, possiamo definire infinite funzioni f : R → R in maniera tale che f (n) = pn per ogni n ∈ N. Ad esempio, possiamo specificare assolutamente a caso i valori di f (x) per x ∈ R \ N. L’Osservazione sopra ci permette di fare una divagazione divertente con un finale polemico. Tutti ci siamo imbattuti, prima o poi, nel seguente “rompicapo”: data una sequenza di quattro o cinque numeri (solitamente naturali), dire quale sarà il numero successivo. È chiaro che, per un matematico, questo è un rompicapo assolutamente ozioso: basta scrivere un numero a caso! Chiaramente non sarà mai la soluzione prevista da chi pone il dilemma. Ad esempio, se la sequenza è “1,3,5,7,9”, sembra plausibile congetturare che il numero successivo sarà 11, data l’assonanza evidente con i primi numeri dispari. In tutti questi casi, il vero rompicapo è capire che cosa significhi scrivere un numero che segue logicamente quelli dati. Un buon rompicapo dovrebbe possedere una soluzione inequivocabile, e soprattutto utilizzare questi problemi per selezionare le future matricole universitarie appare un’idea abbastanza discutibile. Definizione 3.3. Una successione {pn } è crescente (risp. strettamente crescente) se pn ≤ pn+1 (risp. pn < pn+1 ) per ogni n, e decrescente (risp. strettamente decrescente) se vale la disuguaglianza opposta (risp. la disuguaglianza stretta opposta). La successione {pn } è limitata se esiste una costante M > 0 tale che |pn | ≤ M per ogni n. Definizione 3.4. Diremo che la successione {pn } tende al valore ` ∈ R per n → +∞, e scriveremo limn→+∞ pn = ` oppure pn → ` per n → +∞, se, per ogni ε > 0 esiste N ∈ N tale che |pn − `| < ε per ogni n > N . Definizione 3.5. Diremo che una successione {pn } di numeri reali è convergente se essa possiede un limite nel senso della definizione precedente. In caso contrario, diremo che la successione è divergente. Un primo avvertimento che ci sembra doveroso dare è che i libri di testo italiani usano una terminologia molto più descrittiva. Noi abbiamo usato

3.1. SUCCESSIONI E LORO LIMITI

35

l’aggettivo “divergente” per la negazione logica di “convergente”. La tradizione italiana usa tale aggettivo per indicare che la successione tende all’infinito, come vedremo fra poco. La negazione della convergenza si divide così in due sotto-classi: tendere all’infinito e assumere infinite volte valori prossimi a piacere a due numeri distinti. Chi scrive, senz’altro sotto l’influsso del bellissimo libro di Walter Rudin [24], preferisce evitare questa ulteriore distinzione. Nell’economia di questo corso, per inciso, sarebbe anche poco saggio dare eccessiva importanza alle successioni che “oscillano” fra due valori diversi. Osservazione 3.6. È fondamentale che lo studente si renda conto del seguente fatto: se esiste un numero N ∈ N che soddisfa le richieste contenute ˜ > N andranno nella definizione di limite, anche tutti i numeri naturali N bene. Un’osservazione particolarmente importante è che i “primi” termini di una successione sono ininfluenti al fine dell’esistenza del limite. Proposizione 3.7. Siano {pn } e {qn } due successioni, e supponiamo che esista un numero naturale n0 tale che pn = qn per ogni n > n0 . Sotto queste ipotesi, la successione {pn } possiede limite (finito oppure infinito) se e solo se la successione {qn } possiede limite, ed in tal caso i due limiti coincidono. Dim. Supponiamo che limnto+∞ pn = ` ∈ R. Per definizione, fissato ε > 0 esiste N ∈ N tale che |pn − `| < ε per ogni n > N . Posto N1 = max{N, n0 }, ovviamente |qn − `| < ε per ogni n > N1 , dal momento che qn = pn per tali valori dell’indice n. Quindi limn→+∞ qn = `. Poiché questo ragionamento è perfettamente simmetrico, possiamo scambiare il ruolo di {pn } e di {qn }, e concludere che se limn→+∞ qn = ` allora anche limn→+∞ pn = `. Il caso del limite infinito è lasciato per esercizio. Lo studente non deve comunque sopravvalutare la portata della Proposizione appena dimostrata: se il limite rappresenta il comportamento della successione per indici molto grandi, è naturale che si disinteressi dell’andamento della successione per valori “piccoli” dell’indice. Ma come si controlla, operativamente, che una successione sia convergente? Vediamolo con un esempio. Consideriamo la successione { n−1 }, e verifin+1 chiamo che è convergente al limite ` = 1. In base alla definizione, dobbiamo fissare a nostro piacere un numero ε > 0, e verificare che la disequazione n − 1 n + 1 − 1 < ε

36

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

è soddisfatta per tutti i valori di n maggiori di qualche N . Riscriviamo la disequazione facendo il denominatore comune: n − 1 − n − 1 < ε, n+1 cioè

2 < ε. n+1 2 La domanda è: esiste un indice N ∈ N tale che n+1 < ε sia soddisfatta per 2 ogni n > N ? Per rispondere, “risolviamo” la disequazione n+1 < ε rispetto a n: 2 n > − 1. ε Pertanto, se scegliamo N uguale al primo numero naturale maggiore di 2ε − 1, abbiamo finito la verifica del limite proposto. Dunque la verifica di un limite si riduce nel “risolvere” una disequazione e nel dimostrare che l’insieme delle soluzioni contiene tutti i numeri naturali maggiori di un opportuno valore. Prima di passare oltre, osserviamo che il valore del limite ` è stato “regalato”, e che non saremmo riusciti a calcolarlo con la sola definizione. Vedremo fra poco quali strumenti esistano per l’effettivo calcolo dei limiti. La prossima domanda è se possano esistere due numeri `1 e `2 che siano entrambi il limite di {pn }? La risposta è negativa.1 Proposizione 3.8. Se pn → `1 e pn → `2 , allora `1 = `2 . Dim. Supponiamo che `1 < `2 e mostriamo che questo porta ad una contraddizione. Un ragionamento del tutto simile vale anche sotto l’ipotesi (assurda) `1 > `2 , e perciò non resta che `1 = `2 . Dunque, sia ε = 12 (`2 − `1 ) > 0. Applichiamo la definizione di limite per `1 : esiste N1 ∈ N tale che |pn − `1 | < ε se n > N1 . Applicando la definizione a `2 , troviamo che esiste N2 ∈ N tale che |pn − `2 | < ε se n > N2 . Scegliamo N > max{N1 , N2 }. Quindi `2 − `1 ≤ |pn − `1 | + |pn − `2 | < `2 − `1 , assurdo. 1

Almeno per successioni di numeri reali. In contesti molto più generali, una successione potrebbe addirittura ad infiniti limiti diversi.

3.1. SUCCESSIONI E LORO LIMITI

37

Nella dimostrazione abbiamo usato la disuguaglianza triangolare |x − y| ≤ |x − z| + |z − y|

(3.2)

valida per ogni terna x, y, z di numeri reali. Un’altra proprietà delle successioni convergenti, cioè delle successioni che tendono a un limite nel senso della nostra definizione, è che sono successioni limitate. Proposizione 3.9. Ogni successione convergente è limitata. Dim. Infatti, se limn→+∞ pn = `, allora esiste N ∈ N, corrispondente alla scelta di ε = 1, tale che |pn − `| < 1 se n > N . Quindi, per la disuguaglianza triangolare, |pn | < M = max{|p1 |, |p2 |, . . . , |pN |, 1 + |`|}.

Osservazione 3.10. È però falso che ogni successione limitata converge. La successione {1, −1, 1, −1, 1, −1, . . . } è limitata (M = 1 nella definizione), ma non converge. Vedremo comunque che tutte le successioni limitate hanno una sottosuccessione convergente. Prima di proseguire, osserviamo che alle successioni possono essere applicate le quattro operazioni algebriche. Precisamente, se {pn }, {qn } sono successioni e se α ∈ R, possiamo definire le successioni pn + qn , αpn , pn qn ,

pn qn

sotto l’ovvia condizione che qn 6= 0 quando qn appare a denominatore. Il seguente teorema afferma che l’operazione di limite rispetta le operazioni algebriche. Teorema 3.11. Siano {pn } e {qn } due successioni. Se pn → ` e qn → m per n → +∞, allora 1. pn + qn → ` + m; 2. αpn → α`; 3. pn qn → `m; 4.

pn qn



` m

se m 6= 0.

38

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Le affermazioni 1 e 2 sono ovvie. Vediamo la 3, un po’ più difficile. Per ipotesi, dato ε > 0 esistono N1 ed N2 in N tali che |pn − `|| < ε e |qn − m| < ε rispettivamente per n > N1 ed n > N2 . Fissiamo N > max{N1 , N2 } e osserviamo che per n > N |pn qn − `m| = |pn qn − `qn + `qn − `m| ≤ |pn − `||qn | + |`||qn − m|

(3.3)

per la disuguaglianza triangolare. Poiché ogni successione convergente è limitata, avremo |qn | < M , e dunque |pn qn − `m| ≤ M ε + |`|ε = (M + |`|)ε. Poiché ε > 0 è arbitrario, altrettanto arbitrario è il numero (M + |`|)ε, e quindi anche 3 è dimostrata. La dimostrazione di 4 è del tutto analoga, e lo studente può provare a dimostrarla da solo, oppure può studiarla su uno dei llibri di testo consigliati. Nell’ultima dimostrazione, ci sono due passaggi la cui importanza non va sottovalutata. Lo studente deve capirli bene e saperli adattare a situazioni simili. Il primo passaggio è di natura logica. Se un numero ε è piccolo a piacere, altrettanto lo è 2ε, o anche 100ε. L’importante è che il fattore moltiplicativo di ε sia indipendente da ε stesso.2 Il secondo passaggio, è la tecnica di sommare e sottrarre una medesima – o anche più – quantità per raggruppare termini che fanno comodo. Nell’equazione (3.3), sommare e sottrarre `qn ci ha permesso di raccogliere a fattor comune termini come |pn − `|, che sapevamo stimare con ε. Avremo l’occasione di applicare questa tecnica molto spesso, e l’unica regola per scoprire che cosa aggiungere e togliere è l’esperienza. All’inizio, si procede by trial and error, cioè provando senza paura di sbagliare. Molti studenti ricorderanno che quando si studiano i limiti, i guai vengono dalle forme di indecisione. Per poterne parlare, occorre per ò estendere la definizione di limite. Definizione 3.12. Sia {pn } una successione. Diciamo che {pn } tende a +∞ (risp. a −∞), e scriviamo limn→+∞ pn = +∞ (risp. limn→+∞ pn = −∞) se per ogni numero reale M > 0 esiste un indice N ∈ N tale che pn > M per ogni n > N (risp. pn < −M per ogni n > N ). Osservazione 3.13. Fra i matematici è in voga la locuzione “la successione {pn } esplode”. Di solito, con questo linguaggio un po’ colorito intendono dire che limn→+∞ pn = +∞. 2

Ovvio, perché ε−1 ε = 1 non è affatto piccolo a piacere.

3.1. SUCCESSIONI E LORO LIMITI

39

Per esercizio, verifichiamo mediante questa definizione che limn→+∞ log n = +∞. Fissiamo arbitrariamente un numero reale M > 0, e cerchiamo di scegliere N ∈ N tale che log n > M per ogni n > N . Poiché la disuguaglianza log n > M equivale a n > eM , ci basta scegliere il primo numero naturale N maggiore di eM . È ovvio che non tutte le relazioni di limite possono essere verificate appliacndo pedissequamente la definizione. È conveniente dicorrere alle regole per il calcolo algebrico dei limiti, ogni volta che ciò sia possibile in virtù dei teoremi visti nella pagine precedenti. Sfortunatamente, esistono situazioni in cui le regole algebriche non possono essere conclusive: stiamo parlando delle forme di indeterminazione. Dando per scontato che n → +∞ e 1/n → 0 quando n → +∞, vediamo che n·

1 =1→1 n

e dovremmo ipotizzare che +∞ · 0 = 1. Se però cambiamo l’esempio, n2 ·

1 = n → +∞ n

e dunque +∞ · 0 = +∞. C’è di che diventare matti. Ma insomma, quanto fa “zero per infinito”? La risposta è che... non fa! È la prima forma di indecisione che incontriamo, e nasconde un fatto piuttosto sottile: non tutti gli infiniti sono uguali fra loro.3 Si usa scrivere [0 · ∞] fra parentesi, per sottolineare che la moltiplicazione scritta richiede ulteriori precisazioni. Altre forme di indecisione molto popolari fra gli studenti sono   h i 0 ∞ , [+∞ − ∞]. , 0 ∞ Altrettanto indeterminate sono le espressioni  0 0 , [1∞ ] , sebbene pochi studenti sembrino ricordarsene. A parte l’ultima e “patologica” espressione,4 tutte le altre sono caratterizzate dalla presenza di 0 e ∞. La forma di indecisione più complicata è probabilmente [+∞ − ∞], mentre per quelle di natura moltiplicativa esistono tecniche raffinate e potenti che incontreremo a tempo debito. L’aspetto sgradevole è che queste tecniche richiedono il calcolo differenziale, e non sono pertanto direttamente applicabili alle successioni. 3 4

A conferma del fatto che ∞ non designa un numero. Ci sono nascosti dei logaritmi, come vedremo più avanti.

40

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Osservazione 3.14. Perché introdurre la teoria dei limiti per le successioni, considerato che impareremo presto la teoria dei limiti per tutte le funzioni di una variabile reale? La risposta è che le successioni sono uno strumento molto utile e forniscono tecniche dimostrative particolarmente intuitive di alcuni teoremi. Inoltre, tutto il mondo informatico che ci circonda è basato sulle successioni: i numeri vengono rappresentati come approssimazioni decimali (o meglio binarie), ed anche i più avanzati software di calcolo utilizzano tecniche basate sulle successioni per fornire risposte.

3.2

Proprietà asintotiche delle successioni

In questa lezione, vedremo una serie di risultati riguardanti le propriet à delle successioni, che valgono “da un certo indice in poi”. Innanzitutto, formalizziamo questa frase. Definizione 3.15. Data una successione {pn }, diremo che una proprietà vale definitivamente per {pn } quando esiste un indice N ∈ N tale che la proprietà vale per ogni pn con indice n > N . Osservazione 3.16. L’aggettivo “definitivamente” dipende in modo essenziale dalla successione. Per essere più chiari, “definitivamente” per una successione {pn } non significa “definitivamente” anche per un’altra successione {qn }. Infatti, l’indice N che funziona per la prima successione potrebbe non essere abbastanza grande da funzionare anche per la seconda successione. Tuttavia, non siamo di fronte ad un grande problema. Se per la prima successione troviamo un indice N1 e per la seconda un altro indice N2 , è chiaro che l’indice N = max{N1 , N2 } va bene per entrambe, in quanto N è più grande sia di N1 che di N2 .5 Ad esempio, una successione è definitivamente positiva se tutti i termini sono positivi tranne (al più) un numero finito. Inoltre, una successione converge a ` se e solo se la disuguaglianza ` − ε < pn < ` + ε è vera definitivamente. Il primo teorema che dimostriamo è molto importante. Teorema 3.17 (Permanenza del segno). Supponiamo che limn→+∞ pn = ` ∈ R. 1. Se ` > 0 (risp. ` < 0), allora pn > 0 (risp. pn < 0) definitivamente. 5

La scrittura N = max{N1 , N2 } significa precisamente che N è il più grande fra N1 e N2 . Ancora più esplicitamente, si confrontano fra loro N1 e N2 , e si sceglie il maggiore dei due: quello sarà N .

3.2. PROPRIETÀ ASINTOTICHE DELLE SUCCESSIONI

41

2. Se pn ≥ 0 (risp. pn ≤ 0) definitivamente, allora ` ≥ 0 (risp. ` ≤ 0). Dim. Infatti, supponiamo ` > 0. Fissiamo ε = 21 `, e scegliamo N ∈ N tale che ` − ε < pn < ` + ε per ogni n > N . Quindi, in particolare, pn > ` − ε = 1 ε > 0 per n > N . Questo dimostra il punto 1. 2 Il punto 2 segue dal punto 1. Infatti, se ` < 0, allora sarebbe anche pn < 0 definitivamente, contro l’ipotesi pn ≥ 0. Nel punto 2 del teorema precedente, la disuguaglianza stretta nell’ipotesi non garantisce la disugualianza stretta nella tesi. Infatti, consideriamo la successione pn = 1/n. Chiaramente, pn > 0 per ogni n, ma pn → 0 per n → +∞. C’è sempre un punto sul quale gli studenti dimostrano molta difficoltà: rendersi conto che certe successioni non hanno limite, né finito né infinito. Volendo fare un esempio, possiamo considerare la successione {1, −1, 1, −1, 1, −1, 1, −1, . . . }. Questa successione alterna i due valori 1 e −1 periodicamente, e dovrebbe essere chiaro che non può esistere alcun numero reale ` che sia limite della successione. Si tratta di un principio generale che, per i limiti di questo corso, non possiamo inquadrare in un teorema.6 Per sgombrare il campo da future discussioni, precisiamo che per noi esistono solo due categorie di successioni: quelle convergenti e quelle divergenti. La successione appena vista è pertanto divergente. Molti testi elementari parlano invece di successioni oscillanti. Non c’è nulla di male in questo, ma non ci sem bra utile costringere lo studente a imparare a memoria classificazioni ben poco utili. In fondo, i limiti sono utili quando esistono, finiti o anche infiniti. Quando non esistono, l’importante è capire perché non esistono. Vi è una categoria di successioni il cui comportamento è piuttosto regolare. Si tratta delle successioni monotone. Proposizione 3.18. Sia {pn } una successione monotona crescente (o decrescente). Se {pn } è limitata, allora {pn } converge, e il limite coincide con supn∈N pn (oppure con inf n∈N pn se {pn } è decrescente.) 6

Lo studente più curioso si accontenterà di sapere che, a fianco del limite, esistono anche il limite inferiore lim inf n→+∞ e il limite superiore lim supn→+∞ . Una successione converge se e solo se i limiti inferiore e superiore sono uguali. Purtroppo, la definizione dei limiti inferiore e superiore non è semplice, e preferiamo evitare di aggiungere complicazioni ulteriori.

42

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. Infatti, supponiamo che {pn } sia crescente, e poniamo S = supn∈N pn . L’ipotesti di limitatezza della successione implica che S ∈ R.7 Sia ε > 0 fissato arbitrariamente. Per definizione di estremo superiore, esiste N ∈ N tale che S − ε < pN < S. Per la monotonia di {pn }, se n > N allora S − ε < pN ≤ pn < S, e questo significa che pn → S per n → +∞. La dimostrazione nel caso in cui {pn } sia decrescente è analoga. Forse lo studente avrà notato che la Proposizione precedente ammette una immediata generalizzazione. Proposizione 3.19. Una successione crescente e illimitata dall’alto diverge a +∞. Una successione decrescente e illimitata dal basso diverge a −∞. Dim. In effetti, la Proposizione precedente dimostra che una successione monotona tende8 sempre all’estremo superiore oppure all’estremo inferiore. Se una successione è illimitata, almeno uno di tali estremi è infinito. Osservazione 3.20. In realtà, la gran parte dei teoremi che parlano di successioni e dei loro limiti hanno un’immediata generalizzazione secondo la terminologie del “definitivamente”. Solo per fare un esempio, una successione definitivamente monotona, cioè una successione che comincia ad essere monotona dopo un certo indice,9 ovviamente possiede un limite, finito o infinito. Questo dovrebbe essere abbastanza chiaro, dal momento che i primi termini di una successione non ne influenzano il comportamento asintotico. Enunciamo e dimostriamo uno dei criteri più usati per dimostrare la convergenza delle successioni. Come accade sovente in matematica, il principio è quello di ricondursi al caso precedente. Teorema 3.21 (Due carabinieri). Siano {an }, {bn } e {pn } tre successioni. Supponiamo che limn→+∞ an = limn→+∞ bn = ` ∈ R, e che an ≤ pn ≤ bn definitivamente. Allora limn→+∞ pn = `. Se invece an → +∞ allora pn → +∞, e se bn → −∞ allora pn → −∞. Dim. Infatti, fissiamo ε > 0 e scegliamo N ∈ N tale che ` − ε < an < ` + ε e ` − ε < bn < ` + ε. Quindi ` − ε < an ≤ pn ≤ bn < ` + ε, 7

A volte, scriveremo S < +∞. Usiamo questo verbo con una certa imprecisione. 9 Resta inteso che la monotonia deve sussistere per sempre, oltre quel valore dell’indice. 8

3.3. INFINITESIMI ED INFINITI EQUIVALENTI

43

e la prima parte del teorema è dimostrata. Se am → +∞, allora pn è definitivamente maggiore di qualunque numero fissato, dato che pn ≥ an . Lasciamo allo studente il caso bn → −∞, che si tratta in maniera del tutto analoga. Una parola di commento sulla terminologia. L’appellativo “dei due carabinieri” rappresenta la classica immagine di due carabinieri ({an } e {bn }) che scortano in prigione (il limite) il prigioniero ({pn }), affiancandolo passo dopo passo. È un’immagine che appare in molti libri per ragazzi di cento anni fa. Apparentemente, i corpi di polizia dei paesi anglosassoni non hanno mai avuto l’abitudine di scortare i malfattori in questo modo, ed infatti nessun testo di calculus dimostra alcun “two–policemen theorem”. Un’altra spiegazione è che associare galeotti e teoremi di matematica non è un buon modo di rendere l’analisi matematica più affascinante. Spesso il Teorema dei due carabinieri si applica alle successioni positive, scegliendo an = 0 per ogni n. Pensiamo all’esempio   sin n . n Non è affatto immediato verificare che questa successione ha limite, dato che {sin n} ha un comportamento piuttosto bizzarro. Tuttavia, basta osservare che | sin n| ≤ 1, e quindi sin n 1 ≤ , 0 ≤ n n per concludere che la successione tende a zero. Il teorema dei due carabinieri si applica con an = 0 e bn = 1/n. In realtà non è veramente restrittivo pensare alle successioni che convergono a zero. Vale il seguente risultato, la cui dimostrazione immediata è lasciata per esercizio. Proposizione 3.22. Una successione {pn } converge a ` ∈ R se e solo se la successione di numeri non negativi {|pn − `|} converge a zero.

3.3

Infinitesimi ed infiniti equivalenti

In questa sezione, vogliamo introdurre un linguaggio piuttosto diffuso e comodo per confrontare due successioni con lo stesso comportamento. Definizione 3.23. Sia {pn } e {qn } due successioni, entrambe tendenti a zero (rispettivamente ad infinito). Diciamo che {pn } è un infinitesimo (rispetti-

44

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

vamente un infinito) equivalente a {qn }, in simboli10 pn  qn , se lim

n→+∞

pn = 1. qn

Osservazione 3.24. Ovviamente, se due successioni {pn } e {qn } sono tali che limn→+∞ pn /qn = ` 6= 0, allora pn  `qn . La principale utilità degli infinitesimo (ed infiniti) equivalenti è contenuta nella seguente Proposizione 3.25. Supponiamo che {an }, {pn } e {qn } siano successioni, e che pn  qn . Allora lim an pn = lim an qn .

n→+∞

n→+∞

Dim. Infatti, lim an pn = lim an

n→+∞

n→+∞

pn qn = lim an qn , n→+∞ qn

nel senso che il limite limn→+∞ an pn esiste se e solo se esiste limn→+∞ an qn , e i due valori coincidono. In breve, è possibile sostituire fra di loro gli infinitesimi (o gli infiniti) equivalenti nelle strutture moltiplicative. Lo studente faccia attenzione a non tentare questa strada nel caso additivo: è falso che lim an + pn = lim an + qn

n→+∞

n→+∞

se pn  qn .

3.4

Sottosuccessioni

Immaginiamo di avere una successione {p1 , p2 , p3 , . . . , pn , . . . } e di selezionare alcuni elementi da essa, avendo cura di prenderli in ordine crescente di indici. Per esempio, potremmo selezionare p3 , p10 , p11 , p50 , p100 , . . . Anche se a prima vista sembra un po’ curioso, abbiamo costruito un’altra successione. Diamo una definizione generale per questo procedimento. 10

Su alcuni testi si trova pn ∼ qn , oppure pn ≈ qn .

3.5. IL NUMERO E DI NEPERO

45

Definizione 3.26. Una successione {qn } è una sottosuccessione di {pn } se qn = pk(n) , dove k : N → N è una funzione strettamente crescente. Per brevità, si scrive spesso {pkn }. Teorema 3.27. Una successione converge a un limite ` se e solo se tutte le sue sottosuccessioni convergono a `. Omettiamo la dimostrazione di questo teorema, ma vogliamo evidenziarne l’importanza. Per esempio, la successione {1/n2 } converge a zero perché è una sottosuccessione di {1/n}. Per lo stesso motivo, per ogni numero naturale κ > 0 la successione {1/nκ } converge a zero. Lo studente non deve pensare che questo ragionamento giustifichi la scrittura limn→+∞ 1/nα = 0 per ogni numero reale α > 0. Infatti, quando α non è un numero naturale, {nα } non è una sottosuccessione di {n}. Per esempio, quando α = 1/2, la successione √ √ √ 1, 2, 3, 4, . . . , non è una sottosuccessione di 1, 2, 3, 4, . . . , Concludiamo con un teorema di esistenza. È un caso molto speciale di uno dei teoremi più usati in tutta l’analisi matematica, il teorema di compattezza per successioni degli insiemi chiusi e limitati di Rn . Teorema 3.28. Sia [a, b] un intervallo chiuso e limitato di R. Ogni successione {pn } tale che pn ∈ [a, b] per ogni n, possiede una sottosuccessione convergente a qualche elemento di [a, b]. Ad esempio, la successione {1, −1, 1, −1, 1, −1, . . . } cade nelle ipotesi di questo teorema.11 Infatti una sottosuccessione convergente esiste senz’altro: {1, 1, 1, 1, . . . }. Molto meno scontato è il fatto che la successione {sin n} possegga una sottosuccessione convergente. Corollario 3.29. Ogni successione limitata di numeri reali possiede una sottosuccessione convergente. Dim. Se {pn } è limitata, esiste M > 0 tale che |pn | < M per ogni n. Allora pn ∈ [−M − 1, M + 1] per ogni n, e dunque si applica il teorema precedente.

3.5

Il numero e di Nepero

Lo studente avrà senza dubbio già sentito parlare del numero di Nepero,12 indicato dalla lettera e. È uno dei numeri più celebri della matematica ele11 12

Si può scegliere [a, b] = [−1, 1]. O meglio di John Napier.

46

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

√ mentare, insieme a π e all’unità immaginaria i = −1.13 Il numero e è anche la base di logaritmi universalmente utulizzata nelle scienze, avendo ormai soppiantato in quasi tutti i settori la più classica base 10.14 Occorre una definizione che individui tale numero senza possibilità di errore. Esistono due definizioni (evidentemente equivalenti) di e. La prima, e anche la più comoda per fare i calcoli, è ∞ X 1 . e= n! n=0 Il simbolo n! = 1 · 2 · 3 · · · · · (n − 1) · n è il fattoriale di n, ma il guaio è che noi non sappiamo sommare infiniti numeri reali, come richiesto dalla formula precedente. Dovremmo addentrarci nella teoria delle serie numeriche, ma usciremmo dai limiti di questo corso. Proponiamo invece la seguente definizione, ormai comprensibile allo studente: n  1 . (3.4) e = lim 1 + n→+∞ n Insomma, e è il limite della successione di termine n-esimo  n 1 en = 1 + . n Ma chi garantisce che {en } abbia un limite, e che questo limite sia finito? Poiché [1∞ ] è una forma di indecisione,15 certo non i teoremi sul calcolo algebrico dei limiti. Si potrebbe dimostrare con un po’ di fatica, ma noi non lo faremo, che {en } è una successione monotona crescente e limitata. Di conseguenza, {en } ha un limite finito, e battezziamo e tale limite. Usando un programma di calcolo, si trova la seguente approssimazione con cinquanta cifre decimali esatte: e ≈ 2.7182818284590452353602874713526624977572470937000 . . . La formula eiπ +1 = 0 è considerata una delle relazioni più belle di tutta la matematica, poiché coinvolge in maniera semplice i cinque numeri più importanti: 0, 1, e, π ed i. 14 Questa affermazione è vera quando si vuole usare il calcolo differenziale. Un tempo i logaritmi servivano per fare velocemente i calcoli, ed era inevitabile scegliere come base 10, poiché siamo abituati ad usare il sistema decimale per esprimere i numeri. Se fossimo abituati ad operare nel sistema binario dei computer, useremmo con maggior profitto la base 2. 15 Lo studente mediti sul fatto che limn→+∞ 1pn = 1, qualunque sia la successione {pn } che diverge a ∞. Non è in contraddizione con l’affermazione che [1∞ ] è una forma indeterminata? 13

3.6. APPENDICE: SUCCESSIONI DI CAUCHY

47

Si dimostra che e è un numero irrazionale e che n X  +∞ 1 1 = . lim 1 + n→+∞ n n! n=0

3.6

Appendice: successioni di Cauchy

Supponiamo che {pn }n sia una successione convergente ad un limite (finito) `. Per ogni ε > 0, esiste n ∈ N tale che per ogni n > N si ha |pn − `| < ε/2. Sia m > N ; dalla disuguaglianza triangolare deduciamo che |pn − pm | ≤ |pn − `| + |pm − `| <

ε ε + = ε. 2 2

A parole, abbiamo dimostrato che la distanza fra due termini di indice sufficientemente grande di una successione convergente può essere resa piccola a piacere. Diamo un nome alle successioni che soddisfano questa proprietà. Definizione 3.30. Una successione {pn }n si chiama successione di Cauchy se, per ogni ε > 0 esiste N ∈ N tale che |pn − pm | < ε per ogni n, m > N .

(3.5)

Dalla discussione precedente, tutte le successioni convergenti sono successioni di Cauchy. Ora, di fronte a questo genere di implicazione, viene spontaneo domandarsi se le successioni di Cauchy coincidano con le successioni convergenti. La risposta è contenuta nel seguente teorema. Teorema 3.31 (Completezza di R). Ogni successione di Cauchy di numeri reali è convergente. Premettiamo un risultato che interverrà nella dimostrazione. Proposizione 3.32. Sia {pn }n una successione di Cauchy. Se una sottosuccessione {pnk }k converge a un limite `, allora tutta la successione {pn }n converge a `. Dim. Sia ε > 0. Esiste N ∈ N tale che, per ogni n, m > N risulta |pn −pm | < ε. Per ipotesi, in corrispondenza di ε, esiste un indice K ∈ N tale che ˜ > max{N, nK }. Per ogni |pnK − `| < ε. Fissiamo un numero naturale N ˜ , risulta indice n > N |pn − `| ≤ |pn − pnK | + |pnK − `| < ε + ε = 2ε. In conclusione, limn→+∞ pn = `.

48

CAPITOLO 3. SUCCESSIONI DI NUMERI REALI

Dim. del teorema di completezza. Sia {pn }n una successione di Cauchy formata da numeri reali. Dalla definizione di successione di Cauchy segue che {pn }n è necessariamente limitata.16 Sappiamo (si veda il Teorema 3.28) che ogni successione limitata possiede una sottosuccessione convergente, e chiamiamo ` tale limite. Dalla precedente Proposizione, tutta la successione {pn }n deve convergere a `, e questo conclude la dimostrazione. Il nome di questo teorema è legato al fatto che gli spazi metrici in cui tutte le successioni di Cauchy sono necessariamente convergenti vengono chiamati completi.

16

Lo studente si convinca di questa affermazione. Suggerimento: fissato ε = 1, tutti i numeri della successione, ad esclusione di un numero finito N , distano l’uno dall’altro meno di 1, e possono dunque essere inseriti in un intervallo di ampiezza 1. Allarghiamo ora l’ampiezza di questo intervallo finché non vengano intrappolati tutti i primi N termini della successione...

Capitolo 4 Serie numeriche Per spiegare che cosa sia una serie numerica,1 pensiamo di raccogliere una quantità finita di numeri reali, di ordinarli in un certo modo p1 , p2 , . . . , pN e di sommarli: p1 + p2 + . . . + pN . P Si può abbreviare questa scrittura introducendo il simbolo di sommatoria : N X

pi = p1 , p2 , . . . , pN .

i=1

Osservazione 4.1. L’indice i è una variabile muta. Qualunque altra lettera potrebbe essere usata senza alterare il valore della somma: N X i=1

pi =

N X

pj =

j=1

N X

pk = . . .

k=1

Questa operazione è chiara se sommiamo un numero finito di termini, mentre diventa confusa se vogliamo sommare gli infiniti termini di una successione. Definizione 4.2. Sia {pn }n una successione di numeri reali. La serie associata a {pn }n è la successione {sn }n definita dalla formula sn =

n X

pj .

j=1 1

Esistono anche altri tipi di serie: di funzioni, di vettori, ecc.

49

50

CAPITOLO 4. SERIE NUMERICHE

Useremo il simbolo

∞ X

pn ,

n=1

P

o anche l’abbreviazione n pn , per indicare la successione {sn }n . La successione {sn }n prende il nome di successione delle somme parziali della serie. Osservazione 4.3. Esplicitamente, s1 = p1 , s2 = p1 + p2 , s3 = p1 + p2 + p3 , ecc. Osserviamo che, data una serie {sn }n , risulta pn = sn − sn−1 , e pertanto è univocamente individuata la successione che genera la serie. Osservazione 4.4. In esatta analogia con le successioni del capitolo precedente, poco importa da quale valore parte l’indice della serie. Se è vero che ∞ ∞ X X pn e pn n=1

n=0

rappresentano due serie diverse, tuttavia è noto che la convergenza della prima equivale alla convergenza della seconda. Per questo motivo, capiterà di far partire la serie dall’indice 0 o dall’indice 1, a seconda della convenienza. Ovviamente, certe volte la forma della serie impone dei limiti all’indice. Si pensi ad una serie come ∞ X 1 , n−1 n=2 il cui primo indice è n = 2 perché n = 1 annullerebbe il denominatore. Osservazione 4.5. In relazione all’osservazione precedente, possiamo sfruttare il fatto che l’indice di somma è una variabile muta per effettuare un’operazione che sarà il cambiamento di variabile nella teoria dell’integrale di Riemann. Operiamo su un esempio: la serie ∞ X 1 3n n=1

si trasforma nella serie

∞ ∞ X 1 1X 1 = 3k+1 3 k=0 3k k=0

mediante il cambiamento di indice k = n − 1. Per convincersene, scriviamo “con i puntini” le due serie: ∞ X 1 1 1 1 = + + + ... n 2 3 3 3 3 3 n=1

51 ∞

1X 1 1 = k 3 k=0 3 3 =



1 1 1 1 + + 2 + 3 + ... 0 3 3 3 3



1 1 1 + 2 + 3 + ... 3 3 3

Dunque una serie è semplicemente una successione, il cui termine generale è costruito sommando i primi termini di un’altra successione. Si pone naturalmente il problema della convergenza delle serie numeriche. P Definizione 4.6. La serie ∞ n=1 pn converge al valore S se S = lim

n→+∞

n X

pj ,

j=1

o, con la notazione usata finora, se S = limn→+∞ sn . Con un leggero abuso P p di notazione, si scrive S = ∞ n=1 n . L’angolo dello psichiatra. Gli studenti più attenti si saranno senz’altro accorti della notazione paradossale usata comunemente perP indicare una serie. Siccome P abbiamo definito una serie come la successione { nk=1 pk }n , usare il simbolo ∞ n=1 pn significa confondere la serie con il suo limite! Se pensassimo di estendere questo abuso di notazione a tutte le successioni, ci accorgeremmo immediatamente della pazzia compiuta: invece della successione {1/n} P n, parleremmo della successione 0, il suo limite. La scrittura abbreviata n pn è già migliore, ma non esente da critiche. Possiamo confrontare quest’uso “leggero” dei simboli con l’espressione “la funzione x3 ”, che alla lettera non è affatto una funzione, ma – al massimo – un numero reale. Probabilmente tutto ci ò è un retaggio della confusione fra successioni, numeri e funzioni che caratterizzava gli albori dell’analisi matematica. Esiste una condizione necessaria e sufficiente per caratterizzare le serie convergenti. P∞ Teorema 4.7 (Criterio di convergenza di Cauchy). Una serie n=1 pn è convergente se e solo se, per ogni ε > 0 esiste un numero N ∈ N tale che q X

|pn | < ε

n=p

per ogni p, q ∈ N tali che p > N , q > N . Dim. È la traduzione, nel linguaggio delle serie, del teorema di completezza di R.

52

CAPITOLO 4. SERIE NUMERICHE

A volte si riassume il contenuto di questo teorema dicendo che “le code della serie sono piccole a piacere”. P Corollario 4.8. Se la serie ∞ n=1 pn è convergente, allora limn→+∞ pn = 0. Dim. Se la serie è convergente, il criterio di Cauchy garantisce che, fissato arbitrariamente ε > 0, esiste N ∈ N tale che, in particolare, k X

|pn | = |pk | < ε

n=k−1

per ogni k > N . Ma questa è la definizione del limite limn→+∞ pn = 0. Questo corollario, letto in negativo, afferma che se il termine generale pn di una serie tende a zero, allora la serie non può convergere. Ad esempio, P non n−1 n−1 = 1. Purtroppo, non è la serie n n+2 non converge, dato che limn→∞ n+2 P 1 possibile invertire questo ragionamento: vedremo presto che la serie n n2 P converge, mentre la serie n n1 non converge. Entrambe hanno tutavia un termine generale tendente a zero. Osservazione 4.9. Dato che una serie è semplicemente una successione particolare, una serie può convergere o divergere. Nella divergenza sono inclusi tanto la divergenza all’infinito, quanto l’oscillazione. Per esempio, la serie P n n (−1) oscilla fra i valori −1 e 0. Esempio: la serie geometrica. Sia q ∈ [0, +∞) un numero fissato. Consideriamo la serie ∞ X

qn = 1 + q + q2 + q3 + q4 + . . .

n=0

Ci chiediamo se esistano scelte della ragione q che portano ad una serie convergente. Togliendo le parentesi, è facile convincersi che  (1 − q) 1 + q + q 2 + q 3 + q 4 + . . . + q n = 1 − q n+1 . Pertanto, sn =

n X k=0

qk =

1 − q n+1 . 1−q

La successione {sn }n delle somme parziali converge se e solo se limn→+∞ q n+1 esiste finito, e questo accade se se solo se 0 < q < 1. Inoltre, abbiamo anche il valore della serie: ∞ X 1 qn = 1−q n=0

53 per 0 < q < 1. Esempio: le serie telescopiche. Vanno sotto tale nome le serie cui termine generale può essere scritto come

P

n

pn il

pn = qn − qn+1 per una scelta opportuna di {qn }n . È allora chiaro che n X k=1

pk =

n X

qk − qk+1 = q1 − q2 + q2 − q3 + q4 − q5 + . . . = q1 − qk+1 .

k=1

Si conclude subito che ∞ X n=1

pn = lim

n→+∞

n X

pk = q1 − lim qn+1 . n→+∞

k=1

(4.1)

Una serie telescopica converge se e solo se limn→+∞ qn esiste finito. La serie di Mengoli è un esempio di questa classe di serie: ∞ X n=1

Poiché

1 . n(n + 1)

1 1 1 = − , n(n + 1) n n+1

possiamo porre qn = 1/n e concludere da (4.1) che la serie di Mengoli converge a 1. In generale, potrebbe non essere evidente fin dall’inizio che una serie è telescopica. Di primo acchito, la serie ∞ X n=1

log

(n + 1)2 n(n + 2)

non sembra molto telescopica. Usando però le proprietà dei logaritmi, vediamo che (n + 1)2 = 2 log(n + 1) − log n − log(n + 2) log n(n + 2) = [log(n + 1) − log n] − [log(n + 2) − log(n + 1)]. La serie è telescopica con qn = log(n+1)−log n. Poiché qn → 0 per n → +∞, da (4.1) deduciamo che questa serie converge a log 2.

54

4.1

CAPITOLO 4. SERIE NUMERICHE

Serie a termini positivi

Vanno sotto questo nome le serie i cui termini sono numeri maggiori o uguali a zero. Queste serie presentano una forte peculiarità: o convergono o divergono all’infinito. Infatti, se pn ≥ 0 per ogni n, allora sn =

n X

pk ≤

k=1

n+1 X

pk = sn+1 ,

k=1

e dunque la serie è monotona crescente. Sappiamo che una successione monotona o converge o diverge all’infinito, e questo giustifica la precedente affermazione sulle serie a termini positivi. In effetti, vale di più. P Proposizione 4.10. Sia n pn una serie a termini positivi. Questa serie è convergente se e solo se la successione {sn }n delle sue somme parziali è limitata dall’alto. Dim. Infatti, sappiamo che {sn }n è monotona crescente. Dalla teoria vista nel capitolo precedente, {sn }n converge se e solo se supn |sn | < +∞, cioè se e solo se esiste una costante C > 0 tale che sn ≤ C per ogni n. Il principale strumento per l’analisi della convergenza delle serie a termini positivi è il seguente teorema di confronto. P P Teorema 4.11. Siano n pn e n qn sue serie a termini positivi. Supponiamo che pn ≤ qn per ogni n sufficientemente grande. P P 1. Se n qn converge, allora anche n pn converge. P P 2. Se n pn diverge, allora anche n qn diverge. Dim. Nel primo caso, le somme parziali della prima serie sono più piccole delle somme parziali della seconda serie, le quali per ipotesi restano limitate. Perciò saranno limitate anche le somme parziali della prima serie. Nel secondo caso, le somme parziali della seconda serie sono maggiori delle somme parziali della prima serie. PoichéPqueste ultime non sono limitate, non lo saranno nemmeno quelle della serie n qn . Osservazione 4.12. Il criterio del confronto è destinato a fallire per le serie di termini arbitrari. Ad esempio, −

1 1 < 2, n n

P P ma la serie − n n1 diverge (a −∞), mentre la serie n il Corollario 4.20.

1 n2

converge. Si veda

4.1. SERIE A TERMINI POSITIVI Corollario 4.13 (Criterio del confronto asintotico). Siano sue serie a termini positivi. Supponiamo che

55 P

n

pn e

P

n qn

pn = ` ∈ (0, +∞). n→+∞ qn lim

Allora le due serie sono simultaneamente convergenti o divergenti. Dim. Per l’ipotesi sul limite, esiste un numero N ∈ N tale che 3 ` qn ≤ pn ≤ `qn 2 2 per ogni n > N . confronto.

(4.2)

La conclusione segue immediatamente dal criterio di

Per comprendere la potenza di questo criterio, applichiamolo all’analisi della serie ∞ X 1 sin 2 . n n=1 Innanzitutto, i termini della serie sono positivi, dal momento che 0 < 1/n < π/2 per ogni n ≥ 1 e la funzione seno è positiva nell’intervallo (0, π/2). Dal limite notevole limx→0 sinx x = 1 deduciamo che la serie data ha lo stesso comportamento della serie ∞ X 1 , 2 n n=1 e presto imparareremo che questa serie è convergente. Il criterio del confronto asintotico garantisce che anche la serie iniziale converge. Osservazione 4.14. Se nel criterio del P confronto P asintotico risulta ` = 0, non è più possibile dedurre che le serie n pn e n qn hanno lo stesso comportamento rispetto alla convergenza. Per convincerci di questo, consideriamo pn = 1/n2 e qn = 1/n. Ovviamente limn→+∞ pP n /qn = limn→+∞ 1/n = 0, ma P 1 impareremo presto che n n diverge, mentre n n12 converge. Non tutto è P comunque perduto: se ` = 0, possiamo concludere che la P convergenza di n qn implica la convergenza di P n pn . Infatti, per P ` = 02 vale solo la seconda disuguaglianza di (4.2), perciò n pn ≤ (3/2)` n qn .

2

Siamo volutamente imprecisi: la conclusione rigorosa sarebbe che le somme parziali della serie con pn sono maggiorate dalle somme parziali della serie con qn . Come sappiamo, il criterio asintotico non può garantire la (4.2) P anche per i primi valori di n, e questo P potrebbe invalidare la relazione n pn ≤ (3/2)` n qn .

56

CAPITOLO 4. SERIE NUMERICHE

4.2

Criteri di convergenza

Ma esistono metodi generali per decidere se una data serie sia convergente? La risposta è ampiamente affermativa per le serie a termini positivi, ed solo parzialmente affermativa per le serie qualunque. Nel seguito, esporremo alcuni criteri classici per studiare la natura di una serie numerica. P Teorema 4.15 (Criterio della radice). Sia n pn una serie a termini positivi. Supponiamo che √ lim n pn = L. n→+∞

Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio non è applicabile se L = 1. Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numero √ naturale N tale che n pn < L + ε = (1 + L)/2 per ogni n > N . Elevando questa diseguaglianza alla potenza n,  n 1+L pn < , 2  P 1+L n e poiché la serie geometricaP ∞ è convergente3 dal criterio del n=0 2 confronto concludiamo che n pn converge. Se invece L > 1, prendiamo ε = (L − 1)/2, e come prima arriviamo a n  1 + L √ n >1 pn > 2 per ogni n > N . Quindi {pn }n non tende a zero, e la serie non può convergere. P Teorema 4.16 (Criterio del rapporto). Sia n pn una serie a termini positivi. Supponiamo che pn+1 = L. lim n→+∞ pn Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio non è applicabile se L = 1. Dim. Supponiamo dapprima che L < 1. Preso ε−(1−L)/2, esiste un numero naturale N tale che pn+1 /pn < L + ε = (1 + L)/2 per ogni n > N . Quindi pn+1 < pn (1 + L)/2 per ogni n > N . Ma allora  2  n−N −1 1+L 1+L 1+L pn < pn−1 < pn−2 < . . . < pN +1 , 2 2 2 3

Infatti

1+L 2

< 1.

4.2. CRITERI DI CONVERGENZA

57

che possiamo scrivere come pN +1 pn <  1+L N +1 2



1+L 2

n .

 P 1+L n deAncora dal confronto con P la serie geometrica convergente ∞ n=0 2 duciamo la convergenza di n pn . Viceversa, per L > 1, preso ε = (L − 1)/2, ripetendo gli stessi ragionamenti arriviamo a n  pN +1 1+L pn >  1+L N +1 2 2

ed ancora una volta il termine generale pn non tende a zero. Osservazione 4.17. Lo studente avrà notato che questi criteri sono semplicemente applicazioni del criterio del confronto con opportune serie geometriche. Le divergenze, invece, sono dedotte dal fatto che viene violata la condizione necessaria per la convergenza di una serie. Intuitivamente, questo fatto ci induce a sospettare che i due criteri non siano particolarmente fini nei casi meno accademici. Come anticipato, nel caso L = 1 nessuno dei criteri è efficace. Rimandiamo la disamina di questo fatto all’osservazione successiva. Osservazione 4.18. Il criterio del rapporto, di solito, è di applicazione più immediata. Ormai sappiamo che in matematica non si fanno sconti, e puntualmente ciò accade anche in questa situazione. Si potrebbe mostrare che il criterio della radice è più potente: quando è efficace, lo è anche il criterio del rapporto. Quando non è conclusivo (per L = 1), anche il criterio del rapporto non porta ad alcuna conclusione. Per i dettagli, rimandiamo a [24]. Volendo fare dell’ironia, né l’uno né l’altro sono criteri utili nella “pratica”. Risultano invece importanti nella teoria delle serie di potenze, da cui prende vita l’analisi matematica nel piano complesso. Un criterio piuttosto efficace è il seguente, a dispetto della formulazione vagamente misteriosa. P Teorema 4.19 (Criterio di condensazione). Sia n pn una serie a termini positivi. Supponiamo che pn+1 ≤ pn per ogni n. Sotto tali ipotesi, la serie P n pn converge se e solo se converge la serie X k

2k p2k .

58

CAPITOLO 4. SERIE NUMERICHE

Dim. Poiché stiamo lavorando con termini positivi, ci basta dimoP serie a P strare che le somme parziali di n pn e di k 2k p2k sono simultaneamente limitate o non limitate dall’alto. Siano sn = p1 + p2 + . . . + pn , tk = p1 + 2p2 + . . . + 2k p2k le somme parziali delle due serie. Per n < 2k , sn ≤ p1 + (p2 + p3 ) + . . . + (p2k + . . . + p2k+1 −1 ) ≤ p1 + 2p2 + . . . + 2k p2k = tk e quindi sn ≤ tk . Invece, Per N 2k , sn ≥ p1 + p2 + (p3 + p4 ) + . . . + (p2k−1 +1 + . . . + p2k ) 1 p1 + p2 + 2p4 + . . . + 2k−1 p2k ≥ 2 1 = tk 2 e quindi tk ≤ 2pn . Unendo le due conclusioni, le succesisoni delle somme parziali {sn }n e {tk }k sono simultaneamente limitate oppure illimitate, e questo conclude la dimostrazione. P Corollario 4.20. Sia α ∈ R fissato. La serie n n1α converge se α > 1, e diverge se α ≤ 1. Dim. Il caso α ≤ 0 è semplice, perché il termine generale non tende a zero. Applichiamo il criterio di condensazione, e ci riduciamo a studiare la serie X k

2k

X 1 = 2(1−α)k . 2kα k

Si tratta di una serie geometrica di ragione 21−α . Essa sarà convergente se e solo se 21−α < 1, cioè se e solo se α > 1, e divergente all’infinito per α ≤ 1. Osservazione 4.21. Il Corollario ci convince che i criteri del rapportoP e della ∞ 1 radice sono insoddisfacenti quando L = 1. Ad esempio, le due serie n=1 n P∞ 1 e hanno entrambe L = 1 (per entrambi i criteri), ma la prima 2 n=1 n P∞ 1 diverge, mentre la seconda converge. La serie n=1 n prende il nome di

4.2. CRITERI DI CONVERGENZA

59

serie armonica. La sua divergenza può essere mostrata anche direttamente. Chiamando al solito sn la somma dei suoi primi n termini, abbiamo s1 = 1 3 1 = 2 2 3 1 1 3 1 1 + + > + + =2 = 2 3 4 2 4 4 1 1 1 1 1 1 1 1 5 = 2+ + + + >2+ + + + = 5 6 7 8 8 8 8 8 2

s2 = 1 + s3 s4 e in generale s2n = 1 +

1 1 1 1 + ··· + + + ··· + = 2 n n+1 2n 1 1 1 1 1 = sn + + ··· + ≥ sn + + ··· + = sn + . n+1 2n 2n 2n 2

Raddoppiando quindi il numero degli addendi, la somma aumenta almeno di un termine 1/2. Deduciamo che |s2n − sn | ≥ 1/2, e quindi non può essere soddisfatto il criterio di convergenza di Cauchy. Questa serie ci consente un’osservazione di natura pratica. Volendo studiare al computer le serie, può essere molto fuorviante leggere le prime somme parziali e trarne conclusioni sulla convergenza. Infatti, per la serie armonica si ha s1 s3 s7 s15

= < < <

1 2 3 4.

Per arrivare a 10 bisogna sommare più di 1000 termini, e pre superare 20 occorrono fpiù di un milione di addendi. Se si vuole arrivare a 100, che pure non è un segno inqeuivocabile della divergenza della serie, occorre sommare circa 1030 termini! 4 È abbastanza evidente che questa quantità di addendi supera ampiamente le capacità di calcolo di molti personal computer. Il punto è che le serie numeriche sono molto sensibili alle piccole perturbazioni dei loro termini. La serie ∞ X 1 n=1 4

1030 si scrive come 1 seguito da 30 zeri.

n1.01

60

CAPITOLO 4. SERIE NUMERICHE

ha termini numericamente molto prossimi a quelli della serie armonica, ma nonostante questo è convergente. Il celebre filosofo francese Voltaire suggeriva maliziosamente al matematico tedesco Gauss che prima di mettersi a fare conti per tre giorni, è meglio controllare se non si possa usare qualche ragionamento per arrivare in porto in tre minuti.5

4.3

Convergenza assoluta e convergenza delle serie di segno alterno

Tutti i criteri esposti si applicano alle serie a termini positivi. 6 Ci sono criteri di convergenza per le serie qualunque? Prima di rispondere – e la risposta non sarà del tutto soddisfacente – introduciamo il concetto di serie assolutamente convergente. Definizione 4.22. Una serie è convergente.

P

n

pn è assolutamente convergente se

P

n

|pn |

Poiché |pn | ≥ 0, il concetto di serie assolutamente convergente è di pertinenza delle serie a termini positivi. Inoltre, le serie assolutamente convergenti sono convergenti. Proposizione 4.23. Ogni serie assolutamente convergente è anche convergente. Dim. Basta osservare che pn ≤ |pn | ed applicare il criterio del confronto. Osservazione 4.24. La Proposizione non si inverte: vedremo che la serie X (−1)n n 5

n

K.F. Gauss, uno dei più importanti matematici dell’era moderna, aveva una caparbia invidiabile nel mettersi a fare calcoli. Oggi lo potremmo definire simpaticamente uno “smanettone”. Ad onor del vero, certi problemi matematici possono essere risolti solo ricorrendo a lunghe pagine di calcoli. Quello del matematico come uno scienziato che risolve problemi difficili senza scrivere una sola riga di conti è un falso mito che lusinga tutti gli studenti del primo anno. L’eleganza formale con cui vengono presentati i teoremi non dovrebbe far passare in secondo piano i sacrifici e gli sforzi dei matematici che li hanno dimostrati per la prima volta. 6 È giunto il momento di sfatare un mito: ovviamente questi criteri si applicano altrettanto bene alle serie a termini negativi. L’importante è che tutti i termini della serie abbiano lo stesso segno.

4.3. CONVERGENZA ASSOLUTA E CONVERGENZA DELLE SERIE DI SEGNO ALTERNO61 converge, ma ovviamente non converge assolutamente (perché?). Questo non diminuisce l’utilità della Proposizione 4.23. Non saremmo altrimenti in grado di stabilire la convergenza della serie X sin n , 3 n n visto che i suoi termini non sono tutti dello stesso segno. Usando per ò la maggiorazione | sin n| ≤ 1, possiamo concludere che questa serie converge assolutamente, e quindi anche in senso ordinario. 7 Una classe di serie a termine di segno variabile è quella delle serie a termini di segno alterno. P Definizione 4.25. Una serie n pn è detta serie a termini di segno alterno quando pn pn+1 ≤ 0 per ogni n. Di fatto, la Definizione richiede che ogni coppia di termini successivi nella serie sia costituita da due numeri di segno opposto (o eventualmente nulli). Il caso più frequente è quello delle serie del tipo X (−1)n pn , dove pn ≥ 0 per ogni n. Per queste serie esiste un potente criterio di convergenza (ma non di divergenze). Premettiamo un lemma che corrisponde alla formula di integrazione per parti nel calcolo integrale. Lemma 4.26 (Sommatoria per parti). Siano {pn }n e {qn }n due successioni. Poniamo s−1 = 0 e n X sn = pk k=0

per n ≥ 0. Se 0 ≤ m ≤ n sono numeri naturali, allora m X

pk qk =

k=n

Dim.

m X k=n

pk qk =

m−1 X

sk (qk − qk+1 ) + sm qm − sn−1 qn .

(4.3)

k=n m X

(sk − sk−1 )qk =

k=n

m X k=n

sk qk −

m−1 X

sk qk+1

k=n−1

e l’ultima espressione è uguale a (4.3). 7

A volte conviene dire che una serie converge semplicemente quando essa converge secondo la definizione generale. In questo modo, si usa un aggettivo per distinguere la convergenza dalla convergenza assoluta.

62

CAPITOLO 4. SERIE NUMERICHE

Teorema 4.27 (Criterio di Leibniz). Supponiamo che P 1. le somme parziali {sn }n di n pn formino una successione limitata; 2. q0 ≥ q1 ≥ q2 ≥ . . .; 3. limn→+∞ qn = 0. P Allora n pn qn converge. Dim. Scegliamo M > 0 tale che |sn | ≤ M per ogni n. Fissato arbitrariamente ε > 0, per l’ipotesi 3 esiste un numero naturale N tale che qN ≤ ε/(2M ). Per N ≤ n ≤ m, dal Lemma precedente ricaviamo m m−1 X X sk (qk − qk+1 ) + sm qm − sn−1 qn pk qk = k=n k=n m−1 X (sk − sk+1 ) + qm + qn = 2M qn ≤ 2M qN = ε. ≤M k=n

Questo dimostra che la serie quindi converge.

P

n

pn qn soddisfa la condizione di Cauchy, e

Corollario 4.28. Supponiamo che 1. |c1 | ≥ |c2 | ≥ |c3 | ≥ . . .; 2. c2n−1 ≥ 0, c2n ≤ 0; 3. limn→+∞ cn = 0. P Allora n cn converge. Dim. Applicare il Teorema precedente con pn = (−1)n+1 e qn = |cn |. P n Questo corollario garantisce ad esempio che n (−1) converge. poiché n |cn | = 1/n è decrescente e tende a zero. Si noti il contrasto con la convergenza assoluta, che in questo caso non sussiste. Esistono “infiniti” criteri di convergenza e/o divergenza per le serie (prevalentemente a termini positivi). In questo breve capitolo ne abbiamo discussi alcuni estremamente classici. Lo studente interessato potrà trovarne altri in [21] e nei testi classici di analisi matematica come [16]. I testi più recenti sembrano dare molto meno peso a questi criteri, dal momento che sono tutti riconducibili al criterio di confronto (eventualmente asintotico).

Capitolo 5 Limiti di funzioni e funzioni continue Con questo capitolo, lasciamo il mondo delle successioni, cioè delle funzioni definite sul dominio N, ed entriamo in quello delle funzioni reali di una variabile reale. Vedremo che anche per queste funzioni è sensato pensare a un concetto di limite, ed anzi c’è una maggiore flessibilità. Come lo studente avrà osservato, i limiti delle successioni si calcolano solo per l’indice n → +∞. Parlando in termini estremamente imprecisi, questo non ci sorprende più di tanto. D’altronde, se lo spirito dei limiti è quello di vedere cosa succede quando una variabile si avvicina a piacere a un valore, una variabile n ∈ N non può avvicinarsi a piacere a un numero reale. Invece, una variabile reale x può senza dubbio essere vicina a piacere a qualunque altro numero reale.

5.1

Limiti di funzioni come limiti di successioni

Definizione 5.1. Sia f : (a, b) → R una funzione, e sia x0 un punto di accumulazione di (a, b).1 Diremo che limx→x0 f (x) = L, o che f (x) → L per x → x0 , se limn→+∞ f (xn ) = L per ogni successione {xn } di numeri xn ∈ (a, b) con limn→+∞ xn = x0 e xn 6= x0 per ogni n. Logicamente parlando, questa definizione è rigorosa: sappiamo calcolare i limiti di succesioni e questo è tutto quello che la definizione richiede. Confrontando con la definizione di limite per successioni, troviamo imme1

Non è una svista, x0 potrebbe essere uno degli estremi del dominio di f , anche se f non è definita per questi due valori.

63

64

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

diatamente una diversa caratterizzazione dei limiti di funzioni.2 Per inciso, verificare una relazione di limite con la Definizione 5.1 è praticamente impossibile. Vedremo fra poco che la condizione (ii) del seguente teorema rende le verifiche più agevoli. Teorema 5.2. Siano f e x0 come nella Definizione. Sono equivalenti (i) limx→x0 f (x) = L; (ii) per ogni ε > 0 esiste δ > 0 tale che |f (x) − L| < ε per ogni x ∈ (a, b) tale che 0 < |x − x0 | < δ. Dim. Supponiamo che sia vera la (i) ma che la (ii) sia falsa. Allora esiste ε > 0 ed esiste una successione {xn } tale che xn → x0 , xn 6= x0 , ma |f (xn ) − L| ≥ ε. Questà è una contraddizione con l’ipotesi (i), e perciò anche (ii) deve essere vera. Viceversa, supponiamo che sia vera (ii) e dimostriamo la (i). Sia {xn } una qualunque successione di elementi di (a, b), distinti da x0 e tali che xn → x0 . Fissiamo ε > 0 e sia δ > 0 il numero la cui esistenza è garantita dall’ipotesti (ii). Definitivamente, 0 < |xn − x0 | < ε, e dunque |f (xn ) − L| < ε. Questo significa esattamente che limn→+∞ f (xn ) = L. Invitiamo lo studente ad osservare e memorizzare la richiesta “xn 6= x0 ” e l’equivalente 0 < |x − x0 |. Entrambe significano che, nell’effettuare l’operazione di limite per x → x0 , possiamo (e dobbiamo) trascurare completamente tutto ciò che avviene nel punto x0 . Nel punto x0 a cui tende la x la funzione f potrebbe tranquillamente non essere definita. Ma anche se lo fosse, il valore f (x0 ) non importerebbe nulla. Per esempio, le due funzioni f (x) = x e

∀x ∈ R

( x, x 6= 0 g(x) = 1, x = 0

assumono valori diversi in x0 = 0, e tuttavia limx→x0 f (x) = limx→x0 g(x) = 0. L’Autore di [13] sottolinea che la richiesta “|x−x0 | > 0” potrebbe tranquillamente essere omessa, perché le funzioni che in questo modo non avrebbero limite sarebbero “senza importanza”. Chi scrive rispetta ovviamente questo punto di vista, ma non lo condivide. Il concetto di limite sembra infatti particolarmente significativo proprio perché è applicabile in quei punti vicini a piacere al dominio di definizione (i cosiddetti punti di accumulazione 2

In certi testi italiani, il prossimo teorema viene chiamato teorema ponte. Non avendo mai capito bene questa terminologia, preferiamo evitarla.

5.1. LIMITI DI FUNZIONI COME LIMITI DI SUCCESSIONI

65

per il dominio di definizione) ma non necessariamente appartenenti al dominio medesimo. Quindi, una scrittura come limx→0+ x1 = +∞ perderebbe di significato. Osservazione 5.3. È fondamentale che lo studente capisca il seguente fatto: se esiste un δ > 0 come nel punto (ii) del Teorema precedente, anche tutti i numeri positivi δ˜ < δ vanno bene. Nella pratica, questo significa che possiamo sempre considerare restrizioni come δ ≤ 1 quando verifichiamo un limite. In effetti, la dimostrazione di limite non pretende che si individui il migliore δ > 0 che verifichi le richieste. Per chiarire come si applica la definizione di limite, dimostriamo che per ogni a > 0 √ √ lim x = a. x→a √ √ Infatti,√consideriamo la quantità x − a; moltiplicando e dividendo per √ x + a si ottiene3 √ √ |x − a| a| x − a = √|x − √ < √ . x+ a a √ √ √ Fissato allora ε > 0, si avrà | x − a| < ε non appena x ≥ 0√e |x−a| < ε a; la relazione (ii) del Teorema sarà allora verificata con δ = ε a. Osserviamo che √ √vale anche per a = 0, con una diversa dimostrazione. Infatti, √ il risultato | x − 0| = x < ε non appena 0 ≤ x < ε2 . Basterà scegliere δ = ε2 . Lo studente ha certamente notato che il valore del limite altro non è che √ il valore assunto da √x quando x = a. Insomma, sarebbe bastato sostituire x = a nella funzione ·. Certamente non è un caso, e capiremo nel capitolo successivo tutte le ragioni di questa apparente coincidenza. Osservazione 5.4. Una definizione più generale di limite è la seguente. Sia f : E → R una funzione, definita sull’insieme E ⊂ R. Sia x0 è un punto di accumulazione di E; diciamo che lim f (x) = L

x→x0 x∈E

se, per ogni successione {xn } di elementi xn ∈ E, escluso al più x0 stesso, convergente a E, accade che limn→+∞ f (xn ) = L. Oppure, in maniera equivalente, se per ogni ε > 0 esiste δ > 0 tale che, per ogni x ∈ E ∩ ((x0 − δ, x0 + δ) \ {x0 }), accade che |f (x) − L| < ε. 3

Aumentando il denominatore, la frazione diminuisce. Poiché l’ultima disuguaglianza.



x+



a>



a, è valida

66

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Questa definizione si riduce alle precedenti quando E è un intervallo, e contiene automaticamente i limiti per x → ∞, ma in un corso elementare c’e’ il rischio che l’eleganza di questa definizione non venga apprezzata. Introduciamo ora i limiti all’infinito. corrispondenti definizioni.

Vediamo come si esprimono le

Definizione 5.5. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che limx→x0 f (x) = +∞ se per ogni K > 0 esiste δ > 0 tale che f (x) > K per ogni x ∈ (x0 − δ, x0 + δ). Definizione 5.6. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che limx→x0 f (x) = −∞ se per ogni K > 0 esiste δ > 0 tale che f (x) < −K per ogni x ∈ (x0 − δ, x0 + δ). Definizione 5.7. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra.4 Diremo che limx→+∞ f (x) = L ∈ R se per ogni ε > 0 esiste M > 0 tale che |f (x) − L| < ε per ogni x > M . Definizione 5.8. Sia f : (−∞, b) → R una funzione definita su un intervallo illimitato a sinistra.5 Diremo che limx→−∞ f (x) = L ∈ R se per ogni ε > 0 esiste M > 0 tale che |f (x) − L| < ε per ogni x < −M . Definizione 5.9. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra. Diremo che limx→+∞ f (x) = +∞ ∈ R se per ogni K > 0 esiste M > 0 tale che f (x) > K per ogni x > M . Definizione 5.10. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra. Diremo che limx→+∞ f (x) = −∞ ∈ R se per ogni K > 0 esiste M > 0 tale che f (x) < −K per ogni x > M . Ripetiamo che le definizioni scritte qui sopra non sono definizioni indipendenti dalla 5.1. Le abbiamo riportate solo per convenienza, ed invitiamo lo studente a formularle con il linguaggio della Definizione 5.1. Concludiamo con la definizione di limiti per eccesso e per difetto. Definizione 5.11. Sia f : (a, b) → R e sia x0 ∈ (a, b). Diremo che lim f (x) = L

x→x0 −

se per ogni ε > 0 esiste δ > 0 tale che |f (x) − L| < ε per ogni x ∈ (x0 − δ, x0 ). Analogamente, diremo che lim f (x) = L

x→x0 +

se per ogni ε > 0 esiste δ > 0 tale che |f (x)−L| < ε per ogni x ∈ (x0 , x0 +δ). 4 5

Ricordiamo che (a, +∞) = {x ∈ R | x > a}. Ricordiamo che (−∞, b) = {x ∈ R | x < b}.

5.2. TRADUZIONE DEI TEOREMI SULLE SUCCESSIONI

67

La differenza rispetto alla definizione completa di limite è che alla x è permesso di avvicinarsi a x0 solo per valori minori oppure maggiori di x0 stesso. La seguente proposizione afferma che una funzione ha limite se, e soltanto se, esistono finiti ed uguali i limiti da destra e da sinistra. Proposizione 5.12. Sia f : (a, b) → R e sia x0 ∈ (a, b). Sono equivalenti 1. limx→x0 f (x) = L 2. limx→x0 − f (x) = limx→x0 + f (x) = L. Dim. È chiaro che se il limite esiste, a maggior ragione esistono i due limiti direzionali, e coincidono con il valore del limite. Viceversa, supponiamo che i due limiti direzionali esistano e coincidano: sia L il valore comune di questi due limiti. Dalle definizioni, fissato ε > 0, esistono δ − > 0 e δ + > 0 tali che |f (x) − L| < ε se x0 − δ − < x < x0 e |f (x) − L| < ε se x0 < x < x0 + δ + . Definiamo δ = min{δ − , δ + }. Allora, qualunque sia x0 ∈ (x0 −δ, x0 +δ)\{x0 }, risulta |f (x) − L| < ε. Poiché ε > 0 è arbitrario, questo dimostra che limx→x0 f (x) = L. Osservazione 5.13. La precedente Proposizione è piuttosto intuitiva. Dopotutto, ci sono solo due modi di avvicinarsi ad un punto: da sinistra o da destra. E se il comportamento durante l’avvicinamento da sinistra coincide con il comportamento avvicinandosi da destra, è naturale credere che il limite debba esistere. Il discorso cambia radicalmente in dimensione maggiore o uguale a due. Già nel piano cartesiano, esistono infiniti modi di avvicinarsi ad un punto: lungo una retta, lungo una spirale, “saltando” da una parte all’altra, ecc. Questo fa presagire che lo studio dei limiti per funzioni di due o più variabili sia alquanto complicato, e che l’avvicinamento lungo direzioni privilegiate non basterà mai a descrivere interamente i limiti.

5.2

Traduzione dei teoremi sulle successioni

La Definizione 5.1 è come la chiave di un codice segreto: ci permette di tradurre nel linguaggio delle funzioni le proprietà dei limiti viste per le successioni.6 Ne enunciamo alcune, con l’avvertenza che si tratta solo di alcuni dei casi possibili per le funzioni. Per comodità, diamo gli enunciati per limiti al finito, ma enunciati corrispondenti valgono per i limiti all’infinito. 6

In questo senso, le successioni sono sufficienti a caratterizzare tutti i limiti delle funzioni reali di una variabile reale. Non si tratta di una banalità, visto che concettualmente i limiti di funzione diventano un caso speciale dei limiti di successione. Al fondo c’è una proprietà topologica di R che non abbiamo la possibilità di discutere in queste pagine.

68

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Teorema 5.14 (Unicità del limite). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se limx→x0 f (x) = L1 e limx→x0 f (x) = L2 , allora L1 = L2 . Teorema 5.15 (Limitatezza locale). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se esiste finito il limite limx→x0 f (x), allora f è localmente limitata vicino a x0 . Più esplicitamente, esiste un intorno I di x0 ed esiste un numero C > 0 tali che |f (x)| < C per ogni x ∈ I. Teorema 5.16. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se limx→x0 f (x) = L > 0, allora esiste un intorno U di x0 in cui f > 0. Se f ≥ 0 in un intorno di x0 e se esiste il limx→x0 f (x) = L, allora L ≥ 0. Teorema 5.17 (Due carabinieri). Siano f , g ed h tre funzioni definite in (a, b), e sia x0 ∈ [a, b]. Supponiamo che, per ogni x ∈ (a, b), risulti g(x) ≤ f (x) ≤ h(x). Se limx→x0 g(x) = limx→x0 h(x) = L, allora limx→x0 f (x) = L. Teorema 5.18. Sia f : (a, b) → R una funzione monotona (crescente oppure decrescente). (i) Se f è crescente, allora lim f (x) = sup f (x),

x→b−

x∈(a,b)

lim f (x) = inf f (x).

x→a+

x∈(a,b)

(ii) Se f è decrescente, allora lim f (x) = sup f (x),

x→a+

5.3

x∈(a,b)

lim f (x) = inf f (x).

x→b−

x∈(a,b)

Raccolta di limiti notevoli

Proposizione 5.19. Valono le seguenti relazioni di limite. sin x x→0 x 1 − cos x lim x→0 x2 tan x lim x→0 x lim (1 + x)1/x lim

x→0

= 1

(5.1)

1 2

(5.2)

= 1

(5.3)

= e

(5.4)

=

ex − 1 = 1 x→0 x log(1 + x) lim = 1 x→0 x lim

(5.5) (5.6)

5.3. RACCOLTA DI LIMITI NOTEVOLI

69

Q O

T P

Figura 5.1: Il limite notevole limx→0+

sin x x

=1

Dim. Il primo limite ha una dimostrazione dal sapore geometrico. Innazitutto, la funzione x 7→ sinx x è pari (lo studente lo verifichi secondo la definizione), e pertanto ci basterà dimostrare il limite notevole per x → 0+ . Sia x > 0 un angolo “piccolo”. Dalla definizione geometrica di sin x, discende che sin x ≤ x ≤ tan x.7 Nella figura 5.1, Q è il punto di intersezione fra la circonferenza e il segmento OT , x è la lunghezza dell’arco P Q, tan x quella del segmento T P . Invece sin x è la lunghezza del segmento che scende perpendicolarmente dal punto Q fino ad incontrare il segmento OP . Poiché sin x > 0 per 0 < x < π2 , possiamo dividere queste disuguaglianze per sin x e ottenere x 1 ≤ , 1≤ sin x cos x e il teorema dei due carabinieri garantisce che limx→0+ sinx x = 1. Il secondo limite notevole si ottiene dal primo: 1 − cos x (1 − cos x)(1 + cos x) 1 − cos2 x sin2 x = = = . x2 x2 (1 + cos x) x2 (1 + cos x) x2 (1 + cos x) 7

Si tratta di una dimostrazione in cui molto è lasciato all’intuizione geometrica, e dunque poco apprezzata dai bourbakisti.

70

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Quindi 1 − cos x lim = lim x→0 x→0 x2



sin x x

2 lim

x→0 x2 (1

1 1 = . + cos x) 2

sin x Il terzo limite è quasi ovvio, basta scrivere tan x = cos ed usare il primo x limite notevole. Il quarto limite è di solito usato come definizione del numero di Nepero e. Spesso lo si trova scritto nella forma equivalente

x  1 lim 1 + = e. x→±∞ x Gli ultimi due limiti, fra loro equivalenti (suggerimento: cambiare la variabile 1 + x = et ), possono essere dimostrati solo utilizzando la definizione della funzione esponenziale. Non avendo tempo di discutere la costruzione delle potenze reali con base reale, ci accontentiamo di sapere il valore dei limiti.

5.4

Continuità

È inutile sottolineare che non sempre una funzione ha limite. La funzione f : [0, 1] → R definita da ( 0, x ∈ Q f (x) = 1, x ∈ R \ Q non ha limite per x → 1. Infatti, ogni intorno di 1 contiene infiniti valori di x in cui f (x) = 0, e infiniti valori di x in cui f (x) = 1. 8 D’altronde, anche se il limite esiste, può non aver niente a che vedere con il valore della funzione in quel punto. Abbiamo proprio sottolineato che l’operazione di limite ignora per definizione il valore della funzione nel punto verso cui ci stiamo avvicinando. Definizione 5.20. Sia f : [a, b] → R una funzione reale di una variabile reale, e sia x0 ∈ [a, b]. Diciamo che f è continua nel punto x0 se per ogni ε > 0 esiste δ > 0 tale che |f (x)−f (x0 )| < ε per ogni x ∈ (x0 −δ, x0 +δ)∩[a, b]. Diremo che f è continua in [a, b] se è continua in ogni punto x0 ∈ [a, b]. 8

Sempre per lo studente più curioso, risulta lim inf x→1− f (x) = 0 < 1 = lim supx→1− f (x) e quindi il limite non esiste.

5.4. CONTINUITÀ

71

Confrontando questa definizione con quella di limite, abbiamo una caratterizzazione della continuità in termini di limiti.9 Teorema 5.21. Sia f : [a, b] → R una funzione reale di una variabile reale, e sia x0 ∈ [a, b]. La funzione f è continua in x0 se e solo se limx→x0 f (x) = f (x0 ). Corollario 5.22. Una funzione f è continua in un punto x0 appartenente al suo dominio se e solo se lim f (x) = lim f (x) = f (x0 ).

x→x0 −

x→x0 +

Dalle regole per il calcolo algebrico dei limiti, segue immediatamente che tutte polinomiali, cioè le funzione rappresentate da un polinomio PN le funzioni i i=1 ai x di qualsiasi grado N ≥ 1 sono continue in ogni punto di R. Infatti, la somma e il prodotto di funzioni continue sono continue. Sono inoltre continue praticamente tutte le funzioni elementari che lo studente conosce: seno, coseno, esponenziali, logaritmi. Osservazione. Capita spesso di sentir dire, anche da persone autorevoli, che la funzione x 7→ 1/x è discontinua nel punto x = 0. Ora, tale funzione non è definita in x = 0, ed è pertanto imbarazzante applicare la definizione di continuità in questo caso. Di solito, non si fanno affermazioni relative ad oggetti inesistenti. Per esempio, è vero o falso che i mandarini alati hanno quattro ruote motrici? È chiaro che questa discussione ha una natura filosofica: è lecito attribuire proprietà a ciò che non esiste? Io credo che non si possa parlare razionalmente del nulla, ma capisco anche l’altra posizione: il nulla non possiede alcuna proprietà, proprio perché è nulla. Quindi, una funzione non definita in un punto non possiede la continuità, e dunque è discontinua.10 9

Mentre la Definizione 5.20 ha validità generale, il teorema di caratterizzazione non può coprire una caso particolare: quello di una funzione come f : (0, 1) ∪ {2} → R. Ci chiediamo che cosa significhi dire che f è continua in x0 = 2. La Definizione 5.20 ci dice che nei fatti f è sempre continua in tale punto, qualunque “sia il valore di f (2). Mentre il teorema di caratterizzazione è privo di senso: non si può far avvicinare x a 2 restando nel dominio di f . In altri termini, non ha senso scrivere limx→2 f (x). Sembra che la definizione” di continuità proposta in [13, Definizione 7.1] risenta di questa scorrettezza. In ogni caso, per un corso come il nostro, il dominio delle funzioni non contiene punti isolati, ed il teorema di caratterizzazione contiene una condizione necessaria e sufficiente per la continuità. 10 Molti dei più celebri scienziati erano anche filosofi, e queste diatribe hanno a volte rallentato il progresso scientifico. Nelle scienze umane, la sovrapposizione fra progresso scientifico e insegnamento religioso ha generato molte pagine buie della storia del pensiero moderno. In questo senso, una disciplina astratta come la matematica ha sempre goduto di maggiore libertà.

72

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Torniamo al nostro programma. Abbiamo osservato che effettuando le quattro operazioni algebriche su funzioni continue, otteniamo ancora funzioni continue. Ma che accade se componiamo due funzioni continue? La risposta è che la composizione è ancora una funzione continua. A questo risultato premettiamo una Proposizione sul calcolo dei limiti. Proposizione 5.23 (Cambiamento di variabile nei limiti). Siano date due funzioni f : (a, b) → R e g : (c, d) → R, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se (i) g(y) → L per y → y0 , y ∈ (c, d); (ii) f (x) → y0 per x → x0 , x ∈ (a, b); (iii) o g(y0 ) = L o f (x) 6= y0 per ogni x 6= x0 allora limx→x0 g(f (x)) = L. Dim. Dimostriamo la Proposizione nel caso in cui valga la seconda alternativa in (iii). Fissiamo ε > 0. Per (i) esiste σ > 0 tale che se y ∈ (c, d), y 6= y0 , |y − y0 | < σ, allora |g(y) − L| < ε. D’altra parte se si ha f (x) ∈ (c, d), per la (iii) f (x) 6= y0 e per la (ii) esiste δ > 0 tale che se 0 < |x − x0 | < δ allora |f (x) − y0 | < σ. Dunque in definitiva se x ∈ (a, b) ∩ f −1 (c, d), x 6= x0 , |x − x0 | < δ, allora |g(f (x)) − L| < ε. Per l’arbitrarietà di ge > 0, la tesi è dimostrata. Lasciamo al lettore la dimostrazione, pi ù facile, nel caso in cui g(y0 ) = L. Notiamo che questo significa che g è continua in y0 . Un commento sulla Proposizione. Perché abbiamo dovuto introdurre l’alternativa in (iii)? La ragione sta tutta nella condizione “0 < |x − x0 | < δ” della definizione di limite. In altre parole, non ci interessiamo al valore della funzione nel punto. Quando facciamo la composizione g ◦ f e facciamo tendere x a x0 , per poter usare l’ipotesi (i) dobbiamo accertarci che y = f (x) 6= y0 . In caso contrario, potrebbe accadere un fenomeno bizzarro. Consideriamo la funzione costante f : x 7→ y0 , e la funzione ( 0, y 6= y0 g(y) = 1, y = y0 . Quindi, la funzione composta g ◦ f è la funzione costante che vale ovunque 1. Si ha f (x) → y0 per x → x0 , g(y) → 0 per y → y0 , ma nessuna delle alternative in (iii) è soddisfatta. E infatti limx→x0 g(f (x)) = 1 6= 0. Teorema 5.24. Siano f : (a, b) → R e g : (c, d) → R due funzioni, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se f è continua in x0 e se g è continua in y0 = f (x0 ), allora g ◦ f è continua in g(y0 ).

5.5. INFINITESIMI ED INFINITI EQUIVALENTI

73

Dim. Basta applicare la Proposizione precedente. Il problema della continuità della funzione inversa si pone in termini analoghi: data una funzione continua ed invertibile, è vero che la funzione inversa è continua? Nei limiti del nostro corso, la risposta è affermativa.11 Iniziamo da un’osservazione molto intuitiva. Omettiamo la dimostrazione rigorosa, ma invitiamo caldamente lo studente a convincersi con qualche disegno della verità di quanto affermato. Lemma 5.25. Sia f : (a, b) → R una funzione invertibile e continua in tutti i punti di (a, b). Allora f è strettamente monotona. L’idea che si nasconde dietro questo Lemma è la seguente: se f non fosse strettamente monotona, dovrebbe “andare un po’ su e un po’ giù”. Ad esempio, dovrebbe crescere e poi decrescere. Siccome f è continua, necessariamente esisterebbe una retta orizzontale che interseca il grafico di f in almeno due punti distinti. Ciò è in contraddizione con l’invertibilità di f . Ne segue che f o “va sempre su” o “va sempre giù”, cioè è strettamente monotona. Questo discorso non sostituisce una vera dimostrazione, ma possiamo dire che non servirebbe aggiungere molto per ottenerne una. Lo studente interessato troverà i dettagli in [11]. Teorema 5.26. Sia f : (a, b) → R una funzione strettamente monotona e continua in tutti i punti di (a, b). Allora l’inversa f −1 , definita sull’intervallo (c, d), c = inf{f (x) | x ∈ (a, b)}, d = sup{f (x) | x ∈ (a, b)}, è continua in tutti i punti di (c, d). Per brevità, nell’enunciato siamo stati un po’ imprecisi. Se f è strettamente decrescente, l’intervallo (c, d) ha un aspetto insolito, ad esempio (5, 3). In questo caso, lo studente deve pensare di scambiare i due estremi dell’intervallo, cioè deve prendere (d, c).

5.5

Infinitesimi ed infiniti equivalenti

Anche per le funzioni è possibile parlare di infinitesimi ed infiniti equivalenti. Dovrebbe essere chiaro, a questo punto, che le definizioni richiedono qualche sottigliezza. 11

Mentre il teorema di continuità delle funzioni composte è un teorema valido in generale, quello di continuità della funzione inversa non lo è. Se studiassimo funzioni definite su insiemi più “grandi” di R occorrerebbero ipotesi supplementari.

74

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Definizione 5.27. Siano f e g due funzioni, definite almeno in un intorno bucato (x0 − δ, x0 + δ) \ {x0 } di un punto x0 . Supponiamo che limx→x0 f (x) = limx→x0 g(x) = 0 (rispettivamente ∞). Diciamo che f e g sono infinitesimi (rispettivamente infiniti) equivalenti per x → x0 se lim

x→x0

f (x) = 1, g(x)

e scriviamo f g

per x → x0 .

Osservazione 5.28. È indispensabile specificare che l’equivalenza sussiste per x → x0 . Ad esempio f (x) = x(x−1)4 e g(x) = x(x−1)2 sono infinitesimi equivalenti per x → 0 ma non per x → 1. Osservazione 5.29. A costo di sembrare ottusi, ribadiamo con forza che il quoziente f (x)/g(x) deve tendere a 1: nessun altro numero permetterebbe la sostituzione degli infinitesimi ed infiniti equivalenti nel calcolo dei limiti (vedi sotto). Osservazione 5.30. Siamo stati pedanti nella definizione precedente, almeno nel caso degli infinitesimi. In effetti, avremmo potuto supporre addirittura che f e g fossero continue in x0 . Infatti, le funzioni ( f (x) se x 6= x0 f˜(x) = 0 se x = x0 e

( g(x) se x 6= x0 g˜(x) = 0 se x = x0

sono continue in x0 , e si verifica facilmente che f  g se e solo se f˜  g˜ per x → x0 . Nel caso degli inifiniti, è ovviamente insensato pretendere che f e g siano continue se entrambe divergono all’infinito. Osservazione 5.31. È chiaro che definizioni simili si possono dare per x → ±∞. Ovviamente, la due funzioni dovranno essere definite (almeno) in un intervallo del tipo (a, +∞) oppure (−∞, b). Ad esempio, f (x) = sin(1/x) e g(x) = 1/x sono infinitesimi equivalenti per x → +∞. Vale infine un criterio di sostituzione degli infinitesimi (e degli infiniti) equivalenti, che lo studente potrà ricostruire per esercizio a partire dall’analogo visto per le successioni (Proposizione 3.25).

5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE

75

Per convincere lo studente che il principio di sostituzione degli infinitesimi (ed infiniti) equivalenti non vale in ambito additivo, consideriamo il classico limite sin x − x lim . x→0 x3 Impareremo presto che tale limite vale −1/6. Ma questo conta poco: vogliamo invece mostrare che sbaglieremmo, se pensassimo di calcolarlo sostituendo sin x con x. Infatti, arriveremmo alla situazione assurda sin x − x x−x 0 = lim = lim 3 . 3 3 x→0 x→0 x x→0 x x lim

Ma perché stiamo sbagliando? Apparentemente, dovremmo concludere che il limite esiste e vale zero. Invece questo ragionamento non sta in piedi, e ce ne rendiamo conto se proviamo a capire i passaggi nascosti:  sin x x sinx x − 1 −1 x sinx x − x sin x − x x = lim = lim = lim , lim 3 3 3 2 x→0 x→0 x→0 x→0 x x x x e questo limite è ancora una forma di indecisione [0/0]. Insomma, possiamo dire un po’ paradossalmente, che il principio di sostituzione resta “quasi” vero, ma non serve a concludere!

5.6

Teoremi fondamentali per le funzioni continue

A parte le traduzioni dei teoremi sui limiti, le funzioni continue godono di proprietà peculiari, alcune abbastanza intuitive. Se lo studente torna con la memoria alle parole certamente pronunciate dal suo professore di matematica alle scuole superiori, “le funzioni continue sono quelle che si disegnano senza staccare la penna dal foglio”, gli sembrerà quasi ovvio che una funzione continua che parte negativa e arriva positiva debba necessariamente annullarsi. Teorema 5.32 (Teorema degli zeri). Sia f : [a, b] → R una funzione continua. Se f (a)f (b) < 0, allora esiste (almeno) un punto x0 ∈ (a, b) tale che f (x0 ) = 0. Dim. Supponiamo per comodità che f (a) < 0 e f (b) > 0. Il caso f (a) > 0 e f (b) < 0 è identico. Definiamo l’insieme E = {x ∈ [a, b] | f (x) < 0}.

76

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Ovviamente E contiene il punto a, ed è limitato dall’alto poiché b ∈ / E. Perciò esiste in R il numero x0 = sup E. Affermiamo che f (x0 ) = 0. Infatti se f (x0 ) < 0, evidentemente x0 < b. Inoltre per il teorema di permanenza del segno in un intervallo a destra di x0 f sarebbe negativa. Ci sarebbero dunque punti di E maggiori di x0 , e questo non è possibile perché x0 è l’estremo superiore di E. Se f (x0 ) > 0, allora x0 > a e di nuovo per la permanenza del segno ci sarebbe un intervallo sinistro (x0 − δ, x0 ) di x0 in cui f sarebbe strettamente positiva. I punti di E sarebbero allora tutti minori di x0 − δ, e dunque x0 ≤ x0 − δ, assurdo. Non resta che f (x0 ) = 0, e il teorema è dimostrato. Di questo, e di altri teoremi che vedremo, esiste una dimostrazione che fa uso delle successioni.12 È istruttivo presentarne le idee. Si prende a1 = a e b1 = b. Poi si calcola f nel punto mediano, cioè   a1 + b 1 . f 2 1 Se questo numero è negativo, si definisce a2 = a1 +b , altrimenti si definisce 2 a1 +b1 1 b2 = 2 . Supponiamo, per fissare le idee, che a2 = a1 +b . Si divide in 2 a2 +b1 due l’intervallo [a2 , b1 ] e si calcola f ( 2 ) Se troviamo un valore negativo, 1 1 definiamo a3 = a2 +b , altrimenti definiamo b2 = a2 +b . Facendo sempre 2 2 lo stesso tipo di ragionamento, si costruiscono due successioni {an } e {bn }, con la proprietà che f (an ) < 0 e f (bn ) > 0. Inoltre la prima successione è monotona crescente, mentre la seconda è monotona decrescente. Infine, poich é ogni volta abbiamo dimezzato l’intervallo precedente, risulta

0 ≤ bn − an ≤

b−a . 2n

(5.7)

Le successioni monotone limitate13 hanno limite, siano a∞ = lim an , n→+∞

b∞ = lim bn . n→+∞

La relazione (5.7) dice che a∞ = b∞ e il teorema della permanenza de segno dice che f (a∞ ) ≤ 0, mentre f (b∞ ) ≥ 0. Poiché questi numeri coincidono, dev’essere f (a∞ ) = 0. Abbiamo pertanto individuato un punto di [a, b] dove f si annulla. 12

Del teorema precedente esiste anche una dimostrazione molto elegante basata su argomenti topologici. Si veda [24]. 13 Ovviamente {an } e {bn } sono limitate, perché composte di punti dell’intervallo [a, b].

5.6. TEOREMI FONDAMENTALI PER LE FUNZIONI CONTINUE

77

Il metodo con cui abbiamo costruito a∞ = b∞ si chiama metodo di bisezione, ed è uno dei primi metodi per il calcolo approssimato delle soluzioni di equazioni del tipo f (x) = 0 con f funzione continua. Pur essendo indubbiamente efficace ed elegante, sono stati sviluppati metodi più veloci basati sul calcolo differenziale.14 Proponiamo un’interessante conseguenza del teorema degli zeri. Teorema 5.33 (Valori intermedi). Una funzione continua definita su un intervallo [a, b] assume tutti i valori compresi fra f (a) e f (b). Dim. Senza ledere la generalità del discorso, supponiamo f (a) ≤ f (b). Scegliamo y0 ∈ [f (a), f (b)] e dimostriamo che esiste x0 ∈ [a, b] tale che f (x0 ) = y0 . Se y0 = f (a), basta prendere x0 = a. Analogamente se y0 = f (b). Se f (a) < y0 < f (b), definiamo la funzione ausiliaria g(x) = f (x) − y0 . Ovviamente g : [a, b] → R è continua, e g(a) = f (a) − y0 < 0, g(b) = f (b) − y0 > 0. Per il teorema degli zeri, esiste x0 ∈ [a, b] tale che g(x0 ) = 0. Ma questo vuole dire che f (x0 ) = y0 . Il teorema è dimostrato. Osservazione 5.34. Come si legge in [13], per molti decenni i matematici hanno ritenuto che la continuità fosse del tutto equivalente alla proprietà dei valori intermedi. Più precisamente, essi pensavano che se una funzione soddisfa la proprietà dei valori intermedi in un certo intervallo [a, b], allora deve essere continua in [a, b]. Oggi sappiamo bene che questo è falso, come dimostra la funzione ( sin x1 , se x 6= 0 f (x) = 0, se x = 0. È facile vedere che, preso arbitrariamente y ∈ [−1, 1], esiste almeno un numero x ∈ R tale che sin x1 = y. 15 Tuttavia f presenta una discontinuità in x = 0. 14

Non insistiamo sul fatto che questi metodi funzionano solo per le funzioni del calcolo differenziale, mentre quelle continue sono indiscutibilmente più numerose. D’altra parte, molti problemi delle scienze applicate assumono tacitamente che tutte le quantità in gioco siano funzioni estremamente “addomesticate”. 15 Ad esempio x = 1/ arcsin y per y 6= 0. Il caso y = 0 è altrettanto facile.

78

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.7

Massimi e minimi

In tutte le scienze, pure ed applicate, si pone un problema che possiamo formulare in questi termini: massimizzare (o minimizzare) una certa quantità, a sua volta dipendente da altre quantità. Massimizzare il risparmio, minimizzare l’attrito, scegliere il percorso mi gliore per raggiungere un indirizzo: sono tutti esempi di ottimizzazione. Poiché il nostro corso ha carattere elementare, ci limiteremo ad alcune considerazioni relative alle funzioni reali di una variabile reale. Avvertiamo però lo studente che si tratta solo del primo approccio ad una teoria molto ricca e difficile, che è oggetto di ricerca attiva. Definizione 5.35. Sia f : A ⊂ R → R una funzione definita su un insieme A. Diremo che x0 ∈ A è un punto di minimo assoluto per f se f (x0 ) = inf f (x). x∈A

Analogamente diremo che x0 ∈ A è un punto di massimo assoluto per f se f (x0 ) = sup f (x). x∈A

In parole povere, x0 è un punto di minimo assoluto se f (x0 ) ≤ f (x) per ogni x ∈ A. Invece x0 è un punto di massimo assoluto se f (x0 ) ≥ f (x) per ogni x ∈ A. Ad esempio, se f (x) = x2 per ogni x ∈ R, è ovvio che 0 è un punto di minimo assoluto. Infatti, f (0) = 0 ≤ x2 = f (x) per ogni x ∈ R. Avvertenza. Capita molto spesso di commettere delle piccole inesattezze formali, parlando di massimi e minimi. Il più frequente è quello di dire “un minimo x0 ” invece di “un punto di minimo x0 ”. A rigor di logica, il minimo è il valore f (x0 ) della funzione nel punto di minimo. D’altra parte, una volta individuati i punti di massimo e minimo, è immediato calcolare il valore della funzione in tali punti. Questo spiega la tendenza a privilegiare la variabile indipendente rispetto a quella dipendente. Di solito, il contesto chiarisce da sé se si stia parlando di punti di minimo oppure di valori di minimo. Consideriamo ora la funzione x 7→ (1 − x2 )2 definita per ogni x reale. Essa è sempre maggiore o uguale a zero, e vale zero se e solo se x ∈ {−1, 1}. Quindi x = −1 e x = 1 sono gli unici due punti di minimo assoluti. Poiché limx→±∞ (1 − x2 )2 = +∞, la funzione non è limitata dall’alto, e non esistono punti di massimo assoluti. Però è intuitivo che la nostra funzione, nell’intervallo [−1, 1], deve avere dei valori maggiori di zero, e per simmetria rispetto all’asse delle ordinate in x = 0 c’è una “specie di massimo”.

5.7. MASSIMI E MINIMI

79

Definizione 5.36. Sia f : A ⊂ R → R una funzione definita su un insieme A. Diremo che x0 ∈ A è un punto di minimo relativo per f se esiste un intorno U di x0 tale che f (x0 ) ≤ f (x) per ogni x ∈ U ∩ A. Diremo che x0 ∈ A è un punto di massimo relativo per f se esiste un intorno U di x0 tale che f (x0 ) ≥ f (x) per ogni x ∈ U ∩ A. Quando si parla di punti di minimo o massimo relativi, si guarda in realtà la funzione solo “vicino” a tali punti, disinteressandosi completamente di quanto accade “lontano” da essi. Inutile sottolineare che un punto di minimo (o massimo) assoluto è anche un punto di minimo (o massimo) relativo. Non è però vero il viceversa. Torneremo su queste considerazioni nel capitolo della derivata. Ma la ricerca dei punti di massimo e di minimo è basata solo su considerazioni speciali, peculiari di volta in volta per la funzione in esame? Se così fosse, non esisterebbe nemmeno una teoria, ma solamente una raccolta di “trucchi”. Il teorema più famoso16 che fornisce una garanzia per l’esistenza di punti di massimo e minimo (assoluti) è dovuto al grande matematico tedesco C. Weierstrass.17 Teorema 5.37 (Weierstrass). Sia f : [a, b] → R una funzione continua, definita su un intervallo chiuso e limitato. Allora f possiede almeno un punto di minimo assoluto ed un punto di massimo assoluto. Dim. Presentiamo una tipica dimostrazione che usa le successioni ottimizzanti. Diamo i dettagli per l’esistenza del massimo assoluto, lasciando le ovvie modifiche allo studente per il caso del minimo. Sia M = supx∈[a,b] f (x). Se M = +∞, pe rle proprietà dell’estremo superiore, per ogni n ∈ N esiste xn ∈ [a, b] tale che f (xn ) > n, Dunque f (xn ) → +∞ per n → +∞. Se M ∈ R, per ogni n ∈ N esiste xn ∈ [a, b] tale che M−

1 < f (xn ) ≤ M n

e perciò f (xn ) → M per n → +∞. In ogni caso, esiste una successione {xn } di punti di [a, b] tale che limn→+∞ f (xn ) = M . 16 17

Talmente famoso da essere citato perfino in una pubblicità televisiva negli anni passati. Una pronuncia accettabile è vaierstrass.

80

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Per il Teorema 3.28, la successione {xn } possiede una sottosuccessione {xnk } convergente ad un punto x1 ∈ [a, b]. Siccome f è continua, f (xn ) → f (x0 ) per n → +∞. Ma allora M = lim f (xn ) = lim f (xnk ) = f (x1 ). n→+∞

k→+∞

Abbiamo così dimostrato che f (x1 ) = M = supx∈[a,b] f (x). Ciò implica che M ∈ R e che x1 è un punto di massimo assoluto per f . Di questo importantissimo teorema vogliamo presentare una seconda dimostrazione, basata sul metodo della bisezione. Seguiamo abbastanza fedelmente [13]. Dimostrazione alternativa. Dimostriamo ad esempio che f ha massimo assoluto. Detto S = supx∈[a,b] f (x), dividiamo l’intervallo I = [a, b] in due intervalli uguali, e siano S1 e S2 gli estremi superiori di f in questi due sottointervalli. Poiché I è l’unione di questi sottointervalli, necessariamente S = max{S1 , S2 }. Abbiamo così individuato un intervallo I1 = [a1 , b1 ] tale che supx∈[a1 ,b1 ] f (x) = S e b1 − a1 = (b − a)/2. Proseguendo allo stesso modo, troveremmo degli int ervalli In = [an , bn ] tali che In ⊂ In−1 , bn − an = (b − a)/2n , e supx∈[an ,bn ] f (x) = S per ogni n ≥ 1. La successione {an } è monotona crescente, e la successione {bn } è monotona decrescente. Siccome entrambe sono limitate, necessariamente sono dotate di limite finito. Inoltre, limn→+∞ bn = limn→+∞ an + (b − a) limn→+∞ 2−n = limn→+∞ an . Detto x0 ∈ [a, b] il valore comune dei due limiti, vogliamo dimos trare che f (x0 ) = S. Si ha ovviamente f (x0 ) ≤ S. Se fosse f (x0 ) < S, posto 2p = S − f (x0 ), si avrebbe f (x0 ) = S − 2p < S − p e dunque, per il teorema della permanenza del segno, esisterebbe un intorno J di x0 tale che f (x) < S −p per ogni x ∈ J. D’altra parte le successioni {an } e {bn } tendono a x0 , e quindi per n abbastanza grande sia an che bn cadranno in J, e dunque In = [an , bn ] ⊂ J. Ma allora si dovrebbe avere f (x) < S − p per ogni x ∈ In , il che è in contraddizione con il fatto che supx∈[an ,bn ] f (x) = S. Concludiamo che f (x0 ) = S, e per definizione ciò significa che x0 è un punto di massimo assoluto per la funzione f . Osservazione 5.38. Per gli studenti più curiosi, segnaliamo che la seconda dimostrazione è basata sulla forma del dominio di f , un intervallo chiuso e limitato. Il teorema di Weierstrass continua a valere per qualunque funzione continua definita su un insieme chiuso e limitato (ma non necessariamente un intervallo). La dimostrazione alternativa non può essere estesa a questo caso più generale, mentre la prima dimostrazione resta essenzialmente valida. Per capirci, una funzione continua definita sull’insieme (chiuso e limitato)

5.7. MASSIMI E MINIMI

81

A = {0} ∪ {1/n | n ∈ N, n ≥ 1} possiede almeno un punto di massimo ed un punto di minimo assoluti in A, ma non è chiaro come generalizzare l’idea della bisezione all’insieme “stravagante” A. Osserviamo che A è costituito dai punti della successione {1/n}n≥1 e dal limite 0 di tale successione. Più esplicitamente, questo teorema ci dice che, sotto le ipotesi fatte, esiste un punto x0 ∈ [a, b] di minimo assoluto per f , ed esiste un punto x1 ∈ [a, b] di massimo assoluto per f . Lo studente deve ricordare che il contenuto del Teorema di Weierstrass è tutto qui. Non si afferma nulla sul numero di punti di massimo o minimo, né sulla loro localizzazione nell’intervallo [a, b]. Potrebbero coincidere con gli estremi, potrebbero essere dieci, cento oppure mille. E, purtroppo, non dice come individuarli. In una giornata di pioggia, saremmo tentati di sostenere che allora è un teorema inutile. In tal caso, faremmo bene ad attendere una giornata di sole per schiarirci le idee. Il teorema appena enunciato ci dice che, sotto le ipotesi scritte, i punti di massimo e minimo assoluti esistono! Sarebbe una tortura dover cercare qualcosa che forse non esiste. Ci sarebbero studenti ormai decrepiti, ancora impegnati a controllare se una funzione ha massimi e minimi.18 Che le ipotesi del teorema di Weierstrass servano proprio tutte, si capisce dai prossimi esempi. Se il dominio della funzione non è un intervallo chiuso e limitato19 possono sorge problemi. Prendiamo la funzione f : x ∈ (0, 1] 7→ 1/x ∈ R. È continua sul suo dominio, ma non possiede massimo assoluto. Infatti supx∈(0,1] f (x) = +∞. Il dominio è un intervallo primo di uno degli estremi. Ma il teorema fallisce anche quando il dominio è un intervallo non limitato: f : x ∈ R 7→ ex ∈ R è una funzione continua, priva di massimo e di minimo assoluti. Infine, è evidente che la continuità sia fondamentale. Definiamo f : [−1, 1] 7→ R come ( |x|, x 6= 0 f (x) = 1, x = 0. Questa funzione ha due punti di massimo assoluti negli estremi −1 e 1. Ma non ha minimo assoluto. Infatti inf x∈[−1,1] f (x) = 0 ma non esiste nessun x0 ∈ [−1, 1] tale che f (x0 ) = 0. È chiaro che f non è continua in x = 0. 18

È un dato di fatto che questi studenti ci sono. Forse perché il perfido professore ha chiesto di studiare una funzione che non verifica le ipotesi del teorema di Weierstrass. La matematica è interessante soprattutto quando obbliga a usare strumenti non ordinari. 19 In realtà la formulazione generale del teorema di Weierstrass non si limita agli intervalli, ma non abbiamo le conoscenze per scendere nei particolari.

82

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

5.8

Punti di discontinuità

Definizione 5.39. Una funzione è discontinua in un punto appartenente al suo dominio di definizione, se non è continua in quel punto. Osservazione 5.40. La definizione precedente è opinabile. Ad esempio, tanti studenti sono fermamente convinti che la funzione x 7→ 1/(x − 2) sia discontinua nel punto x = 2. In base alla nostra definizione, la stessa funzione è continua in tutto il suo dominio di definizione. Chi ha ragione? In matematica la ragione sta sempre dalla parte di chi rispetta assiomi e definizioni. Quindi il problema si scarica sulla “giusta” definizione di punto di discontinuità. Quelli che pensano sia più corretto privilegiare l’idea di disegnare un grafico senza staccare la penna dal foglio, diranno sicuramente che c’è una discontinuità in x = 2. Quelli che pensano le funzioni come oggetti dotate inevitabilmente di un dominio di definizione, probabilmente penseranno che non ha senso parlare del comportamento di una funzione laddove non è nemmeno definita. Poiché la libertà di pensiero è sacra, ma per andare avanti dobbiamo scegliere da che parte stare, d’ora in poi converremo che i punti di discontinuità debbano appartenere al dominio di definizione. Pertanto, la nostra funzione x 7→ 1/(x − 2) sarà considerata continua in tutti i punti del suo campo di esistenza. Ma i punti di discontinuità sono tutti uguali? Riprendiamo l’enunciato del Corollario 5.22. In un punto di discontinuità può capitare solo un numero molto limitato di fenomeni. Ripetiamo, a costo di perdere la voce, che x0 deve appartenere al dominio di definizione di f . Un primo caso è quello dell’ultimo esempio della sezione precedente. La nostra funzione “vorrebbe” essere continua, però noi le imponiamo di non esserlo. Formalmente, ciò accade quando limx→x0 f (x) esiste finito, ma è diverso da f (x0 ). Si usa parlare di discontinuità eliminabile in x0 . Per quanto detto sopra, il punto x0 dovrebbe necessariamente appartenere al dominio di definizione della funzione f . Tuttavia, proprio per il fatto che ci accingiamo a definire opportunamente il valore f (x0 ), non è il caso di essere troppo rigidi. In pratica, se abbiamo una funzione fatta in modo che limx→x0 f (x) esiste finito, parliamo comunque di discontinuità eliminabile in x0 , senza neanche controllare see x0 appartenga oppure non appartenga al dominio di f . Basta infatti definire una nuova funzione ( f (x), x 6= x0 f˜(x) = limx→x0 f (x), x = x0 .

5.8. PUNTI DI DISCONTINUITÀ

83

Questa funzione coincide con f dappertutto, tranne in x0 . continua in x0 , poiché f˜(x0 ) = limx→x0 f˜(x) = limx→x0 f (x).20 Un secondo caso è quello di una funzione in cui

Inoltre f˜ è

lim f (x) 6= lim f (x),

x→x0 −

x→x0 +

pur essendo entrambi numeri reali. Il valore di f (x0 ) poco importa, non ci sono speranze che f sia continua in x0 . Intuitivamente, f “salta” dal valore limx→x0 − f (x) al valore limx→x0 + f (x). Si parla di discontinuità a salto in x0 . Infine, restano... tutti gli altri casi immaginabili. Ad esempio se almeno uno dei due limiti destro e sinistro è infinito, oppure se il limite limx→x0 f (x) non esiste, oppure se uno solo dei limiti destro e sinistro non esiste. Parleremo di discontinuità di terza specie, senza addentrarci in ulteriori classificazioni.

20

Uno studente spiritoso potrebbe sollevare la seguente obiezione: se è permesso cambiare la funzione, qualunque funzione diventa continua. È un po’ provocatorio, ma ha un fondo di verità: se iniziamo giocando a pallacanestro, non possiamo finire giocando a briscola.

84

CAPITOLO 5. LIMITI DI FUNZIONI E FUNZIONI CONTINUE

Capitolo 6 Il calcolo differenziale Siamo arrivati al cuore del nostro corso: introdurremo finalmente lo strumento principale per analizzare il comportamento di una funzione. Molti studenti universitari conoscono già la derivata e le sue applicazioni. Li invitiamo a non commettere uno degli errori più spiacevoli, quello di vivere di rendita sui ricordi liceali. Vedremo presto che a noi interessa esporre con rigore la teoria delle funzioni derivabili, mentre nelle scuole superiori c’è la comprensibile tendenza a nascondere sotto il tappeto le difficoltà e le patologie. Non tutte le funzioni sono derivabili, anzi la famiglia delle funzioni derivabili è una sparuta minoranza nell’universo delle funzioni continue.1

6.1

Variazioni infinitesime

Spiegare che cosa sia la derivata senza essere bourbakisti 2 non è un compito facile. 1

Questa frase non è una sciocchezza. Esistono strumenti matematici che “misurano” la percentuale di funzioni derivabili fra le funzioni continue. E il risultato, sorprendente sono per chi si avvicina all’ Analisi Matematica per la prima volta, è che le funzioni derivabili sono davvero poche. 2 Dal nome di Nicholas Bourbaki. È il nome collettivo di un gruppo di matematici francesi che, nel XX secolo, decisero di rifondare la matematica moderna da un punto di vista completamente deduttivo. Nei loro libri non si trovano spiegazioni discorsive, ma solo definizioni seguite da teoremi e corollari. È un approccio affascinante alla matematica, ma considerato da molti pedagogicamente disastroso. Chi scrive ha sempre considerato i libri pieni di grafici, figure e divagazioni varie piuttosto fuorvianti. Danno la sensazione ` più dura. Se a molti basta avere una percezione che tutto sia facile, mentre la realtà ben del proprio giardino, a molti altri farebbe comodo dare uno sguardo all’intera città. Le parabole sono funzioni continue, ma ci sembra più conveniente definire in astratto la continuità e poi applicarne i risultati alle parabole.

85

86

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

C’è chi ama parlare di rette tangenti, chi di velocità ed accelerazione. Per tutte queste motivazioni storico–filosofiche, rimandiamo lo studente ad uno dei testi citati in bibliografia. In ogni caso, l’idea innovativa in comune è quella di variazione infinitesima di una funzione. Ricordiamo che, data una funzione f : (a, b) → R, la variazione di f nel punto x0 ∈ (a, b) di incremento h è il rapporto f (x0 + h) − f (x0 ) ∆f (x0 , h) = . ∆x h Questo rapporto è ben definito quando |h| è sufficientemente piccolo, in modo che x0 + h ∈ (a, b). Ha allora senso domandarsi che cosa rappresenti il limite ∆f f (x0 + h) − f (x0 ) (x0 , h) = lim . h→0 ∆x h→0 h lim

Spesso questo limite non esiste nemmeno; se consideriamo il punto x0 = 0 e la funzione f (x) = |x|, allora f (x0 + h) − f (x0 ) |h| = lim = −1, h→0− h→0− h h lim

mentre

f (x0 + h) − f (x0 ) |h| = lim = 1, h→0+ h→0+ h h Per altre funzioni, tale limite esiste banalmente. Prendiamo le funzioni costanti: f (x) = q per ogni x reale. Allora lim

q−q f (x0 ) + h) − f (x0 ) = lim = 0, h→0 h→0 h h lim

qualunque sia x0 . Questo non ci soprende, dato che la variazione di una funzione costante non può che essere nulla, anche prima di prendere il limite per h → 0. Se invece f (x) = mx + q è una generica funzione lineare, calcoliamo f (x0 ) + h) − f (x0 ) [m(x0 + h) + q] − [mx0 + q] = lim = m. h→0 h→0 h h lim

La variazione infinitesima di una funzione lineare coincide in ogni punto con il coefficiente angolare m. Anche per la parabola f (x) = x2 si fanno i calcoli agevolmente: f (x0 ) + h) − f (x0 ) (x0 + h)2 − x20 = lim h→0 h→0 h h 2 x + 2x0 h + h2 − x20 = lim 0 h→0 h = lim 2x0 + h = 2x0 . lim

h→0

6.1. VARIAZIONI INFINITESIME

87

Per la funzione x 7→ x2 , la variazione infinitesima dipende esplicitamente dal punto x0 in ci la calcoliamo, e il risultato è 2x0 . Definizione 6.1. Sia f : (a, b) → R una funzione data, e sia x0 ∈ (a, b) un punto di (a, b). Chiamiamo derivata di f in x0 il numero f (x0 + h) − f (x0 ) , h→0 h

Df (x0 ) = lim

(6.1)

a patto che tale limite esista finito. Diremo che f è derivabile in x0 se esiste la derivata Df (x0 ). Altre notazioni di uso comune per la derivata sono df df 0 f (x0 ), (x0 ), , f˙(x0 ) dx dx x=x0 La prima è forse la più diffusa e popolare, la seconda e la terza sono dovute a Leibniz, mentre la quarta è dovuta ad I. Newton. Quest’ultima è ancora oggi la notazione preferita in Fisica e in Meccanica, dove la Seconda Legge di Newton ha la forma m¨ x = F. Avvertenza. La derivata è un’operazione che dipende dalla funzione f e dal punto x0 . In particolare, il nome della variabile indipendente non riveste aldf . Quella cun ruolo. Ecco perché non amiamo particolarmente la notazione dx x a denominatore ha un’evidenza che non le compete. Infatti, se usiamo una . Il grande vantaggio della scrittura come f (t) = t2 , dobbiamo scrivere df dt df notazione “frazionaria” dx è che permette di scrivere formule come d sin x = cos x. dx La notazione D(x 7→ sin x)(x) = cos x, per quanto logicamente più corretta, sembra improponibile. Lo studente è libero di scegliere la notazione preferita, con la consapevolezza che d sin x = cos t dt è una immane sciocchezza. L’importante è che, compiuta una scelta, ad essa ci si attenga con coerenza.

88

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Prima di procedere, osserviamo che la derivata è anche caratterizzata dall’uguaglianza f (x) − f (x0 ) . Df (x0 ) = lim x→x0 x − x0 Infatti, basta cambiare variabile: x = x0 + h e osservare che x → x0 se e solo se h → 0. Proposizione 6.2. Ogni funzione derivabile in un punto è anche continua in quel punto. Dim. Sia f derivabile in x0 . Allora f (x0 + h) − f (x0 ) · h = Df (x0 ) · 0 = 0. h→0 h

lim f (x0 + h) − f (x0 ) = lim

h→0

Quindi, ricordando l’osservazione che precede questa Proposizione, f (x0 ) = lim f (x), e la tesi è dimostrata. x→x0

Non soltanto esistono funzioni continue ma non derivabili in un singolo punto: Carl Weierstrass ha dimostrato il seguente, sorprendente, risultato. Teorema 6.3 (Weierstrass). È possibile costruire una funzione, definita in tutto R, che non è derivabile in alcun punto. Il bello è che la dimostrazione è costruttiva, cioè si può scrivere una formula che definisce tale funzione. Si tratta comunque di una definizione un po’ particolare, che richiede la conoscenza delle serie di funzioni. Una dimostrazione alternativa è contenuta in [21, Theorem 1.2, pag. 192], ma richiede un paio di pagine di calcoli! Vediamo adesso che la derivata identifica in modo univoco una retta che rappresenta la migliore approssimazione lineare di ogni funzione derivabile. Proposizione 6.4. Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b). Sono equivalenti: (i) f è derivabile in x0 ; (ii) f è continua in x0 , e la retta di equazione y = Df (x0 )(x − x0 ) + f (x0 ) approssima la funzione f localmente, nel senso che lim

x→x0

f (x) − (Df (x0 )(x − x0 ) + f (x0 )) = 0. x − x0

Lasciamo la dimostrazione per esercizio. La retta y = Df (x0 )(x − x0 ) + f (x0 ) si chiama retta tangente al grafico di f nel punto (x0 , f (x0 )).

6.2. IL CALCOLO DELLE DERIVATE

6.2

89

Il calcolo delle derivate

Quando p un esercizio chiede di calcolare la derivata della funzione f (x) = sin 5 1 + log(x − 2), di sicuro nessuno studente di buon senso cercherà di applicare la definizione di derivata. Esistono infatti alcune regole di derivazione, piuttosto facili da memorizzare, che ci aiutano a calcolare senza fatica le derivate di funzioni anche molto complicate. Teorema 6.5. Siano f e g due funzioni derivabili in un punto x0 . Sia c un numero reale. Allora le funzioni x 7→ f (x)+g(x), x 7→ f (x)g(x) e x 7→ cf (x) sono derivabili in x0 , e valgono le identià 1. D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ); 2. D(cf )(x0 ) = cDf (x0 ); 3. D(f g)(x0 ) = Df (x0 )g(x0 ) + f (x0 )Dg(x0 ) (regola di Leibniz). Infine, se Dg(x0 ) 6= 0, allora anche la funzione x 7→ f (x)/g(x) è derivabile in x0 , e vale l’identità   Df (x0 )g(x0 ) − f (x0 )Dg(x0 ) f . (x0 ) = D g (g(x0 ))2 Dim. Le prime due formule sono facilissime da dimostrare, e lasciamo i dettagli allo studente. La terza formula richiede il trucco di aggiungere e togliere una quantità opportuna. Facciamo il limite del rapporto incrementale per la funzione f g: f (x)g(x) − f (x0 )g(x0 ) x→x0 x − x0 f (x)g(x) − f (x0 )g(x) + f (x0 )g(x) − f (x0 )g(x0 ) = lim x→x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = lim g(x) − f (x0 ) x→x0 x − x0 x − x0 = Df (x0 )g(x0 ) + f (x0 )Dg(x0 ). lim

La dimostrazione della formula per la derivata del quoziente potrebbe essere fatta in modo analogo. Invece, dimostriamola innanzitutto nel caso f (x) = 1 per ogni x: lim

x→x0

1 g(x)



1 g(x0 )

x − x0

g(x0 ) − g(x) 1 x→x0 x − x0 g(x)g(x0 ) Dg(x0 ) = − . (g(x0 ))2

=

lim

90

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Osservando che, per ogni x risulta 1 f (x) = f (x) , g(x) g(x) possiamo applicare la regola per la derivata del prodotto e l’ultima formula, ottenendo la derivata del quoziente. Quindi, attenzione: la derivata della somma è la somma delle derivate, ma la derivata del prodotto è molto diversa dal prodotto delle derivate! Un’altra regola di derivazione riguarda le funzioni composte. Teorema 6.6 (Regola della catena). Siano f : (a, b) → R, g : (c, d) → R con f ((a, b)) ⊂ (c, d).3 Se f è derivabile in x e se g è derivabile in f (x), allora g ◦ f è derivabile in x e vale la relazione D(g ◦ f )(x) = Dg(f (x))Df (x). Dim. La funzione v : (c, d) → R data da ( v(y) =

g(y)−g(f (x)) , y−f (x)

se y 6= f (x)

Dg(f (x)),

se y = f (x)

è continua in f (x) perché g è per ipotesi derivabile in f (x). Inoltre per ogni h sufficientemente piccolo si può scrivere f (x + h) − f (x) g(f (x + h)) − g(f (x)) = v(f (x + h)) h h come si verifica subito distinguendo i due casi f (x + h) 6= f (x) e f (x + h) = f (x). Per h → 0 si ha f (x + h) → f (x), v(f (x + h)) → v(f (x)) = Dg(f (x)) per il teorema di continuità delle funzioni composte. Quindi g(f (x + h)) − g(f (x)) = Dg(f (x))Df (x), h→0 h lim

e il teorema è dimostrato. Osservazione 6.7. La precedente dimostrazione contiene in realtà una definizione equivalente di derivabilità per una funzione f , introdotta da Weierstrass. Una funzione f , definita almeno in un intorno del punto x0 , è derivabile in x0 se e solo se esiste una funzione continua ω tale che f (x) = f (x0 ) + ω(x)(x − x0 ), 3

per ogni x.

Questa condizione garantisce che la funzione g ◦ f abbia senso.

6.2. IL CALCOLO DELLE DERIVATE

91

Infatti, la funzione continua ω è univocamente individuata dalla formula ( f (x)−f (x0 ) , x 6= x0 x−x0 ω(x) = Df (x0 ), x = x0 . Leggendo fra le righe la dimostrazione del teorema precedente, lo studente osserverà che la funzion v gioca esattamente il ruolo di ω per la funzione g invece che per f . Usando la notazione “frazionaria” per le derivate, ponendo y = y(x),

w = w(y),

la regola di derivazione delle funzioni composte prende la forma suggestiva dw dy dw = . dx dy dx Lo studente avrà notato che la dimostrazione dell’ultimo teorema non è affatto scontata. Per spiegarne l’aspetto più delicato, introduciamo la notazione f (x + h) − f (x) ∆f = ∆x h per il rapporto incrementale. Scriviamo per semplicità y = f (x). Ora, non è vero che ∆(g ◦ f ) ∆g ∆y = . ∆x ∆y ∆x Il punto è che potremmo aver diviso per zero, operazione vietata in matematica. Nessuno può garantire che ∆y = f (x + h) − f (x) 6= 0, a meno di supporre che Df (x) 6= 0. Tuttavia, sarebbe assolutamente pretestuoso aggiungere questa ipotesi nel teorema, che infatti vale comunque.4 Per applicare la regola della catena, occorre imparare ad isolare gli “atomi” che compongono una funzione. Tutte le funzioni di questo corso sono solo somme, prodotti, quozienti e composizioni delle solite funzioni elementari. Per esempio x 7→ sin(1 + x) si decompone nella composizione x 7→ 1 + x 7→ sin(1 + x). 4

D’accordo, lo studente è libero di credere che si commetterebbe un peccato veniale. In matematica, purtroppo, le dimostrazioni sono giuste o sbagliate. Spiace comunque notare che parecchi libri di testo, sia per le scuole superiori che per l’università, propongono una dimostrazione sbagliata della regola della catena.

92

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Quindi d sin(1 + x) = cos(1 + x) · 1, dx poiché f (x) = 1 + x e g(y) = sin y. È molto utile ragionare come se fossimo una calcolatrice: ci viene fornito x, e su tale variabile facciamo delle operazioni. Nell’esempio, prima calcoliamo 1 + x, e poi calcoliamo il seno del risultato. Ecco dunque le due funzioni che compongono x 7→ sin(1 + x). Non c’è nulla di sbagliato in questo approccio, anche se presto si impara a raggruppare le operazioni più comuni. Se è vero che per la funzione x 7→ 3x + 2 si prende x, si trova 3x e p oi si trova 3x + 2, ben poche persone applicano la regola della catena a questa funzione. Più semplicemente, si nota che d d d (3x + 2) = (3x) + 2 = 3. dx dx dx Il risultato deve essere lo stesso, ma l’esperienza aiuta sempre a scegliere quale strada prendere per giungere rapidamente al traguardo. Esiste naturalmente una formula di derivazione della funzione inversa. Purtroppo, l’enunciato sembra più difficile di quanto non lo sia davvero. Teorema 6.8 (Derivata della funzione inversa). Sia f : (a, b) → (c, d) una funzione biunivoca e derivabile nel punto x0 ∈ (a, b). Allora la funzione inversa f −1 : (c, d) → (a, b) è derivabile nel punto y0 = f (x0 ) ∈ (c, d), e vale la relazione 1 Df −1 (y0 ) = . (6.2) Df (x0 ) Dim. La dimostrazione è diretta: siano y0 = f (x0 ) e k = f (x0 + h) − f (x0 ). Per la continuità della funzione inversa, k → 0 per h → 0. Quindi h f −1 (y0 + k) − f −1 (y0 ) = lim . h→0 f (x0 + h) − f (x0 ) k→0 k lim

Ma questa è esattamente la relazione (6.2). Illustriamo questo teorema con un esempio. Vogliamo calcolare la derivata della funzione logaritmo, definita da y ∈ (0, +∞) 7→ log y. È noto che questa è la funzione inversa della funzione f : x ∈ R 7→ ex , nel senso che log ex = x per ogni x ∈ R e elog y = y per ogni y > 0. Quindi stiamo calcolando la derivata di f −1 . Poiché Df (x0 ) = ex0 per ogni x0 reale, la regola del precedente teorema ci garantisce che , se y0 = ex0 , allora Df −1 (y0 ) =

1 . ex0

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE93 Quindi D log(y0 ) =

1 1 = , x 0 e y0

e questo vale per ogni y0 > 0. Abbiamo quindi trovato la derivata della funzione logaritmo, senza nemmeno scriverne il rapporto incrementale. Seguendo questo schema, si calcolano le derivate delle funzioni inverse di seno, coseno, tangente. Lo studente potrà ricavare le rispettive formule per esercizio, e troverà i dettagli nei testi citati in bibliografia.

6.3

I teoremi fondamentali del calcolo differenziale

Finora, l’introduzione della derivata non sembra questa gran rivoluzione. Si tratta di calcolare qualche limite di rapporti incrementali, usando di volta in volta un’accorgimento particolare. Invece sono svariate le applicazioni delle derivate all’analisi delle funzioni, e in questo paragrafo ce ne occuperemo dettagliatamente. Per prima cosa, può essere utile definire le derivate sinistra e destra in un punto. Definizione 6.9. Sia f : (a, b) → R una funzione continua, e sia x0 ∈ (a, b). Diciamo che f possiede derivata sinistra in x0 se esiste finito il limite f (x0 + h) − f (x0 ) . h→0− h lim

Analogamente, f possiede derivata destra in x0 se esiste finito il limite f (x0 + h) − f (x0 ) . h→0+ h lim

Proposizione 6.10. Una funzione f : (a, b) → R è derivabile nel punto x0 ∈ (a, b) se e solo se f ha derivata destra e derivata sinistra in x0 , e queste sono uguali fra loro. Dim. È una conseguenza immediata della Proposizione 5.12. Una prima applicazione di questo fatto è alle funzioni definite per “incollamento”.

94

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Teorema 6.11. Siano p : (a, b) → R e q : (a, b) → R due funzioni continue e derivabili. Sia x0 ∈ (a, b) un punto fissato. Definiamo la funzione f : (a, b) → R come ( p(x), x ∈ (a, x0 ) f (x) = q(x), x ∈ [x0 , b). Allora 1. f è continua in x0 se e solo se p(x0 ) = q(x0 ); 2. f è derivabile in x0 se e solo se p(x0 ) = q(x0 ) e Dp(x0 ) = Dq(x0 ). La dimostrazione è evidente. Sottolineiamo che la sola condizione Dp(x0 ) = Dq(x0 ) non è sufficiente a garantire la derivabilit à di f . Infatti le due funzioni p(x) = x e q(x) = x + 1 hanno la stessa derivata in x0 = 0, ma la funzione f costruita incollandole nell’origine ha un salto. Esempio. Applichiamo questa “ricetta” alla funzione f (x) = |x|. In effetti, in base alla definizione del valore assoluto, possiamo scrivere ( x, (x ≥ 0) f (x) = −x, (x < 0) e da ciò deduciamo che f non è derivabile in x0 = 0. Infatti l’incollamento è continuo in questo punto, ma la derivata di x differisce da quella di −x. In ogni altro punto x 6= 0, la derivata vale ( 1, (x ≥ 0) f (x) = −1, (x < 0). A volte si introduce la funzione segno sign : R \ {0} → R definita da sign x = x . Per esercizio, lo studente verifichi che f 0 (x) = sign x per ogni x 6= 0. |x| Il prossimo teorema, dovuto al matematico francese Fermat,5 è di fondamentale importanza nella ricerca di massimi e minimi di una data funzione. Teorema 6.12 (Fermat). Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b) un punto di massimo (o di minimo) relativo. Se f è derivabile in x0 , allora Df (x0 ) = 0. 5

Si pronuncia fermà.

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE95 Dim. Supponiamo che x0 sia un minimo relativo. Dunque, esiste un intorno [x0 − δ, x0 + δ] di x0 tale che f (x0 ) ≤ f (x) per ogni x di tale intorno. Sia h ∈ (−δ, δ), e costruiamo il rapporto incrementale di f in x0 : f (x0 + h) − f (x0 ) . h Poiché x0 + h ∈ [x0 − δ, x0 + δ], il numeratore è sempre maggiore o uguale a zero. Ne deduciamo che f (x0 + h) − f (x0 ) ≤ 0, h→0− h

Df (x0 ) = lim mentre

f (x0 + h) − f (x0 ) ≥ 0. h→0+ h Se un numero è simultaneamente ≤ 0 e ≥ 0, allora tale numero è 0. Il teorema è così dimostrato per i minimi relativi. Per i massimi relativi, si applicano le stesse considerazioni, e l’unica differenza è l’inversione delle ultime due disuguaglianze. Df (x0 ) = lim

Concretamente, il procedimento per individuare i punti di massimo e minimo relativi di una funzione assegnata è: isolo i punti dove f non è derivabile, e isolo gli (eventuali) estremi del dominio di definizione. Infine cerco gli zeri della derivata. Attenzione, il teorema di Fermat è falso se x0 cade in uno degli estremi di (a, b). Come esempio, sia f : x ∈ [0, 1] 7→ x. Il minimo assoluto è in x = 0, il massimo assoluto in x = 1. Però f 0 (x) 6= 0 per ogni x ∈ [0, 1]. Definizione 6.13. I punti critici di una funzione derivabile f sono i punti x tali che Df (x) = 0. Questa definizione non è superflua: non tutti gli zeri della derivata sono massimi oppure minimi. Se poniamo f (x) = x3 per ogni x ∈ R, troviamo facilmente l’unico zero della derivata prima, x = 0. Ora, se x > 0 allora x3 = f (x) > 0, mentre se x < 0 è x3 = f (x) < 0. Quindi, l’origine non è un minimo né un massimo per f , visto che in ogni intorno dell’origine cadono punto in cui f vale meno di 0 e punti in cui f vale più di 0. L’origine è dunque un punto critico di f che non sa ppiamo ancora descrivere bene.6 Infine, la funzione x 7→ |x| è un classico esempio di funzione con un punto di minimo assoluto (quale?) dove la derivata non esiste. Il prossimo teorema dà una 6

po’.

Qualche studente ricorderà che 0 è un punto di flesso per f , ma ci arriveremo fra un

96

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

condizione sufficiente affinché una funzione derivabile abbia almeno un punto critico. Invitiamo lo studente a convincersi con esempi che la condizione posta non è necessaria per l’esistenza di punti critici.7 Teorema 6.14 (Rolle). Sia f : [a, b] → R una funzione continua e derivabile in (a, b). Se f (a) = f (b), allora esiste ξ ∈ (a, b) tale che 8 Df (ξ) = 0. Dim. Per il teorema di Weierstraß la funzione f ha massimo e minimo (assoluti) in [a, b]. Siano xM un punto di massimo e xm un punto di minimo. Esistono solo due casi: 1. sia xm che xM cadono agli estremi dell’intervallo [a, b]. Poiché f assume (per ipotesi) lo stesso valore in questi due punti, il massimo assoluto di f coincide con il minimo assoluto, e pertanto la funzione è costante. La sua derivata è dunque sempre uguale a zero, e non c’è altro da dimostrare. 2. Uno almeno dei due punti xm e xM cade all’interno dell’intervallo [a, b]. Per il teorema di Fermat, in questo punto la derivata di f si annulla, e la dimostrazione è completa anche in questo caso. In ogni caso, abbiamo verificato che la derivata di f si annulla in almeno un punto di (a, b). Osservazione. Il precedente teorema inaugura la serie di enunciati in cui si tratta di funzioni continue su un intervallo chiuso [a, b] e derivabili nell’intervallo aperto (a, b). Non si tratta di un’inutile complicazione introdotta da qualche docente particolarmente cattivo, bensì di un’effettiva necessità. L’esistenza delle derivate nei punti a e b non è necessaria. Anzi, la dimostrazione del teorema di De l’Hospital richiede l’uso di questi teoremi esattamente come li abbiamo enunciati. Il Teorema di Fermat ci dice che i punti di massimo e di minimo si nascondono fra i punti critici. Ma esiste un modo per stabilire se un punto critico è un massimo, un minimo, o nessuno dei due? Ne esiste più di uno, e il modo più facile per capirlo è studiare la monotonia della funzione. Se essa cresce a sinistra del punto critico, e decresce dopo averlo superato, siamo inequivocabilmente in presenza di un massimo relativo. Simmilmente per i minimi relativi. Ma come si studia la monotonia di una f unzione? Se la funzione è derivabile, i metodi del calcolo differenziale ci sono utili. La chiave è un teorema celeberrimo. 7

Quello che vogliamo dire è: esistono funzioni dotate di punti critici, ma che non soddisfano l’ipotesi fondamentale del teorema di Rolle. 8 La lettera greca ξ si legge più o meno “csi”.

6.3. I TEOREMI FONDAMENTALI DEL CALCOLO DIFFERENZIALE97 Teorema 6.15 (del valor medio, o di Lagrange). Sia f : [a, b] → R una funzione continua e derivabile in (a, b). Allora esiste ξ ∈ (a, b) tale che Df (ξ) =

f (b) − f (a) . b−a

Dim. La tecnica dimostrativa consiste nell’applicare il teorema di Rolle a una funzione ausiliaria che ne verifica le ipotesi. A tale scopo, definiamo g : [a, b] → R mediante la formula g(x) = f (x) − f (a) −

f (b) − f (a) (x − a). b−a

In pratica, facciamo la differenza fra f e la retta che unisce gli estremi (a, f (a)) con (b, f (b)). È chiaro che g è continua in [a, b], derivabile in (a, b), e g(a) = g(b) = 0 Dunque g soddisfa le ipotesi del teorema di Rolle, sicché esiste ξ ∈ [a, b] dove Dg(ξ) = 0. Le regole di derivazione affermano che (a) , e la condizione Dg(ξ) = 0 si legge Dg(x) = Df (x) − f (b)−f b−a Df (ξ) =

f (b) − f (a) . b−a

Questo completa la dimostrazione del teorema. Osservazione 6.16. Applicando alla funzione f (x) = log x il teorema precedente, si dimostra la relazione di Nepero 1 log b − log a 1 < < b b−a a per ogni 0 < a < b. Lasciamo i dettagli (semplicissimi) allo studente. È frequente trovare il teorema di Lagrange come caso particolare di un altro teorema molto famoso, dovuto al matematico francese Louis Augustin Cauchy. Lo enunciamo e diamo solo uno spunto per completarne la dimostrazione. Teorema 6.17 (Cauchy). Siano f e g due funzioni continue su [a, b] e derivabili in (a, b). Suppponiamo inoltre che Dg(x) 6= 0 per ogni x ∈ (a, b). Allora esiste ξ ∈ [a, b] tale che f (b) − f (a) Df (ξ) = g(b) − g(a) Dg(ξ)

98

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Cenno della dimostrazione. Trovare un numero erale k tale che il teorema di Rolle sia applicabile alla funzione ausiliaria h(x) = f (x)−kg(x). Osserviamo che l’ipotesi Dg(x) 6= 0 per ogni x ∈ (a, b) implica in particolare g(b)−g(a) 6= 0. È una conseguenza del teorema di Rolle. Il teorema di Lagrange appare dunque come un caso particolare (per g : x 7→ x) del teorema precedente. Il fatto che le applicazioni del teorema di Lagrange siano molte più di quelle del teorema di Cauchy, ci ha indotti ad attribuirgli un’evidenza maggiore. Il prossimo risultato mostra che la derivata di una funzione (derivabile) non può avere salti. Teorema 6.18. Sia f : (a, b) → R una funzione derivabile. Se Df (a) < λ < Df (b), allora esiste ξ ∈ (a, b) tale che Df (ξ) = λ. Dim. Definiamo una funzione ausiliaria g : x ∈ (a, b) 7→ f (x) − λx. Per ogni x ∈ (a, b), è Dg(x) = Df (x) − λ. Inoltre Dg(a) < 0, Dg(b) > 0. Quindi g è decrescente in un intorno di a e crescente in un intorno di b. In particolare, esiste un punto di minimo ξ ∈ (a, b) per g. Per il teorema di Fermat, Dg(ξ) = 0, cioè Df (ξ) = λ.

6.4

Punti singolari

Sappiamo che una funzione derivabile in un punto deve essere ivi continua. Rovesciando logicamente questa affermazione, nessuna funzione è derivabile in un punto di discontinuità. Quindi la discontinuità è la causa più “rozza” di perdita di derivabilità. D’altronde, abbiamo già imparato che la funzione x 7→ |x| è continua ovunque ma non è derivabile in 0. Definizione 6.19. I punti singolari di una funzione sono quelli in cui la funzione è continua ma non derivabile. Elenchiamo due tipi di punti singolari. 1. I punti angolosi. Sono quelli in cui la derivata destra e la derivata sinistra esistono, ma non coincidono. La funzione del valore assoluto ne è un esempio. 2. Le cuspidi. Sono quelli in cui almeno una fra la derivata destra e la 9 derivata p sinistra è infinita. Il punto 0 è una cuspide per la funzione x 7→ |x|. 9

Il linguaggio è comprensibile ma impreciso. Una derivata non può essere infinita, in base alle nostre definizioni. Qui intendiamo piuttosto dire che una delle due derivate destra o sinistra non esiste proprio perché il corrispondente limite del rapporto incrementale è infinito.

6.5. APPLICAZIONI ALLO STUDIO DELLE FUNZIONI

99

Nei vari testi consultati, esistono piccole differenze nella classificazione dei punti singolari. In particolare, molti libri chiamano cuspide solo un punto singolare in cui sono infinite sia la derivata sinistra che quella destra. Poi, però, non attribuiscono alcun nome al punto singolare in cui solo una di tali derivate è infinita. Fortunatamente, non sembrano esserci divergenze sulla definizione dei punti angolosi.

6.5

Applicazioni allo studio delle funzioni

Teorema 6.20. Sia f : (a, b) → R una funzione derivabile. 1. Se f è monotona crescente (risp. decrescente) allora Df (x) ≥ 0 (risp. Df (x) ≤ 0) per ogni x ∈ (a, b). 2. Se Df (x) ≥ 0 (risp. Df (x) ≤ 0) per ogni x ∈ (a, b), allora f è monotona crescente (risp. decrescente). 3. Se Df (x) > 0 (risp. Df (x) < 0) per ogni x ∈ (a, b), allora f è strettamente crescente (risp. strettamente decrescente). Dim. La prima affermazione discende dal teorema della permanenza del segno applicato al rapporto incrementale. Le altre affermazioni sono conseguenza del teorema di Lagrange. Fissati arbitrariamente x1 < x2 in (a, b), esiste un punto ξ ∈ (x1 , x2 ) tale che f (x2 ) − f (x1 ) = Df (ξ)(x2 − x1 ). Quindi il segno di f (x2 ) − f (x1 ) è individuato dal segno di Df (ξ). Iil teorema precedente fornisce una regola per decifrare la monotonia di una funzione derivabile. Salvo qualche cautela sulla monotonia stretta, occorre identificare gli intervalli dove la derivata è positiva: in tali intervalli, la funzione cresce. La funzione invece decresce negli intervalli dove la derivata è negativa. Una seconda applicazione del teorema di Lagrange riguarda la derivabilità stessa. Supponiamo che una certa funzione sia continua in (a, b) e derivabile in tutti i punti dell’intervallo eccettuato al più un punto x0 . Come si fa a decidere se la funzione è derivabile anche in x0 ? Si può pensare di ricorrere alla definizione, scrivendo il rapporto incrementale centrato in x0 e facendo tendere a zero l’incremento. Oppure si può usare il seguente criterio. Proposizione 6.21. Sia f : (a, b) → R una funzione continua. Sia x0 ∈ (a, b) un punto, e supponiamo che f sia derivabile in (a, x0 ) ∪ (x0 , b). Se esiste finito λ = limx→x0 Df (x0 ), allora f è derivabile in x0 e Df (x0 ) = λ.

100

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Dim. Sia x ∈ (a, b), x 6= x0 . Per il teorema di Lagrange, esiste ξ = ξ(x) tale che f (x) − f (x0 ) = Df (ξ)(x − x0 ). Ovviamente, siccome ξ ∈ (x0 , x), si avrà ξ → x0 per x → x0 . L’ipotesi della Proposizione garantisce allora che lim

x→x0

f (x) − f (x0 ) = lim Df (ξ) = λ. x→x0 x − x0

Perciò f è derivabile in x0 , e Df (x0 ) = λ. Occorre però fare attenzione, perché il criterio della Proposizione precedente è sufficiente ma non necessario per l’esistenza della derivata in x0 .10 Consideriamo infatti la funzione ( x2 sin(1/x) x 6= 0 f (x) = 0 x = 0. Poiché

1 0 ≤ |f (x)| = x sin ≤ x2 → 0 x 2

per x → 0, f è continua un x = 0. Inoltre f (x) − f (0) 1 = lim x sin = 0. x→0 x→0 x−0 x lim

Dunque Df (0) = 0. Se x 6= 0, la derivata vale Df (x) = 2x sin

1 1 − cos , x x

che non ha limite per x → 0. La Proposizione non è perciò applicabile, mentre la derivata di f in 0 esiste.11 Osservazione 6.22. Se riflettiamo un istante sull’enunciato della Proposizione, ci accorgiamo che la sua tesi va oltre la mera esistenza della derivata in x0 . In realtà, le ipotesi ci permettono di concludere che la funzione derivata f 0 è continua in x0 : limx→x0 f 0 (x) = λ = f 0 (x0 ). Nei controesempi appena discussi, è chiaro che la derivata risultava sempre discontinua in x0 . 10

In parole povere, se il criterio si applica allora la funzione è derivabile; se il criterio fallisce, non siamo autorizzati a trarre alcuna conclusione. Invito lo studente a fare molta attenzione. 11 L’accanimento con cui presentiamo controesempi non deve indurre lo studente a pensare che tutti i teoremi siano “deboli”. Piuttosto, vogliamo evidenziare l’ottimalità delle ipotesi.

6.6. DERIVATE SUCCESSIVE

6.6

101

Derivate successive

Se una funzione f : (a, b) → R è derivabile in (a, b), la funzione x ∈ (a, b) 7→ Df (x) definisce una funzione reale di una variabile reale, che chiamiamo naturalmente funzione derivata di f . Definizione 6.23. Diremo che la funzione f è derivabile due volte nel punto x0 ∈ (a, b) se la funzione derivata di f è derivabile a sua volta in x0 . La derivata seconda di f in x0 è denotata con uno dei simboli 2

D f (x0 ),

00

f (x0 ),

d2 f (x0 ), dx2

f¨(x0 ).

Evidentemente, è possibile iterare il ragionamento precedente, e parlare così di derivata terza, quarta, ecc. In generale, per indicare la derivata n– esima si usano i simboli Dn f (x0 ),

f (n) (x0 ),

dn f (x0 ). dxn

Impareremo presto ad usare uno strumento, il polinomio di Taylor, in cui le derivate successive rivestono un ruolo di fondamentale importanza. Nel resto di questo paragrafo, ci concentreremo sulla derivata seconda, l’ultima ad avere qualche interpretazione geometrica degno di nota. Prima però dobbiamo introdurre una definizione. Definizione 6.24. Sia f : (a, b) → R una funzione. Si dice che f è convessa in (a, b) se, per ogni x1 , x2 ∈ (a, b) e per ogni λ ∈ [0, 1], risulta f ((1 − λ)x1 + λx2 ) ≤ (1 − λ)f (x1 ) + λf (x2 ).

(6.3)

Si dice invece che f è concava in (a, b) se la funzione −f , che agisce come x 7→ −f (x), è convessa. Posto x = (1−λ)x1 +λx2 , la disuguaglianza di convessità si può riscrivere come f (x2 ) − f (x1 ) (x − x1 ), x ∈ [x1 , x2 ]. f (x) ≤ f (x1 ) + x2 − x1 Essa quindi equivale all’affermazione geometrica: per ogni x1 , x2 con x1 < x2 , il grafico di f in [x1 , x2 ] sta al di sotto della corda per i punti (x1 , f (x1 )), (x2 , f (x2 )). Immaginiamo che lo studente sia stato introdotto, seppure brevemente, alla convessità durante le scuole superiori. Quasi certamente gli sarà stato insegnato un linguaggio un po’ diverso: invece di funzione convessa,

102

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Figura 6.1: Una tipica funzione convessa

Figura 6.2: Una tipica funzione concava

6.6. DERIVATE SUCCESSIVE

103

funzione che volge la concavità verso l’alto. Pur sentendoci in grado di affermare che “convessità” è l’unica denominazione in voga nella matematica contemporanea, poco importano i nomi e gli aggettivi. Osservazione. Come visto, per noi la definizione di funzione convessa è di natura globale, e non daremo un significato a frasi quali “la funzione è convessa in un punto”. Un altro punto sul quale condividiamo le perplessità dello studente è l’applicabilità della disuguaglianza di convessità. Se, per esempio, non è difficile dimostrare con tale definizione che la funzione x 7→ x2 è convessa in tutto R, per funzioni più complicate risulta impossibile gestire elementarmente le disuguaglianze. Occorrono dunque dei criteri, cioè delle condizioni atte ad assicurare la convessità di una data funzione mediante test maneggevoli. Eccone uno. Proposizione 6.25. Sia f : [a, b] → R una funzione derivabile. Sono equivalenti: (i) f è convessa. (ii) La funzione x 7→ Df (x) è monotona crescente in (a, b). (iii) Il grafico di f è sopra tutte le sue tangenti, cioè per ogni x, x0 ∈ [a, b] f (x) ≥ f (x0 ) + Df (x0 )(x − x0 ). La caratterizzazione più utile è l’equivalenza di (i) e (ii). La convessità di una funzione derivabile equivale in tutto e per tutto alla monotonia della sua derivata prima. Siccome sappiamo che la monotonia di una funzione si riflette nel segno della derivata della funzione, abbiamo il seguente criterio di convessità per le funzioni derivabili due volte. Proposizione 6.26. Sia f : (a, b) → R una funzione derivabile due volte. Sono equivalenti: (i) f è convessa. (ii) D2 f (x) ≥ 0 per ogni x ∈ (a, b). Definizione 6.27. Sia f : (a, b) → R una funzione. Diremo che x0 ∈ (a, b) è un punto di flesso per f se f è convessa in (a, x0 ) e concava in (x0 , b), o viceversa.

104

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

In altre parole, in un punto di flesso la retta tangente al grafico di f , se esiste, attraversa tale grafico. Vogliamo invece sfatare un mito assai diffuso. Non tutti gli zeri della derivata seconda sono punti di flesso. Sia f : x 7→ x4 . Si ha D2 f (0) = 0, ma 0 è evidentemente un punto di minimo assoluto per f . Vale per ò il seguente teorema. Teorema 6.28. Una funzione f derivabile due volte e dotata di un punto di flesso in x0 , deve verificare D2 f (x0 ) = 0. Dim. Infatti, f deve essere convessa a sinistra di x0 e concava a destra di x0 (o viceversa). Pertanto la derivata prima di f cambia il senso di monotonia attraversando il punto x0 . Questo implica che x0 è un punto di massimo (o di minimo) per Df . Il teorema di Fermat garantisce allora che D(Df )(x0 ) = D2 f (x0 ) = 0. Osservazione 6.29. Non è facile trovare in letteratura una definizione definitiva di punto di flesso. Il motivo è che si tratta di un’idea tipica per le funzioni di una variabile. Volendo generalizzare la convessità a funzioni di un numero maggiore di variabili, ci si imbatte nel problema seguente: mentre un punto spezza l’asse reale R in due parti, un punto nello spazio (per esempio tridimensionale, cioè quello in cui viviamo) non suddivide lo spazio stesso in parti disgiunte. Non sembra dunque ragionevole parlare di punti di flesso per funzioni di due, tre o più variabili. Concludiamo questa sezione con qualche altra proprietà delle funzioni convesse. Lemma 6.30 (Disuguaglianza di Jensen, caso discreto). Supponiamo che f sia una funzione convessa definita in un intervallo I. Allora f (α1 x1 + . . . + αn xn ) ≤ α1 f (x1 ) + . . . + αn f (xn ) per ogni n ∈ N, x1 , . . . , xn ∈ I, α1 , . . . , αn ≥ 0 con α1 + . . . αn = 1. Corollario 6.31. Supponiamo che f sia una funzione convessa definita in un intervallo I. Allora   α1 f (x1 ) + . . . + αn f (xn ) α1 x1 + . . . + αn xn ≤ , f α1 + . . . αn α1 + . . . αn per ogni x1 , . . . , xn ∈ I, α1 , . . . , αn > 0. Corollario 6.32. Fissiamo arbitrariamente n ∈ N, ed n punti xi > 0, per i = 1, . . . , n. Siano poi αi ≥ 0, per i = 1, . . . n, n numeri reali non negativi tali che α1 + . . . + αn = 1. Allora xα1 1 xα2 2 · · · xαnn ≤ α1 x1 + . . . + αn xn .

6.7. CLASSI DI REGOLARITÀ

105

Osservazione 6.33. Se scegliamo α1 = α2 = . . . = αn = 1/n nel precedente corollario, otteniamo la nota relazione fra la media algebrica e media aritmetica di n numeri reali positivi: √ x1 + . . . + x n n x1 x2 · · · xn ≤ . n Definizione 6.34. Sia I un intervallo della retta reale, e sia f : I → R una funzione. Diremo che f è Jensen–convessa se   f (x) + f (y) x+y ≤ f 2 2 per ogni x, y ∈ I. Ovviamente, tutte le funzioni convesse son oanche Jensen–convesse. Il viceversa è in generale falso, ma diventa vero limitatamente alle funzioni continue. Proposizione 6.35. Ogni funzione Jensen–convessa e continua in un intervallo I è convessa in I. Dim. Si veda, ad esempio, [21, Proposition 6.3].

6.7

Classi di regolarità

Per abbreviare alcuni enunciati, conviene introdurre una terminologia progressiva per la regolarità di una funzione. Vorremmo assegnare alla continuità il grado di regolarità più basso, per poi passare alla derivabilità una, due, tre, o più volte. Definizione 6.36. Sia f : (a, b) → R una funzione. Diremo che f è di classe C k (a, b), e scriveremo f ∈ C k (a, b), se f possiede k derivate in ogni punto di (a, b), e se queste derivate sono tutte funzioni continue in (a, b). Per estensione, diremo che f è di classe C ∞ (a, b), se f possiede derivate di ordine arbitrariamente alto in (a, b). Convenzionalmente, una funzione di classe C 0 (a, b) è semplicemente una funzione continua in (a, b). Una funzione di classe C 1 (a, b) è una funzione che possiede una derivata continua in (a, b). Invitiamo lo studente a prestare attenzione alla richiesta di continuità per tutte le derivate coinvolte. Potrebbe infatti accadere che una funzione sia derivabile, ma che la derivata abbia una discontinuità: in questo caso non possiamo attribuire la regolarità C 1 . Per dare qualche esempio, tutti i polinomi sono di classe C ∞ (R), così come la funzione esponenziale, il seno e il coseno. Nei fatti, praticamente tutte le funzioni elementari sono di classe C ∞ nel loro dominio di definizione.

106

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

6.8

Grafici di funzioni

Abbiamo ormai tutti gli strumenti per effettuare uno studio qualitativo del grafico di una funzione. Sappiamo che, in buona sostanza, il segno della derivata prima è un indicatore della monotonia, mentre il segno della derivata seconda descrive la convessità. Per avere un grafico rappresentativo di una funzione, conviene mettere in risalto gli eventuali asintoti. Nella sostanza, un asintoto è semplicemente una retta verso la quale il grafico di una funzione si avvicina indefinitamente. Piuttosto che affrontare una difficile definizione unitaria di asintoto, preferiamo presentare tre definizioni. Sebbene la terza possa inglobare la seconda con poco sforzo, è didatticamente consigliabile tenerle separate. Definizione 6.37. Sia f una funzione reale di variabile reale, definita almeno su un intervallo (a, b). La retta di equazione x = a è un asintoto verticale destro per f se limx→a+ f (x) = ±∞. Similmente, la retta x = b è un asintoto verticale sinistro se limx→b− f (x) = ±∞. Nulla impedisce che una retta x = c sia simultaneamente un asintoto verticale sinistro e destro. Ovviamente, la funzione f deve essere definita almeno in un intorno di c, escluso al più {c}. Definizione 6.38. Sia f una funzione definita almeno su un intervallo illimitato (a, +∞). La retta di equazione y = q è un asintoto orizzontale destro se limx→+∞ f (x) = q. Analogamente, se f è definita almeno su un intervallo illimitato (−∞, a), la retta y = q è un asintoto orizzontale sinistro se limx→−∞ f (x) = q. Meno ovvia è la definizione di asintoto obliquo, e soprattutto è meno immediato capire se una funzione ammetta asintoti obliqui. Definizione 6.39. Sia f una funzione definita almeno su un intervallo illimitato (a, +∞). La retta di equazione y = mx + q, m 6= 0, è un asintoto obliquo per x → +∞ se limx→+∞ |f (x) − (mx + q)| = 0. Analogamente, possiamo definire un asintoto obliquo per x → −∞. In primo luogo, osserviamo che una condizione necessaria affinché una funzione f abbia un asintoto obliquo (diciamo per x → +∞) è che lim f (x) = ±∞.

x→+∞

Questo è chiaro: se y = mx + q è un asintoto obliquo, allora lim f (x) = lim f (x) − mx − q + mx + q = lim mx + q = ±∞.

x→+∞

x→+∞

x→+∞

6.8. GRAFICI DI FUNZIONI

107

Vediamo come calcolare i coefficienti m e q di un asintoto obliquo. limx→+∞ |f (x) − (mx + q)| = 0, a maggior ragione   q f (x) −m− = 0. lim x x→+∞ x x

Se

Quindi la parentesi deve tendere a zero, e f (x) . (6.4) x→+∞ x Ora che abbiamo trovato il coefficiente angolare m, dalla definizione stessa di asintoto obliquo deduciamo m = lim

q = lim f (x) − mx. x→+∞

(6.5)

Non c’è bisogno di dire che considerazioni del tutto analoghe devono essere fatte per gli asintoti obliqui per x → −∞. Evidenziamo poi che abbiamo sempre supposto m 6= 0. Da un lato, il caso m = 0 corrisponde all’asintoto orizzontale. Dall’altro, se la relazione (6.4) fornisce m = 0, non è corretto √ affermare che esiste un asintoto orizzontale. Ad esempio, la funzione x 7→ x non ha asintoti per x → +∞, eppure m = 0. Da ultimo, una stessa funzione può presentare due asintoti obliqui distinti, il primo per x → −∞ e il secondo per x → +∞. Dunque le formule (6.4) e (6.5) devono essere applicate sia per x → +∞ che per x → −∞, senza alcuna possibilità di fare economia sui calcoli.12 Riassumendo, studiare l’andamento di una funzione è un esercizio che possiamo suddividere in vari passi. In particolare, lo studente potrà seguire questo schema. • Identificare eventuali simmetrie, anche in senso lato, o periodicità della funzione, così come le zone in cui la funzione è continua, derivabile, ecc. • Studiare l’andamento asintotico della funzione vicino ai punti estremi del dominio di definizione. Questo comprende anche il calcolo dei limiti all’infinito, e l’individuazione degli asintoti. • Identificare il segno della derivata prima, cioè le zone in cui f è monotona, e i punti critici. Determinare la natura degli eventuali punti critici, e, quando possibile, studiare il segno della derivata seconda per definire le regioni di convessità e gli eventuali punti di flesso. 12

Lo studente non prenda questa affermazione come un’accusa di scarsa volontà. In un corso non specialistico come il nostro, buona parte degli esercizi consiste nel fare conti. Prafrasando Pasolini, “calcolare stanca”, ma è anche l’unico modo per verificare se lo studente sa usare le idee presentate a lezione.

108

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

• Studiare gli eventuali punti singolari. • Disegnare il grafico cartesiano della funzione, avendo cura di dare risalto alle conclusioni ottenute con l’analisi dei punti precedenti.

6.9

Il teorema di De l’Hospital

La collocazione di questo paragrafo può sembrare bizzarra, dal momento che è consuetudine introdurre il Teorema di De l’Hospital subito dopo il teorema del valor medio. Inoltre, averlo a disposizione prima di affrontare lo studio del grafico di una funzione è di grande aiuto in determinate circostanze. Abbiamo preferito collocarlo in coda ai teoremi fondamentali del calcolo differenziale per due ragioni: la prima è che questa scelta porta diritti a parlare del polinomio di Taylor. La seconda è che tanto più un teorema è utile per gli esercizi, tanto più lo studente tende ad abusarne. Alcuni fra gli errori più grossolani negli elaborati d’esame riguardano esattamente questo teorema. Certo, il docente spesso contribuisce a seminare “trappole” negli esercizi; ma anche questo è il suo lavoro. Per ragioni pedagogiche, scindiamo l’enunciato in due teoremi piuttosto simili. Il primo enunciato copre la situazione [0/0], e il secondo la situazione [qualunque cosa/∞].13 Teorema 6.40 (Prima parte). Siano f : (a, b) → R e g : (a, b) → R due funzioni derivabili. Supponiamo che (i) limx→a+ f (x) = limx→a+ g(x) = 0; (ii) Dg(x) 6= 0 per ogni x ∈ (a, b); Se

Df (x) = L, Dg(x) ammettendo anche la possibilità che L = ±∞, allora lim

x→a+

f (x) = L. x→a+ g(x) lim

Dim. Sia q > L un numero arbitrariamente vicino a L, e scegliamo r ∈ R tale che L < r < q. Per l’ipotesi sul limite del quoziente delle derivate, esiste c ∈ (a, b) tale che Df (x)
Questa simbologia è tratta da [10].

6.9. IL TEOREMA DI DE L’HOSPITAL

109

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implica l’esistenza di un numero t ∈ (x, y) con Df (t) f (x) − f (y) = < r. g(x) − g(y) Dg(t) Facciamo tendere x → a, e vediamo che f (y)
f (y) g(y)

per ogni a < y < c¯. Riassumendo, abbiamo dimostrato che il rapporto f (y)/g(y) è vicino a piacere a L, a patto di prendere y abbastanza vicino a a. La dimostrazione del teorema è completa. Teorema 6.41 (Seconda parte). Siano f : (a, b) → R e g : (a, b) → R due funzioni derivabili. Supponiamo che (i) limx→a+ g(x) = ±∞; (ii) Dg(x) 6= 0 per ogni x ∈ (a, b); Se

Df (x) = L, x→a+ Dg(x) lim

ammettendo anche la possibilità che L = ±∞, allora f (x) = L. x→a+ g(x) lim

Dim. La dimostrazione è molto simile a quella della prima parte. Dobbiamo però usare l’ipotesi g(x) → ±∞ per x → a+. Sia q > L un numero arbitrariamente vicino a L, e scegliamo r ∈ R tale che L < r < q. Per l’ipotesi sul limite del quoziente delle derivate, esiste c ∈ (a, b) tale che Df (x)
110

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

per ogni x ∈ (a, c). Ora, se a < x < y < c, il teorema di Cauchy implica l’esistenza di un numero t ∈ (x, y) con f (x) − f (y) Df (t) = < r. g(x) − g(y) Dg(t)

(6.6)

Per fissare le idee, supporremo d’ora in avanti che limx→a+ g(x) = +∞. Lasciamo allo studente le piccole modifiche necessarie a trattare il caso limx→a+ g(x) = −∞. Tenendo y fissa nell’ultima equazione, scegliamo c1 ∈ (a, c) tale che g(x) > g(y) per ogni x ∈ (a, c1 ). Questo è possibile, perch é g(x) diventa infinitamente grande al tendere di x verso a. Per la stessa ragione, possiamo anche supporre che g(x) > 0. Moltiplicando la (6.6) per la quantità positiva (g(x) − g(y))/g(x), troviamo g(y) f (y) f (x)
f (x) g(x)

sia valida per ogni x ∈ (a, c3 ). Come nella prima parte, la dimostrazione è completa. Qualche parola di commento. Per semplificare gli enunciati, abbiamo presentato un caso modello, il limite per x → a+. Si tratta di una scelta piuttosto convenzionale, visto che i teoremi continuano a valere anche per x → x0 ∈ (a, b) e perfino per x → ±∞. È sottinteso che, per i limiti all’infinito, le due funzioni devono essere definite almeno su un intervallo della forma (a, +∞) o (−∞, a). Le dimostrazione dei teoremi precedenti sono abbastanza tecniche, ma crediamo che quella della prima parte sia piuttosto chiara. L’ipotesi sul limite del quoziente delle derivate viene usato per mezzo del teorema di Cauchy. La dimostrazione della seconda parte richiede qualche accorgimento tecnico sul segno del denominatore. Attiriamo l’attenzione dello studente su un fatto: il teorema tratta la forma [qualunque cosa/∞]. Potrebbe non trattarsi di una forma indeterminata, ciò che importa è che siano soddisfatte le ipotesi del teorema.

6.9. IL TEOREMA DI DE L’HOSPITAL

111

Osservazione 6.42. Il teorema di De l’Hospital permette di dimostrare una parziale inversione della Proposizione 6.21. Come visto, non possiamo aspettarci che l’esistenza del limite della derivata prima sia equivalente all’esistenza della derivata prima nel punto x0 , ma possiamo comunque dire qualcosa in più. Proposizione 6.43. Supponiamo che f : (a, b) → R sia una funzione continua, che x0 ∈ (a, b), e che f sia derivabile in (a, x0 ) ∪ (x0 , b). Se lim f 0 (x) = λ− 6= λ+ = lim+ f 0 (x),

x→x− 0

x→x0

allora f non è derivabile in x0 . Dim. Applichiamo il teorema di De l’Hospital ai due intervalli (a, x0 ) e (x0 , b). Per definizione di derivata, dobbiamo controllare l’esistenza del limite lim

x→x0

f (x) − f (x0 ) . x − x0

Tutte le ipotesi del teorema di De l’Hospital sono soddisfatte, in particolare lim−

x→x0

f 0 (x) = λ− , 1

lim+

f 0 (x) = λ+ . 1

x→x0

Quindi

f (x) − f (x0 ) f 0 (x) lim− = lim− = λ− , x − x0 1 x→x0 x→x0

mentre lim+

x→x0

f (x) − f (x0 ) f 0 (x) = lim+ = λ+ . x − x0 1 x→x0

Il rapporto incrementale non possiede limite per x → x0 , e dunque f non è derivabile in x0 . In poche parole, l’unico caso in cui la Proposizione 6.21 non si inverte, è esattamente quello dei nostri controesempi, in cui f 0 non possiede limite per x → x0 . Lo studente confronti anche la Proposizione VII.24 di [6]. Oltre alle consuete applicazioni al calcolo dei limiti, il teorema di De l’Hospital è il fondamento di una fra le più eleganti tecniche di approssimazione delle funzioni. Ce ne occupiamo nel prossimo paragrafo.

112

6.10

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Il polinomio di Taylor

È piuttosto ragionevole affermare, anche nell’era del calcolo automatizzato, che fare dei conti con i polinomi è più semplice che farli con funzioni qualunque. Questa osservazione tanto ovvia ha permesso di gettare le basi del calcolo approssimato. In questo corso toccheremo superficialmente due metodi di approssimazione, il primo locale, il secondo globale. In questo paragrafo, studieremo la possibilità di approssimare una funzione molto regolare14 mediante polinomi opportuni. Ricordiamo che un polinomio di grado n è per noi una funzione della fo rma Pn (x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an−1 xn−1 + an xn , dove i numeri reali a0 , . . . an sono i coefficienti di Pn . Introduciamo infine la cosiddetta notazione di Landau per i limiti. Definizione 6.44. Siano f e g due funzioni definite almeno in un intorno di a ∈ R. Diremo che f = o(g) (si legge f è o piccolo di g) per x → a se f (x) = 0. x→a g(x) lim

Osservazione 6.45. Dalla definizione segue che la notazione “o piccolo” indica in realtà un insieme di funzioni. Per essere precisi, data una funzione g definita (almeno) in un intorno di un punto x0 , abbiamo definito l’insieme   f (x) o(g) = f | lim =0 , x→a g(x) dove abbiamo sottinteso che le funzioni f di questo insieme sono anch’esse definite (almeno) in un intorno di x0 . A rigor di logica, dovremmo scrivere f ∈ o(g) per x → x0 invece di f = o(g). Alcuni testi, ad esempio quello di Mureşan [21], seguono questo approccio più rigoroso ma meno consueto. Questa notazione sarebbe più corretta, ma ha avuto storicamente minor fortuna. 15 14

L’aggettivo “regolare” è spesso usato come abbreviazione per espressioni riguardanti la derivabilità. Per noi, una funzione regolare è una funzione dotata di derivata prima, seconda, terza, ecc. Il numero esatto delle derivate non conta molto, e verrà specificato negli enunciati dei teoremi. 15 È un peccato, perché il simbolo di uguaglianza perde in questa situazione la proprietà simmetrica: Se f = o(g), non è affatto vero che in generale g = o(f ). Insomma, bisogna usare il simbolo = con grandissima cautela.

6.10. IL POLINOMIO DI TAYLOR

113

Osservazione 6.46. Se c’è un “o piccolo”, ci dovrebbe essere anche un “O grande”, dirà qualche studente. È vero, e il simbolo di O grande si utilizza per dire che una funzione è “controllata” da un’altra, sia dall’alto che dal basso, nell’intorno di un punto. Precisamente, se f e g sono due funzioni definite (almeno) in un intorno di x0 , si scrive f = O(g) per x → x0 quando si vuole dire che esistono un intorno I di x0 ed una costante C > 0 tali che 1 |g(x)| ≤ |f (x)| ≤ C|g(x)| per ogni x ∈ I. C In altre parole, f = O(g) significa che il rapporto |f (x)/g(x)| si mantiene limitato nelle vicinanze di x0 . Nel caso particolare in cui g è una funzione costante,16 la scrittura f = O(g) significa esattamente che nelle vicinanze del punto x0 la funzione f resta limitata. Per capirci, questo esclude la presenza di un asintoto verticale in x0 . Non ci soffermiamo oltre su questo linguaggio, che non useremo mai nel resto del corso. Per approfondimenti, il lettore potrà consultare il classico libro di Prodi [22]. Scegliendo nella Definizione 6.44 come g la funzione costante ed uguale a 1, f = o(1) significa semplicemente che f (x) → 0 per x → a. Lo studente si convinca che la definizione di derivata può essere riscritta f (x) = f (x0 ) + Df (x0 )(x − x0 ) + o(x − x0 ) per x → x0 Definizione 6.47. Siano f e g due funzioni definite almeno in un intorno del punto x0 . Diremo che g approssima f all’ordine n se f − g = o((x − x0 )n ) per x → x0 . Esplicitamente, richiediamo che lim

x→x0

f (x) − g(x) = 0. (x − x0 )n

Un caso noto e particolarmente significativo è l’approssimazione all’ordine 1, chiamata anche approssimazione lineare. Ogni funzione derivabile in un punto è approssimabile linearmente in tale punto, e la funzione che realizza l’approssimazione è la funzione lineare affine rappresentata dalla retta tangente nel punto. D’altronde, senza ulteriori condizioni dobbiamo aspettarci una gran quantità di funzioni approssimanti. Per esempio, la funzione quadratica f : x 7→ x2 è approssimata linearmente in x0 = 0 da qualunque funzione g : x 7→ αxn , con α ∈ R e n ≥ 2. Infatti x2 − αxn = lim x − αxn−1 = 0. x→0 x→0 x lim

16

Qui non importa il valore di tale costante.

114

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

Però abbiamo già imparato che la retta tangente è l’unica retta che approssima linearmente una funzione derivabile in un dato punto. Poniamo dunque il seguente problema: determinare, se esiste, un polinomio di grado n che approssima una funzione all’ordine n nell’intorno di un punto x0 . Procediamo per passi successivi, chiamando f la funzione da approssimare e supponendo x0 = 0. Il caso di x0 qualunque verr à discusso fra poco. Per n = 1 sappiamo già che l’unico polinomio cercato è P1 (x) = f (0) + Df (0)x. Per n = 2, la cosa migliore è scrivere il generico polinomio di secondo grado P2 (x) = a0 + a1 x + a2 x2 e imporre la condizione di approssimazione: f (x) − P2 (x) = 0. x→0 x2 lim

Il denominatore tende a zero, il numeratore a f (0) − a0 . Quindi è necessario che a0 = f (0). Il limite si riscrive f (x) − f (0) − a1 x − a2 x2 = 0. x→0 x2 lim

Possiamo applicare la regola di De l’Hospital, e ci riconduciamo al limite del quoziente delle derivate Df (x) − a1 − 2a2 x . x→0 2x lim

La speranza è che tale limite valga zero, e come prima è necessario che Df (0) = a1 . Applicando una seconda volta la regola di De l’Hospital, troviamo la condizione necessaria D2 f (0) = 2a2 . Se un polinomio approssimante c’è, l’unica possibilità è che 1 P2 (x) = f (0) + Df (0)x + D2 f (0)x2 . 2 Lasciamo allo studente la verifica banale che questo P2 è effettivamente un’approssimazione di ordine 2 di f in x0 = 0. Con la notazione di Landau, 1 f (x) = f (0) + Df (0)x + D2 f (0)x2 + o(x2 ). 2

6.10. IL POLINOMIO DI TAYLOR

115

Se avessimo scelto un punto x0 anche diverso da zero, la conclusione sarebbe stata analoga ma un po’ meno trasparente. Il “trucco” consiste nello scrivere il generico polinomio nella forma P2 (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 . I valori per i tre coefficienti a0 , a1 e a2 sarebbero stati gli stessi. Applicando più volte l’argomento del teorema di De l’Hospital, si dimostra il seguente risultato. Teorema 6.48 (Taylor). Sia f : (a, b) → R una funzione derivabile n volte, e sia x0 ∈ (a, b) un punto fissato. Allora esiste uno ed un solo polinomio Pn di grado (al più) n, che approssima f in x0 con ordine n. I coefficienti di Pn sono 1 a0 = f (x0 ), ak = Dk f (x0 ) per k ≥ 1, k! e conseguentemente n X 1 k Pn (x) = f (x0 ) + D f (x0 )(x − x0 )k . k! k=1

P Notazione. Il simbolo è quello della sommatoria. Dato un insieme finito di numeri reali {p1 , p2 , . . . , pn }, scriviamo n X

pk = p1 + p2 + · · · + pk .

k=1

Forse qualche lettore avrà sentito parlare della possibilità di sommare infiniti numeri reali, l’operazione alla base della teoria delle serie numeriche. Questo argomento esula P dal programma del nostro corso. In ogni caso, il simbolo di sommatoria è solo un’abbreviazione comoda sommare una quantità finita di numeri. Il bello della matematica è che, a parole, tutto è semplice. Adesso che abbiamo definito il polinomio di Taylor, calcolarlo è concettualmente una sciocchezza. Abbiamo infatti la “ricetta” che ci restituisce meccanicamente tutti i coefficienti. Basta saper calcolare le derivate. In alcuni casi, tali calcoli sono davvero facilissimi. Ad esempio, il polinomio di Taylor di una funzione polinomiale è evidentemente la funzione stessa. Non c’è neanche bisogno di fare calcoli, dato che basta inserire Pn = f nella definizione del polinomio di approssimazione.

116

CAPITOLO 6. IL CALCOLO DIFFERENZIALE Calcoliamo i primi tre termini del polinomio di Taylor della funzione f (x) =

1 1 − x − x2

con punto iniziale x0 = 0. Ci servono le prime due derivate di f : 1 + 2x (1 − x − x2 )2 2(1 − x − x2 )2 + 2(1 + 2x)2 (1 − x − x2 ) D2 f (x) = (1 − x − x2 )4 Df (x) =

Quindi 1 P2 (x) = f (0) + Df (0)x + D2 f (0)x2 = 1 + x + 2x2 , 2 2 2 e perciò f (x) = 1 + x + 2x + o(x ) per x → 0. Osserviamo che l’approssimazione ottenuta vale solo per x in un intorno di x0 = 0, e lo studente deve rifuggire la tentazione di estendere questa approssimazione a valori diversi di x. Giunti fin qui, ci resta un dubbio: è possibile stimare l’errore compiuto con la sostituzione di Pn al posto di f ? Abbiamo visto che tale errore deve tendere a zero più velocemente di (x − x0 )n , per x → x0 . Ma di funzioni che tendono a zero è pieno il mondo. Sarebbe bello poter scrivere in termini più espliciti tale errore. Per il momento ci limitiamo al prossimo risultato. Quando avremo anche gli integrali definiti nella nostra cassetta degli attrezzi, potremo dare una stima d iversa e spesso più utile. Teorema 6.49 (Formula di Taylor con resto di Lagrange). Supponiamo che f : [a, b] → R. Sia n ∈ N e supponiamo che la derivata (n − 1)–esima Dn−1 f sia una funzione continua in (a, b) e che Dn f (x) esista per ogni x ∈ (a, b). Siano x, x0 ∈ [a, b] due punti distinti, e sia Pn−1 il polinomio di Taylor di f centrato nel punto x0 di ordine n − 1. Allora esiste un punto ξ compreso fra x0 e x tale che Dn f (ξ) (x − x0 )n . f (x) = Pn−1 (x) + n! Dim. Sia M quell’unico numero reale tale che f (x) = Pn−1 (x) + M (x − x0 )n . Definiamo la funzione g : (a, b) → R come g(t) = f (t) − Pn−1 (t) − M (t − x0 )n . Vogliamo dimostrare che esiste ξ compreso fra x0 e x tale che n!M = Dn f (ξ). Derivando ripetutamente la funzione g, troviamo che Dn g(t) = Dn f (t) − n!M.

6.10. IL POLINOMIO DI TAYLOR

117

Ci basta allora dimostrare che Dn g si annulla fra x0 e x. Poiché Dk Pn−1 (x0 ) = Dk f (x0 ) per k = 0, . . . , n − 1, abbiamo g(x0 ) = Dg(x0 ) = · · · = Dn−1 g(x0 ) = 0. La nostra scelta di M implica g(x) = 0, e applicando il teorema di Lagrange in [x0 , x] deduciamo l’esistenza di x1 ∈ [x0 , x] tale che Dg(x1 ) = 0. Poiché Dg(x0 ) = 0 lo stesso teorema applicato in [x0 , x1 ] garantisce l’esistenza di x2 in tale intervallo con Dg(x2 ) = 0. Dopo n passi, troviamo infine un punto xn = ξ ∈ [x0 , xn−1 ] tale che Dn g(ξ) = 0. Poiché xn−1 è compreso per costruzione fra x0 e x, la dimostrazione è conclusa. Un invito alla calma. Lo studente deve osservare con attenzione che la formula di approssimazione dell’ultimo teorema è Dn f (ξ) (x − x0 )n . n! C’è un’apparente sfasatura negli indici: infatti per il termine finale f (x) = Pn−1 (x) +

Dn f (ξ) (x − x0 )n = o((x − x0 )n−1 ). n! Ma questo non è in contraddizione con la formula ricavata precedentemente. Per avere un’approssimazione lineare dobbiamo scegliere n = 2 nell’ultimo teorema. Non è il massimo della comodit à, ma da un punto di vista teorico ci sembra meglio privilegiare il ruolo della regolarità di f . Se la formula di Taylor con il resto “o piccolo” richiede n derivate per avere un’approssimazione all’ordine n, la formula con il resto di Lagrange richiede n + 1 derivate, per avere lo stesso ordine di appross imazione. Per avere l’approssimazione lineare con resto “o piccolo”, basta che la funzione sia derivabile. Se però vogliamo la stima del resto del tipo D2 f (ξ) (x − x0 )2 , 2! chiaramente f deve avere due derivate. Lo studente non farà fatica a riconoscere come caso particolare del Teorema 6.49 proprio il teorema di Lagrange (n = 1). Uno degli usi più frequenti delle formule di Taylor è il calcolo dei limiti. Supponiamo di voler calcolare il limite ex − 1 − x . x→0 x2 lim

118

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

È una forma di indecisione evidente, e nessun limite notevole può risolverla senza fare ulteriori indagini. Ma se ricordiamo la formula di Taylor per la funzione esponenziale e la definizione di “o piccolo”, possiamo scrivere ex − 1 − x 1 + x + x2 + o(x2 ) − 1 − x o(x2 ) = = 1 + →1 x2 x2 x2 per x → 0. Una via alternativa17 consiste nell’applicare due volte la regola di De l’Hospital. Lasciamo allo studente i dettagli relativi. Qualche studente intraprendente potrebbe credere che i principali limiti possano essere dedotti dagli sviluppi di Taylor. Purtroppo, tali deduzioni sarebbero quasi certamente scorrette da un punto di vista logico. Pensiamo al famoso limite sin x = 1. (6.7) lim x→0 x Se usiamo lo sviluppo di Taylor sin x = x − 3!1 x3 + o(x3 ), arriviamo immediatamente al risultato. Ma calcolare il polinomio di Taylor richiede il calcolo delle derivate. Come si calcola la derivata della funzione seno in x = 0? Facendo il limite del rapporto incrementale: lim

x→0

sin x sin x − sin 0 = lim . x→0 x−0 x

C’è qualcosa che non va: stiamo calcolando un limite notevole, ma abbiamo bisogno di conoscerlo prima di calcolarlo. Questo apparente paradosso dovrebbe farci riflettere sull’importanza di costruire una casa partendo dalle fondamenta, e non dal primo piano. Dando per scontata la definizione “ingenua” delle funzioni goniometriche seno e coseno, prima dobbiamo calcolare i limiti notevoli, e solo poi possiamo calcolare le derivate. Quelle noiose disuguaglianze geometriche che costituiscono la dimostrazion e elementare del limite notevole (6.7) non sembrano facilmente evitabili.18 Infine, proponiamo un’applicazione della formula di Taylor al’analisi dei punti critici. 17

Alternativa per modo di dire. Il polinomio di Taylor è sostanzialmente equivalente all’uso di De l’Hospital, come visto. Se dovessimo calcolare ogni volta i coefficienti del polinomio, tanto varrebbe usare De l’Hospital. Fortunatamente esistono le tabelle degli sviluppi di Taylor per le principali funzioni, e il loro uso riduce sensibilmente la mole di calcoli necessaria per calcolare molti limiti in forma indeterminata. Ovviamente, molti software sono capaci di scrivere i polinomi di Taylor di funzioni arbitrarie in pochi secondi. 18 I matematici puri danno spesso definizioni più raffinate per la funzione seno, e questo permette di calcolarne la derivata seguendo strade diverse. Purtroppo, nell’economia di un primo corso di matematica questi escamotages sono troppo complicati.

6.10. IL POLINOMIO DI TAYLOR

119

Proposizione 6.50. Sia f : (a, b) → R una funzione derivabile n volte in (a, b). Inoltre sia Df (x0 ) = D2 f (x0 ) = · · · = Dn−1 f (x0 ) = 0, Dn f (x0 ) 6= 0. Allora 1. se n è pari e Dn f (x0 ) > 0, x0 è un punto di minimo; 2. se n è pari e Dn f (x0 ) < 0, x0 è un punto di massimo; 3. se n è dispari, x0 non è né un punto di massimo né un punto di minimo. Dim. Tutte le affermazioni discendono dal teorema di Taylor. Infatti, per ipotesi si può scrivere f (x) = f (x0 ) +

Dn f (x0 ) (x − x0 )n + o((x − x0 )n ) n!

per x → x0 . Se n è pari, allora, in un intorno di x0 , f (x) − f (x0 ) ha lo stesso segno di Dn f (x0 ), e si conclude. Se n è dispari, in ogni intorno di x0 ci sono punti x in cui f (x) − f (x0 ) è positivo, e altri punti in cui la stessa quantità è negativa. Pertanto, x0 non è né u massimo né un minimo relativo. La proposizione precedente gode di una certa popolarità soprattutto nei testi di matematica per le scuole superiori. In effetti, quasi tutte le tecniche meccaniche, che richiedono tanti calcoli e poco ragionamento, sembrano avere grande fortuna nell’insegnamento secondario. Tuttavia, il calcolo delle derivate successive può essere fonte di banali errori di calcolo; conviene allora cercare di studiare il segno della derivata prima attorno a x0 , per applicare il criterio di monotonia descritto in precedenza. Fra l’altro, esistono funzioni “maleducate” alle quali la Proposizione dimostrata adesso non si applica. Per esempio, la funzione P : R → R definita da19 ( exp(−1/x2 ), x 6= 0 P (x) = 0 x=0 ha un evidente minimo in x = 0. Tuttavia si potrebbe dimostrare che per ogni j ∈ N Dj P (0) = 0. A parole, tutte le derivate di P calcolate in x = 0 sono nulle! Non c’e’ speranza di descrivere la natura dell’origine mediante la Proposizione. Senza voler 19

P è l’iniziale di “piatta”.

120

CAPITOLO 6. IL CALCOLO DIFFERENZIALE

essere rigorosi, potremmo dire che P è “indefinitamente piatta” nell’origine. L’andamento qualitativo di P è evidenziato nella prossima figura.

0.35

0.3

0.25

0.2

0.15

0.1

0.05

–1

–0.8

–0.6

–0.4

–0.2

0

0.2

0.4

0.6 x

0.8

1

Capitolo 7 Teoria dell’integrazione secondo Riemann Ogni studente universitario ha, o dovrebbe avere, una certa familiarità con il calcolo di aree e volumi. A livello elementare, diciamo fino alle scuole superiori, si impara a misurare perimetri, aree e volumi di speciali figure geometriche. Fra queste compaiono i quadrilateri, i triangoli, i parallelepipedi, e così via. Già la lunghezza della circonferenza pone diversi problemi tecnici, generalmente superati d’autorità insegnando che la circonferenza unitaria misura 2π.1 Sorvolando sulla definizione stessa di π, che spesso si dice valere circa 3.14 senza altri particolari, la misurazione della lunghezza della circonferenza è resa attraente mediante il classico trucco dello spago arrotolato attorno alla circonferenza. Con le aree, la faccenda si fa ancora più spinosa. Infatti, se ci può sembrare intelligente ed anche intuitivo dire che il rettangolo di lati a e b ha un’area pari a ab (base × altezza), ben più inquietante è l’affermazione che il cerchio di raggio r ha un’area pari a πr2 (raggio × raggio × 3.14). Qui non c’è più lo spago da arrotolare. Nei casi più fortunati, impariamo che la misura dell’area del cerchio si ottiene inscrivendo in esso poligoni regolari con un numero sempre maggiore di lati, e facendo tendere all’infinito il numero di lati. L’area del cerchio sarà allora il limite, per n → +∞, dell’area del poligono regolare di n lati inscritto. Ancora più in generale, consideriamo una funzione f : [a, b] → R, positiva e continua. Nel piano cartesiano, il suo grafico y = f (x) rappresenta una curva continua: che significato potremmo dare all’area di piano che giace fra l’asse delle x e il grafico della funzione? Non è facile dare una risposta 1

Ovviamente, occorrerebbe specificare un’unità di misura: chilometri.

121

metri, centimetri,

122

CAPITOLO 7. INTEGRALE DI RIEMANN

completamente comprensibile da uno studente di terza media. Fu solo nel corso del XVIII secolo che celebri matematici di nome Chauchy, Riemann, ecc. furono in grado di introdurre una teoria potente e compatibile con l’intuizione stessa di area. Nelle sezioni seguenti presenteremo un approccio ormai classico all’integrazione secondo Riemann. Seguiamo da vicino [24] e l’appendice di [25]. Non è d’altronde l’unico approccio possibile, e infatti in [6, 13] lo studente può trovare presentazioni diverse dalla nostra. In [5], la teoria dell’integrale non è veramente svolta, tranne per le funzioni continue. Osservazione 7.1. Per molti decenni, i primi corsi di analisi matematica per gli studenti di Scienze ed Ingegneria presentavano una teoria ristretta dell’integrazione, dovuta a L. A. Cauchy. Si introduce un integrale definito che esiste in generale solo sotto l’ipotesi di continuità; quindi è uno strumento meno potente di quello che vedremo nelle prossime pagine, sebbene abbia il pregio della maggior semplicità. Avvertenza. In queste note, abbiamo deciso di trattare la cosiddetta integrazione indefinita solo marginalmente in un paragrafo successivo. Riteniamo infatti che la ricerca delle primitive sia una questione di esercizio, più che di teoria. Sul mio libro di quinta liceo scientifico,2 l’Autore scriveva che “tutta la teoria dell’integrale indefinito consiste di una definizione e di una decina di integrali immediati”. La definizione è ovviamente quella di primitiva. Si usa dire che alla base di tale teoria stia la necessità di invertire l’operazione di derivazione. Data una funzione, vorremmo scriverne (almeno) un’altra la cui derivata coincida con la funzione assegnata. Problema legittimo e alquanto interessante, che si risolve comunque in una definizione, un paio di osservazioni e due regolette. Tutto il resto è esercizio. Ci piacerebbe che lo studente prendesse consapevolezza di un fatto: in matematica la teoria dell’integrazione è quella definita.

7.1

Partizioni del dominio

Situazione: abbiamo una funzione f : [a, b] → R, limitata, definita sull’intervallo chiuso e limitato [a, b]. Osservazione 7.2. L’ipotesi di limitatezza della funzione f sarà tacitamente mantenuta in tutto la trattazione dell’integrazione secondo Riemann. Nella sezione dedicata agli integrali impropri e generalizzati vedremo fino a che 2

R. Ferrauto, Lezioni di Analisi Matematica. Casa editrice Dante Alighieri.

7.1. PARTIZIONI DEL DOMINIO

123

punto sia possibile parlare di integrazione definita per funzioni non limitate. Ovviamente, l’ipotesi di limitatezza potrebbe essere rimossa fin dall’inizio facendo ricorso all’integrazione secondo Lebesgue. Definizione 7.3. Una partizione di [a, b] è un insieme finito di punti P = {x0 , x1 , . . . , xn } tali che a = x0 < x1 < x2 < · · · < xn−1 < xn = b. Una partizione P 0 è più fine di P se contiene più punti di P . Date due partizioni P e P 0 , il loro raffinamento comune è la partizione P ? = P ∪ P 0 . Osservazione 7.4. Poiché le partizioni sono semplici insiemi, ad esse si applicano tutte le consuete operazioni fra insiemi: unioni, intersezioni, ecc. Nei fatti, il raffinamento comune di due partizioni si ottiene mettendo insieme i punti di entrambe, e ovviamente disponendoli in ordine crescente di grandezza. Definizione 7.5. L’ampiezza di una partizione P si definisce come σ(P ) = max |xi − xi−1 |. i=1,...,n

Notazione. Se P = {x0 , x1 , . . . , xn } è una partizione di [a, b], si pone ∆xi = xi − xi−1 . In corrispondenza di una partizione P , introduciamo due approssimazioni, l’una per difetto e l’altra per eccesso, dell’area sottesa dal grafico di f e dall’asse delle ascisse. Per ogni i ∈ {0, 1, . . . , n} mi =

inf

xi−1 ≤x≤xi

f (x),

Mi =

f (x).

sup

(7.1)

xi−1 ≤x≤xi

La limitatezza di f garantisce ovviamente che mi e Mi sono numeri reali, cioè −∞ < mi ≤ Mi < +∞. È chiaro che questa conclusione diviene falsa senza ipotesi di limitatezza. Se, per esempio, f avesse un asintoto verticale x = x0 interno all’intervallo [a, b], almeno uno fra mi e Mi diventerebbe infinito per ogni partizione contenente il punto x0 . Siano ora L(P, f ) =

n X i=1

mi ∆xi ,

U (P, f ) =

n X i=1

Mi ∆xi .

124

CAPITOLO 7. INTEGRALE DI RIEMANN

Geometricamente, L(P, f ) è la somma delle aree dei rettangoli di base ∆xi e di altezza mi , che rappresentano i rettangoli inscritti fra l’asse delle ascisse e il grafico di f . Analogamente, i rettangoli di base ∆xi e altezza Mi sono circoscritti al grafico di f . Intuitivamente, L(P, f ) è un’approssimazione per difetto dell’area sottesa dal grafico di f , mentre U (P, f ) è un’approssimazione per eccesso della stessa area. Definizione 7.6. Il numero Z b f (x) dx = sup L(P, f ) P

a

prende il nome di integrale inferiore di f su [a, b]. Analogamente, il numero Z

b

f (x) dx = inf U (P, f ) a

P

prende il nome di integrale superiore di f esteso ad [a, b]. Rb Rb Segue dall’ovvia relazione L(P, f ) ≤ U (P, f ) che a f (x) dx ≤ a f (x) dx. Inoltre, la limitatezza di f implica che i due integrali inferiore e superiore sono sempre numeri reali finiti. Infatti, da m ≤ f (x) ≤ M per ogni x ∈ [a, b] discende che −∞ < m(b − a) ≤ L(P, f ) ≤ U (P, f ) ≤ M (b − a) < +∞ per ogni partizione P . La conclusione segue prendendo l’inf e il sup al variare delle partizioni P . Definizione 7.7. Una funzione f : [a, b] → R è integrabile secondo Riemann Rb Rb se a f (x) dx = a f (x) dx. In questo caso il valore comune dei due integrali inferioreRe superiore prendo il nome di integrale definito di f , e si denota col b simbolo a f (x) dx. Osservazione. RIn queste note, abbiamo privilegiato la notazione tipica R b dei b libri di Calcolo a f (x) dx invece di quella, logicamente più coerente, a f .3 In effetti, dalle nostre definizioni consegue che solo f e l’intervallo [a, b] sono coinvolti nella definizione di integrale. La variabile x è perfettamente superflua. Tuttavia, capita spesso di scrivere espressioni quali Z 1 1 x2 dx = . 3 0 Rb Rb Capita di veder scritto a f (x) dx, I(f, a, b), oppure a dx f (x). Quest’ultima notazione, a mio parere detestabile, è particolarmente popolare nei libri di fisica. 3

7.1. PARTIZIONI DEL DOMINIO

125

Un attimo di riflessione ci convince che quella appena scritta è un’inesattezza paragonabile a d 3 x = 3x2 . dx Sarebbe una battaglia persa convincere che la scrittura corretta è più o meno d (t 7→ t3 )(x) = 3x2 . dx C’è stato qualche coraggioso che ha tentato di introdurre nell’Analisi matematica elementare queste notazioni,R ma ormai nessuno ne ricorda il nome! Rb b Morale della favola, i simboli a f (x) dx e a f (y) dy rappresentano il medesimo ente matematico. Proposizione 7.8. Sia P una partizione, e sia P 0 più fine di P . Allora L(P 0 , f ) ≥ L(P, f ), e U (P 0 , f ) ≤ U (P, f ). Dim. Cominciamo a supporre che P 0 contenga esattamente un punto più di P . Se x¯ è questo punto, esiste un indice i tale che xi−1 < x¯ < xi , dove xi−1 e xi sono due punti consecutivi di P . Posto w1 =

inf

xi−1 ≤x≤¯ x

f (x),

w2 = inf f (x), x ¯≤x≤xi

è chiaro che w1 ≥ mi e w2 ≥ mi . Quindi L(P 0 , f ) − L(P, f ) = w1 (¯ x − xi−1 ) + w2 (xi − x¯) − mi (xi − x¯ + x¯ − xi−1 ) = (w1 − mi )(¯ x − xi−1 ) + (w2 − mi )(xi − x¯) ≥ 0. Un ragionamento del tutto analogo mostra che U (P 0 , f ) ≤ U (P, f ). Se poi P 0 contiene un numero k > 1 di punti più di P , basta ripetere k volte il discorso appena visto. La definizione di integrale appena introdotta non è molto significativa rispetto al calcolo effettivo degli integrali definiti. Inoltre, non abbiamo ancora costruito una classe maneggevole di funzioni che possono essere integrate. Quest’affermazione non dovrebbe più sorprendere lo studente: sappiamo già che solo alcune funzioni sono continue, altre sono derivabili. Certamente non possiamo aspettarci che “tutte” le funzioni siano integrabili. Quella che segue è una caratterizzazione molto forte dell’integrabilit à. Essendo una condizione necessaria e sufficiente per l’integrabilità, sarà possibile utilizzarla in maniera del tutto equivalente alla definizione di integrabilità.

126

CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.9. Una funzione limitata f : [a, b] → R è integrabile se e solo se, per ogni ε > 0 esiste una partizione Pε tale che U (Pε , f ) − L(Pε , f ) < ε.

(7.2)

Rb f (x) dx ≤ f (x) dx ≤ U (P, f ). a a Rb Rb Se vale la (7.2), allora deduciamo che 0 ≤ a f (x) dx − a f (x) dx < ε, e Rb Rb l’arbitrarietà di ε garantisce che a f (x) dx = a f (x) dx. Questo significa che f è integrabile. Viceversa, supponiamo che f sia integrabile. Fissato ε > 0, esistono due partizioni Pq e P2 tali che Dim. Per ogni partizione P , è L(P, f ) ≤

Z U (P2 , f ) − a

b

ε f (x) dx < , 2

Z a

Rb

b

ε f (x) dx − L(P1 , f ) < . 2

Se P ? è il raffinamento comune di P1 e P2 , allora U (P ? , f ) − L(P ? , f ) < ε, e possiamo scegliere pertanto Pε = P ? . La condizione (7.2) sarà quella che verificheremo sistematicamente per controllare l’integrabilità delle funzioni. Prima di proseguire, vogliamo però dare un’interpretazione più intuitiva dell’integrale di Riemann. Per quanto ne sappiamo finora, per calcolare l’integrale di una data funzione, dovremmo calcolare un estremo inferiore ed un estremo superiore al variare di tutte le possibili partizioni dell’intervallo [a, b]. Non è né comodo, né intuitivo. Vedremo fra un attimo che l’inte grale è in realtà un limite di aree di rettangoli al tendere a zero della lunghezza delle basi dei rettangoli. Definizione 7.10. Sia P = {x0 , . . . , xn } una partizione di [a, b]. Una somma di Riemann per la funzione limitata f su [a, b] è una somma del tipo Σ(P, f ) =

n X

f (ti )∆xi ,

i=1

dove ti ∈ [xi−1 , xi ] è un punto qualsiasi nell’intervallino [xi−1 , xi ]. Il teorema che segue permette di vedere l’integrale come un’operazione di limite. Teorema 7.11. Una funzione limitataRf è integrabile se e solo se esiste finito b limσ(P )→0 Σ(P, f ). In tal caso, risulta a f (x) dx = limσ(P )→0 Σ(P, f ).

7.1. PARTIZIONI DEL DOMINIO

127

Dim. Supponiamo dapprima che A = limσ(P )→0 Σ(P, f ) esista finito. Fissato ε > 0, esiste δ > 0 tale che σ(P ) < δ implica, per ogni scelta di t1 , . . . , tn , A−

ε ε ≤ Σ(P, f ) ≤ A + . 2 2

Sia P una partizione qualsiasi, con σ(P ) < δ. Facendo assumere a t1 , . . . , tn tutti i valori possibili e passando all’estremo inferiore e superiore delle corrispondenti somme di Riemann, si ha inf Σ(P, f ) = L(P, f ),

t1 ,...,tn

sup Σ(P, f ) = U (P, f ). t1 ,...,tn

e quindi

ε ε ≤ L(P, f ) ≤ U (P, f ) ≤ A + . 2 4 Rb Ma allora f è integrabile, ed anzi A = a f (x) dx per l’arbitrarietà di ε. Viceversa, sia ε > 0 fissato. Esiste una partizione P 0 tale che U (P 0 , f ) ≤ Rb f (x) dx + 2ε . Supponiamo che P 0 sia costituita da n + 1 punti e quindi a divida [a, b] in n intervalli. Siano A−

M = sup |f (x)|,

0 < δ1 <

x∈[a,b]

ε . 8M n

Consideriamo una partizione P tale che σ(P ) < δ1 , e denotiamo con P ? il raffinamento comune a P 0 e P . Allora U (P, f ) = U (P, f ) − U (P ? , f ) + U (P ? , f ) ≤ U (P, f ) − U (P ? , f ) + U (P 0 , f ) Z b ε ? ≤ U (P, f ) − U (P , f ) + + f (x) dx. 4 a I punti di P 0 interni a intervalli di P sono al massimo n − 1, e quindi U (P, f ) − U (P ? , f ) ≤ (n − 1) · 2M δ1 <

n−1ε ε < . n 4 4

Quindi ε U (P, f ) ≤ + 2

Z

b

f (x) dx a

per ogni partizione P con σ(P ) < δ. Analogamente si può provare che esiste δ2 > 0 tale che per ogni partizione P con σ(P ) < δ2 risulta Z b ε L(P, f ) ≥ f (x) dx − . 2 a

128

CAPITOLO 7. INTEGRALE DI RIEMANN

Se σ(P ) < δ = min{δ1 , δ2 }, allora Z a

b

ε ε f (x) dx − ≤ L(P, f ) ≤ U (P, f ) ≤ + 2 2

Z

b

f (x) dx. a

Poiché L(P, f ) ≤ Σ(P, f ) ≤ U (P, f ), si ha Z b ≤ε Σ(P, f ) − f (x) dx a

per ogni partizione P con σ(P ) < δ e per ogni scelta dei punti t1 , . . . , tn . Per Rb definizione, questo vuol dire che a f (x) dx = limσ(P )→0 Σ(P, f ). Osservazione 7.12. Molte attribuzioni vengono fatte per la teoria dell’integrazione definita. L. A. Cauchy dimostrò che il limite delle somme di Riemann al tendere a zero dell’ampiezza della partizione esiste finito per tutte le funzioni continue. Alcuni Autori chiamano pertanto integrale secondo Cauchy quello costruito mediante il limite delle somme di Riemann applicate a funzioni continue. L’estensione al caso delle funzioni limitate sembra essere dovuta a Riemann, mentre l’approccio con gli integrali inferiore e superiore è dovuto al matematico francese Darboux. Come vedremo, tutte queste “teorie” vengono a coincidere per la maggior parte delle funzioni elementari e addirittura per tutte le funzioni (limitate) che possiedono un numero finito di punti di discontinuità nell’intervallo di integrazione [a, b]. Calcolo di un integrale mediante la definizione. Usando la teoria delle serie numeriche e il Teorema precedente, mostriamo come calcolare un integrale definito. Seguendo l’esempio di Archimede, calcoliamo l’area del segmento parabolico: Z 1 S= x2 dx. 0

Fissato arbitrariamente n ∈ N, consideriamo la partizione equi-distribuita 0=

1 2 n−1 n 0 < < < ... < < = 1. n n n n n

Dando per scontato che la funzione x 7→ x2 sia integrabile in [0, 1], il Teorema precedente garantisce che la somma di Riemann 2 n  X k−1 1 Sn = n n k=1

7.1. PARTIZIONI DEL DOMINIO

129

converge al valore S dell’integrale cercato per n → +∞. Per calcolare Sn , osserviamo che Sn =

n  1 X 1 2 2 2 2 2 , 1 + 2 + 3 + . . . + (n − 1) (k − 1) = n3 k=1 n3

e dunque ci serve un’espressione chiusa per la somma dei quadrati dei primi n − 1 numeri naturali. La formula per questa espressione è nota, ma non è molto intuitiva. L’espressione chiusa è   1 1 3 1 2 1 Sn = 3 n − n + n . n 3 2 6 Per quanto detto sopra, Z 0

1

1 x2 dx = lim Sn = . n→+∞ 3

È piuttosto sorprendente che questo risultato, ottenuto praticamente con lo stesso ragionamento esposto, fosse noto già nell’antica Grecia! La verifica dell’integrabilità della funzione x 7→ x2 è contenuta nel prossimo Teorema. Una prima classe di funzioni certamente integrabili è quella delle funzioni monotone (crescenti oppure decrescenti). Teorema 7.13. Sia f : [a, b] → R una funzione monotona e limitata. Allora f è integrabile. Dim. Dimostriamo l’enunciato nel caso in cui f sia monotona crescente. Prendiamo ε > 0 arbitrariamente piccolo, e sia n un numero naturale maggiore di (f (b) − f (a))(b − a)/ε. Consideriamo i punti equispaziati (nel senso che ∆xi = xi − xi−1 = (b − a)/n per ogni valore dell’indice i) xi = a +

b−a i, n

i = 0, . . . , n.

La partizione P = {xi }i=0,...,n verifica la condizione (7.2). Infatti, con ovvio significato dei simboli, n X

n X b−a U (P, f ) − L(P, f ) = (Mi − mi )∆xi = (f (xi+1 ) − f (xi )) n i=0 i=0 n

=

b−a b−aX (f (xi+1 ) − f (xi )) = (f (b) − f (a)) < ε. n i=0 n

130

CAPITOLO 7. INTEGRALE DI RIEMANN

Dunque f è integrabile su [a, b]. Il caso in cui f sia decrescente è analogo. Di più, si deduce dal caso già dimostrato: infatti se f decresce, allora −f cresce. Poiché è evidente che una funzione f è integrabile se e solo se lo è −f , abbiamo concluso. Osservazione. Il teorema precedente non dà informazioni di alcun tipo sul Rb valore di a f (x) dx. Ci dice soltanto che questo integrale di Riemann esiste. Come sappiamo, una funzione monotona non è necessariamente una funzione continua. Si potrebbe dimostrare che non può essere “troppo” discontinua, ma questo va oltre gli scopi del nostro corso. Quindi, l’integrabilità delle funzioni continue non è un caso particolare del teorema sulle funzioni monotone. Purtroppo la dimostrazione che tutte le funzioni continue sono integrabili richiede qualche fatica aggiuntiva.

7.2

La continuità uniforme e l’integrazione delle funzioni continue

Ripensiamo alla definizione di continuità: una funzione f è continua nel punto x0 se per ogni ε > 0 esiste δ > 0, dipendente da ε e da x0 , tale che |x − x0 | < δ implichi |f (x) − f (x0 )| < ε. Pensiamo alla continuità della funzione x 7→ x2 ; si riesce a determinare esplicitamente un δ che soddisfa questa condizione, ma non si può pretendere che lo stesso δ vada bene per ogni x0 .4 Decisamente diverso è il caso della funzione x 7→ x. Per questa funzione, basta scegliere δ = ε, senza specificare in quale punto x0 stiamo verificando la continuità. Questa proprietà è così importante che le si attribuisce un nome speciale. Definizione 7.14. Una funzione f : D ⊂ R → R è uniformemente continua in D se per ogni ε > 0 esiste δ > 0 tale che |f (x1 ) − f (x2 )| < ε per ogni scelta di x1 , x2 ∈ D tali che |x1 − x2 | < δ. La continuità uniforme è un concetto diverso dalla semplice continuità: la funzione exp : R → (0, +∞), definita da exp x = ex , non è uniformemente continua in R. Infatti, negare la definizione di continuità uniforme significa dimostrare che: esiste ε > 0 tale che, scelto arbitrariamente δ > 0, esistono 4

Scriviamo un cenno della dimostrazione. Sia x0 6= 0, e fissiamo ε > 0. Se δ < ε/(2|x0 |) e |x − x0 | < δ, allora |x2 − x20 | = |(x − x0 )(x + x0 )| < δ · 2|x0 | < ε. È evidente che δ → 0 se |x0 | → +∞. Questo rende impossibile la scelta di δ indipendentemente dal punto x0 .

7.2. CONTINUITÀ UNIFORME

131

punti x1 e x2 ∈ D tali che |x1 − x2 | < δ ma |f (x1 ) − f (x2 )| ≥ ε. Ora, se scegliamo δ > 0 abbastanza piccolo, e se poniamo x1 = δ + 1/δ e x2 = 1/δ, ovviamente |x1 − x2 | = δ e δ 1 1 e − 1 δ → +∞ | exp x1 − exp x2 | = e δ e − 1 = δe δ δ per δ → 0+ . Per questa ragione, la funzione continua exp non può essere uniformemente continua in R. L’ostacolo che si è frapposto fra la continuità e la continuità uniforme è stato la possibilità di far tendere x1 e x2 all’infinito mentre δ → 0. Il prossimo risultato ci dice che tutte le funzioni continue su un intervallo chiuso e limitato sono addirittura uniformemente continue. Teorema 7.15. Tutte le funzioni continue, definite su un intervallo chiuso e limitato della forma [a, b], sono uniformemente continue su tale intervallo. Dim. Dimostreremo il teorema ragionando per assurdo. Se neghiamo la definizione di continuità uniforme, arriviamo all’enunciato: esiste ε? > 0 ed esistono due successioni {xn } ed {yn } di punti in [a, b] tali che limn→+∞ |xn − yn | = 0 ma |f (xn ) − f (yn )| ≥ ε? . Ora, per il Teorema 3.28, esistono due sottosuccessioni {xnk } di {xn } e {ynk } di {yn } tali che xnk → x∞ ∈ [a, b] e ynk → y∞ ∈ [a, b] per k → +∞, ma |f (xn ) − f (yn )| ≥ ε? . L’ipotesi che limn→+∞ |xn − yn | = 0 implica x∞ = y∞ , e la continuità di f implica che f (xnk ) → f (x∞ ) e f (ynk ) → y∞ per k → +∞. Ma allora 0 < ε? ≤ lim |f (xnk ) − f (ynk )| = f (x∞ ) − f (y∞ ) = 0. k→+∞

Questa catena assurda di disuguaglianze implica che era assurda la negazione della continuità uniforme. Pertanto, f è uniformemente continua. Osserviamo che la funzione x ∈ R 7→ x2 ∈ [0, +∞) non è uniformemente continua, come si può verificare imitando il ragionamento utilizzato per la funzione exp. Lo è invece ogni sua restrizione a intervalli chiusi e limitati. Per inciso, questo dovrebbe convincere lo studente che l’insieme di definizione di una funzione è tanto importante quanto la formula analitica che la rappresenta. Abbiamo ormai a nostra disposizione tutti gli ingredienti per formulare e dimostrare un teorea di integrabilità per le funzioni continue su un intervallo. Teorema 7.16. Una funzione continua f : [a, b] → R è integrabile.

132

CAPITOLO 7. INTEGRALE DI RIEMANN

Dim. Per il teorema UC di uniforme continuità, la funzione f è uniformemente continua. Dato ε > 0, esiste δ > 0 tale che |f (x1 ) − f (x2 )| < ε/(b − a) per ogni scelta di x1 , x2 ∈ [a, b] tali che |x1 − x2 | < δ. Sia P = {x0 , . . . , xn } una partizione di ampiezza σ(P ) < δ. Allora U (P, f ) − L(P, f ) =

n X

(Mi − mi )∆xi

i=1



n X i=0

ε ε (xi − xi−1 ) = (b − a) = ε. b−a b−a

ε poiché |xi − xi−1 | < δ e di conseguenza Mi − mi < b−a . Abbiamo costruito una partizione P che soddisfa la (7.2), dunque f è integrabile.

Più in generale, si dimostra il seguente risultato di integrabilità. Avvisiamo lo studente che la dimostrazione è abbastanza complicata. Teorema 7.17. Una funzione limitata f : [a, b] → R, avente un numero finito di punti di discontinuità, è integrabile. Dim. Fissato arbitrariamente ε > 0, poniamo M = maxx∈[a,b] |f (x)| e sia E l’insieme (costituito da un numero finito di elementi) dove f è discontinua. Siccome E è un insieme finito, possiamo ricoprirlo con un numero finito di intervalli aperti [uj , vj ] in modo che |vj −uj | < ε. Inoltre possiamo pensare di posizionare questi intervalli in modo che ogni elemento dell’insieme E ∩ (a, b) sia contenuto in qualche (uj , vj ). Rimuoviamo ora gli intervalli (uj , vj ) da [a, b]. L ’insieme K che resta è chiuso e limitato. Quindi f è uniformemente continua su K: esiste allora δ > 0 tale che |f (x) − f (y)| < ε se x, y ∈ K e |x − y| < δ. Costruiamo adesso una partizione P di [a, b] come segue: 1. ogni uj ed ogni vj appartengono a P ; 2. nessun punto di (uj , vj ) appartiene a P ; 3. se xj non è uno dei punti uj , allora ∆xj < δ. Osserviamo che Mi − mi ≤ 2M per ogni i, e che Mi − mi ≤ ε a meno che xi−1 non sia uno dei punti uj . Pertanto U (P, f ) − L(P, f ) ≤ (b − a)ε + 2M ε. Dal momento che ε è arbitrario, abbiamo dimostrato l’integrabilit à di f .

7.2. CONTINUITÀ UNIFORME

133

Osservazione 7.18. Al di là dei tecnicismi, l’idea della dimostrazione può essere riassunta così: si tolgono da [a, b] dei piccoli intorni di ogni punto di discontinuità, e si osserva che le somme di Riemann si spezzano in due. Da un lato le somme dove f risulta continua e quindi integrabile. Dall’altra le somme relative ai piccoli intorni appena costruiti. Ricordando che somme, prodotti, quozienti di funzioni continue sono ancora funzioni continue, alla luce del teorema di integrabilità per le funzioni continue siamo spinti a credere che l’integrabilità rispetti le usuali operazioni aritmetiche. Questo è vero, ma naturalmente richiede una dimostrazione indipendente dalla continuità. Ci limitiamo all’enunciato preciso. Teorema 7.19. Siano f e g due funzioni limitate, definite sull’intervallo [a, b]. Se f e g sono integrabili, allora le funzioni f + g ed f g sono integrabili. Per ogni costante reale c, la funzione cf è integrabile. Se g(x) 6= 0 per ogni x ∈ [a, b], allora anche f /g è integrabile. Valgono inoltre le formule Z a

b

Z

b

Z

f (x) + g(x) dx = f (x) dx + a Z b Z b f (x) dx cf (x) dx = c a Za b Z b f (x) dx ≤ |f (x)| dx. a

b

g(x) dx, a

a

Dobbiamo rifuggire dalla tentazione di estendere al prodotto f g e al quoziente f /g le formule di integrazione. Non è vero che l’integrale del prodotto è il prodotto degli integrali! Gli esempi si sprecano, e li vedremo quando sapremo come calcolare di fatto un integrale definito di una funzione assegnata. L’integrale di Riemann gode poi di una proprietà molto interessante: l’additività rispetto al dominio di integrazione. Proposizione 7.20. Sia f : [a, b] → R una funzione integrabile. Se c ∈ [a, b], allora f è integrabile su [a, c] e su [c, b], e risulta Z

b

Z f (x) dx =

a

c

Z f (x) dx +

a

b

f (x) dx. c

L’ultima operazione inportante da analizzare è quella di composizione. Si preserva l’integrabilità componendo funzioni integrabili? Sì e no: la funzione “esterna” deve essere almeno continua. Vale precisamente il seguente teorema.

134

CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.21. Sia f : [a, b] → R una funzione integrabile su [a, b], e supponiamo che c ≤ f (x) ≤ d per ogni x ∈ [a, b]. Sia ϕ : [c, d] → R una funzione continua. Allora la funzione composta ϕ ◦ f : [a, b] → R è integrabile su [a, b]. Deduciamo una conseguenza notevole: se f è positiva ed integrabile, anche ogni potenza ad esponente reale positivo di f è ancora integrabile. Anche x 7→ ef (x) è integrabile. Lasciamo al lettore il piacere di costruirsi altri corollari dei risultati precedenti sull’integrabilità.

7.3

Il teorema fondamentale del calcolo integrale

Arriviamo così al momento più atteso da ogni studente: la “regoletta” per calcolare gli integrali. In altri termini, la formula che esprime il legame fra l’integrale definito e le primitive di una funzione assegnata. Ci arriveremo con la dovuta calma, passando attraverso una formula “esplicita” per scrivere le primitive di una funzione continua. Teorema 7.22. Sia f : [a, b] → R una funzione limitata e integrabile. Allora la funzione definita da Z x f (t) dt, (a ≤ x ≤ b) (7.3) F (x) = a

è continua. Se f è continua nel punto x0 ∈ [a, b], allora F è derivabile in x0 e F 0 (x0 ) = f (x0 ). Dim. Sia M = supx∈[a,b] |f (x)|. Allora, presi x < y in [a, b], abbiamo che Z y Z y |F (y) − F (x)| = f (t) dt ≤ |f (t)| dt ≤ M (y − x). x

x

Quindi F è addirittura uniformemente continua. Supponiamo che f sia continua in un certo x0 . Fissiamo ε > 0 e sappiamo che esiste δ > 0 tale che |x − x0 | < δ implica |f (x) − f (x0 )| < ε. Allora, se |h| < δ, Z x0 +h 1 F (x0 + h) − F (x0 ) − f (x0 ) ≤ |f (t) − f (x0 )| dt ≤ ε, h h x0 e questo dimostra che F (x0 + h) − F (x0 ) = f (x0 ). h→0 h

F 0 (x0 ) = lim La dimostrazione è conclusa.

7.3. TEOREMA FONDAMENTALE DEL CALCOLO

135

Abbiamo appena visto che tutte le funzioni continue su un intervallo hanno una primitiva abbastanza esplicita, ottenibile mediante integrazione definita. Sottolineiamo che non si può prescindere dalla continuità di f . Infatti, prendiamo a = 0 e b = 2. La funzione discontinua ( 0 se 0 ≤ x ≤ 1 f (x) = 1 se 1 < x ≤ 2 definisce la funzione integrale F (x) =

Rx 0

f (t) dt mediante la formula

( 0 se 0 ≤ x ≤ 1 F (x) = x − 1 se 1 < x ≤ 2. Questa funzione F è continua, ma non è una primitiva di f . Infatti, la derivata di F nel punto x = 1 non esiste, trattandosi di un punto angoloso. Il risultato che segue, noto sotto il nome di Teorema di Torricelli– Barrow, contiene un primo legame fra integrazione definita e integrazione indefinita. Teorema 7.23. Sia f : [a, b] → R una funzione continua. Se F è una primitiva di f , cioè F è derivabile in ogni punto e F 0 = f , allora Z

b

f (x) dx = F (b) − F (a). a

Rx Dim. Poniamo G(x) = a f (t) dt. Il teorema precedente ci mostra che G è una primitiva di f , e pertanto d (F (x) − G(x)) = f (x) − f (x) = 0. dx Quindi esiste un numero k reale tale che F (x) − G(x) = k per ogni x ∈ [a, b]. Scegliendo x = a, vediamo che F (a) − 0 = k, cioè k = F (a). Quindi Z

b

f (x) dx = G(b) = F (b) − k = F (b) − F (a). a

La dimostrazione è conclusa. Questo enunciato è molto importante, e dipende in modo cruciale dalla continuità della funzione integranda f . Tuttavia questa ipotesi non serve. Il prezzo da pagare è quello di una dimostrazione più complicata.

136

CAPITOLO 7. INTEGRALE DI RIEMANN

Teorema 7.24. Sia f : [a, b] → R una funzione integrabile. Se F è una primitiva di f , cioè F è derivabile in ogni punto e F 0 = f , allora Z

b

f (x) dx = F (b) − F (a). a

Dim. Sia ε > 0. Sappiamo che l’integrabilità di f implica l’esistenza di una partizione P = {x0 , . . . , xn } tale che U (P, f ) − L(P, f ) < ε. Per ogni i = 1, . . . , n, il teorema di Lagrange applicato alla funzione F ci dice che esiste ti ∈ [xi−1 , xi ] tale che F (xi ) − F (xi−1 ) = f (ti )∆xi . Dal momento che ti ∈ [xi−1 , xi ], avremo mi ≤ f (ti ) ≤ Mi , e dunque Z n b X f (x) dx − f (ti )∆xi < ε. a i=1

Inoltre, F (b) − F (a) = [F (x1 ) − F (x0 )] + [F (x2 ) − F (x1 )] + · · · + [F (xn ) − F (xn−1 )] n X = F (xi ) − F (xi−1 ). i=1

Deduciamo che Z b F (b) − F (a) − = f (x) dx

Z b n X F (xi ) − F (xi−1 ) − f (x) dx a i=1 Z b n X = f (ti )∆xi − f (x) dx < ε. a

a

i=1

Questo conclude la dimostrazione. Osservazione 7.25. Ci sembra utile proporre il seguente argomento per la dimostrazione del teorema precedente. Fissata arbitrariamente una partizione P di [a, b], per ogni indice i esiste un punto ti ∈ [xi−1 , xi ] tale che F (xi ) − F (xi−1 ) = f (ti )∆xi . Sommando rispetto a i, otteniamo F (b) − F (a) =

n X i=1

F (xi ) − F (xi−1 ) =

n X

f (ti )∆xi ,

(?)

i=1

e a destra dell’ultimo segno di uguaglianza riconosciamo una somma di Riemann per la funzione f . Invocando allora il Teorema 6.8, ci sembrerebbe

7.3. TEOREMA FONDAMENTALE DEL CALCOLO

137

lecito far tendere a zero l’ampiezza σ(P ) della partizione P e di concludere che Z b n X f (x) dx = lim f (ti )∆xi = F (b) − F (a). σ(P )→0

a

i=1

La dimostrazione è così terminata. Ne siamo proprio sicuri? La risposta è che questa non è una dimostrazione corretta. Fare il limite delle somme di Riemann significa che per ogni ε > 0 esiste δ > 0 tale che, per ogni partizione P di ampiezza σ(P ) < δ e per ogni scelta dei punti ti ∈ [xi−1 , xi ] si ha Z b n X f (ti )∆xi − f (x) dx < ε. a i=1

Invece, nel nostro ragionamento, i punti ti sono opportunamente scelti. Spostandoli anche solo di poco, la relazione (?) diventa in generale falsa! Si potrebbe dimostrare con poca fatica che le cose vanno a posto quando f è continua, dal momento che piccoli spostamenti dei punti ti comportano piccoli spostamenti dei valori f (ti ). Ma il teorema fondamentale del calcolo per le funzioni continue ha una dimostrazione ancora più elementare che abbiamo già proposto. Ricapitolando, per calcolare un integrale definito basta procurarsi una primitiva e applicare il teorema di Torricelli. Un’estensione pressoché immediata al concetto di primitiva è il seguente. Definizione 7.26. Sia (a, b) un intervallo, e sia f : (a, b) → R. Si dice che F : (a, b) → R è una primitiva in senso esteso di f se F è continua in ogni punto di (a, b), se F è derivabile in (a, b) eccetto al più un numero finito di punti x1 , . . . , xn , e se F 0 (x) = f (x) per ogni x ∈ (a, b) \ {x1 , . . . , xn }. Invitiamo lo studente a dimostrare che se F e G sono due primitive in senso esteso di una certa f , allora F e G differiscono per una costante. Suggerimento: su ciascuno degli intervalli [x1 , x2 ], [x2 , x3 ], ecc. la funzione F −G ha derivata nulla. Quindi essa è costante su ognuno di questi intervalli. Il punto è che le varie costanti potrebbero essere diverse: F (x) − G(x) = C1 in [x1 , x2 ], F (x) − G(x) = C2 in [x2 , x3 ], e così via. La continuità di F e di G, assunta per ipotesi nella definizione precedente, obbliga tuttavia queste costanti a coincidere. La conclusione è ormai a portata di mano.

138

7.4

CAPITOLO 7. INTEGRALE DI RIEMANN

Media integrale

Se f : [a, b] → R è integrabile, il numero 1 b−a

b

Z

f (x) dx a

si chiama media integrale di f sull’intervallo [a, b]. Se P è una qualunque partizione di [a, b], risulta (b − a) inf f (x) ≤ L(P, f ) ≤ U (P, f ) ≤ (b − a) sup f (x), x∈[a,b]

x∈[a,b]

e in particolare 1 inf f (x) ≤ x∈[a,b] b−a

Z

b

f (x) dx ≤ sup f (x). a

x∈[a,b]

Questo mostra che la media integrale di f è un numero compreso fra l’estremo inferiore e l’estremo superiore di f . Se f è anche continua, sappiamo dal Teorema 5.33 che tale numero deve essere assunto in qualche punto di [a, b]. Precisamente vale il seguente risultato. Teorema 7.27. Se f : [a, b] → R è continua, allora esiste ξ ∈ [a, b] tale che Rb 1 f (x) dx. f (ξ) = b−a a

7.5

Applicazioni al calcolo degli integrali definiti

Ricordiamo che la formula di derivazione (f g)0 = f 0 g + f g 0 conduce alla regola di integrazione per parti (si veda anche il paragrafo successivo) Z Z 0 f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx. Il teorema fondamentale del calcolo integrale ci dice immediatamente che Z

b 0

Z

f (x)g (x) dx = f (b)g(b) − f (a)g(a) − a

a

b

f 0 (x)g(x) dx.

7.5. APPLICAZIONI AL CALCOLO DEGLI INTEGRALI DEFINITI 139 Un po’ più complicata è la formula per calcolare correttamente gli integrali definiti per sostituzione. Se x = g(t), t ∈ [c, d], è un cambiamento di variabile monotono crescente,5 allora Z

b

Z

g −1 (b)

f (g(t))g 0 (t) dt.

f (x) dx =

(7.4)

g −1 (a)

a

Se invece x = g(t), t ∈ [c, d], è un cambiamento di variabile monotono decrescente, dobbiamo usare la formula Z

b

Z

g −1 (a)

f (g(t))g 0 (t) dt.

f (x) dx =

(7.5)

g −1 (b)

a

Occorre fare molta attenzione alle formule (7.4) e (7.5). Queste ci dicono che integrando per sostituzione gli estremi di integrazione vanno cambiati. Vediamo un esempio: vogliamo calcolare Z 1

2

log x dx. x

Ponendo x = g(t) = et , la formula (7.4) afferma che Z 1

2

log x dx = x

Z

log 2

log 1

t t e dt = et

Z 0

log 2

1 t dt = (log 2)2 . 2

Invitiamo gil studenti a fare molto esercizio per memorizzare queste formule. Uno degli errori più diffusi è quello di dimenticarsi di cambiare gli estremi di integrazione. Osservazione 7.28. Dalla discussione appena fatta, discende che il calcolo di un integrale definito in cui sia necessario operare per sostituzione può essere svolto in due modi: 1. lavorando sempre con l’integrale indefinito, e applicando il teorema fondamentale solo come ultimo passaggio; 2. lavorando direttamente sull’integrale definito, ricordando sempre di cambiare gli estremi di integrazione coerentemente con il cambiamento di variabile. 5

È sottinteso in questa espressione che g sia derivabile.

140

CAPITOLO 7. INTEGRALE DI RIEMANN

7.6

Cenni sulla ricerca delle primitive

L’insegnamento del paragrafo precedente è che occorre sviluppare una certa manualità nel calcolo delle primitive. Ricordiamo che Definizione 7.29. Una funzione F è una primitiva di una funzione f sull’intervallo I se F è derivabile in I e risulta F 0 (x) = f (x) per ogni x ∈ I. Osservazione 7.30. Se calcolare la derivata di una funzione la cui formula si compone di funzioni elementari è sempre possibile mediante le regole di calcolo dimostrate prima, il calcolo delle primitive delle funzioni elementari pu ò sconfinare dall’ambito delle funzioni elementari stesse. Per capirci, si 2 può dimostrare che la funzione x 7→ ex non possiede primitive esprimibili mediante formule elementari. Ovviamente questa funzione possiede primitive in quanto si trata di una funzione continua. Il punto è che non riusciremo mai a scriverle esplicitamente mediante il solo utilizzo di funzioni elementari. Innanzitutto, quante solo le primitive di una data funzione? Proposizione 7.31. Dati un intervallo I ed una funzione f , due primitive di f differiscono per una costante additiva. Dim. Siano F1 ed F2 due primitive di f su I. Poiché (F1 − F2 )0 = F10 − F20 = f − f = 0 in I, la funzione F1 − F2 è costante in I. Quindi esiste C ∈ R tale che F1 (x) = F2 (x) + C per ogni x ∈ I. Quindi, se vogliamo trovare le primitive di una funzione su un intervallo, occorre e basta trovarne una: tutte le altre differiranno da essa per costanti additive. Con un certo abuso di notazione, sottintendiamo l’intervallo I e scriviamo Z f (x) dx = {F | F è una primitiva di f su I} . (7.6) Questo perìo non ci aiuta nel calcolo effettivo delle primitive. Inoltre, la definizione non è operativa, a differenza di quella di derivata. Per affrontare questo problema, cominciamo ad osservare che ogni tabella di derivate è automaticamente una tabella di primitive. Ad esempio, dalla regola d sin x = cos x dx

7.6. CENNI SULLA RICERCA DELLE PRIMITIVE

141

deduciamo che una primitiva della funzione coseno è la funzione seno. Inoltre, le regole algebriche per il calcolo differenziale diventano (parzialmente) ergole per il calcolo delle primitive. Infatti, se k è una costante reale, Z Z Z (f (x) + g(x)) dx = f (x) dx + g(x) dx, Z

Z k · f (x) dx = k ·

f (x) dx.

Non è ovviamente vero che la primitiva di un prodotto di funzioni sia il prodotto delle corrispondenti primitive! La formula di Leibniz per la derivazione dei prodotti dà origine alla regola di integrazione per parti. Proposizione 7.32 (Integrazione per parti). Se f 4 g sono due funzioni derivabili in un intervallo I, allora Z Z 0 f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx. (7.7) Dim. Dalla formula di Leibniz D(f g) = Df ·g+f ·Dg segue immediatamente che Z Z 0 f (x)g(x) = f (x)g(x) dx + f (x)g 0 (x) dx, cioè la formula della proposizione. Vediamo si applica, in pratica, questa formula. Supponiamo di voler R come x calcolare xe dx. Come scegliere f e g? Abbiamo due possibilit à: 1. f (x) = x e g 0 (x) = ex 2. f (x) = ex e g 0 (x) = x. Nel primo caso, la Proposizione precedente dice che Z Z x x xe dx = xe − ex dx = xex − ex + C. Nel secondo caso, Z 2 x2 x x x xe dx = e − e dx. 2 2 È evidente che la seconda alternativa ha complicato il calcolo dell’integrale indefinito, mentre la prima l’ha risolto. Come “vedere” la scelta giusta? Non ci sono ricette universali, ed è soprattutto l’esperienza che permette di scegliere la strada migliore senza perdersi in calcoli inutili e complicati. Se fin qui abbiamo dato spazio alle regole algebriche, ci manca ancora un metodo generale per affrontare la ricerca delle primitive di funzioni ottenute mediante composizione. Z

x

142

CAPITOLO 7. INTEGRALE DI RIEMANN

Proposizione 7.33 (Integrazione per sostituzione). Siano f ed x due funzioni derivabili e tali che la composizione f ◦ x abbia significato in un certo intervallo. Allora Z f 0 (x(t))x0 (t) dt = f (x(t)) + C. (7.8) Dim. Per la regola della catena, d f (x(t)) = f 0 (x(t))x0 (t), dt sicché f (x(t)) + C =

R

f 0 (x(t))x0 (t) dt.

Questa formula è molto meno trasparente di quella di integrazione per parti. In pratica, il metodo sembra potersi applicare solo alle funzioni integrande di un tipo molto particolare, cioè (f ◦ x)x0 . Vediamo R x+2 ora S un esempio molto semplice di applicazione. Si voglia calcolare e dx. Se poniamo f 0 (x) = ex e t = x + 2, allora x = x(t) = t − 2 è derivabile e l’integarle proposto si risolve con la formula di integrazione per sostituzione: Z Z x+2 e dx = f 0 (x(t))x0 (t) dt = et + C = ex+2 + C. R Ecco un secondo esempio: calcolare x sin(x2 ) dx. Poniamo x2 = t, in √ 1 0 e l’integrale diventa modo che x = x(t) = ± t. Quindi x (t) = ± 2√ t Z

  Z Z √ 1 1 1 ± t sin t ± √ dt = sin t dt = − cos t + C. 2 2 2 t

Torniamo infine alla variabile x, e poiché t = x2 possiamo scrivere Z 1 x sin(x2 ) dx = − cos(x2 ) + C. 2 Osservazione 7.34. Nell’ultimo esempio abbiamo cercato di proporre lo schema pratico dell’integrazione per sostituzione, che appare un po’ diverso dal contenuto della Proposizione 7.33. Per accertarsi di non aver commesso qualche ingenuo errore di calcolo, lo studente è senz’altro invitato a verificare la correttezza della propria soluzione facendo la derivata della (presunta) primitiva. Se il risultato è esattamente la funzione da integrare, allora l’esercizio è corretto. Nel prossimo paragrafo lo studente può trovare una motivazione un po’ formale del funzionamento del metodo di sostituzione.

7.7. IL DIFFERENZIALE

143

Osservazione 7.35. Capita spesso di leggere interi paragrafi di libri di testo dedicati ai cosiddetti “integrali quasi immediati”. Si tratta di quegli integrali che si presentano sotto la forma generale Z g(f (x))f 0 (x) dx, dove f e g sono due funzioni assegnate. In realtà, questi sono integrali banalmente calcolabili per sostituzione: infatti, ponendo t = t(x) = f (x), osserviamo che t0 (x) = f 0 (x), sicché Z Z 0 g(f (x))f (x) dx = g(t) dt, e basta allora procurarsi una primitiva G di g per concludere che Z g(f (x))f 0 (x) dx = G(f (x)) + C. Il secondo esempio visto sopra era in realtà di questo tipo: infatti Z Z 1 2 (2x) sin(x2 ) dx, x sin(x ) dx = 2 e riconosciamo un integrale “quasi immediato” nel quale f (x) = x2 e g(x) = sin x. Se queste sono le uniche regole generali di calcolo delle primitive, questo non significa che siamo capaci di calcolare tutti gli integrali indefiniti che possiamo concepire. Anche escludendo quei casi che non possiedono primitive esprimibili mediante funzioni elementari, il calcolo di una primitiva può richieder l’uso ripetuto e/o sovrapposto delle regole studiate, oltre naturalmente ad “astuzie” di natura algebrica o analitica. Insomma, il calcolo integrale mette alla prova lo spirito di osservazione dello studente, e costituisce certamente il primo ostacolo che la sola applicazione di regole meccaniche non permettono di aggirare. Nel prossimo paragrafo ci occuperemo dell’integrazione indefinita di un’ampia classe di funzioni, e saremo costretti ad utilizzare alcuni “trucchi” per semplificare il nostro lavoro.

7.7

Il differenziale

Definizione 7.36. Una funzione lineare L : R → R è una funzione tale che per ogni x, y ∈ R ed ogni α, β reali risulti L(αx + βy) = αL(x) + βL(y).

144

CAPITOLO 7. INTEGRALE DI RIEMANN

Osservazione 7.37. Non è difficile rendersi conto che tutte e sole le funzioni lineari hanno la rappresentazione L(x) = kx per un valore opportuno di k ∈ R. In parole povere, le funzioni lineari di una variabile sono rappresentate da rette uscenti dall’origine degli assi cartesiani. Definizione 7.38. Una funzione f : (a, b) → R è differenziabile nel punto x0 ∈ (a, b) se esiste una funzione lineare L (dipendente ovviamente da x0 ) tale che f (x0 + h) − f (x0 ) − L(h) = 0. (7.9) lim h→0 h Il differenziale di f in x0 , se esiste, viene indicato dal simbolo df (x0 ). Osservazione 7.39. Dalla precedente osservazione, deriva che f è differenzialbile in x0 se e solo se esiste un numero reale k tale che f (x0 + h) − f (x0 ) − kh = 0, h→0 h lim

e dunque se e solo se esiste un numero reale k tale che f (x0 + h) − f (x0 ) . h→0 h

k = lim

Dunque la differenziabilità in x0 coincide con la derivabilit à in x0 ! Di più, df (x0 ) altro non è che la funzione lineare h 7→ f 0 (x0 )h. Perché abbiamo introdotto l’inutile concetto di differenziale se questo coincide (con leggero abuso di terminologia) con la derivata? Una risposta raffinata ma poco corretta è che, per funzioni di due o più variabili, la derivata deve essere definita mediante il differenziale per avere tutte le proprietà buone che ci aspettiamo. Ma questa risposta non ci soddisfa, dato che per funzioni di una variabile reale abiamo visto che è tutto tempo sprecato. Una risposta suggestiva è che il differenziale permette di rendere pi ù intuitiva la formula di itnegrazione per sostituzione. Infatti, se x = x(t) è la sostituzione che vogliamo effettuare nell’integrale, allora possiamo usare il concetto di differenziale per scrivere dx = x0 (t) dt, pensando che dt sia un piccolo incremento (quello che prima abbiamo denotato con h). Dunque, al posto di dx dobbiamo scrivere x0 (t) dt, e questo porta direttamente alla formula di integrazione per sostituzione.

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE

145

Osservazione 7.40. Capita spesso di leggere, sui testi più tradizionali di calcolo differenziale, che i differenziali sono più flessibili delle derivate perch é non richiedono che si specifichi da quali variabili dipendono le quantità in esame. Uno degli esempi classici è la legge della fisica pV = nT , dove p è la pressione, V il volume e T la temperatura (espressa in gradi Kelvin), menter n è una costante. A questo punto, si dice che “differenziando” questa uguaglianza, si ottiene p dV + V dp = n dT, qualunque siano le variabili indipendenti da cui dipendono p, V e T . Personalmente, non trovo questa conclusione così eccitante ed innovativa. Il punto è che i matematici all’antica pensavano alle funzioni come a formule esplicite contenenti una o pi ù variabili indipendenti. Se non potevano scriverle, si sentivano molto a disagio. Per noi, ormai, è chiaro che la derivata opera sulle funzioni, indipendentemente dal nome scelto per le variabili indipendenti che la descrivono. Nonostante ciò, i fisici matematici continuano ad utilizzare un linguaggio pittoresco e simpaticamente vintage, e guai a mostrarsi indifferenti!

7.8

Integrazione delle funzioni razionali fratte

Le seguenti formule sono tratte da [2]: per a 6= 0,  2 2ax + b   p arctan p , b2 − 4ac < 0   2 2  4ac − b 4ac − b       Z  2ax + b − pb2 − 4ac dx 1 = p p log , b2 − 4ac > 0 ax2 + bx + c  2 2  b − 4ac 2ax + b + b − 4ac         2  − , b2 = 4ac. 2ax + b La forma analitica delle primitive dipende essenzialmente dal segno di ∆ = b2 − 4ac. I calcoli seguenti dovrebbero risvegliare qualche ricordo nella mente

146

CAPITOLO 7. INTEGRALE DI RIEMANN

dello studente: per a 6= 0, !   2 2 c b c b b =a x+ + − 2 ax2 + bx + c = a x2 + x + a a 2a a 4a !  2 b 4ac − b2 = a x+ + 2a 4a2 !  2 b ∆ = a x+ − 2 2a 4a 

Vediamo che, per risolvere l’equazione algebrica di secondo grado ax2 + bx + c = 0 dobbiamo risolvere

e cioè

! 2  ∆ b − 2 = 0, a x+ 2a 4a 2  ∆ b − 2 = 0. x+ 2a 4a

Ma questa equazione è facile: r √ ∆ ∆ b =± =± . x+ 2 2a 4a 2a Lo studente non mancherà di notare che abbiamo ricavato la celeberrima formula risolutiva per le equazioni (algebriche) di secondo grado: √ −b ± ∆ x= . 2a La presenza della radice quadrata di ∆ ci costringe a distinguere tre casi: 1. ∆ > 0 2. ∆ < 0 3. ∆ = 0. Cominciamo dall’ultimo caso. Il polinomio ax2 + bx + c possiede due radici reali coincidenti: b x1 = x2 = − . 2a

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE

147

Inoltre ax2 + bx + c = a(x − x1 )2 . Quindi Z

dx 1 = 2 ax + bx + c a

Z

dx 2 1 1 =− . =− 2 (x − x1 ) a x − x1 2ax + b

Il caso ∆ > 0 si tratta come nel seguito. Il nostro polinomio di secondo grado possiede le due radici reali distinte √ −b − ∆ x1 = , 2a

√ −b + ∆ x2 = . 2a

Perciò ax2 + bx + c = a(x − x1 )(x − x2 ), e Z

dx 1 = 2 ax + bx + c a

Z

dx . (x − x1 )(x − x2 )

Cerchiamo due numeri reali A e B tali che A 1 B = + (x − x1 )(x − x2 ) x − x1 x − x2 per ogni x ∈ / {x1 , x2 }. Mettendo a denominatore comune e operando qualche semplificazione, otteniamo 1 = (A + B)x − Ax2 − Bx1 per ogni x ∈ / {x1 , x2 }. Affiché questo sia vero, il coefficiente della x a secondo membro deve essere uguale al coefficiente della x a primo membro (cioè 0), e i termini noti devono coincidere. Pertanto occorre risolvere il sistema lineare in due equazioni ( A+B =0 Ax2 + Bx1 = −1.

La soluzione si trova facilmente per sostituzione: ( A = 1/(x1 − x2 ) B = −1/(x1 − x2 ). Dunque 1 1 1 1 1 = − . (x − x1 )(x − x2 ) x1 − x2 x − x1 x1 − x2 x − x2

(7.10)

148 Infine, Z

CAPITOLO 7. INTEGRALE DI RIEMANN

Z dx 1 dx = 2 ax + bx + c a (x − x1 )(x − x2 )   1 1 1 = log |x − x1 | − log |x − x2 | a x1 − x2 x1 − x2 x − x1 1 . log = a(x1 − x2 ) x − x2

Sostituendo i valori di x1 e x2 e facendo qualche calcolo algebrico, si arriva alla formula scritta all’inizio di questo paragrafo. L’ultimo caso è quello in cui ∆ < 0, ed è noto che il nostro polinomio di secondo grado non possiede radici reali. Probabilmente alcuni studenti sanno che esso possiede invece due radici complesse coniugate. Non avendo discusso i numeri complessi, e visto che non ne trarremmo alcun vantaggio concreto, evitiamo di insistere su tale terminologia. Per integrare la funzione razionale ci basta osservare che   c b 2 2 ax + bx + c = a x + x + a a e che b c x + x+ = a a 2



b x+ 2a

2

c b2 + − 2. a 4a

Poiché ∆ < 0, esiste k ∈ R tale che k2 = La sostituzione t = x +

c b2 − 2. a 4a

b 2a

ci conduce all’integrale Z Z 1 dt 1 dt = 2 . t 2 2 2 a t +k ak (k) + 1

L’ulteriore sostituzione u = t/k risolve l’ultimo integrale: Z Z 1 dt 1 k 1 1 t = 2 du = arctan u + C = arctan + C. t 2 2 2 ak ak u +1 ak ak k (k) + 1 b Ricordando che t = x+ 2a ed esplicitando il valore di k, si arriva dopo qualche passaggio all’integrale voluto. Sconsigliamo allo studente di imparare a memoria i risultati: lo sforzo non è banale, ed è certo più importante saper riprodurre i ragionamenti nel caso concreto.

7.8. INTEGRAZIONE DELLE FUNZIONI RAZIONALI FRATTE

149

Osservazione 7.41. Come sempre, non esiste necessariamente un unico modo di esprimere una primitiva. Si consideri l’esempio Z dx . 1 − x2 Si tratta evidentemente di una integranda di tipo razionale fratto. Ovviamente 1 − x2 = (1 − x)(1 + x), e dunque 1 1 1 1 1 − = 2 1−x 21−x 21+x e l’integrale diventa immediato: Z dx 1 1 = log |1 − x| − log |1 + x| + C. 2 1−x 2 2 Molti software di calcolo simbolico propongono una primitiva molto diversa: Z dx = arctanh x + C. 1 − x2 Ricordiamo che ex − e−x 2 x e + e−x cosh x = 2 sinh x tanh x = . cosh x sinh x =

Si verifica facilmente che6 (cosh x)2 − (sinh x)2 = 1, e dividendo per (cosh x)2 si arriva all’identità (cosh x)2 =

1 1 − (tanh x)2

Infine, d sinh x = cosh x dx d cosh x = sinh x dx d 1 tanh x = . dx (cosh x)2 Si osservi la somiglianza con l’identità fondamentale della (tri)goniometria (sin α)2 + (cos α)2 = 1. 6

150

CAPITOLO 7. INTEGRALE DI RIEMANN

2,4

1,6

0,8

-4,8

-4

-3,2

-2,4

-1,6

-0,8

0

0,8

1,6

2,4

3,2

4

4,8

-0,8

-1,6

-2,4

Figura 7.1: la funzione sinh La funzione arctanh è definita come la funzione inversa di tanh. La sua derivata vale d arctanh y = dy dove y = tanh x. pertanto Z

d dx

1 1 = (cosh x)2 = , 1 − y2 tanh x

dy = arctanh y + C. 1 − y2

Nelle figure 7.1, 7.2 e 7.3 appaiono i grafici qualitativi delle funzioni seno iperbolico, coseno iperbolico e tangente iperbolica.

7.9

Il polinomio di Taylor con resto integrale

Ricordiamo che, per una funzione f : (a, b) → R derivabile n volte, vale la formula f (x) = Pn (x) + Rn (x), dove Pn (x) = f (x0 ) +

n X 1 k D f (x0 )(x − x0 )k k! k=1

7.9. IL POLINOMIO DI TAYLOR CON RESTO INTEGRALE

2,4

1,6

0,8

-4,8

-4

-3,2

-2,4

-1,6

-0,8

0

0,8

1,6

2,4

3,2

4

4,8

3,2

4

4,8

-0,8

-1,6

-2,4

Figura 7.2: la funzione cosh

2,4

1,6

0,8

-4,8

-4

-3,2

-2,4

-1,6

-0,8

0

0,8

1,6

2,4

-0,8

-1,6

-2,4

Figura 7.3: la funzione tanh

151

152

CAPITOLO 7. INTEGRALE DI RIEMANN

è il polinomio di Taylor di ordine n e Rn (x) = f (x) − Pn (x) è l’errore che si compie sostituendo Pn a f . Abbiamo già imparato che lim

x→x0

Rn (x) = 0, (x − x0 )n

e che è possibile esprimere tale resto mediante la derivata (n + 1)– esima in un punto opportuno ξ: Rn (x) =

1 Dn+1 f (ξ)(x − x0 )n+1 . (n + 1)!

Il seguente risultato illustra un’ulteriore espressione per il resto. Teorema 7.42 (Polinomio di Taylor con resto integrale). Sia f : (a, b) → R una funzione derivabile n+1 volte in (a, b), con derivata (n+1)–esima Dn+1 f continua. Allora Z 1 x Rn (x) = (x − t)n Dn+1 f (t) dt. n! x0 Non dimostriamo tale formula, che richiederebbe la tecnica dell’induzione matematica. L’espressione integrale del resto Rn ha un’utilità quasi esclusivamente teorica, dato che la funzione integrale coinvolta è di difficile calcolo.

7.10

Integrali impropri

Per quanto ci riguarda, solamente le funzioni limitate possono essere integrate su un intervallo√limitato [a, b]. Da questa classe esulano le funzioni come x ∈ (0, 1) 7→ 1/ x e x ∈ (1, +∞) 7→ 1/x2 , per esempio. Osserviamo che si tratta di funzioni continue, ed anzi derivabili nel loro dominio. L’integrale di Lebesgue, la cui teoria è ben più complicata di quella vista finora, propone una teoria che supera queste restrizioni. Noi ci accontenteremo di introdurre i rudimenti dell’integrazione in senso generalizzato o improprio.

7.10.1

Funzioni illimitate

Per semplicità consideriamo una funzione f che sia definita e continua in un intervallo [a, b). La funzione f potrà R c non essere limitata. È lecito allora per ogni c < b considerare l’integrale a f (x) dx e viene spontanea la seguente

7.10. INTEGRALI IMPROPRI

153

Definizione 7.43. Se nelle ipotesi dette esiste il limite Z c lim f (x) dx, c→b−

a

questo viene detto integrale (improprio) di f in (a, b) e lo si indica ancora Rb con la notazione a f (x) dx. È chiaro che possiamo estendere la definizione precedente al caso in cui f sia illimitata nell’estremo sinistro a dell’intervallo. Basta considerare il limite Z b f (x) dx. lim c→a+

c

Quindi, tutto è stato ricondotto all’esistenza di un limite. Non sempre, però è possibile calcolare esplicitamente gli integrali, ed è utile avere un teorema che garantisca l’integrabilità impropria di f . Teorema 7.44. Sia ϕ una funzione continua in [a, b), a valori positivi per cui esista l’integrale improprio in (a, b), e sia f una funzione continua in [a, b) tale che |f (x)| ≤ ϕ(x) per ogni x ∈ [a, b). Allora esiste l’integrale improprio fra a e b di f . Conviene pertanto costruire una scala di funzioni illimitate che ci permatta di decidere per confronto se una funzione ammetta integrale improprio o no. Consideriamo questa semplice famiglia di funzioni illimitate in ogni intorno del’estremo b: x ∈ [a, b) 7→

1 , (b − x)α

(α > 0).

Ora, Z a

c

dx = (b − x)α

( log(b − a) − log(b − c), α=1 1 1 1−α 1−α (b − a) − 1−α (b − c) , α = 6 1. 1−α

Perciò nel caso α = 1 l’integrale improprio non esiste in quanto Z c dx lim = +∞. c→b− a (b − x)α Lo stesso accade per α > 1. Per α < 1 Z c dx 1 lim = (b − a)1−α α c→b− a (b − x) 1−α In conclusione, l’integrale improprio esiste se e solo se 0 < α < 1.

154

CAPITOLO 7. INTEGRALE DI RIEMANN

Diamo un cenno a un caso un po’ più generale. Supponiamo che la funzione f , definita in [a, b], sia continua con l’eventuale eccezione dei punti d1 , d2 , . . . ,dr . Allora si può suddividere l’intervallo (a, b) in un numero finito di intervalli, in modo che in ciascuno di essi la funzione f sia discontinua solo in un estremo (destro o sinistro). A ciascuno di questi intervalli si possono applicare le considerazioni fatte prima; se, per ciascuno di essi, esiste l’integrale improprio, la somma di questi si definisce come integrale improprio della f esteso all’intervallo (a, b). In pratica, se nell’intervallo [a, b] ci sono due punti d1 e d2 dove la funzione f è illimitata, scriveremo Z b Z d2 Z b Z d1 f (x) dx + f (x) dx. f (x) dx + f (x) dx = d1

a

a

d2

Il primo e l’ultimo integrale ricadono nella definizione di integrale improprio. Il secondo è più delicato. Infatti f potrebbe essere illimitata in entrambi gli estremi. Possiamo però ricondurlo a un integrale improprio con questo “trucco”: scegliamo un punto c ∈ (d1 , d2 ) dove f sia continua, e scriviamo Z d2 Z c Z d2 f (x) dx. f (x) dx = f (x) dx + d1

d1

Vediamo, ad esempio, se esiste

R +1 −1

c

√dx . |x|

La funzione integranda è illimitata per x → 0. Suddividiamo allora l’intervallo (−1, 1) nei due intervalli (−1, 0 e (0, 1). Si ha 7 Z −δ √ 1 √ dx = lim (−2 −δ + 2) = 2 lim δ→0+ δ→0+ −1 −x e Z 1 √ 1 √ dx = lim (2 − 2 σ) = 2. lim σ→0+ σ σ→0+ x

7.10.2

Funzioni definite su intervalli illimitati

Consideriamo ora il secondo caso, quello di una funzione definita su un intervallo illimitato, ad esempio del tipo (a, +∞). R c Supporremo che f sia continua in [a, +∞), e pertanto tutti gli integrali a f (x) dx hanno senso per c > a. Definizione 7.45. Se nelle ipotesi dette esiste il limite Z c lim f (x) dx c→+∞

a

questo viene detto l’integrale improprio di f in (a, +∞). 7

Lo studente noterà che abbiamo esplicitato il valore assoluto nei due integrali.

7.10. INTEGRALI IMPROPRI Esempio: Z 0

+∞

dx = lim x2 + 1 c→+∞

155

Z 0

c

dx π = lim arctan c = . x2 + 1 c→+∞ 2

Come nel caso dell’intervallo limitato, sussiste il seguente criterio del confronto per l’integrale improprio su intervalli illimitati. Teorema 7.46. Sia ϕ una funzione continua in [a, +∞), a valori positivi per cui esista l’integrale improprio in (a, +∞), e sia f una funzione continua in [a, b) tale che |f (x)| ≤ ϕ(x) per ogni x ∈ [a, +∞). Allora esiste l’integrale improprio fra a e +∞ di f . Costruiamo anche nel nostro caso una scala di funzioni che ci permetta, per mezzo del criterio del confronto, di decidere se un integrale improprio esiste. Consideriamo ( Z c 1 1 c1−α + α−1 , α 6= 1 dx 1−α = α log c, α = 1. 1 x Se è α > 1, il limite per c → +∞ è 1/(α − 1), mentre, per α ≤ 1, è +∞. Osservazione 7.47. L’applicazione del criterio di confronto per la convergenza degli integrali impropri richiede la costruzione di una funzione ϕ di confronto, e non esistono ricette universali per questo.

156

CAPITOLO 7. INTEGRALE DI RIEMANN

Capitolo 8 Introduzione alle equazioni differenziali ordinarie Risolvere un’equazione significa trovare i valori di una o più incognite che rendono vera una certa uguaglianza. Lo studente sa risolvere le equazioni ax = b, ax2 + bx + c = 0, 2x = 4, e altre ancora. In questi esempi, l’incognita x è un numero.1 È possibile scrivere equazioni in cui l’incognita sia una funzione e non già un singolo numero? Un attimo di riflessione ci lascia intendere che il senso dell’uguaglianza da verificare vada inteso come un’uguaglianza punto per punto. Per esempio, cercare una funzione f tale che f2 − 1 = 0 può essere interpretato come cercare una funzione f tale che f (x)2 − 1 = 0 per ogni x appartenente al dominio di f . Queste solo le cosiddette equazioni funzionali, e sono un argomento davvero complesso. In questo capitolo tratteremo un diverso tipo di equazioni, quelle in cui l’incognita è una funzione ma l’uguaglianza da verificare coinvolge le derivate dell’incognita. Sarà comodo indicare le derivate con apici: y 0 invece di Dy, y 00 invece di D2 y, ecc. Definizione 8.1. Un’equazione nell’incognita y : (a, b) → R del tipo F (x, y(x), y 0 (x), y 00 (x), . . . , y (n) (x)) = 0,

x ∈ (a, b)

(8.1)

si chiama equazione differenziale ordinaria di ordine n. L’ordine n sta ad indicare l’ordine di derivazione più alto della funzione incognita y che effettivamente compare. 1

Che intenderemo sempre reale. In matematica si studiano equazioni le cui inconite devono appartenere ad insiemi specificati, ad esempio Z o Q.

157

158

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

Definizione 8.2. L’equazione (8.1) si dice lineare se è della forma an (x)y (n) (x) + an−1 y (n−1) (x) + · · · + a0 (x)y(x) = f (x)

(8.2)

e lineare omogenea se f = 0. Ora che sappiamo che cosa sia un’equazione differenziale2 vogliamo anche dire che cosa sia una sua soluzione. Definizione 8.3. Una soluzione di (8.1) è una funzione y : (a, b) → R, derivabile n volte in (a, b) e verificante (8.1) per ogni x ∈ (a, b). L’insieme di tutte le soluzioni di (8.1) in (a, b) si chiama integrale generale di (8.1) in (a, b). È importantissimo sottolineare che l’insieme di definizione della soluzione non è un dato del problema, bensì parte dell’incognita. In particolare, non è possibile pretendere che le soluzioni di una data equazione differenziale risultino definite su un insieme da noi specificato. In termini equivalenti, aggiungere il dominio della soluzione ai dati dell’equazione può portare a un problema privo di soluzioni. Un’equazione differenziale ordinaria che sappiamo già risolvere è y 0 = f (x), dove f è una funzione continua assegnata. Il teorema fondamentale del calcolo ci dice che, trovata una primitiva F di f in un intervallo (a, b), la soluzione generale è y(x) = F (x) + C, al variare di C ∈ R. Nei paragrafi seguenti proponiamo i metodi risolutivi per qualche altro tipo di equazioni differenziali del primo ordine. Non diremo quasi niente della teoria che sta alla base. Lo studente tenga bene a mente che non esistono metodi per risolvere una generica equazioni differenziale ordinaria mediante formule elementari.

8.1

Equazioni differenziali lineari del primo ordine

In questa sezione, troviamo tutte le soluzioni di una equazione differenziale del primo ordine scritta nella forma y 0 + a(x)y = f (x) 2

Sottintenderemo spesso l’aggettivo ordinaria.

(8.3)

8.1. EQUAZIONI DIFFERENZIALI LINEARI DEL PRIMO ORDINE159 Quando si studiano le equazioni differenziali lineari, conviene sempre applicare il principio di sovrapposizione. Esso consiste nelle seguenti due osservazioni: 1. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare omogenea, allora c1 y1 + c2 y2 , al variare di c1 , c2 ∈ R, è ancora una soluzione; 2. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare con termine noto f , allora y1 − y2 è una soluzione della stessa equazione differenziale lineare con f = 0. Il senso pratico di questo principio è che per trovare l’integrale generale di un’equazione differenziale lineare non omogenea, basta trovare l’integrale generale ella corrispondente equazione omogenea e sommargli una soluzione particolare dell’equazione non omogenea. Il vantaggio è che la soluzione particolare può essere individuata con ogni mezzo, anche casualmente.3 Per la nostra equazione (8.3), cominciamo a trovare l’integrale generale della corrispondente equazione omogenea y 0 + a(x)y = 0.

(8.4)

Nel seguito, supporremo sempre che a sia una funzione continua. Dividendo per y, si ottiene formalmente 0=

d y0 + a(x) = log y(x) + a(x), y dx

cioè log y(x) = −A(x) dove A è una primitiva di a.4 Il suggerimento che ne ricaviamo è che la funzione   Z x (8.5) y0 (x) = exp − a(s) ds α

dove α è un numero arbitrariamente fissato, sia una soluzione di (8.4). Lo studente verifichi per (semplice) esercizio che y0 è davvero una soluzione. L’integrale generale di (8.4) è y(x) = cy0 (x), 3

c ∈ R.

Questa è soltanto una frase ad effetto. Nessuno individua le soluzioni particolari casualmente, ma sempre seguendo qualche tecnica ragionevole. 4 Ricordiamo che, per definizione di primitiva, A0 (x) = a(x).

160 Infatti,

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

y 0 y0 − y00 y −ayy0 + ay0 y d y(x) = = = 0, 2 dx y0 (x) y0 y02

e dunque y/y0 è costante. Per trattare il caso non omogeneo, proponiamo un metodo alquanto potente e generale: quello della variazione delle costanti. Al di là della denominazione paradossale, è un metodo che funziona sempre, anche se può portare a calcoli problematici. Lo schema è il seguente. Si risolve l’equazione omogenea e si determina y0 come sopra. A questo punto, cerchiamo una soluzione particolare della forma yf (x) = λ(x)y0 (x) Capiamo la ragione del nome: facciamo finta che la costante reale c che descrive l’integrale generale di (8.4) sia una funzione (derivabile), e cerchiamo di sceglierla così da avere una effettiva soluzione dell’equazione non omogenea. Inserendo yf nell’equazione (8.3), ci accorgiamo che yf è una soluzione se e solo se λ0 (x)y0 (x) + λ(x) (y00 (x) + a(x)y0 (x)) = f (x); basta quindi scegliere λ in modo che λ0 (x) =

f (x) . y0 (x)

Questa è un’equazione differenziale del tutto banale, dato che si risolve semplicemente scegliendo una primitiva della funzione a secondo membro. In conclusione, l’integrale generale dell’equazione (8.3) è   Z x f (s) y(x) = y0 (x) c + ds , (8.6) α y0 (s) dove

 Z y0 (x) = exp −

x

 a(s) ds .

α

Inoltre, ciascuna di queste soluzioni è univocamente determinata dal valore assunto in α, c = y(α). Osservazione 8.4. Esiste un approccio più diretto al caso nonR omogeneo. Partiamo dall’equazione y 0 +a(x)y = f (x) e poniamo v(x) = exp( a(x) dx)y(x). La derivata di v si calcola facilmente: R

a(x) dx 0

R

a(x) dx

v 0 (x) = e

=e

R

y (x) + a(x)e 0

(y + a(x)y) .

a(x) dx

y(x)

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI161 Quindi y risolve la nostra equazione differenziale non omogenea se, e solo se, v risolve l’equazione differenziale R

v0 = e Ma allora v(x) = generale5 y:

R

e

R

a(x) dx



y(x) = e

R

a(x) dx

f (x).

f (x) dx + C, e possiamo ricavare la soluzione

a(x) dx

Z

R

e

a(x) dx

 f (x) dx + C .

Qualche volta, la forma specifica di f a secondo membro può suggerire una soluzione particolare. Per esempio, una soluzione di y 0 + y = ex può essere suggerita dal fatto ben noto che, per ogni λ, µ ∈ R, d (λeµx ) = λµeµx . dx Si verifica agevolmente che λ = 1/2 e µ = 1 fornisce la soluzione yf (x) = (1/2)ex . Considerazioni analoghe valgono per funzioni a secondo membro di tipo polinomiale e goniometrico.

8.2

Equazioni del primo ordine a variabili separabili

Discutiamo ora alcuni esempi di equazioni differenziali del primo ordine non lineari y 0 = f (x, y), (8.7) dove f è una funzione di due variabili assegnata. Una soluzione di (8.7) è una funzione y derivabile con continuità in un intervallo (a, b) e tale che y 0 (x) = f (x, y(x)) per ogni x ∈ (a, b). Discuteremo inoltre la risolubilità del problema di Cauchy, ovvero del problema di trovare una soluzione di (8.7) soddisfacente la condizione y(x0 ) = y0 , 5

Qualche studente potrebbe criticare l’uso un po’ leggero del simbolo di integrazione indefinita: in particolare, a che serve la costante C se l’integrale indefinito continene già tutte le infinite primitive? La critica è formalmente corretta, e possiamo dire che nella formula seguente gli integrali denotano una primitiva scelta liberamente fra le infinite a disposizione.

162

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

(x0 , y0 ) essendo un punto del piano cartesiano (appartenente al dominio di f ). In altre parole, discuteremo la risolubilità del sistema y 0 (x) = f (x, y(x)) y(x0 ) = y0 .



(8.8)

Geometricamente il problema consiste, dopo aver assegnato in ogni punto del piano (x, y) un numero f (x, y), nel trovare una funzione y il cui grafico passa per (x0 , y0 ) in ogni punto (x, y(x)) ha una pendenza assegnata f (x, y(x)). Purtroppo non possiamo dire quasi nulla di astratto: la comparsa di una funzione di due variabili porta tutta la discussione ad un livello di matematica più avanzato rispetto al nostro. Questa consapevolezza dei nostri limiti non ci impedirà tuttavia di imparare a risolvere alcuni tipi di equazioni differenziali di tipo speciale. I due esempi che seguono mostrano alcuni comportamenti inattesi, almeno a un primo sguardo. Non unicità. Per ogni a < 0 < b, le funzioni  1 2  − 4 (x − a) , x < a y(x) = 0, a≤x≤b  1 2 (x − b) , x>b 4 sono tutte funzioni derivabili con continuità in R. risolve il problema di Cauchy 

6

Inoltre ognuna di esse

p y 0 (x) = |y(x)| y(0) = 0.

In contrasto con quel che capita con le equazioni lineari del primo ordine dove la soluzione dell’equzione è univocamente determinata dal valore della stessa in un dato punto, questa equazione non lineare presenta infinite soluzioni diverse. Esplosione in tempo finito. La funzione y(x) = 1/(1 − x), definita per ogni x ∈ (−∞, 1), è soluzione del problema 

6

y 0 (x) = y(x)2 y(0) = 1.

Lo studente verifichi attentamente questa affermazione.

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI163 In questo caso, pur essendo l’equazione definita per ogni possibile coppia (x, y) del piano cartesiano, la soluzione y è definita solo su un intervallo limitato superiormente. Di più, l’ampiezza dell’intervallo dipende dal valore iniziale. Ad esempio per λ > 0 la funzione yλ (x) = λ/(1 − λx), x ∈ (−∞, 1/λ), è la soluzione del problema di Cauchy  0 y (x) = y(x)2 y(0) = λ. Osserviamo che. per x → 1/λ, yλ (x) → +∞. Per questa ragione, parliamo di esplosione della soluzione al “tempo” x = 1/λ. Per ragioni di tempo ed opportunità, ci limiteremo a considerare solo il caso delle equazioni a variabili separabili, cioè equazioni differenziali del tipo y 0 (x) = f (x)g(y(x)), dove f : (a, b) → R e g : (c, d) → R sono funzioni di una sola variabile. Il seguente teorema ci tranquillizza rispetto all’esistenza e all’unicità della soluzione. Teorema 8.5. Siano f : (a, b) → R e g : (c, d) → R due funzioni derivabili con continuità, dove i due intervalli di definizione possono essere eventualmente illimitati. Per ogni x0 ∈ (a, b), y0 ∈ (c, d) il problema di Cauchy  0 y (x) = f (x)g(y(x)) y(x0 ) = y0 possiede una ed una sola soluzione y : (α, β) → R. Quindi, se le nostre equazioni a variabili separabili sono unicamente risolvibili (sotto le ipotesi del teorema, ovviamente), resta da capire se sia possibile scrivere esplicitamente le soluzioni. Vediamo un modello tratto dalla Fisica. A volte in un processo di crescita intervengono fattori esterni. È il caso di una popolazione (ad esempio di batteri) la cui crescita dipende dalla produzione di cibo. Se si mantiene costante il cibo disponibile, sufficiente diciamo per L elementi della popolazione, ci si può aspettare che la rapidità di crescita tenda a zero quando il numero di individui y tende a L. Un modello semplice è l’equazione differenziale  y , y 0 = ky 1 − L

164

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

detta equazione logistica. Il parametro k è una costante del problema, e cerchiamo le soluzioni del problema di Cauchy   0 y = ky 1 − Ly y(0) = λ. Il Teorema 8.5 dà in particolare l/unicità della soluzione. Vediamo di “indovinare” una soluzione del nostro problema. Se λ = L, allora la soluzione costante y(x) = L per ogni x ∈ R è soluzione. Se λ 6= L, riscriviamo formalmente l’equazione come dy  = k dx y 1 − Ly che suggerisce per integrazione dei due membri y = kx + C, C ∈ R. log y − L Ricavando y, y(x) =

cL , c + e−kx

c ∈ R.

Imponendo che y(0) = L, ricaviamo la condizione cL =λ c−1 che identifica esattamente l’unica soluzione nel caso λ 6= L. Notiamo che no avremmo potuto ricavare la soluzione costante in questo modo. Cerchiamo adesso di adattare la tecnica dell’esempio all’equazione a variabili separabili generale. Notiamo che se g(¯ y ) = 0, la funzione y(x) = y¯ per ogni x è una soluzione. Quindi, se y è una soluzione allora o y è costante oppure y(x) non annulla mai la g. In quest’ultimo caso, g(y(x)) 6= 0 per ogni x, e dividendo l’equazione per g(y(x)) si ottiene y 0 (x) = f (x). g(y(x)) Se integriamo fra x0 e x, con la formula di integrazione per sostituzione arriviamo a Z y(x) Z x 0 Z x 1 y (t) dy = dt = f (s) ds. g(y) y0 x0 g(y(t)) x0

8.2. EQUAZIONI DEL PRIMO ORDINE A VARIABILI SEPARABILI165 Chiamando F una primitiva di f e G una primitiva di 1/g, abbiamo ricavato la soluzione in forma implicita: G(y(x)) − G(y0 ) = F (x) − F (x0 ). Ora, è possibile dimostrare che G è strettamente monotona, dunque invertibile. Possiamo ricavare y(x) dalla relazione sopra: y(x) = G−1 (F (x) − F (x0 ) + G(y0 )) . In teoria, abbiamo trovato l’unica soluzione esplicitamente. In pratica, occorre una dose di sano realismo: il calcolo delle primitive F e G, e soprattutto il calcolo della fuzione inversa di G, sono spesso di difficoltà insormontabile. Con questo non vogliamo incoraggiare lo studente a catalogare come impossibile la risoluzione delle equazioni differenziali: gli esercizi dei temi d’esame sono costruiti in modo che lo studente possa fare esplicitamente tutti i calcoli necessari ad arrivare alla formula della soluzione. Esempio: capitale ed interessi. Supponiamo di depositare in banca un certo capitale u0 ad un tasso di interesse p computato continuamente. Questo significa che in un intervallo di tempo infinitesimo dt il capitale aumenta di una somma du = pu(t) dt proporzionale alla durata dell’intervallo e al capitale stesso u(t). Dividendo7 per dt, otteniamo l’equazi one differenziale u0 (t) = pu(t). Essendo a variabili separabili, la soluzione si ottiene facilmente, ed è espressa dalla formula u(t) = u0 ept . Supponiamo ora di ritirare con regolarità una certa rendita (costante) b. In questo caso l’andamento del capitale risponderà all’equazione u0 (t) = pu(t) − b. È ancora a variabili separabili, e la sua soluzione si ricava risolvendo rispetto a u l’equazione 1 log(pu − b) = t + C, p cioè  1 u(t) = Cept + b . p 7

Questi ragionamenti sono formali, ed infatti i veri interessi vengono computati ad intervalli di tempo prefissati.

166

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

La costante C si ricava imponendo che u(0) = u0 , da cui u0 = C = pu0 − b. In conclusione u(t) =

C+b , p

e dunque

 1 (pu0 − b)ept + b . p

Si danno tre casi. 1. b < pu0 . In questo caso il capitale aumenta con il tempo, anche se meno velocemente di quanto avveniva senza prelievo. In effetti, tutto avviene come se si fosse partiti da un capitale iniziale u0 − pb , remunerato all’interesse p, più un capitale fisso b/p non remunerato. 2. b > pu0 . Se si preleva troppo, il capitale diminuisce, e si estingue in un tempo T che può essere calcolato imponendo che u(T ) = 0. Esplicitamente, dobbiamo risolvere rispetto a T l’equazione (pu0 − b)epT + b = 0. Ricavando T , troviamo T =

b 1 log . p b − pu0

3. b = pu0 . In questo caso il capitale rimane costante, sempre uguale a u0 = b/p. Notiamo che il capitale u0 ed il prelievo b possono essere negativi: se b > pu0 stiamo parlando di un prestito che viene estinto con versamenti regolari. A volte può essere interessante sapere quanto occorre versare per estinguere un prestito u0 in un certo numero T di anni. Si deve semplicemente porre u(T ) = 0 e ricavare b: epT . b = pu0 pT e −1 Se si vuole estinguere il prestito di 100 000 euro al 10% in 10 anni, si dovrà pagare una rata di e b = 10000 ≈ 15800 e−1 euro all’anno, cioè circa 1317 euro al mese. Questo esempio è tratto da [13].

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE

8.3

167

Equazioni lineari del secondo ordine a coefficienti costanti

Come detto nell’introduzione al capitolo, le equazioni lineari possiedono caratteristiche particolari. In questo paragrafo vedremo come utilizzare la linearità dell’equazione per determinare le soluzioni. Per semplicità, ci limiteremo alle equazioni lineari del secondo ordine a coefficienti costanti: ay 00 + by 0 + cy = f,

(8.9)

dove a, b e c sono numeri reali mentre f è una funzione assegnata. Osservazione 8.6. Ogni equazione di ordine due può essere ricondotta ad un sistema di equazioni di ordine uno. Consideriamo ad esempio la (8.9), e introduciamo l’incognita ausiliaria v = y 0 . Allora la (8.9) equivale al sistema  0 av + bv + cy = f y 0 = v. Da un punto di vista teorico, si tratta di un risultato di importanza fondamentale, poiché permette di studiare solamente i sistemi di equazioni differenziali di primo ordine. Dal punto di vista pratico, spesso è più conveniente sfruttare tecniche particolari, e la riduzione ad un sistema non offre molto aiuto. Come per le equazioni lineari del primo ordine, consideriamo innanzitutto il caso omogeneo f = 0. L’equazione ay 00 +by 0 +cy = 0 suggerisce la ricerca di soluzioni y tali che y, 0 y e y 00 siano multipli di una medesima funzione. Cerchiamo allora una soluzione y(x) = erx , per oppurtuni valori di r ∈ R. Sostituendo nell’equazione, troviamo in effetti  erx ar2 + br + c = 0. Questa identità può essere soddisfatta soltanto se ar2 + br + c = 0

(8.10)

La teoria delle equazioni algebriche di secondo grado ci dice che le soluzioni reali di (8.10) sono due, una8 oppure nessuna a seconda che il discriminante 8

Gli insegnanti delle scuole superiori amano parlare di due radici coincidenti. Non è sbagliato, ed anzi in certi casi è di grande aiuto usare tale espressione. Per i nostri scopi, sarebbe come dire che oggi indosso due paia di pantaloni coincidenti: logicamente ineccepibile ma francamente superfluo. Tutto si sitema introducendo la molteplicità delle radici di un polinomio, concetto comunque be al di là dei limiti del nostro corso.

168

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

∆ = b2 −4ac sia positi vo, nullo oppure negativo. Schematicamente, vediamo come trovare le soluzioni nei tre casi. (1) Due radici reali. L’equazione (8.10) possiede due radici reali distinte r1 e r2 , e dunque le due funzioni x 7→ er1 x ,

x 7→ er1 x

sono soluzioni. Per il principio di sovrapposizione, l’integrale generale dell’equazione omogenea è y(x) = c1 er1 x + c2 er2 x . (8.11) (2) Una radice reale. Se ∆ = 0, l’unica radice reale è r=−

b . 2a

Dunque abbiamo trovato una soluzione b

x 7→ e− 2a x per l’equazione omogenea. Malauguratamente, questa non basta a descrivere l’integrale generale. Possiamo tuttavia provare a cercare una soluzione della forma b x 7→ e− 2a x u(x). Sostituendo, otteniamo la condizione (r = −b/(2a))  b 0 = e− 2a x (ar2 + br + c)u + au00 + (2ar + b)u0 = au00 . Dunque u00 = 0, e integrando due volte u(x) = c1 + c2 x. L’integrale generale della nostra equazione omogenea è pertanto b

y(x) = e− 2a x (c1 + c2 x) .

(8.12)

(3) Nessuna radice reale. Questo caso è sempre il più difficile da analizzare. Non avendo a disposizione l’algebra dei numeri complessi, è piuttosto macchinoso costruire le soluzioni. Ci limitiamo pertanto a proporle “ex cathedra”. Definiamo √ b 4ac − b2 α= , ω= . 2a 2a

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE

169

L’integrale generale nel caso ∆ < 0 si scrive y(x) = Ae−αx cos(ωx + ϕ)

(8.13)

al variare delle costanti A ≥ 0 e ϕ ∈ [−π/2, π/2). In alternativa, le formule di addizione per la funzione coseno dicono che l’integrale generale può essere scritto y(x) = e−αx (C1 sin(ωx) + C2 cos(ωx)) , (8.14) al variare delle costanti reali C1 e C2 . Questa formula è meno concisa della precedente, ma spesso preferibile per fare i calcoli. Il caso non omogeneo si discute usando il principio di sovrapposizione: si trova l’integrale generale dell’equazione omogenea e si somma ad una soluzione particolare dell’equazione non omogenea. Tutto sta nel calcolare quest’ultima. Vi sono essenzialmente tre modi, per le equazioni del secondo ordine a coefficienti costanti. 1. Procedere per tentativi. Ad esempio, se f è un polinomio di grado n, si cerca una soluzione particolare che sia un polinomio di grado n + 2. Questa tecnica è la più semplice ma anche la più rischiosa, dato che funziona solamente per classi molto ristrette di funzioni f . 2. Utilizzare il metodo della variazione delle costanti. Siano y1 e y2 due soluzioni dell’equazione omogenea. Si cerca una soluzione dell’equazione non omogenea del tipo yf (x) = c1 (x)y1 (x) + c2 (x)y2 (x),

(8.15)

dove c1 e c2 sono funzioni incognite. Oltre al fatto che yf risolva l’equazione, si impone la condizione ausiliaria9 c01 (x)y1 (x) + c02 (x)y2 (x) = 0. Per trovare le incognite c1 e c2 occorre perciò risolvere il sistema 

c01 (x)y1 (x) + c02 (x)y2 (x) = 0 c01 (x)y10 (x) + c02 (x)y20 (x) = f (x).

(8.16)

A dispetto delle apparenze, questo sistema non è di difficile soluzione: basta ricavare algebricamente c01 e c02 , e integrare. 9

Se avessimo il tempo per la teoria generale delle equazioni differenziali lineari, potremmo far vedere che questa condizione è tutt’altro che artificiosa. Si veda [9] per i dettagli.

170

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

3. Utilizzare la formula di Duhamel.10 Se u è la soluzione del problema di Cauchy  00  au + bu0 + c = 0 u(0) = 0 (8.17)  0 u (0) = 1, allora

Z yf (x) =

x

u(x − s)f (s) ds. 0

Si potrebbe dimostrare che questa espressione altro non è che una conseguenza del metodo di variazione delle costanti. L’esperienza didattica insegna che questo metodo risolutivo non è particolarmente gradito agli studenti. Esempio 8.7. Applichiamo tutti questi metodi all’equazione y 00 − y = x2 .

(8.18)

La soluzione generale dell’equazione omogenea y 00 = y = 0 è y(x) = c1 ex + c2 e−x . Poiché il secondo membro dell’equazione è un polinomio di grado 2, cerchiamo un polinomio di grado 4 che sia una soluzione particolare. Il generico polinomio di quarto grado ha la forma a0 + a1 x + a2 x2 + a3 x3 + a4 x4 , e sarà una soluzione di (8.18) se e solo se 12a4 x2 + 6a3 x − 2a2 − a0 − a1 x − a2 x2 − a3 x3 − a4 x4 = x2 per ogni x. Uguagliando i coefficienti delle stesse potenze di x, dobbiamo risolvere il sistema   a4 = 0      a3 = 0 12a4 − a2 = 1    6a3 − a1 = 0    2a − a = 0. 2 0 Operando per sostituzione, troviamo molto facilmente l’unica soluzione a0 = −2, a1 = 0, a2 = −1, a3 = a4 = 0. Quindi una soluzione particolare è la funzione polinomiale x 7→ −x2 − 2. Se usiamo invece il metodo della variazione delle costanti, dobbiamo risolvere il sistema ( ex c01 + e−x c02 = 0 ex c01 − e−x c02 = x2 , 10

Questa formula è spesso attribuita a Cauchy, che la utilizzò in una forma equivalente ma diversa da quella che riportiamo. È interessante osservare che la formula di Duhamel vale per tutte le equazioni differenziali lineari.

8.3. EQUAZIONI LINEARI DEL SECONDO ORDINE

171

che ci porta immediatamente a 1 c01 = x2 e−x , 2

1 c02 = − x2 ex . 2

Integrando, c1 = (− 12 x2 − x − 1)e−x , c2 = (− 12 x2 + x − 1)ex , e quindi la soluzione particolare è yf (x) = c1 ex + c2 e−x = −x2 − 2. Utilizzando infine la formula di Duhamel, si trova che  Z x 1 x−2 1 s−x 2 s ds e − e yf (x) = 2 2 0 Z Z 1 x x 2 −s 1 −x x 2 s = s e ds − e s e ds. e 2 2 0 0 Lasciamo al lettore il calcolo di questi ultimi due integrali (suggerimento: integrare per parti due volte). Alla fine si giunge allo stesso risultato: yf (x) = −x2 − 2. In conclusione, la soluzione generale di (8.18) è y(x) = c1 ex + c2 e−x − x2 − 2. Sembra evidente che, almeno per funzioni f di tipo molto particolare, conviene almeno tentare di indovinare una soluzione particolare yf con il primo metodo. Esempio 8.8. Vogliamo risolvere11 l’equazione y 00 + 2y 0 + y =

e−x . x

Osserviamo che il polinomio associato all’equazione è λ2 +2λ+1 = 0, che possiede la radice doppia λ = −1. Dunque la soluzione generale dell’equazione omogena sarà y0 (x) = C1 e−x + C2 xe−x . Occorre determinare una soluzione particolare dell’equazione completa. Poiché sembra improbabile indovinare ad occhio una soluzione, ricorriamo alla formula di Duhamel. La soluzione del problema  00 0  y + 2y + y = 0 y(0) = 0   0 y (0) = 1 11

Con questa espressione intenderemo sempre che vogliamo calcolare la soluzione generale.

172

CAPITOLO 8. EQUAZIONI DIFFERENZIALI ORDINARIE

è la funzione y¯(x) = xe−x : basta imporre le condizioni y(0) = 0 e y 0 (0) = 1 e determinare le giuste costanti C1 e C2 . Quindi la teoria ci dice che Z x Z x e−s e−s y¯(x − s) ds = (x − s)e−(x−s) ds yf (x) = s s 1 1 Z x Z x x − s −x x − s −2−t+s e ds = e ds = s s 1 1 Z x x−s = e−x ds = e−x [x log |s| − s]s=x s=1 s 1 = e−x (x log x − x + 1) . Un’osservazione: abbiamo integrato fra 1 ed x invece che fra 0 ed x perché la funzione a secondo membro dell’equazione non è definita in 0. Infine, la soluzione generale della nostra equazione è y(x) = C1 e−x + C2 xe−x + x(log x − 1)e−x . Per inciso, si potrebbe far vedere che la formula di Duhamel è solo un caso particolare del metodo della variazione delle costanti. La formula di Duhamel sembra il metodo più invitante, sebbene sia in realtà abbastanza insidiosa a causa degil integrali complicati a cui conduce. Quasi tutto quello che abbiamo esposto è tratto da [11]. Numerosi esempi, modelli e tecniche risolutive per le equazioni differenziali ordinarie si trovano nei primi capitoli del libro [17]. Pur non presentando alcuna giustificazione teorica dei risultati, in questo agile libretto lo studente interessato può facilmente impratichirsi con la risoluzione delle equazioni differenziali più comuni. Si veda anche [8].

Capitolo 9 Metodi del calcolo approssimato In quest’ultimo capitolo, affronteremo succintamente alcuni problemi dell’Analisi Numerica. Pur tenendoci a un livello di difficoltà davvero basso, abbiamo l’ambizione di proporre alcuni metodi di calcolo approssimato. In particolare, proporremo il metodo di interpolazione di Lagrange per costruire un polinomio che unisca dei punti del piano cartesiano. Di seguito, vedremo tre modi per tovare approssimazioni numeriche degli integrali definiti. Trattandosi di argomenti complementari al corso, non ci soffermeremo su molti dettagli, né discuteremo la questione più importante di tutta l’Analisi Numerica: quella della precisione dei metodi.

9.1

Interpolazione polinomiale

Supponiamo che, durante un esperimento di laboratorio, le misurazioni ci forniscano delle coppie numeriche rappresentative di una quantità fisica o chimica in relazione a un’altra quantità variabile: (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). La prima cosa che ci viene in mente di fare è di segnare tali punti nel piano cartesiano, cenrcando di capire se esista una relazione fra i valori delle x e quelli delle y.1 Innanzitutto, la presenza di punti con uguale ascissa e diverse ordinate creerebbero problemi insormontabili, perché non ci sarebbe speranza di avere 1

Chi scrive è un matematico “puro”, e in queste situazioni è convinto che dieci o cento punti nel piano non servano assolutamente a niente. Anche se fossero allineati lungo una retta orizzontale, la logica matematica non ci permetterebbe di trarre la conclusione che ogni scienziato “applicato” ne trarrebbe. Chi ci dice che, facendo anche solo una misurazione in più, non troveremmo un punto completamente disallineato?

173

174

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

la y in funzione della x. Sbarazziamoci fin d’ora di tale caso, peraltro ridicolo da un punto di vista sperimentale. Infatti, se alla stessa x corrispondessero due valori sperimentali distinti della y, dovremmo concludere che non siamo capaci di fare l’esperimento. In seconda battuta, fin da bambini ci siamo divertiti a “unire i puntini” sulle riviste di enigmistica. Questo metodo funziona sempre, e produce una funzione continua il cui grafico è la spezzata che congiunge i dati sperimentali. Quasi sicuramente, questa funzione non sarà però derivabile nei punti di congiunzione. E soprattutto sarebbe presuntuoso ipotizzare che proprio quei pochi dati calcolati siano gli “spigoli” della vera funzione che lega le ordinate alle ascisse. Raramente i fenomeni macroscopici misurabili in laboratorio presentano comportamenti spigolosi. Ben consci di tutte queste difficoltà, rivolgiamo allora lo sguardo verso una classe di funzioni che uniscono vari pregi: facilità di derivazione, di integrazione, di calcolo dei valori. Stiamo parlando dei polinomi. Ora, c’è un evidente legame fra il numero di dati sperimentali e il grado del polinomio che vogliamo trovare. Se abbiamo due coppie di punti, possiamo unirli con una retta univocamente individuata2 , ma possiamo anche unirli con infiniti rami di parabole variamente disposte nel piano cartesiano. Per convincere di ciò anche lo studente più scettico, scegliamo i due punti (−1, 0) e (1, 0). La retta orizzontale y = 0 li congiunge, ma anche tutte le parabole y = a(x2 − 1) al variare di a ∈ R. Riassumendo, con due punti abbiamo un unico polinomio di grado 1 = 2 − 1, e infiniti polinomi di grado maggiore di 1. Per tre punti, la geometria analitica delle scuole superiori ci assicura che esiste una ed una sola parabola che li unisce, ma è facile costruire infiniti polinomi di quarto grado che passano per tali punti. Ci sembra di vedere un legame fra il numero n + 1 di dati sperimentali e il grado n del polinomio univocamente determinato. Il seguente teorema non solo ci conforta in questa convinzione, ma ci fornisce una formula esplicita per scrivere tutti i coefficienti del polinomio di grado n voluto. Teorema 9.1 (Polinomio interpolatore di Lagrange). Dati n+1 punti distinti x0 , x1 , . . . , xn e n + 1 numeri reali y0 , y1 , . . . , yn non necessariamente distinti, esiste uno ed un solo polinomio P di grado (minore o uguale a) n tale che P (xj ) = yj per ogni j = 0, 1, 2, . . . , n. Questo polinomio è dato da P (x) =

n X yk Ak (x) k=0

2

Ak (xk )

,

Il famoso assioma “per due punti passa una ed una sola retta”.

(9.1)

9.1. INTERPOLAZIONE POLINOMIALE

175

dove Ak (x) =

Y (x − xj ). j6=k

Certo, ilQpolinomio interpolatore ha un aspetto vagamente misterioso. Il simbolo di produttoria è analogo a quello della sommatoria: serve a scrivere brevemente i prodotti invece che le somme. Vediamo di spiegare brevemente perché il polinomio di Lagrange ha proprio questo aspetto. Partendo dal caso molto semplice di due punti x0 e x1 , consideriamo le due espressioni x − x0 e x − x1 . La prima si annulla per x = x0 , la seconda per x = x1 . Se poi le dividiamo opportunamente, troviamo le espressioni x − x0 , x 1 − x0

x − x1 . x 0 − x1

La prima vale 1 per x = x1 . mentre la seconda vale 1 per x = x0 . Pertanto l’espressione x − x0 x − x1 y0 + y1 x1 − x0 x0 − x1 vale y0 per x = x0 e y1 per x = x1 . Ovviamente, al variare di x ∈ R, questa espressione rappresenta un polinomio di primo grado. Confrontandolo con il Teorema precedente, abbiamo costruito esattamente il polinomio di Lagrange di primo grado. Non è difficile convincersi che il generico polinomio di Lagrange di grado n si costruisce seguendo lo stesso principio: prima si trovano n polinomi Aj , j = 0, 1, . . . , n, che hanno la proprietà Aj (xi ) = 0 per ogni i 6= j, e poi si divide per Aj (xj ) in modo da ottenere un’espressione polinomiale che vale 1 per x = xj . Infine si moltiplica ognuna di queste espressioni per yj e si somma rispetto a j. Il risultato è esattamente il polinomio interpolatore di Lagrange. Osservazione. Un approccio più concreto è il seguente. polinomio di grado (al più) n, e lo scriviamo nella forma P (x) =

n X

Vogliamo un

ak x k .

k=0

Come troviamo i coefficienti incogniti a0 , a1 , ecc.? È semplice: imponendo le condizioni P (xj ) = yj , j = 0, . . . , n.

176

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

Ricaviamo un sistema di n + 1 equazioni lineari nelle n + 1 incognite aj , j = 0, . . . , n. Risolvendo questo banale3 sistema, ricaveremo il polinomio interpolatore. Salvo errori di calcolo, l’unicità di tale polinomio significa che ad esso possiamo arrivare in qualunque modo ci faccia comodo. Trovato il polinomio interpolatore, che ne facciamo? In primo luogo, lo possiamo usare proprio per interpolare, cioè per “indovinare” i valori della funzione sperimentale nei punti compresi fra i nodi sperimentali usati per la costruzione del polinomio.4 Solo per fare un esempio di interesse storico e matematico, le celebri tavole dei logaritmi con cui nei secolo scorsi generazioni di ingegneri hanno fatto i loro calcoli erano basate sull’interpolazione lineare. Più correttamente, le tavole riportavano una grande quantità di “nodi” (i cui logaritmi erano calcolati con metodi che qui non possiamo approfondire). Se si voleva calcolare il logaritmo di un numero che non appariva sulle tavole, lo si localizzava fra i due nodi adiacenti, e si faceva l’interpolazione lineare fra di essi. Questo procedimento comportava un errore, tutto sommato trascurabile grazie alla densità dei nodi. Ci auguriamo vivamente che il nostro studente non si abbandoni a sorrisi di scherno verso i suoi “avi” scienziati. Se è vero che i moderni calcolatori sanno operare con precisione molto alta, anch’essi forniscono risposte approssimate. Facendo qualche confronto fra i risultati del metodo delle tavole e quelli di una calcolatrice scientifica a dieci cifre decimali, ci si accorge che le tavole “sbagliano” mediamente dalla quinta cifra in poi. Un confronto decisamente lusinghiero, se si considera che le tavole erano preparate calcolando con carta e matita! Un altro uso possibile del polinomio interpolatore è quello di usarlo per calcolare l’integrale della funzione sperimentale incognita. Infatti, questo integrale potrebbe avere un significato concreto, e sarebbe pressoché impossibile stimarne il valore in altro modo. Su questo problema ritorneremo nella prossima sezione. Più delicato e addirittura sconsigliabile se non come ultimo tentativo è l’uso del polinomio per calcolare la derivata della funzione sperimentale. La ragione di questo scetticismo dovrebbe essere chiaro. I grafici di due funzioni possono essere molto vicini nel piano cartesiano, ma avere pendenze molto diverse. Si pensi, intuitivamente, a una funzione costante e a una funzione che oscilla “furiosamente” fra due valori vicini alla costante. La prima ha pendenza identicamente nulla, la seconda ha pendenze molto 3

D’accordo, stiamo facendo dell’ironia fuori luogo. Si parla invece di estrapolazione quando si pretende di calcolare i valori esterni al più piccolo e al più grande nodo sperimentale. Questo è un procedimento molto pericoloso. Se dati sperimentali molto fitti possono ragionevolmente indurre a un miglioramento dell’interpolazione, nulla ci rassicura sul fatto che il polinomio approssimi bene la funzione sperimentale a grande distanza dai valori calcolati in laboratorio. 4

9.2. INTEGRAZIONE NUMERICA

177

brusche vicino alle oscillazioni. Poiché il nostro polinomio interpolatore è costruito solo ed esclusivamente per assumere gli stessi valori della funzione sperimentale nei nodi calcolati, è difficile credere che serva ad approssimare accuratamente la derivata. Anche per gli esperti, la derivazione numerica è un argomento tra i più difficili, e naturalmente non ce ne occuperemo in questa sede. Osservazione 9.2. Esistono altri tipi di approssimazione polinomiale, anch’essi molto diffusi nei problemi delle scienze applicate. Un primo esempio è quello di cercare un polinomio che passi per i nodi (xj , yj ) e che in tail punti abbia un assegnato valore della derivata prima. I polinomi che se ne ricavano5 prendono il nome di polinomi di Hermite. Pur senza soffermarci sulle loro proprietà, è evidente che a parità di nodi occorrono polinomi di grado più alto che per la semplice int erpolazione di Lagrange. Pensiamo ai due punti: sappiamo che per essi passa esattamente un polinomio di grado uno, ma il valore della derivata nei due nodi è fissato (e costante per i due punti). Volendo prescrivere anche i due valori della derivata nei due nodi, ci serev un polinomio di grado maggiore. Ne deduciamo che l’interpolazione di Hermite fornisce polinomi sensibilmente diversi da quelli di Lagrange. Un altro esempio è quello della ricerca della retta che “meglio approssima” un insieme di punti del piano cartesiano. Abbiamo virgolettato la richiesta di approssimazione perché non vogliamo entrare nei dettagli di questo metodo. È però evidente che non si pu ò parlare di interpolazione: se prendiamo tre punti non allineati nel piano cartesiano, non ci sarà nessuna retta di interpolazione. Ha invece senso chiedersi quale sia (se esiste) la retta che passa più vicino a tutti i punti segnati. Fra i metodi più popolari per trattare questo problema è quello dei minimi quadrati. Facciamo un esempio numerico: prendiamo i tre punti di coordinate (−1, 0), (0, 0) e (1, 0), osservano che appartengono alla parabola di equazione y = x2 . Si calcola abbastanza velocemente che la retta che passa più vicino a questi punti ha equazione y = 1/2. Siamo ben lontani dal concetto di interpolazione.

9.2

Integrazione numerica

Ci poniamo il problema di calcolare, con un’approssimazione prefissata, un integrale definito Z b f (x) dx, a 5

Lo studente rifletta sul fatto che non è affatto banale che tali polinomi esistano.

178

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

dove f è una funzione continua. Non è sempre possibile conoscere esplicitamente una primitiva di f o, comunque, esprimere il valore dell’integrale mediante una formula in cui compaiono solo funzioni elementari; anzi si può dire che queste situazioni favorevoli devono ritenersi eccezionali. Presenteremo tre metodi, tutti ispirati più o meno direttamente alla definizione stessa di integrale di Riemann. 8.2.1 Il metodo dei rettangoli Fissato un intero n > 0, si ponga xk = a +

b−a k n

(k = 0, 1, . . . , n)

e si assuma come valore approssimato dell’integrale Sn =

b−a (f (x0 ) + f (x1 ) + · · · + f (xn−1 )) . n

Il seguente risultato esprime la precisione con cui Sn approssima il vero valore dell’integrale. Teorema 9.3. Ammettendo che, per qualche costante M1 > 0 si abbia |f 0 (x)| ≤ M1 in [a, b] risulta Z b M1 (b − a)2 Sn − ≤ . f (x) dx 2 n a Rb Quindi vediamo che limn→+∞ Sn = a f (x) dx, e l’errore commesso tende a zero come 1/n. 8.2.2 Il metodo delle tangenti Il metodo precedente, come era da aspettarsi, è piuttosto grossolano. L’intuizione ci dice che, quando f sia abbastanza regolare, una somma del P tipo k (xk − xk−1 )f (zk ) fornisca una migliore approssimazione dell’integrale se per ogni intervallo il punto zk coincide con il punto medio, cioè zk = (xk−1 + xk )/2. Sia dunque ancora xk = a +

b−a k n

e sia zk = Poniamo Sn0 =

(k = 0, 1, . . . , n)

xk−1 + xk . 2

b−a (f (z1 ) + f (z2 ) + · · · + f (zn )) . n

9.2. INTEGRAZIONE NUMERICA

179

Teorema 9.4. Sia f una funzione dotata di derivate prima e seconda continue in [a, b] e si abbia |f 00 (x)| ≤ M2 . Allora Z b 0 M2 (b − a)3 Sn − ≤ f (x) dx . 24 n2 a A parità di nodi, questo metodo fornisce effettivamente un’approssimazione migliore. Osservazione. Spesso si definisce uno stimatore della precisione numerica, chiamato ordine del metodo. Prendendo come funzioni–campione i soliti polinomi, un metodo numerico è di ordine N se esso è esatto (cioè non si comemtte nessun errore) per tutti i polinomi di ordine (non superiore a) N . È facile convincersi che sia il metodo dei retatngoli che quelo dei trapezi sono di ordine N = 1. Basta pensare alla costruzione delle approssimazion per rendersi conto che Sn e Sn0 coincidono con il valore dell’integrale di f ogni volta che f è una funzione lineare. In questo senso, invitiamo lo studente ad usare con la dovuta cautela il concetto di precisione per i metodi numerici. Potendosi dimostrare l’ottimalità delle stime fornite dai teoremi precedenti, deduciamo che l’ordine è uno stimatore che non si sovrappone alla velocità con cui l’errore tende a zero. D’altra parte, l’ordine non fa ricorso al numero di derivate disponibili per la funzione integranda, e questo lo rende sensato anche per le funzioni che siano solo continue. Avvertiamo che i tre metodi precedenti sono esposti anche in [12], dove però le formule relative agli errori sono decisamente migliorabili. Una rapida ispezione delle stime mostra che esse sono matematicamente rigorose, ma diverse da quelle dei nostri teoremi proprio in quanto è richiesta meno regolarità alla funzione integranda. 8.2.3 Il metodo di Cavalieri–Simpson Il metodo delle tangenti consiste nel compiere l’integrazione dopo aver sostituito, in ciascun intervallo della suddivisione, il grafico della funzione con la tangente al grafico, in corrispondenza al punto di mezzo. Viene spontaneamente l’idea di introdurre una curva che meglio approssimi il grafico, almeno quando queto sia abbastanza “liscio”. Il metodo che esponiamo consiste nell’approssimare il grafico con un arco di parabola, che coincida con la curva in corrispondenza degli estremi di ciascun intervallo e del punto di mezzo. 6 Presa dunque la suddivisione {x0 , x1 , . . . , xn } dell’intervallo [a, b] in n intervalli di uguale ampiezza, e posto zk = (xk−1 + xk )/2, consideriamo un 6

Ricordiamo infatti che servono tre punti distinti per determinare univocamente una parabola che li congiunga.

180

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

polinomio di secondo grado, che potrà essere scritto nella forma pk (x) = α(x − zk )2 + β(x − zk ) + γ, e imponiamo le condizioni pk (xk−1 ) = f (xk−1 ),

pk (zk ) = f (zk ),

Ponendo xk − zk = zk − xk−1 = σ =

pk (xk ) = f (xk ). b−a , 2n

si avrà γ = f (zk ) ασ 2 + βσ = f (xk ) − f (zk ) ασ 2 − βσ = f (xk−1 ) − f (zk ). Si ha poi7 Z xk

 x k (x − zk )3 2 pk (x) dx = α = ασ 3 + 2γσ. + γ(x − zk ) 3 3 xk−1 xk−1

Ricavando α e γ dal sistema, Z xk f (xk ) + f (xk−1 ) + 4f (zk ) pk (x) dx = σ 3 xk−1 b − a f (xk ) + f (xk−1 ) + 4f (zk ) = . n 6 Sommando rispetto all’indice k, otteniamo la seguente espressione approssimata dell’integrale: n

Sn? =

b − a X f (xk ) + f (xk−1 ) + 4f (zk ) n k=1 6   b − a = f (x0 ) + f (xn ) + 2 f (x1 ) + f (x2 ) + · · · + f (xn−1 ) 6n   + 4 f (z1 ) + f (z2 ) + · · · + f (zn ) .

Teorema 9.5. Sia f una funzione continua con le sue derivate fino al quarto ordine in [a, b] e sia |D4 f (x)| ≤ M4 . Allora Z b ? M4 (b − a)5 1 Sn − ≤ f (x) dx . 2880 n4 a Il termine β2 (x−zk )2 si semplifica perché stiamo integrando su un intervallo simmetrico rispetto a zk . 7

9.2. INTEGRAZIONE NUMERICA

181

Dalla costruzione emerge chiaramente che il metodo di Cavalieri–Simpson è esatto per i polinomi di secondo grado, e dunque è un metodo di ordine N = 2. Osservazione 9.6. Avvertiamo lo studente che su molti testi vengono utilizzate notazioni diverse. Noi abbiamo introdotto, per ogni coppia di nodi xk e xk+1 un noto di comodo zk . Altri autori prendono invece tre nodi consecutivi xk−1 , xk e xk+1 della suddivisione, considerando ovviamente xk alla stregua del nostro zk . A questo punto però bisogna scegliere obbligatoriamente n pari, altrimenti non si riesce ad arrivare a b con l’ultimo passaggio. È chiaro che l’idea resta sempre quella di approssimare f mediante archi di parabola. Concludiamo con un confronto: cerchiamo di approssimare Z 2 dx . log 2 = x 1 Prendendo n = 4 nel metodo delle tangenti, i punti di mezzo saranno 9 11 13 15 , , , . 8 8 8 8 Troviamo dunque S40

1 = 4



8 8 8 8 + + + 9 11 13 15

 = 0.6910

mentre log 2 = 0.6931... Con 4 suddivisioni, il valore è corretto alla seconda cifra decimale. Usiamo invece il metodo di Cavalieri–Simpson con n = 2. facendo qualche calcolo si arriva a    1 1 4 4 4 ? S2 = 1+ + +4 + = 0.6932... 12 2 3 5 7 Come si vede, l’approssimazione ottenuta è sensibilmente migliore già con la metà di suddivisioni.8 Il contenuto di questo paragrafo è preso dall’ultimo capitolo di [22]. Non trattandosi di un testo specializzato nel calcolo numerico, la trattazione ha un’impostazione molto geometrica ed intuitiva. In effetti, dubitiamo che lo studente abbia scorto il legame fra i tre metodi proposti e l’interpolazione polinomiale. Per il metodo dei rettangoli, tale legame semplicemente non c’è, o comunque è decisamente “degenere”. Infatti ci siamo limitati 8

A questo riguardo, si leggano gli ultimi capoversi del capitolo.

182

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

ad approssimare la funzione continua f con segmenti orizzontali, ottenendo un’approssimazione chiaramente discontinua. In realtà, il metodo di Cavalieri–Simpson consiste evidentemente nell’integrazione di un polinomio interpolatore di secondo grado, come abbiamo evidenziato nella costruzione. Come utile esercizio, lo studente potrà verificare che partendo dal polinomio interpolatore di Lagrange passante per i tre punti (xk , f (xk )), (zk , f (zk ), (xk+1 , f (xk+1 )) e integrandolo fra xk e xk+1 si perviene alla stessa formula. Non abbiamo seguito questa via solo perché conveniva sfruttare la simmetria rispetto al punto mediano zk per semplificare alcuni calcoli. Resta da capire se l’integrazione del polinomio interpolatore di primo grado conduca a una formula di integrazione approssimata efficiente. La risposta è affermativa, e il metodo va sotto il nome di metodo dei trapezi. Fissata la solita suddivisione {x0 , x1 , . . . , xn } di [a, b], per ogni intervallino [xk−1 , xk ] possiamo introdurre il polinomio di interpolazione lineare p1 , che esplicitamente si scrive p1 (x) =

f (xk ) − f (xk−1 ) (x − xk−1 ) + f (xk−1 ). xk − xk−1

Integrando, 9 Z xk f (xk ) + f (xk−1 ) b − a f (xk ) + f (xk−1 ) p1 (x) dx = (xk − xk−1 ) = . 2 n 2 xk−1 Infine, sommando rispetto all’indice k, troviamo la formula di approssimazione per l’integrale esteso da a a b: n

Sntrap

b − a X f (xk ) + f (xk−1 ) = . n k=1 2

Per costruzione, questo è un metodo di ordine N = 1, dato che i polinomi per i quali l’interpolazione lineare è sempre esatta sono quelli di grado uno. È altresì evidente che nulla ci impedisce di considerare polinomi interpolatori di grado più alto di due. Potremmo infatti raggruppare i punti a tre a tre e cercare un polinomio di terzo grado che li unisca.10 Se questo può sembrare un gioco appassionante con cui mettere alla prova la propria 9

Lo studente si convinca che l’integrale di p1 altro non è che l’area di un trapezio rettangolo di basi f (xk ) e f (xk−1 ) e altezza (b − a)/n. 10 Evidentemente, capiterà di dover supporre che il numero di intervalli della suddivisione sia pari. Questo dettaglio sarà sottinteso.

9.2. INTEGRAZIONE NUMERICA

183

comprensione dell’argomento, ci si accorge in fretta che esagerare non serve a molto. Lo studente avrà senz’altro notato che far passare un polinomio di decimo grado per undici nodi è solo una complicazione tecnica: tanto vale “raffinare” la suddivisione dell’intervallo e usare un polinomio di grado inferiore. La formula di Cavalieri–Simpson è una delle preferibili, dal momento che unisce accuratezza e semplicità. Nella letteratura specializzata (si veda [23]), molta importanza viene data ai metodi di Newton–Cotes, basati proprio sui polinomi di Lagrange. Infine, tutti i metodi di integrazione approssimata hanno la caratteristica di essere facilmente implementabili in un qualsiasi linguaggio di programmazione moderno, come il C, il Python, il Fortran o anche uno dei linguaggi di alto livello come Matlab, Mathematica o Maple. Per tutti si tratta solamente di ricevere in input una stringa di dati (i nodi sulle ascisse e i corrispondenti valori sulle ordinate) e di emettere in output un numero ottenuto mediante alcune semplici operazioni aritmetiche. Lo studente interessato potrà trovare alcuni esempi, assolutamente elementari e primitivi, di implementazione nel linguaggio C dei metodi dei trapezi, delle tangenti e di Simpson sul sito dell’autore, nella sezione di didattica. La scelta del linguaggio C è legata all’esistenza dei compilatore Open Source gcc, liberamente installabile su ogni sistema operativo moderno e già presente nelle principali distribuzioni GNU/Linux. Naturalmente il codice è così semplice da poter essere tradotto in tutti i linguaggi scientifici conosciuti. Solo per comodità, riportiamo di seguito il brevissimo listato del metodo dei trapezi in Python. La prima riga è specifica per i sistemi Unix (GNU/Linux, *BSD, Apple Mac OS X, ecc.) #!/usr/bin/python def f(x) : t = 1./x return t n = 1000 i=0 x1 = 1. x2 = 1. + 1./n S = 0. while i
184

CAPITOLO 9. METODI DEL CALCOLO APPROSSIMATO

print S Lo studente noterà che abbiamo evitato l’uso degli array per memorizzare i nodi della suddivisione e le corrispondenti immagini. Un informatico noterebbe che il listato in Python è preferibile a quelli in C proprio perché usa strutture più elementari. Per un matematico, al contrario, è più spontaneo usare un array di numeri reali.

Epilogo Siamo arrivati alla fine del nostro viaggio, durato circa dodici settimane e accompagnato probabilmente da prove scritte intermedie. Lo studio di queste dispense, affiancate dagli appunti del corso e delle esercitazioni, e soprattutto completato dalla lettura di uno dei testi segnalati nella bibliografia, dovrebbe trasmettere allo studente le conoscenze indspensabili a qualsiasi laureando in una disciplina scientifica. Sono sicuro che solo un numero statisticamente trascurabile di iscritti serberà un ricordo piacevole del corso di Matematica. Resta tuttavia la speranza che, almeno una volta, le idee studiate con fatica in questi mesi possano rivelarsi utili. A tutti gli studenti che sono arrivati alla fine delle lezioni senza commettere gesti insani, va un ringraziamento e l’invito a proseguire la carriera universitaria con serietà e passione.

185

186

EPILOGO

Commento alla bibliografia Innanzitutto, suggeriamo senz’altro a tutti gli studenti di leggere il classico testo di Courant e Robbins [7]. Ne esiste una traduzione italiana risalente agli anni ’70 del secolo scorso. È una descrizione molto piacevole e scorrevole dei fondamenti della matematica moderna, spesso presentati attraverso esempi e problemi di facile comprensione. Non è però un valido libro di testo per un corso universitario. Il fatto che il libro di G.H. Hardy [16] risalga al 1921 (ed era già la terza ristampa!) dovrebbe essere un chiaro segnale della classicità degli argomenti trattati nel nostro corso. A parte qualche notazione ormai caduta in disuso, il testo di Hardy conserva ancora oggi un notevole fascino scientifico, e potrebbe tranquillamente essere utilizzato nelle nostre università. Un manuale molto recente, che lo studente può trovare interessante ed educativo, è [5]. Lo stile del libro è veloce e preciso, e l’unica differenza fra il suo contenuto e le lezioni in aula è la costruzione dell’integrale di Riemann. In questo libro è stata privilegiata la definizione più intuitiva dell’integrale definito mediante il limite delle somme integrali. Come dimostriamo nel Teorema 6.10, di fatto la nostra costruzione coincide con quella di [5], ma si rivela più maneggevole nelle dimostrazioni. Un altro testo di riferimento per il corso è [6]: un libro moderno e ricco di contenuti, approfondimenti ed esercizi svolti. Alcuni argomenti vengono però trattati da un punto di vista diverso, e presuppone nel lettore una preparazione che, di questi tempi, non sembra essere molto diffusa. Proprio quest’anno è uscito il manuale [13] che propone per intero gli argomenti trattati nel nostro corso (con un capitolo di ripasso della geometria analitica, utile per rivedere o apprendere qualche concetto utilizzato anche da noi). Il ritmo dell’esposizione è molto tranquillo, e numerosi sono gli esempi e i commenti ai contenuti. La lunga esperienza didattica ha suggerito all’Autore l’omissione di alcune dimostrazioni particolarmente tecniche; in questi rari casi, lo studente troverà i dettagli sulle dispense. Più simile alle nostre dispense è invece [11], strutturato in capitoli snelli e adatti ad essere trattati in due ore circa di lezione. Le successioni sono 187

188

EPILOGO

introdotte soltanto alla fine, come capitolo facoltativo. Questo rende alcune dimostrazioni meno trasparenti ed intuitive, e gli esercizi sono di un livello senz’altro superiore a quelli che il nostro studente deve saper risolvere. Il testo [22], scritto da o dei padri della moderna Analisi non lineare, è stato considerato a lungo uno dei migliori manuali universitari per lo studio dell’Analisi Matematica, prevalentemente rivolto a studenti del corso di Matematica o Fisica. Così come per [24], non ci sentiamo di consigliarli al nostro lettore: appaiono qui solo perché, sporadicamente, ne abbiamo tratto spunti e osservazioni interessanti. Il libro [4] è probabilmente il miglior testo per lo studio astratto delle proprietà infinitesimali delle funzioni. Il livello della presentazione è estremamente elevato. Per quanto riguarda gli argomenti numerici, consigliamo senz’altro [18, 23]. Qualche studente si chiederà se l’ordine dei nostri capitoli corrisponde fedelmente allo sviluppo storico del calcolo infinitesimale. In realtà, la matematica si è sviluppata gradualmente, e spesso i grandi matematici che hanno sviluppato le idee esposte in queste dispense non scrivevano delle definizioni rigorose e pulite come quelle a cui ci siamo abituati. Il libro di Hairer [15] è un’affascinante confronto fra lo sviluppo storico del calcolo e quello pedagogico dei nostri giorni. Un fatto da tenere a mente è stata la “rivoluzione bourbakista” degli anni ’50 e ’60 del secolo appena trascorso. Partendo dalla Francia, si è diffusa la richiesta di un ripensamento nitido e logicamente rigoroso delle discipline che compongono la matematica contemporanea. Il gruppo Bourbaki cercò di esporre tutta la matematica moderna in modo puramente logico–deduttivo. Questo approccio è stato molto criticato, e la principale accusa era di nascondere la natura dell’atto creativo in matematica. Infine, un testo apparso di recente è [21]. Gli argomenti trattati spaziano dai numeri reali al calcolo integrale in più dimensioni. Sembra chiaramente ispirato allo stile di [24], ma con qualche attenzione in più agil esempi e alle necessità didattiche attuali. Gli esercizi non sono tutti originali, ed il loro livello è decisamente avanzato.

Indice 1 Insiemi e Funzioni 1.1 Cenni di logica elementare . 1.2 Richiami di insiemistica . . 1.3 Insiemi numerici . . . . . . . 1.4 Topologia della retta reale . 1.5 L’infinito . . . . . . . . . . . 1.6 Punti di accumulazione . . . 1.7 Appendice: la dimostrazione

. . . . . . . . . . . . per

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . induzione

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

1 1 4 6 10 13 15 16

2 Funzioni fra insiemi 2.1 Operazioni sulle funzioni . . . . . . . . . 2.2 Funzioni monotòne e funzioni periodiche 2.3 Grafici cartesiani . . . . . . . . . . . . . 2.4 Funzioni elementari . . . . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

19 25 28 29 30

3 Successioni di numeri reali 3.1 Successioni e loro limiti . . . . . . . . 3.2 Proprietà asintotiche delle successioni 3.3 Infinitesimi ed infiniti equivalenti . . 3.4 Sottosuccessioni . . . . . . . . . . . . 3.5 Il numero e di Nepero . . . . . . . . 3.6 Appendice: successioni di Cauchy . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

33 33 40 43 44 45 47

4 Serie numeriche 4.1 Serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . 4.2 Criteri di convergenza . . . . . . . . . . . . . . . . . . . . . . 4.3 Convergenza assoluta e convergenza delle serie di segno alterno

49 54 56 60

. . . . . .

. . . . . .

5 Limiti di funzioni e funzioni continue 63 5.1 Limiti di funzioni come limiti di successioni . . . . . . . . . . . 63 5.2 Traduzione dei teoremi sulle successioni . . . . . . . . . . . . . 67 189

190 5.3 5.4 5.5 5.6 5.7 5.8

INDICE Raccolta di limiti notevoli . . . . . . . . . . . Continuità . . . . . . . . . . . . . . . . . . . . Infinitesimi ed infiniti equivalenti . . . . . . . Teoremi fondamentali per le funzioni continue Massimi e minimi . . . . . . . . . . . . . . . . Punti di discontinuità . . . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

68 70 73 75 78 82

6 Il calcolo differenziale 6.1 Variazioni infinitesime . . . . . . . . . . . . . 6.2 Il calcolo delle derivate . . . . . . . . . . . . . 6.3 I teoremi fondamentali del calcolo differenziale 6.4 Punti singolari . . . . . . . . . . . . . . . . . . 6.5 Applicazioni allo studio delle funzioni . . . . . 6.6 Derivate successive . . . . . . . . . . . . . . . 6.7 Classi di regolarità . . . . . . . . . . . . . . . 6.8 Grafici di funzioni . . . . . . . . . . . . . . . . 6.9 Il teorema di De l’Hospital . . . . . . . . . . . 6.10 Il polinomio di Taylor . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

85 85 89 93 98 99 101 105 106 108 112

7 Integrale di Riemann 7.1 Partizioni del dominio . . . . . . . . . . . . . 7.2 Continuità uniforme . . . . . . . . . . . . . . 7.3 Teorema fondamentale del calcolo . . . . . . . 7.4 Media integrale . . . . . . . . . . . . . . . . . 7.5 Applicazioni al calcolo degli integrali definiti . 7.6 Cenni sulla ricerca delle primitive . . . . . . . 7.7 Il differenziale . . . . . . . . . . . . . . . . . 7.8 Integrazione delle funzioni razionali fratte . . . 7.9 Il polinomio di Taylor con resto integrale . . . 7.10 Integrali impropri . . . . . . . . . . . . . . . . 7.10.1 Funzioni illimitate . . . . . . . . . . . 7.10.2 Funzioni definite su intervalli illimitati

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

121 122 130 134 138 138 140 143 145 150 152 152 154

8 Equazioni differenziali ordinarie 157 8.1 Equazioni differenziali lineari del primo ordine . . . . . . . . . 158 8.2 Equazioni del primo ordine a variabili separabili . . . . . . . . 161 8.3 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . 167 9 Metodi del calcolo approssimato 173 9.1 Interpolazione polinomiale . . . . . . . . . . . . . . . . . . . . 173 9.2 Integrazione numerica . . . . . . . . . . . . . . . . . . . . . . 177

INDICE

191

Epilogo

185

192

INDICE

Bibliografia [1] M. Abate. Geometria. McGraw–Hill. [2] M. Abramowitz and I. A. Stegun. Handbook of mathematical functions. National Bureau of Standards, 1972. [3] G. Birkhoff and S. MacLane. A survey of modern algebra. MacMillan, 1977. [4] N. Bourbaki. Éléments de Mathématiques. Fonctions d’une variable réelle. Springer–Verlag. [5] M. Bramanti, C. Pagani, S. Salsa. Analisi matematica 1. Zanichelli, 2008. [6] M. Conti, D. L. Ferrario, S. Terracini, and G. Verzini. Matematica. Apogeo, 2006. [7] R. Courant, H. Robbins. What is mathematics? Press, 1996.

Analisi

Oxford University

[8] N. Fusco, P. Marcellini, and C. Sbordone. Analisi Matematica Due. Liguori. [9] G. De Marco. Analisi Due. Zanichelli. [10] G. De Marco. Analisi Uno. Zanichelli. [11] M. Giaquinta and G. Modica. Analisi Matematica. 1. Funzioni di una variabile. Pitagora Editrice. [12] M. Giaquinta and G. Modica. Analisi Matematica. 2. Approssimazione e Processi Discreti. Pitagora Editrice. [13] E. Giusti. Elementi di analisi matematica. Bollati Boringhieri. [14] E. Hairer. Analysis by its history. Springer–Verlag. 193

194

BIBLIOGRAFIA

[15] P. Halmos. Naïve set theory. Van Nostrand. [16] G. H. Hardy. A course of pure mathematics. Cambridge University Press, 1921. [17] J. Heading. Equazioni differenziali ordinarie. Liguori. [18] F. Jedrzejewski. Introduction aux méthodes numeriques. Springer, 2005. [19] J. Kelley. General topology. Springer. [20] E. Mendelson. Introduction to mathematical logic. Chapman & Hall, 1997. [21] M. Mureşan. A concrete approach to classical analysis. Springer–Verlag. [22] G. Prodi. Analisi matematica. Bollati Boringhieri, 1970. [23] A. Quarteroni, R. Sacco, and F. Saleri. Matematica Numerica. Springer. [24] W. Rudin. Principi di analisi matematica. McGraw–Hill, 1991. [25] E. Stein, R. Shakarchi. Fourier analysis, an introduction. Princeton University Press.

Related Documents

Lezioni Di Matematica
December 2019 16
Lezioni
May 2020 20
Lezioni Americane
April 2020 10
Lezioni Aziendali
November 2019 17

More Documents from "Carlo"

Lezioni Di Matematica
December 2019 16