Table des matières Introduction
2
I Gestion de portefeuille
3
1 Approche Statique 1.1 1.2 1.3
Notations et hypothèses de bases . . . . . . . . . . . . . . . . . . Aversion et utilité . . . . . . . . . . . . . . . . . . . . . . . . . . . Programme de markovitz . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Résolution du programme de markovitz sans contrainte : . 1.3.2 Résolution du programme de markovitz sous contrainte : .
2 Approche Dynamique 2.1 2.2
Gestion dynamique . . . . . . . . . . . . . . . . . . . Résolution du programme de maximisation . . . . . 2.2.1 Solution optimale dans le cas sans contraintes 2.2.2 Solution optimale dans le cas avec contraintes
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3 3 4 4 5 5
7
7 8 9 14
3 Approche de Black-Litterman
21
II
24
3.1 3.2 3.3
Le modèle de Black-Litterman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spécication des vues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Calibrations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modélisation GARCH
21 22 23
1 Représentation du modèle GARCH(p,q)
24
2 Vérication de l'hypothèse du bruit GARCH
25
3 Identication des ordres p et q du modèle GARCH
28
3.1 3.2
Méthode d'ajustement du modèle autoregressif AR(p) . . . . . . . . . . . . . . . . . Méthode d'ajustement du modèle moyenne mobile MA(q) . . . . . . . . . . . . . . .
28 29
4 Estimation des paramètres du modèle GARCH(p,q) par quasi-maximum de vraisemblance 30 4.1 4.2
Quasi-vraisemblance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . Calcul numérique de l'estimateur du QMV . . . . . . . . . . . . . . . . . . . . . . . .
30 31
5 Adéquation du modèle estimé et sélection nale du modèle le plus approprié
33
6 Prévision des séries nancières
34
7 Exemple numérique d'ajustement et prévision GARCH
34
Conclusion
37
Bibliographie
38
Annexe
39
1 Approche statique- optimisation sous contraintes
39
2 Approche dynamique-optimisation sans contraintes
40
3 Approche dynamique-optimisation sous contraintes
42
4 Détermination du vecteur des rendement d'équilibre de Black-Litterman
44
2.1 2.2 3.1
Cas d'une fonction d'utilité puissance . . . . . . . . . . . . . . . . . . . . . . . . . . Cas d'une fonction d'utilité exponentielle . . . . . . . . . . . . . . . . . . . . . . . . Factorisation matricielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40 40 42
Remerciements
Je remercie la BNP Paribas et l'ensemble des collaborateurs avec lesquels j'ai été amené à travailler pour leur accueil et leur bonne humeur. Plus particulièrement, je souhaite transmettre un remerciement sincère à Jalila AZIKI, mon responsable de stage, pour sa disponibilité et c'est grâce à ses conseils avisés, clairs et ciblés que j'ai pu mener à bien ce travail. Aussi, j'inclus à ma reconnaissance l'ensemble des membres de la salle des marchés qui m'ont motivé par leur dynamisme et leur ouverture d'esprit qui a largement participé à faciliter mon intégration au sein de la société. Ma gratitude s'adresse enn au corps enseignant de l'ENSAE, pour leurs pédagogie et leurs conseils qui me seront utiles toute ma vie professionnelle.
Introduction
Avec la croissance des marchés nanciers, la visibilité sur les stratégies d'investissement devient de moins en moins lucide et nécessite une analyse d'information de plus en plus complexe. Le but étant d'aider les gestionnaires des portefeuilles à prendre des choix d'investissement optimaux tout en aillant une aidée claire sur le risque qu'ils encourent. C'est dans ce cadre que s'est située notre mission de stage qui avait pour objectif, de mettre à la disposition des gérants de portefeuilles, des outils de gestion et d'aide à la décision qui s'adaptent aux horizons d'investissement et aux contraintes des expositions, mais aussi aux convictions subjectives sur les performances du marché, et qui orent à leur utilisateur la possibilité de suivre et de prévoir les risques associés à ses positions. Dans un premier temps, nous présenterons la théorie classique de gestion de portefeuille avant de s'attarder sur l'approche de base utilisée dans notre étude, à savoir l'approche dynamique de gestion de portefeuille. Puis, nous insisterons sur l'approche de Black-Litterman qui permet de marier les modèles quantitatifs de gestion avec les vues personnelles du gérant. La deuxième partie sera consacrée à la modélisation des séries nancières par le modèle GARCH (modèle AutoRégressif Conditionnellement Hétéroscédastique). La particularité de ce modèle est qu'il repose essentiellement sur le concept de variance conditionnelle, grandeur de grande utilité pour la mesurer de la VaR (Value-At-Risk) et d'autres indicateurs essentiels au bon encadrement du risque de portefeuille. L'organisation de cette partie, explicitera dans un premier temps les motivations derrières le choix de la modélisation GARCH, ensuite, la démarche choisi au cours de la modélisation et qui a servi de base pour l'implémentation de l'outils informatique. Enn, nous reprendrons brièvement les étapes de modélisation sous un exemple numérique.
Gestion de protefeuille
Première partie
Gestion de portefeuille 1 Approche Statique Alors que les portefeuilles étaient gérés comme un ensemble de titres plus ou moins indépendants, les travaux de markowitz(1959)[1] sur la gestion statique de portefeuille se sont attardés sur la prise en compte des dépendances entre les titres individuelles et ont permet d'établir un cadre d'analyse formel connu sous le nom de l'approche statique de gestion de portefeuille et qui est considéré à la base de la gestion modèrne du portefeuille. Dans cette partie, nous allons présenter les hypothèses de base de cette approche, ses fondements mathématiques et les méthodes numériques qui permettent de chercher les allocations optimales dans le cas de gestion sous contraintes.
1.1 Notations et hypothèses de bases On considère un marché composé de : ¡ ¢ n actifs risqués de prix Sti 0≤t≤T ¡ ¢ 1 actif sans risque de prix St0 qui s'apprécie avec le taux sans risque r ;
ST0 = S00 (1 + r) On suppose qu'on dispose d'une richesse initiale V0 à investir en respectant la contrainte budgétaire P n i i i=0 α0 = 1, avec α0 la proportion de richesse à inverstir en actif i. La richesse à la date T qu'on note VT s'écrit ainsi :
VT =
n X α i V0 0
i=0
S0i
STi
En intégrant la contrainte budgétaire et remplacant le prix de l'actif sans risque par son expression en fonction du taux sans risque, on obtient : n X VT α0i STi 0 = α0 (1 + r) + V0 S0i i=1
De là, la surperformance du portefeuille par rapport au taux sans risque s'écrit : n
X VT −1−r = α0i V0 i=1
µ
STi −1−r S0i
¶
On note : π(α0 ) la surperformance du portefeuille par rapport à l'actif sans risque. π i la surperformance de l'actif i par rapport à l'actif sans risque. Sous forme matricielle, la surperformance du portefeuille devient : ¡ ¢0 π(α0 ) = α00 π avec π = π 1 , π 2 , ..., π n Dans la suite, on suppose que π est un vecteur gaussien multivarié de moyenne µ et de matrice de variance covariance Σ . page : 3
Gestion de protefeuille
1.2 Aversion et utilité De façon générale, on considère que les investisseurs sont averses au risque. Pour cette raison, plus un investissement est risqué, plus il devra orir un rendement espéré élevé. Sinon l'investisseur se tournera vers des titres qui orent le même rendement espéré avec plus de certitude. Pour déterminer la stratégie d'allocation d'actifs optimale, un investisseur tente alors de maximiser une fonction d'utilité U qui tient compte du rendement espéré, du risque associé à l'obtention de ce rendement, mais aussi de l'aversion au risque. Remarque : Dans cette approche, on se limite au cas d'une fonction d'utilité exponentielle ; U (x) = −exp (−λx), où λ est l'aversion au risque. Pour cette fonction, on a : ∆U = λexp (−λx) ∆x donc
∆U = −λ∆x U
En posant v0 = λ1 , on obtient :
∆U ∆x =− U v0
On constate alors que v0 à l'unité d'une richesse et peut être comparé à la richesse initiale pour estimer l'aversion au risque.
1.3 Programme de markovitz La structure fonctionnelle du problème de gestion du portefeuille présentée par markovitz consiste à trouver la (ou les) stratégies α ∈ Rn qui maximisent E [U (VT )] , avec :
U (VT ) = −exp (−λVT ) . On sait que π ∼ ℵ (µ, Σ) donc
π (α) ∼ ℵ (α0 µ, α0 Σα) .
En utlisant la transformée de laplace, on obtient : µ ¶ µ ¶ λ2 V02 0 λV0 0 E [U (VT )] = −exp (−λV0 (1 + r)) exp −λV0 α0 µ + α Σα = U E [VT ] − α Σα 2 2 Enn de compte, on trouve la relation d'équivalence suivante :
supα∈Rn E [U (VT )] ⇐⇒ supα∈Rn α0 µ −
λV0 0 α Σα 2
qui simplie la structure fonctionnelle du programme de maximisation de markovitz.
page : 4
Gestion de protefeuille
1.3.1 Résolution du programme de markovitz sans contrainte : Ce programme est simple à résoudre car la fonction f tel que f (α) = α0 µ − λV2 0 α0 Σα qu'on cherche à maximiser est quadratique concave, ce qui assure l'existence et l'unicité de son maximum. La méthode usuelle de résolution consiste à chercher le vecteur des αi qui annule la dérivée première de f Rappel : soient a , R deux vecteurs de Rn et Σ une matrice de Rn × Rn on montre que : ∂a0 R ∂a0 Σa = R et = 2Σa ∂a ∂a donc ∂f (α) = µ − λV0 Σα ∂α ainsi le α optimal vérie µ − λV0 Σα = 0
⇒α=
1 −1 Σ µ λV0
En vertu de la simplication λV0 = 1 expliquée précédemment, le programme de maximisation de markovitz pour une fonction d'utilité exponentielle consiste à trouver le vecteur α qui maximise l'expression α0 µ − α0 Σα. donc : ⇒ α = Σ−1 µ.
1.3.2 Résolution du programme de markovitz sous contrainte : le programme de markovitz sous contraintes sur les proportions de richesses investies s'écrit sous la forme suivante : sup (α0 µ − α0 Σα) s.c : i i αmin ≤ αi ≤ αmax ,∀i ∈ [1, . . . , n] L'intérêt de ce programme, est de tenir compte des contraintes pratiques qui s'imposent, telles que la limitation ou l'interdiction de la vente à découvert, ou encore la nécessité de restreindre l'exposition sur des marchés ou des titres particulièrs. Toutefois, la solution analytique de ce programme est beaucoup moins évidente comme exposé dans le théorème de Karuch-Kuhn-Tucker. D'autant plus le nombre d'opérations nécessaires pour résoudre ce système de manière analytique, augmente de l'ordre de 3n en fonction de la dimension du problème(voir annexe). La méthode de resolution alternative de ce problème, consiste à trouver une solution approchée par une des méthodes numériques, telle que celle de la relaxation pénalisée[2][3] qui s'adapte complétement à la nature de ce problème. Aperçu de la méthode de relaxation pénalisée Il s'agit d'une méthode itérative où, partant d'un vecteur initial α0 arbitraire, on construit une suite de vecteurs αk , k ≥ 0. Autrement dit, l'objectif est la construction d'une méthode convergente, en ce sens que, pour tout vecteur initial α0 , la suite (αk )k≥0 converge vers une solution du problème. Pour construire le vecteur αk+1 à partir du vecteur αk , l'idée consiste à se ramener à un problème "facile à résoudre numériquement", à savoir un problème de maximisation pour une fonction d'une seule variable réelle. Pour cela, partant d'un vecteur initial α0 , chaque vecteur αk est construit en page : 5
Gestion de protefeuille
calculant succesivement ses composantes par la résolution des problèmes suivants de minimisation à une variable (on a entouré de crochets chaque nouvelle composante calculée) : ¢ ¡ ¢ ¡£ k+1 ¤ k k J ¡ α1 £ , α2 , ¤α3 , . . . , αnk¢ = supζ∈Λ J ¡ ζ, α2k , α3k , . . . , αnk ¢ , J αk+1 , αk+1 , α3k , . . . , αnk = supζ∈Λ J αk+1 , ζ, α3k , . . . , αnk , 1 2 1 .. £ ¤¢ . ¡ ¢ ¡ k+1 k+1 k+1 J α1 , . . . , αn−1 , αnk+1 = supζ∈Λ J α1k+1 , . . . , αn−1 ,ζ . avec Λ l'ensemble des stratégies admissibles d'investissement dans les actifs risqués et J est la fonction dénie par : J (α) = α0 µ − α0 Σα.
page : 6
Gestion de protefeuille
2 Approche Dynamique La gestion statique du portefeuille apporte de nombreux enseignements robustes, mais très partiels. Les hypothèses retenues ne permettent pas de mettre en places des stratégies plus complexes que d'acheter et attendre. La gestion dynamique du portefeuille vient pour remédier à ce problème. Plusieurs approches de gestion dynamique sont possibles, nous présenterons celle développée par Samuelson 1969 et anée par Merton 1998, et qui consiste à chercher une stratégie de portefeuille en utilisant des méthodes de type contrôle optimal. Ensuite, nous allons l'appliquer pour diérentes fonctions d'utilité pour conclure par la suite sur les avantages et inconvénients de l'approche. Enn, nous allons étendre l'approche dans le cas de gestion sous contraintes et proposer une méthode de résolution numérique.
2.1 Gestion dynamique On considère une durée de détention [0, T ]. 1 actif sans risque représenté par un zéro coupon de maturité T :B (t, T ) ½ dB (t, T ) = B (t, T ) (rt dt + σB (t, B (t, T )) dWt ) B (T, T ) = 1 avec Wt est un mouvement brownien standard multidimentionnel de dimension n+1. n actifs risqués :
½
dSt = diag (St ) (rt dt + σ (t, St ) dWt ) S 0 = s0
avec :¡ ¢0 St = St1 , . . . , Stn
.. .
· · · Σ(n,n) · · · σ = .. . 2 σn+1,1 ...
(2.1)
2 σ1,n+1
2
.. .
2 σn+1,n+1
2 2 et σn+1,. Σ étant la matrice de varaince covariance entre les actifs risqués. Les termes σ.,n+1 quand à eux, désignent la covariancce entre les actifs risqués et l'actif sans risque.
Partant d'une richesse initiale Vo = ν , la condition d'autonancement s'applique localement à Pn l'instant t et implique que nous investissons 1− j=1 αj,t dans l'actif sans risque, et que le processus de la richesse (Vt )0≤t≤T évolue avec la dynamique :
dVt =
n X
³
αj,t Vt diag Stj
´−1
dStj + 1 −
j=1
n X j=1
αj,t Vt
dB (t, T ) , ∀αt ∈ Λ B (t, T )
En utlisant les valeurs forward , on peut montrer que l'équation de la dynamique de la richesse peut se simplier sous la forme : ( t dVt = Vt αt0 dS St V0 = ν page : 7
Gestion de protefeuille
où Vt est la richesse forward et St est le prix forward. Dans le but d'assouplir les notations, on notera dans la suite Vt et St pour désigner les valeurs forward des grandeurs associées. Ainsi, la dynamique des richesses forward s'écrit : ½ dVt = Vt (αt0 µt dt + αt σt dWt ) V0 = ν avec σt la volatilité des prix forward et µt la tendance des prix forward. Nous pouvons donc nalement écrire le programme d'optimisation dynamique an de construire le portefeuille eecient : supαt ∈Λ E [U (VT )] s.c : V0 = ν
2.2 Résolution du programme de maximisation La résolution de ce programme repose sur l'approche dite de programmation dynamique qui va être présentée de manière heuristique. Pour ce qui est des fondements mathématique de cette approche, le lecteur est renvoyé au papier de Fleming et Soner[4]. On introduit la fonction valeur :
J (t, v) = supα∈Λ E [U (VT ) |Vt = v] . Le principe de base de cette méthode est de trouver les stratégies αt qui permettent de rester toujours optimal sur l'horizon d'investissement. Ainsi, ∀t0 ∈ [t, T ] , J (t, Vt ) = supα∈Λ(t,t0 ) Et [J (t0 , Vt0 ) |Vt ] . en particulier :
J (t, Vt ) = supα∈Λ(t,t+h) Et [J (t + h, Vt+h ) |Vt ] .
Le développement de taylor au second ordre de la fonction valeur donne : · ¸ 2 ∂J ∂J 1 2 ∂ J J (t, Vt ) = supα∈Λ(t,t+h) Et J (t, Vt ) + h + (Vt+h − Vt ) + (Vt+h − Vt ) + ◦ (h) |V t . ∂t ∂V 2 ∂V 2 Comme dVt = Vt (αt0 µt dt + αt σt dWt ), on utilise les approximations suivantes : Et [Vt+h − Vt ] = Vt αt0 µt h h i 2 2 Et (Vt+h − Vt ) = Vt2 (αt0 σt dWt ) donc
h avec :
∂J + supα∈Λ(t,t+h) ∂t
µ ¶ 2 ∂J 1 2 ∂ J Vt hαt0 µt + Vt2 (αt0 σdWt ) ' ◦ (h) . ∂V 2 ∂V 2 2
(αt0 σdWt ) =
n+1 n XX
2 αj2 σji h
i=1 j=1
car dWti .dWtj = 0 pour i 6= j. Ainsi, la fonction valeur est solution de l'équation de Hamilton Jaccobi Bellman(HJB) suivante : ( h ³P ´ 2 i n+1 Pn ∂J 1 2 ∂ J 0 ∂J 2 2 (2.2) + sup V α µ + V α σ α∈Λ t t j ji (t,t+h) i=1 j=1 ∂t ∂V 2 ∂V 2 = 0 J (T, VT ) = U (VT ) page : 8
Gestion de protefeuille
2.2.1 Solution optimale dans le cas sans contraintes Dans ce cas, on suppose que le domaine Λ des stratégies d'investissements admissibles coincide avec l'espace vectoriel des nombres réels ; Λ = Rn . De là, l'eqution de (2.2) de HJB devient : ( ´ 2 i h ³P n+1 Pn ∂J 1 2 ∂ J 0 ∂J 2 2 n Vt α µ + sup + V α σ (2.3) α∈R i=1 j=1 j ji ∂V 2 = 0 ∂t ∂V 2 t J (T, VT ) = U (VT ) " Ãn+1 !# n Vt2 X 2 2 ∂J X ∂J + supα∈Rn Vt αj µj + =⇒ αj σji =0 ∂t ∂V 2 j=1 i=1 " Ãn+1 !# n 2 X ∂J ∂J X 2 Vt 2 + + αj supα∈Rn αj Vt µj =0 =⇒ σji ∂t ∂V 2 j=1 i=1 Or, on montre queJ est concave constitue l'esperance d'une fonction concave. Donc h ³ du fait qu'elle ´i V 2 Pn+1 2 ∂J le sup de αj Vt µj ∂V + α2j 2t σ est atteint pour : i=1 ji
αj =
Vt
∂J −µj ∂V Pn+1
∂2J ∂V 2
i=1
2 σji
.
Finalement, en remplacant α par son expression, l'equation (2.3) se simplife et devient : ∂J 2 Pn (µj ∂V ) ∂J 1 j=1 ∂ 2 J Pn+1 σ 2 = 0 ∂t − 2 2 i=1 ji J (T, V ) = U ∂V (V ) T
T
Commentaire : ∂J ∂2J Le fait que les αj soient fonctions de ∂J ∂t , ∂V et ∂V 2 traduit le comportement de myopie des investisseurs. Il s'agit tout simplement du fait de s'attarder aux uctuations à court terme et d'être incapable d'adopter une vision à long terme.
a-Application au cas d'une fonction d'utilité puissance
On suppose que la fonction d'utilité de l'investisseur est de la forme :
U (x) =
x1−γ . 1−γ
Dans ce cas, on montre(voir annexe) que la stratégie optimale d'investissement consiste à placer dans chaque actif risqué j , la proportion de richesse :
αj =
γ
µt,j Pn+1 i=1
2 σt,ji
Remarque : Sous l'hypothèse d'anticipations stationnaires de la variance "σt = σ " et du rendement moyen "µt = µ", on obtient une stratégie d'allocation constante en fonction du temps. Une telle stratégie est appelé constant mix. Soit QT la probabilité forward risque neutre. En vertu de l'equation (2.1), la dynamique des actifs risqués sous la probabilité QT est :
dSt = [diagSt ] σdW QT page : 9
Gestion de protefeuille
et puisque
dVt Vt
= αt [diagSt ]
−1
dSt alors : dVt = αt0 σdW QT Vt ! Ãn+1 n X X dVt QT ⇒ = αj σij dW . Vt j=1 i=1
donc :
Pn+1 ³Pn
Vt = V0 exp −
j=1 αj σij
i=1
Stj donc
=
−
n X αj σij WiQT .
n+1 X
(1)
j=1
σij dW QT
i=1
" Pn+1 S0j exp
n+1 X i=1
dStj
=
·t+
2
D'autre part, on a :
Stj
´2
i=1
2 σij
2
·t+
n+1 X
# σij dW QT .
(2)
i=1
Des deux equations (1) et (2), on montre que à !αj n Y Vt Stj exp [f (σ, α)] = V0 S0j j=1 où f est une fonction de σ et α. Interprétation de la stratégie d'investissement constant-mix On constate, à partir de la gure ci-dessous, que la stratégie d'investissement constant-mix donne toujours une richesse positive. Par ailleurs, sous l'hypothèse d'anticipations stationnaires, la richesse nale ne dépend pas du chemin suivi, mais seulement des prix obsérvés à la date d'évaluation et la date nale. Mise en place pratique de la stratégie constant-mix : Supposons que l'actif risqué j varie de x% :
Stj −→ Stj (1 + x) alors, en se servant de l'equation
dVt Vt
=
Pn j=1
αj
dStj , Stj
la richesse évolue de αx% :
¡ ¢ Vt −→ Vt 1 + αj x Soit δtj− le nombre d'actifs risqués j détenus par l'investisseur juste avant la variation du prix. On a : Vt δtj− = αj . St
page : 10
Gestion de protefeuille
Fig.
1 Evolution de la richesse en fonction du prix de l'actif risqué pour α =-0,5 et α =0,5
page : 11
Gestion de protefeuille
Pour garder la même composition après la variation du prix, le nombre d'actifs risqués détenus vaut : ¡ ¢ Vt 1 + α j x j δt = αj . St (1 + x) Finalement, la quantité n d'actifs risqués à acheter pour garder la même composition est égale à :
∆δ = δt − δt− = αj
Vt (1 + αj x) − Vt (1 + x)
¢ ¡ ⇒ ∆δ = αj2 − αj
Fig.
Stj (1 + x) Vt x St (1 + x)
2 Variation du nombre d'actifs risqués détenus suite à l'augmentation de son prix en x%
A partir du graphique ci-dessus, on constate que quand le prix d'un actif risqué augmente, l'investisseur vend une partie de ce dernier pour diminuer l'augmentation de la proportion de cet actif constatée sur son portefeuille, et ce, dans le but de rester à constant-mix. De façon simple, la stratégie constant-mix consiste à vendre l'actif risqué en faveur de l'actif sans risque lorsque son prix augmente et à faire l'inverse quand il baisse. L'intérêt de cette stratégie est que le gestionnaire peut tirer prot des hausses du marché en vendant l'actif risqué, ce qui permet de collecter des bénéces. Et lorsque le marché est en baisse, d'acheter page : 12
Gestion de protefeuille
plutôt l'actif risqué en anticipant le retour à la hausse du marché. Limites de l'approche Si les actifs risqués du portefeuille subissent une hausse persistante de prix, on aura de moins en moins d'actifs risqués et de plus en plus d'actifs sans risque. Ce qui réduira le rendement du portefeuille puisqu'il va tendre vers celui de l'actif sans risque. A l'opposé, suite à une baisse persistante des prix des actifs risqués qui composent le portefeuille, on aura de plus en plus d'actifs risqués et de moins en moins d'actifs sans risque. Ce qui conduira à des pertes très lourdes si les prix continuent leurs baisse.
b-Application au cas d'une fonction d'utilité exponentielle
On suppose que la fonction d'utilité de l'investisseur est de la forme : µ ¶ Vt U (Vt ) = −exp − V0
Dans ce cas, on montre (voir annexe) que la stratégie optimale d'investissement consiste à placer dans chaque actif j , la proportion de la richesse :
µj αj = Pn+1
2 i=1 σji
Remarque Soit Mtj le montant investi dans l'actif j à l'instant t. On a : Mtj = αjt Vt µj ⇒ Mtj = Pn+1 i=1
V0 Vt
2 σji
donc, sous l'hypothèse d'anticipations stationnaires, le montant investi dans l'actif risqué j reste constant en fonction du temps. Partant de la formule(2.1), et utilisant la formule d'itô, on peut montrer qu'on a sous la probabilité forward risque neutre QT : 1 1 1 d ln (St ) = σdWtQT − σ 2 1n+1 dt avec 1n+1 = . 2 ..
1
donc
(n+1,1)
1 dVt = αt0 d ln (St ) + αt0 σ 2 1n+1 dt Vt 2 Ã ! n n n+1 X V0 µj STj 1 X V0 µj X 2 ⇒ Vt − V0 = + σji t Pn+1 2 ln P 2 2 j=1 n+1 S0j i=1 σji i=1 σji i=1 j=1 " # Ã ! n X STj µj 1 Vt − V0 = + µj t ⇒ Pn+1 2 ln V0 2 S0j i=1 σji j=1
Remarque La richesse étant exprimée en valeur forward, VT ≥ V0 signie qu'on réalise une performance meilleur que celle de l'actif sans risque ; V T ≥ V 0 ⇒ VTspot ≥ V0spot . page : 13
Gestion de protefeuille
Ainsi, en partant du tracé de la performance du portefeuille en fonction du prix de l'actif risqué, on constate que cette stratégie anticipe souvent une surperformance (respectivement une sousperformance) du portefeuille par rapport à l'actif sans risque, et ce, dans le cas où le rendement forward moyen de l'actif risqué est positif (respectivement négatif).
3 Evolution du rendement du portefeuille en fonction du prix de l'actif risqué pour µ = −2%etµ = 2%
Fig.
Commentaire En suivant le même raisonnement que celui présenté dans le cas de la fonction d'utilité puissance, on montre que cette approche reproduit les mêmes dérives que la première, que se soit dans le cas des hausses ou des baisses persistantes du marché.
2.2.2 Solution optimale dans le cas avec contraintes Cette fois, on s'intéresse à la détérmination de la politique d'investissement optimale dans le cas où l'espace des stratégies admissibles "Λ" est une partie de Rn . Algorithme de résolution L'algorithme de résolution connu sous le nom d'algorithme de Howard[5][6] consiste à alterner deux étapes :
page : 14
Gestion de protefeuille
une étape de calcul de la politique optimale α pour chaque date t ∈ [0, T [ et chaque niveau de richesse détenue Vt , en fonction de la fonction valeur J , ceci en maximisant le second membre de l'équation de Bellman. une étape de résolution exacte de l'equation de Bellman dans laquelle on remplace le contrôle réel par le contrôle précédement trouvé. Cela consiste donc à calculer les deux suites récurrentes (αn )(0≤t≤T,Vt ∈[0,∞[) et (Jn )(0≤t≤T,Vt ∈[0,∞[) dénies par : n+1 n 2 XX 1 ∂J ∂ J n n 2 • αn+1 = supα∈Λ Vt α0 µ + Vt2 (1) αj2 σji ∂V 2 ∂V 2 i=1 j=1
•
n+1 n XX
∂Jn+1 ∂Jn+1 1 + Vt αn0 µ + Vt2 ∂t ∂V 2 i=1
j=1
2
2 (αn )j σji
∂ 2 Jn+1 =0 ∂V 2
(2)
Dans cet algorithme, la suite Jn converge rapidement vers la solution J de l'équation de Bellman, à cause du fait que le conrôle optimale α est régulier par rapport à la fonction J .
page : 15
Gestion de protefeuille
4 Estimation de la fonction valeur obtenue par l'alogorithme de Howard après seulement 15 itérations Fig.
page : 16
Gestion de protefeuille
Toutefois, la résolution pratique de ce problème nécessite d'opérer des changements de variable pour se ramener à un domaine d'étude borné. Changement de variable et détérmination de la nouvelle équation de Bellman : On pose :
ξt =
Vt /V0 ∈ [0, 1[ 1 + Vt /V0
L'idée derrière ce changement de variable est que la fonction f dénie par :
f : x −→
x 1+x
est à valeurs dans ]0, 1[ pour tout x dans R+ ∗ . Par ailleurs, l'utilisation du rapport Vt /V0 plutôt que Vt donne que ξ0 = 21 et permet de gagner en terme de simplication dans la résolution du problème. ainsi : ´ ³ Vt /V0 ∂ 1+V /V ∂ξt 1 t 0 = = 2 ∂Vt ∂Vt (1 + Vt /V0 ) 1 2 = (1 − ξt ) . V0 et
³ ´ 2 ∂ V10 (1 − ξt ) ∂ξt ∂ 2 ξt = · 2 ∂Vt ∂ξt ∂Vt 2 3 = − 2 (1 − ξt ) . V0
donc
• Vt
∂J ∂J ∂ξt ∂J 1 2 = Vt · · = Vt · · (1 − ξt ) ∂Vt ∂ξt ∂Vt ∂ξt V0 ∂J = ξt (1 − ξt ) . ∂ξt
et
³ • Vt2
2
∂
1 V0
2 ∂J ∂ξt
(1 − ξt )
´
∂ξt ∂V µ ¶ 2 2 ∂J 1 ∂ξt 2 ∂ J 2 = Vt − (1 − ξt ) + (1 − ξt ) · V0 ∂ξt V0 ∂ξt2 ∂Vt ¡ ¢ ∂2J ∂J + ξt2 1 − ξt2 = −2ξt2 (1 − ξt ) · ∂ξt ∂ξt2
∂ J = Vt2 ∂Vt2
∂ξt
·
dès lors, l'équation de HJB qui servivra pour chercher la stratégie optimale est : h ii h 0 = ∂J + supαt ∈Λ ξ (1 − ξ) αt0 µ ∂J + 1 Pn+1 Pn α2 σ 2 · ξ 2 (1 − ξ) −2 ∂J + (1 + ξ) ∂ 2 J2 i=1 j=1 j ji ∂t ∂ξ 2 ∂ξ ∂ξ ³ ´ ξT J (T, ξT ) = U 1−ξT
page : 17
(2.4)
Gestion de protefeuille
Discrétisation de l'équation de HJB La discrétisation de ce problème demande de réechir sur un maillage en espace-temps qui contient explicitement la courbe de frontière. On suggère la méthode de résolution couramment pratiquée de diérences nies basée sur les théta-schémas. Discrétisation en temps Nous écrivons l'équation précédente de HJB sous la forme :
∂J + supα∈Λ A (t, ξ) · J (t, ξ) = 0 ∂t
(3)
avec t qui varie dans [0, T ] et l'opérateur A est donné par :
A (t, ξ) = ξ (1 − ξ) αt0 µ
¸ · n+1 n ∂ 1 XX 2 2 2 ∂2 ∂ + + (1 + ξ) 2 αj σji · ξ (1 − ξ) −2 ∂ξ 2 i=1 j=1 ∂ξ ∂ξ
A présent, on introduit un pas de temps subdivisant notre intervalle [0, T ] en N intervalles égales, associées aux instants intermédiaires tk :
∆t =
T , t k = k · ∆t , 0 ≤ k ≤ N N
Pour trouver des solutions approchées, nous utilisons les théta-schémas qui se traduisent sous l'expression :
0=
J ((i + 1) ∆t , ξ) − J ((i) ∆t , ξ) + Ak [J ((i + 1) ∆t , ξ) + θ (J (i∆t , ξ) − J ((i + 1) ∆t , ξ))] ∆t
avec 0 ≤ θ ≤ 1. Discrétisation en espace Les temps intermédiaires tk dénissent naturellement pour 0 ≤ k ≤ N , des points ξ sur le maillage de points. Dans un souci de simplicité dans la mise en oeuvre pratique, on garde ici une progression uniforme pour l'ensemble des points de la suite (ξk ) :
ξ k = k · ∆ξ , 0 ≤ k ≤ M Les donnée introduites ci-dessus conduisent à une grille cartésienne (tk , ξk ) à pas constant en temps ³ ´ ξ et espace avec la condition au bord J (T, ξ) = U 1−ξ . Compte tenu de la relation (3) valable dans le cas d'un espace continu, l'opérateur discret Ak agit sur la fonction valeur J à l'aide d'un opérateur aux diérences nies dénit par : formules pour la première diérentitation
J (i, k + 1) − J (i, k) ∂J (i, k) ' ∂ξk ∆x ∂J (i, k) J (i, k + 1) − J (i, k − 1) ' ∂ξk 2∆x J (i, k) − J (i, k − 1) ∂J (i, k) ' ∂ξk ∆x avec, la première dérivée première qui concerne les points décentrés à droite, la deuxième les points centrés et la troisième les points décentrès à gauche. page : 18
Gestion de protefeuille
formules pour la seconde diérentitation :
∂ 2 J (i, k) J (i, k + 2) − 2J (i, k + 1) + J (i, k) ' 2 ∂ξk2 (∆x ) ∂ 2 J (i, k) J (i, k + 1) − 2J (i, k) + J (i, k − 1) ' 2 2 ∂ξk (∆x ) ∂ 2 J (i, k) J (i, k − 2) − 2J (i, k − 1) + J (i, k) ' 2 ∂ξk2 (∆x ) avec, la première dérivée seconde qui concerne les points décentrés à droite, la deuxième les points centrés et la troisième les points décentrès à gauche. Discrétisation du problème de résolution de Howard : Comme mentionné auparavant, l'algorithme de Howard se base sur une alternance entre itérations sur les politques et itérations sur les valeurs. L'expression générale du problème étant introduite dans le cas continu, nous proposons ci-dessous une reformulation dans le cas discret qui s'adapte à la résolution par diérences nies. Itération sur la politique : le but est de rechercher le contrôle optimal αn+1 qui vérie pour une fonction valeur Jn donnée, la relation (1). En vertu du changement de variable opéré, et en se donnant une fonction valeur Jn , on montre j que le contrôle optimale αn+1 pour l'actif risquée j , au point (i, k) sur la grille de discrétisation, est le maximum de l'équation de second degré suivante :
aj αj2 + bj αj avec :
(
aj = 12 ξ 2 (1 − ξk )
Pn+1 i=1
∂J µj bj = ξk (1 − ξk ) ∂ξ k
h i ∂J ∂2J 2 σij −2 ∂ξ + (1 − ξ ) 2 k ∂ξ k
on pose :
maxj =
k
−bj 2aj
La détermination du maximum relatif de cette équation passe par la détermination de sa concavité ; 2 Si ∂∂ξJ2 < 0 : k ³ ´ j j j − si max ≤ α alors αn+1 = αmin j min ¡ ¢ j j j − si ³maxj ≥ αmax alors αn+1 = αmax ´ j j j − si αmin ≤ maxj ≤ αmax alors αn+1 = maxj Si
∂2J 2 ∂ξk
≥0: − si − si
³ ³
j2 j j2 j aj αmax + bj αmax ≥ aj αmin + bj αmin j2 j j2 j aj αmax + bj αmax < aj αmin + bj αmin
´ ´
alors
j j αn+1 = αmax
alors
j j αn+1 = αmin
Itération sur la fonction valeur J : Dans cette itération, on cherche à déterminer la fonction valeur Jn+1 à partir du contrôle αn calculé
page : 19
Gestion de protefeuille
par le biais de l'itération sur la politique. Partant de l'équation (2), on montre que Jn+1 vérie au point ξk la relation :
0=
J (i + 1, k) − J (i, k) + (1 − θ) Aki+1 + θAki Dt
En réaménageant les termes de cette équation, on déduit la relation de récurrence suivante entre les J (i, ·) : ¡ ¢ ¡ ¢ 1 + Dt (1 − θ) Ak J (i + 1, k) = 1 − Dt θAk J (i, k) Sous forme matricielle, on peut montrer que le passage du vecteur J (i + 1, ·) au vecteur J (i, ·) se fait via la résolution d'un système linéaire de la forme :
Ai J (i, ·) = bi+1 où A est une matrice quadridiagonale : a1 1 a1 2 a1 3 a2 1 a2 2 a2 3 .. .. . . A= . .. 0
0 .. ..
. .
an−1n−2 a n n−2
..
. an−1n−1 a n n−1
an−1n an n
La construction de Jn+1 pour l'ensemble du maillage du points commence par l'utilisation de la condition au bord qui nous renseigne sur la valeur du vecteur J (T, ·) ”J (T ) = U ”, duquel on calcul J (·, T − ∆t ) ; J (T − ∆t , ·) = A−1 T −∆t AT J (T, ·) Ainsi de suite, on détermine les termes J (·, T − 2∆t ) , J (·, T − 3∆t ) , . . . , J (·, 0) qui constituent les valeurs de la fonction valeur Jn+1 sur le domaine d'étude. il reste alors simplement à calculer ... Remarque L'algorithme de Howard nécessite souvent peu d'itérations pour converger "bibcool19", mais chaque itération comprend une inversion de matrice. Cette méthode, s'avère donc peu pratique vu l'important temps de calcul nécessaire pour inverser les matrices de grandes tailles. Pour contourner ce problème, on propose de résoudre le système linéaire A · J = b par factorisation plutôt que par inversion de la matrice A(voir annexe).
page : 20
Gestion de protefeuille
3 Approche de Black-Litterman L'intérêt de cette approche, connue encore sous le nom de l'allocation mixte, est de trouver un équilibre entre les positions de long et de court termes. Les positions de long terme sont les allocations du portefeuille de référence qui peut être représenté par l'indice du marché dont les actifs constitutifs sont pondérés par leur capitalisation boursière ,ou par les allocations issues d'une optimisation quantitative, telle que l'optimisation statique ou dynamique présentées auparavant. Les positions de court terme sont habituellement le produit de modèles ou d'idées du gestionnaire de portefeuille. Ces prévisions peuvent être la source de rendement excédentaires par rapport au portefeuille de référence, mais aussi une source de risque. L'allocation mixte d'actifs a donc pour but, d'obtenir un compromis entre le portefeuille de référence et les positions tactiques, de telle manière que le potentiel de rendements excédentaire soit intéressant sans que le risque encouru puisse empêcher l'atteinte des objectifs nancières du portefeuille. Dans cette section, on montrera en premier lieu le fondement mathématique de l'approche, ensuite, la démarche pratique de spécication des vues du gestionnaire du portefeuille, enn on exposera une méthode de calibration des paramètres du modèle.
3.1 Le modèle de Black-Litterman Etant donné la problématique à laquelle fait face le gestionnaire de portefeuille, le modèle de Black-Litterman[7][8][9] produit un vecteur de prévisions de rendements pondérés entre les rendements du marché et les vues du gestionnaire. On note µBL ce vecteur de rendements espérés et µ le vecteur des rendements d'équilibre dénis à partir des pondérations de capitalisation. Ces rendements d'équilibre ont des fondements solides qui ne peuvent pas être ignorés. On s'autorise néanmoins à des écarts en fonction des vues du gérant. On suppose que les rendements espérés sont distribués autour des rendements implicites d'équilibre avec une matrice de covariance proportionnelle à la matrice de covariance initiale ;
µBL 7→ ℵ(µ, τ Σ) Le facteur de proportionnalité τ sera plus au moins faible en fonction des niveaux de conance dans le marché, plus τ est grand, plus la conance dans le marché sera grande. Dans le cas où on dispose pas de vue particulière, τ = 0, les rendements espérés seront égaux à µ. Dans le cas de vues, il faut les combiner avec l'équilibre de manière optimale, c'est tout l'objectif, la diculté de l'approche de Black-Litterman. Pour le moment, supposons que nous pouvons préciser ces vues sous la forme matricielle suivante :
P.µBL = V + ² avec P une matrice k lignes et n colonnes, avec k le nombre de vues et n le nombre d'actifs, ² un terme d'incértitude sur la vue. P.µBL est supposé normalement distribué de moyenne V et de matrice de covariance Ω correspondant au terme d'incertitude ². Dans le cas de vue incertaines , on montre que l'espérance de µBL est : (voir annexe) h i−1 h i −1 −1 µBL = (τ Σ) + P 0 Ω−1 P (τ Σ) µ + P 0 Ω−1 V page : 21
Gestion de protefeuille
Cette formule connue sous le nom de "Master Formula" s'interprète de la manière suivante : L'espérance des rendements µBL apparaît comme une moyenne pondérée : des rendements µ avec un coecient de pondération (τ Σ)−1 , qui sera d'autant plus fort que τ et Σ seront faibles. des vues V avec un coecient de pondération P 0 Ω−1 qui sera d'autant plus fort que l'incertitude sur la vue Ω sera faible. Lorsque le gérant est moins conant dans ses vues l'eséprance du rendement sera plus proche des rendements d'équilibre µ. L'espérance des rendement apparaît donc comme un compromis (mais optimal) entre l'équilibre du marché et les vues. Remarque : Dans le cas d'un seul actif de rendement d'équilibre µ et de variance σ 2 , avec µBL 7→ ℵ(v, w2 ), la relation précédente devient :
µ v + 2 2 τ σ w µBL = 1 1 + 2 2 τσ w on remarque nettement que l'espérance du rendement est bien une moyenne entre le rendement d'équilibre et la vue. La dernière étape consiste à déterminer les pondérations optimales. Pour cela, il sut d'utiliser l'approche statique ou dynamique introduites auparavant, en remplaçant uniquement le vecteur des rendements moyens historiques, par le vecteur µBL . Exemple : Dans le cas de l'approche statique sans contraintes, le vecteur des allocations optimales s'écrit :
wBL =
1 −1 Σ µBL . γ
avec γ le coecient d'aversion au risque
3.2 Spécication des vues On peut spécier les vues de diérentes manières : en relatif, du type : le secteur A va surperformer le secteur B de 5%, ou de manière absolue : le secteur C a un rendement espéré de 10%. Considérons par exemple , la vue suivante : "Les secteurs de la pharmacie et des valeurs mobilières va surperformer les telecom et les technologies par 3%, à plus au moins 1% avec une conance de 90%. Cette vue s'exprime de la manière suivante : h i £ ¤ mobil tech wpharm µpharm + w µ − wtelec µtelec 7→ ℵ(3%, 0.612 ) mobil BL BL + wtech µBL BL La performance relative de 3% à plus au moins 1% est interprété comme une variable aléatoire normalement distribuée de moyenne 3% et variance telle que 90% se trouve entre 2% et 4%, autrement dit tel que 1.645 σ =1%, soit σ =0.61%. Une vue absolue peut être formulée de la manière suivante : le secteur des biens non cycliques sera de 7.5% à plus au moins 1.5% (à 90% de conance). Se traduisant par : 2 1.µcycl BL 7→ ℵ(7.5%, 0.91 ) page : 22
Gestion de protefeuille
De la même façon que précédement, σ =0.91 correspond à l'écart type normal, tel que 1.5=1.645σ . On peut en plus, combiner ces deux vues sous une forme matricielle pour construire la matrice P de 2 lignes (nombre de vues) et 10 colonnes (nombre d'atifs égale à 10 par exemple) . µ ¶ 0 0 0.34 0 0.66 0 −0.51 0.49 0 0 P = 0 0 0 1 0 0 0 0 0 0 avec
µ V =
et
µ Ω=
3% 7.5%
0.61%2 0
¶
0 0.91%2
¶
3.3 Calibrations La calibration consiste à trouver la valeur des paramètres du modèle à partir des données du marché. Ainsi, dans le cas du portefeuille de marché, de rendement rm et volatilité σM , le paramètre d'aversion γ s'obtient par la relation :
γ=
rM − rf ree . 2 σM
Le paramètre τ qui intervient dans la formule de Black-Litterman peut être calibré de plusieurs manières. Une première méthode consiste à rechercher un compromis entre la conance totale représentée par la variance totale "trace(Ω)" et un terme d'incertitude sur les vues liées au marché "τ 10k P ΣP 0 1k ", avec 1k le vecteur de dimension k contenant des 1 :
τ=
Ω 10k P ΣP 0 1k
Remarque : En appliquant la relation précedente dans le cas d'un seul actif, on obtient :
τ= et
w2 σ2
1 (µ + v) 2 Une autre façon pour calibrer τ consiste à examiner les performances attendues. L'Information Ratio anticpé doit rester raisonnable. Ce ratio d'information est égal au rendement en excès divisé par l'écart type des rendements en excès, plus connu sous le nom de "Tracking Error". Un ratio d'information réaliste ne peut dépasser 2 : des rendements anticipés qui s'écartent de plus de 2 écart type des rendements d'équilibre sont très improbables. Si le Ratio d'information est supérieur à 2, il sut de diminuer τ jusqu'à obtenir un ratio d'information égal à 2. µBL =
page : 23
Modélisation GARCH
Deuxième partie
Modélisation GARCH La modélisation des séries nancières est un problème complexe. Cette complexité n'est pas seulement due à la grande variété des séries (prix d'actions, taux d'intérêt, taux de change . . .), à l'importance de la fréquence d'observation (minute, jour, heure,. . .) ou à la disponibilité d'échantillons de très grande taille. Elle tient surtout à l'existence de régularités statistiques ('faits stylisés') communes à un très grand nombre de séries nancières et diciles à reproduire articiellement à partir de modèles stachastiques. Parmi ces régularités, on cite ci-dessous, celles vériées pour les séries quotidiennes de prix des actions. ³ ´ t−1 Soit pt le cours d'un actif à la date t et rt rt = ptp−p son rendement. t−1
(i) Non stationnarité de pt . (i) Autocorrélation des carrées des variations de prix ; on constate que la série (rt ) présente de très faibles autocorrélations, le rendant proche d'un bruit blanc. En revanche les séries des carrées rt2 sont souvent fortement autocorrélées. Ces deux proporiétés ne sont pas incompatibles mais montrent que le bruit blanc rt n'est pas indépendant. (iii) Regroupement des extrêmes ; Les grandes valeurs de |rt |, ou fortes variations de prix, tendent
à être suivies de grandes valeurs, et les petites de petites. Cette propriété se voit souvent à l'oeil nu sur les trajectoires des séries. Comme ces sous périodes sont récurrentes mais se succèdent de façon non périodiques, ceci ne signie pas que la suite des rendement est incompatible avec un processus stationnaire. C'est un phénomène connu sous le nom d'hétéroscédasticité conditionnelle ( variance conditionnelle n'est pas constante).
(iv) Queues de distribution épaisses : Lorsque l'on considère les distributions de probabi-
lité empiriques de séries de rendements, ou de variations de prix, ou encore du logarithme de ces variations de prix, on s'aperçoit généralement que celles-ci ne correspondent pas à une distribution gaussienne. Plus précisément, les distributions de ces séries présentent des queues épaisses et des pics en zéro : elles sont dites Leptokurtiques.
(v) Eet de levier : Il s'agit de l'assymétrie de l'impact des valeurs passées positives sur la
volatilité de la date courante. Ainsi, les valeurs négatives(baisses du cours) tendent à provoquer un accroissement de volatilité supérieur à celui induit par des valeurs positives ( hausses des cours) de même amplitude.
1 Représentation du modèle GARCH(p,q) Les propriétés précédentes illustrent la diculté de modéliser les séries nancières. Le modèle introduit dans la littérature économétrique par Engle (1982) an de prendre en compte les proporiétés des séries nancières repose essentiellement sur le concept de variance conditionnelle. Dans ce modèle, celle-ci s'écrit comme une fonction ane des valeurs passées du carré de la série. Cette spécication particulière connue sous le nom GARCH (modèle AutoRégressif Conditionnellement Hétéroscédastique)[10] se révèle très fructueuse car elle permet une étude complète des proporiétés des solutions tout en étant assez générale. Pour tout processus (rt ), nous notons rt =: σ (rs ; −∞ ≤ s ≤ t − 1) la tribu engendrée par le passé page : 24
Modélisation GARCH
de rt . Nous donnons une dénition du processus GARCH fondée sur les deux premiers moments de rt conditionnels à son passé. Dénition : Soit (ηt ) une suite de variables i.i.d de loi η (0, 1) . On dit que (rt ) est un processus GARCH(p,q) au sens fort ( relativement à la suite (ηt )) s'il vérie : (i) rt = σt ηt avec σt ∈ indépendant de ηt+i pour tout i ≥ 0 ; (ii) Il existe des constantes w, αi , i = 1, . . . , q et βj , j = 1, . . . , p telles que q p X X ¡ ¢ 2 2 σt2 = V rt |rt−1 = w + αi rt−i + , t∈Z βj σt−j i=1
(1)
j=1
Remarque Soit (νt ) le processus d'innovation de rt2 . Par dénition νt = rt2 − E[rt2 |rt−1 ]. En remplaçant dans l'équation (1), on obtient : max(p,q)
rt2
=
X
(αi +
2 βi ) rt−i
+ νt −
i=1
p X
2 βj νt−j , t∈Z
(2)
j=1
avec la convention αi = 0 (resp.βj = 0) si i > q (resp. j > p). On retrouve ainsi dans cette équation la structure linéaire des modèles ARMA, permettant par exemple l'identication des ordres p et q du modèle GARCH. Sous des hypothèses supplémentaires impliquant la stationnarité de rt2 , on peut armer que si rt est un processus GARCH(p,q), (rt2 ) est un processus ARMA(max (p, q) , p). Dans la suite, nous présentons une analyse statistique du modèle GARCH comportant plusieurs étapes : vérication de l'hypothèse du bruit GARCH, identication des ordres p et q , estimation des paramètres de la volatilité (coecients w, αi , βj ) pour des ordres p et q donnés, adéquation du modèle estimé et sélection nale du modèle le plus approprié.
2 Vérication de l'hypothèse du bruit GARCH On note ρ(h) (resp. ρb(h)) l'autocorrélation d'ordre h (resp. empirique) du processus rt , et γ(h) (resp. γ b(h)) son autocovariance d'ordre h (resp. empirique). On montre que si (rt ) est un processus GARCH(p,q) strictement stationnaire non anticipatif avec la condition du moment d'ordre 4 ni (E[rt4 ] < ∞) alors, quand n → ∞,
√
nb ρm à ℵ( 0 ,
1 Σm ) γ b(0)2
(3)
avec : - ρm (resp. ρc m ) Le vecteur des m premières autocorrélations (resp. empiriques) du processus (rt ) ; ρb(1) ρbm = ...
ρb(m)
page : 25
Modélisation GARCH
- Σm
= var
2 E[rt2 rt−1 ]
rt rt−1 2 .. E[rt rt−1 rt−2 ] = . .. . rt rt−1 E[rt2 rt−1 rt−2 ]
E[rt2 rt−1 rt−2 ] 2 E[rt2 rt−2 ]
... ..
···
.
E[rt2 rt−1 rt−m ] .. . 2 E[rt2 rt−m ]
Pn 1 - ρbm = γbγbh0 et γ bh = n−h t=h+1 rt rt−h A partir de (3), on montre, en utilisant le théorème d'ergodicité appliqué au processus (rt ), que la statistique de portmanteau dans le cas d'un bruit GARCH s'écrit sous la forme : Qm = nb γ02 ρb0m Σ−1 bm ρ bm ρ et que cette statistique suit asymptotiquement une loi de χ2 à m degrés de liberté. Dès lors, l'hypothèse du bruit GARCH est rejetée au niveau de signication α si :
Qm > χ21−α, m Remarques : - La statistique de portmanteau dans le cas d'un bruit blanc fort (bruit i.i.d) prend la forme suivante :
Qm = n
m X
ρb2 (h).
h=1
Cette dernière suit asymptotiquement une loi χ2 à m degrés de liberté. - Dans le corrélogramme empirique de simulation d'un bruit blanc , on a constaté que les ordres 2 et 4 des autocorrélations sont très nettement en dehors des bandes de conance à 95% calculées sous l'hypothèse de bruit blanc fort(voir gure ci-dessous). Le praticien non averti sera tenté a rejeter l'hypothèse de bruit blanc.
√ √ Pour éviter ce genre de spécications, il faut donc bien être conscient que les limites [−1.96/ n , 1.96/ n] ne sont pas valables pour les autocorrélations d'un bruit blanc GARCH ( bruits rt dépendants ) et comme le montre la borne de signicativité pour un bruit blanc GARCH, on ne devrait pas rejeter l'hypothèse de bruit blanc GARCH car toutes les autocorrélations sont à l'intérieur ou ne débordent que légèrement des limites de signicativité.
page : 26
Modélisation GARCH
Fig.
5 Corrélogramme d'une simulation d'un bruit blanc et bornes de signicativité
page : 27
Modélisation GARCH
3 Identication des ordres p et q du modèle GARCH Il n'est souvent pas facile d'identier les ordres d'un modèle GARCH(P,Q) à partir des autocorrélations ou des autocorrélations partielles. La méthode de coin( Béguin, 1980), de Box et Jenkins (1981) ou encore la méthode de l'epsilon-algorithme (Berlinet, 1982) dénissent des statistiques plus commodes. Nous présentons la méthode de Box et Jenkins[11]. Principe de la méthode : Pour identier les ordres d'un GARCH(p,q), on utilise le fait que (rt2 ) suit un ARMA(P,Q) avec P=max(p,q) et Q=p. On commence par ajuster un modèle ARMA(P,Q) à rt2 , pour cela, on procède en deux temps ; - D'abord, on ajuste un modèle autorégressif d'ordre P "AR(P)" à rt2 :
rt2 =
P X
2 φi rt−i + at
(4)
i=1
- Ensuite, on ajuste un modèle moyenne mobile d'ordre Q "MA(Q)" au bruit at :
at =
Q X
θj bt−j
(5)
j=1
de (4) et (5), on trouve les ordres P et Q qui vérifent spécication :
rt2 =
P X i=1
2 + φi rt−i
Q X
θj bt−j
j=1
Par la suite,
→ Quand l'ajustement ARMA ressort P>Q alors le modèle GARCH(p,q) à retenir est tel que p=Q, q=P. → Quand l'ajustement ARMA ressort P≤Q, ceci aboutit aux choix des modèles GARCH(p,q) avec (p,q) = (Q,0), (Q,1), . . . , (Q,P). La sélection du modèle le plus approprié entre ces derniers sera présentée dans l'étape 5 de validation du modèle. Reste à déterminer une méthode pour ajuster les modèles AR(P) et MA(Q) , ceci fera l'objet des deux points suivants.
3.1 Méthode d'ajustement du modèle autoregressif AR(p) Un processus autrorégressif d'ordre P est déni par le modèle :
Xt = φ1 Xt−1 + · · · + φP Xt−P + w + at avec
½
at 7→ Bruit blanc (0, σ 2 ) φP 6= 0, (w, φ1 , . . . , φP ) ∈ RP +1
On montre que les processus {Xt } et {Xt − w} ont la même structure d'autocovariance et d'autocorrélation. Dans la suite, lorsqu'on va s'intéresser aux autocovariances et aux autocorrélations, on suppose sans restruction que le processus est centré (w = 0). page : 28
Modélisation GARCH
Par ailleurs, on montre la relation de récurrence suivante entre les autocorréélations :
∀k > 1, ρt = φ1 ρk−1 + · · · + φP ρk−P duquelle, on déduit le système d'équations ci-dessous connu sous le nom du système de Yule-Walker, et qui permettra de déterminer l'ordre P du modèle AR : ρ1 φ1 1 ρ(1) . . . ρ(P −1) ρ(1) φ 2 ρ2 1 .. = .. .. .. . . . .
ρ(P −1)
1
φP
ρP
Théorème Pour un processus AR(P), on a
1 φbk, k 7→ ℵ(0, ) pour k ≥ P + 1 N avec φbk, k l'etimation du coecient d'autocorrélation partielle φk, k . Application de point de vu pratique, l'ordre P à retenir est celui qui vérie :
2 |φbk, k | < √ pour k = P + 1, P + 2, . . . n φbk,k étant la dernière composante de la solution du système de Yule-Walker d'ordre k ; b φk,1 1 ρb(1) . . . ρb(k−1) ρb(1) ρb(1) 1 ρb(2) φbk,2 = .. .. . . . . . . . . . bk,k ρb(k−1) 1 ρb(k) φ
3.2 Méthode d'ajustement du modèle moyenne mobile MA(q) Un processus moyenne mobile d'ordre Q est déni par le modèle :
Xt = w + θ0 at + θ1 at−1 + · · · + θQ at−Q avec
½
at 7→ Bruit blanc (0, σ 2 ) θQ 6= 0, (w, θ0 , θ1 , . . . , θQ ) ∈ RQ+2
Théorème Si (Xt ) suit un processus moyenne mobile d'ordre Q alors, pour tout k ≥ Q + 1 ρbk 7→ ℵ(0, σρ2k ) avec
¤ 1 £ 1 + 2ρ21 + · · · + +2ρ2Q N et ρk le coecient d'autocorrélatiuon d'ordre k du processus (Xt ). Application σρ2k =
page : 29
Modélisation GARCH
En pratique, on ne connait pas l'ordre q, on teste successivement les modèles MA(Q) pour Q=0,1,2,. . . Pour tester H0 : M A(Q), on s'intéresse à k=Q+1. Dans ce cas, i 1 h 1 + 2ρb1 2 + · · · + +2b ρ2Q−1 σρ2k ' N l'hypothèse H0 sera retenue si |b ρk | < 1.96 σρk pour k=Q+1, Q+2,. . .
4 Estimation des paramètres du modèle GARCH(p,q) par quasi-maximum de vraisemblance Dans cette partie nous présentons une procédure itérative de calcul de la log-vraisemblance, conditionnellement à des valeurs initiales. Cette vraisemblance est écrite comme si la variable était normale centrée réduite, on parle de pseudo ou quasi-vraisemblance[12][13].
4.1 Quasi-vraisemblance conditionnelle On suppose que les observations r1 , . . . , rn constituent une réalisation (de longueur n) d'un processus GARCH(p,q) déni par : ½ rt = σt η¡t ¢ Pp Pq 2 2 + j=1 βj σt−j σt2 = V rt /rt−1 = w + i=1 αi rt−i où les ordres p et q sont supposés connus. On note θ le vecteur des paramètres ;
θ = (θ1 , . . . , θp+q+1 )0 := (w, α1 , . . . , αq , β1 , . . . , βp )0 La vraie valeur des paramètres est inconnue et est notée : θ0 = (θ1 , . . . , θp+q+1 )0 . Pour écrire la vraisemblance du modèle, il faut spécier une distribution particulière pour les variables i.i.d ηt . on considère la vraisemblance gaussienne, i.e. la vraisemblance obtenue à partir d'une loi normale centrée réduite pour les ηt . Nous ne ferons cependant pas l'hypothèse que cette loi constitue la vraie distribution du processus ηt . 2 que nous allons préciser, la vraisemEtant données des valeurs initiales r0 , . . . , r1−q , σ02 , . . . , σ1−p blance conditionnelle gausssienne Ln (θ) s'écrit :
µ ¶ rt2 p Ln (θ) = Ln (θ; r1 , . . . , rn ) = exp − 2 2σt 2πσt2 t=1 n Y
1
où les σt2 sont dénies récursivement, pour t≥1, par
σt2 = σt2 (θ) = w +
q X i=1
2 αi rt−i +
p X
2 βj σt−j (θ).
j=1
Pour une valeur donnée de θ, sous l'hypothèse de stationnarité au second ordre, la varaince non conditonnelle ( correspondant à cette valeur de θ) est un choix raisonnable pour les valeurs initiales inconnues : n 1X 2 2 2 r02 = · · · = r1−q = σ02 = · · · = σ1−p = r n t=1 t Un estimateur de quasi maximum de vraisemblance (QMV) de θ est déni comme toute quantitée θbn vériant presque sûrement : Ln (θbn ) = supθ Ln (θ) page : 30
Modélisation GARCH
On voit, en prenant le logarithme, que maximiser la vraisemblance revient à maximiser par rapport àθ n X log Ln (θ) = lt (θ) t=1
où
1 1 rt2 lt (θ) = − log σt2 − 2 2 σt2
4.2 Calcul numérique de l'estimateur du QMV Plutôt que d'utiliser les équations de vraisemblances obtenues en annulant la dérivée par rapport à θ du log-vraisemblance pour calculer les paramètres du modèle, nous proposons d'utiliser une méthode numérique qui va donner certes, uniquement une approximation de ces derniers, mais qui va permettre de réduire signicativement le temps de calcul nécessaire pour la résolution analytique. la méthode de Levenberg Marquardt qu'on va détailler par la suite, semble être un bon choix et sa mise en place pratique nécessiste à la fois, le calcul de la dérivée première de la log-vraisemblance et de la matrice Hessienne. Calcul de la dérivée première de la log-vraisemblance La dérivation par rapport à θ de lt donne :
¸ · ∂lt 1 1 ∂σt2 rt2 1 1 ∂σt2 1 ∂σt2 rt2 = −1 =− 2 + ∂θ 2 σt ∂θ 2 ∂θ σt4 2 σt2 ∂θ σt2 avec
p X ∂σ 2 ∂σt2 βi t−i = zt + ∂θ ∂θ i=1
et
(6)
¡ ¢ 2 2 2 2 zt = 1, rt−1 , . . . , rt−q , σt−1 , . . . , σt−p ∂σ 2
∂σ 2
Notons que le calcul de ∂θp requiert le calcul de ∂θ0 . Puisque σ02 est calculée comme la moyenne des carrés des rendements échantillonnales, elle ne dépend pas de θ ; Ã ! n ∂ 1X 2 r =0 ∂θ T t=1 t donc si t ≤ 0,
∂σt2 =0 ∂θ Ce qui permet d'opérer un calcul récursif des dérivées dans l'équation (6). Calcul de la matrice hessienne (H) La dérivée seconde par rapport à θ de lt est de la forme : · 2 · ¸ ¸ rt 1 1 ∂σt2 ∂σt2 rt2 ∂ 2 lt ∂ 1 1 ∂σt2 = − − 1 ∂θ∂θ0 σ2 ∂θ0 2 σt2 ∂θ 2 σt4 ∂θ ∂θ0 σt2 · 2t ¸ ¸· r 1 1 ∂σt2 ∂σt2 1 1 ∂σt2 ∂σt2 rt2 1 1 ∂ 2 σt2 = t2 − 1 − − . 2 4 0 0 σt 2 σt ∂θ∂θ 2 σt ∂θ ∂θ 2 σt4 ∂θ ∂θ0 σt2
page : 31
Modélisation GARCH
avec p
p
2 2 ∂ 2 σt2 ∂zt X ∂σt−i ∂βi X ∂ 2 σt−i = + + βi 0 0 0 ∂θ∂θ ∂θ ∂θ ∂θ ∂θ∂θ0 i=1 i=1
=A+
p X
Bi +
i=1
p X
Ci
(7)
i=1
A, Bi , Ci étant des matrices de dimension (1 + q + p)(1 + q + p) avec ; ¤0 £ 2 2 2 ∂ 1, rt−1 , . . . , σt−1 , . . . , σt−p A= ∂ [α0 , α1 , . . . , β1 , . . . , βp ] 0 0 ··· 0 0 ··· 0 .. .. .. .. .. .. .. . . . . . . . 0 0 · · · 0 0 · · · 0 2 2 2 2 2 ∂σt−1 ∂σt−1 ∂σt−1 ∂σt−1 ∂σt−1 = ∂w ··· ··· ∂α1 ∂αq ∂β1 ∂βp .. .. .. .. .. .. .. . . . . . . . 2 ∂σt−p ∂w
2 ∂σt−p ∂α1
···
2 ∂σt−p ∂αq
2 ∂σt−p ∂β1
···
2 ∂σt−p ∂βp
le nombre des lignes nulles est de 1 + q .
Bi =
2 ∂σt−i ∂βi ∂θ ∂θ0
∂βi = (0, . . . , 0, 1, 0, . . . , 0) ∂θ0 & (1 + q + i)ème composante 0 0 ... 0 .. .. .. .. . . . . 0 0 ... 0 0 2 2 2 Bi = ∂σt−i ∂σt−i ∂σt−i ∂w · · · ∂α1 ∂αp .. .. .. .. . . . . 0 0 ... 0 on a donc :
p X
Bi0 = A
i=1
Les matrices Ci peuvent être calculées de manière récursive de l'équation (7), et ce, en utilisant la condition initiale : ∂ 2 σt2 =0 , ∀t≤0 ∂θ∂θ0 Méthode de Levenberg Marquardt Il s'agit d'une variante de la méthode de gradient qui permet de réduire signicativement le nombre d'itérations. En eet, la méthode de gradient donne la direction vers laquelle se déplacer pour trouver le maximum, mais ne donne pas le pas. Dans la descente de gradient classique ce pas est un coecient xe, et dans cette variante , il varie à chaque itération et permet de ce déplacer rapidement vers le maximum. page : 32
Modélisation GARCH
Intuition et motivation de la méthode
On suppose, comme pour la descente de gradient, que l'on se trouve à une itération numéro i , et que l'on cherche à calculer un nouveau vecteur θi en fonction de θi−1 , tel que Ln (θi ) se rapporche plus du maximum de Ln . Pour cela, on détermine par approximation linéaire de Ln du point θ auquel le gradient s'annule. Mais, ceci n'est ecace en pratique que si la fonction Ln est eectivement proche d'une droite autour du point θi−1 . Dans le cas contraire cet algorithme donne de très mauvaises résultats. L'idée de Levenberg est donc d'utiliser cet approche dans la zone où Ln est quasi-linéaire, et une descente de gradient dans les autres cas. Le pas d'une itération λ de cet algorithme est calculé de la manière suivante : Quand Ln (θ) augmente au cours de l'itération, on augmente λ (en le divisant par 10 par exemple), et l'on se rapproche ainsi de la méthode d'approximation linéaire. Au contraire, si Ln (θ) diminue, cela signie que nous nous trouvons dans une région dans laquelle Ln n'est pas trop linéaire, et donc on diminue λ (en le divisant par 10 par exemple) an de se rapprocher de la descente de gradient. Cet algorithme a ensuite été améliorée par Marquardt, l'algorithme d'optimisation étant déni par :
θi = θi−1 − (H + λdiag (H))
−1
Remarque
Un bon point de départ pour l'algorithme est obtenu par une estimation au préalable des coecients par la méthode des moindres carrés.
5 Adéquation du modèle estimé et sélection nale du modèle le plus approprié Sous les hypothèses : H1 : rt strictement stationnaire non anticipatif ; H2 :
Pp j=1
βj < 1 ;
H3 : ηt2 à une loi non dégénérée ; H4 : identiabilité de θ0 ; H5 : α0 i 6= 0 et β0 j 6= 0 pour tout i = 1 . . . q et tout j = 1 . . . p ; H6 : E[ηt4 ] < ∞ ; on montre que
´ ¡ ¡ ¢ ¢ √ ³ n θb − θ0 7→ ℵ 0, E[ηt4 ] − 1 · J −1
avec
· J =E
∂ 2 lt (θ) ∂θ∂θ0
¸ θ=θ0
Ce qui permet de construire des intervalles de conances et d'eectuer des tests d'hypothèses sur les valeurs du paramètre θ0 . La statistique usuelle de wald pour tester l'hypothèse θ0 = θ1 contre θ0 6= θ1 prend la forme n (θ0 − θ1 ) Jb (θ0 − θ1 ) w(1+q+p) = 4 [ E[η ] − 1 t
page : 33
Modélisation GARCH
et suit asymptotiquement une loi χ2 à (1+q+p) degrés de libertés. Toutefois, en vertu de l'hypothèse H4, ce test ne permet pas de tester la nullité d'un coecient. Pour tenir compte de cette particularité, la statistique de wald dans ce test suit asymptotiquement une loi χ2 avec une masse en zéro (loi mélange) ;
w (1) 7→
1 1 δ0 + χ21 2 2 & masse en 0 .
l'hypothèse H0 : θ0 i = 0 avec i qui varie dans l'intervalle des entiers [1, n] sera rejetée si w1 > χ21−2α (1).
6 Prévision des séries nancières Soit ( rt ) un processus GARCH(p,q). La prévision optimale de ( rt ) sachant son passé est : £ ¤ © £ ¤ ª E rt+h |rt−1 = E E rt+h |rt+h−1 |rt−1 = 0, h ≥ 0 t ∈ Z Ce qui montre que la prévision optimale GARCH de toute variable du futur sachant son passé est nulle. Le principale intérêt des modèles GARCH ne réside évidement pas dans la prévision de la variable elle même mais dans celle de son carré. Les prévisions à horizon h ≥ 0 s'obtiennent récursivement par : q p X £ 2 £ 2 £ 2 ¤ £ 2 ¤ ¤ X ¤ αi E rt+h−i |rt−1 + βj E σt+h−j |rt−1 E rt+h |rt−1 = E rt+h |σt−1 = w + i=1
avec pour i ≤ h et pour i > h
j=1
£ 2 ¤ £ 2 ¤ E rt+h−i |rt−1 = E rt+h−i |σt−1 £ 2 ¤ £ ¤ 2 2 E rt+h−i |rt−1 = rt+h−i , E σt+h−1 = σt+h−i .
7 Exemple numérique d'ajustement et prévision GARCH Pour cette illustration des étapes de la modélisation GARCH, nous avons insérer dans la base de données liée à l'application JAVA qu'on a implémenté, les données historiques du rendements journaliers du cours de l'action BNP sur la période du 20/11/2006 au 21/11/2007. Le premier point vérié est la possibilité d'ajuster un modèle GARCH à cette série nancière. Pour ce faire, l'application calcule les autocorrélations empiriques ρb(h), puis les statistiques de portemanteau Qm des 20 premièrs ordres. Ensuite, ces statistiques sont comparées avec les bornes de signicativité χ21−α, m importés de la table de la loi khi-deux. Dans cette exemple, comme on peut le voir dans le tableau ci-dessous, les statistiques de portemanteau ne dépassent jamais les barres χ290%, m associées. Ainsi, la série nancière accepte une modélisation GARCH. L'étape suivante, consiste à identier les ordres p et q du modèle GARCH. Dans cette étape, comme exposé auparavant, l'application va ajuster un modèle autoregressif AR à rt2 , puis un modèle
page : 34
Modélisation GARCH
Fig.
6 Statistiques de portemanteau (série BNP, période 06-07)
MA à la série du bruit du modèle AR, et c'est à la base de ces deux ajustements que les ordres p et q du modèle GARCH sont calculés. Ceci donne :
(p, q) = (1, 2) . Reste à estimer les paramètres (w, α1 , α2 , β1 ) du modèle. L'application opère dans un premier lieu une estimation par la méthode de maximum de vraisemblance ordinaire. Cette estimation, est utilisée comme point de démarrage par l'algorithme de Levenberg Marquardt qui cherche une approximation de l'estimateur du quasi maximum de vraisemblance. Les résultats de cette maximisation sont les suivants :
(w, α1 , α2 , β1 ) = (0.13, 0.32, 0.06, 0.38) on écrit alors :
2 2 2 σt2 = 0.13 + 0.32 rt−1 + 0.06 rt−2 + 0.38 σt−1 .
La mesure de la pertinence du modèle s'eectue moyennant le test de signicativité de ses paramètres. Pour la série nancière de la BNP, ce test juge tous les paramètres signicatifs et permet de garder la forme structurelle actuelle du modèle. La dernière étape consiste à utiliser la modélisation ajustée pour prévoir le comportement futur de la série. Ci-dessous, nous avons les valeurs passées et espérées de la volatilité journalière du rendement de l'action BNP, et les intervalles de conance associées aux prévisions.
page : 35
Modélisation GARCH
Fig.
jours
7 prévision de la volatilité journalière du rendement de l'action BNP sur un horizon de 15
page : 36
Conclusion
L'aboutissement de ce travail était la réalisation d'une application informatique qui permet de gérer le portefeuille selon trois approches : approche statique, dynamique et Black-Litterman, de modéliser la volatilité du portefeuille et des séries nancières en général, de calculer la VaR (Value-At-Risk) pour plusieurs seuils de signicativité, horizons ,et ce, selon plusieurs approches : historique, paramétrique, Cornish-Fisher, incremental VaR . . ., d'évaluer les ratios et indicateurs fondamentaux pour l'encadrement du risque : Oméga, Sortino, exposant de Hurst, Down Side Risk . . .. Concernant les options oertes pour la gestion du portefeuille, l'utilisateur pourra choisir entre une fonction d'utilité exponentielle ou puissance, insérer leurs paramètres ou à défaut, prendre les valeurs proposées. Il peut en plus, déterminer facultativement le nombre de points de discrétisation du temps et de l'espace dans la gestion dynamique. Par ailleurs, l'utilisateur peut calibrer les paramètres du modèle de Black-Litterman en utilisant les valeurs optimales achées par défaut, ou les changer s'il en voit la nécessité. L'amélioration à apporter sur cette application se situe essentiellement au niveau de la combinaison entre les deux premiers types d'approches et celle de Black-Litterman. En eet, dans l'implémentation, les positions de long terme correspondent aux allocations du portefeuille dont les actifs constitutifs sont pondérés par leur capitalisation boursière, ce qui serait optimal est deux remplacer ce vecteur par les résultats d'optimisation obtenus par l'approche de gestion statique ou dynamique avant de lancer les calculs de l'allocation optimale via l'approche de Black-Litterman. Ce qui est de la modélisation de la volatilité par le modèle GARCH, elle a l'avantage d'orir un cadre complet d'ajustement, d'estimation, de prévision, avec en plus des tests pour valider la pertinence des résultats. Ce qui serait encore mieux, c'est de mettre en place le modèle GARCH à seuil (THRESHOLD GARCH) qui permet de prendre en compte l'asymétrie de la volatilité en fonction du sens de variation du rendement. Le modèle GARCH exponentiel (EGARCH) serait aussi une possibilité attractive à entreprendre, dans la mesure où ce dernier nimpose pas de contraintes à priori sur les coecients, chose qui nous autorise à garder les paramètres ayant une contribution négative sur la volatilité. Bien évidemment, à coté du cadre de modélisation qui se complexie, la contrainte du temps de stage s'impose, et ne nous laisse pas la possibilité de pousser les problématiques posées très loin. Toutefois, la possibilité de faire évoluer l'application est ouverte pour l'équipe d'ingénierie nancière de la BNP.
Bibliographie
[1] Nicolas GAUSSEL :Gestion de portefeuille, Janvier 2007. [2] G. Demange and J-C. Rochet, Méthodes Mathématiques de la Finance. Econométrica, 2005. [3] Gabrielle DEMANGE , Jean-Charles ROCHET : Méthodes mathematiques de la nance, 2ème edition , editeur ECONOMICA , Mars 1997. [4] W.H. Fleming and H.M.Soner : Controlled Markov Process and Viscosity Solutions, Springer, 1992. [5] Mohamed Mnif , Agnès Sulem : Optimal risk control under excess of loss reinsurance , INRIA, 14 Novombre 2001. [6] Philippe , G.Ciarlet : Introduction à l'analyse numérique matricielle et à l'optimisation ; editeur DUNOD,paris 1998. [7] Thomas IDZOREK :A Step-by-step guide to the Black-Litterman model,10 Février 2002. [8] Robert LITTERMAN , Guangliang HE :The intuition behind Black-Litterman model portfolios, Decembre 1999. [9] Daniel HERLEMONT :Frontière eciente - l'approche de Black-Litterman. [10] Christian FRANCO , Jean-Michel ZAKOIAN : "Modèle GARCH et à volatilité stochastique", Novombre 2006. [11] Jamal NSIRI :note de cours series temporelles, INSEA Rabat, Janvier 2006. [12] John-HULL :Options, futures et autres actifs dérivés, cinquième édition. [13] Gabriee FIORENTNI , Giorgio CALZOLARI :Analytic Derivatives and the Computation of Garch Estimates, Journal of Applied Econometrics, Vol.11,No.4, pp399-417 , 1996.
Annexe
1 Approche statique- optimisation sous contraintes Théorème de Karuch-Kuhn-Tucker : Soient J, h1 , . . . , hp , g1 , . . . , gq des applications de x est solution du problème max s.c : hi (x) = 0 gj (x) ≤ 0
classe C 1 de Rn dans R.
J (x) , i = 1, . . . , p , j = 1, . . . , q
si et seulement s'il existe λ = (λ1 , . . . , λp ) ∈ Rp , µ = (µ1 , . . . , µq ) ∈ Rq tels que :
∀j ∈ {1, . . . , q} , µj ≥ 0 hi (x) = 0, gj (x) ≤ 0 ∀j ∈ {1, . .P . , q} , µj gj (x) = 0P p q ∇J (x) + i=1 λi ∇hi (x) + j=1 µj ∇gj (x) = 0.
Dans le cas du problème d'optimisation sous contrainte de markovitz, le lagrangien s'écrit sous la 0 forme : L = α0 µ − α 2Σα − β (−α + α) − β (α − α) donc la solution analytique de ce problème consiste à parcourir pour chaque αi , les trois cas possibles ; ¡ ¢ αi = αi ¡βi = 0 ¢ αi ≤ αi ≤ αi ¡βi = β¢i = 0 βi = 0 αi = αi et de prendre le vecteur des α qui vérie les quatre conditions de Karuch-Kuhn-Tucker. Remarque : Pour un problème de dimension n, le nombre des combinaisons des αi à tester est de 3n ! !, ce qui rend cette méthode très couteuse en temps de calcul pour les dimensions élevées.
page : 39
Annexe
2 Approche dynamique-optimisation sans contraintes 2.1 Cas d'une fonction d'utilité puissance 1−γ
Soit U (x) = x1−γ on peut montrer que la fonction valeur est une fonction séparable ;
J (t, V ) = f (t) · g (V ) donc
¡ ∂J ¢2 n X µ2j ∂J 0 = f (t) · g (V ) = ∂V P n+1 2 ∂2J ∂t 2 ∂V 2 j=1 i=1 σji ⇒
⇒
2 2 n µ2j f (t) g 0 (V ) X Pn+1 2 00 2f (t) g (V ) j=1 i=1 σji
n 2 X µ2j f 0 (t) g 0 (V ) = 00 Pn+1 2 = C ∈ R f (t) g (V ) g (V ) j=1 i=1 σji
(1)
ainsi, les fonctions f et g sont de la forme :
f (t) = f (T ) exp (−C (T − t)) , g (V ) = V k De (1), on déduit que :
k =P n k−1
C
j=1
or J (T, V ) = f (T ) V k =
V 1−γ 1−γ
⇒C= · et puisque αj =
1 1−γ exp
1−γ γ
∂J −µj ∂V Pn+1
2
∂ J Vt ∂V 2
i=1
2 σji
i=1
2 σji
donc :
½
Ainsi J (T, V ) =
µ2j Pn+1
(T − t)
1 f (T ) = 1−γ k =1−γ n µ2j 1−γ X Pn+1 2 γ j=1 i=1 σji
Pn j=1
µ2j Pn+1 i=1
¸ 2 σji
V 1−γ
alors :
αj =
γ
µj Pn+1 i=1
2 σji
2.2 Cas d'une fonction d'utilité exponentielle
´ h i ³ Soit U (Vt ) = −exp − VV0t on cherche la fonction valeur J sous la forme : J (t, Vt ) = −exp − VV0t + f (t)
on a donc f (T ) = 0 car J (T, VT ) = U (VT ) or : 0 ∂J ∂t = −f (t) J ;
∂J ∂V
=
−1 ∂2J V0 J , ∂V 2
=
J V02
page : 40
Annexe
et puisque J vérie l'equation n
1X ∂J − ∂t 2 j=1 alors
¡
¢ ∂J 2 µj ∂V Pn+1 2 = 0 ∂2J i=1 σji ∂V 2
n 1 J 2 /V 2 X f (t) J = 2 J/V02 j=1 0
n
1X ⇒ f (t) = 2 j=1 0
après simplication, on obtient :f 0 (t) =
1 2
Pn j=1
¡
¢ ∂J 2 µj ∂V Pn+1 2 ∂2J i=1 σji ∂V 2
¡ ∂J ¢2 µj ∂V Pn+1 2 ∂2J i=1 σji ∂V 2 ∂J (µj ∂V )
∂2 J ∂V 2
2
Pn+1
n X 1 ⇒ f (t) = (t − T ) 2 j=1
i=1
2 σji
¡ ∂J ¢2 µj ∂V Pn+1 2 . ∂2J i=1 σji ∂V 2
n X Vt 1 ⇒ J (t, Vt ) = −exp − + (T − t) V0 2 j=1
¡ ∂J ¢2 µj ∂V Pn+1 2 ∂2J 2 i=1 σji ∂V
donc la stratégie optimale à suivre dans le cas d'une fonction d'utilité exponentielle consiste à investir des proportions de richesses αj qui vérient :
µj αj = Pn+1
2 i=1 σji
page : 41
V0 Vt
Annexe
3 Approche dynamique-optimisation sous contraintes 3.1 Factorisation matricielle Nombreuses sont les applications où l'on doit résoudre des systèmes linéaires avec des matrices de grandes tailles. Il peut alors être avantageux de factoriser une matrice comme un produit de deux matrices ayant des propriétés agréables, comme celle d'être triangulaire. Ci-dessous on propose un algorithme réalisant la factorisation LU d'une matrice A et stockant cette factorisation dans la place mémoire occuppée par A :
· · · · · · · · · · · · · · · · ·
f or(int i = 1; i <= N ; i + +) { f or(int j = 1 ; j <= i; j + +) { sum = 0; f or(int k = 1; k < j; k + +) sum+ = A(i, k) ∗ A(k, j); A(i, j) = A(i, j) − sum; } f or(int j = i + 1; j <= N ; j + +) { sum = 0; f or(int k = 1; k < i; k + +) sum+ = A(i, k) ∗ A(k, j); A(i, j) = (A(i, j) − sum)/A(i, i); } }
Remarque La diagonale de L (qui ne contient que des 1) n'est pas stockée. Le programme pour la descente-remontée pour calculer la solution de "Ax = b" est :
· · · · · · · · · · · · · ·
f or(int i = 1; i <= N ; i + +) { sum = 0.; f or(int k = 1; k < i; k + +) sum+ = A(i, k) ∗ b(k); b(i) = (b(i) − sum)/A(i, i); } f or(int i = N ; i >= 1; i − −) { sum = 0; f or(int k = i + 1; k <= N ; k + +) sum+ = A(i, k) ∗ b(k); b(i)− = sum; }
Condition nécessaire et susante d'existence, unicité :
page : 42
Annexe
Soit A une matrice de N × N . Pour 1 ≤ p ≤ N , on note Ap le bloc a1 1 · · · · · · a1 p a2 1 · · · · · · a2 p Ap = .. .. . . ap 1 · · · · · · ap p La matrice A admet une factorisation
A = LU où L est triangulaire inférieure avec des 1 sur la diagonale et U est triangulaire supérieure et inversible si et seulement si tous les blocs Ap , 1 ≤ p ≤ N , sont inversibles. De plus, cette factorisation est unique.
page : 43
Annexe
4 Détermination du vecteur des rendement d'équilibre de Black-Litterman La base du modèle est un problème de minimisation qui consiste à réduire les écarts du rendement espéré à la fois aux vues du gérant et au point d'équilibre du marché. Ceci se traduit par la formule suivante : 0 −1 0 minµBL [µBL − µ] (τ Σ) [µBL − µ] + [P µBL − V ] Ω−1 [P µBL − V ] . La dérivation du premier terme de l'expression précédente donne : 0
−1
∂ [µBL − µ] (τ Σ) ∂µBL
[µBL − µ]
=
h i −1 −1 ∂ µBL (τ Σ) µBL − 2µ0BL (τ Σ) µ ∂µBL
= 2 (τ Σ)
−1
µBL − 2 (τ Σ)
−1
= 2 (τ Σ)
−1
[µBL − µ]
µ (1)
La dérivation du deuxième terme donne :
£ ¤ 0 0 ∂ (P µBL ) Ω−1 (P µBL ) − 2µ0BL P 0 Ω−1 V ∂ [P µBL − V ] Ω−1 [P µBL − V ] = ∂µBL ∂µBL 0 −1 = 2P Ω P µBL − 2P 0 Ω−1 V ¡ ¢£ ¤ = 2 P 0 Ω−1 P µBL − P −1 V
de (1) et (2) le rendement µBL d'équilibre de Black-Litterman vérie : ¡ ¢£ ¤ −1 (τ Σ) [µBL − µ] + P 0 Ω−1 P µBL − P −1 V = 0
h i−1 h i −1 −1 ⇒ µBL = (τ Σ) + P 0 Ω−1 P (τ Σ) µ + P Ω−1 P .
page : 44
(2)