Skript zur Vorlesung “Entscheidungs– und Kapitalmarkttheorie (I)” von Prof. Dr. Dr. Andreas L¨offler, bearbeitet von Dr. J¨org Laitenberger∗ ¨ letzte Anderung am 28. Oktober 2003
∗
Beachten Sie bitte, dass nicht nur dieses Skript, sondern auch ein Reader mit zus¨atzlicher Literatur Grundlage der Vorlesung Entscheidungstheorie ist. N¨ahere Hinweise erhalten Sie auf einem kleinen Handout zur Vorlesung, den Sie im Internet finden.
Inhaltsverzeichnis
1 Sicherheit 1.1 Das Grundmodell . . . . . . . . . . . . . . . . . . . . . . 1.2 Pr¨aferenzrelationen . . . . . . . . . . . . . . . . . . . . . 1.3 Pr¨aferenzen im Mehrperiodenkontext . . . . . . . . . . . 1.4 Konsumgl¨attung und die Bestimmung der Zinsh¨ohe . . 1.5 Separation von Konsum– und Investitionentscheidungen: 2 Unsicherheit 2.1 Erwartungsnutzentheorie . . . . . . . . . . . . . 2.1.1 Das Grundmodell: mehrere Zust¨ande . . 2.1.2 Petersburger Spiel . . . . . . . . . . . . 2.1.3 Erwartungsnutzen . . . . . . . . . . . . 2.1.4 Grad (Intensit¨at) der Risikoaversion . . 2.1.5 Ein einfaches Portfolioproblem . . . . . 2.1.6 Stochastische Dominanz . . . . . . . . . 2.2 µ-σ–Theorie . . . . . . . . . . . . . . . . . . . 2.2.1 Das Grundmodell: mehrere Basistitel . . 2.2.2 Erwartungsnutzen und µ-σ–Theorie . . 2.2.3 Die Axiome . . . . . . . . . . . . . . . . 2.2.4 S¨attigung beim µ-σ–Kalk¨ ul . . . . . . . 2.2.5 Tobin–Separation (und Portfoliotheorie) Literaturverzeichnis
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . das Fisher–Modell
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . .
1 1 2 6 8 10
. . . . . . . . . . . . .
15 15 15 16 18 23 30 35 40 40 42 46 49 50 54
II
Inhaltsverzeichnis
S. III
Definitionen, Annahmen, S¨ atze ¨ Die Liste enth¨alt eine Ubersicht u ¨ber die im Skript zu findenden Definitionen und S¨atze Definition Definition Definition Definition Definition Definition
2.1 2.2 2.3 2.4 2.5 2.6
Satz 1.1 Satz 1.2 Satz 1.3 Satz 2.1 Satz 2.2 Satz 2.3 Satz 2.4 Satz 2.5 Satz 2.6 Satz 2.7 Satz 2.8 Satz 2.9 Satz 2.10 Satz 2.11 Satz 2.12 Satz 2.13 Satz 2.14
c L¨offler/Laitenberger 2003
Unabh¨angigkeitsaxiom Risikofreude, –aversion Markowitzpr¨amie absolute Risikoaversion relative Risikoaversion Varianzaversion
19 23 24 25 32 46
Existenz Nutzenfunktion Intertemporaler Konsum Bestimmungsfaktoren f¨ ur den Zinssatz Erwartungsnutzen konkave Nutzenfunktion und Risikoaversion Approximation Markowitzpr¨amie Charakt. fallende absolute Risikoaversion Charakt. konstante absolute Risikoaversion absolute RA und einfaches Portfolioproblem relative RA und einfaches Portfolioproblem Charakt. konstante relative Risikoaversion FSD SSD einfache Kriterien f¨ ur SSD Kovarianzmatrix und redundante Titel Varianzaversion und µ–σ–Nutzen Tobin–Separation
2 9 10 19 23 24 26 26 30 33 33 36 37 38 42 47 52
1 Sicherheit 1.1 Das Grundmodell Wir stellen das Grundmodell unter Sicherheit vor. Wir wollen uns in dieser Vorlesung mit der Frage besch¨aftigen, wie Individuen in einer unsicheren Umwelt entscheiden sollen. Dazu gehen wir zuerst auf ein Modell ein, bei dem die Unsicherheit ausgeblendet wird. Wir betrachten also eine Welt unter Sicherheit. Dieser Welt wird von uns anhand eines formalen Modells dargestellt. Dieses formale Modell soll zwei Aspekte widerspiegeln: Entscheidungen k¨onnen mehrere G¨ uter sowie mehrere Zeitpunkte, in denen diese G¨ uter konsumiert werden, betreffen. Es zeigt sich, dass wir beide Aspekte (“mehrere G¨ uter”, “mehrere Zeitpunkte”) nicht in einem formalen Modell analysieren k¨onnen. Statt dessen werden wir uns nur auf einen der beiden konzentrieren. Gibt es in unserer Welt mehrere G¨ uter, dann haben wir nur einen Zeitpunkt. K¨onnen wir dagegen in der Welt zwischen mehreren Zeitpunkten unterscheiden, dann werden wir es der Einfachheit halber nur mit einem Gut zu tun haben. Wenden wir uns jetzt der ersten Darstellung zu. Es gebe in unserem Modell nur einen Zeitpunkt (“heute”), in dem Individuen handeln k¨onnen. In derselben logischen Sekunde, in der ein Vertrag vereinbart wird, wird ebenfalls geliefert. Geliefert werden k¨onnen S verschiedene physische G¨ uter, deren Beschaffenheit uns hier weniger interessiert. Bezahlt wird in einer nicht n¨aher beschriebenen Einheit. Da in diesem Modell die G¨ uter konsumiert werden, macht es wenig Sinn, dass eines der G¨ uter Geld ist: Geld kann man schließlich nicht essen. Wenn es kein Geld gibt, gibt es auch keine Geldanlage und demzufolge k¨onnen wir nicht sagen, wie hoch ein (risikoloser) Zins w¨are. Ein Vertrag (auch Wertpapier oder Portfolio) wird durch die Menge der G¨ uter, die zu liefern sind, beschrieben. Wir verwenden hierf¨ ur die Vektorschreibweise und identifizieren Vertrag und Lieferung. Wir schreiben f¨ ur das Wertpapier X (sie werden grunds¨atzlich mit Großbuchstaben versehen, die einzelnen Eintr¨age erhalten einen Index) X1 ←− Menge an erstem Gut X2 ←− Menge an zweitem Gut X= . .. .. . XS
←−
Menge an S–tem Gut
Diese Schreibweise ist von Vorteil, weil wir die Elemente der Vektorraumrechnung nutzen k¨onnen. Wir k¨onnen Vertr¨age zusammenlegen (die Zahlung entspricht jetzt der Summe der Vektoren X +Y ), wir k¨onnen Vertr¨age vervielfachen (hier ist das Produkt a·X zu verwenden) und miteinander vergleichen. Dabei sagen wir X ≥ Y genau dann, wenn die Zahlung beim Vertrag X von jedem Gut mehr oder wenigstens ebenso hoch ist wie beim Wertpapier Y . Ebenso gilt X = Y , wenn die Wertpapiere X und Y von jedem Gut die gleiche Menge liefern. Wir k¨onnen auch von einem Grenz¨ ubergang sprechen: wir sagen limn Xn = X genau dann,
1
1.2 Pr¨aferenzrelationen
S. 2
wenn in den Vektoren Xn die Eintr¨age einer jeden Zeile gegen den entsprechenden Eintrag in X konvergieren. Der Preis eines Vertrages X wird in der Literatur verschieden bezeichnet: hier werden wir p(X) schreiben.
1.2 Pr¨ aferenzrelationen In diesem Abschnitt soll ein Axiomensystem f¨ ur Pr¨ aferenzen vorgestellt werden, aus dem sich die Existenz einer Nutzenfunktion ableiten l¨ asst. Wir werden jetzt einen weiteren Weg kennen lernen, mit dem Nutzenfunktionen eingef¨ uhrt werden k¨onnen. Wir werden dazu ein Axiomensystem an Pr¨ aferenzen formulieren. Pr¨aferenzen sind “besser als”–Relationen: ich finde das Portfolio X besser als den Titel Y . Welche Eigenschaften an diese Relationen ben¨otigen wir, um daraus schlussfolgern zu k¨onnen, dass der Investor sich so verh¨alt, als maximiere er eine Nutzenfunktion? Wir werden im folgenden eine Pr¨aferenzrelation durch das Symbol X Y beschreiben. Diese Schreibweise ist wie folgt zu interpretieren: “X ist besser oder mindestens ebenso gut wie Y ”. Es gibt Lehrb¨ ucher, in denen diese Relation durch das Symbol beschrieben wird. Wir werden hier also den Fall, dass X und Y gleichpr¨aferiert sind (X ∼ Y ) mit in das Relationssysmbol aufnehmen. Die folgenden Axiome sind nun hinreichend f¨ ur die Existenz einer Nutzenfunktion. Vergleichbarkeit es gilt X Y oder Y X.1 Transitivit¨ at Wenn X Y und Y Z gilt, dann ist auch X Z. Stetigkeit Die Relation ¨andert sich nicht, wenn ein Grenz¨ ubergang im Unendlichen erfolgt. Aus X n X folgt also limn→∞ X n X. Ebenso folgt aus X n X die Relation limn→∞ X n X. Man kann nun zeigen, dass die genannten drei Axiome in der Tat hinreichend f¨ ur die Darstellung einer Pr¨aferenz durch eine Nutzenfunktion sind. Das Beispiel der lexikographischen Pr¨aferenz zeigt auch, dass man auf die eher technisch anmutende Stetigkeitsforderung nicht verzichten kann.2 Satz 1.1 (Debreu, 1954) Eine Pr¨ aferenzrelation erf¨ ullt die oben genannten Axiome genau dann, wenn es eine Nutzenfunktion U (x) derart gibt, dass die folgende Aussage gilt XY
⇐⇒
U (X) ≥ U (Y ).
(1.1)
Der Satz offenbart, dass die Nutzenfunktion U (X) selbst sehr wenig Einschr¨ankungen besitzt. So k¨onnten wir beispielsweise statt U (X) ohne weiteres ebenso eU (X) verwenden, denn es gilt ja U (X) ≥ U (Y )
⇐⇒
1
eU (X) ≥ eU (Y ) .
H¨ atten wir uns entschieden, die Relation X Y (“X ist besser als Y ”) zu verstehen, m¨ usste das Axiom ein wenig anders lauten. Wir h¨ atten zu fordern, dass entweder X Y , Y X oder X ∼ Y gilt. 2 Debreu bewies diesen Satz in der Arbeit Debreu (1954).
c L¨offler/Laitenberger 2003
1.2 Pr¨aferenzrelationen
S. 3
Man nennt daher die Darstellung der Nutzentheorie auch ordinal, weil die absolute Nutzenzahl keine Rolle spielt. Vielmehr kommt es nur auf die Relationen der Nutzenwerte zueinander an. Wir wollen zuletzt zwei Beispiele von Pr¨aferenzrelationen betrachten. Beispiel (lexikographische Ordnung): Wir betrachten die G¨ uterb¨ undel X und Y, die ¨ jeweils zwei G¨ uter (Apfel und Birnen) enthalten. X=
X0 X1
,
Y =
Y0 Y1
.
¨ X0 und Y0 zeigen Anzahl der Apfel und X1 und Y1 Anzahl der Birnen in den entsprechenden ¨ B¨ undeln. Wir wollen sagen, dass Apfel grunds¨atzlich besser als Birnen sind. Die Pr¨aferenzrelation wird von uns dazu wie folgt definiert:
X Y : ⇐⇒ X0 > Y0 oder (X0 = Y0 und X1 ≥ Y1 ). ¨ Zur Erl¨auterung: der Investor achtet zuerst auf die Anzahl der Apfel. Sind sie in X gr¨oßer als in Y , so zieht er das G¨ uterb¨ undel X dem B¨ undel Y vor, unabh¨angig davon, wieviel Birnen in beiden B¨ undeln enthalten sind. Pr¨ ufen wir die drei Axiome von Debreu. 1. Was ist mit dem Axiom der Vergleichbarkeit? Dieses Axiom ist dann erf¨ ullt, wenn beliebige G¨ uterb¨ undel X und Y miteinander verglichen werden k¨onnen. Bei den G¨ uterb¨ undeln sind nur die folgende F¨alle m¨oglich: ¨ • es gilt X0 > Y0 (“mehr Apfel in X”). Dann folgt sofort X Y . ¨ • Oder aber es gilt X0 < Y0 (“mehr Apfel in Y ”). Dann folgt aus der Definition der Relation sofort Y X. ¨ • Oder aber es gilt X0 = Y0 (“gleich viel Apfel in X und Y ”). F¨ ur die Birnen muss dann entweder X1 ≥ Y1 gelten (und damit X Y ) oder es ist X1 < Y1 und damit Y X. Andere F¨alle sind nicht m¨oglich. Da jeden Fall X Y oder Y X gilt, ist die Vergleichbarkeit gew¨ahrleistet.3 2. Was ist mit dem Axiom der Transitivit¨at? Angenommen, es gilt X Y und Y Z. Dann haben wir die Relation X Z zu beweisen. Dazu unterscheiden wir alle vier F¨alle, die aufgrund unserer Voraussetzung m¨oglich sind. Fall 1. Angenommen, es gilt X0 > Y0 und Y0 > Z0 . Dann gilt X0 > Z0 . Daraus folgt X Z. Fall 2. Angenommen, es gilt X0 = Y0 und X1 ≥ Y1 und Y0 = Z0 und Y1 ≥ Z1 . Dann gilt X0 = Y0 = Z0 und X1 ≥ Y1 ≥ Z1 , also wieder X Z. Fall 3. Angenommen, es gilt X0 > Y0 und Y0 = Z0 . Dann gilt X0 > Z0 und damit X Z. 3
Dem aufmerksamen Leser d¨ urfte nicht entgangen sein, dass bei gleichen G¨ uterb¨ undeln X = Y sowohl X Y als auch Y X gilt. Dies ist kein Widerspruch zur Vergleichbarkeit! Es hieß im Axiom ja nicht “entweder . . . oder”!
c L¨offler/Laitenberger 2003
1.2 Pr¨aferenzrelationen
S. 4
Fall 4. Angenommen, es gilt X0 = Y0 , X1 ≥ Y1 und Y0 > Z0 . Dann gilt X0 > Z0 und damit X Z. 3. Was ist mit dem Stetigkeitsaxiom? Da die beiden anderen Axiome erf¨ ullt sind, muss hier das Problem liegen und wir erwarten, dass dieses Axiom nicht gelten wird. Dazu gen¨ ugt es, ein Gegenbeispiel zu konstruieren. Wir betrachten folgendes Zahlenbeispiel. 0 0,5 0,999 1 . 1 1 1 0 Damit ist die Voraussetzung, die im Stetigkeitsaxiom formuliert wurde, erf¨ ullt. Dennoch gilt 1 1 lim X n = X= . n→∞ 1 0 Die Stetigkeit ist nicht erf¨ ullt. Daraus folgt, dass keine Nutzenfunktion existiert. Wir haben, um das Beispiel etwas anschaulicher werden zu lassen, die Bessermenge in Abbildung 1.1 eingezeichnet. Schraffiert sind diejenigen Punkte, die besser oder gleich gut dem G¨ uterb¨ undel X sind. X1 6
. ..... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . ... . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . .... . . . . . . . . . . . . . . . . . . . .
Bessermenge
X s
- X0
Abbildung 1.1: Bessermenge f¨ ur eine Pr¨aferenz ohne Nutzenfunktion Beispiel: Wir wollen ein zweites Beispiel betrachten. Wiederum haben wir zwei G¨ uterb¨ undel ¨ X und Y , die jeweils die G¨ uter Apfel und Birnen besitzen. Im Unterschied zu vorherigem Beispiel wollen wir jetzt davon ausgehen, dass beide G¨ uter vom Individuum substituiert ¨ werden k¨onnen: Apfel und Birnen sind gleich gut. Die Pr¨aferenz wird wie folgt definiert:
X Y : ⇐⇒ X0 + X1 ≥ Y0 + Y1 .
(1.2)
Der Investor z¨ahlt hier nur die Gesamtzahl der Fr¨ uchte; das B¨ undel mit den meisten Fr¨ uchten bevorzugt er. Wieder untersuchen wir die drei Axiome von Debreu. 1. Was ist mit dem Axiom der Vergleichbarkeit? Die Zahlen X0 + X1 und Y0 + Y1 sind immer miteinander vergleichbar. Also gilt X Y oder Y X.
c L¨offler/Laitenberger 2003
1.2 Pr¨aferenzrelationen
S. 5
2. Auch die Transitivit¨at gilt. Wenn X Y und Y Z gilt, dann m¨ ussen die Relationen X0 + X1 ≥ Y0 + Y1 und Y0 + Y1 ≥ Z0 + Z1 gelten. Also ist X0 + X1 ≥ Z0 + Z1 . Das bedeutet aber X Z. Das Axiom der Transitivit¨at ist erf¨ ullt. 3. Auch die Stetigkeit gilt (ohne Beweis). Nach dem Satz von Debreu muss es mithin eine Nutzenfunktion geben. Wie sieht diese Nutzenfunktion aus? Dazu zeichnen wir die Indifferenzkurven der Relation. Auf der Indifferenzkurve liegen genau diejenigen G¨ uterb¨ undel Y , f¨ ur die X ∼ Y gilt. Dazu muss folgendes erf¨ ullt sein: X∼Y
⇐⇒
(X Y und Y X)
⇐⇒
(X0 + X1 ≥ Y0 + Y1 und Y0 + Y1 ≥ X0 + X1 )
⇐⇒
X0 + X1 = Y0 + Y1
⇐⇒
Y1 = X0 + X1 − Y0 .
Dies ist die Gleichung einer Gerade mit dem Anstieg −1. Unsere Nutzenfunktion lautet daher U (X) = X0 + X1 . Diese Darstellung der Nutzenfunktion h¨atten wir bereits in der Definition der Relation (1.2) unmittelbar erkennen k¨onnen. Die Abbildung 1.2 veranschaulicht die Bessermenge. X1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... . ............................................................... . . . ..................................................................... . ................................................................... ... . ............................................................... . . . ..................................................................... . ................................................................... ... . ............................................................... . . . ..................................................................... ..................................................................... . . . ............................................................... . . . .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . . . ....... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . . ..... . . . . . . . . . . . . . . ...... . . . . . . . . . . . . . ..... . . . . . . . . . . . . . ..... . . . . . . . . . . . . ...... . . . . . . . . . . . . ..... . . . . . . . . . . .
6
Bessermenge
sX
-
X0
Abbildung 1.2: Bessermenge des zweiten Beispiels Wir werden im folgenden weitere Annahmen an die Nutzenfunktion unterstellen. So fordern wir etwa die Monotonie, das heißt mehr G¨ uter sind auch besser. Ebenso werden wir die Quasikonkavit¨at und die Differenzierbarkeit voraussetzen.4 Die Quasikonkavit¨at soll sicherstellen, dass Optimall¨osungen immer eindeutig sind; die Differenzierbarkeit soll sicherstellen, dass wir uns des Differentialkalk¨ uls bedienen k¨onnen.
4
Siehe dazu Mas-Colell (1985), S.69ff.
c L¨offler/Laitenberger 2003
1.3 Pr¨aferenzen im Mehrperiodenkontext
S. 6
1.3 Pr¨ aferenzen im Mehrperiodenkontext Das am Anfang vorgestellte Grundmodell kann auch g¨anzlich anders aufgefasst werden. Wir k¨onnten davon ausgehen, dass es nur ein einziges Gut gibt, welches jedoch nicht nur in einem Zeitpunkt. sondern in mehreren Zeitpunkten geliefert werden kann. Wir w¨ urden dann X2 nicht als die Menge an zweitem Gut, sondern als die Menge des Gutes im zweiten Zeitpunkt interpretieren k¨onnen, ohne dass wir unser formales Modell entsprechend anpassen m¨ ussten. Der Vorteil liegt auf der Hand: da wir dasselbe formale Modell verwenden, m¨ ussen wir nur einmal beweisen und erhalten so zwei ¨okonomischen Aussagen. Diese zweite Interpretation wollen wir etwas genauer beschreiben. Der gesamte Handel finde nicht in einem Zeitpunkt statt, vielmehr gibt es eine Gegenwart (“heute”) und S zuk¨ unftige Zeitpunkte. Vertr¨age werden heute abgeschlossen, geliefert wird in der Zukunft. Das lieferbare Gut sei Geld. Ein Vertrag oder ein Wertpapier verspricht nicht verschiedene physische G¨ uter, sondern Geld in den verschiedenen Zeitpunkten. Wir k¨onnen dieselbe Schreibweise benutzen, m¨ ussen aber die Eintr¨age anders auffassen X1 ←− Menge an Geld in t = 1 X2 ←− Menge an Geld in t = 2 X= . .. .. . XS
←−
Menge an Geld in t = S
Jetzt macht es sehr wohl Sinn, von einem risikolosen Zins zu sprechen. Es gibt sogar verschiedene Zinss¨atze (Kassa– und Terminzinss¨atze), auf die wir in der Arbitragetheorie eingehen. Wir verwenden an dieser Stelle statt der Schreibweise p(X) f¨ ur den Preis eines Wertpapieres auch die k¨ urzere Form X0 (der Vektor wird gewissermaßen um eine Zeile “aufgebl¨aht”). Diese Schreibweise ist sinnvoll, wenn wir die Bezahlung bei Vertragsabschluss (im Zeitpunkt t = 0!) auch als eine “Lieferung” interpretieren. F¨ ur den Fall S = 1 (nur ein zuk¨ unftiger Zeitpunkt) werden wir den risikolosen Zins mit der Variable rf bezeichnen. In diesem Abschnitt wollen wir kurz untersuchen, welche zus¨atzliche Annahmen man an die Pr¨aferenzen machen kann, wenn es nur ein Konsumgut Xt in jeder Periode t gibt, daf¨ ur aber mehrere Perioden t = 1, . . . , S. Dass es nur ein Konsumgut gibt, ist nat¨ urlich eine stark vereinfachende Annahme. Man kann sich aber vorstellen, dass dieses eine Konsumgut einfach Geld ist, mit dem man in jeder Periode seinen Konsum vieler verschiedenartiger Produkte bestreitet. Das funktioniert aber nat¨ urlich nur, wenn man die Annahme trifft, dass die Preise der Produkte in allen Perioden gleich bleiben, da ansonsten offensichtlich die gleiche Menge Geld ganz verschiedene Produktallokationen erm¨oglicht, die wohl kaum den gleichen Nutzenwert haben d¨ urften. An Stelle eines Konsumportfolios sprechen wir in diesem Kontext auch von einem Konsumstrom. Wie wir am Anfang schon gesagt hatten, k¨onnen wir den Konsumstrom einfach als ein Konsumportfolio unseres ersten einperiodischen Modells auffassen und ansonsten alles gleich lassen. Man erh¨alt dann mit Satz (1.1) die Existenz einer Nutzenfunktion U (X1 , . . . , XS ). Wir wollen u ¨berlegen, ob man im intertemporalen Kontext vielleicht zus¨atzliche vertretbare Annahmen an die Pr¨aferenzen machen kann. Man betrachte als erstes das Axiom der Separabilit¨at. Dabei werde die Menge der Zeitpunkte t = 1, . . . , S in zwei disjunkte Teilmengen aufgeteilt: T1 und T2 mit T1 ∪ T2 = {1, . . . , S}. Separabilit¨ at Die Pr¨aferenzrelation f¨ ur die Verteilung des Konsums u ¨ber die Perioden in T1
c L¨offler/Laitenberger 2003
1.3 Pr¨aferenzen im Mehrperiodenkontext
S. 7
ist unabh¨angig vom Konsum in den Perioden in T2 . Formal: es seien X und Y zwei ˆ Konsumstr¨ome mit Xt = Yt zu allen Zeitpunkten t ∈ T2 , sowie zwei Konsumstr¨ome X ˆ t = Yˆt zu allen Zeitpunkten t ∈ T2 . Außerdem sei X ˆ s = Xs und und Yˆ , die ebenfalls X ˆ ˆ Yˆ . Ys = Ys zu allen Zeitpunkten s ∈ T1 . Dann folgt aus X Y die Pr¨aferenz X Das Axiom der Separabilit¨at werde am folgenden Beispiel dargestellt: t X Y ˆ X Yˆ
1 X1 X1 ˆ1 X ˆ1 X
2 X2 X2 ˆ2 X ˆ2 X
3 X3 Y3 X3 Y3
4 X4 Y4 X4 Y4
Die Konsumstr¨ome X und Y sind in den Perioden 1 und 2 identisch. Wenn nun X gegen¨ uber ˆ ˆ ˆ Y pr¨aferiert wird, so impliziert das, dass auch X gegen¨ uber Y pr¨aferiert wird, da auch X und Yˆ in den Perioden 1 und 2 identisch sind und in den anderen Perioden den Konsum von X ˆ und Yˆ in t = 1 und t = 2 identisch sind, muss die Entscheidung bzw. von Y bieten. Da X zwischen den beiden offensichtlich anhand des Konsums in t = 3 und in t = 4 festgemacht werden. Hier ist aber aus der Vorliebe von X u ¨ber Y bereits die Pr¨aferenz festgelegt. Ob Sie es vorziehen, heute weniger zu konsumieren und daf¨ ur sp¨ater mehr, h¨angt nicht davon ab, was sie in den letzten Jahren konsumiert haben. Eine Konsequenz dieses Axioms ist, dass die Nutzenfunktion U zeitlich additiv sein muss, was bedeutet, dass es Funktionen ut gibt, so dass U (X1 , . . . , XS ) =
S X
ut (Xt ).
t=1
Die zeitliche Separabilit¨at scheint eine recht plausible Annahme zu sein, jedenfalls erleichtert es die Analyse ungemein. Allerdings schr¨ankt es die Nutzenfunktion ein. Bestimmte Ph¨anomene, wie zum Beispiel Gewohnheitseffekte, k¨onnen damit nicht erfasst werden. Diese Gewohnheitseffekte (englisch ’habit formation’) werden seit einigen Jahren intensiv bei der Analyse des Sparverhaltens intensiv diskutiert.5 Eine weitere hilfreiche und vertretbare Annahme an die Pr¨aferenzen bildet das Axiom der Stationarit¨at. Man erl¨autert es am einfachsten im Kontext von Entscheidungen u ¨ber Konsumstr¨ome u ber unendlich viele Perioden, also t = 1, 2, . . .. Es betrifft die Art und Weise, ¨ wie sich die Pr¨aferenzen ¨andern, wenn der Entscheidungstr¨ager ¨alter wird. Es wird dabei gefordert, dass Stationarit¨ at Die Rangordnung der Konsumstr¨ome in zuk¨ unftigen Perioden ist in allen Perioden gleich. Formal: wenn zu einem Zeitpunkt t der Konsumstrom X = (Xt+1 , Xt+2 , . . .) dem Konsumstrom Y = (Yt+1 , Yt+2 , . . .) vorgezogen wird, dann wird zum Zeitpunkt t+1 ˆ = (X ˆ t+2 , X ˆ t+3 , . . .) mit X ˆ t+2 = Xt+1 , X ˆ t+3 = Xt+2 , usw.., dem der Konsumstrom X ˆ ˆ ˆ ˆ ˆ Konsumstrom Y = (Yt+2 , Yt+3 , . . .) mit Yt+2 = Yt+1 , Yt+3 = Yt+2 , usw.., vorgezogen. 5
Wer mehr u ochte, konsultiere ¨ber Gewohnheitseffekte und deren Anwendung auf das Sparverhalten wissen m¨ Constantinides (1990).
c L¨offler/Laitenberger 2003
1.4 Konsumgl¨attung und die Bestimmung der Zinsh¨ohe
S. 8
Mit den Axiomen der Separabilit¨at und der Stationarit¨at folgt, dass es ein β ∈ R und eine Funktion u(·) gibt, so dass die Funktionen ut (Xt ) = β t u(Xt ). Die Nutzenfunktion u ¨ber intertemporalen Konsum schreibt sich dann U (X1 , . . . , XS ) =
S X
β t u(Xt ).
t=1
Das Axiom der Stationarit¨at wird manchmal auch Axiom der zeitlichen Konsistenz der Entscheidungen genannt, da es ¨aquivalent zu der Annahme ist, dass ein rationaler Entscheider seine Entscheidungen so trifft, dass er sie in sp¨ateren Perioden nicht revidiert. Es bedeutet, dass man eine Maßnahme, die man sich heute vornimmt, morgen durchzuf¨ uhren, auch tats¨achlich durchgef¨ uhrt wird. Angesichts der Erfahrungen Milliarden von Rauchern beim Versuch damit aufzuh¨oren, mag man an der Berechtigung dieses Axioms zweifeln, aber bei Investitionsentscheidungen d¨ urfte es ganz gut hinkommen. Zur Illustration, was passiert, wenn die Pr¨aferenzen nicht die Eigenschaft der Stationarit¨ at besitzen, betrachte man das folgende Problem. Sie k¨onnen heute dar¨ uber entscheiden, morgen Geld eine Periode lang anzulegen zu einem festen Zinssatz rf . Heute in t = 1 werden Sie zur L¨osung dieses Problems das folgende Maximierungsproblem l¨osen: max u1 (E1 ) + u2 (E2 − Y ) + u3 (E3 + (1 + rf )Y ) + . . . , Y
wobei Y den Sparbetrag und Et Ihr Einkommen in Periode t darstellt. Eine Periode sp¨ater, in t = 2, wenn der Zeitpunkt gekommen ist, zur Bank zu gehen, l¨osen sie das Problem max u1 (E2 − Y ) + u2 (E3 + (1 + rf )Y ) + . . . . Y
Man erh¨alt in beiden Entscheidungsproblemen nur dann die gleiche Sparrate Y , wenn u2 = βu1 und u3 = βu2 . In der Regel geht man davon aus, dass β < 1 ist, was zum Ausdruck bringt, dass die Gegenwart h¨oher gewertet wird als die Zukunft und die nahe Zukunft h¨oher als die ferne Zukunft.
1.4 Konsumgl¨ attung und die Bestimmung der Zinsh¨ ohe Wir wollen untersuchen, welchen Einfluss die Zeitpr¨ aferenzen auf die Zinsh¨ ohe in einem Marktgleichgewicht haben. Es gibt zwei Gr¨ unde daf¨ ur zu sparen: man spart, um seinen Konsum u ¨ber die verschiedenen Perioden zu verteilen, und man spart, um sein Verm¨ogen durch Ausnutzen hoher Zinsraten zu erh¨ohen. Wir wollen diese beiden Effekte in einem einfachen Modell untersuchen. Wir betrachten ein Modell mit zwei Zeitpunkten, t = 1 und t = 2. Ein Investor habe die intertemporale Nutzenfunktion u(X1 ) + βu(X2 ). Der Investor verf¨ uge u ¨ber Einkommen E1 in t = 1 und E2 in t = 2. Dar¨ uber hinaus kann er zum sicheren Zinssatz rf sparen oder auch zum gleichen Zinssatz Kredite aufnehmen. Der Anlagebetrag werde mit Y bezeichnet. Das Entscheidungsproblem lautet:6 max u(E1 − Y ) + βu(E2 + (1 + rf )Y ). Y
6
Wenn der Konsument einen Kredit aufnimmt, dann ist Y negativ. Der Konsument hat dann in t = 2 den Kredit zur¨ uckzuzahlen.
c L¨offler/Laitenberger 2003
1.4 Konsumgl¨attung und die Bestimmung der Zinsh¨ohe
S. 9
Die Bedingungen erster Ordnung dieses Problems lauten −u0 (E1 − Y ) + β(1 + rf )u0 (E2 + (1 + rf )Y ) = 0. Die Bedingungen zweiter Ordnung lauten u00 (E1 − Y ) + β(1 + rf )2 u00 (E2 + (1 + rf )Y ) < 0. Die Bedingungen zweiter Ordnung sind nur dann erf¨ ullt, wenn u00 < 0 ist, u also eine konkave Funktion ist. Wenn u konvex w¨are, dann h¨atten wir es mit einem Minimum zu tun und es g¨abe u urde versuchen so viel Konsum in einer ¨berhaupt kein Maximum. Der Konsument w¨ Periode zu konzentrieren wie m¨oglich. Wenn man negativen Konsum ausschließt, w¨ urde das dazu f¨ uhren, dass der Konsument sich gerade so weit verschuldet, dass er in t = 2 mit seinem Einkommen den Kredit zur¨ uckzahlen kann und nichts mehr zum konsumieren u ¨brig bleibt. Das ist unwahrscheinlich und deshalb ist die Annahme einer konkaven Nutzenfunktion ganz vern¨ unftig. Hier wird der Konsument versuchen weitgehend gleich hohen Konsum in beiden Perioden zu erreichen, er wird seinen Konsum gl¨atten. Die Bedingung erster Ordnung kann umgeformt werden: u0 (X1 ) = β(1 + rf ). u0 (X2 )
(1.3)
Da u0 eine fallende Funktion ist, ist der Bruch auf der linken Seite genau dann gr¨oßer (kleiner) eins, wenn der Konsum zunimmt (abnimmt). Wir haben damit ein erstes Ergebnis: Satz 1.2 Der Konsum ist genau dann zunehmend (abnehmend), wenn das Produkt aus β(1+ rf ) gr¨ oßer (kleiner) eins ist. Wenn β(1 + rf ) = 1 ist, dann ist der Konsum u ¨ber die Perioden konstant. Als n¨achstes wollen wir einen ersten Versuch machen, zu verstehen, wie die H¨ohe des Zinssatzes rf in einer Marktwirtschaft zustande kommt. Da der Zins sich im Rahmen eines Marktgleichgewichts, bei dem alle Marktteilnehmer zu bestimmten Preisen ihre Konsum– und Investitionentscheidungen treffen, so dass Angebot und Nachfrage sowohl auf den G¨ uterm¨arkten als auch auf den Finanzm¨arkten im Gleichgewicht sind, ist dies im Allgemeinen nicht so einfach. Zudem ist dies eigentlich erst Thema der Vorlesung ’Kapitalmarkttheorie’ im n¨achsten Semester. Trotzdem wollen wir in einem sehr einfachen Modell diese Frage jetzt schon einmal beleuchten. Das Modell ist eine Vereinfachnung des (auch bereits sehr einfachen) Modells von Lucas (1978), der u.a. daf¨ ur den Nobelpreis bekommen hat. Es gebe eine endliche Menge an identischen Konsumenten, die in den Perioden t = 1 und t = 2 leben. Sie haben alle die gleiche intertemporale Nutzenfunktion u(X1 ) + βu(X2 ). Jeder Konsument besitzt einen Baum, der in t = 1 E1 Fr¨ uchte und in t = 2 E2 Fr¨ uchte produziert. Die Wachstumsrate der Fr¨ uchteproduktion ist E2 /E1 = 1 + g. Die Konsumenten k¨onnen sich gegenseitig Fr¨ uchte verkaufen. Da alle Konsumenten ja gleich viele Fr¨ uchte besitzen und auch ansonsten identisch sind, w¨ usste man aber nicht weshalb sie das tun sollten. Außerdem soll es in t = 1 einen Kapitalmarkt geben, auf dem die Konsumenten Fr¨ uchte gegen das Versprechen der Lieferung von Fr¨ uchten in t = 2 eintauschen k¨onnen. Jemand der in t = 1 auf diesem Kapitalmarkt Fr¨ uchte anbietet, legt also sozusagen Fr¨ uchte an und bekommt daf¨ ur in t = 2
c L¨offler/Laitenberger 2003
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell
S. 10
Zinsen in Form von Fr¨ uchten. Der Kapitalmarkt wird von einem sogenannten Market Maker geleitet. Dessen Job ist es, den geeigneten Zinssatz zu bestimmen, so dass das Angebot an Fr¨ uchten gerade der Nachfrage entspricht. Da aber wieder alle Konsumenten identisch sind, wird im Gleichgewicht niemand Fr¨ uchte verleihen oder ausleihen. F¨ ur jeden Konsumenten lautet also die Bedingung erster Ordnung (1.3): 1 u0 (E1 ) = 1 + rf . β u0 (E1 (1 + g)) Man erkennt: wenn die Fr¨ uchteproduktion stagniert (g = 0), dann ist der Zinssatz gerade der Kehrwert der Zeitpr¨aferenz β. Dieser Kehrwert wird auch als Maß der Ungeduld der Konsumenten bezeichnet. Spezifizieren wir die Nutzenfunktion zum Beispiel mit u(X) = ln(X), dann lautet die Bedingung erster Ordnung: 1 (1 + g) = 1 + rf . β Wir fassen zusammen:7 Satz 1.3
Der Zins steigt mit der H¨ ohe des Wachstums und der H¨ ohe der Ungeduld.
Ohne Wachstum ist der Zinssatz gerade gleich dem Kehrwert der Zeitpr¨ aferenz.
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell In diesem Abschnitt soll das Fisher–Modell vorgestellt werden. Wir zeigen damit, dass f¨ ur bestimmte Entscheidungen, die Kenntnis der Zeitpr¨ aferenzen gar nicht ben¨ otigt werden. Wir wollen nun zeigen, wie wir mit Hilfe von Nutzenfunktionen im Fisher–Modell Entscheidungen treffen. Es gebe in der Zukunft nur einen Zeitpunkt, der Investor tauscht Geld. Er ¯ 0 bezeichnen. Wir setzen voraus, besitzt heute eine Erstausstattung an Geld, die wir mit X dass der Investor Portfolios bildet, um seinen Geldbesitz heute X0 und morgen X1 zu optimieren. Es geht um eine optimale Umverteilung heutigen Geldbesitzes in die Zukunft. Das Fisher–Modell8 betrachtet nun drei stilisierte Situationen. Robinso-Crusoe–Welt. Wenn der Investor weder produzieren noch handeln kann, bleibt ihm ¯ 0 sowie den zuk¨ gar nichts anderes u unftigen Besitz ¨brig als die Erstausstattung X0 = X X1 = 0 als optimal anzusehen. Kapitalmarkt Es gibt jetzt einen perfekten Kapitalmarkt.9 Der Investor kann Geld am Kapitalmarkt anlegen oder borgen. Die Geldanlage am Kapitalmarkt verzinst sich zu einem 7
Das Ergebnis gilt auch f¨ ur andere Nutzenfunktionen. Die Herleitung ist dann allerdings etwas m¨ uhsamer. Unser Fisher–Modell ist denkbar einfach. So kann man ohne Schwierigkeiten voraussetzen, dass der Investor auch eine Erstausstattung an Geld morgen besitzt, neben Geld ein Gut gehandelt wird und dieses Gut einer Inflation ausgesetzt wird. Die zentralen Ergebnisse ¨ andern sich aber dadurch nicht. 9 Der Kapitalmarkt ist perfekt genau dann, wenn Sollzinsen und Habenzinsen identisch sind, es kein Finanzierungslimit gibt und der Markt keine Reibungsm¨ oglichkeiten (Steuern, Transaktionskosten) besitzt. 8
c L¨offler/Laitenberger 2003
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell
S. 11
Zins rf . Wir wollen die Geldanlage, mit der der Investor sein optimales Portfolio herstellt, mit dem Symbol M bezeichnen (die Schreibweise ist historisch gewachsen und orientiert sich an der Bedeutung “money”). Heute zahlt der Investor also den Preis M0 , um morgen den Geldbetrag M1 zu erhalten. M kann auch negativ sein, in diesem Fall nimmt er einen Kredit auf. Wollen wir das optimale Nutzenniveau ermitteln, so haben wir das folgende Maximierungsproblem zu l¨osen max U (X0 , X1 ),
s.t. X0 = X¯0 − M0 ,
X 1 = M1 .
(1.4)
Wir wissen, dass die Rendite am Kapitalmarkt rf betr¨agt, also gilt rf =
M1 − 1. M0
(1.5)
Setzen wir dies in die Maximierungsbedingung ein, dann erhalten wir durch Eliminieren von M0 max U (X0 , X1 ),
0 = X1 − (1 + rf )(X¯0 − X0 ).
s.t.
Was haben wir bisher ¨okonomisch gezeigt? Wir haben gezeigt, dass mit der Wahl des heutigen Besitzniveaus s¨amtliche anderen Variablen des Problems (Geldanlage M0 , zuk¨ unftiger Besitz X1 ) festgelegt sind. Dies scheint plausibel zu sein. Die Nebenbedingung wird auch Transaktionsgerade genannt, weil sie die Menge m¨oglicher Transaktionen am Kapitalmarkt beschreibt. Unsere Maximierungsaufgabe l¨asst sich nun mit dem Kalk¨ ul von Lagrange l¨osen. Dazu notieren wir die Lagrange–Funktion L = U (X0 , X1 ) − λ(X1 − (1 + rf )(X¯0 − X0 )). Die Nebenbedingungen erster Ordnung lauten nun10 ∂L = X1 − (1 + rf )(X¯0 − X0 ) ∂λ ∂L ∂U (X0 , X1 ) 0= = − λ(1 + rf ) ∂X0 ∂X0 ∂L ∂U (X0 , X1 ) = −λ 0= ∂X1 ∂X1 0=
Die erste Gleichung ist notwendig, um das optimale Portfolio zu bestimmen, sie wird uns aber in diesem Abschnitt nicht interessieren. Wir setzen die dritte Gleichung in die zweite ein und erhalten −(1 + rf ) =
10
∂U (X0 ,X1 ) ∂X0 − ∂U (X 0 ,X1 ) ∂X1
.
(1.6)
Wir ignorieren in diesem Abschnitt die Bedingungen zweiter Ordnung: es k¨ onnte also durchaus sein, dass wir hier kein Nutzenmaximum, sondern ein Nutzenminimum gefunden haben?! Wir werden im Verlauf der Diskussion sehen, wie man diesen Fall ausschließen kann. Im Moment ist er uns nicht wichtig.
c L¨offler/Laitenberger 2003
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell
S. 12
Der Term auf der rechten Seite wird als Grenzrate der Substitution bezeichnet.11 Die Bedingung (1.6) besagt, dass im Optimum Grenzrate der Substitution und risikoloser Zins plus eins u ussen. Diese Bedingung k¨onnen wir uns gut graphisch ¨bereinstimmen m¨ veranschaulichen. Dazu tragen wir in einem Diagramm die Zahlungen X0 sowie X1 ein und ber¨ ucksichtigen weiter die Nebenbedingung aus der Maximierung (1.4). Das Ergebnis ist in Abbildung 1.3 zu sehen. Der Optimalpunkt ist derjenige, bei dem die Tangentiallinie der Indifferenzkurve (gerade der rechte Ausdruck in (1.6)) parallel an die Transaktionsgerade mit der Steigung −(1 + rf ) ist.
(1 + rf )X 0
X1
6
..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ... ..... . ..... ..... ..... ..... .. ..... .. ..... ... ....... ....... ....... ................ ..... ............ ..... ..... ..... ..... ..... ..... ..... .
s
U (X0 , X1 ) -
X0 X0 Abbildung 1.3: Fisher–Modell mit Kapitalmarkt Bisher haben wir die Frage, ob genau eine optimale L¨osung existiert, vernachl¨assigt. Dies wollen wir jetzt nachholen. W¨ urde es uns nicht gelingen, Bedingungen f¨ ur eine eindeutige optimale L¨osung zu formulieren, dann macht unsere gesamte Theorie wenig Sinn: wir behaupten ja, Verhalten von Entscheidungstr¨agern beschreiben zu k¨onnen. G¨abe es beispielsweise mehrere optimale L¨osungen, dann m¨ ussten wir erkl¨aren, welche der m¨oglichen Portfolios der Entscheidungstr¨ager nun letztendlich w¨ahlt. Wir fragen daher, unter welchen Annahmen an die Nutzenfunktion das optimale Portfolio eindeutig bestimmt ist. Es zeigt sich, dass dazu die strikte Quasikonkavit¨at der Nutzenfunktion 11
Dazu eine kurze Erl¨ auterung. Unter der Grenzrate der Substitution versteht man diejenigen Mengen an zuk¨ unftigem Gut, auf die man verzichten muss, wenn wir eine (marginale) Einheit heutiges Gut zus¨ atzlich erhalten und dennoch das Nutzenniveau nicht ver¨ andern wollen. Daraus ergibt sich folgende Rechnung 0 = dU (X0 , X1 ) ∂U ∂U = dX0 + dX1 ∂X0 ∂X1 ∂U/∂X0 dX1 =− , dX0 ∂U/∂X1
Nutzenniveau konstant totales Differential umstellen.
Der Ausdruck auf der linken Seite gibt die Mengen an X1 an, die als Kompensation f¨ ur dX0 mehr Geld in t = 0 herhalten m¨ ussen. Dieser Ausdruck ist immer negativ, da man f¨ ur mehr X0 ja weniger X1 in Kauf nehmen wird.
c L¨offler/Laitenberger 2003
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell
S. 13
ausreichend ist. Eine Nutzenfunktion heißt strikt quasikonkav, wenn sie die folgende Eigenschaft besitzt: • Wir w¨ahlen zwei beliebige Punkte auf einer Indifferenzkurve und verbinde sie miteinander. • Die Nutzenfunktion ist strikt quasikonkav, wenn jeder Punkt auf der Verbindungslinie besser als die beiden Ausgangspunkte ist. Zur Veranschaulichung betrachten wir eine Situation wie in Abbildung 1.4. In diesem Fall w¨aren die beiden Portfolios (a0 , a1 ) sowie (b0 , b1 ) optimal, da die Indifferenzkurve tangential an der Budgetlinie verl¨auft. Offensichtlich ist die Nutzenfunktion nicht strikt quasikonkav, denn die Portfolios der Verbindungslinie von (a0 , a1 ) und (b0 , b1 ) sind alle schlechter als (a0 , a1 ) bzw. (b0 , b1 ).
6
X1
a1
b1
..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ... ..... ..... .. ..... ..... ..... ..... .. ..... ... ..... .... ..... ... ..... ... ....... ...... ....... ................... ..... ............ ..... ........ ..... ....... ..... .... ..... ... ..... ... ..... ..... ..... ..... ..... .. ..... .. ..... ... ....... ....... ...... ............... ..... .............. ..... . ..... ..... ..... ..... ..... .....
s
s
a0
U (X0 , X1 ) -
b0 X0
Abbildung 1.4: Zwei optimale Portfolios Kapitalmarkt und Realinvestition Nun unterstellen wir die Existenz einer Realinvestition mit der Anfangsausgabe I0 sowie der Auszahlung CF1 einen Zeitpunkt sp¨ater. Diese Realinvestition erscheint in diesem Modell als eine Art “Geldmaschine”, bei der keine R¨ ucksicht darauf genommen wird, ob hier ein Gut produziert wird. Wir werden uns bei der Antwort auf die Frage, ob diese Realinvestition durchgef¨ uhrt werden sollte, nur an dem Nutzenniveau des Investors orientieren. Dazu f¨ ugen wir dem Maximierungsproblem die Realinvestition hinzu und pr¨ ufen, inwieweit sich das Nutzenniveau des Investors erh¨oht. Wir haben max U (X0 , X1 ),
s.t. X0 = X¯0 − M0 − I0 ,
X1 = (1 + rf )M0 + CF1 .
(1.7)
Analog dem obigen Vorgehen k¨onnen wir wieder M0 ausklammern; wir erhalten max U (X0 , X1 ),
¯ 0 − X0 ) + (1 + rf )(−I0 + CF1 ). s.t. X1 = (1 + rf )(X 1 + rf | {z } =NPV
c L¨offler/Laitenberger 2003
1.5 Separation von Konsum– und Investitionentscheidungen: das Fisher–Modell
S. 14
Statt mit der u ugt ein scharfer Blick ¨blichen mathematische Prozedur zu beginnen, gen¨ auf unser Problem. Wir erkennen folgendes. F¨ ur einen gegebenen Geldbesitz heute (also X0 ) ist, wenn der in der Klammer NPV genannte Ausdruck positiv ist, der Geldbesitz morgen h¨oher. Mithin wird der Investor, egal wie seine konkrete Nutzenfunktion nun gestaltet ist, die Investition immer dann vorziehen, wenn der Kapitalwert (NPV) gr¨oßer null ist. Graphisch l¨asst sich dieses Verhalten dadurch plausibilisieren, dass ein positiver NPV die Transaktionsgerade nach oben verschiebt – und dort befinden sich ja gerade die h¨oheren Nutzenniveaus. Das zuletzt erhaltene Resultat nennt man auch die Separierbarkeit von Investitions– und Konsumentscheidung. Ob sich eine Investitionsentscheidung lohnt oder wir sie besser unterlassen, h¨angt nicht mehr von der konkreten Form der Nutzenfunktion ab. Vielmehr ist f¨ ur alle Investoren, die eine monotone Nutzenfunktion aufweisen, die Durchf¨ uhrung der Investition vorteilhaft, falls der Kapitalwert positiv ist. Betrachten wir ein weiteres Mal die Intepretation mit mehreren Zeitpunkten. Es sei angemerkt, dass im Fisher–Modell die Bedingung eines positiven Zinses nicht aus den Modellannahmen folgt. Vielmehr k¨onnte der Zins durchaus negativ sein. Erst, wenn man voraussetzt, dass das Geld auch ohne weitere Kosten gelagert werden k¨onnte (dies bedeutet beispielsweise auch keine Inflation und kein W¨ahrungstausch), ist nur ein Zins von null oder h¨oher denkbar. Dies kann man sich wie folgt klarmachen. Angenommen, es w¨are m¨oglich, Geld kostenfrei zu lagern und dennoch sei der Zins negativ. Dann w¨ urde jeder Investor sich Geld borgen, dieses Geld lagern und w¨ urde so in der Zukunft einen Extragewinn erzielen k¨onnen.
c L¨offler/Laitenberger 2003
2 Unsicherheit 2.1 Erwartungsnutzentheorie 2.1.1 Das Grundmodell: mehrere Zust¨ ande ¨ Wir stellen das Grundmodell unter Unsicherheit vor. Es wird sehr starke Ahnlichkeit mit dem Grundmodell aus em Abschnitt unter Sicherheit aufweisen. Wir wollen nun ein Modell n¨aher betrachten, das eine unsichere Zukunft zum Gegenstand haben wird. Wie wird die Unsicherheit formal dargestellt? Wir unterscheiden zwei Zeitpunkte, die eine festgelegte Einheit (etwa ein Jahr) auseinanderliegen. W¨ahrend der heutige Zeitpunkt sicher ist, soll die Zukunft unsicher sein. Wir setzen voraus, dass es insgesamt S einander wechselseitig ausschließende Zust¨ande in dieser Zukunft geben kann, die wir mit dem Index s = 1, . . . , S (s steht f¨ ur “state”) bezeichnen. Wir gehen weiter davon aus, dass wir jedem Zustand s eine Wahrscheinlichkeit seines Eintretens zuordnen k¨onnen. Diese Wahrscheinlichkeit bezeichnen wir mit qs , sie ist sinnvollerweise gr¨oßer null und alle qs summieren sich nat¨ urlich zu eins. Da wir Wahrscheinlichkeiten der Zust¨ande kennen, werden wir Erwartungswerte und Kovarianzen berechnen k¨onnen. Es gebe an unserem Markt insgesamt nur ein handelbares ¨ Gut, und dabei soll es sich um Geld handeln. Insofern hat unser Modell sehr starke Ahnlichkeit mit der zweiten Interpretation des Grundmodells aus dem vorigen Abschnitt, bei dem ebenfalls Geld zu verschiedenen Zeitpunkten in der Zukunft lieferbar war.
X=
X1 X2 .. . XS
←− ←−
Menge an Zahlung im ersten Zustand Menge an Zahlung im zweiten Zustand .. .
←−
Menge an Zahlung im S–ten Zustand
Bevor wir mit dem inhaltlichen Teil beginnen, stellen wir folgende interessante Eigenschaft unseres Modelles fest. Wenn wir unser Grundmodell der Unsicherheit mit den Modellen vergleichen, die wir im vorigen Kapitel behandelt haben, dann haben sie eine grundlegende formale Gemeinsamkeit. Wir k¨onnten in einem Gedankenexperiment beispielsweise die verschieden lieferbaren G¨ uter als Geld in verschiedenen Zust¨anden auffassen: Gut eins entspricht also einer Geldeinheit im ersten Zustand, Gut zwei einer Geldeinheit im zweiten Zustand usw. Insoweit k¨onnten wir etwa die Axiomatik der Nutzenfunktionen u ¨bernehmen, wenn uns an einer Nutzenfunktion der Form U (X1 , X2 , . . . , XS ) gelegen w¨are. Etwas mehr Aufmerksamkeit m¨ ussen wir der Frage widmen, was in unserem Modell jetzt ein risikoloser Titel sein soll. Offensichtlich ist ein Wertpapier in dem Grundmodell der Unsicherheit genau dann risikolos, wenn es genau eine Geldeinheit in jedem Zustand auszahlt. Wir werden es auch durch eine
15
2.1 Erwartungsnutzentheorie
S. 16
fett gedruckte eins darstellen: 1 1 1 := . . .. 1 Der Preis dieses Wertpapiers wird den risikolosen Zins determinieren, und es gilt p(1) =
1 . 1 + rf
2.1.2 Petersburger Spiel Wir betrachten ein ber¨ uhmtes Spiel, dessen Ergebnis als “Petersburger Paradox” in die Literatur eingegangen ist.1 Angenommen, man offeriert uns ein Spiel, das einmal durchgef¨ uhrt wird. Um daran teilzunehmen, muss man einen Geldbetrag bezahlen, dessen H¨ohe vorerst unbekannt sei. Hat man also den bisher unbekannten Teilnahmebetrag ermittelt, dann wirft der Spielleiter eine M¨ unze. Er tut dies so oft, bis auf der M¨ unze “Zahl” erscheint. In Abh¨angigkeit von der Anzahl der notwendigen W¨ urfe gibt es f¨ ur den Teilnehmer des Spiels eine Auszahlung. Sie ermittelt sich wie folgt Anzahl der W¨ urfe (Zustand s) 1 Wurf 2 W¨ urfe 3 W¨ urfe 4 W¨ urfe 5 W¨ urfe .. .
2 4 8 16
Auszahlung (Xs ) 1 Geldeinheit Geldeinheiten Geldeinheiten Geldeinheiten Geldeinheiten .. .
Mit der Anzahl der notwendigen W¨ urfe verdoppelt sich die Auszahlung. Befragen wir den urde, so ¨okonomisch nicht versierten Leser, welchen Eintrittspreis er als “fair” bezeichnen w¨ werden sehr selten Werte u unf Geldeinheiten genannt. Wir wollen zuerst ermitteln, wie ¨ber f¨ hoch die erwartete Auszahlung dieses Spieles w¨are. Dazu haben wir in jeder m¨oglichen Situation die Auszahlung mit der entsprechenden Wahrscheinlichkeit zu multiplizieren. Dies f¨ uhrt auf die folgende Rechnung 1 1 1 1 + 2 · 2 + 4 · 3 + 8 · 4 + ··· 2 2 2 2 1 1 1 = + + + ··· 2 2 2 =∞
1·
1
¨ Dieses Spiel ist durch die Arbeit Daniel Bernoullis ber¨ uhmt geworden. Eine Ubersetzung ist wieder k¨ urzlich erschienen, siehe Bernoulli (1996).
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 17
und dieses Ergebnis ist in der Tat paradox. Jeder “vern¨ unftige” Mensch w¨ urde f¨ ur die hier vorgestellte Lotterie nicht mehr als f¨ unf Geldeinheiten zahlen, obwohl sie offensichtlich eine unendlich hohe erwartete Auszahlung besitzt. Wird die Lotterie also oft genug gespielt, dann k¨onnte der Spieler im Durchschnitt unendlich reich werden. Und dennoch ist der “faire” Eintrittpreis des Spiels ganz offensichtlich ungleich der erwarteten Auszahlung. Wie kommt es zu diesem Paradox? In der Literatur hat es um diese Frage eine erbitterte Auseinandersetzung gegeben, weil das Spiel ein Element der Unendlichkeit enth¨alt. So hat Cramer noch vor Daniel Bernoulli vorgeschlagen, alle Auszahlungen ab dem 24.ten Wurf nicht mehr zu ber¨ ucksichtigen (dies entspr¨ache einer Auszahlung von ca. 8.4 Millionen). Und in der Tat scheint es ab einem bestimmten Geldbetrag schlichtweg unm¨oglich, dass der Spielleiter abenteuerlich hohe Gewinne auszahlen k¨onnte. Wiederholt man nun die Rechnung, so kommt man auf einen vern¨ unftigen Spieleinsatz von etwa 12 Geldeinheiten und das Problem scheint gel¨ost. ¨ Nicht alle Okonomen haben diese Ansicht geteilt. Um klarzumachen, dass hinter dem Petersburger Paradox mehr als nur ein Problem mit der Unendlichkeit steckt, wollen wir ein weiteres Spiel vorschlagen. Wir bieten ein Spiel an, bei dem eine M¨ unze einmal geworfen wird. Erhalten wir “Zahl”, dann verpflichten wir uns (oder wir verpflichten eine Bank), das zuk¨ unftige Gehalt des Spielers immer zu verdoppeln. Eine Bank sollte ohne weiteres dazu in der Lage sein. Als Eintrittspreis verlangen wir dagegen, dass im Falle von “Wappen” der Spieler sein gesamtes Gehalt uns (oder der Bank) zur Verf¨ ugung stellt. Hier liegt sicherlich kein Problem mit einer Unendlichkeit vor.2 Die erwartete Auszahlung entspricht genau dem Eintrittspreis des Spiels, dennoch wird niemand ein derartiges Spiel spielen. Die beiden Beispiele verdeutlichen folgendes: entweder liegt der als “fair” empfundene Eintrittspreis des Spiels deutlich unter der Auszahlung (siehe das Petersburger Paradox) oder, falls beide zusammenfallen (siehe unser Lohnverpf¨andungsspiel), werden wir dieses Spiel nicht spielen. Wenn p(X) den fairen Eintrittspreis des Spieles bezeichnet, so gilt p(X) < E [X]. Dieses Ergebnis scheint der Intuition zu widersprechen, dass eine Investitionsentscheidung unter Unsicherheit sich einfach am Erwartungswert der Auszahlung orientiert. W¨ahrend das Petersburger Spiel dieses Paradox durch die Verwendung eines unendlichen Spiels nicht deutlich genug herausarbeitet, f¨allt es bei unserem Lohnverpf¨andungsspiel sofort auf. Zur¨ uck zum Petersburger Spiel. Wie l¨oste Daniel Bernoulli das Paradox? Er argumentierte, dass nicht die Auszahlung, sondern der Nutzen der Auszahlung f¨ ur einen Investor von Bedeutung ist. Der Nutzen aber, so postulierte er, verh¨alt sich diametral zu H¨ohe des Geldbetrages und er leitete eine Nutzenfunktion der Form u(x) = ln(x) ab. Dann m¨ ussen wir die Ergebnisrechnung wiederholen3 ∞
X ln(2k ) ln(1) ln(2) ln(4) + 2 + 3 + ··· = 2 2 2 2k+1 k=0
= ln(2). 2
Nat¨ urlich ist es unm¨ oglich, sein gesamtes Gehalt zu verpf¨ anden, das Sozialhilfeniveau muss ja gesichert werden. Diese Details ignorieren wir jetzt großz¨ ugig. 3 Der nun folgende Rechenschritt setzt in der letzten Zeile einen mathematischen Trick voraus, auf dessen Darstellung wir hier verzichten.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 18
In der ersten Zeile finden wir den Nutzen des Spieles, und wenn dieser Nutzen gleich dem Nutzen des Eintrittspreises sein soll, dann muss der faire Preis gerade zwei Geldeinheiten betragen. Dieses Ergebnis ist plausibel.
2.1.3 Erwartungsnutzen Wir k¨onnen folgendes festhalten. Wenn ein Entscheidungstr¨ager unter Unsicherheit entscheidet, sollte er sich aufgrund der Risikoaversion der Investoren nicht am Erwartungswert, sondern am Erwartungsnutzen orientieren. Bevor wir uns der Frage zuwenden, welche Nutzenfunktionen denn u ussen wir folgende Frage aufwerfen. Wir haben ¨berhaupt plausibel sind, m¨ im vorigen Kapitel großen Wert darauf gelegt, unsere Nutzenfunktionen immer auf Axiome zu begr¨ unden. Eine solche Nutzenfunktion, die auf uns bekannten Axiomen beruht, w¨ urden wir mit U (X1 , X2 , X3 , . . .) bezeichnen k¨onnen. Die Erwartungsnutzentheorie aber verlangt, dass unsere Nutzenfunktion eine wesentlich speziellere Gestalt aufweist, genauer soll sie von der Form U (X1 , X2 , X3 , . . .) = q1 · u(X1 ) + q2 · u(X2 ) + q3 · u(X3 ) + . . . + qS u(XS )
(2.1)
f¨ ur eine Funktion u(x) sein. Unter welchen (weiteren) Annahmen an die Pr¨aferenzen aber folgt, dass wir es in der Tat mit einer Erwartungsnutzendarstellung zu tun haben? Die Pr¨aferenzen m¨ ussen u uterb¨ undel im Sin¨ber unsichere Ergebnisse definiert sein. Ein G¨ ne von Mikro I soll nun eine Lotterie L sein, die mit Wahrscheinlichkeiten (q 1 , . . . , qS ) mit PS q = 1 die Auszahlungen (X , . . . , X ) liefert. Um ein paar technischen Details aus dem 1 S s=1 s Weg zu gehen, wollen wir nur Lotterien mit endlich vielen m¨oglichen Ergebnissen betrachten. Dies schließt allerdings bereits das Beispiel des Petersburger Spiels aus, bei dem es ja durchaus zu unendlich vielen M¨ unzwurfen kommen kann. Die Ergebnisse Xs k¨onnen einfache Zahlungen oder bestimmte Ereignisse sein (eine Bef¨orderung, eine gute Note o.¨a.). Besondere Bedeutung haben Lotterien deren Ergebnisse selbst wieder Lotterien sind. Eine Lotterie u ¨ber Lotterien ist aber im Grunde auch nur eine einfache Lotterie u ungliche Lotterie als ¨ber die Menge der Preise aller Lotterien, die die urspr¨ Ergebnisse lieferte. Sei zum Beispiel L0 die Lotterie, die mit Wahrscheinlichkeiten (p1 , p2 ) die Ergebnisse (X1 , X2 ) ergibt und L00 die Lotterie, die mit Wahrscheilichkeiten (q1 , q2 ) die Ergebnisse (X2 , X3 ) liefert. Dann ist die Lotterie L, die mit Wahrscheinlichkeiten (α, 1 − α) als Ergebnisse die Lotterien L0 bzw. L00 liefert, nichts anderes als eine Lotterie mit Wahrscheinlichkeiten (αp1 , αp2 +(1−α)q1 , (1−α)q2 ) die Preise (X1 , X2 , X3 ) liefert. Die zusammengesetzte Lotterie L schreiben wir L = αL0 + (1 − α)L00 . Dabei benutzen in Anlehnung an die Literatur wir also das +–Zeichen, obwohl hier nichts addiert wird. Ich hoffe, das f¨ uhrt nicht zu all zu viel Verwirrung... Wir wollen aber annehmen. dass alle Marktteilnehmer dies erkennen und also nicht zwischen Lotterien u uber hinaus sollen die ¨ber Lotterien und einfachen Lotterien unterscheiden.4 Dar¨ 4
Bereits dies ist eine gewagte Annahme. In der Realit¨ at verhalten sich die wenigsten Menschen derart. Wenn ¨ man ihnen aber vorher die Aquivalenz der beiden Lotterien erl¨ autert, wird diese Annahme in der Regel befolgt.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 19
Standardaxiome der Vollst¨andigkeit, der Transitivit¨at und der Stetigkeit gelten. Das Stetigkeitsaxiom bezogen auf Lotterien bedeutet demnach, dass wenn f¨ ur Lotterien L, L0 und L00 und f¨ ur Wahrscheinlichkeiten qn ∈ [0, 1] gilt, dass qn L + (1 − qn )L0 L00 dann gilt auch f¨ ur q = limn→∞ qn qL + (1 − q)L0 L00 . Damit ergibt sich immerhin schon die Existenz einer Nutzenfunktion U auf dem Raum der Lotterien. Damit U aber die Form von (2.1) hat, wird ein weiteres Axiom ben¨otigt, das so genannte ’Unabh¨angigkeits–Axiom’: Definition 2.1 Die Pr¨ aferenz–Relation gen¨ ugt auf dem Raum der Lotterien dem Axiom der Unabh¨ angigkeit, wenn f¨ ur alle Lotterien L, L0 und L00 mit L L0 und α ∈ [0, 1] gilt, dass auch αL + (1 − α)L00 αL0 + (1 − α)L00 . Mit anderen Worten, wenn eine Lotterie einer zweiten Lotterie vorgezogen wird, dann ¨andert sich daran auch nichts, wenn beide Lotterien mit einer dritten verkn¨ upft werden. Dies ist ein vollkommen neues Axiom, das es in der bisherigen Nutzentheorie in Mikro I nicht gab. Dort konnte es eben sehr wohl sein, dass die Vorlieben f¨ ur Eis u ¨ber Spaghetti durchaus davon abh¨angig sein konnten, ob man dazu auch Tomatensoße bekam. Das soll beim Erwartungsnutzen anders sein. Hier wird die Wahl einer Lotterie davon unabh¨angig sein, welche anderen Lotterien gespielt werden. Mit dem Unabh¨angigkeits–Axiom wird die Nutzenfunktion die additive Struktur von (2.1) haben: Satz 2.1 (von Neumann/Morgenstern, 1944) Die Pr¨ aferenzrelation auf dem Raum der Lotterien gen¨ uge den Axiomen der Vollst¨ andigkeit, der Transitivit¨ at, der Stetigkeit und der Unabh¨ angigkeit. Dann hat die zugeh¨ orige Nutzenfunktion U die Form einer Erwartungsnutzenfunktion, das heißt, es existiert eine stetige Funktion u auf dem Raum der Ergebnisse, so dass f¨ ur alle Lotterien L mit Wahrscheinlichkeiten (q1 , . . . , qS ) und Ergebnissen (X1 , . . . , XS ) gilt: U (L) =
S X
qs u(Xs ).
s=1
Beweis: Wir beweisen den Satz vorerst f¨ur den Fall, dass es eine beste Lotterie Lb und eine schlechteste Lotterie Lw gibt, das heißt f¨ ur alle Lotterien L gilt: Lb L Lw . Man setzt U (Lb ) = 1 und U (Lw ) = 0. F¨ ur eine beliebige Lotterie L setzt man U (L) = αl wobei l α ∈ [0, 1] mit αl Lb + (1 − αl )Lw ∼ L. Wir m¨ ussen als erstes zeigen, dass U wohldefiniert ist, das heißt wir m¨ ussen die Existenz und die Eindeutigkeit von αl beweisen.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 20
Eindeutigkeit Dazu benutzen wir den folgenden Hilfssatz: F¨ ur je zwei Zahlen α und β in [0, 1] gilt αLb + (1 − α)Lw βLb + (1 − β)Lw
genau dann wenn α > β.
(2.2)
Dies ergibt sich aus dem Unabh¨ angigkeits–Axiom (in der Fassung f¨ ur die strikte Pr¨aferenz ) wie folgt: da Lb Lw folgt mit dem Unabh¨angigkeits–Axiom, dass f¨ ur beliebige Lotterien L und 0 < γ < 1: γLb + (1 − γ)L γLw + (1 − γ)L. Setzt man hier f¨ ur L die Lotterie δLb + (1 − δ)Lw mit δ ∈ [0, 1] so erh¨alt man: γLb + (1 − γ)(δLb + (1 − δ)Lw ) γLw + (1 − γ)(δLb + (1 − δ)Lw ) bzw. (γ + (1 − γ)δ)Lb + (1 − γ)(1 − δ)Lw (1 − γ)δLb + (γ + (1 − γ)(1 − β)Lw . Da γ > 0 ist, bekommt man mit α = γ + (1 − γ)δ und β = (1 − γ)δ = α − γ das Ergebnis (2.2). Damit haben wir aber die Eindeutigkeit von αl gezeigt, da f¨ ur alle α 6= αl mit dem Hilfssatz b w l b l w offensichtlich αL + (1 − α)L 6∼ α L + (1 − α )L sein muss. Existenz Wegen der Vollst¨ andigkeit der Pr¨aferenzrelation liegt jedes q ∈ [0, 1] in einer der Mengen {q ∈ [0, 1]|qLb + (1 − q)Lw L} oder {q ∈ [0, 1]|qLb + (1 − q)Lw L}. Sei q min > 0 das Minimum der ersten Menge und q max < 1 das Maximum der zweiten Menge5 . Mit unseren ¨ Uberlegungen zur Eindeutigkeit wissen wir bereits, dass q min ≥ q max . Wenn q min > q max w¨are, dann g¨ abe es Werte q ∈ [0, 1] mit q min > q > q max , die in keiner der beiden Mengen liegen w¨ urden. Dies ist aber ein Widerspruch zur Vollst¨andigkeit der Pr¨aferenzrelation. Damit haben wir also q min = q max und damit die Existenz von αl = q min = q max . Damit ist U (L) wohldefiniert. Wir m¨ ussen noch zeigen, dass U tats¨achlich eine Erwartungsnutzenfunktion ist. Sei nun L eine beliebige Lotterie mit Wahrscheinlichkeiten (q1 , . . . , qS ) und Ergebnissen (X1 , . . . , XS ). Wenn S = 1, also L eine degenerierte Lotterie mit nur einem Ergebnis ist, dann ist offensichtlich mit der Definition u(X1 ) := U (L): U (L) = 1 ∗ u(X1 ) = q1 u(X1 ). Sei nun S > 1. L1 bezeichne die degenerierte Lotterie mit einem sicheren Ergebnis von X1 und L−1 q2 qS die Lotterie mit Wahrscheinlichkeiten ( 1−q , . . . , 1−q ) und Ergebnissen (X2 , . . . , XS ). Es gilt: 1 1 L = q1 L1 + (1 − q1 )L−1 . Beachten Sie, dass L−1 nur S − 1 m¨ ogliche Ergebnisse liefert. Nach der Konstruktion von U haben wir L ∼ U (L)Lb + (1 − U (L))Lw L1 ∼ U (L1 )Lb + (1 − U (L1 ))Lw L−1 ∼ U (L−1 )Lb + (1 − U (L−1 ))Lw . Mit dem Unabh¨ angigkeits–Axiom haben wir dann q1 L1 + (1 − q1 )L−1 ∼ q1 (U (L1 )Lb + (1 − U (L1 ))Lw ) + (1 − q1 )L−1 bzw. q1 (U (L1 )Lb +(1−U (L1 ))Lw )+(1−q1 )L−1 ∼ q1 (U (L1 )Lb +(1−U (L1 ))Lw )+(1−q1 )(U (L−1 )Lb +(1−U (L−1 ))Lw ). 5
Beide existieren, wegen der Stetigkeit der Pr¨ aferenzrelation.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 21
Wird letzteres ausmultipliziert, erh¨ alt man L ∼ (q1 U (L1 ) + (1 − q1 )U (L−1 ))Lb + (q1 (1 − U (L1 )) + (1 − q1 )(1 − U (L−1 )))Lw . Damit haben wir also gezeigt, dass U (L) = q1 U (L1 ) + (1 − q1 )U (L−1 ). Man kann dieses Verfahren nun weiter auf L−1 anwenden indem ein weiteres Ergebnis gestrichen wird. Man setzt dies so lange fort bis nichts mehr zu streichen ist und erh¨ alt dann schließlich U (L) =
S X
s
qs U (L ) =
s=1
S X
qs u(X s ).
s=1
Es bleibt noch zu zeigen, was passiert, wenn es keine beste und schlechteste Lotterie Lb und Lw gibt. Man greift sich dann zwei beliebige Lotterien heraus. Einzige Bedingung: eine muss besser als die andere sein. Man nennt diese wieder Lb und Lw mit Lb Lw . F¨ ur Lotterien L mit Lb L Lw b geht man wie oben vor. F¨ ur Lotterien L mit L L zeigt man, dass es ein eindeutiges αl existiert mit αl L + (1 − αl )Lw ∼ Lb und definiert U (L) = 1/αl . F¨ ur Lotterien L mit L ≺ Lw zeigt man, dass es ein l l b l w eindeutiges α gibt mit α L + (1 − α )L ∼ L und definiert U (L) = −αl /(1 − αl ). N¨aheres schlage man in den einschl¨ agigen Lehrb¨ uchern nach.
Sehr viele Ergebnisse in der Theorie der Kapitalm¨arkte basieren auf der Erwartungsnutzentheorie. Es w¨are also sch¨on, wenn die zu Grunde liegenden Axiome einigermaßen zutreffen w¨ urden. Hier gilt leider wieder, was weiter oben zur Einsch¨atzung von Lotterien auf Lotterien gesagt wurde. Viele Menschen handeln erst dann entsprechend des Unabh¨angigkeits–Axiom, wenn man sie explizit auf die Inkonsistenzen einer Abweichung hinweist. Ein ber¨ uhmtes Beispiel, f¨ ur Entscheidungen, die nicht mit dem Unabh¨angigkeits–Axiom zu vereinbaren sind, ist das so genannte Allais–Paradox6 . Es gebe drei m¨ogliche Preise: Erster Preis e 27.500
Zweiter Preis e 24.000
Dritter Preis e0
Gefragt nach einer Entscheidung zwischen dem zweiten Preis mit Sicherheit oder einer Lotterie L mit Wahrscheinlichkeiten (0, 33; 0, 66; 0, 01), entscheiden sich die meisten Menschen f¨ ur die sichere Zahlung. Geht die Entscheidung aber zwischen zwei Lotterien L0 mit Wahrscheinlichkeiten (0; 0, 34; 0, 66) und L00 mit Wahrscheinlichkeiten (0, 33; 0; 0, 67), dann ziehen die meisten Menschen L00 vor. Dies widerspricht aber dem Erwartungsnutzenprinzip. Wenn Sie bei der ersten Entscheidung die sichere Zahlung vorziehen, heißt das also u(e 24.000) > 0, 33u(e 27.500) + 0, 66u(e 24.000) + 0, 01u(e 0). Wenn Sie dies umstellen, ergibt sich 0, 34u(e 24.000) > 0, 33u(e 27.500) + 0, 01u(e 0). Wenn Sie nun auf beiden Seiten 0, 66u(e 0) addieren, erhalten Sie 0, 34u(e 24.000) + 0, 66u(e 0) > 0, 33u(e 27.500) + 0, 67u(e 0). An diesem Beispiel l¨asst sich die Bedeutung des Unabh¨angigkeitsaxiom recht gut demonstrieren. Der Verstoß gegen das Erwartungsnutzenprinzip ergibt sich aus einem Verstoß gegen das 6
Nach Allais (1953).
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 22
Unabh¨angigkeits–Axiom. Schauen Sie sich die Lotterien L1 ’e 24.000 mit Sicherheit’ und L2 ’e 27.500 mit einer Wahrscheinlichkeit von 33/34 und e 0 mit einer Wahrscheinlichkeit von 1/34’ an. Entweder Sie ziehen die sichere Zahlung vor oder nicht. Nehmen wir an Sie w¨ urden die sichere Zahlung vorziehen, also L1 L2 . Dann gilt also mit dem Unabh¨angigkeitsaxiom also f¨ ur jede beliebige Lotterie L3 und 0 < α < 1: αL1 + (1 − α)L3 αL2 + (1 − α)L3 . Wenn Sie nun f¨ ur L3 die Lotterie L1 nehmen und α = 0, 34 dann erhalten Sie L1 0, 34L2 + 0, 66L1 . Wenn Sie die Lotterie auf der rechten Seite ausmultiplizieren, dann erkennen Sie, dass das gerade die Lotterie L aus dem Allais–Paradox ist. Die Entscheidung die sichere Zahlung der Lotterie L2 vorzuziehen war also kompatibel mit der ersten Entscheidung im Allais–Paradox. Genau so gut k¨onnen Sie aber f¨ ur L3 die Lotterie ’e 0 mit Sicherheit’ einsetzen. Mit dem gleichen α = 0, 34 wie gerade eben ergibt sich dann: 0, 34L1 + 0, 66L3 0, 34L2 + 0, 66L3 . Wenn Sie diese Lotterien ausmultiplizieren, erkennen Sie aber, dass dies bedeutet, dass Sie in der zweiten Entscheidung des Allais–Paradoxes L0 L00 vorziehen m¨ ussten. Sie haben vielleicht bemerkt, dass wir bei der Herleitung der Erwartungsnutzentheorie davon ausgegangen sind, dass die Wahrscheinlichkeiten der Lotterien vorgegeben wurden. Die Erwartungsnutzentheorie gibt uns eine Darstellung der Nutzenfunktion f¨ ur Entscheidungen, bei denen die Unsicherheit objektiv vorgegeben ist. Dies ist sicherlich bei Entscheidungen, bei denen es um einen M¨ unzwurf oder die Ziehung der Lottozahlen geht, realistisch. Es gibt aber auch viele Situationen, bei denen man sich als Entscheider erst einmal u ¨ber die zu Grunde liegenden Wahrscheinlichkeiten Klarheit verschaffen muss. Wie sieht ein Axiomensystem aus, das sowohl zu jedem Zustand eine Wahrscheinlichkeit als auch eine zu diesen Wahrscheinlichkeiten konsistente Erwartungsnutzenfunktion liefert? Leider ist diese Frage nicht ganz einfach zu beantworten. In der Literatur sind o¨konomisch gut zu interpretierende Axiomensysteme f¨ ur den Fall bekannt, dass am Markt unendlich viele Zust¨ande S = ∞ existieren.7 F¨ ur den Fall endlich vieler Zust¨ande S < ∞ ist die Diskussion durchaus noch nicht abgeschlossen. Ein besonders eleganter Zugang stammt von Wakker (1984), dort gen¨ ugt neben den im Kapitel u ¨ber Sicherheit genannten Annahmen ein weiteres Axiom (es heißt “kardinale Koordinatenunabh¨angigkeit”, was die Sache nicht einfacher macht. . . ). Dieser Zugang hat aber den großen Nachteil, dass er ¨okonomisch nur sehr schwer zu verstehen ist. Wir verzichten daher auf eine Darstellung und wollen damit die Fragen um die Axiomatisierung der Erwartungsnutzentheorie beenden. Wir wollen noch auf einen wichtigen Unterschied der Erwartungsnutzentheorie zur Nutzentheorie unter Sicherheit hinweisen. Dort hatten wir erkannt (siehe S. 2), dass wir eine Nutzenfunktion immer monoton transformieren d¨ urfen und wieder eine Nutzenfunktion erhalten, die die Rangordnung der G¨ uterb¨ undel des Investors widerspiegelt. Wir hatten diese Eigenschaft als Ordinalit¨at der Nutzenfunktion gekennzeichnet. Im Rahmen der Erwartungsnutzentheorie 7
Das state–of–the–art System stammt von Savage (1972).
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 23
ist diese Eigenschaft nicht mehr erf¨ ullt. Die einzigen Transformationen, die wir mit Nutzenfunktionen durchf¨ uhren d¨ urfen, sind positiv lineare Transformationen (b > 0). Denn es gilt E [u(X)] ≥ E [u(Z)]
⇐⇒
a + b E [u(X)] ≥ a + b E [u(Z)],
⇐⇒
E [a + b · u(X)] ≥ E [a + b · u(Z)],
falls b > 0. Diese Eigenschaft werden wir als Kardinalit¨at der Erwartungsnutzentheorie bezeichnen.
2.1.4 Grad (Intensit¨ at) der Risikoaversion Wir fragen, welche Nutzenfunktionen in einer ¨ okonomischen Theorie plausibel sind. Dazu definieren wir den Grad oder die Intensit¨ at der Risikoaversion und stellen fest, dass nur eine fallende absolute Risikoaversion vertretbar ist. Wir haben den vergangenen Abschnitten erkannt, dass in Entscheidungssituation unter Unsicherheit immer Erwartungsnutzenfunktion verwendet werden sollten. Wir wollen uns jetzt mit der Frage auseinandersetzen, welche Nutzenfunktionen dabei sinnvollerweise eingesetzt werden k¨onnen. Wir gehen dabei wie folgt vor: wir vergleichen eine unsichere Situation mit einer sicheren Zahlung, die beide jedoch f¨ ur den Investor den gleichen Nutzen stiften sollen. Sei also eine Lotterie X gegeben, die eine unsichere Auszahlung in der Zukunft generiert. Nach unseren bisherigen Ausf¨ uhrungen wird dies beim Investor zu einem Nutzen in H¨ohe von E [u(X)] f¨ uhren. Zuerst k¨onnte man davon ausgehen, dass der Investor statt des unsicher ausgezahlten Geldbetrages einen sicheren Geldbetrag in H¨ohe des Erwartungswertes erh¨alt. In diesem Fall w¨ urden dem Investor also E [X] zustehen und dies h¨atte einen Nutzen in H¨ohe von u(E [X]) zur Folge. Der Investor ist aber risikoavers. Also m¨ ussen wir davon ausgehen, dass dieser Nutzenwert u urde ja der Investor eine ¨ber dem im vorigen Absatz ermittelten Niveau liegt: anderenfalls w¨ unsichere Zahlung mit gleichem Erwartungswert vorziehen. Wir definieren also Definition 2.2 Sei X eine unsichere Zahlung. Dann heißt ein Investor risikoavers genau dann, wenn f¨ ur dessen Nutzenfunktion die Relation E [u(X)] < u(E [X]) gilt, risikofreudig genau dann, wenn E [u(X)] > u(E [X]) erf¨ ullt ist, risikoneutral genau dann, wenn E [u(X)] = u(E [X]) gilt. Wir haben nat¨ urlich zuerst die Frage zu beantworten, inwieweit wir bereits der Nutzenfunktion ansehen k¨onnen, welches Risikoverhalten vorliegt. Wir k¨onnen folgenden Satz beweisen. Satz 2.2 Wenn die Nutzenfunktion u(x) konkav ist, dann ist der Investor risikoavers. Ist sie konvex, dann ist er risikofreudig. Ist sie linear, dann liegt Risikoneutralit¨ at vor. Beweis: Wir zeigen die Behauptung nur f¨ur den Fall der Risikoaversion, die beiden anderen F¨alle k¨onnen analog erledigt werden.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 24
Die Behauptung des Satzes ist dann eine Folge der sogenannten Jensenschen Ungleichungen. Diese behaupten, dass eine Funktion u(x) genau dann konkav ist, wenn f¨ ur beliebige Zahlen λs , Xs mit P s λs = 1 die folgende Ungleichung gilt λ1 u(X1 ) + λ2 u(X2 ) + . . . + λS u(XS ) < u(λ1 X1 + . . . λS XS ). Wir m¨ ussen nun nur noch diese Ungleichung richtig interpretieren. Dazu setzen wir statt der λs auf der linken Seite die Wahrscheinlichkeiten der S Zust¨ande ein. Die linke Seite ist dann nichts anderes als der Erwartungsnutzen E [u(X)], w¨ ahrend die rechte Seite genau u(E [X]) ergibt. Aber das war zu zeigen.
Wir hatten bereits in der Einleitung argumentiert, dass wir ein risikoaverses Verhalten f¨ ur ¨okonomisch plausibel halten. Daher werden wir im folgenden immer von konkaven Nutzenfunktionen ausgehen. Uns interessiert nun, wie hoch der Abschlag ist, den ein Investor in Kauf nimmt, wenn er sich dennoch Risiko aussetzt. Dieser Abschlag wird auch Markowitz– Risikopr¨amie genannt und wie folgt definiert. ¨ Definition 2.3 (Markowitz) Die Risikopr¨ amie π f¨ ur die Ubernahme von Risiko X unter der Nutzenfunktion u(x) ist derjenige Betrag π, f¨ ur den die Gleichung E [u(X)] = u(E [X] − π)
(2.3)
¨ erf¨ ullt wird. E [X] − π wird auch als das Sicherheits¨ aquivalent SA(X) von X bezeichnet. Zuerst versuchen wir, eine Absch¨atzung f¨ ur die H¨ohe dieser Risikopr¨amie herzuleiten. Es wird sich zeigen, dass dies f¨ ur kleine Risiken in der Tat m¨oglich ist. Satz 2.3 F¨ ur kleine Risiken gilt der Zusammenhang 00 (E [X]) π ≈ 12 Var [X] · − uu0 (E [X]) .
(2.4)
00
(x) Die Gr¨ oße − uu0 (x) wird auch absolute Risikoaversion der Nutzenfunktion u(x) genannt.
Beweis: Um diesen Satz zu beweisen, verwenden wir eine Taylor–Approximation bis zur zweiten Ordnung u(t) ≈ u(s) + u0 (s)(t − s) +
u00 (s) (t − s)2 . 2
(2.5)
Bei der Taylor–Approximation wird eine Nutzenfunktion u(t) durch die ersten drei Glieder der Taylorreihe ersetzt. Wir erhalten eine neue quadratische Funktion, die f¨ ur kleine Abweichungen |s − t| ein durchaus akzeptables Ergebnis liefern kann. ur jede der Gr¨oßen t = Xs und s = E [X] In einem ersten Schritt wenden wir die Approximation (2.5) f¨ an und erhalten u(Xs ) ≈ u(E [X]) + u0 (E [X])(Xs − E [X]) +
u00 (E [X]) (Xs − E [X])2 . 2
Wird nun der Erwartungswert gebildet (dazu multiplizieren wir jede der obenstehenden Absch¨atzungen mit der Wahrscheinlichkeit qs und addieren die S Gleichungen), so verbleibt E [u(X)] ≈ u(E [X]) + 0 +
c L¨offler/Laitenberger 2003
u00 (E [X]) Var [X]. 2
2.1 Erwartungsnutzentheorie
S. 25
Diese Absch¨ atzung k¨ onnen wir in die Definition der Markowitz–Pr¨amie einsetzen. Wir erhalten u(E [X] − π) = E [u(X)] ≈ u(E [X]) + 0 +
u00 (E [X]) Var [X]. 2
In einem zweiten Schritt versuchen wir, uns der linken Seite zu n¨ahern. Auch hier hilft eine Taylor– Approximation weiter. Wir approximieren hier mit t = E [X] − π und s = E [X] nur bis zur ersten Stelle und dies f¨ uhrt auf u(E [X]) + u0 (E [X])(−π) ≈ u(E [X] − π) ≈ u(E [X]) +
u00 (E [X]) Var [X]. 2
K¨ urzen wir u(E [X]) und stellen geringf¨ ugig um, so erhalten wir die gew¨ unschte Approximation.
Die Risikopr¨amie ermittelt sich also in quadratischer N¨aherung aus dem Produkt der Varianz des Risikos mit einem Term, der sich aus der zweiten und ersten Ableitung der Nutzenfunktion ergibt. Dabei sind beide Ableitungen jeweils an der Stelle E [X] zu ermitteln. Wir wollen nun einen Schritt weitergehen. Wir gehen davon aus, dass der Investor neben der riskanten Investition im Zeitpunkt t = 1 (also der Zukunft) ein sicheres Verm¨ogen besitze. Dieses Verm¨ogen betrage gerade w und damit ist das Portfolio der Approximation nicht X, sondern X + w · 1. Die Approximationsgleichung lautet, weil eine sichere Gr¨oße die Varianz ja nicht ¨andert 00 1 u (w + E [X]) π ≈ Var [X] · − 0 . 2 u (w + E [X]) Uns interessiert nun, inwieweit die Risikopr¨amie sich mit dem Verm¨ogen des Investors ¨andert. Dazu betrachten wir die Approximation (2.4) ein weiteres Mal. Uns interessiert die Risikopr¨amie π als eine Funktion des sicheren Verm¨ogens w in der Zukunft. Angenommen, ein Entscheidungstr¨ager wird immer wohlhabender. Es scheint plausibel, dass er in einer solchen Situation selbstverst¨andlich bereit sein sollte, zumindest die bisherigen riskanten Situationen einzugehen: die gerade definierte Risikopr¨amie bei einem gleichbleibenden Risiko sollte sich also nicht erh¨ohen, wenn das Verm¨ ogen w w¨achst – vielmehr sollte sie fallen. W¨ urde nun die Approximation nicht nur ungef¨ahr, sondern sogar exakt gelten, dann ließe sich dieser Zusammenhang wie folgt formal umsetzen. Da die linke Seite der Approximation ja in w fallen soll, muss dies auch f¨ ur die rechte Seite gelten. Die rechte Seite besteht aber aus der Varianz des Risikos, die vom Verm¨ogen g¨anzlich unabh¨angig ist, und dem Term, den wir die absolute Risikoaversion genannt haben. Es bietet sich damit folgende Definition an. Definition 2.4 Der Entscheidungstr¨ ager besitzt fallende (wachsende, konstante) absolute Risikoaversion genau dann, wenn die absolute Risikoaversion −
u00 (t) u0 (t)
eine fallende (wachsende, konstante) Funktion ist. Und in der Tat l¨asst sich der folgende Satz beweisen. Allerdings fußt der Beweis nicht auf der Approximationsgleichung (2.4), da die Approximation nur eine N¨aherungsaussage u ¨ber die H¨ohe der Risikopr¨amie machen kann. Auf einen Beweis m¨ ussen wir verzichten, er ist zu aufwendig.8 8
Man findet den Beweis beispielsweise bei Wolfstetter (1999), S.166f.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 26
Satz 2.4 Der Investor besitzt fallende absolute Risikoaversion (wachsende, konstante ARA) genau dann, wenn π im Verm¨ ogen w eine fallende (wachsende, konstante) Funktion ist. Der Fall der konstanten absoluten Risikoaversion besitzt eine besondere Bedeutung. Abgesehen von vielen ¨okonomischen Modellen, in denen er Verwendung findet, wird er insbesondere bei der Berechnung von Versicherungspr¨amien in der Praxis sehr oft benutzt. Eben weil die H¨ohe der Risikopr¨amie nicht vom aktuellen Verm¨ogen abh¨angig ist, l¨asst sich eine Versicherungspr¨amie ermitteln, die nicht auf die pers¨onlichen Umst¨ande des Versicherungsnehmers zur¨ uckgreift. Wir werden in diesem Fall die einfacher zu zeigenden Beweise angeben. Satz 2.5 F¨ ur Nutzenfunktionen sind folgende drei Aussagen ¨ aquivalent (i) die absolute Risikoaversion ist konstant, (ii) die Nutzenfunktion ist u(x) = −e−ax , (iii) die Risikopr¨ amie ist unabh¨ angig vom Verm¨ ogen. Beweis: Wir zeigen: (i) =⇒ (ii), (ii) =⇒ (iii) sowie (iii) =⇒ (i). Damit ist der Satz dann bewiesen. Wir zeigen zuerst, dass aus der Aussage (i) die Aussage (ii) folgt. Die Risikoaversion war konstant, und die Konstante setzen wir gleich einer Variablen a −
u00 (t) = const. = a u0 (t)
=⇒ =⇒
−
d(ln(u0 (t)) =a dt
Regeln Differentialr.
ln(u0 (t)) − ln(u0 (0)) =
Z
t
−adt = −at
integrieren
0
=⇒
ln(u0 (t)) = −at + ln(u0 (0)) | {z }
vereinfachen
=c
=⇒
0
c−at
u (t) = e
Exponentialfunktion Z
=⇒
u(x) − u(0) = 0
x
1 ec−at dt = − ec−ax − ec a
integrieren.
Nun k¨onnen wir zur Nutzenfunktion ohne Einschr¨ankung u(0) addieren, sie mit der Zahl ae−c multiplizieren und ebenso die Zahl 1 addieren: das Ergebnis ist weiterhin eine repr¨asentierende Nutzenfunktion des Investors. Wir erhalten −e−ax und das war zu zeigen. Im n¨achsten Schritt zeigen wir, wie aus der Teilaussage (ii) die Aussage (iii) folgt. Dazu nutzen wir die Definition der Risikopr¨ amie sowie die funktionale Form der Nutzenfunktion aus. Es gilt f¨ ur den Erwartungswert E [u(w · 1 + X)] = u(w + E [X] − π) S X
qs u(w + Xs ) = u(w + E [X] − π)
Definition π Berechnung Erwartungswert
s=1 S X
qs e−a(w+Xs ) = e−a(w+E [X]−π)
Form der Nutzenfunktion
s=1 −aw
e
S X
qs e−aXs = e−aw · e−a(E [X]−π)
Ausklammern
s=1 S X
qs e−aXs = e−a(E [X]−π)
s=1
c L¨offler/Laitenberger 2003
k¨ urzen
2.1 Erwartungsnutzentheorie
S. 27
und die letzte Gleichung besagt nichts anderes als das die H¨ohe der Risikopr¨amie ohne Kenntnis des Verm¨ogens berechnet werden kann. Zuletzt wollten wir beweisen9 , dass aus (iii) die Aussage (i) folgt. Wenn Aussage (iii) gilt, dann insbesondere auch f¨ ur kleine Risiken X mit E [X] = 0. Dann gilt aber mit (2.4): 00 1 u (w) π ≈ Var [X] · − 0 . 2 u (w) Dies ist aber offensichtlich nur dann unabh¨angig vom Verm¨ogen w, wenn zu zeigen und damit sind wir am Ende des Beweises angelangt.
u00 (w) u0 (w)
konstant ist. Das war
Beispiel 2.1 (Nachfrage nach Versicherungen) Eine Hausbesitzerin besitze ein Haus im Wert von H. Daneben verf¨ uge sie u ¨ber ein Barverm¨ogen von W . Mit der Wahrscheinlichkeit q wird das Haus komplett abbrennen. Der Hausbesitzerin steht die M¨oglichkeit offen, sich zu versichern. Um eine Versicherung, die im Falle eines Feuers eine Entsch¨adigung E zahlt, abzuschließen, muss eine Versicherungspr¨ amie in H¨ohe von πE gezahlt werden.10 π ist die Pr¨amie je Einheit der Versicherungssumme. Wie hoch sollte sich die Hausbesitzerin versichern? Das Nutzenmaximierungsproblem hat folgende Form: max qu(W − H − πE + E) + (1 − q)u(W − πE). E
Die Bedingung erster Ordnung lautet: qu0 (W − H + (1 − π)E ∗ )(1 − π) − (1 − q)u0 (W − πE ∗ )π = 0 bzw. u0 (W − H + (1 − π)E ∗ ) 1−q π = . u0 (W − πE ∗ ) q 1−π Im Falle eines Feuers macht die Versicherung einen Verlust in H¨ohe von πE − E. Wenn kein Feuer eintritt, macht sie einen Gewinn von πE. Der Erwartete Gewinn der Versicherung ist (1 − q)πE − q(1 − π)E. Bei einem harten Wettbewerb im Versicherungsmarkt wird die Versicherung einen Profit von Null machen, das heißt (1 − q)πE − q(1 − π)E = 0 woraus folgt: π = q. Eine derartige Versicherungspr¨amie wird als aktuarisch faire Pr¨amie bezeichnet: die Kosten einer Versicherungspr¨amie entsprechen gerade dem erwarteten Schaden. Wenn wir die faire Pr¨amie in das Entscheidungsproblem der Hausbesitzerin einf¨ ugen, erhalten wir u0 (W − H + (1 − π)E ∗ ) = u0 (W − πE ∗ ). 9
Da wir den Beweis mit einer Approximation f¨ uhren, ist dies nat¨ urlich kein mathematisch sauberer Beweis, aber uns gen¨ ugt die Intuition, die dahinter steckt. 10 Achtung: dies ist eine andere Pr¨ amie als die Risikopr¨ amie, die wir in 2.3 kennen gelernt haben.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 28
Wenn die Hausbesitzerin risikoavers ist, dann ist u00 < 0 und u0 eine fallende Funktion. Obige Gleichung kann dann nur erf¨ ullt sein, wenn W − H + (1 − π)E ∗ = W − πE ∗ bzw. wenn E ∗ = H. Wenn die Hausbesitzerin risikoavers ist, wird sie sich bei aktuarisch fairen Versicherungspr¨amien immer vollst¨andig versichern! Beispiel 2.2 (Wertpapierrenditen) Eine wichtige (wahrscheinlich die wichtigste) Anwendung der Entscheidungstheorie unter Unsicherheit betrifft die Erkl¨arung von Wertpapierpreisen oder -renditen an den Kapitalm¨ arkten. Wertpapiere sind rein formal Vertr¨age zwischen einem K¨aufer, der heute einen Preis zahlt, und einem Verk¨aufer, der sich verpflichtet zu einem (oder mehreren) sp¨ateren Zeitpunkt(en) Zahlungen an den K¨aufer zu leisten. Die bekanntesten Sorten von Wertpapieren sind Aktien, die den Inhabern (den K¨aufern) zuk¨ unftige Dividenden versprechen, und Anleihen, die den Inhabern zuk¨ unftige Zinszahlungen versprechen. Die Zahlungen aus Wertpapieren sind typischerweise unsicher. Dividenden richten sich nach den Gewinnen der Unternehmen, die in einer unsicheren Welt unsicher sind, und auch die Zinszahlungen aus Anleihen sind in der Regel unsicher, wenn der Schuldner (der Verk¨aufer der Anleihe) ausfallgef¨ahrdet ist. Wenn man die Wertpapiere nicht mit dem Ziel erwirbt, sie f¨ ur alle Zeiten zu behalten, sondern plant, sie zu einem sp¨ateren Zeitpunkt wieder zu verkaufen (was typischerweise der Fall sein d¨ urfte), kommt bei beiden genannten Gattungen die Unsicherheit u unftig erzielbaren Verkaufspreis dazu. ¨ber den zuk¨ Wir wollen nun untersuchen, wie die Konzepte des Erwartungsnutzens und der Risikoaversion sich auf die Nachfrage nach Wertpapieren auswirken. Betrachten Sie einen Investor, der sein gesamtes Verm¨ogen W am Kapitalmarkt anlegen m¨ochte. Der Investor kann in ein risikoloses Wertpapier investieren, das eine sichere Rendite von r0 bietet, und in n verschiedene unsichere Wertpapiere, deren Renditen der Investor jeweils mit der Zufallsvariablen ri , i = 1, . . . , n einsch¨atzt. Das heißt, beim Kauf des Wertpapiers i erh¨alt der Investor f¨ ur jeden eingesetzten Geldbetrag y eine sp¨atere unsichere R¨ uckzahlung in Form einer Lotterie mit den Gewinnen y(1 + ri ). Wir bezeichnen den Anteil seines Verm¨ogens, den der Investor in das Wertpapier i investiert, mit xi . Das zuk¨ unftige Verm¨ogen des Investors ergibt sich also zu n X X = W( xi (1 + ri )), i=0
Pn
wobei i=0 xi = 1, wenn der Investor sein gesamtes Verm¨ogen einsetzt (wovon wir ausgehen). Diese Gleichung stellen wir um: X = W (x0 (1 + r0 ) +
n X
xi (1 + ri ))
i=1
= W ((1 −
n X
xi )(1 + r0 ) +
xi (1 + ri ))
1=1
i=1
= W ((1 + r0 ) +
n X
n X
xi (ri − r0 )).
1=1
Damit haben die Entscheidungsvariable x0 aus unserem Investitionsproblem eliminiert. x0 ergibt sich mit Hilfe der Budgetidentit¨at automatisch, sobald wir die anderen xi ausgew¨ahlt
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 29
haben. Das Maximierungsproblem des Investors schreibt sich nun wie folgt: max E [u(W ((1 + r0 ) +
x1 ,...,xn
n X
xi (ri − r0 )))],
1=1
wobei u die Erwartungsnutzenfunktion des Investors sei. Wir gehen davon aus, dass u zweimal differenzierbar ist und der Investor risikoavers, also u0 > 0 und u00 < 0. Ableitung nach den Entscheidungsvariablen x1 , . . . , xn ergibt n Bedingungen erster Ordnung: E [u0 (X ∗ )(ri − r0 )] = 0,
(2.6)
wobei X ∗ das optimierte zuk¨ unftige Verm¨ogen des Investors bezeichnet. Die Bedingungen zweiter Ordnung lauten E [u00 (X ∗ )(ri − r0 )2 ] < 0. Sie sind immer erf¨ ullt, da (ri − r0 )2 ≥ 0 und u00 < 0 ist. Die Bedingungen erster Ordnung (2.6) lauten umgeformt E [u0 (X ∗ )ri ] = r0 E [u0 (X ∗ )].
(2.7)
Wir benutzen nun eine n¨ utzliche Gleichung aus der Wahrcheinlichkeitstheorie. Es gilt n¨amlich f¨ ur beliebige Zufallsvariablen Y und Z: Cov [Y, Z] = E [Y Z] − E [Y ]E [Z]. Damit schreibt sich (2.7): E [u0 (X ∗ )ri ] = Cov [u0 (X ∗ ), ri ] + E [u0 (X ∗ )]E [ri ] = r0 E [u0 (X ∗ )], oder E [ri ] = r0 −
1 Cov [u0 (X ∗ ), ri ]. E [u0 (X ∗ )]
(2.8)
Das heißt, die erwartete Rendite eines beliebigen Wertpapiers ergibt sich als Summe aus der Rendite des risikolosen Wertpapiers und einer Risikopr¨amie, die von der Kovarianz der Wertpapierrendite mit dem marginalen Nutzen aus dem zuk¨ unftigen Konsum abh¨angt. Da u0 eine 00 fallende Funktion ist (u ist immer negativ), ist der marginale Nutzen bei hohen Realisationen des zuk¨ unftigen Verm¨ogens X niedriger als bei niedrigem Verm¨ogen. Wertpapierrenditen, die positiv mit dem zuk¨ unftigen Verm¨ogen korreliert sind (Cov [X ∗ , ri ] > 0), sind tendenziell negativ mit dem marginalen Nutzen daraus korreliert (Cov [u0 (X ∗ ), ri ] < 0) und haben daher eine h¨ohere erwartete Rendite als das risikolose Wertpapier.11 Bei diesen Wertpapieren werden Sie daf¨ ur kompensiert, dass Sie Risiko u ¨bernehmen. Umgekehrt, wenn ri und X ∗ negativ korreliert sind, dann wird die Wertpapierrendite niedriger sein als die Rendite des risikolosen Wertpapiers. Dies sind Wertpapiere, mit denen Sie sich gegen k¨ unftige Konsumunsicherheiten absichern und die also den Charakter einer Versicherung aufweisen. 11
Das gilt leider nicht immer. Man kann Beispiele konstruieren, bei denen diese Beziehung nicht gilt. Man muss eine etwas strengere Annahme treffen als Cov [X ∗ , ri ] > 0, die in der Fachwelt als ’positive (negative) Abh¨ angigkeit’ bezeichnet wird (Magill & Nermuth (1986)). In der Regel sind positive (negative) Abh¨ angigkeit und positive (negative) Korrelation ¨ aquivalent.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 30
2.1.5 Ein einfaches Portfolioproblem Wir untersuchen eine besonders einfache Entscheidungssituation: es gebe nur ein risikoloses und ein riskantes Wertpapier. Dann kann man in Abh¨ angigkeit der Risikoaversion beschreiben, wie sich die Zusammenstellung des optimalen Portfolios ¨ andert, wenn der Investor verm¨ ogender wird. Im vergangenen Abschnitt haben wir gelernt, dass man Nutzenfunktionen anhand von Risikopr¨amien unterscheiden kann. F¨ ur diese Risikopr¨amien konnten wir, falls die Risiken selbst klein sind, eine Absch¨atzung angeben. Man bezeichnet diese Art der Herangehensweise auch als ”lokale Theorie”, weil wir nur kleine Risiken in der N¨ahe von null untersucht haben. Es ist auch m¨oglich, eine ”globale Theorie” des Risikos zu entwickeln, und das soll in diesem Abschnitt geschehen. Wir wollen das bisher gelernte auf ein einfaches Investitionsproblem anwenden, bei dem es nur zwei Wertpapiere gibt: der risikolose Titel 1 mit Preis p(1) und ein riskanter Titel X mit positivem Preis p(X) > 0 und Var [X] > 0. Dem Investor stehe heute der Geldbetrag w zur Verf¨ ugung, mit dem er handeln kann. Damit l¨ost er das folgende Problem: max
E [u(m1 + nX)].
(2.9)
m·p(1)+n·p(X)≤w
Der Einfachheit halber wollen wir annehmen, dass p(1) = p(X) = 1 ist. Außerdem nehmen wir an, dass der Investor sein gesamtes Verm¨ogen w investiert. Heutige Konsumentscheidungen spielen also bei der Investitionentscheidung keine Rolle. Weiterhin wollen wir nur unsichere Wertpapiere X in Betracht ziehen, die eine h¨ohere erwartete Rendite als das sichere Wertpapier haben, bei denen also E [X] > 1 ist. W¨are E [X] < 1, dann k¨onnten wir n¨amlich mit Y = 21 − X ein neues Wertpapier schaffen, das auch einen Preis von eins hat, und bei dem E [Y ] = 2 ∗ 1 − E [X] > 1 ist. Der Fall E [X] = 1 ist nicht besonders spannend, da in diesem Fall die Nachfrage nach X immer gleich Null w¨are. Es gilt nun folgender Satz, der auf Arrow und Pratt zur¨ uckgeht.12 Satz 2.6 Das optimale Portfolio aus (2.9) beim Einkommen w enthalte m? risikolose Titel und n? riskante Titel. Dann hat der Entscheidungstr¨ ager fallende (wachsende, konstante) ? absolute Risikoaversion genau dann, wenn n eine wachsende (fallende, konstante) Funktion in w ist. Beweis: Wir zeigen nur, dass aus fallender Risikoaversion ein steigendes n? folgt. Das ist der lebensn¨achste Fall und die Beweise f¨ ur die anderen beiden F¨alle funktionieren genauso. Wenn der Investor sein Budget aussch¨ opft, dann ist m + n = w. Setzen wir dies in das Maximierungsproblem des Investors ein, so lautet dieses: max E [u(w − n + nX)]. n
Die Bedingungen erster und zweiter Ordnung dieses Problems lauten E [u0 (w + n? (X − 1))(X − 1)] = 0 bzw. E [u00 (w + n? (X − 1))(X − 1)2 ] < 0. 12
Siehe Pratt (1964).
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 31
Aufgrund der Risikoaversion des Investors ist u00 < 0 und also ist die Bedingung zweiter Ordnung immer erf¨ ullt. Kann das optimale n? negativ sein?13 Bei einem negativen n ergibt sich ein zuk¨ unftiges Verm¨ogen W = w + n(X − 1) = mit E [W ] = w + n(E [X] − 1) < w, da E [X] > 1 vorausgesetzt wurde, und Var [W ] = n2 Var [X] > 0. Nach der Definition von Risikoaversion zieht der Investor dem Verm¨ogen W die sichere Zahlung E [W ] vor. Da der Investor außerdem unges¨attigt ist, zieht er auch der sicheren Zahlung E [W ] die h¨ ohere sichere Zahlung w vor. Dies kann er aber erreichen, wenn er einfach gar nichts in das riskante Wertpapier investiert. Damit ist klar, dass n? ≥ 0. An der Stelle n = 0 ist E [u0 (w)(X − 1)] = u0 (w)(E [X] − 1) und dies ist mit E [X] > 1 immer positiv, da u0 (w) > 0. Damit kann das optimale n? auch nicht gleich Null sein. Damit bleibt also nur n? > 0 u ¨brig. Sei nun n? (w) der optimale Portfolioanteil im unsicheren Wertpapier in Abh¨angigkeit vom Verm¨ogen w. Aufgrund der Bedingungen erster Ordnung gilt: E [u0 (w + n? (w)(X − 1))(X − 1)] ≡ 0. Wird auf beiden Seiten nach w abgeleitet, erh¨alt man: E [u00 (w + n? (w)(X − 1))(X − 1)(1 +
dn? (w) (X − 1))] ≡ 0 dw
bzw. E [u00 (w + n? (w)(X − 1))(X − 1)] dn? (w) =− . dw E [u00 (w + n? (w)(X − 1))(X − 1)2 ]
(2.10)
Wieder ist aufgrund der Risikoaversion von u der Nenner immer negativ. Entscheidend f¨ ur das Vorzeichen des Bruches ist also der Z¨ahler. Es sei daran erinnert, dass dieser ein Erwartungswert ist, der sich auch wie folgt schreibt: E [u00 (w + n? (w)(X − 1))(X − 1)] =
S X
qs u00 (w + n? (w)(Xs − 1))(Xs − 1).
s=1
Um das Vorzeichen des Z¨ ahlers zu ermitteln, sollte man also versuchen etwas u ¨ber den Wert jedes einzelnen Summanden dieser Summe herauszufinden. Da die qs alle nichtnegativ sind, wollen wir versuchen, etwas u ¨ber jeden der Werte u00 (w+n? (w)(Xs −1))(Xs −1) herauszufinden. Zuerst betrachten wir diejenigen Xs mit Xs ≥ 1. Da wir fallende Risikoaversion vorausgesetzt haben, gilt also f¨ ur Xs ≥ 1: −
u00 (w + n? (Xs − 1)) u00 (w) ≤− 0 , 0 ? u (w + n (Xs − 1)) u (w)
oder umgestellt u00 (w + n? (Xs − 1)) ≥
u00 (w) 0 u (w + n? (Xs − 1)). u0 (w)
Da Xs ≥ 1 gilt schließlich auch u00 (w + n? (Xs − 1))(Xs − 1) ≥ 13
u00 (w) 0 u (w + n? (Xs − 1))(Xs − 1). u0 (w)
(2.11)
Das w¨ urde also einem so genannten Leerverkauf des riskanten Wertpapiers entsprechen, bei dem man ein Wertpapier, das man gar nicht besitzt, verkauft. Man verpflichtet sich dabei, alle Zahlungen des Wertpapiers (Zinsen oder Dividenden) dem K¨ aufer zu leisten. Leerverk¨ aufe sind f¨ ur institutionelle H¨ andler nichts ungew¨ ohnliches, Hedge Funds verdienen einen Großteil ihres Geldes damit.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 32
Nun betrachten wir diejenigen Xs mit Xs < 1. Nun gilt wegen der fallenden Risikoaversion umgekehrt −
u00 (w + n? (Xs − 1)) u00 (w) >− 0 , 0 ? u (w + n (Xs − 1)) u (w)
bzw. u00 (w + n? (Xs − 1)) <
u00 (w) 0 u (w + n? (Xs − 1)). u0 (w)
ur alle Xs gilt, gilt Und da Xs < 1 folgt Gleichung (2.11) auch in diesem Fall. Da Gleichung (2.11) f¨ sie auch f¨ ur den Erwartungswert: E [u00 (w + n? (X − 1))(X − 1)] ≥
u00 (w) E [u0 (w + n? (X − 1))(X − 1)]. u0 (w)
Da aber E [u0 (w + n? (X − 1))(X − 1)] = 0 (dies ist die Bedingung erster Ordnung) folgt E [u00 (w + n? (X − 1))(X − 1)] ≥ 0. Damit haben wir aber gezeigt, dass der Z¨ahler in (2.10) nichtnegativ ist und damit folgt, dass dn? (w) ≥ 0. dw
Arrow hat aus diesem Satz den durchaus plausiblen Schluss gezogen, dass f¨ ur Nutzenfunktionen nur der Fall der fallenden absoluten Risikoaversion plausibel sein kann. Wir sind dieser Forderung bereits in der lokalen Theorie begegnet und finden daher unsere dort getroffene Einsch¨atzung wiederum best¨atigt. Aber wir m¨ ussen die auch in der lokalen Theorie aufgeworfene Frage hervorheben: die Tatsache, dass die absolute Risikoaversion f¨allt, schr¨ankt die Menge der m¨oglichen Nutzenfunktionen nicht wesentlich ein. Wie k¨onnen wir also eine hinreichend plausible Nutzenfunktion ausw¨ahlen? Wir wenden uns einer Definition zu, die ebenfalls auf Arrow und Pratt zur¨ uckgeht und sich als hilfreich erweisen wird. Definition 2.5 F¨ ur eine Nutzenfunktion u(t) wird der Term −t
u00 (t) u0 (t)
als die relative Risikoaversion der Nutzenfunktion bezeichnet. Insbesondere sprechen wir davon, die Nutzenfunktion habe fallende (konstante, wachsende) relative Risikoaversion genau dann, wenn dieser Term f¨ allt (konstant bleibt, w¨ achst). Bevor wir mit dem entscheidenden Resultat dieses Abschnittes fortfahren, wollen wir versuchen, die relative Risikoaversion einer Nutzenfunktion inhaltlich zu interpretieren. Wir stellen die Definition etwas um und erhalten den folgenden Ausdruck u00 (t) =− −t 0 u (t)
du0 (t) u0 (t) dt t
.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 33
Bei dem Term auf der rechten Seite handelt es sich um die aus der Literatur bekannte Vorgehensweise, eine Elastizit¨at der Gr¨oße u0 (t), also dem Grenznutzen, zu ermitteln. Die relative Risikoaversion einer Nutzenfunktion ist damit interpretierbar als die Elastizit¨at des Grenznutzens. Wir kehren nun zur¨ uck zum einfachen Portfolioproblem und es gilt folgender Satz.14 Satz 2.7 Das optimale Portfolio aus (2.9) beim Einkommen w enthalte m? risikolose Titel und n? riskante Titel. Dann hat der Entscheidungstr¨ ager fallende (wachsende, konstante) n? relative Risikoaversion genau dann, wenn w eine wachsende (fallende, konstante) Funktion in w ist. Worin unterscheiden sich die Aussagen der S¨atze 2.6 sowie 2.7? Es handelt sich nur um ein unscheinbares Detail: w¨ahrend bei der fallenden absoluten Risikoaversion n? im Einkommen ? w¨achst, ist es bei der fallenden relativen Risikoaversion der Ausdruck nw . Inhaltlich l¨asst sich dieser Unterschied wie folgt beschreiben. Hat ein reicher werdender Investor eine fallende absolute Risikoaversion, so wird die Menge des riskanten Titels, die er h¨alt, wachsen. Hat ein reicher werdender Investor dagegen fallende relative Risikoaversion, so wird der Anteil des riskanten Titels am optimalen Gesamtportfolio wachsen. Und in der Tat: dieser Anteil ermittelt sich ja aus dem Quotienten n? p(X) n? = p(X) . w w | {z } >0
Man kann leicht zeigen, dass die Aussage, die relative Risikoaversion (RRA) sei fallend, wesentlich st¨arker ist als die Behauptung, die absolute Risikoaversion (ARA) falle. Wir wollen ¨ die bisherigen Erkenntnisse in einer tabellarischen Ubersicht zusammenfassen:
ARA f¨allt RRA f¨allt
Menge riskanter Titel w¨achst mit Verm¨ogen w¨achst mit Verm¨ogen
Anteil riskanter Titel nicht eindeutig w¨achst mit Verm¨ogen
Analog zum Satz 2.5 k¨onnen wir die Funktionen mit konstanter relativer Risikoaversion genauer charakterisieren. Satz 2.8 Folgende Aussagen sind ¨ aquivalent: (i) die Nutzenfunktion weist konstante relative Risikoaversion auf, α
(ii) die Nutzenfunktionen hat die funktionale Form ln(x), x α−1 f¨ ur α ∈ (−∞, 1) \ {0}, (iii) Beim einfachen Portfolioproblem bleibt der Anteil am riskanten Titel im optimalen Portfolio konstant. ¨ Beweis: Wir wollen nur die Aquivalenz der ersten beiden Behauptungen beweisen, auf den Beweis der Bedingung (iii) verzichten wir.
14
Siehe Pratt (1964).
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 34
Die relative Risikoaversion war konstant, und die Konstante setzen wir gleich einer Variablen a −t
u00 (t) = const. = a u0 (t)
=⇒
d(ln(u0 (t)) a =− dt t
=⇒
ln(u0 (t)) − ln(u0 (1)) =
=⇒
Regeln Differentialr. Z
t
a − dt = −a ln(t) t 1 0 0 ln(u (t)) = −a ln(t) + ln(u (1)) | {z }
integrieren vereinfachen
=ln(c)
=⇒
0
c−a ln(t)
u (t) = e
= ct
Z =⇒
−a
u(x) − u(1) = 1
Exponentialfunktion (
x
ct−a dt =
c 1−a 1−a (x
c ln(x)
− 1) a 6= 1 a=1
Analog dem anderen Beweisweg (kardinale Nutzentheorie!) erhalten wir wieder die Nutzenfunktionen t1−a oder ln(x) und das war zu zeigen. Jetzt wollen wir beweisen, dass aus (ii) die Aussage (i) folgt. Dies ist nun einfache Differentialrechnung. Wir beschr¨ anken uns auf den Fall ln(x) u(x) = ln(x) 1 u0 (x) = − x 1 u00 (x) = 2 x u00 (x) −x 0 =1 u (x) und damit sind wir am Ende angelangt.
Arrow hat in einer 1971 erschienen Arbeit behauptet, es sei durchaus plausibel anzunehmen, die Nutzenfunktion von Individuen weise wachsende relative Risikoaversion auf. Diese Behauptung kann heute als widerlegt gelten. In der Literatur wurde dabei das Portfolio– Verhalten von Individuen untersucht und es die Ergebnisse weisen auf eine fallende relative Risikoaversion hin.15 Meistens macht man aber mit einer Nutzenfunktion mit konstanter relativer Risikoaversion keinen großen Fehler, weshalb diese Funktionen in der Literatur sehr ¨ beliebt sind. Ublicherweise arbeitet man mit der etwas anderen parametrische Darstellung u(x, 1 − α) =
x1−α , 1−α
α > 0,
α 6= 1,
und es finden sich Belege f¨ ur ein α der Gr¨oßenordnung zwischen 1 und 2.16 15
Zum Beispiel weisen Kessler & Wolff (1991) nach, dass US–Haushalte mit niedrigem Einkommen einen unproportional hohen Anteil an festverzinslichen Wertpapieren halten. Guiso, Jappelli & Terlizzese (1996) untersuchen die Zusammensetzung von Portfolios von italienischen Haushalten und stellen fallende relative Risikoaversion fest. Ogaki & Zhang (1999) weisen fallende relative Risikoaversion anhand des Konsumverhaltens in Entwicklungsl¨ andern nach. 16 Friend & Blume (1975) finden einen Koeffizienten α = 2, Kydland & Prescott (1982) untersuchten aggregierte Fluktuationen von Konsum und Investition, die vorliegenden Daten verwiesen auf einen Parameter α zwischen 1 und 2. Hildreth & Knowles (1982) analysierten das Verhalten von Bauern und erhielten einen Parameter zwischen 1 und 2. Tobin & Dolde (1971) studierten das Sparverhalten in Lebenszyklus–Modellen mit Kreditrestriktionen, sie kamen auf einen Wert von 1,5. Neuere Arbeiten (Dalal & Arshanapalli (1993)) haben diese Ergebnisse prinzipiell best¨ atigt.
c L¨offler/Laitenberger 2003
integrieren.
2.1 Erwartungsnutzentheorie
S. 35
Wir sind damit an unserem Ausgangspunkt angelangt. Wir haben anhand des Petersburger Spiels erkannt, dass nicht der Erwartungswert, sondern der Erwartungsnutzen den fairen Preis einer unsicheren Auszahlung bestimmt. Die Nutzenfunktionen haben wir sehr weit einschr¨anken k¨onnen: sie mussten konkav sein (wegen der Risikoaversion), weiter fallende absolute Risikoaversion aufweisen (damit die Risikopr¨amie im Verm¨ogen sinkt) und eine konstante relative Risikoaversion aufweisen (damit der Anteil der riskanten Titel im optimalen Portfolio konstant bleibt). Dann aber muss die verwendete Nutzenfunktion entweder der Logarithmus oder eine Wurzelfunktion sein.
2.1.6 Stochastische Dominanz Wir werden in diesem Abschnitt zeigen, wie man Aussagen u ¨ber Vorteilhaftigkeit verschiedener Portfolios treffen kann, wenn man die Erwartungsnutzenfunktion nicht kennt. Wir haben in den letzten Abschnitten erkannt, wie man anhand von Eigenschaften der Nutzenfunktionen eines Investors Aussagen u ¨ber sein optimales Portfolio treffen kann. Wenn ein Investor risikoavers ist, so wird er beispielsweise eine risikolose Investition einer riskanten Investition mit gleichem Erwartungswert vorziehen. Ebenso wissen wir, dass die H¨ohe der Risikopr¨amie von dem Koeffizienten der absoluten Risikoaversion abh¨angig ist. Wir haben auch erkannt, dass sich die absolute Risikoaversion eignet, um eine komparative Statik des optimalen Portfolios beschreiben zu k¨onnen. In allen F¨allen sind wir in fast selbstverst¨andlicher Weise davon ausgegangen, dass wir hinreichend genaue Kenntnisse u ¨ber die Nutzenfunktion des Investors besitzen. Genau diese Selbstverst¨andlichkeit wollen wir in diesem Abschnitt aufgeben. Sind wir in der Lage, einen Investor bei der Auswahl optimaler Portfolios auch dann zu beraten, wenn wir nicht wissen, wie seine Nutzenfunktion gestaltet ist? K¨onnen wir ohne Kenntnis der Risikoaversion sagen, jeder Investor werde ein Portfolio einem anderen vorziehen? Die Antwort auf diese Frage bietet die Theorie der stochastischen Dominanz. Wir werden nun dem Rahmen des Grundmodells nicht mehr in voller Strenge folgen. Die Theorie der stochastischen Dominanz wird u ¨blicherweise in Modellen dargestellt, in denen der Zustandsraum nicht endlich ist. Vielmehr betrachtet man die Verteilungsfunktionen der Portfolios. Zwar w¨are es m¨oglich, alle Resultate auf unser Modell umzurechnen, wir wollen jedoch der besseren Vergleichbarkeit wegen darauf in der Vorlesung verzichten. Wir gehen also im folgenden davon aus, dass wir zu Portfolios X und Y die jeweiligen Verteilungsfunktionen FX (t) und FY (t) kennen. Wenn wir unser Grundmodell zugrunde legen w¨ urden, dann w¨aren die Verteilungsfunktionen einfach Treppenfunktionen, die sich schrittweise der 1 n¨ahern. Ein Portfolio der Form 1 X = 1.5 3 bei jeweils gleichverteilten Zust¨anden h¨atte beispielsweise eine Verteilungsfunktion, wie in Abbildung 2.1) dargestellt. Die Theorie der stochastischen Dominanz ist sehr weit ausgebaut. Wir werden uns in diesem ¨ Rahmen nur auf die Dominanz erster und zweiter Ordnung beschr¨anken. Ublicherweise sollte nun eine Definition beide Begriffe erfolgen. Weil aber die stochastische Dominanz nicht in allen F¨allen leicht zu motivieren ist, wollen wir ausnahmsweise einmal mit dem Ergebnis, das wir
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 36
6
1 FX (t) 0.66 0.33
...................................... ... .. ... ... ... .. ................................................................................................................................................................... .... ... ... ... ... .. ........................................................ .... ... ... ... ... .. .............................................................................................................
0
1
1.5
-
3 t
Abbildung 2.1: Verteilungsfunktion im Grundmodell
erzielen wollen, beginnen. Uns interessieren Aussagen der folgenden Form: Wir wollen wissen, unter welchen Annahmen jeder Investor, der nur monotone Pr¨aferenzen habe, ein Portfolio X immer einem Portfolio Y vorziehen wird. Wenn beispielsweise X und Y risikolose Portfolios sind, und wenn weitergehend X eine h¨ohere Auszahlung als Y aufweist, dann wird jeder Investor mit monotonen Pr¨aferenzen sinnvollerweise X dem Portfolio Y vorziehen. Wenn aber sowohl X als auch Y nicht mehr sichere Zahlungen aufweisen, dann liegen die Dinge keinesfalls so einfach. Betrachten wir dazu folgenden Fall. Wenn in jedem Zustand die Auszahlung von X h¨oher als die Auszahlung von Y ist, dann wird jeder Investor mit monotonen Pr¨aferenzen X dem Portfolio Y vorziehen. Die Theorie der stochastischen Dominanz X F SD Y schw¨acht nun diese Bedingung dahingehend ab, dass nicht mehr in jedem Zustand eine h¨ohere Auszahlung vorliegen muss. Vielmehr muss nur noch die h¨ohere Auszahlung immer mit h¨oherer Wahrscheinlichkeit erfolgen. Um zu zeigen, dass hier tats¨achlich ein allgemeinerer Zugang vorliegt, betrachten wir ein einfaches Beispiel mit zwei Zust¨anden und den Portfolios 3 1 , q1 = 90%, q2 = 10%. , Y = X= 1 2 Das Portfolio X weist im ersten Zustand eine h¨ohere Zahlung als Y auf, nicht aber im zweiten Zustand. Dennoch gilt, dass das Portfolio X h¨ohere Zahlungen mit h¨oherer Wahrscheinlichkeit leisten wird: eine Geldeinheit wird jetzt nur mit 10% Wahrscheinlichkeit gezahlt, beim Portfolio Y waren es noch 90%. Satz 2.9 Seien zwei Portfolios X und Y gegeben. Jeder Investor mit beliebiger, aber monotoner Nutzenfunktion u, zieht X der Lotterie Y genau dann vor E [u(X)] ≥ E [u(Y )], wenn f¨ ur die Verteilungsfunktionen FX und FY die Ungleichung ∀t
FX (t) ≤ FY (t)
erf¨ ullt ist.
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
S. 37
Wir sagen in einem solchen Fall X dominiert das Portfolio Y im Sinne der stochastischen Dominanz erster Ordnung (“first order stochastic dominance”, auch FSD abgek¨ urzt) und schreiben daf¨ ur symbolisch X F SD Y . Wenden wir uns nun der Theorie der stochastischen Dominanz zweiter Ordnung (“second order stochastic dominance”, SSD) zu. Bei der FSD war es notwendig, dass eine Verteilungsfunktion immer unterhalb einer anderen Verteilungsfunktion verlief, um eine Entscheidung zu treffen. Es wird nun aber eine Vielzahl von F¨allen geben, bei der die Verteilungsfunktionen einander schneiden. Nach dem Kriterium der stochastischen Dominanz erster Ordnung ist dann aber keine Entscheidung mehr m¨oglich. Allerdings haben wir bei dem Kriterium nur Investoren betrachtet, bei denen wir wussten, dass sie monotone Nutzenfunktionen besitzen. In der Entscheidungstheorie haben wir jedoch erkannt, dass typischerweise Investoren nicht monoton, sondern auch risikoavers sind. Die dazugeh¨origen Erwartungsnutzenfunktionen m¨ ussen dann konkav sein. Wenn wir nun diese zus¨atzliche Information ber¨ ucksichtigen, gelingt dann eine Entscheidung auch bei sich schneidenden Verteilungsfunktionen? Satz 2.10 Seien zwei Lotterien X und Y gegeben. Jeder Investor mit beliebiger, aber monotoner und konkaver Nutzenfunktion u, zieht X der Lotterie Y genau dann vor E [u(X)] ≥ E [u(Y )], wenn f¨ ur die Verteilungsfunktionen FX und FY die Ungleichung Z s Z s ∀s FX (t)dt ≤ FY (t)dt −∞
−∞
erf¨ ullt ist. Wir sprechen in einem solchen Fall davon, dass X das Portfolio Y im Sinne der stochastischen Dominanz zweiter Ordnung (“second order stochastic dominance”, auch SSD abgek¨ urzt) dominiert und schreiben daf¨ ur symbolisch X SSD Y . An dieser Stelle w¨are nun eine Intuition f¨ ur die Dominanz zweiter Ordnung zu geben. Leider ist eine Intuition in diesem Fall nicht ganz offensichtlich. Um wenigstens einen Versuch einer Ann¨aherung zu wagen, betrachten wir die folgende Situation. Angenommen, es w¨are ein risikoloses Portfolio X mit einer Auszahlung von µ Geldeinheiten gegeben und ein weiteres Portfolio Y habe denselben Erwartungswert, sei aber unsicher. Eine Auszahlung gr¨oßer als 2µ sei bei Y aber nicht m¨oglich. Jeder risikoaverse Investor wird X dem Portfolio Y vorziehen. Daher erwarten wir, dass in diesem Fall auch eine stochastische Dominanz zweiter Ordnung vorliegt (im u ¨brigen schneiden sich die Verteilungsfunktionen, FSD ist also nicht gegeben!), und das werden wir jetzt zeigen. Betrachten wir die Verteilungsfunktionen von X und Y . Da X risikolos ist, macht die Verteilungsfunktion an der Stelle µ einen Sprung von 0 zu 1. Die Verteilungsfunktion von Y dagegen wird sich eher schrittweise der 1 ann¨ahern und sie erst bei 2µ erreichen, so wie in der Abbildung 2.2 angedeutet. Wir wollen R t nun in einer anderen Abbildung das Integral der Differenz der Verteilungsfunktionen 0 FY (s) − FX (s) ds in Abh¨angigkeit von t eintragen. Wir halten zun¨achst fest, dass f¨ ur t = 0 dieses Integral sinnvollerweise null ist. Man kann nun durch nicht umfangreiche ¨ Uberlegungen zeigen, dass f¨ ur t ≥ 2µ ebenfalls das Integral null wird, da die Fl¨achen unter
c L¨offler/Laitenberger 2003
2.1 Erwartungsnutzentheorie
1
S. 38
6
............................................................................................................................................................................................ ......... ... ........... ... ........ ....... .... ....... . . . . . ... . ... ....... .. ......... ... ............. ............. ... ........ . . . . .... . . ...... .. ...... ... ...... ...... ... ...... . . . . . .... ...... .. ...... ... .......... ............... . . . . ... . ....... .... ....... .. ....... ....... ... ....... . . . . . .. . . . . . . . .. ........ . . . . . . . . . . . . . . ................ ... ..................... ............................... ... ................. ... ............. ..........................................................................................................................................................................................
FX
F (t)
FY
0
t→
µ
-
2µ
Zahlung t Abbildung 2.2: Ein Versuch einer Intuition f¨ ur SSD
beiden Verteilungsfunktionen identischen Inhalt aufweisen.17 Entscheidend ist nun die folgen¨ de Uberlegung: wenn t links von dem Mittelwert µ liegt, R t dann ist offensichtlich die Differenz FY − FX = FY − 0 immer positiv und das Integral 0 FY (s) − FX (s) ds wird daher immer positiv sein. Ein m¨oglicher Funktionsverlauf ist in der Abbildung 2.3 durchgehend gezeichnet. Sobald t den Wert µ durchst¨oßt, wird die Differenz FY − FX = FY − 1 dagegen immer negativ. Das Integral kann also in diesem Bereich nur kleiner werden (monoton fallen). Jedoch wissen wir bereits, dass f¨ ur t = 2µ (nach Betrachtung aller m¨oglichen Auszahlungswerte) als gr¨oßtm¨oglicher Wert des Integrals die null erreicht wird. Demnach kann der Funktionsverlauf zwischen der durchgehenden Linie und dem Nullpunkt nur in der Weise verlaufen, wie er in der gestrichelten Linie dargestellt ist, und damit bleibt also das Integral immer nichtnegativ. In der Tat liegt hier stochastische Dominanz zweiter Ordnung vor. Die SSD ist h¨aufig schwer zu pr¨ ufen und daher formulieren wir drei einfachere Kriterien. Satz 2.11 (einfachere Kriterien fu ¨ r SSD) Wenn X dem Portfolio Y im Sinne der FSD vorgezogen wird (also X F SD Y ), dann auch im Sinne der SSD (also X SSD Y ). Angenommen, X und Y seien stetige nichtnegative Zufallsvariablen und die Verteilungsfunktionen FX und FY schneiden sich genau in einem Punkt (man spricht von der 17
Die Fl¨ ache unter einer Verteilungsfunktion 1 − FY auf einem endlichen Intervall ist gerade gleich dem Erwartungswert der Zufallsvariablen (dies beweist man durch partielle Integration) Z 2µ 1 − FY (t)dt = E [Y ] = E [X]. 0
Diese Gleichung gilt aber auch f¨ ur X und damit haben dann die Gesamtfl¨ achen unter FX und unter FY identischen Fl¨ acheninhalt, weil X und Y identischen Erwartungswert besaßen: Z 2µ Z 2µ Z 2µ FY − FX dt = 1 − FX dt − 1 − FY dt 0
0
= E [Y ] − E [X] = 0.
c L¨offler/Laitenberger 2003
0
2.1 Erwartungsnutzentheorie
S. 39
6
......... .... .... .... .... .... .... ..... .... ..... .... ..... . . . . .... ... . . . .... . ... . . .... . . ... . .... . . . ..... .... . . . . . . .... ..... . . . . . .... . ..... . . .... . . . . .... .... . . . . . . . . . .... . ....... . . . . . . ... ... . . . . ....... . .... . . . . . . . . . . . . .... .. .......... . . . . . . . . . . . . . . .. ... . ........ . . ... . . . . . . ... ..... . . . . . . ... . ..... . . ... . . . . . . ....... .......
Rt 0
FY − FX dt
t→
µ
-
2µ
Zahlung t Abbildung 2.3: Das Integral
Rt 0
FY − FX dt
“single–crossing property”). Des weiteren sei FX (t) ≤ FY (t) f¨ ur kleine t. Dann gilt X SSD Y genau dann, wenn E [X] ≥ E [Y ]. Angenommen, Y ergibt sich aus X und einem St¨ orterm, also einer weiteren Lotterie , wobei der bedingte Erwartungswert von , gegeben dass man X bereits kennt, nicht positiv ist. Also Y =X +
mit
E [|X] ≤ 0.
Dann gilt: X SSD Y . ¨ Beweis: Die ersten beiden Behauptungen sind einfach und bleiben daher Ihnen als Ubungsaufgaben u ¨berlassen. Die dritte Behauptung ergibt sich durch Anwendung der Jensen’schen Ungleichung: E [u(Y )] = E [E [u(X + )|X]] ≤ E [u(X + E [|X])] ≤ E [u(X)].
Beispiel 2.3 (Der Nutzen von Portfoliodiversifikation) Sie haben sicherlich schon einmal den Rat bekommen, beim investieren nicht alles ’auf ein Pferd zu setzen’, sondern Ihre Investitionen auf verschiedene Wertpapiere zu streuen. Das hat viele gute intuitive Gr¨ unde. Wenn zwei Wertpapiere negativ miteinander korreliert sind, dann k¨onnen Sie einen Teil des Risikos des einen Wertpapiers durch den Kauf des anderen Wertpapiers eliminieren.18 Aber auch wenn Sie in unabh¨angige Wertpapiere investieren, senken Sie Ihr Risiko.19 Wir wollen nun untersuchen, wie das mit dem Konzept der stochastischen Dominanz zusammen h¨angt. Betrachten Sie zwei unabh¨angige und gleich verteilte Lotterien X und Y . Sie k¨onnen Ihr Verm¨ogen beliebig auf die beiden Lotterien aufteilen. Es bezeichne αx den Anteil des Verm¨ogens, den Sie 18
Dies folgt aus grundlegenster Wahrscheindlichkeitstheorie, da E [X + Y ] = E [X] + E [Y ], aber Var [X + Y ] = Var [X] + Var [Y ] + 2Cov [X, Y ]. 19 Das ist wieder elementare Wahrscheinlichkeitstheorie: wenn E [X] = E [Y ] und Var [X] = Var [Y ], dann ist E [ 21 X + 12 Y ] = 12 E [X] + 12 E [Y ]=E [X] aber Var [ 21 X + 12 Y ] = 41 Var [X] + 41 Var [Y ] = 12 Var [X].
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 40
auf X setzen, und αy den Anteil, den Sie auf Y setzen. Da Sie nicht mehr einsetzen k¨onnen, als was Sie besitzen, ist αx + αy = 1. Wir zeigen nun, dass die Gleichverteilung Ihres Verm¨ogens, (αx , αy ) = ( 12 , 21 ) alle anderen Verteilungen im Sinne der stochastischen Dominanz zweiter Ordnung dominiert. Beweis: Wir bezeichnen die perfekte Diversifikation mit A, also A = 12 X + 21 Y . Betrachten Sie nun irgendeine andere Diversifikationsstrategie B = αx X + αy Y . Es gilt 1 1 B = A + (αx − )X + (αy − )Y. 2 2 Wir zeigen nun, dass der hintere Term (αx − 21 )X +(αy − 21 )Y ein reiner St¨orterm ist, also bei gegebenen A einen Erwartungswert von Null besitzt. Es gilt: 1 1 1 1 E [(αx − )X + (αy − )Y |A] = (αx − )E [X|A] + (αy − )E [Y |A]. 2 2 2 2 Da X und Y identisch und gleichverteilt sind, ist E [X|A] = E [Y |A]. Wir bezeichnen diesen Wert mit k. Es folgt 1 1 1 1 E [(αx − )X + (αy − )Y |A] = k((αx − ) + (αy − )) = k(αx + αy − 1) = 0. 2 2 2 2
2.2 µ-σ–Theorie 2.2.1 Das Grundmodell: mehrere Basistitel Wir stellen das Grundmodell unter Unsicherheit f¨ ur die µ-σ–Theorie vor. Wir hatten f¨ ur die Theorie des Erwartungsnutzens von einem Grundmodell Gebrauch gemacht, bei dem die Zahlungen eines Portfolios in jedem Zustand zugrunde liegen. Wir k¨onnten auch im Falle der µ-σ–Theorie dieses Grundmodell verwenden, allerdings ist dies in der Literatur un¨ ublich. Die µ-σ–Theorie hat weitestgehend Verwendung nur in der Portfoliotheorie und der Auswahl optimaler Kapitalmarktanlagen gefunden, und dort liegt der Fokus weniger auf den Zahlungen als auf der Art und Weise, wie ein optimales Portfolio zusammenzustellen ist. Daher werden wir das Modell etwas ver¨andern. Wir gehen davon aus, dass an einem Markt insgesamt S Wertpapiere oder Basistitel gehandelt werden. Diese Basistitel m¨ogen Zahlungen in der Zukunft versprechen, die wir mit Y s bezeichnen wollen. Die Zahlungen sind im allgemeinen unsicher und daher formal Zufallsvariablen. Der Erwartungswert der Zahlung des s–ten Basistitels werde mit E [Y s ] bezeichnet, die Kovarianz der Zahlungen des s–ten und des r–ten Basistitels mit Cov [Y s , Y r ]. Unter einem Portfolio verstehen wir eine Zusammenstellung von S Basistiteln, wir bezeichnen dieses Portfolio mit X. Diese Zusammenstellung erfolgt noch in der Gegenwart, aber die Struktur des Portfolios ¨andert sich bis zur Zukunft morgen nicht mehr. Die Eintr¨age in dem Portfoliovektor sind wie folgt zu interpretieren:20 20
Der Leser beachte: bei Xs handelt es sich im Grundmodell des Erwartungsnutzens um eine Zahlung des Titels X im Zustand s. Hier steht Xs f¨ ur die Menge des Titels Y s im Portfolio X!
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
X=
X1 X2 .. . XS
S. 41
←− ←−
Menge erstes Wertpapier Menge zweites Wertpapier .. .
←−
Menge S–tes Wertpapier
Bevor wir mit unserer Analyse fortfahren, m¨ ussen wir auf einen ersten wichtigen Unterschied zum Grundmodell des Erwartungsnutzens hinweisen. Dort bedeutete ein negativer Eintrag in einem Wertpapier, dass dieser Titel negative G¨ utermengen zahlte – und der Inhaber zu liefern hatte. Hier bedeutet ein negativer Eintrag, dass der Inhaber des Assets beispielsweise −3 Titel eines Basistitels besitzt. Was soll das heißen? Ein positiver Eintrag hieß, der Investor erh¨alt die mit dem Wertpapier verbundenen Dividendenzahlungen der n¨achsten Periode. Ein negativer Eintrag kann also nur bedeuten, dass er diese Dividendenzahlungen selbst zu liefern hat – oder anders gesagt, dass er in der Zukunft das Wertpapier nicht besitzen, sondern selbst liefern muss. Diese Situation kann realistischerweise so verstanden werden, dass der Investor sich heute das Asset borgt und es einen Zeitpunkt sp¨ater wieder zur¨ uckgeben muss. Diesen Vorgang bezeichnet man als Leerverkauf, er wird in Deutschland von Privatpersonen derzeit eher selten praktiziert. F¨ ur institutionelle Anleger existiert ein standardisiertes Verfahren (unter Einbeziehung eines clearing houses), mit dem diese Leerverk¨aufe abgewickelt werden. Wir ben¨otigen f¨ ur den Fortgang der Untersuchungen noch eine Reihe von Annahmen. So werden wir unterstellen, dass unter den genannten S Wertpapieren ein Titel sei, der risikolos ist. Der Einfachheit halber sei dies der erste Titel. Hier entsteht also ein wichtiger Unterschied zum vorigen Grundmodell. Der risikolose Titel wird jetzt durch (1, 0, . . . , 0) beschrieben; im Grundmodell der Erwartungsnutzentheorie war es dagegen (1, 1, . . . , 1). Des weiteren wollen wir annehmen, dass sich unter dem riskanten Titeln nur soviele Assets wie unbedingt n¨otig befinden m¨ogen. Wann ist ein Titel u ussig? Ein Titel ist offensicht¨berfl¨ lich genau dann u berfl¨ u ssig, wenn seine Zahlungen durch ein geschickt zusammengestelltes ¨ Portfolio aus den verbleibenden S −1 Titel dupliziert werden k¨onnen. Betrachten wir der Einfachheit halber den S–ten Basistitel und unterstellen, dass die verbleibenden S − 1 ebenfalls eine Zahlung in der H¨ohe realisieren k¨onnen, die der Zahlung des S–ten Titels entspricht. Mit geeigneten Mengen X1 , X2 , . . . der Wertpapiere gilt dann aber Y S = X1 · Y 1 + X2 · Y 2 + · · · + XS−1 · Y S−1 oder umgestellt 0 = X1 · Y 1 + X2 · Y 2 + · · · + XS−1 · Y S−1 + XS ·Y S . |{z}
(2.12)
=−1
Wenn also ein Titel (in unserem Beispiel der S–te) nachgebaut werden kann, dann kann insbesondere auch ein Portfolio ohne Zahlungsverpflichtungen (“Nullportfolio”) aus den S − 1 riskanten Basistiteln und dem risikolosen Titel erzeugt werden.21 Wie kann man u ufen, ob es in einer Menge von Basistiteln duplizierbare Portfolios gibt? ¨berpr¨ Man wird ja schlecht dem Anwender vorschlagen, alle m¨oglichen Portfolios X auf G¨ ultigkeit 21
Man sagt auch, die Wertpapierzahlungen seien linear abh¨ angig, wenn eine Relation der Form (2.12) gilt.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 42
der Beziehung (2.12) zu u ufen. Es gilt folgender Zusammenhang, auf dessen Beweis wir ¨berpr¨ verzichten. Satz 2.12 Unter S Basistiteln sind keine Titel u ussig genau dann, wenn die Kovarianz– ¨berfl¨ Matrix aus den riskanten Titeln Cov [Y 2 , Y 2 ] Cov [Y 2 , Y 3 ] · · · Cov [Y 2 , Y S ] Cov [Y 3 , Y 2 ] Cov [Y 3 , Y 3 ] · · · Cov [Y 3 , Y S ] .. .. .. . . . Cov [Y S , Y 2 ]
Cov [Y S , Y 3 ]
···
Cov [Y S , Y S ]
eine von null verschiedene Determinante hat. Diese Bedingung garantiert, dass man mit den riskanten kein Portfolio zusammenstellen kann, dass risikolos ist, bei dem sich also die Risiken der riskanten Titel gegenseitig aufheben. W¨are das der Fall liesse sich mit dem risikolosen Titel schließlich das Nullportfolio erreichen.
2.2.2 Erwartungsnutzen und µ-σ–Theorie Wie begr¨ undet man, dass eine Nutzenfunktion nur vom Erwartungswert und der Varianz abh¨ angig ist? Vielleicht handelt es sich ja um einen Spezialfall des Erwartungsnutzens? Das wollen wir hier nachpr¨ ufen. Wir wollen nun eine weitere Theorie kennenlernen, mit der Entscheidungen unter Unsicherheit getroffen werden. Sie geht auf die Arbeit von Markowitz (1952) zur¨ uck, der daf¨ ur mit dem Nobelpreis geehrt wurde. In der Erwartungsnutzentheorie ist es notwendig, die Zahlungen eines Portfolios in jedem Zustand zu kennen: daraus werden die die entsprechenden Nutzenniveaus ermittelt. Von diesen Nutzenniveaus ist der Erwartungswert zu berechnen und diese Erwartungswert bildet die Grundlage f¨ ur die Entscheidung. Markowitz schlug nun vor, diese Rechenverfahren zu vereinfachen. Der Ertrag eines Wertpapieres soll durch den Erwartungswert, das Risiko dagegen einfach durch die Varianz abgebildet werden. Je besser der Erwartungswert, desto besser f¨ ur den Entscheidungstr¨ager. Je h¨oher die Varianz, desto unangenehmer f¨ ur den Entscheidungstr¨ager. Dieses Risikomaß hat den unbestrittenen Vorteil, dass es sehr leicht zu implementieren ist und es hat sich denn auch in der modernen Finanzmarkttheorie (im Gegensatz zum Erwartungsnutzen) auf breiter Front in der Praxis durchgesetzt. Die Nutzenfunktion ist daher von der Gestalt V (E [X], Var [X]). V ist eine beliebige Funktion, die in der ersten Variable strikt monoton wachsend und in der zweiten strikt monton fallend ist. Wenn ein Entscheidungstr¨ager diese Nutzenfunktion benutzen soll, m¨ ussen wir im Vorfeld folgende Frage kl¨aren. Wir sind immer davon ausgegangen, dass Pr¨aferenzen Nutzenfunktionen bestimmen. Wir haben diese Vorgehensweise (mehr oder weniger erfolgreich) verfolgt, um den Erwartungsnutzen zu begr¨ unden. Also sollten wir kl¨aren, welche Axiome notwendig sind, um zu einer Nutzenfunktion zu kommen, die in der Tat nur noch vom Erwartungswert und der Varianz einer Zahlung abh¨angig ist. Wir sollten also mit Pr¨aferenzen und nicht mit Nutzenfunktionen beginnen.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 43
In der Literatur hat man bisher eine Antwort auf diese Frage umgangen. Vielmehr wurde versucht, den µ-σ–Nutzen auf der Erwartungswerttheorie zu begr¨ unden. Wir wollen diese M¨oglichkeiten kurz darstellen; wir werden sehen, dass insbesondere im finanzwirtschaftlichen Kalk¨ ul diese Zug¨ange eher fragw¨ urdig sind. Es sind bis heute drei Spezialf¨alle bekannt, in denen diese Vereinbarkeit gelingt. 1.Fall: quadratischer Nutzen Markowitz, der Begr¨ under des µ-σ–Modells, bemerkte bereits, dass unter der Annahme einer quadratischen Nutzenfunktion die Vereinbarkeit beider Modelle gelingt. Es gilt n¨amlich mit geeigneten reellen Konstanten a, b (a > 0) und der Nutzenfunktion u(t) := −at2 + bt
(2.13)
der Zusammenhang E [u(X)] = E [−aX 2 + bX] = −aVar [X] − aE [X]2 + bE [X] =: V (E [X], Var [X]).
(2.14)
Ein Entscheidungstr¨ager, der seine Erwartungsnutzenfunktion maximiert, verh¨alt sich gleichzeitig wie ein Investor, der den Forderungen des µ-σ–Modells gehorcht. Allerdings hat der Zugang (2.14) eine Reihe schwerwiegender Nachteile. Zum ersten ist die Nutzenfunktion nicht monoton im Erwartungswert. Zeichnet man diese Nutzenb funktion f¨ ur gen¨ ugend große Werte E [X] (genauer f¨ ur E [X] > 2a ), dann sinkt der Nutzen mit steigendem Erwartungswert. Dieses Ergebnis ist nat¨ urlich sehr unplausibel. Es w¨ urde bedeuten, dass ein Entscheidungstr¨ager unter Umst¨anden ein Portfolio ablehnt, weil es zu hohe erwartete Zahlungen verspricht! Weiter zeigt sich eine Schwierigkeit dieses Zuganges, auf die Arrow (1971) verwiesen hat. Arrow zeigte, dass ein Entscheidungstr¨ager mit quadratischer Nutzenfunktion immer wachsende absolute Risikoaversion aufweist. Das k¨onnen wir sehr einfach nachrechnen: u00 (t) u0 (t) −2a =− = −2at + b
ARA(t) = −
b 2a
1 . −t
Zeichnet man diese Funktion, so ergibt sich eine Darstellung wie in Abbildung 2.4 angedeutet. Wir erkennen, dass (mit Ausnahme der Polstelle) die absolute Risikoaversion immer wachsend ist. Dies bedeutet aber, dass ein solcher Entscheidungstr¨ager bei h¨oherem Verm¨ogen immer eine sinkende Nachfrage nach riskanten Titel aufweist. Ein solches Verhalten ist ebenfalls sehr unplausibel. Zusammenfassend bleibt zu sagen, dass eine bestimmte quadratische Nutzenfunktion zwar zum µ-σ Modell f¨ uhrt, dieser Weg aber mit schwerwiegenden Nachteilen behaftet ist. 2.Fall: normalverteilte R¨ uckfl¨ usse Eine zweite M¨oglichkeit, den Erwartungsnutzen und den µ-σ Kalk¨ ul miteinander zu vereinen, besteht durch die Annahme eines Kontinuums an zuk¨ unftigen Umweltsituationen. Weiter wird vorausgesetzt, dass die Nutzenfunktion
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 44
ARA(t) 6
. ... ... .. .. . . ... .... ..... ..... .... . . . . ....... ....... .......... ............. .................. . . . . . . . . . . . . . . . . . . . . . . . . . . . .............................................
b 2a
.... ................................... ..................... .............. ........... ......... . . . . . . . ...... ..... ..... ... ... . ... ... ... .. . ... ... ...
t
Abbildung 2.4: ARA f¨ ur quadratische Nutzenfunktionen u(t) analytisch ist (sich also f¨ ur alle t ∈ R in eine Taylor–Reihe entwickeln l¨asst) und dass sie strikt monoton und strikt konkav ist. Die Basistitel seien multivariat normalverteilt.22 Dann l¨asst sich beweisen, dass ein Entscheidungstr¨ager, der sich gem¨aß dem Erwartungsnutzen verh¨alt, ebenfalls den Anforderungen des µ-σ–Modells gen¨ ugt. Beweis: Zum Beweis der Vereinbarkeit von Erwartungsnutzen und µ-σ Kalk¨ul entwickeln wir die Nutzenfunktion u(t) an der Stelle E [X] und erhalten u(t) = u(E [X]) +
∞ X
u(k) (E [X])
k=1
(t − E [X])k . k!
(2.15)
Setzen wir nun f¨ ur t die Realisationen der Zielgr¨oße X(ωs ) ein und bilden den Erwartungswert, dann erhalten wir E [u(X)] = u(E [X]) +
∞ X u(k) k=1
k!
E [(X − E [X])k ].
(2.16)
Nun waren die Basistitel normalverteilt, mithin sind es auch die Portfolios aus den Basistiteln.23 Die zentralen Momente einer Normalverteilung aber k¨onnen berechnet werden, es gilt ( 0 wenn k ungerade, k E [(X − E [X]) ] = (2.17) k−1 1 · 3 · 5 · · · (k − 1) · Var [X] wenn k gerade. Setzt man dieses Ergebnis in die Gleichung (2.16) ein, dann erkennt man, dass der Entscheidungstr¨ ager eine Funktion maximiert, deren Zielgr¨oße in der Tat nur von Erwartungswert und Varianz des Portfolios abh¨ angig ist:24 E [u(X)] = u(E [X]) +
∞ X
u(2k) (E [X])
k=1
1 · 3 · · · (2k − 1) · Var [X]2k−1 (2k)!
=: V (E [X], Var [X]). 22
Zur Definition siehe zum Beispiel Bronstein, Semendjajew, Musiol & M¨ uhlig (1993), S. 203. Dies folgt aus der Annahme der linearen Unabh¨ angigkeit der Basistitel. Die Summe von normalverteilten Zufallsvariablen und das Produkt mit reellen Zahlen sind wieder normalverteilt, siehe Bronstein et al. (1993), S. 712. 24 Dabei bezeichne u(2k) die 2k–te Ableitung der Funktion u. 23
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 45
Man kann nun zeigen, dass die Zielgr¨osse E [u(X)] strikt monoton wachsend im Erwartungswert und strikt monoton fallend in der Varianz des Portfolios ist. Wir verzichten hier auf einen Beweis.
Die Annahme der Normalverteilung impliziert, dass die Basistitel mit nichtverschwindender Wahrscheinlichkeit beliebig hohe negative R¨ uckfl¨ usse aufweisen. Eine ganze Reihe von Wertpapieren (zum Beispiel Aktien) aber, die durchaus als Anwendungsbeispiel f¨ ur Basistitel in Frage kommen, k¨onnen keine negativen R¨ uckfl¨ usse erzielen. Wir sind der Auffassung, dass durch diese Implikationen keine ausreichende Realit¨atsn¨ahe des Zuganges mehr gegeben ist. 3.Fall: lineare Risikoklassen Eine dritte M¨oglichkeit, beide Modelle miteinander zu vereinen, geht auf Meyer (1987) und Schneeweiß (1967) sowie (in Unkenntnis dieser Arbeiten) auf Lajeri & Nielsen (1994) zur¨ uck.25 Beim Ansatz der linearen Risikoklassen folgt man den bisher vorgestellten Annahmen. Im Gegensatz dazu wird aber unterstellt, dass es nur einen riskanten Basistitel Y2 (und nicht mehrere linear unabh¨angige) gibt. Dieser Titel habe einen Erwartungswert E [Y2 ] = 0 und eine Varianz Var [Y2 ] = 1. Des weiteren existiere wieder ein risikoloses Asset Y1 mit einem Erwartungswert von 1. Die Strategien des Entscheidungstr¨agers sind wieder Portfolios aus den beiden Wertpapieren, haben also die R¨ uckfl¨ usse X = X1 Y 1 + X2 Y 2 .
(2.18)
Der Erwartungsnutzen dieser R¨ uckfl¨ usse ergibt sich aus E [u(X)] = E [u(X1 · Y 1 + X2 · Y 2 )].
(2.19)
Andererseits kann man den Erwartungswert und die Varianz der vom Entscheidungstr¨ager zu bildenden Portfolios direkt bilden: E [X] = X1 ,
Var [X] = X22 .
Beide Gleichungen k¨onnen leicht nach den Koeffizienten X1 und X2 aufgel¨ost werden. Setzen wir dies in die Darstellung (2.19) ein, so erhalten wir die folgende Darstellung des Erwartungsnutzens eines Portfolios X:26 h i p E [u(X)] = E u E [X] · Y 1 + Var [X] · Y 2 =: V (E [X], Var [X]).
(2.20)
Die letzte Gleichung besagt gerade, dass der Erwartungsnutzen eines Portfolios X nur vom Erwartungswert E [X] und der Varianz Var [X] dieses Portfolios abh¨angig ist. Alle 25
Tobin ¨ außerte 1958 die Behauptung, das von Markowitz formulierte µ-σ–Modell lasse sich f¨ ur alle diejenigen Verteilungen aus dem Erwartungsnutzen ableiten, die zweiparametrig seien. Diese Behauptung erwies sich als fehlerhaft, wie zuerst von Schneeweiß (1967) und Samuelson (1967) erkannt wurde. Schneeweiß war der erste, der explizit zwischen den hier zu behandelnden linearen Risikoklassen und anderen Zwei– Parameterklassen unterschied. Nur f¨ ur die linearen Risikoklassen ließ sich die Vereinbarkeit beider Modelle beweisen. 26 Das risikolose Asset zahle gerade eine Geldeinheit und kann daher beim Faktor E [X] weggelassen werden.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 46
anderen Variablen sind konstant, da sie sich aus den Basistiteln Y 1 , Y 2 ergeben. Auch dieser Zugang f¨ uhrt zum µ-σ–Modell. So elegant dieser Weg ist, er hat folgenden Nachteil. Betrachten wir als Anwendungsfall die Nutzenfunktion ln(t). Angenommen, es gebe in der Zukunft nur zwei Zust¨ande und der Einfachheit halber m¨ ogen beide mit gleicher Wahrscheinlichkeit auftreten. Es gebe weiter nur einen riskanten Basistitel Y 2 . Dieser Basistitel Y 2 habe in den beiden Zust¨anden die Realisationen ±1. Man errechnet sofort einen Erwartungswert des R¨ uckflusses von E [Y 2 ] = 0 und eine Varianz Var [Y 2 ] = 1. Jetzt wollen wir Portfolios aus dem risikolosen Titel sowie dem riskanten Basistitel bilden. Dies ist nat¨ urlich immer m¨oglich, aber es gelingt uns nur in bestimmten F¨allen, einen Erwartungsnutzen f¨ ur diese Portfolios zu errechnen. Beim Erwartungsnutzen m¨ ussen ja die Nutzenwerte der Zust¨ande mit den Wahrscheinlichkeiten gewichtet werden, die einzelnen Summanden sind dann zu addieren. Betrachten wir aber den Zustand, in dem Y 2 gerade den Wert -1 annimmt, der Einfachheit halber m¨oge dies der erste Zustand sein. Wenn wir jeweils einen Basistitel Y 2 und ein risikoloses Asset Y 1 halten, bekommen wir in der Zukunft eine Zahlung in H¨ohe von null Y11 + Y12 = 1 + (−1) = 0. Wir h¨atten nun den Nutzenwert dieser Zahlung zu ermitteln: aber ln(0) ist nicht definiert! Es ist schlichtweg nicht m¨oglich, den Erwartungsnutzen des Portfolios Y 1 + Y 2 zu bestimmen, weil in einem Zustand der Wert der Nutzenfunktion undefiniert ist. Ein Zugang zum µ-σ–Kalk¨ ul, bei dem wir einige Portfolios ausblenden m¨ ussen, kann uns aber nicht u ¨berzeugen. ¨ Fassen wir die vorangegangenen Uberlegungen zusammen. Es ist uns nicht gelungen, das µ-σ– Modell dem Erwartungsnutzen unterzuordnen. Vielmehr haben alle diesbez¨ uglichen Versuche schwerwiegende Nachteile. Wir vertreten daher die Ansicht, dass es sich beim Erwartungsnutzen und dem µ-σ–Modell um zwei verschiedene Arten der Modellierung von Risiko handelt. Diese Sichtweise hat setzt sich erst sehr z¨ogerlich in der Finanzierung durch.27
2.2.3 Die Axiome Wir haben vergeblich versucht, den µ-σ–Kalk¨ ul auf dem Erwartungsnutzen zu begr¨ unden. Deshalb werden wir jetzt einen anderen Weg gehen und Axiome angeben, die auf µ-σ–Funktionen f¨ uhren. Wir definieren zwei Begriffe, die auf Duffie (1988) zur¨ uckgehen: Definition 2.6 Die Pr¨ aferenz heißt strikt varianzavers genau dann, wenn gilt ∀X, Z 6= 0 27
Cov (X, Z) = E (Z) = 0
=⇒
X X + Z,
Einige Arbeiten, die unsere Sicht teilen, sind zum Beispiel: “A mean–variance framework is justified if the class of distributions is suitably restricted; for example, if they are all normal. The capital asset pricing model is also justified in a continuous time model where uncertainty is generated by diffusion processes. But more generally the specification of mean–variance utility functions is an ad hoc functional form specification that is adopted for reasons of tractability” Epstein (1985), S. 945 oder “In the present paper, mean–variance behavior is treated not as a special case of expected utility maximization but as an alternative, normal distributions being a special case of both” Lajeri & Nielsen (1994), S. 4.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 47
Die Pr¨ aferenz heißt strikt monoton im risikolosen Titel Y 1 genau dann, wenn gilt ∀t > 0, X
X + t · Y 1 X.
Versuchen wir zuerst, den ¨okonomischen Gehalt beider Begriffe zu verstehen. Monotonie verlangt, dass bei Addition des risikolosen Portfolios der Nutzen eines Investors w¨achst. Also unterstellt die zweite Bedingung, dass der Entscheidungstr¨ager keine S¨attigung im risikolosen Titel aufweist. Etwas komplizierter scheint die Interpretation der ersten Bedingung. Das Portfolio Z in der Definition 2.6 kann als ein reiner St¨orterm von X aufgefasst werden. Denn Z besitzt verschwindenden Erwartungswert und erh¨oht wegen Var [X + Z] = Var [X] + Var [Z] + 2Cov (X, Z) > Var [X] | {z } =0
nur die Varianz des Portfolios. Also verlangt die Varianzaversion, dass ein Investor die Addition reiner St¨orterme zu seinem Portfolio ablehnt. Die Nutzenfunktion des Investors wird nun durch den folgenden Satz charakterisiert.28 Satz 2.13 Es gebe mindestens zwei riskante und unkorrelierte Wertpapiere. Es sei eine Pr¨ aferenzrelation gegeben. Eine Pr¨ aferenz erf¨ ullt die strikte Varianzaversion und strikte Monotonie im risikolosen Wertpapier genau dann, wenn es eine repr¨ asentierende Nutzenfunktion U (X) gibt, die nur von Mittelwert und Standardabweichung des Portfolios abh¨ angt: U (X) = V (E [X], Var [X]), wobei V in der ersten Variablen strikt monoton wachsend und in der zweiten Variablen strikt monoton fallend ist. Sind die Annahmen an die Pr¨aferenzen erf¨ ullt, dann maximiert der Investor eine Nutzenfunktion, welche nur vom Erwartungswert und der Varianz einer Zufallsvariable abh¨angt. Man kann die µ-σ–Nutzenfunktionen sehr anschaulich in einem µ-Var –Diagramm darstellen, bei dem jeder Punkt des Diagramms ein Porfolio darstellt mit einer bestimmten Kombination aus einem Wert der Varianz und einem Erwartungswert. Wie sehen in einem solchen Diagramm die Indifferenzkurven einer µ-σ–Nutzenfunktion aus? Dazu sucht man diejenigen Punkte in dem Diagramm, bei denen sich der Wert der Nutzenfunktion nicht ver¨andert: V (µ, σ 2 ) = C. Eine Indifferenzkurve ist dann durch einen funktionalen Zusammenhang µ(σ 2 ) gegeben. Vorausgesetzt die Nutzenfuktion ist ausreichend differenzierbar, dann ergibt sich f¨ ur die Steigung der Indifferenzkurve ein positiver Wert. Dies sieht man wie folgt: ableiten von V (µ(σ 2 ), σ 2 ) = C ergibt dV ∂V ∂µ ∂V = + = 0. 2 2 dσ ∂µ ∂σ ∂σ 2 28
Zum Beweis siehe L¨ offler (1996).
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 48
Durch umstellen sieht man, dass ∂V ∂µ ∂σ 2 = − ∂V > 0 ∂σ 2 ∂µ
da
∂V ∂µ
> 0 und
∂V ∂σ 2
< 0. Wenn wir nun zus¨atzlich fordern, dass die Nutzenfunktion des 2
∂ µ Investors quasikonkav ist, dann kann man sogar zeigen, dass ∂(σ 2 )2 > 0 ist, und also dass die Indifferenzkurven immer st¨arker steigende Kurven sind wie in der folgenden Graphik dargestellt:
µ
. .... .... .... .... .... . . . . . ..... .... ..... ..... .... . . . . ..... ..... ...... ....... ........ . . . . . . . . .......... ..............
6
-
σ2
Abbildung 2.5: Indifferenzkurve einer µ–σ–Nutzenfunktion
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 49
2.2.4 S¨ attigung beim µ-σ–Kalk¨ ul Damit haben wir nicht gerechnet: wir zeigen, dass mehr nicht unbedingt besser ist, wenn der Investor eine µ-σ–Nutzenfunktion besitzt. Wir wollen in diesem Abschnitt auf eine Eigenschaft der µ-σ–Nutzenfunktionen hinweisen, die erst in der neueren Literatur bemerkt wurde.29 Dazu betrachten wir einen Investor, der eine Erwartungsnutzenfunktion besitze. Diesem Investor werde ein Portfolio angeboten, das in jedem Zustand entweder null oder einen (m¨oglicherweise kleinen) positiven Betrag auszahle. Wir k¨onnen diese Situation auch dadurch beschreiben, dass dem Investor eventuell etwas geschenkt werde. Es ist f¨ ur uns selbstverst¨andlich, dass jeder Investor dieses Geschenk annehmen wird. F¨ ur den mathematischen Kalk¨ ul des Erwartungsnutzens kann diese Eigenschaft auch bewiesen werden, worauf wir aber hier verzichten wollen. Beim µ-σ–Kalk¨ ul ist dies anders. Bevor wir in die Details einsteigen, schauen wir uns die Motivation aus einem anderen Blickwinkel an. Dazu gehen wir zur¨ uck zur Definition der strikten Monotonie im risikolosen Asset. Unser Vorgehen in diesem Abschnitt kann als Versuch gewertet werden, diese strikte Monotonie auf den Fall zu verallgemeinern, bei dem einem Investor nur ein Portfolio mit einer nichtnegativen Auszahlung offeriert wird. Sei Z ein solches Portfolio, also es gelte Z ≥ 0. Gilt f¨ ur eine Pr¨aferenz, die von einer µ-σ–Nutzenfunktion repr¨asentiert wird, dann immer X ≺ X + Z? Wir werden jetzt ein Beispiel konstruieren, bei dem diese elementare Eigenschaft verletzt ist. Bevor wir in die Mathematik einsteigen, soll aber die Intuition des Resultates vorweggenommen werden. Wenn man zu einem beliebigen Portfolio X ein Z ≥ 0 hinzuf¨ ugt, so erh¨oht das sicherlich den Erwartungswert und wird damit vom Investor gern gesehen. Leider aber besteht die M¨oglichkeit, dass ebenso die Varianz steigt. Wenn nun die Varianz st¨arker als der Erwartungswert w¨achst (und dies h¨angt sowohl von Z als auch von der Nutzenfunktion ab), dann sinkt der Nutzen und der Investor lehnt dieses Portfolio ab. Diese Eigenschaft ist offensichtlich unerw¨ unscht, aber dennoch Ergebnis einer gedankenlosen Anwendung der µ-σ–Theorie. Es gebe zwei zuk¨ unftige Zust¨ande der Welt, die beide gleich wahrscheinlich seien. Der Investor habe zuerst nichts, X = 0. Seine Nutzenfunktion sei V (E [X], Var [X]) = E [X] − Var [X]. Nun offerieren wir dem Investor ein Portfolio, bei dem im Zustand eins eine Zahlung von 2t Geldeinheiten erfolgt, w¨ahrend im Zustand zwei nichts gezahlt wird. Intuitiv w¨ urden wir erwarten, dass der Investor dieses Portfolio besser als X findet. Doch rechnen wir besser nach: V (E [X + Z], Var [X + Z]) = E [X + Z] − Var [X + Z] = E [Z] − Var [Z] = t − t2 . F¨ ur Werte von t aus dem Intervall [0, 1] steigt der Wert der Nutzenfunktion in der Tat u ¨ber V (E [X], Var [X]) = 0 und daher gilt auch X ≺ X + Z. Wenn jedoch t den Wert von eins u ¨bersteigt, steigt die Varianz zu stark an und es gilt V (E [X], Var [X]) > V (E [X + Z], Var [X + Z]) 29
Beispielsweise Nielsen (1987).
c L¨offler/Laitenberger 2003
=⇒
X X + Z.
2.2 µ-σ–Theorie
S. 50
Wenn wir dem Investor “zuviel” schenken, lehnt er dieses Geschenk wegen der zu hohen Varianz ab! Eine solche Eigenschaft wird auch als S¨attigung bezeichnet und stellt eine der unangenehmen Begleiterscheinungen der µ-σ–Theorie dar.
2.2.5 Tobin–Separation (und Portfoliotheorie) Wir zeigen eine wichtige Eigenschaft der µ-σ–Pr¨ aferenzen: das optimale Portfolio setzt sich aus dem risikolosen Asset und einem vom Investor unabh¨ angigen Portfolio zusammen. Wir betrachten nun einen Investor, der eine µ-σ–Nutzenfunktion besitzt und sein Verm¨ogen w maximieren m¨ochte. Dieser Investor l¨ost das folgende Problem max V (E [X], Var [X]),
s.t. p(X) ≤ w.
Zuerst k¨onnen wir folgendes feststellen. Wir haben bisher immer angenommen, dass ein risikoloser Titel Y 1 gehandelt wird. Wenn der Investor sein Budget nicht aussch¨opfen sollte (also wenn p(X) < w gilt), dann kann der Investor von dem verbleibenden Restbetrag risikolose Assets kaufen. Dieser Kauf wird den Erwartungswert erh¨ohen, aber die Varianz unver¨andert lassen. Das heißt aber nichts anderes, als das der Gesamtnutzen steigt. Damit k¨onnen wir schlussfolgern, dass wir genauso gut das Maximierungsproblem l¨osen k¨onnen, bei dem das Budget ausgesch¨opft wird max V (E [X], Var [X]),
s.t. p(X) = w.
Um diese Maximierungsaufgabe zu bew¨altigen, bestehen nun mehrere M¨oglichkeiten. Wir werden hier den klassischen Weg verfolgen und den Lagrangeansatz verwenden. Dazu bilden wir die Lagrangefunktion in der Variable X und erhalten L = V (E [X], Var [X]) − λ(p(X) − w). Diese Funktion muss nun nach X abgeleitet werden und da X ein Vektor ist, scheint diese Aufgabe auf den ersten Blick nicht gerade einfach. Bevor wir mit der Rechnung fortfahren k¨onnen, m¨ ussen wir uns weiter eines Resultates bedienen, dass aus der Arbitragefreiheit des Marktes stammt. Dieses Ergebnis wird in einer anderen Veranstaltung pr¨azise hergeleitet, wir werden es hier nur veranschaulichen. Wir wissen, dass X die Zusammenstellung eines Portfolios des Investors beschreibt. Wir setzen nun voraus, dass der Preis dieses Portfolios sich aus der Summe der Einzelteile zusammensetzt30 , genauer nehmen wir an, dass folgender Zusammenhang gilt p(X) =
S X
Xs · p(Y s ).
s=1
Setzen wir dies in unsere Lagrangefunktion ein und ber¨ ucksichtigen die Art und Weise, in der Erwartungswerte und Varianzen ermittelt werden, so erhalten wir ! S S X S S X X X s s r s L=V Xs E [Y ], Xs Xr Cov [Y , Y ] − λ Xs p(Y ) − w |s=1 {z
=E [X]
30
} |s=1 r=1
s=1
{z
=Var [X]
}
Dieses Ergebnis heißt Wertaddivit¨ atstheorem und wird in der Veranstaltung zur Kapitalmarkttheorie behandelt.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 51
und diese Formulierung hat den Vorteil, dass wir nun Ableitungen nach den Zahlen Xs bilden k¨onnen. Vorher ber¨ ucksichtigen wir, dass der risikolose Titel zwar zu einem h¨oheren Erwartungswert beitr¨agt, aber keine Wirkungen auf die Varianz besitzt. Mithin verk¨ urzt sich die letzte Maximierungsaufgabe zu ! S S X S S X X X s s r s L=V Xs E [Y ], Xs Xr Cov [Y , Y ] − λ Xs p(Y ) − w (2.21) s=1
s=2 r=2
s=1
Leiten wir diese Gleichung zuerst nach der ersten Variable X1 , also der nachgefragten Menge an risikolosen Titeln ab, dann ergibt sich31 P d Ss=1 Xs E [Y s ] ∂L 0= = Vµ (E [X], Var [X]) · − λp(Y 1 ) ∂X1 dX1 = Vµ (E [X], Var [X]) · E [Y 1 ] − λp(Y 1 )
was auf den folgenden Ausdruck f¨ ur den Parameter λ f¨ uhrt λ = Vµ (E [X], Var [X]) ·
E [Y 1 ] . p(Y 1 ) | {z }
(2.22)
=1+rf
Die Ableitungen nach der s–ten Variable (f¨ ur s > 1) ergeben dagegen32 0=
∂L ∂V (E [X], Var [X]) = − λp(Y s ) ∂Xs ∂Xs P ∂ Ss=1 Xs E [Y s ] + = Vµ (E [X], Var [X]) · ∂Xs P P ∂ Ss=2 Sr=2 Xs Xr Cov [Y s , Y r ] + Vσ2 (E [X], Var [X]) · − λp(Y s ) ∂Xs S X = Vµ (E [X], Var [X]) E [Y s ] + Vσ2 (E [X], Var [X]) 2 Xr Cov [Y s , Y r ] − λp(Y s ). r=2
31
Wir benutzen hier und im n¨ achsten Schritt die Grundregel des totalen Differentials. Danach gilt f¨ ur eine beliebige Funktion f (x, y) immer df (x, y) dx dy = fx + fy . dz dz dz
F¨ ur die Ableitung von V nach der ersten Variablen schreiben wir Vµ , f¨ ur die Ableitung nach der zweiten Variablen Vσ2 . 32 Der folgende Schritt enth¨ alt eine Ableitung nach einer Doppelsumme, und das ist etwas ungew¨ ohnlich. In einer Aufgabe zeigen wir anhand eines Beispiels f¨ ur S = 3, dass die Ableitung in der Tat dem im Skript genannten Ausdruck entspricht.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 52
Wir setzen die Gleichung (2.22) ein und erhalten 0 = Vµ (E [X], Var [X]) E [Y s ] + Vσ2 (E [X], Var [X]) 2
S X
Xr Cov [Y s , Y r ]−
r=2
− (1 + rf )Vµ (E [X], Var [X]) · p(Y s ) 0 = E [Y s ] − (1 + rf )p(Y s ) + 2
S Vσ2 (E [X], Var [X]) X Xr Cov [Y s , Y r ] Vµ (E [X], Var [X])
(2.23)
r=2
Wir wollen diese Bedingung vorerst nicht weiter umformen. Da wir f¨ ur jedes s = 2, . . . , S eine Ableitung bilden k¨onnen, haben wir es insgesamt mit S − 1 Gleichungen zu tun. Wir m¨ ussen uns klarmachen, dass sich diese Gleichungen in einer wesentlich kompakteren Form schreiben lassen. In allen F¨allen gehen die Unbekannten X2 , . . . , XS linear ein. Dies l¨asst vermuten, man k¨onne die Gleichungen (2.23) als ein lineares Gleichungssystem formulieren. Und in der Tat erkennt man bei genauerer Betrachtung, dass die S − 1 Gleichungen sich in folgender Matrixschreibweise darstellen lassen (1 + rf )p(Y 2 ) − E [Y 2 ] Cov [Y 2 , Y 2 ] Cov [Y 2 , Y S ] X2 Vσ2 (E [X], Var [X]) .. .. .. .. =2 · . . . . V (E [X], Var [X]) µ S S S 2 S S (1 + rf )p(Y ) − E [Y ] Cov [Y , Y ] Cov [Y , Y ] XS Die Unbekannten Parameter X2 , . . . , XS stehen auf der rechten Seite und alle anderen Variablen sind bekannt. Die Gleichung l¨asst sich l¨osen, wenn die Kovarianzmatrix invertierbar ist. Aber genau das hatten wir in der Einleitung vorausgesetzt (siehe Seite 42). Damit besitzt das Gleichungssystem eine eindeutige L¨osung X2 Cov [Y 2 , Y 2 ] Vσ2 (E [X], Var [X]) . .. 2 .. = . Vµ (E [X], Var [X]) Cov [Y S , Y 2 ] XS
−1 Cov [Y 2 , Y S ] (1 + rf )p(Y 2 ) − E [Y 2 ] .. .. · . . S S S S Cov [Y , Y ] (1 + rf )p(Y ) − E [Y ]
Was k¨onnen wir u ¨ber die L¨osung dieses Gleichungssystems aussagen? Es scheint keine generelle Aussage m¨oglich, da wir doch nichts genaueres u ¨ber die Nutzenfunktion V wissen. Dennoch erlaubt ein genauerer Blick auf die letzte Gleichung folgenden Schluss. Wir erkennen, dass auf der rechten Seite ausschließlich Gr¨oßen zu finden sind, die nicht von der Nutzenfunktion abh¨angig sind. Vielmehr stehen dort nur Gr¨oßen, die von den Basistiteln bestimmt werden. Das bedeutet aber, dass die rechte Seite der Gleichung f¨ ur alle Investoren identisch ist, wenn sie identische Erwartungen und identische Kovarianzmatrizen besitzen. V
(E [X],Var [X])
Die Nutzenfunktion weiter geht nur auf der linken Seite ein, und der Term Vσµ2(E [X],Var [X]) ist eine Zahl. Daher ist auch das relative Verh¨altnis von Xs : Xr nicht von der Nutzenfunktion abh¨angig. Wir k¨onnen unsere Erkenntnis in folgendem Satz zusammenfassen, der auf James Tobin zur¨ uckgeht. Satz 2.14 (Tobin–Separation) Angenommen ein Investor maximiere eine µ-σ–Nutzenfunktion. Dann haben die riskanten Titel in seinem optimalen Portfolio ein Verh¨ altnis zueinander, das nicht von der Nutzenfunktion und auch nicht von seinem Einkommen abh¨ angt. Dieses Portfolio wird auch Preisportfolio genannt.
c L¨offler/Laitenberger 2003
2.2 µ-σ–Theorie
S. 53
Wir k¨onnten dieses Ergebnis wie folgt zusammenfassen. Jeder µ-σ–Investor wird, das wissen wir bereits ohne genauere Kenntnis seiner Nutzenfunktion und seines Verm¨ogens, zwei Portfolios erwerben: den risikolosen Titel und ein riskantes Portfolio, dessen Zusammensetzung wir bereits ermitteln k¨onnen. Um nun zu bestimmen, wieviel er von dem risikolosen Titel und wieviel von dem riskanten Portfolio erwirbt, m¨ ussen wir sowohl die Nutzenfunktion als auch das Verm¨ogen kennen.
c L¨offler/Laitenberger 2003
Literaturverzeichnis Allais, M. (1953), ‘Le comportement de l’homme rationnel devant le risque: Critique des postulats et axiomes de l’ecole americaine’, Econometrica 21, 503–546. Arrow, K. (1971), Essays in the Theory of Risk Aversion, Markham, Chicago. Bernoulli, D. (1996), ‘Entwurf einer neuen Theorie zur Bewertung von Lotterien (Specimen ¨ theoriae novae de mensura sortis)’, Die Betriebswirtschaft 56, 733–742. Deutsche Ubersetzung: L. und P. Kruschwitz. Bronstein, I., Semendjajew, K., Musiol, G. & M¨ uhlig, H. (1993), Taschenbuch der Mathematik, Verlag Harri Deutsch, Frankfurt/M. Constantinides, G. M. (1990), ‘Habit formation: A resolution of the equity premium puzzle’, Journal of Political Economy 98, 519–543. Dalal, A. & Arshanapalli, B. (1993), ‘Estimating the demand for risky assets via the indirect expected utility function’, Journal of Risk and Uncertainty 6, 277–288. Debreu, G. (1954), Representation of a preference ordering by a numerical function, in R. Thrall, ed., ‘Decision Processes’, Wiley & Sons, New York, pp. 159–165. Duffie, D. (1988), Security Markets, Academic Press, Inc., San Diego. Epstein, L. (1985), ‘Decreasing risk aversion and mean–variance analysis’, Econometrica 53, 945–961. Friend, I. & Blume, M. (1975), ‘The demand for risky assets’, American Economic Review 65, 900–922. Guiso, L., Jappelli, T. & Terlizzese, D. (1996), ‘Income risk, borrowing constraints and portfolio choice’, American Economic Review 86, 158–172. Hildreth, C. & Knowles, G. (1982), Some estimates of farmers’ utility functions, Technical Report 335, Agricultural Experimental Station, University of Minnesota. Kessler, D. & Wolff, E. (1991), ‘A comparative analysis of household wealth patterns in france and in the united states’, Review of Income and Wealth 37, 249–266. Kydland, F. & Prescott, E. (1982), ‘Time to build and aggregate fluctuations’, Econometrica 50, 1345–1370. Lajeri, F. & Nielsen, L. (1994), Risk aversion and prudence: The case of mean–variance preferences. INSEAD.
54
Literaturverzeichnis
S. 55
L¨offler, A. (1996), ‘Variance aversion implies µ–σ 2 –criterion’, Journal of Economic Theory 69, 532–539. Lucas, R. (1978), ‘Asset pricing in an exchange economy’, Econometrica 46, 1429–1445. Magill, M. & Nermuth, M. (1986), ‘On the qualitative properties of futures market equilibrium’, Journal of Economics 46, 233–252. Markowitz, H. (1952), ‘Utility of wealth’, Journal of Political Economy 60, 151–158. Mas-Colell, A. (1985), The Theory of General Economic Equilibrium: A Differentiable Approach., number 9 in ‘Econometric Society monographs’, Cambridge University Press, Cambridge. Meyer, J. (1987), ‘Two–moment decision models and expected utility maximization’, American Economic Review 77, 421–430. Nielsen, L. (1987), ‘Portfolio selection in the mean-variance–model: A note’, Journal of Finance 42, 1371–1376. Ogaki, M. & Zhang, Q. (1999), Decreasing realive risk aversion abd tests of risk sharing. Ohio State University. Pratt, J. (1964), ‘Risk aversion in the small and in the large’, Econometrica 32, 122–136. Samuelson, P. (1967), ‘General proof that diversification pays’, Journal of Financial and Quantitative Analysis 2, 66–84. Savage, L. (1972), The Foundations of Statistics, Dover Publications, New York. Schneeweiß, H. (1967), Entscheidungskriterien bei Risiko, Vol. VI of Econometrics and Operations Research, Springer Verlag, Berlin Heidelberg New York. Tobin, J. & Dolde, W. (1971), Wealth, liquidity and consumption, in ‘Consumer spending and monetary policy: The linkage’, Federal Reserve Bank of Boston, Boston, pp. 99–146. Wakker, P. (1984), ‘Cardinal coordinate independence for expected utility’, Journal of Mathematical Psychology 28, 110–117. Wolfstetter, E. (1999), Topics in Microeconomics, Cambridge University Press, Cambridge.
c L¨offler/Laitenberger 2003