´ ´ FORMAS CUADRATICAS Y CONICAS EN Rn . En la siguiente secci´on, introduciremos los conceptos de formas cuadr´aticas y c´onicas. Antes de eso, veremos algunas definiciones. Una funci´on bilineal o forma bilineal en Rn es una funci´on B : Rn × Rn → R que satisface: (i) B(~u, ~v + αw) ~ = B(~u, ~v ) + αB(~u, w) ~ , ∀ α ∈ R , ∀ ~u, ~v , w ~ ∈ Rn . (ii) B(~a + β~b, ~c) = B(~a, ~c) + βB(~b, ~c) , ∀ β ∈ R , ∀ ~a, ~b, ~c ∈ Rn . La forma bilineal B se dir´a sim´etrica si adem´as satisface: (iii) B(~u, ~v ) = B(~v , ~u) , ∀ ~u, ~v ∈ Rn . µ
¶ µ ¶ u v 1 1 Por ejemplo en R2 , denotemos ~u = y ~v = , con u1 , u2 , v1 , v2 ∈ R, entonces u2 v2 la funci´on definida por B(~u, ~v ) = u1 · v2 es una forma bilineal. En este caso no es sim´etrica. Por otro lado, B(~u, ~v ) = u1 · v1 + u2 · v2 , es una forma lineal sim´etrica. En general, si B es una funci´on bilineal en Rn , B = {~v1 , ~v2 , ..., ~vn } una base de Rn y ~x, ~y ∈ Rn , entonces escribiendo estos vectores como combinaci´on lineal de esta base ~x =
n X
xi~vi , ~y =
i=1
tenemos B(~x, ~y ) = B
n X
yj ~vj , xi , yj ∈ R, i, j ∈ {1, 2, ..., n} ,
j=1
à n X i=1
xi~vi ,
n X
! yj ~vj
j=1
=
n X n X
xi · yj · B(~vi , ~vj ) .
i=1 j=1
De esta manera, si definimos la matriz B ∈ Mn (R) como (B)ij = B(~vi , ~vj ), i, j ∈ {1, 2, ..., n}, entonces B(~x, ~y ) = [~x]B • (B · [~y ]B ) = ([~x]B )t · B · [~y ]B , donde • es el producto punto usual de Rn y [~x]B , [~y ]B ∈ Rn son las coordenadas de ~x, ~y respecto a la base B, respectivamente. B se denomina la matriz asociada a la forma bilineal B. Rec´ıprocamente, dada cualquier matriz B ∈ Mn (R), la funci´on F : Rn × R2 → R definida por F (~x, ~y ) = (~x)t · B · ~y es una funci´on bilineal; en resumen, TODA funci´on bilineal en Rn tiene la forma (~x)t · B · ~y para alguna matriz B. En el ejemplo anterior, para B(~u, ~v ) = u1 · v2 se tiene ¶ µ ¶ µ ¡ ¢ 0 1 v1 , B(~u, ~v ) = u1 u2 · · v2 0 0 1
mientras que para B(~u, ~v ) = u1 · v1 + u2 · v2 , la escritura es µ ¶ µ ¶ ¡ ¢ 1 0 v1 B(~u, ~v ) = u1 u2 · · . 0 1 v2 Finalmente, observemos que B es una forma bilineal sim´etrica ⇔ la matriz asociada B es sim´etrica. 2 ´ FORMAS CUADRATICAS. Una funci´on q : Rn → R se dir´a una forma cuadr´atica si y s´olo si existe una forma bilineal sim´etrica B tal que q(~x) = B(~x, ~x) , ∀ ~x ∈ Rn . De los resultados anteriores, tenemos que para B existe B ∈ Mn (R) sim´etrica tal que B(~x, ~y ) = (~x)t · B · ~y , ∀ ~x, ~y ∈ Rn . Luego, en Rn toda forma cuadr´atica q tiene la forma q(~x) = (~x)t · B · ~x , ∀ ~x ∈ Rn . ¶ ¶ µ a b x , donde a, b, c ∈ R. Entonces, yB= Ejemplo 1: En R , denotemos ~x = b c y la forma general de una cuadr´atica en R2 es µ
2
q(x, y) = q(~x) = (~x)t · B · ~x = ax2 + 2bxy + cy 2 , ∀ ~x ∈ R2 . 3 2 Ejemplo 2: Siµtenemos ¶ la cuadr´atica q(x, y) = 7x + 3xy, entonces a = 7, b = 2 , c = 0; por 3 7 2 y as´ı lo tanto, B = 3 0 2 µ ¶ µµ ¶ µ ¶¶ µ ¶ µ ¶ ¡ ¢ x 7 32 x 7 32 x • q(x, y) = · = x y · 3 · . 3 y 0 y 0 y 2 2
Dado que la matriz B asociada a la forma cuadr´atica es sim´etrica, es posible hacer una reducci´on aprovechando el hecho que este tipo de matrices son diagonalizables. Sean λ1 , λ2 , ..., λn los valores propios de B y ~v1 , ~v2 , ..., ~vn una base ortonormal de vectores propios. De acuerdo a lo visto en clases, se tiene que B = P · D · P t , donde D es una matriz diagonal con los valores propios y P es la matriz de vectores propios. Luego, q(~x) = (~x)t · B · ~x = (~x)t · (P · D · P t ) · ~x , ∀ ~x ∈ Rn . Si hacemos el cambio de coordenadas, ~z = P t · ~x, tenemos (~x)t · (P · D · P t ) · ~x = (P t · ~x)t · D · (P t · ~x) = (~z)t · D · ~z . 2
Como D =
λ1 0 . . . 0 0 λ2 . . . 0 .. .. . . . . .. . . 0 . . . 0 λn
, entonces si ponemos ~z =
z1 z2 .. .
, zi ∈ R, i = 1, 2, .., n,
zn
llegamos a t
(∗) (~z) · D · ~z =
n X
λi zi2 = λ1 z12 + λ2 z22 + · · · + λn zn2 .
i=1
Esta u ´ltima expresi´on la denominaremos forma can´ onica o elemental de una cuadr´atica. De esta manera, se ha concluido que cualquier forma cuadr´atica definida en Rn se puede llevar a su forma can´onica a trav´es de un cambio de coordenadas. Ejemplo: Consideremos la forma cuadr´atica q(x, y) = 5x2 + 8xy − y 2 . Entonces µ ¶ µ ¶ ¡ ¢ 5 4 x q(x, y) = x y · · . 4 −1 y µ
¶ 5 4 Los valores propios de la matriz B = son λ1 = −3 y λ2 = 7 y un par de 4 −1 µ ¶ µ ¶ 1 2 vectores propios asociados a λ1 , λ2 son w ~1 = y w ~2 = , respectivamente. −2 1 Estos vectores son ortogonales y forman una base de R2 . Para normalizarlos, basta definir ~1 ~2 ~v1 = ||w , ~v2 = ||w . De esta manera, w ~ 1 || w ~ 2 || µ D=
−3 0 0 7
Ã
¶ , P =
√1 5 −2 √ 5
√2 5 √1 5
! .
Por lo tanto, µ
5 4 4 −1
Ã
¶ =
√1 5 −2 √ 5
√2 5 √1 5
! µ ¶ Ã −3 0 · · 0 7
√1 5 √2 5
−2 √ 5 √1 5
! .
Finalmente, haciendo el cambio de coordenadas, ~z = P t · ~x, o sea, ¶ Ã 1 −2 ! µ ¶ µ √ √ z1 x 5 5 = · , 2 1 √ √ z2 y 5 5 llegamos a q(x, y) = q(~x) = q(P · ~z) = −3z12 + 7z22 . Geom´etricamente, el cambio de coordenadas se ilustra en la figura inferior, una rotaci´on de los ejes.
3
Siguiendo las notaciones de antes, o sea, q(~x) = (~x)t · B · ~x, con B una matriz sim´etrica, se definen los siguientes subespacios: (i) S − = ker(B − λi1 I) ⊕ ker(B − λi2 I) ⊕ · · · ⊕ ker(B − λik I), donde λi1 , λi2 , . . . , λik son los valores propios negativos de B, (ii) S 0 = ker(B − 0 · I) = ker(B) y (iii) S + = ker(B − λj1 I) ⊕ ker(B − λj2 I) ⊕ · · · ⊕ ker(B − λp I), donde λj1 , λj2 , . . . , λjp son los valores propios positivos de B. Estos espacios se denominan, espacio negativo, espacio nulo y espacio positivo de la cuadr´atica q, respectivamente. Es f´acil ver que Rn = S − ⊕ S 0 ⊕ S + . Por u ´ltimo, consideraremos las siguientes definiciones generales. Sea A ∈ Mn (R) una matriz sim´etrica. Diremos que (a) A es definida positiva ⇔ (~x)t · A · ~x > 0 , ∀ ~x ∈ Rn , ~x 6= ~0, (b) A es semi-definida positiva ⇔ (~x)t · A · ~x ≥ 0 , ∀ ~x ∈ Rn y existe al menos un vector ~x0 ∈ Rn , ~x0 6= ~0, tal que (~x0 )t · A · ~x0 = 0, (c) A es definida negativa ⇔ (~x)t · A · ~x < 0 , ∀ ~x ∈ Rn , ~x 6= ~0, (d) A es semi-definida negativa ⇔ (~x)t · A · ~x ≤ 0 , ∀ ~x ∈ Rn y existe al menos un vector ~x0 ∈ Rn , ~x0 6= ~0, tal que (~x0 )t · A · ~x0 = 0. Del cambio de coordenadas que definimos en (∗), es directo ver que (1) A es definida positiva ⇔ los valores propios son positivos, (2) A es semi-definida positiva ⇔ los valores propios son no-negativos (≥) y existe al menos un valor propio nulo, 4
(3) A es definida negativa ⇔ los valores propios son negativos, (4) A es semi-definida negativa ⇔ los valores propios son no-positivos(≤) y existe al menos un valor propio nulo. ´ : cada una de las definiciones (a), (b), (c) y (d) es posible hacerla para una OBSERVACION forma cuadr´atica, esto es, por ejemplo, q : Rn → R se dir´a una forma cuadr´atica definida positiva ⇔ q(~x) > 0, ~x 6= ~0. Como toda forma cuadr´atica en Rn se escribe como (~x)t · B · ~x, B sim´etrica, entonces una forma cuadr´atica q es definida positiva ⇔ su matriz asociada B es definida positiva. An´alogamente para los otros casos. 2 ´ CUADRICAS EN Rn . Sean q : Rn → R una forma cuadr´atica, L : Rn → R una funci´on lineal y g ∈ R. Una cu´adrica en Rn es un conjunto de la forma . n Q = {~x ∈ R q(~x) + L(~x) + g = 0} . ´ : En algunos textos aparece la definici´on de la forma OBSERVACION . Q = {~x ∈ Rn q(~x) + F (~x) = 0} , donde F es una funci´on af´ın. Precisamente, las funciones afines son aquellas que tienen la forma F (~x) = L(~x) + g, donde L es una funci´on lineal y g es una constante. En lo que sigue analizaremos el caso n = 2. En R2 las cu´adricas se denominan simplemente secciones c´onicas o c´onicas. Usaremos las siguiente notaciones: q(x, y) = ax2 + 2bxy + cy 2 , L(x, y) = dx + f y, donde a, b, c, d, f ∈ R son fijas. Luego, las c´onicas tienen la siguiente forma . Q = {(x, y) ∈ R2 ax2 + 2bxy + cy 2 + dx + f y + g = 0} . Adem´as, q y L se pueden reescribir de las siguiente forma µ ¶ µ ¶ ¡ ¢ a b x q(x, y) = x y · · = (~x)t · B · ~x , b c y ¶ µ ¶t µ ¶ x d x ~ t · ~x , L(x, y) = d f · = · = (d) y f y µ ¶ µ ¶ µ ¶ a b x d ~ donde B = , ~x = ,d= . b c y f ¡
¢
µ
5
As´ı, tenemos que Q = {(x, y) ∈ R2
.
~ t · ~x + g = 0} . (~x)t · B · ~x + (d)
De esta u ´ltima igualdad, vemos que para clasificar las c´onicas basta con estudiar los valores propios de la matriz B. Con la notaci´on usual, ponemos λ1 y λ2 los valores propios de B. Primer Caso: Los valores propios son distintos de 0. µ ¶ c1 Sea ~c = ∈ R2 . Consideremos la traslaci´on de coordenadas al punto ~c, esto es, c2 ¶ µ u1 := ~x − ~c . ~u = u2 Entonces, ~x satisface
~ t · ~x + g = 0 (~x)t · B · ~x + (d)
si y solamente si ~u satisface ³ ´ ~ t · ~u + (~c)t · B · ~c + (d) ~ t · ~c + g = 0 . (~u)t · B · ~u + 2(~c)t · B + (d) En lo anterior s´olo se usan propiedades algebraicas de la multiplicaci´on, la transpoci´on de matrices y el hecho que B es sim´etrica. Por otro lado, observemos que ~c es arbitrario pero fijo. Sin embargo, una elecci´on u ´til de ~c t t t ~ ~ ser´ıa la que hiciera posible 2(~c) · B + (d) = 0 . Dado que B es sim´etrica, la elecci´on anterior es equivalente a la existencia de ~c tal que 2B · ~c + d~ = ~0. Pero por la hip´otesis, los valores propios son distinto de cero, entonces det(B) 6= 0; luego, B es invertible, por lo tanto, existe un u ´nico ~c tal que d~ + 2B · ~c = 0, m´as a´ un, el vector ~c −1 ~ 1 est´a dado por la expresi´on ~c = − 2 · B · d. O sea, si ponemos ~cQ = − 21 · B−1 · d~ y ~u = ~x − ~cQ , entonces reemplazando tenemos que ~x satisface ~ t · ~x + g = 0 (~x)t · B · ~x + (d) si y solamente si ~u satisface (?) (~u)t · B · ~u + g˜ = 0 , donde g˜ := g − (~cQ )t · B · ~cQ . El vector ~cQ se denomina centro de la c´onica Q. ¶ µ z1 t , donde P es la matriz cuyas Por u ´ltimo, si hacemos el cambio ~z = P · ~u, ~z = z2 columnas son los vectores propios ortonormales de B( tal como lo hicimos en (∗)) y lo reemplazamos en (?), llegamos a 0 = (~u)t · B · ~u + g˜ = (~z)t · D · ~z + g˜ = λ1 z12 + λ2 z22 + g˜ . Para analizar esta u ´ltima expresi´on, separamos en los siguientes casos: 6
1. Los valores propios tienen el mismo signo. (i) Si los valores propios son positivos y g˜ > 0, entonces Q = Ø. (ii) Si los valores propios son positivos y g˜ = 0, entonces ~z = ~0; por lo tanto, ~u = ~0 y por ende, ~x = ~c; as´ı se concluye que Q = {~cQ }. (iii) Si los valores propios son positivos y g˜ < 0, entonces el conjunto de puntos que satisface λ1 z12 + λ2 z22 + g˜ = 0 es una elipse sobre los ejes coordenados nuevos(los definidos por los vectores propios de B). Por lo tanto, para retornar a las coordenadas (x, y) dadas por el vector ~x tenemos que pasar por la rotaci´on P , o sea, Q es una elipse rotada con centro en el vector ~cQ . En la figura inferior, se representa geom´etricamente el hecho anterior. Los vectores ~v1 y ~v2 son los directores de los ejes de la elipse los cuales son perpendiculares.
Un ´analisis an´alogo se puede hacer cuando los valores propios son negativos. 2. Los valores propios tiene distinto signo. Supongamos que λ1 < 0 < λ2 . Entonces la expresi´on λ1 z12 + λ2 z22 + g˜ = 0 corresponde a: ´ (a) Dos rectas si g˜ = 0. Estas tienen vectores directores à ! ! à 1 1 ¯ ¯ ~2 = ~ 1 = ¯¯ λ ¯¯ , D , D ¯ ¯ − ¯ λλ21 ¯ ¯ λ12 ¯ respectivamente; por lo tanto, al retornar a las variables originales, tenemos que Q ~ 1, P · D ~ 2 , respectivamente es la uni´on de dos rectas que siguen las direcciones P · D y se intersectan en ~cQ . 7
En la figura izquierda tenemos el panorama en las coordenadas (z1 , z2 ). En la figura derecha, tenemos la situaci´on en las coordenadas (x, y); la c´onica Q est´a representada en rojo (m´as remarcado que el izquierdo). (b) Una hip´erbola si g˜ 6= 0.
Estas representaciones son sobre los ejes nuevos que siguen la direcci´on de los vectores propios( la coordenada z1 se mueve sobre el eje generado por ~v1 y la coordenada z2 se 8
mueve sobre el eje generado por ~v2 ). Por lo tanto, Q corresponde a hip´erbolas, pero rotadas y con centro en el vector ~cQ , como se ve en las figuras inferiores.
Segundo Caso: Hay valores propios nulos . En este caso la matriz B no es invertible y por lo tanto, no es claro la existencia del vector ~c. De esta manera, intentaremos de un principio el cambio ~z = P t · ~x. Luego, ~x satisface ~ t · ~x + g = 0 (~x)t · B · ~x + (d) si y solamente si ~z satisface ~ t · P · ~z + g = 0 . (~z)t · D · ~z + (d) ˜ Si ponemos d~ =
µ
d˜ f˜
¶ = P t · d~ . y hacemos los reemplazos de ~z como antes, tenemos que
˜ 1 + f˜z2 + g = 0 . ~ t · P · ~z + g = λ1 z 2 + λ2 z 2 + dz (¨) (~z)t · D · ~z + (d) 2 1 De esta u ´ltima igualdad, concluimos lo siguiente: (i) Si ambos valores propios son nulos, entonces B = 02,2 , luego . 2 d~ • ~x + g = 0} . Q = {(x, y) ∈ R Este conjunto corresponde a una recta en R2 , salvo que d~ = ~0 y g 6= 0( en tal caso, Q = Ø) o bien d~ = ~0 y g = 0 (en este caso, Q = R2 ). 9
(ii) Supongamos que uno de los valores propios es nulo, para fijar ideas pongamos 0 = λ2 < λ1 . Entonces si usamos (¨), tenemos ˜ 1 + f˜z2 + g = 0 . (¥) λ1 z12 + dz Por lo tanto, si el coeficiente f˜ 6= 0, tenemos z2 =
˜ 1−g −λ1 z12 − dz , f˜
O sea, la ecuaci´on de una par´abola en los ejes generados por los vectores propios. Al regresar a las coordenadas (x, y), tenemos una par´abola rotada. En la figura inferior izquierda, tenemos el dibujo de la par´abola en las coordenadas (z1 , z2 ) y en el otro, en las coodenadas (x, y). Conviene aclarar que este dibujo corres1 ponde cuando el coeficiente −λ es positivo. f˜
Por u ´ltimo, si el coeficiente f˜ = 0, la expresi´on (¥) se reduce a ˜ 1+g =0 . λ1 z12 + dz Esto es una ecuaci´on de segundo orden. Las ra´ıces pueden ser reales o complejas. En el caso complejo, tenemos que Q = Ø. Si son reales, tenemos dos rectas paralelas que pasan por (r1 , 0) y (r2 , 0), respectivamente, donde r1 , r2 son las ra´ıces de la ecuaci´on. Estas podr´ıan ser iguales, en tal caso, se tendr´ıa una sola recta. Esto es en el sistema de coordenadas generado por los vectores propios. 10
En la figura el lado derecho, tenemos la representaci´on en las coordenadas (x, y). O sea, Q es la uni´on de dos rectas paralelas. En el caso de que uno de los valores propios es nulo, se habla de una c´onica degenerada. Estos son todos los posibles casos para una c´onica en R2 2 Ejemplo: Considere la c´onica de ecuaci´on x2 + 4xy + y 2 + 2x + 5 = 0. Usar lo anterior para determinar de que c´onica se trata y hacer un bosquejo. µ ¶ µ ¶ 1 2 2 ~ Soluci´ on: Tenemos que, d = ,B= ; sus valores propios son −1 y 3. Como 0 2 1 son distintos de cero, se tiene que B es invertible, por lo tanto, es una c´onica con centro y como los valores propios tienen distinto signo, se trata de una hip´erbola rotada. ! Ã 1 3 y g˜ = 16 Adem´as, el centro ~cQ = − 12 · B−1 · d~ = . 3 − 23 µ ¶ 1 Un vector propio asociado a λ1 = −1 es w ~1 = y uno asociado a λ2 = 3 es w ~2 = −1 µ ¶ 1 . Esta es una base de vectores propios pero no es ortonormal. Por lo tanto, como 1 estamos en R2 para ortonormalizar cada uno de ellos divimos por las respectivas normas. Nos queda : Ã 1 ! Ã 1 ! √ √ 1 1 2 2 ·w ~1 = · w ~ = ~v1 = , ~ v = . 2 2 −1 1 √ √ ||w ~ 1 || || w ~ || 2 2 2 11
Luego, la representaci´on para la c´onica es :
2
12