UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA
PROJETO PIBEG
Unidade Ι Ι Ι Ajuste de curvas 0011 0010
12 45
Sumário:
1 – Introdução 2 – Quadrados Mínimos (Caso discreto – Modelo linear) 3 – Quadrados Mínimos (Caso discreto – Modelo não linear) 3.1 – Teste de alinhamento 4 – Quadrados Mínimos (Caso contínuo)
0011 0010
12 45
1 – Introdução
0011 0010
12 45
Em geral, experimentos em laboratório geram um conjunto de dados que devem ser analisados com o objetivo de determinar certas propriedades do processo em análise. 14
12
10
8
6
4
2
0 1
1.5
2
2.5
3
3.5
4
4.5
5
Obter uma função matemática que represente (ou que ajuste)
12 45
estes dados, permite fazer simulações do processo, reduzindo assim repetições de experimentos que podem ter um custo alto. 0011 0010
Nesta unidade será estudado uma das técnicas mais utilizadas para se ajustar dados, conhecida com Método dos Quadrados Mínimos (MQM).
0011 0010
12 45
2 – Quadrados Mínimos Caso discreto - Modelo linear
0011 0010
12 45
Seja uma tabela de pontos (xi, yi), i = 0, 1,..., m, xi ∈[a, b]. O problema de ajuste de curvas consiste em escolher n funções g1, g2,..., gn contínuas e linearmente independentes em [a, b] e obter n constantes α 1, α 2,...,α n tais que: ϕ (xk) = α 1g1(xk) + α 2g2(xk) +...+ α ngn(xk) seja uma boa aproximação para os pontos y(xk), ou seja, ϕ k ≈ yk. Este é um modelo linear porque a função ϕ (x) utilizada no ajuste dos pontos é linear nos parâmetros α j, embora as funções gj(x) possam ser não-lineares (ex.: ex, 1 + x2, ln(x) ).
0011 0010
12 45
A escolha das funções gj(x) pode ser feita observando o gráfico dos pontos tabelados, chamado de diagrama de dispersão, Através do qual podemos observar o tipo de curva que melhor se ajusta aos dados.
0011 0010
12 45
Exemplo 1: Considere a seguinte tabela de pontos. xk
0.1
0.2
0.5
0.7
0.8
0.9
1.1
1.23 1.35
1.5
1.7
1.8
yk
0.19 0.36 0.75 0.91 0.96 0.99 0.99 0.94 0.87 0.75 0.51 0.35
1
A análise do diagrama de dispersão mostra que a função que procuramos se comporta como uma parábola.
0.8
0.6
0.4
0.2
0 0
0.5
1
1.5
2
Logo poderíamos escolher as funções g1(x) = 1, g2(x) = x e g3(x) = x2, pois ϕ (x) = α 1g1(x) + α 2g2(x) + α 3g3(x) representa uma família de parábolas, e com a escolha adequada dos α j teremos aquela que melhor se ajusta aos pontos.
0011 0010
12 45
Para obter a curva que melhor se ajusta a função tabelada a idéia é impor que o desvio em relação à função aproximada seja o menor possível, ou seja: dk = |yk – ϕ (xk)| 1.5
ϕ (x) 1
yk
dk
0.5
0
-0.5
d2 d1
-1
0011 0010
-1.5 -2
d3
-1.5
-1
-0.5
0
0.5
1
1.5
2
12 45
O Método dos Quadrados Mínimos consiste em escolher α j de tal forma que a soma dos quadrados dos desvios seja mínima: 2 ∑ d = ∑ [ y k − ϕ ( xk ) ] ⇒ m
k =1
2 k
m
k =1
2 ∑ d = ∑ [ yk − α1 g1 ( xk ) − α 2 g 2 ( xk ) − − α n g n ( xk )] m
k =1
2 k
m
k =1
isto é, encontrar os parâmetros α j que minimizam a função: ) ϕ( xk F (α1 , α 2 ,..., α n ) = ∑ [ yk − (α1 g1 ( xk ) + ... + α n g n ( xk ))]2 m
k =1
0011 0010
12 45
A função F é uma função quadrática que satisfaz F(α ) ≥ 0 ∀α ∈ R m . Isto é, uma função limitada inferiormente e portanto tem um ponto de mínimo. O ponto crítico de F(α ) é encontrado igualando seu gradiente a zero: ∂F ∂α j
=0
j = 1, 2,..., n.
(α1 ,...,α n )
Desta forma temos: m
2 ∑[yk – α 1g1(xk) - α 2g2(xk) – ... – α ngn(xk)](-gj(xk)) = 0 k =1
0011 0010
12 45
A equação anterior pode ser reescrita como: m k∑=1 g1(xk)g1(xk)
α1 +
m k∑=1 g2(xk)g1(xk)
m ∑ g (x )g (x ) k =1 1 k 2 k α1 +
m k∑=1 g2(xk)g2(xk)
m ∑ g (x )g (x ) k =1 1 k n k α1 +
m m y g (x ) α 2 + + k∑=1 gn(xk)g1(xk) α n = k∑=1 k 1 k
m α + + 2 k∑=1 gn(xk)g2(xk)
m α = n k∑=1 yk g2(xk)
m m m k∑=1 g2(xk)gn(xk) α 2 + + k∑=1 gn(xk)gn(xk) α n = k∑=1 yk gn(xk)
Assim, para obter α j temos que resolver o seguinte sistema: A11 A21 A 31 A n1
A12 A22 A32 An 2
0011 0010
A13 A23 A33 An 3
A1n A2 n A3n Ann
α1 b1 α 2 b2 α = b 3 3 α b n n
onde,
m
Aij = ∑ gi(xk)gj(xk) k= 1
m
bi = ∑
k= 1
yk gi(xk)
Observação
12 45
A matriz A é a matriz Hessiana de F(α ), portanto se A for positiva definida, garante-se que o ponto crítico é ponto mínimo.
0011 0010
12 45
No exemplo anterior ajustamos os dados a uma parábola, mas outras funções bases poderiam ser usadas. Como exemplo, poderíamos pensar que os dados representam o primeiro meio período de uma função senoidal. π E neste caso poderíamos tomar ϕ (x) = α 1 + α 2sen( 2 Afinal qual seria a melhor escolha?
x).
A soma dos quadrados dos desvios em cada ponto tabelado fornece uma medida que pode ser usada como parâmetro de comparação entre ajustes diferentes. n
d = ∑ [ yk − ϕ ( xk )]2 k =1
0011 0010
12 45
Aplicando o Método dos Quadrados Mínimos para o caso da função senoidal, obtém-se: π ϕ ( x) = 0.0136 + 1.0193sen x 2 1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
0011 0010
0
0.5
1
1.5
2
12 45
Calculando a soma dos quadrados dos desvios para cada caso: Parábola:
12
Sr = ∑ [ y ( xk ) − ϕ ( xk )]2 =0.00011 k =1
Senóide:
12
Sr = ∑ [ y ( xk ) − ϕ ( xk )]2 =0.02835 k =1
Portanto, para este caso, o melhor ajuste foi obtido usando a parábola.
0011 0010
12 45
2.1 – Coeficiente de correlação (r) Fornece uma medida do percentual de pontos bem ajustados:.
St − S r r = St 2
onde,
m
S t = ∑ ( yk − ym ) k =1
m
S r = ∑ ( yk − ϕi )
m
2
ym =
∑ yk
k =1
m
2
k =1
0011 0010
12 45
3 – Quadrados Mínimos Caso discreto - Modelo não linear
0011 0010
12 45
Existem casos, onde o diagrama de dispersão de uma função indica que os dados devem ser ajustados por uma função que não é linear com relação aos parâmetros α j. Como exemplo, considere os seguintes dados: xk yk
-1.0
-0.5
0
0.5
1
1.5
2.0
2.5
3
0.157 0.234 0.350 0.522 0.778 1.162 1.733 2.586 3.858
4
Observando o diagrama podemos considerar que os dados tem um comportamento exponencial, que nos sugere o seguinte ajuste:
3.5 3 2.5 2
ϕ ( x) = α1eα 2 x
1.5 1 0.5 0 -1
-0.5
0011 0010
0
0.5
1
1.5
2
2.5
3
12 45
Para aplicar o Método dos Quadrados Mínimos torna-se necessário efetuar uma linearização do problema. A linearização da função escolhida para ajustar os pontos anteriores deve ser feita da seguinte forma: ϕ( x) = α1eα x ⇒ 2
z = ln(ϕ ( x)) ⇒
z = ln α1 + α2 x
Fazendo β 1 = lnα 1 e β 2 = α 2 o problema consiste em ajustar os dados de z pela reta: z(x) = β 1 + β 2x 0011 0010
12 45
Para isso devemos construir uma nova tabela com os dados de zk = ln(yk) = β 1 + β 2x. xk
-1.0
-0.5
0
0.5
yk
0.166
0.189
0.250
0.600
1
1.5
2.0
2.5
3
0.800 1.200 1.800 2.640 3.700
zk = ln(yk) -1.796 -1.666 -1.386 -0.511 -0.223 0.182 0.588 0.971 1.308 9
F ( β1 , β 2 ) = ∑ [ z ( xk ) − ( β1 + β 2 xk )]2 k =1
9 (1) 9 x β1 9 z ∑ k ∑ k k∑=1 = k =1 k =1 9 9 9 2 ∑ xk ∑ xk β 2 ∑ z k xk k =1 k =1 k =1 Resolvendo o sistema anterior obtemos a seguinte solução: β 1 = -1.114 β 2 = 0.832 0011 0010
12 45
Desta forma os valores de α j são dados por: α1 = e β = 0.328 1
α 2 = β 2 = 0.832
Portanto temos:
ϕ ( x) = α1eα 2 x = 0.328e 0.832 x 5
4
3
2
1
0011 0010
0 -2
-1
0
1
2
3
4
12 45
Para calcular o coeficiente de correlação escrevemos a seguinte tabela: 9
y=
∑ yk k =1
9
= 1.2606
ϕ
(yk - ϕ k)2
yk
(yk – y )2
0,166
1,1980
0,1427
0,0005
0,189
1,1482
0,2164
0,0007
0,25
1,0212
0,3280
0,0061
0,6
0,4363
0,4972
0,0106
0,8
0,2121
0,7537
0,0021
1,2
0,0037
1,1425
0,0033
1,8
0,2910
1,7320
0,0046
2,64
1,9029
2,6255
0,0002
3,7
5,9509
3,9799
0,0783
∑
12,1644
k
0,1066
2
9
S t = ∑ ( yk − ym ) = 12.1644 k =1
9
2
S r = ∑ ( yk − ϕi ) = 0.1066 k =1
0011 0010
⇒
r2 =
S t − S r 12.1644 − 0.1066 = = 0,9912 St 12.1644
r = 0.9956
12 45
Linearização de algumas curvas: • Curva Hiperbólica y=
1 α1 + α 2 x
⇒ z = α1 + α 2 x
onde z = 1
y
• Curva Exponencial y = α1 (α 2 ) x
⇒ z = β1 + β 2 x onde z = ln( y ) , β1 = ln(α1 ) , β 2 = ln(α 2 )
• Curva Geométrica α y = α1 ( x ) ⇒ ln( y ) = ln( α1 ) + α 2 ln( x) onde z = ln ( y ), t = ln ( x ), 2
z = β1 + β 2 t 0011 0010
β1 = ln(α1 ), β 2 = α 2
12 45
3.1 – Teste de Alinhamento Uma vez escolhida uma função não linear em α 1, α 2,..., α para ajustar uma função dada, uma forma de verificarmos se a escolha feita foi razoável é aplicarmos o teste de alinhamento, que consiste em:
n
i) fazer a “linearização” da função não linear escolhida; ii) fazer o diagrama de dispersão dos novos dados; iii) se os pontos do diagrama (ii) estiverem alinhados, isto significará que a escolha da função foi adequada.
0011 0010
12 45
Exemplo 4: Considere a função dada pela tabela: xk
-8
-6
-4
-2
0
2
4
yk
30
10
9
6
5
4
4
1 Qual das funções a) y ( x) = ou a + bx
b) y ( x) = ab
x
ajustaria melhor os dados da tabela? Em primeiro lugar devemos linearizar as funções: 1 = De y ( x) , obtemos : a + bx x -8 -6 -4 -2 z1 ( x) = a + bx
k
0
0011 0010
4
z1=1/yk 0.03 0.10 0.11 0.17 0.20 0.25 0.25
De y ( x) = ab t , obtemos : z2 ( x) = ln a + x ln b
2
xk
-8
-6
-4
-2
0
12 45 2
4
z2=ln(yk) 3.40 2.30 2.20 1.79 1.61 1.39 1.39
Fazendo o diagrama de dispersão para cada função:
z1 = a + bx
z 2 = ln a + x ln b
0.35
3.5
0.3 3 0.25 2.5
0.2
0.15
2
0.1 1.5 0.05
0 -8
-6
-4
-2
0
2
4
1 -8
-6
-4
-2
0
2
4
12 45
Vemos que os dados de z1 = a + bx se aproximam mais de uma reta. Assim, devemos escolher y = 1 a + bx para ajustar os dados. 0011 0010
4 – Quadrados Mínimos Caso contínuo
0011 0010
12 45
No caso contínuo temos uma função f(x) dada num intervalo [a, b] e não mais uma tabela de pontos. O procedimento é análogo ao caso discreto. Escolhidas as funções bases gj devemos determinar a função ϕ (xk) = α 1g1(xk) + α 2g2(xk) +... + α ngn(xk) de modo que o desvio seja mínimo, onde: b
d = ∫ ( f ( x) − ϕ ( x) ) dx 2
a
Neste caso os α j também são determinados pela resolução de um sistema, onde os elementos Aij são obtidos por intermédio do produto interno entre as funções gi(x) e gj(x). b
Aij = ∫ g i ( x) g j ( x) dx a
12 45
E os elementos bi pelo produto interno entre f(x) e gj(x), ou seja: b
0011 0010
bi = ∫ f ( x) g j ( x)dx a