Hessen matriisi yleiselle usean muuttujan funktiolle (Edwards - PowerPoint PPT Presentation

1 / 15
About This Presentation
Title:

Hessen matriisi yleiselle usean muuttujan funktiolle (Edwards

Description:

Title: Slide 1 Author: Matematiikan laitos Last modified by: Matematiikan laitos Created Date: 12/12/2005 1:08:40 PM Document presentation format – PowerPoint PPT presentation

Number of Views:36
Avg rating:3.0/5.0
Slides: 16
Provided by: Matem1
Category:

less

Transcript and Presenter's Notes

Title: Hessen matriisi yleiselle usean muuttujan funktiolle (Edwards


1
Hessen matriisi yleiselle usean muuttujan
funktiolle
(EdwardsPenney Luku 13.10)
Neliömuotojen yhteydessä tutustuimme jo
reaalisiin, symmetrisiin 3?3-matriiseihin
ja toisaalta kahden muuttujan ääriarvojen
etsimisen yhteydessä 2. kl. derivaatojen
testiin. Nyt näemme, että nämä kaksi asiaa
voidaan yleistää ja yhdistää, kun otetaan
käyttöön käsite Hessen matriisi. Aluksi asetetaan
seuraava
Määritelmä. Reaalinen, symmetrinen matriisi A
on (i) positiividefiniitti, jos jokaiselle
reaaliselle vektorille X (¹ 0) pätee XTAX gt 0,
(ii) negatiividefiniitti, jos jokaiselle
reaaliselle vektorille X (¹ 0) pätee XTAX lt
0, (iii) indefiniitti, jos on olemassa reaalinen
vektori X jolle XTAX lt 0 ja reaalinen
vektori Y jolle YTAY gt 0.
Lasketaanpas An ominaisarvot eli ratkaistaan l
yhtälöstä
Esimerkki 1. Koska
neliömuoto!
Huomaamme, että positiividefiniitin matriisin
A kaikki ominaisarvot ovat positiivisia. Olisiko
tämä vain sattumaa?
aina, kun (x,y,z) ¹ (0,0,0), on A
positiividefiniitti.
2
Esimerkki 2. Koska
Lasketaan taas An ominaisarvot
neliömuoto!
Huomaamme, että indefiniitillä matriisilla A on
sekä positiivisia että negatiivisia ominaisarvoja
Olisiko tämäkin vain
sattuman kauppaa?
on A on indefiniitti.
Esimerkki 3. Koska
Laskemalla An ominaisarvot huomamme, että ne
kaikki ovat negatiivisia. Yleinen totuus on
seuraava
Lause. Reaalinen, symmetrinen matriisi A on (i)
posit.definiitti joss An ominaisarvot ovat
positiivisia, (ii) negat.definiitti joss An
ominaisarvot ovat negatiivisia, (iii)
indefiniitti joss Alla on sekä positiivisia
että negatiivisia ominaisarvoja.
aina, kun (x,y,z) ¹ (0,0,0), on A
negatiividefiniitti.
3
Tarkastellaan nyt yleistä nn muuttujan
reaaliarvoista funktiota fRn?R. Oletetaan,
että fn kaikki toisen kertaluvun
osittaisderivaatat ovat olemassa vieläpä
jatkuvina jossakin avaruuden Rn pisteen X (x1,
x2, ... ,xn) ympäristössä. Määritellään funktion
f Hessen matriisi seuraavalla tavalla
Kyseessä on siis n?n-matriisi, jonka alkioina on
funktioita. Koska oletimme osittaisderi- vaatat
jatkuviksi, on matriisi H(X) symmetrinen. Kiinteäl
lä Xn arvolla X0 on H(X0) reaalinen. Voimme
siis puhua matriisin H(X0) definiittisyydestä!
Esim. Tutki funktion f(x,y) excos(y) Hessen
matriisi definiittisyyttä pisteessä
(0,p/2). Ratkaisu. Hesse
excos(y)
-exsin(y)

-exsin(y)
-excos(y)
Nyt det(H0 - lI) l2 1 0. Siis l1 -1 lt 0
ja l2 1 gt 0.
Johtopäätös Ko. Hessen matriisi on indefiniitti
4
Tässä vaiheessa huomaamme, että kahden muuttujan
funktioon liittyvä diskriminantti, jota
tarkastelimme kriittisten pisteiden ja
ääriarvojen yhteydesä (toisen derivaatan
testi!) on itse asiassa erikoistapaus Hessen
matriisiista. Teoriaa voidaan nyt yleistää ja
yksin- kertaistaa seuraavasti
Lause. Olkoon funktiolla fRn?R jatkuvat toisen
kertaluvun osittaisderivaatat ja olkoon piste X0
kriittinen piste (käytännössä siis ?f/?xi(X0) 0
kaikilla i 1, ... , n). Silloin (i) Jos H(X0)
on positiividefiniitti, on X0 lokaali
minimipiste, (ii) Jos H(X0) on negatiividefiniitti
, on X0 lokaali maksimipiste, (iii) Jos H(X0) on
indefiniitti, on X0 satulapiste. (Muissa
tapauksissa lause ei sano mitään, kriittinen
piste on tutkittava muilla keinoin!)
Esim. Tutkitaan funktion f(x,y) sin(xy)
mahdollista ääriarvoa origossa.
(1) Aluksi pitää varmistaa, onko origo funktion
f(x,y) kriittinen piste osittaisderivoidaan!
(3) Tutkitaan tämän ominaisarvot
Erityisesti origossa osittaisderivaattojen arvot
ovat
Kyseessä on kriittinen piste. (2) Muodostetaan
Hesse
det(H0-l I) (-l)2 - 1 0 , josta
l1 -1 lt 0 ja l2 1 gt 0.
Koska kyseinen matriisi on indefiniitti, on
origo satulapiste
Erityisesti origossa (merk) H0
5
y2x2
Differentiaaleista 1-dim tapauksessa, kun
yf(x), on ?y f(x)?x (ErwardsPenney
Luku 13.6) Olkoon nn muuttujan funktiolla
f(x1,x2,,xn) on osittaisderivaatat
Silloin fn kokonaisdifferentiaali ?f on
Lisäämällä tähän kaavaan itseisarvomerkit saadaan
kaava, jota fysiikassa ym. käytetään mittaus-,
ym. virheen arviointiin, nim.kaava
Jos siis muuttujan xi mittaus- tai
arviointi- virhe on ?xin suuruinen (i1,,n),
niin fn kokonaisvirhe on enintään ?fmaxn
suuruinen.
Ratkaisu. ?x0.02x, ?y0.03y, ?z0.01z.
Esim. Olkoon f(x,y,z) xyz xy 2y2z3, missä
x,y ja z ovat mitattuja fysikaalisia suureita.
Jos mittaustulokseksi on saatu x1, y2 ja z3,
ja xn mittauksessa on mahdollista
mittausvirhettä 2, ja ylle ja zlle vastaavasti
3 ja 1, niin mikä on fn kokonaisvirhe
suurimmillaan?
Huom EP käyttää merkintää df eikä ?f
fn kokonaisvir- heelle saadaan näin yläraja
?fmax yz y0.02x xzx4yz30.03y xy
6y2z20.01z
26.46
x1 y2 z3
Yleensä fysikaalinen mittaustulos
annetaan muodossa f ? ?fmax, tässä 224 ? 26.5
Toisaalta f(1,2,3) 123 12 222 33
224, joten prosentuaalinen virhe on
6
Usean muuttujan funktion differentioituvuudesta U
sean muuttujan funktion osittaisderivaatat ovat
helposti ymmärrettäviä, ja ne yleistävät (eräällä
tavalla!) yhden muuttujan funktion derivaatan.
Derivaatta voidaan yleistää myös toisella
vaativammalla tavalla, nimittäin puhutaan
differentioituvasta usean muuttujan funktiosta.
Käsitellään tämä kolmen muuttujan funktiolle eli
funktiotyypille f(x,y,z) w. Määr. Funktion
f(x,y,z) w on differentioituva
pisteessä/alueessa, jos osittaisderivaatat fx,
fy, ja fz, ovat olemassa tässä pisteessä/alueessa
JA on olemassa funktio g(x,y,z) siten, että
f(x?x,y?y,z?z)-f(x,y,z) fx(x,y,z)?x
fy(x,y,z)?y fz(x,y,z)?z g(?x,?y,?z) eli
vektorimuodossa
Tässä x (x,y,z) ja 0 (0,0,0)!
Esim. Onko funktio
Määritelmän mukaan siis f differentioituva ?
fllä osittaisderivaatat. Implikaatio toisin
päin ei välttämättä päde, mutta aina sen sijaan
pätee fllä jatkuvat osittaisderivaatat ?
f
differentioituva Myös voidaan todistaa
implikaatio f differentioituva ? f jatkuva
kaikkialla differentioituva?
Kuvaajan perusteella voi jo päätellä, että suorat
y x ja y -x ovat epäjatkuvuus- kohtia ? ei
osit.deriv. ? f ei differentioituva suorilla y x
ja y -x
7
Usean muuttujan reaaliarvoisen funktion suunnattu
derivaatta yksikkövektorin u suuntaan
määritellään raja-arvona
Käytännössä suunnattu derivaatta lasketaan
vektorin u ja fn gradienttivektorin
pistetulon avulla, nimittäin
Kiinteällä arvolla x (x1,...,xn) suunnattu
derivaatta on luku. Mihin suuntaan se on suurin?
Vektoreiden välisen kulman ? cosini toteuttaa
tunnetusti
Siten
Tämä arvo on suurin, kun ? 0 eli yksikkövektori
u on gradientin suuntainen
8
Kahden muuttujan funktion gradientti

(EdwardsPenney Luku 13.8) Määr. Funktion f(x,y)
z pisteeseen (a,b,f(a,b)) piirretyn
gradienttivektorin ?f(a,b) lauseke on ?f(a,b)
f1(a,b)i f2(a,b)j (? luetaan nabla)
Esim. Etsi funktion
gradientti(vektori) pisteessä (1,2,1/5)
Ratkaisu.
Geometrisesti tulkittuna gradientti
ilmoittaa funktion f(x,y) suurimman
muutossuunnan xy-tasossa pisteessä (a,b). Esim.
Ajatellaan paikkakunnasta piirretyn tasokartta,
jolla pisteessä (x,y) korkeuden ilmoittaa yhtälö
h(x,y) x2y (jossakin rajoi- tetussa alueessa).
Jos seisotaan pisteessä (-1,-1,-1), niin missä
xy-tason suunnassa (eli kartalla) rinne on
jyrkin? Ratkaisu. Vektorin ?h(-1,-1)
h1(-1,-1)i h2(-1,-1)j suunnassa ?h(x,y)
h1(x,y)i h2(x,y)j 2xyi x2j, erityisesti
?h(-1,-1) 2i j
x1 y2
x1 y2
Siis ?f(1,2) 1/25(3i - 4j)

9
Huom! Tämä suunta on vain ajanhetkellä t 0, se
muuttuu kun pallo liikkuu eteenpäin, kuitenkin
aina (suurin piirtein) suuntaan -?h(x,y)
Jatkokysymys Jos pisteeseen (1,3) asetetaan
pallo, niin mihin suuntaan se lähtee
vierimään? Vastaus vektorin - ?h(1,3)
-(213i 12j) -6i - j suuntaan!
Suunnattu derivaatta Gradienttivektori ?f(a,b)
f1(a,b)i f2(a,b)j kertoo funktion f(x,y)
suurimman muutos- suunnan (suunnan, missä mäki
on jyrkin ylöspäin). Voidaan kysyä toisinpäin ja
ylei- semmin jos on annettu jokin xy-tason
vektori v, niin paljonko on rinteen
jyrkkyys pisteessä (a,b,f(a,b)) tämän vektorin
suuntaan? Vastauksen tähän antaa
suunnatun derivaatan käsite, joka lasketaan
kaavalla
Gradientti antaa suurimman kasvusuunnan ?
Esim. Laske suunnattu derivaatta funktiolle
h(x,y) x2y pisteessä (-1,-1) vektorin v i
2j suuntaan. Ratkaisu. Aiemmin laskimme jo,
että ?h(-1,-1) 2i j. Siten
Jatkokysymys 1. Missä xy-tason suun- nassa
pisteessä (-1,-1,-1) jyrkkyys 0 eli tapahdu
nousua eikä laskua? Ratkaisu. Etsitään vektori
v xi yj, s.e.
Siis suunnissa v i - 2j tai v -i 2j
? 2xy0 ? y -2x eli v xi - 2xj, x?0
Siis rinteen h(x,y) x2y jyrkkyys suunnassa i
2j on
n. 60
Nousua arctan
10
Jatkokysymys 2. Mitkä ovat niiden
xy-tason käyrien yhtälöt, joissa h(x,y) 1,2
ja 4? ne ovat tasa-arvokäyriä Ratkaisu.
Merkitään yksinkertaisesti x2y
1,2 ja 4
Huomaa yhteys tasa-arvokäyrien ja
topografi- karttojen korkeuskäyrien välillä jos
kuljet maastossa kartan mukaan yhdellä
korkeskäy- rällä, et nouse ylöspäin etkä laskeudu
alaspäin.
Jatkokysymys 3. Jos pisteeseen (-1,-1,-1)
ase- tetaan pallo, mitä xy-tason käyrää se
vierii ? Ratkaisu. Vierimiskäyrä on
kohtisuorassa kaik- kia ohittamiaan
tasa-arvokäyriä (i) x2y C vastaan. Lasketaan
siis ensin tasa-arvokäyrien tangentin
kulmakerroin y derivoimalla implisiit- tisesti
lauseketta (i), saadaan 2xy x2y 0.Siis
(ii) 2yy x. Mikä on tällainen käyrä? No,
senhän pitää selvästikin olla muo- toa y2 1/2x2
D (D vakio), nimittäin derivoimalla tämä
puolittain xn suht- teen saadaan tulokseksi
yhtälö (ii)! Ehdosta, että kyseinen käyrä
kulkee pisteen (-1,-1) kautta voidaan
laskea vakion D arvo (-1)2 1/2(-1)2 D
? D 1/2 Kysytty vierimiskäyrä on siis
y2 1/2x2 1/2
Toisiaan vastaan kohtisuorien
suorien kulmakertoimille k1 ja k2 on
k1 -1/ k2 Siis ilmeisesti etsityn käyrän
tangentin kulma- kertoimelle on voimassa y x/2y
2y ?
11
Usean muuttujan funktion sidotut ääriarvot.
Lagrangen menetelmä (EdwardPenney Luku 13.8)
Tähän asti olemme etsineet usean muuttujan
funktiolle f ääriarvoa asettamatta
ratkaisulle mitään erityistä rajoitusta. Nyt
vaadimme, että ääriarvon tulee lisäksi toteuttaa
reunaehto (eli side-ehto) g(x) 0. Lagrange
keksi jo 18. vuosisadalla, miten ongelma
ratkaistaan. Teoreema. n-n muuttujan funktion
f(x) sidotut ääriarvot, side-ehtona g(x) 0,
löytyvät Lagrangen polynomin L(x,?) f(x) ?
g(x) (n1 muuttujaa!) kriit.pist.
joukosta. Esim. Etsi funktion f(x,y,z) x2
y2 z2 ääriarvot lisäehdolla z2 x2 -1.
Ratkaisu. Lisäehto on yhtäpitävä ehdon
g(x) 0 kanssa, kun g(x) x2 -1- z2.
Siten Lagrangen polynomi on 4n
muuttujan funktio
L(x,y,z, ?) x2 y2 z2 ?(x2 -1- z2).
Etsitään Ln kriittiset pisteet,
jotka ovat osittaisderivaattojen nolla-kohdat.
Tämä L on neljän muuttujan funktio, joten sen
kuvaaja on jokin pinta 5-ulotteisessa
avaruudessa. Bill Gates ei vielä ole keksinyt,
miten sen saisi PowerPointilla näkymään ...
12
L(x,y,z, ?) x2 y2 z2 ?(x2 -1- z2).
Jos nyt x 0
on -z2 1 eli z i, ei käy
Jos taas z 0, on x2 1 eli x 1. O.K
Siis osittaisderivaattojen nollakohdat saadaan
arvoilla x1, y0, z0, ? -1 (1,0,0,-1)

x-1, y0, z0, ?
-1 (-1,0,0,-1)
Arvo f(1,0,0) (1)20202 1 on selvästikin
funktion minimi. Maksimia funktiolla f(x,y,z)
x2 y2 z2 ei selvästikään ole kun siihen
sijoitetaan side-ehto z2 x2 -1, saadaan
funktio h(x,y) 2x2 y2 -1, joka voi saada
kuinka suuria arvoja tahansa.
Huomautus. Joskus esiintyy seuraava
virhe sijoitetaan lisäehto g(x) alkuperäiseen
minimoi- tavaan funktioon f(x), ja etsitään näin
saadun uuden funktion h(x) vapaita ääriarvoja.
Näin ei tietenkään voida tehdä edellisen
esimerkin tapauksessa saataisiin minimiksi
-1. Sijoittamisella siis hukataan lisävaatimus.
13
Esim. Etsi funktion f(x,y) cosxsiny ääriarvot
ehdolla x y alueessa
Ratkaisu. Lagrangen polynomi on L(x,y,?)
cos(x)sin(y) ?(x-y), osittaisderivoidaan!
Siis sidotut ääriarvot ovat
Esim. Etsi pisteen (7,2,1) lyhin etäisyys
tasosta -2x8z -5 Lagrangen menetelmällä. Ratkai
su. Minimoimme etäisyyttä
gtL... gtsolve(diff(L,x)0, diff(L,y)0, diff(L,z
)0, diff(L,?)0,x,y,z, ?) ja saadaan vastaus
lisäehdolla g(x,y,z) -2x8z 5 0. Lagrangen
polynomi on nyt muotoa
Näillä arvoilla etäisyys on
Etsitään taas osittaisderivaattojen
nollakohdat, siihen tarvitaan vain 2 Maple-käskyä
14
Lagrangen menetelmä, kun side-ehtoja on kaksi
kpl g(x) ja h(x) 0, saa muodon L(x,?,?)
f(x) ?g(x) ?h(x) (n2 muuttujaa) ratkaisut
löytyvät tämän funktion kriittisten pisteiden
joukosta Esim. Tutki, onko funktiolla f(x,y,z)
xyz ääriarvoja side-ehdoilla x2z21 ja
xy. Ratkaisu. Side-ehdot tulee kirjoittaa
muotoon g(x,y,z) x2z2-10 ja h(x,y,z) x-y
0. Silloin Lagrangen polynomi on viiden muuttujan
x,y,z,?,? funktio
L(x,y,z,?,? ) xyz ?(x2z2-1) ?(x-y) Sen
kriittiset pisteet ovat osittaisderivaattojen
0-kohdat
Tämä viiden tuntemattoman ja viiden
yhtälön ei-lineaarinen yhtälöryhmä on
ratkaistu Maplen solve-käskyllä, joka antaa
vastaukseksi x y 0, z 1, eli kriittisiä
pisteitä on kaksi kappaletta (0,0,-1) ja
(0,0,1) Mikä on niiden luonne? Piste (0,0,1) on
selvästi satulapiste, ensinnäkin f (0,0,1)
0 toisaalta, jos ollaan hyvin lähellä pistettä
(0,0,1), saa f(x,y,z) kuinka pieniä
positiivisia ja negatiivisia arvoja hyvänsä sen
perusteella, onko x ja y positiivinen/negatiivin
en. Vastaavalla perusteella (0,0,-1) on
satulapiste,
15
Taylor polynomi usean muuttujan funktiolle
Yhden muuttujan reaaliarvoiselle funktiolle f(x)
tunnetaan (m. asteen) Taylor-polynomi pisteen c
ympäristössä, kun f(x)llä on (ainakin) m1
asteen jatkuvat derivaatat cn sisältämällä
välillä
Kun f(x) on riittävän säännöllinen pisteen c
läheisyydessä, voidaan se lisäksi esittää Taylor
kehitelmänsä avulla eli lausekkeena
Nämä käsiteet voidaan yleistää nn muuttujan
reaaliarvoiselle funktiolle f(x).
Funktion f(x1,...,xn) m. asteen Taylor polynomi
pisteen c (c1,...,cn) ympäristössä on
...kertaa vastaavien koordinaattien erotus
kaikki mn asteen sekaderivaatat...
...pisteessä C
Write a Comment
User Comments (0)
About PowerShow.com