|
|
147. sor: |
147. sor: |
| Megjegyezzük, hogy azt, hogy ez lokális maximum még a másodikderivált próbával is sikeresen ellenőrizhető. | | Megjegyezzük, hogy azt, hogy ez lokális maximum még a másodikderivált próbával is sikeresen ellenőrizhető. |
| | | |
− | ==Implicit függvény deriváltja==
| |
| | | |
− | '''Implicit''' megadású '''függvény'''ről akkor beszélünk, amikor egy függvény megadása nem (az explicit módon) ''y'' = ''f''(''x'') alakban történik, hanem az x és y kapcsolatát egy mindkét változót tartalmazó
| |
− | :<math>F(x,y) = 0 \,</math>
| |
− | egyenlet írja le.
| |
− | Például adjunk meg olyan függvényt, melynek grafikonja valamely kör egy szakasza. Az
| |
− | :<math>x^2+y^2=1\,</math>
| |
− | egyenletű körből könnyű az ''y'' változót kifejezni, az <math>\mbox{ }_{y=\sqrt{1-x^2}}</math> és <math>\mbox{ }_{y=-\sqrt{1-x^2}}</math> alakokat kapjuk. Bonyolultabb esetekben, például a
| |
− | :<math>\sin y =x\,</math>
| |
− | esetén semmi reményünk, hogy az ''y'' változóra valamilyen egyenletrendezéssel általános képletet kapjunk. Az ilyen példák miatt nevezik ezeket a típusú függvényeket ''implicit'', avagy régi, választékos kifejezéssel élve ''bennrekedt'' függvényeknek. A differenciálszámítás szempontjából megelégedhetünk azzal, ha az implicit függvény deriváltját ki tudjuk számolni. Sok esetben ebből már következtethetünk a függvényre vagy annak viselkedésére is.
| |
− |
| |
− | A modern analízis szemszögéből egy N × M <math>\rightarrow</math> K normált terek között ható ''F'' függvény ''a'' ∈ ''N'' és ''b'' ∈ ''M'' pontokhoz tartozó implicit függvényén olyan, az ''a'' egy ''U'' környezetén értelmezett és a ''b'' egy ''V'' környezetébe képező ''f'':''U'' <math>\rightarrow </math> ''V'' függvényt értünk, melyre f(a)=b és minden ''x'' ∈ ''U'' pont esetén rendelkezik az
| |
− | :<math>F(x,f(x))=0\,</math>
| |
− | tulajdonsággal. Amelyet szavakban úgy fogalmazhatunk meg, hogy az F(x,y)=0 egyenletből az ''y'' változó kifejezhető y=f(x) alakban.
| |
− |
| |
− | Most szorítkozzunk csak a kétváltozós esetre és tegyük fel, hogy létezik differenciálható implicit függvénye a differenciálható F függvénynek. Ekkor az F(x,y) függvény implicit függvénye az f(x), ha egy adott (u,v) pontban:
| |
− | :F(u,v)=0 és
| |
− | :minden az f értelmezési tartományába eső x-re F(x,f(x))≡0 és
| |
− | :f(u)=v,
| |
− | akkor világos, hogy ha
| |
− | :0 ≡ φ(x) = F(x,f(x)) = (F<math>\circ</math>(id,f))(x) ,
| |
− | akkor
| |
− | :φ'(x) ≡ 0
| |
− | így tehát a függvénykompozíció deriválásának szabálya szerint:
| |
− | :<math>\varphi'(u)=[\partial_1F(u,v),\partial_2F(u,v)]\cdot \begin{bmatrix}1\\f'(u)\end{bmatrix}=\partial_1 F(u,v)+\partial_2F(u,v)\cdot f'(u)\,=0</math>
| |
− | így
| |
− | :<math>f'(u)=-\frac{\partial_1 F(u,v)}{\partial_2 F(u,v)} \,</math>
| |
− |
| |
− | ==Implicitfüggvény tétel==
| |
− |
| |
− |
| |
− | '''Tétel''' – ''Implicitfüggvény-tétel '''R'''-beli implicit függvényre'' – Legyen ''F'' az '''R'''<sup>2</sup> egy részhalmazán értelmezett, '''R'''-be képező függvény, mely az értelmezési tartománya egy ''(a,b)'' belső pontjában erősen differenciálható, F(a,b) = 0 és
| |
− | :<math>\partial_2 F(a,b)\neq 0</math>
| |
− | (azaz (a,b)-ben az ''y'' szerinti [[parciális derivált]]ja nem nulla).
| |
− | Ekkor van a-nak olyan <math>I</math> és b-nek olyan <math>J</math> környezete, hogy F-nek egyértelműen létezik az (a,b) párhoz tartozó f: <math>I</math> <math>\rightarrow</math> <math>J</math> implicit függvénye, mely erősen differenciálható a-ban és deriváltja:
| |
− | :<math>f'(a)=-\frac{\partial_1 F(a,b)}{\partial_2 F(a,b)}</math>
| |
− |
| |
− | ''Bizonyítás.'' A (a,b)-beli erős differenciálhatóságból következik, hogy F folytonosan differenciálható (a,b)-ben. Választhatunk tehát olyan <math>I</math> és J nyílt intervallumokat, a és b körül, hogy <math>I</math> × J-n ∂<sub>2</sub>F sehol sem nulla, azonos előjelű. ''Feltehetjük, hogy ∂<sub>2</sub>F pozitív''. Vegyük észre, hogy az implicit függvény létezése egyenértékű azzal, hogy minden ''x'' ∈ <math>I</math>-re az F( x , . ) parciális függvénynek zérushelye van J-ban, hiszen ekkor minden x-hez létezik olyan ''y'' ∈ J, hogy F(x,y)=0. Belátjuk, hogy minden ilyen x-hez egyetlen zérushelye van F( x , . )-nek.
| |
− |
| |
− | Tekintsük a folytonos F( a , . ) parciális függvényt. Az erős differenciálhatóságból és a pozitívra választott deriváltból következik, hogy ez <math>I</math>-n szigorúan monoton növekvő. Mivel b-ben zérushelye van ( F(a,b)=0 ), ezért van olyan <math>y_2</math> > b pont, hogy ott F( a , . ) pozitív és <math>y_1</math> < b pont, hogy ott F( a , . ) negatív. Ekkor F folytonossága miatt van az (a,<math>y_1</math>) pontnak olyan környezete, ahol F negatív és
| |
− | van az (a,<math>y_2</math>) pontnak olyan környezete, ahol F pozitív. Most definiáljuk át <math>I</math>-t és J-t úgy, hogy <math>I</math> × J-n az F egy J-beli elem fölött mindenhol pozitív, egy J-beli elem alatt mindehol negatív értéket vegyen föl.
| |
− |
| |
− | Az erős differenciálhatóságból az is következik, hogy minden x ∈ <math>I</math>-re az F( x , . ) függvény is szigorúan monoton növekvő, negatív és pozitív értéket is felvevő folytonos függvény, így a [[Bolzano-tétel]] alapján létezik <math>y_x</math> zérushelye és mindegyiknek egyetlen zérushelye létezik. Állítjuk, hogy a φ:<math>I</math> <math>\rightarrow</math> J, x <math>\mapsto</math> <math>y_x</math> függvény implicit függvénye F-nek, azaz minden x ∈ <math>I</math>-re F(x,φ(x))=0.
| |
− |
| |
− | Könnyen belátható, hogy φ folytonos a-ban, hiszen ha a-hoz közeledve mindig találnánk olyan x pontot, hogy φ(x) egy adott ε-nál mindig jobban eltér b-től, akkor φ(x) egy olyan környezetbe esne bele, ahol F mindenhol egy pozitív számnál nagyobb vagy mindenhol egy negatív számnál kisebb. Ám, F(x,φ(x))=0, így ez ellentmondana
| |
− | F folytonos tulajdonságának.
| |
− |
| |
− | φ erősen differenciálható (a,b)-ben, hiszen tetszőleges <math>x_1</math>, <math>x_2</math> ∈ <math>I</math>-re az F erős differenciálhatósága miatt fennáll
| |
− | :<math>0=F(x_1,\varphi(x_1))-F(x_2,\varphi(x_2))=</math>
| |
− | :<math>=\partial_1F(a,b)(x_2-x_1)+\partial_2F(a,b)(\varphi(x_2)-\varphi(x_1))+</math>
| |
− | :<math>+\varepsilon\cdot(x_2-x_1)+\eta\cdot(\varphi(x_2)-\varphi(x_1))</math>
| |
− | azaz (a pozitív ∂<sub>2</sub>F(a,b) miatt pozitívra választható ∂<sub>2</sub>F(a,b)+η miatt):
| |
− | : <math>\frac{\varphi(x_2)-\varphi(x_1)}{x_2-x_1}=-\frac{\partial_1F(a,b)+\varepsilon}{\partial_2F(a,b)+\eta}</math>
| |
− | és innen (<math>x_1</math>,<math>x_2</math>)<math>\to</math>(a,a) határátmenetet véve, a másodendű tagok eltűnését követően kapjuk az állítás eredményét. <big><big><big>[[Quod erat demonstrandum| ■ ]]</big></big></big>
| |
− |
| |
− | Felhívjuk a figyelmet arra, hogy az implicit függvény értékére fennáll ugyan a
| |
− | : <math>\mbox{ }_{\varphi(x)=\varphi(a)-\frac{\partial_1F(a,b)+\varepsilon}{\partial_2F(a,b)+\eta}(x-a)}</math>
| |
− | egyenlőség, de mivel ε és η ki nem írt argumentumaiban szerepel φ(x), ezért ez sem egy explicit alak.
| |
− |
| |
− |
| |
− |
| |
− | === Példák===
| |
− |
| |
− | Tekintsük a következő egyenletű síkgörbét:
| |
− | :<math>x^5+xy+y^5=3\,</math>
| |
− | Nem lenne könnyű feladat kifejezni belőle y-t, mert az ötödfokú egyenletnek nincs általános megoldóképlete. Mivel a baloldal akárhányszor differenciálható, ezért joggal feltételezhetjük, hogy bizonyos pontokban létezik implicit függvénye. Tegyük fel, hogy φ ilyen függvény. Ekkor az egyenlet
| |
− | :<math>x^5+x\varphi(x)+(\varphi(x))^5=3</math>
| |
− | alakú, melynek minden olyan x-nél, ahol φ differenciálható:
| |
− | :<math>5x^4+\varphi(x)+x\varphi'(x)+5\varphi^4(x)\cdot\varphi'(x)=0</math>
| |
− | ahonnan a derivált:
| |
− | <math>\varphi'(x)=-\frac{5x^4+\varphi(x)}{5\varphi^4(x)+x}</math> vagy szimbolikusan: <math>y'=-\frac{5x^4+y}{5y^4+x}</math>.
| |
− | Alaposabb vizsgálatokkal kideríthető, hogy ez a derivált minden pontban létezik és negatív, így az implicit függvény mindenhol létezik és szigorúan monoton csökkenő. Vegyük észre, hogy a nevezőben lévő kifejezés pont ∂<sub>y</sub>F(x,y) és az implicit függvény létezésének feltétele pont a nevező nullától különböző volta.
| |
− | ==Többváltozós eset==
| |
− |
| |
− | Ebben az esetben is az „érintősík” végtelenül közelítő tulajdonsága játszik majd fontos szerepet. Jól látható az összefüggés, ha feltesszük, hogy ''F'' egy '''R'''<sup>n</sup>×'''R'''<sup>m</sup>-en értelmezett affin függvény, azaz egy lineáris leképezés eltoltja. Ekkor
| |
− | :''F(x,y) = F(a+h,b+k) = F(a,b)+dF<sub>1</sub>(a,b)h+dF<sub>2</sub>(a,b)k''.
| |
− | Amennyiben ''y = y(x)'' olyan, hogy ''y(a) = b'' és ''F(x,y(x)) = 0'', akkor fennáll a ''0 = dF<sub>1</sub>(a,b)h + dF<sub>2</sub>(a,b)k''
| |
− | egyenlőség és ''k'' kifejezhető, amennyiben az ''A = dF<sub>2</sub>(a,b)'' mátrix invertálható. A ''B = dF<sub>1</sub>(a,b)'' jelöléssel ekkor
| |
− | :''k = -(A<sup>-1</sup><math>\cdot</math>B) h''.
| |
− | Általános esetben ez csak egy másodrendűen kicsiny tag hozzávételével lesz igaz, de az implicit függvény létezésének belátásához szükséges a fenti gondolatmenet is.
| |
− |
| |
− | [[Banach-tér|Banach-terek]] esetén (melyek akár végtelen [[dimenzió]]sak is lehetnek) a tétel a következő.
| |
− |
| |
− | '''Tétel''' – ''Implicitfüggvény-tétel Banach-terekre'' – Legyen E, H, G Banach-terek, F:E × H <math>\rightarrow</math> G olyan függvény, mely (a,b) ∈ E × H-ban erősen differenciálható. Ha a ∂<sub>2</sub>F(a,b) lineáris leképezés injektív és az inverzével együtt folytonos, akkor egyértelműen létezik az F-nek egy az (a,b) párhoz tartozó f lokális implicit függvénye, ez erősen differenciálható a-ban és differenciálja:
| |
− | : <math>df(a)=-(\partial_2 F(a,b))^{-1}\circ(\partial_1 F(a,b))</math>
| |
− |
| |
− | Vagy egy kevésbé absztrakt tétel:
| |
− |
| |
− | '''Tétel''' – ''Implicitfüggvény-tétel '''R'''<sup>n</sup>-re'' – Legyen F:'''R'''<sup>n</sup>×'''R'''<sup>m</sup><math>\rightarrow</math>'''R'''<sup>m</sup> folytonosan differenciálható függvény, (a,b) ∈ '''R'''<sup>n</sup>×'''R'''<sup>m</sup>olyanok, hogy F(a,b)=0 és <math>\mbox{ }_{\det\left(\frac{\partial F_i(a,b)}{\partial y_k}\right)_{i,k=1,...,m}\ne 0}</math>. Ekkor egyértelműen létezik F-nek egy az (a,b)-hez tartozó lokális implicit függvénye.
| |
| | | |
| | | |
A lap 2009. április 2., 20:21-kori változata
Másodrendű parciális deriváltak
Ha f a H ⊆ R2 halmazon értelmezett R-be képező, az u ∈ H-ban differenciálható függvény és a
-
gradiensfüggvény szintén differenciálható u-ban, akkor f-et u-ban kétszer differenciálhatónak nevezzük és az f függény u-beli másodrendű differenciálja:
-
Ennek Jacobi-mátrixa akkor is létezik, ha csak azt feltételezzük, hogy a parciális deriváltak léteznek az u egykörnyezetében, és ott differenciálhatóak. Ekkor a szóban forgó Jacobi-mátrix kvadratikus és
-
alakú, amit Hesse-féle mátrixnak nevezünk.
A vegyes másodrendű parciális deriváltakra vonatkozik a Young-tétel:
Tétel (Young) Kétszer differenciálható függvény vegyes másodrendű parciális deriváltjai egyenlők.
(A tétel egy gyenge verziójának könnyen átlátható szemléletes bizonyítása megtalálható itt: User:Mozo/egyéb#Young-tétel.)
A Young-tétel értelmében a Hesse-mátrix szimmetrikus illetve a d2f(u) szimmetrikus tenzor
-
Általában a deriváltmátrixok nem szimmetrikusak, ez egy különleges tulajdonsága a második differenciálnak. Sőt, általában az a kérdés, hogy mi a deriválttenzor szimmetrikus és antiszimmetrikus része.
Megjegyzés. Elvileg a
-
leképezésnek kellett volna a differenciálját venni az u pontban, és ezt tekinteni a differenciálnak. Ám ez nem Rm-be, hanem egy általánosabb normált térbe, a R2 R lináris leképezések terébe képez (az ún. kétváltozós lineáris funkcionálok terébe). Ebben a norma az operátornorma (az operátor minimális Lipschitz-konstansa), és a tér véges dimenziós. A differenciálhatóság pontosan ugyanúgy értelmezhető, mint a többváltozs esetben. Ekkor az f függvény u-beli másodrendű differenciálja az
-
lineáris leképezés, melyre teljesül a
-
A bázisvektorokon A a következőt veszi fel:
-
ennek a mátrixa a sztenderd bázisban
-
ami a kivonás és az osztást komponensenként elvégezve az parciális deriváltak első változó szerinti parciális deriváltjait adja:
-
Az 1 bázisvektoron felvett érték tehát az a lineáris operártor, melyet a fenti sorvektorral való szorzás határoz meg. A másik bázisvektoron szintén felríható ez a mátrix, így világos, hogy d(df(.))(u) jellemezhető a d2f(u) mátrixával, így azonosítható vele.
Feltételes szélsőértékfeladat
Feltétele szélsőérték feladat - Lagrange-multiplikátormódszer - Tegyük fel, hogy az u = F(x,y,z) skalárfüggvény szélsőértékét keressük az f(x,y,z) = c korlátozás (feltétel) mellett. Ekkor a következőképpen járunk el. A szükségesség szempontjából a feladat egyenértékű az
-
négyváltozós szélsőérték feladat vizsgálatával.
1. példa
Határozzuk meg a síkon az origó távolságát egy adott egyenesől!
Legyen az egyenes egyenlete
-
(nyilván A és B nem egyszerre nulla, mert (A,B) nomálvektor.) A keresett szám az origó és az egyenes pontjai közötti távolságok közül a legkisebb.
Tehát keressük a
-
kétváltozós leképezés minimumát az
-
feltétel mellett.
Megjegyzés. Ez a minimum biztosan létezik, mert ha P az egyenes egy tetszőlegesen rögzített pontja, akkor az OP távolság kétszeresénél közelebb lesz a keresett szélsőértékhely. A feladat tehát az 2OP sugarú zárt gömb és az egyenes közös pontjain értelmezett, fenti d(x,y) hozzárendelési utasítású függvény szélsőértékének meghatérozása. d kompakt halmazon folytonos, így Weierstrass tétele miatt felveszi abszolút minimumát.
Lagrange módszere szerint a feltételi egyenlet nullára redukált alakja:
-
ezt a leképezést kell hozzávenni a multiplikátorral szorozva a függvényhez:
-
Az szélsőérték szükségességét vizsgálva:
-
Az utolsó 0 lényegében a feltételi egyenlet megismétlését jelenti. λ kiesik, ha az első "egyenlet" B-vel, a másodikat A-val beszorozzuk. Ebből:
-
és a feltételi egyenlet:
-
Innen
-
Annak eldöntése, hogy ez valóban minimumhely-e, a második derivált próbára hárulna, de az nem tudja eldönteni mert (mint kiderülne) a Hesse-mátrix nem nem definit.
-
az adott pontban ez
-
A bal felső elem pozitív, de a 2×2-es determináns nulla. Azaz a szabad feladat szemidefinit és a szélsőérték jellegének megvizsgálása további tanulmányozást igényelne, amit most idő hiányában nem végzünk el.
2. példa
Keressük az
-
összeg maximumát az
-
feltétel mellett.
Legyen
-
Ekkor
-
így
- , ,
Innen a megoldások:
- , ,
- , ,
A Hesse-mátrix:
-
az adott pontokban ez
-
A két megoldás esetén a szabad probléma aldeterminánsai:
- 2, 4
- -2, 4
azaz már a szabad feladat 2×2-es mátrixa is pozitív ill. negatív definit, azaz nyugodtan kijelenthetjük, hogy feltételes feldatnak (-1/2,-1/2)-ben minimuma, (1/2,1/2)-ben maximuma van.
Tartományi szélsőértékfeladat
Legyen K ⊆ Rn kompakt halmaz és f : Rn R differenciálható függvény. Weierstrass tétele szerint f felveszi szélsőértékeit. Ha int (K)-ban nem találunk lokális szélsőértékhelyet, akkor a határon veszi föl azokat, melyet a multiplikátormódszerrel, vagy egyéb feltételes szélsőértékmódszerrel számolunk ki. Ha int(K)-ban van lokális szélsőérték, akkor a front(K) szélsőértékei és eközött kell megtalálnunk az extémumot.
1. példa
Tekintsük a
egyenletű elliptikus paraboloidot. Határozzuk meg a [-x,x], [-y,y], [0,z] élek által kifeszített legnagyobb térfogatú tégla térfogatát, ha (x,y,z) a felületen, az [x,y] sík feletti részen van.
Felírjuk a térfogat x,y-tóli függését:
-
-
az értelmezési tartománya pedig az első negyed
- azaz
egyenletű ellipszisbe eső része:
-
Ekkor az int(K) beli szélsőérték szükséges feltétele:
-
A megoldás
-
Mivel itt z(x,y) = 2 < 4, ezért (x,y) ∈ int(K) és értéke
Megállapítjuk, hogy ez maximum és csakis ez. Egyrészt front(K)-n f = 0, így a határon nem veheti föl abszolút maximumát. De belül máshol se, csak az előbbi (x,y) pontban, tehát az a maximum.
Megjegyezzük, hogy azt, hogy ez lokális maximum még a másodikderivált próbával is sikeresen ellenőrizhető.