Matematika A2a 2008/8. gyakorlat

A MathWikiből
A lap korábbi változatát látod, amilyen Mozo (vitalap | szerkesztései) 2008. április 10., 21:35-kor történt szerkesztése után volt.

Tartalomjegyzék

Feltételes szélsőértékfeladat

Feltétele szélsőérték feladat - Lagrange-multiplikátormódszer - Tegyük fel, hogy az u = F(x,y,z) skalárfüggvény szélsőértékét keressük az f(x,y,z) = c korlátozás (feltétel) mellett. Ekkor a következőképpen járunk el. A szükségesség szempontjából a feladat egyenértékű az

\Phi(x,y,z,\lambda)=F(x,y,z)+\lambda\cdot f(x,y,z)\,

négyváltozós szélsőérték feladat vizsgálatával.

1. példa

Határozzuk meg a síkon az origó távolságát egy adott egyenesől!

Legyen az egyenes egyenlete

Ax+By=C\,

(nyilván A és B nem egyszerre nulla, mert (A,B) nomálvektor.) A keresett szám az origó és az egyenes pontjai közötti távolságok közül a legkisebb.

Tehát keressük a

d(x,y)=\sqrt{x^2+y^2}\,

kétváltozós leképezés minimumát az

Ax+By=C\,

feltétel mellett.

Megjegyzés. Ez a minimum biztosan létezik, mert ha P az egyenes egy tetszőlegesen rögzített pontja, akkor az OP távolság kétszeresénél közelebb lesz a keresett szélsőértékhely. A feladat tehát az 2\cdotOP sugarú zárt gömb és az egyenes közös pontjain értelmezett, fenti d(x,y) hozzárendelési utasítású függvény szélsőértékének meghatérozása. d kompakt halmazon folytonos, így Weierstrass tétele miatt felveszi abszolút minimumát.

Lagrange módszere szerint a feltételi egyenlet nullára redukált alakja:

f(x,y)=Ax+By-C=0\,

ezt a leképezést kell hozzávenni a multiplikátorral szorozva a függvényhez:

\Phi(x,y,\lambda)=\sqrt{x^2+y^2}+\lambda.(Ax+By-C)\,

Az szélsőérték szükségességét vizsgálva:

\mathrm{grad}\,\Phi(x,y,\lambda)=\left(\frac{x}{\sqrt{x^2+y^2}}+\lambda.A,\frac{y}{\sqrt{x^2+y^2}}+\lambda.B,Ax+By-C\right)=(0,0,0)

Az utolsó 0 lényegében a feltételi egyenlet megismétlését jelenti. λ kiesik, ha az első "egyenlet" B-vel, a másodikat A-val beszorozzuk. Ebből:

Bx-Ay=0\,

és a feltételi egyenlet:

Ax+By=C\,

Innen

(x,y)=\left(\frac{AC}{\sqrt{A^2+B^2}}, \frac{BC}{\sqrt{A^2+B^2}}\right)

Annak eldöntése, hogy ez valóban minimumhely-e, a második derivált próbára hárulna, de az nem tudja eldönteni mert (mint kiderülne) a Hesse-mátrix nem nem definit.

\mathrm{H}^{\Phi}(x,y,\lambda)=
\begin{pmatrix}
\frac{1}{\sqrt{x^2+y^2}}-\frac{x^2}{\sqrt{x^2+y^2}^3} & - \frac{xy}{\sqrt{x^2+y^2}^3}& A\\
 - \frac{xy}{\sqrt{x^2+y^2}^3}& \frac{1}{\sqrt{x^2+y^2}}-\frac{y^2}{\sqrt{x^2+y^2}^3} & B\\
A & B & 0
\end{pmatrix}

az adott pontban ez

\mathrm{H}^{\Phi}(x,y,\lambda)=
\begin{pmatrix}
\frac{1}{|C|}-\frac{A^2}{|C|(A^2+B^2)} & - \frac{AB}{|C|(A^2+B^2)}& A\\
 - \frac{AB}{|C|(A^2+B^2)}& \frac{1}{|C|}-\frac{B^2}{|C|(A^2+B^2)} & B\\
A & B & 0
\end{pmatrix}

A bal felső elem pozitív, de a 2×2-es determináns nulla. Azaz a szabad feladat szemidefinit és a szélsőérték jellegének megvizsgálása további tanulmányozást igényelne, amit most idő hiányában nem végzünk el.

2. példa

Keressük az

F(x,y)=x+y\,

összeg maximumát az

x^2+y^2=2\,

feltétel mellett.

Legyen

\Phi(x,y,\lambda)=x+y+\lambda (x^2+y^2-2)\,

Ekkor

\mathrm{grad}\,\Phi(x,y,\lambda)=(1+\lambda 2x,1+\lambda 2y,x^2+y^2-2)=(0,0,0)\,

így

x=-\frac{1}{2\lambda}, y=-\frac{1}{2\lambda}, 2=\frac{1}{2\lambda^2}

Innen a megoldások:

\lambda_1=1\,, x_1=-\frac{1}{2}, y_1=-\frac{1}{2}
\lambda_2=-1\,, x_2=\frac{1}{2}, y_2=\frac{1}{2}

A Hesse-mátrix:

\mathrm{H}^{\Phi}(x,y,\lambda)=
\begin{pmatrix}
2\lambda & 0 & 2x\\
0 & 2\lambda & 2y\\
2x & 2y & 0
\end{pmatrix}

az adott pontokban ez

\mathrm{H}^{\Phi}(x,y,\lambda)=
\begin{pmatrix}
\pm 2 & 0 & \mp 1\\
 0 & \pm 2 & \mp 1\\
 \mp 1 & \mp 1 & 0
\end{pmatrix}

A két megoldás esetén a szabad probléma aldeterminánsai:

2, 4
-2, 4

azaz már a szabad feladat 2×2-es mátrixa is pozitív ill. negatív definit, azaz nyugodtan kijelenthetjük, hogy feltételes feldatnak (-1/2,-1/2)-ben minimuma, (1/2,1/2)-ben maximuma van.

Tartományi szélsőértékfeladat

Legyen KRn kompakt halmaz és f : Rn\to R differenciálható függvény. Weierstrass tétele szerint f felveszi szélsőértékeit. Ha int (K)-ban nem találunk lokális szélsőértékhelyet, akkor a határon veszi föl azokat, melyet a multiplikátormódszerrel, vagy egyéb feltételes szélsőértékmódszerrel számolunk ki. Ha int(K)-ban van lokális szélsőérték, akkor a front(K) szélsőértékei és eközött kell megtalálnunk az extémumot.

1. példa

Tekintsük a z=4-x^2-2y^2\, egyenletű elliptikus paraboloidot. Határozzuk meg a [-x,x], [-y,y], [0,z] élek által kifeszített legnagyobb térfogatú tégla térfogatát, ha (x,y,z) a felületen, az [x,y] sík feletti részen van.

Felírjuk a térfogat x,y-tóli függését:

V(x,y,z)=4xyz\,
 f(x,y)=V(x,y,z(x,y))=4xy(4-x^2-2y^2)=16xy-4x^3y-8xy^3\,

az értelmezési tartománya pedig az első negyed

x^2+2y^2=4\, azaz \left(\frac{x}{2}\right)^2 + \left(\frac{y}{\sqrt{2}}\right)^2=1\,

egyenletű ellipszisbe eső része:

\mathrm{Dom}(f)=\{(x,y)\in\mathbf{R}^2\mid x\leq 0 \land y\leq 0 \land 4\geq x^2+2y^2\}=K\,

Ekkor az int(K) beli szélsőérték szükséges feltétele:

\mathrm{grad}\,f(x,y)=(16y-12x^2y-8y^3,16x-4x^3-24xy^2)=(0,0)\,

A megoldás

x=1, y=\frac{\sqrt{2}}{2}

Mivel itt z(x,y) = 2 < 4, ezért (x,y) ∈ int(K) és értéke V = 4\sqrt{2} Megállapítjuk, hogy ez maximum és csakis ez. Egyrészt front(K)-n f = 0, így a határon nem veheti föl abszolút maximumát. De belül máshol se, csak az előbbi (x,y) pontban, tehát az a maximum.

Megjegyezzük, hogy azt, hogy ez lokális maximum még a másodikderivált próbával is sikeresen ellenőrizhető.

Implicit függvény deriváltja

Implicit megadású függvényről akkor beszélünk, amikor egy függvény megadása nem (az explicit módon) y = f(x) alakban történik, hanem az x és y kapcsolatát egy mindkét változót tartalmazó

F(x,y) = 0 \,

egyenlet írja le. Például adjunk meg olyan függvényt, melynek grafikonja valamely kör egy szakasza. Az

x^2+y^2=1\,

egyenletű körből könnyű az y változót kifejezni, az \mbox{ }_{y=\sqrt{1-x^2}} és \mbox{ }_{y=-\sqrt{1-x^2}} alakokat kapjuk. Bonyolultabb esetekben, például a

\sin y =x\,

esetén semmi reményünk, hogy az y változóra valamilyen egyenletrendezéssel általános képletet kapjunk. Az ilyen példák miatt nevezik ezeket a típusú függvényeket implicit, avagy régi, választékos kifejezéssel élve bennrekedt függvényeknek. A differenciálszámítás szempontjából megelégedhetünk azzal, ha az implicit függvény deriváltját ki tudjuk számolni. Sok esetben ebből már következtethetünk a függvényre vagy annak viselkedésére is.

A modern analízis szemszögéből egy N × M \rightarrow K normált terek között ható F függvény aN és bM pontokhoz tartozó implicit függvényén olyan, az a egy U környezetén értelmezett és a b egy V környezetébe képező f:U \rightarrow V függvényt értünk, melyre f(a)=b és minden xU pont esetén rendelkezik az

F(x,f(x))=0\,

tulajdonsággal. Amelyet szavakban úgy fogalmazhatunk meg, hogy az F(x,y)=0 egyenletből az y változó kifejezhető y=f(x) alakban.

Most szorítkozzunk csak a kétváltozós esetre és tegyük fel, hogy létezik differenciálható implicit függvénye a differenciálható F függvénynek. Ekkor az F(x,y) függvény implicit függvénye az f(x), ha egy adott (u,v) pontban:

F(u,v)=0 és minden az f értelmezési tartományába eső x-re F(x,f(x))≡0

világos, hogy ha

0 ≡ φ(x) = F(x,f(x)) = (F\circ(id,f))(x) ,

akkor

φ'(x) ≡ 0

így tehát a függvénykompozíció deriválásának szabálya szerint:

\phi'(u)=[\partial_F(u,v),\partial_2F(u,v)]\cdot \begin{bmatrix}1//f'(u)\end{bmatrix}=\partial_1 F(u,v)+\partial_2F(u,v)\cdot f'(u)\,=0

így

f'(u)=-\frac{\partial_1 F(u,v)}{\partial_2 F(u,v)} \,

Implicitfüggvény tétel

TételImplicitfüggvény-tétel R-beli implicit függvényre – Legyen F az R2 egy részhalmazán értelmezett, R-be képező függvény, mely az értelmezési tartománya egy (a,b) belső pontjában erősen differenciálható, F(a,b) = 0 és

\partial_2 F(a,b)\neq 0

(azaz (a,b)-ben az y szerinti parciális deriváltja nem nulla). Ekkor van a-nak olyan I és b-nek olyan J környezete, hogy F-nek egyértelműen létezik az (a,b) párhoz tartozó f: I \rightarrow J implicit függvénye, mely erősen differenciálható a-ban és deriváltja:

f'(a)=-\frac{\partial_1 F(a,b)}{\partial_2 F(a,b)}

Bizonyítás. A (a,b)-beli erős differenciálhatóságból következik, hogy F folytonosan differenciálható (a,b)-ben. Választhatunk tehát olyan I és J nyílt intervallumokat, a és b körül, hogy I × J-n ∂2F sehol sem nulla, azonos előjelű. Feltehetjük, hogy ∂2F pozitív. Vegyük észre, hogy az implicit függvény létezése egyenértékű azzal, hogy minden xI-re az F( x , . ) parciális függvénynek zérushelye van J-ban, hiszen ekkor minden x-hez létezik olyan y ∈ J, hogy F(x,y)=0. Belátjuk, hogy minden ilyen x-hez egyetlen zérushelye van F( x , . )-nek.

Tekintsük a folytonos F( a , . ) parciális függvényt. Az erős differenciálhatóságból és a pozitívra választott deriváltból következik, hogy ez I-n szigorúan monoton növekvő. Mivel b-ben zérushelye van ( F(a,b)=0 ), ezért van olyan y2 > b pont, hogy ott F( a , . ) pozitív és y1 < b pont, hogy ott F( a , . ) negatív. Ekkor F folytonossága miatt van az (a,y1) pontnak olyan környezete, ahol F negatív és van az (a,y2) pontnak olyan környezete, ahol F pozitív. Most definiáljuk át I-t és J-t úgy, hogy I × J-n az F egy J-beli elem fölött mindenhol pozitív, egy J-beli elem alatt mindehol negatív értéket vegyen föl.

Az erős differenciálhatóságból az is következik, hogy minden x ∈ I-re az F( x , . ) függvény is szigorúan monoton növekvő, negatív és pozitív értéket is felvevő folytonos függvény, így a Bolzano-tétel alapján létezik yx zérushelye és mindegyiknek egyetlen zérushelye létezik. Állítjuk, hogy a φ:I \rightarrow J, x \mapsto yx függvény implicit függvénye F-nek, azaz minden x ∈ I-re F(x,φ(x))=0.

Könnyen belátható, hogy φ folytonos a-ban, hiszen ha a-hoz közeledve mindig találnánk olyan x pontot, hogy φ(x) egy adott ε-nál mindig jobban eltér b-től, akkor φ(x) egy olyan környezetbe esne bele, ahol F mindenhol egy pozitív számnál nagyobb vagy mindenhol egy negatív számnál kisebb. Ám, F(x,φ(x))=0, így ez ellentmondana F folytonos tulajdonságának.

φ erősen differenciálható (a,b)-ben, hiszen tetszőleges x1, x2I-re az F erős differenciálhatósága miatt fennáll

0=F(x_1,\varphi(x_1))-F(x_2,\varphi(x_2))=
=\partial_1F(a,b)(x_2-x_1)+\partial_2F(a,b)(\varphi(x_2)-\varphi(x_1))+
+\varepsilon\cdot(x_2-x_1)+\eta\cdot(\varphi(x_2)-\varphi(x_1))

azaz (a pozitív ∂2F(a,b) miatt pozitívra választható ∂2F(a,b)+η miatt):

\frac{\varphi(x_2)-\varphi(x_1)}{x_2-x_1}=-\frac{\partial_1F(a,b)+\varepsilon}{\partial_2F(a,b)+\eta}

és innen (x1,x2)\to(a,a) határátmenetet véve, a másodendű tagok eltűnését követően kapjuk az állítás eredményét.

Felhívjuk a figyelmet arra, hogy az implicit függvény értékére fennáll ugyan a

\mbox{ }_{\varphi(x)=\varphi(a)-\frac{\partial_1F(a,b)+\varepsilon}{\partial_2F(a,b)+\eta}(x-a)}

egyenlőség, de mivel ε és η ki nem írt argumentumaiban szerepel φ(x), ezért ez sem egy explicit alak.


Példák

Tekintsük a következő egyenletű síkgörbét:

x^5+xy+y^5=3\,

Nem lenne könnyű feladat kifejezni belőle y-t, mert az ötödfokú egyenletnek nincs általános megoldóképlete. Mivel a baloldal akárhányszor differenciálható, ezért joggal feltételezhetjük, hogy bizonyos pontokban létezik implicit függvénye. Tegyük fel, hogy φ ilyen függvény. Ekkor az egyenlet

x^5+x\varphi(x)+(\varphi(x))^5=3

alakú, melynek minden olyan x-nél, ahol φ differenciálható:

5x^4+\varphi(x)+x\varphi'(x)+5\varphi^4(x)\cdot\varphi'(x)=0

ahonnan a derivált: \varphi'(x)=-\frac{5x^4+\varphi(x)}{5\varphi^4(x)+x} vagy szimbolikusan: y'=-\frac{5x^4+y}{5y^4+x}. Alaposabb vizsgálatokkal kideríthető, hogy ez a derivált minden pontban létezik és negatív, így az implicit függvény mindenhol létezik és szigorúan monoton csökkenő. Vegyük észre, hogy a nevezőben lévő kifejezés pont ∂yF(x,y) és az implicit függvény létezésének feltétele pont a nevező nullától különböző volta.

Többváltozós eset

Ebben az esetben is az „érintősík” végtelenül közelítő tulajdonsága játszik majd fontos szerepet. Jól látható az összefüggés, ha feltesszük, hogy F egy Rn×Rm-en értelmezett affin függvény, azaz egy lineáris leképezés eltoltja. Ekkor

F(x,y) = F(a+h,b+k) = F(a,b)+dF1(a,b)h+dF2(a,b)k.

Amennyiben y = y(x) olyan, hogy y(a) = b és F(x,y(x)) = 0, akkor fennáll a 0 = dF1(a,b)h + dF2(a,b)k egyenlőség és k kifejezhető, amennyiben az A = dF2(a,b) mátrix invertálható. A B = dF1(a,b) jelöléssel ekkor

k = -(A-1\cdotB) h.

Általános esetben ez csak egy másodrendűen kicsiny tag hozzávételével lesz igaz, de az implicit függvény létezésének belátásához szükséges a fenti gondolatmenet is.

Banach-terek esetén (melyek akár végtelen dimenziósak is lehetnek) a tétel a következő.

TételImplicitfüggvény-tétel Banach-terekre – Legyen E, H, G Banach-terek, F:E × H \rightarrow G olyan függvény, mely (a,b) ∈ E × H-ban erősen differenciálható. Ha a ∂2F(a,b) lineáris leképezés injektív és az inverzével együtt folytonos, akkor egyértelműen létezik az F-nek egy az (a,b) párhoz tartozó f lokális implicit függvénye, ez erősen differenciálható a-ban és differenciálja:

df(a)=-(\partial_2 F(a,b))^{-1}\circ(\partial_1 F(a,b))

Vagy egy kevésbé absztrakt tétel:

TételImplicitfüggvény-tétel Rn-re – Legyen F:Rn×Rm\rightarrowRm folytonosan differenciálható függvény, (a,b) ∈ Rn×Rmolyanok, hogy F(a,b)=0 és \mbox{ }_{\det\left(\frac{\partial F_i(a,b)}{\partial y_k}\right)_{i,k=1,...,m}\ne 0}. Ekkor egyértelműen létezik F-nek egy az (a,b)-hez tartozó lokális implicit függvénye.



7. gyakorlat 9. gyakorlat
Személyes eszközök