Matematika A2a 2008/5. gyakorlat
Mozo (vitalap | szerkesztései) |
Mozo (vitalap | szerkesztései) (→Iránymenti deriválhatóság és differenciálhatóság) |
||
98. sor: | 98. sor: | ||
'''Megjegyzés.''' Persze abból, hogy az összes iránymenti derivált létezik, abból nem következik, hogy a függvény totálisan deriválható: | '''Megjegyzés.''' Persze abból, hogy az összes iránymenti derivált létezik, abból nem következik, hogy a függvény totálisan deriválható: | ||
+ | ==Folytonos parciális differenciálhatóság== | ||
+ | |||
+ | Megfordításról a következő esetben beszélhetünk. | ||
+ | |||
+ | '''Tétel.''' Ha az ''f'':'''R'''<sup>n</sup> ⊃<math>\to</math> '''R'''<sup>m</sup> függvény minden parciális deriváltfüggvénye létezik az ''u'' egy környezetében és ''u''-ban a parciális deriváltak folytonosak, akkor ''u''-ban ''f'' differenciálható. (Sőt, folytonosan differenciálható.) | ||
+ | |||
+ | ''Bizonyítás.'' Elegendő az m = 1 esetet vizsgálni. Továbbá a bizonyítás elve nem változik, ha csak az n = 2 esetet tekintjük. Legyen x az u mondott környezetéből vett pont, és x = (<math>x_1</math>,<math>x_2</math>), v=(<math>u_1</math>,<math>x_2</math>), u=(<math>u_1</math>,<math>u_2</math>) Ekkor az [x,v] szakaszon ∂<sub>1</sub>f-hez a Lagrange-féle középértéktétel miatt létezik olyan ξ(<math>x_1</math>)∈[<math>x_1</math>,<math>u_1</math>] szám, és a [v,u] szakaszon ∂<sub>2</sub>f-hez ζ(<math>x_2</math>)∈[<math>x_2</math>,<math>u_2</math>] szám, hogy | ||
+ | :<math>f(x)-f(u)=f(x)-f(v)+f(v)-f(u)=\,</math> | ||
+ | :<math>=\partial_1 f(\xi(x_1),x_2)(x_1-u_1)+\partial_2 f(u_1,\zeta(x_2))(x_2-u_2)=</math> | ||
+ | :<math>=\partial_1f(u)(x_1-u_1)+\partial_2f(u)(x_2-u_2)+</math> | ||
+ | :<math>+(\partial_1 f(\xi(x_1),x_2)-\partial_1f(u))(x_1-u_1)+(\partial_2 f(u_1,\zeta(x_2))-\partial_2f(u))(x_2-u_2)</math> | ||
+ | itt az | ||
+ | :<math>\varepsilon_1(x)=\partial_1 f(\xi(x_1),x_2)-\partial_1f(u)</math> és <math>\varepsilon_2(x)=\partial_2 f(x_1,\zeta(x_2))-\partial_2f(u)</math> | ||
+ | függvények folytonosak ''u''-ban (még ha a ξ, ζ függvények nem is azok), és értékük az ''u''-ban 0. Világos, hogy ez azt jelenti, hogy f differenciálható ''u''-ban. | ||
+ | |||
+ | Világos, hogy a parciális deriváltak folytonossága szükséges a fenti tételben. Az alábbi példában léteznek a parciális deriváltfüggvények az ''u'' egy környzetében, de az ''u''-ban nem folytonosak. | ||
+ | ====Nem differenciálható, nem folytonosan parciálisan differenciálható függvény==== | ||
+ | |||
+ | :<math>f(x,y)=\left\{\begin{matrix}\frac{xy}{\sqrt{x^2+y^2}}& \mbox{, ha }&(x,y)\ne (0,0)\\ | ||
+ | 0&\mbox{, ha }&(x,y)=(0,0)\end{matrix}\right.</math> | ||
+ | parciális deriváltfüggvényei léteznek: | ||
+ | :<math>\frac{\partial f(x,y)}{\partial x}=\frac{y}{\sqrt{x^2+y^2}}-\frac{x^2y}{\sqrt{(x^2+y^2)^3}}</math> | ||
+ | a másik hasonlóan. A 0-ban 0 mindkettő, de az (0,1/n) mentén a 0-ba tartva az 1-hez tart, ami nem 0. | ||
+ | |||
+ | :<math>f(x,y)=\left\{\begin{matrix} | ||
+ | 0,& \mbox{ ha }(x,y)=(0,0)\\ | ||
+ | \frac{xy(x^2-y^2)}{x^2+y^2},& \mbox{ ha }(x,y)\ne(0,0) | ||
+ | \end{matrix}\right.</math> | ||
+ | A Young-tételnél beláttuk, hogy ekkor a 0-ban nem egyenlő a két vegyes parciális derivált. Most már azt is tudjuk miért. A függvény gradiense nem differenciálható totálisan a 0-ban. Ehhez elevenítsük föl, hogy | ||
+ | |||
+ | :<math>J^g(0,0)=H^f(0,0)=\begin{bmatrix} | ||
+ | 0 & -1\\ | ||
+ | 1 & 0 | ||
+ | \end{bmatrix}</math> | ||
+ | ami a 90˚-os forgatás. | ||
+ | |||
+ | Számoljuk ki g értékét a (x,x) alakú pontokban: | ||
+ | |||
+ | :<math>\partial_1f(x,x)=\lim\limits_{t\to 0}\frac{f(x+t,x)-f(0,0)}{t}=\lim\limits_{t\to 0}\frac{(x+t)x((x+t)^2-x^2)}{t((x+t)^2+x^2)}=</math> | ||
+ | :<math>\lim\limits_{t\to 0}\frac{(x+t)x(2tx+t^2)}{t(2x^2+2tx+t^2)}=\lim\limits_{t\to 0}\frac{(x+t)x(2x+t)}{2x^2+2tx+t^2}=\lim\limits_{t\to 0}=x</math> | ||
+ | :<math>\partial_2f(x,x)=\lim\limits_{t\to 0}\frac{f(x,x+t)-f(0,0)}{t}=\lim\limits_{t\to 0}\frac{x(x+t)(x^2-(x+t)^2)}{t(x^2+(x+t)^2)}=</math> | ||
+ | :<math>\lim\limits_{t\to 0}\frac{x(x+t)(-2tx-t^2)}{t(2x^2+2tx+t^2)}=-x</math> | ||
+ | |||
+ | Tehát g(t,t)=(t,-t), és emiatt | ||
+ | |||
+ | :<math>\lim\limits_{t\to 0}\frac{g(t,t)-g(0,0)-J^g(0,0)\cdot (t,t)}{|t|}=\lim\limits_{t\to 0}\frac{(t,-t)-(-t,t)}{|t|}=\lim\limits_{t\to 0}\frac{(2t,-2t)}{|t|}=\lim\limits_{t\to 0}(2\mathrm{sgn}(t),-2\mathrm{sgn}(t))\ne (0,0)\,</math> | ||
+ | márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne. | ||
+ | |||
+ | ====Differenciálható, de nem folytonosan parciálisan differenciálható==== | ||
+ | A differenciálhatóság azonban nem elég ahhoz, hogy a parciális deriváltak folytonosak legyenek. | ||
+ | |||
+ | Az | ||
+ | :<math>f(x,y)=\left\{\begin{matrix}(x^2+y^2)\sin\cfrac{1}{x^2+y^2}, & \mbox{ha} & (x,y)\ne (0,0)\\\\ | ||
+ | 0, & \mbox{ha} & (x,y) =(0,0) | ||
+ | \end{matrix}\right. | ||
+ | </math> | ||
+ | differenciálható, hiszen ez az | ||
+ | :<math>f(\mathbf{r})=\left\{\begin{matrix} \mathbf{r}^2\cdot\sin(|\mathbf{r}|^{-2}) & \mbox{ha} & \mathbf{r}\ne \mathbf{0}\\\\ | ||
+ | \mathbf{0}, & \mbox{ha} & \mathbf{r}= \mathbf{0}\end{matrix}\right. | ||
+ | </math> | ||
+ | függvény és '''r''' ≠ '''0'''-ban: | ||
+ | :<math>\mathrm{grad}(f)=\sin(|\mathbf{r}|^{-2}).\mathrm{grad}\,\mathbf{r}^2+\mathbf{r}^2.\mathrm{grad}\,\sin(|\mathbf{r}|^{-2})=</math> | ||
+ | :<math>=\sin(|\mathbf{r}|^{-2}).2\mathbf{r}+\mathbf{r}^2\cdot\cos(|\mathbf{r}|^{-2})\cdot(-2)|\mathbf{r}|^{-3}.\frac{\mathbf{r}}{|\mathbf{r}|}</math> | ||
+ | és grad f nem korlátos. Ez persze a parciális deriváltakon is megátszik: azok sem korlátosak. | ||
==Egyváltozós illetve valós értékű függvény deriváltja== | ==Egyváltozós illetve valós értékű függvény deriváltja== |
A lap 2013. október 7., 21:28-kori változata
Differenciálhatóság
A többváltozós differenciálhatóságot az egyváltozós alábbi átfogalmazásából általánosítjuk:
Definíció. Legyen f: Rn Rm és u ∈ int Dom(f). Azt mondjuk, hogy f differenciálható az u pontban, ha létezik olyan A: Rn Rm lineáris leképezés, hogy
Ekkor A egyértelmű és az f leképezés u-bent beli differenciáljának nevezzük és df(u)-val vagy Df(u)-val jelöljük. Ezt a fogalmat néha teljes differenciálnak, totális differenciálnak vagy Fréchet-deriváltnak is mondjuk.
Megjegyzés. A fenti határérték 0 volta egyenértékű a következő kijelentéssel. Létezik A: Rn Rm lineáris leképezés és ε: Dom(f) Rm függvény, melyre:
- ε folytonos u-ban és ε(u)=0, továbbá
minden x ∈ Dom(f)-re:
Megjegyzés. Azt, hogy A egyértelmű, a következőkkel bizonyíthatjuk. Legyen A és B is a mondott tulajdonságú, azaz létezzenek ε és η az u-ban eltűnő és ott folytonos Dom(f)-en értelmezett függvények, melyekre teljesül, hogy minden x ∈ Dom(f)-re
ezeket kivonva egymásból és használva minden x-re:
így minden x = u + ty értékre is az azonosan nullát kapjuk, ha t pozitív szám, y pedig rögzített nemnulla vektor, azaz minden t-re
az azonosan 0 függény határértéke t 0 esetén szintén nulla:
hiszen t-t kiemelhetünk és egyszerűsíthetünk és t 0 esetén ε és η nullává válik. Ez viszont pont azt jelenti, hogy a két lineéris operátor azonosan egyenlő.
Jacobi-mátrix
A df(u) lineáris leképezés (e1,e2,...,en) szetenderd bázisbeli mátrixa legyen: [df(u)] = A. Vizsgáljuk mibe viszi a bázisokat df(u) leképezés!
Írjuk fel a definíciót, de az e1 egységvektor mentén tartsunk u-hoz: x = u + te1. Ekkor
ami azért hasznos, mert a
alakból kiemelhetó t:
azaz
vagyis f koordinátafüggvényeinek az első változó szerinti parciális deriváltja az u pontban. A többi oszlopvektor ugyanígy:
amelyet Jacobi-mátrixnak nevezünk.
Következmény. Tehát. ha f totálisan differenciálható, akkor parciálisan is differenciálható és a differenciál sztenderd bázisbeli mátrixa a Jacobi-mátrix.
Azaz:
- teljes differenciálhatóság parciális differenciálhatóság
de ez fordítva már nem igaz:
- parciális differenciálhatóság teljes differenciálhatóság
Erre vonatkozik a két alábbi példa.
Folytonosság és totális differenciálhatóság
Tekintsük az
Ekkor
Viszont g nem totálisan diffható, mert a (t,t) mentén a (0,0)-ba tartva:
ami nem létezik.
Megjegyzés. Itt persze g nem folytonos, és itt is igaz az, hogy ha totálisan differenciálható egy függvény, akkor folytonos is:
Tétel. Ha f differenciálható u-ban, akkor ott folytonos is, ugyanis minden x-re:
amely tagjai mind folytonosak u-ban.
Iránymenti deriválhatóság és differenciálhatóság
Példa.
Ekkor
Ha tehát differenciálható, akkor az iránymenti deriváltak (Gateau-deriváltak) is léteznek (e egységvektor):
Ám, polárkoordinátákra áttérve:
φ = π/4-et és π + π/4-et véve a vetületfüggvény a
- ,
ami nem differenciálható a 0-ban.
Megjegyzés. Persze abból, hogy az összes iránymenti derivált létezik, abból nem következik, hogy a függvény totálisan deriválható:
Folytonos parciális differenciálhatóság
Megfordításról a következő esetben beszélhetünk.
Tétel. Ha az f:Rn ⊃ Rm függvény minden parciális deriváltfüggvénye létezik az u egy környezetében és u-ban a parciális deriváltak folytonosak, akkor u-ban f differenciálható. (Sőt, folytonosan differenciálható.)
Bizonyítás. Elegendő az m = 1 esetet vizsgálni. Továbbá a bizonyítás elve nem változik, ha csak az n = 2 esetet tekintjük. Legyen x az u mondott környezetéből vett pont, és x = (x1,x2), v=(u1,x2), u=(u1,u2) Ekkor az [x,v] szakaszon ∂1f-hez a Lagrange-féle középértéktétel miatt létezik olyan ξ(x1)∈[x1,u1] szám, és a [v,u] szakaszon ∂2f-hez ζ(x2)∈[x2,u2] szám, hogy
itt az
- és
függvények folytonosak u-ban (még ha a ξ, ζ függvények nem is azok), és értékük az u-ban 0. Világos, hogy ez azt jelenti, hogy f differenciálható u-ban.
Világos, hogy a parciális deriváltak folytonossága szükséges a fenti tételben. Az alábbi példában léteznek a parciális deriváltfüggvények az u egy környzetében, de az u-ban nem folytonosak.
Nem differenciálható, nem folytonosan parciálisan differenciálható függvény
parciális deriváltfüggvényei léteznek:
a másik hasonlóan. A 0-ban 0 mindkettő, de az (0,1/n) mentén a 0-ba tartva az 1-hez tart, ami nem 0.
A Young-tételnél beláttuk, hogy ekkor a 0-ban nem egyenlő a két vegyes parciális derivált. Most már azt is tudjuk miért. A függvény gradiense nem differenciálható totálisan a 0-ban. Ehhez elevenítsük föl, hogy
ami a 90˚-os forgatás.
Számoljuk ki g értékét a (x,x) alakú pontokban:
Tehát g(t,t)=(t,-t), és emiatt
márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne.
Differenciálható, de nem folytonosan parciálisan differenciálható
A differenciálhatóság azonban nem elég ahhoz, hogy a parciális deriváltak folytonosak legyenek.
Az
differenciálható, hiszen ez az
függvény és r ≠ 0-ban:
és grad f nem korlátos. Ez persze a parciális deriváltakon is megátszik: azok sem korlátosak.
Egyváltozós illetve valós értékű függvény deriváltja
Ha f:Rn R, akkor a definíciót még így is ki szokás mondani:
f diffható r0-ban, ha létezik m vektor, hogy
Ekkor az m a gradiensvektor, melynek sztenderd bázisbeli koordinátamátrixa a Jacobi mátrix:
Ha f:R Rn, akkor a definíciót még így is ki szokás mondani:
és ekkor f'(t0) a t0-beli deriváltvektor (ha t az idő és r=f(t) a hely, akkor ez a sebeségvektor).
Ha f:Rn Rn, akkor a differenciált deriválttenzornak is nevezik.
Példa.
Mi az
- ,
skalárfüggvény gradiense?
Válasszuk le a lineáris részét!
Itt az első tag a lineáris, a második a magasabbfokú. Tehát:
Lineáris és affin függvény deriváltja
Tétel. Az A : Rn Rm lineáris leképezés differenciálható és differenciálja minden pontban saját maga:
Ugyanis, legyen u ∈ Rn. Ekkor
Tétel. Az azonosan c konstans függény esetén az dc(u) 0 alkalmas differenciálnak, mert
Tétel. Ha f és g a H ⊆ Rn halmazon értelmezett Rm-be képező, az u ∈ H-ban differenciálható függvények, akkor minden λ számra
- is differenciálható u-ban és és
- is differenciálható u-ban és
Ugyanis, a mondott differenciálokkal és a
választással, ezek az u-ban folytonosak lesznek és a lineáris résszekel együtt ezek előállítják a skalárszoros és összegfüggvények megváltozásait.
Következmény. Tehát minden u ∈ Rn-re az affin c+A diffható és
Példa
Az A: x 2x1 + 3x2 - 4x3 lineáris leképezés differenciálja az u pontban az u-tól független
és Jacobi-mátrixa a konstans
mátrix.
Világos, hogy a
koordináta vagy projekciófüggvény lineáris, differenciálja minden u pontban saját maga és ennek mátrixa:
ahol az 1 az i-edik helyen áll. Másként
ahol
azaz a Kronecker-féle δ szimbólum.
Szélsőérték szükséges feltétele
Egyelőre állapodjunk meg abban, hogy gradiensnek nevezzük a következő többváltozós vektorértékű függvényt: ha f: Rn R parciálisan differenciálható, akkor
mely lényegében az f elsőrendű parciális deriváltjaiból képezett vektor.
Később a gradienst egy kissé másképp fogjuk értelmezni és amit most definiáltunk, az a gradiens sztenderd bázisbeli mátrixa lesz (adott pontra vonatkozóan).
Tétel - Fermat-tétel - Legyen f: Rn R, u ∈ int Dom(f), f parciálisan differenciálható u-ban.
- Ha u-ban f-nek (lokális) szélsőértéke van, akkor
U.is: minden i-re az i-edik parciális függvénynek szélsőértéke van ui-ben, így az egyváltozós Fermat-tétel miatt ezeknek a deriváltja ui-ben 0, így a gradiens értéke 0.
Példa
Ennek gradiense:
Az
egyenletrendszer megoldásai: x = 0, y tetszőleges ill. y = 0 és x tetszőleges. A szélsőértékek helyei csak ezek közül kerülhetnek ki és ezek valóban szélsőértékek is, mert ezeken a függvény 0-t vesz fel, ami a lehetséges legkisebb értéke.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot 5*x*x*y*y
Magasabbrendű parciális deriváltak
Ha f parciálisan deriválható, akkor ∂1f és ∂2f szintén kétváltozós függvények (a pontonként a deriváltak, mint függvényértékek értelmezésével) és érdeklődhetünk ezek parciális differenciálhatóságuk iránt. Például:
És valóban:
Tétel. (Young-tétel) Ha a másodrendű parciláis deriváltak léteznek az u egy környezetében és folytonosak az u pontban, akkor az u-beli vegyes másodrendű parciláis deriváltak egyenlőek:
Azaz az alábbi, úgy nevezett Hesse-mátrix szimmetrikus:
Feladat. Az a kitétel, hogy az u-ban a másodrenrű parciláis deriváltak folytonosak, nem hagyható el, ugyanis. Legyen
Ekkor a 0-ban nem egyenlő a két vegyes parciális derivált.
Tekintsük a parciális deriváltakat:
Ehhez tehát elegendő kiszámítani a következő föggvényeket: y (∂xf)(0,y), x (∂yf)(x,0). Ehhez a parciális deriváltak:
Megjegyezzük, hogy a g=(∂xf,∂yf) függvény (0,0)-beli parciális deriváltjai nem lehetnek folytonosak, mert ott a függvény nem totálisan diffható. Ugyanis a g Jacobi-mátrixa:
ami a 90˚-os forgatás. Ekkor a g-t a (t,0) vektorral közelítve a 0-ba:
márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne.
Többváltozós függvény szélsőértéke
Másodikderivált próba
Kétszer differenciálható függvényre vonatkozóan megfogalmazhatjuk a lokális maximum és minimum létezésének elégséges feltételét. Csak a kétváltozós függvényekkel foglalkozunk. Tegyük fel, hogy grad f(u) = 0 és Hf(u) az f Hesse-mátrixa
- ha det Hf(u) > 0 és ∂11f(u) < 0, akkor f-nek u-ban maximuma van
- ha det Hf(u) > 0 és ∂11f(u) > 0, akkor f-nek u-ban minimuma van
- ha det Hf(u) < 0, akkor f-nek biztosan nincs szélsőértéke, ún. nyeregpontja van
- ha det Hf(u) = 0, akkor a próba nem járt sikerrel, azaz további vizsgálatokat igényel annak eldöntése, hogy u szélsőérték hely-e.
Megjegyzések. Mivel kétváltozós esetben
ezért olyan eset nem létezik, hogy det Hf(u) > 0 és ∂11f(u) = 0.
Világos, hogy a másodikderivált tipikusan azoknál a függvényeknél jár sikerrel, melyeket egy másodfokú függvény közelít a legjobban (aszimptotikusan másodfokúak). Ha a függvény ennél magasabb fokú, akkor a második deriváltak eltűnnek és a Hesse-mártix elfajul (vagy legalább is tipikusan elfajul).
Ha tehát
- , akkor ,
és így a tipikus példák a következők.
Példák
1. Ha B kicsi, azaz az AC-hez képest kis abszolútrétékű szám, akkor a szélsőérték irányába mozdul el a feladat.
Ekkor grad f = ( 2x + y , 2y + x ) és
azaz 4 - 1 = 3 > 0 és 2 > 0 miatt minimum.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot x*x+x*y+y*y
2. Ha |B| nagy (azaz AC-hez képest nagy), akkor a bizonyosan nemszélsőérték irányába.
Ekkor grad f = ( 2x + -3y , 2y + -3x ) és
azaz 4 - 9 = -5 < 0 miatt nincs szélsőérték: nyeregpont.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot x*x -3*x*y+y*y
3. Negatív A és C-re és kis B-re:
Ekkor grad f = ( -2x + 3y , -2y + 3x ) és
azaz 4 - 1 = 3 > 0 és -2 < 0 miatt maximum.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot -x*x +x*y-y*y
4. Ha A és C előjele ellenkező, akkor rögtön következik, hogy nincs sz.é.
Ekkor grad f = ( 2x + y , -2y + x ) és
azaz -4 - 1 = -5 < 0 azaz nyeregpont.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot x*x +x*y-y*y
5. Atipikus eset, ha AC = B2. Ekkor nem jár sikerrel a próba:
Ekkor grad f = ( 2x + 2y , 2y + 2x ) és
azaz 4 - 4 = 0, azaz határozatlan eset. De tudjuk, hogy
ami pontosan akkor minimális, ha x = -y, azaz ezeken a helyeken van szélsőérték.
set pm3d
set size 0.8,0.8 set xrange [-1:1] set yrange [-1:1] set zrange [-2:2] set view 50,30,1,1 unset xtics unset ytics unset ztics unset key unset colorboxsplot (x+y)*(x+y)
4. gyakorlat | 6. gyakorlat |