Matematika A2a 2008/7. gyakorlat

A MathWikiből
A lap korábbi változatát látod, amilyen Mozo (vitalap | szerkesztései) 2009. április 2., 18:28-kor történt szerkesztése után volt.
Ez az szócikk a Matematika A2a 2008 alszócikke.

Tartalomjegyzék

Függvénykompozíció differenciálja

Tétel. Legyen g: Rn\to Rm, az u-ban differenciálható, f: Rm\to Rk a g(u)-ban differenciálható függvény, u ∈ int Dom(f \circ g). Ekkor az

f\circ g differenciálható u-ban és
 \mathrm{d}(f\circ g)(u)=\mathrm{d}f(g(u))\circ\mathrm{d}g(u)

Bizonyítás. Alkalmas ε, A és η B párral, minden x ∈ Dom(f \circ g)-re:

f(g(x))=f(g(u))+\mathcal{A}(g(x)-g(u))+\varepsilon(g(x))||g(x)-g(u)||)=
=f(g(u))+\mathcal{A}(\mathcal{B}(x-u)+\eta(x)||x-u||)+\varepsilon(g(x))||g(x)-g(u)||)=
=f(g(u))+(\mathcal{A}\circ\mathcal{B})(x-u)+\mathcal{A}(\eta(x)||x-u||)+\varepsilon(g(x))||g(x)-g(u)||)=
=f(g(u))+(\mathcal{A}\circ\mathcal{B})(x-u)+(\mathcal{A}(\eta(x))+\varepsilon(g(x))||\mathcal{B}\frac{x-u}{||x-u||}+\eta(x)||)||x-u||

Innen leolvasható a differenciál és a másodrendben eltűnő mennyiség vektortényezője, az

\varepsilon_{f\circ g}(x)=\mathcal{A}(\eta(x))+\varepsilon(g(x))||\mathcal{B}\frac{x-u}{||x-u||}+\eta(x)||

melyben az első tag a 0-hoz tart, mivel a lineáris leképezés a 0-ban folytonos, és η a 0-hoz tart az u-ban. A második tag nulla szor korlátos alakú, hiszen a lineáris leképezés Lipschitz-tuladonsága folytán B minden egységvektoron korlátos értéket vesz fel.

Ennek a tételnek a legegyszerűbb, de már vektorokat tartalmazó formáját írja át "fogyasztható" formába az alábbi

Következmény. Ha g: Rn\to R, az u-ban differenciálható, f: R\to R a g(u)-ban differenciálható függvény, u ∈ int Dom(f \circ g), akkor

f\circ g differenciálható u-ban és
 \mathrm{grad}(f\circ g)(u)=f'(g(u)).\mathrm{grad}\,g(u)

Ahol . a skalárral való szorzást jelöli.

Ugyanis, a deriváltak lineáris leképezések:

v\mapsto (\mathrm{d}g(u))v=(\mathrm{grad}\,(u))\cdot v\,
w\mapsto (\mathrm{d}f(x))w=f'(x)\cdot w\,

Ezek kompozíciója (f-et az x=g(u)-ban felírva):

(\mathrm{d}(f\circ g)(u))v=(\mathrm{d}f(g(u)))(\mathrm{d}g(u))v=f'(g(u)).(\mathrm{d}g(u))v=f'(g(u)).(\mathrm{grad}\,g(u))\cdot v\,

Hol diffható?

\Phi(r)=|r|=\sqrt{r^2}\,

(Útmutatás: abs'=sgn, a 0-án kívül.)

0-ban nem, mert a parciális deriváltak nem léteznek. Azon kívül:

Külső függvény:

f(x)=\sqrt(x)\,

nemnulla x-re:

f'(x)=\frac{1}{2}x^{-\frac{1}{2}}\,

A belső:

r^2\,

gradiense 2r.

Így:

\mathrm{grad}\,\sqrt{r^2}=\frac{1}{2}\frac{1}{\sqrt{r^2}}. 2r=\frac{r}{|r|}


Gömbszimmetrikus feldatok

Mi az

\Phi(r)=|r|^\alpha\quad\quad\alpha>0

függvény gradiense és differenciálja. Hol diffható?

0-ban α=1 vagy α<1 esetén biztosan nem diffható, mert a parciális deriváltak nem léteznek.

A külső függvény:

\,f(x)=x^\alpha
\,f'(x)=\alpha x^{\alpha-1}

A belső függvény: \,f(x)=|r|

Ez nem diffható 0-ban (mert a parciális deriváltjai nem léteznek), de máshol:

\mathrm{grad}\,|r|=\frac{r}{|r|}\,

Ekkor r≠0-ban:

\mathrm{grad}\,\Phi(r)=\alpha |r|^{\alpha-1}.\frac{r}{|r|}=\alpha r |r|^{\alpha-2}

Ha r=0 és α>1, akkor

\frac{|r|^\alpha-0-0}{|r|}=|r|^{\alpha-1}\to 0

Tehát a derivált

\mathrm{grad}\,\Phi(r)=\left\{\begin{matrix}0, &\mathrm{ha} & r=0\\\alpha r |r|^{\alpha-2}, &\mathrm{ha} & r\ne 0\end{matrix}\right.

Példa. r3|r|α milyen α-ra diffható mindenhol és mi a deriváltja?


Folytonos parciális differenciálhatóság

Megfordításról a következő esetben beszélhetünk.

Tétel. Ha az f:Rn\to Rm függvény minden parciális deriváltfüggvénye létezik az u egy környezetében és u-ban a parciális deriváltak folytonosak, akkor u-ban f differenciálható. (Sőt, folytonosan differenciálható.)

Bizonyítás. Elegendő az m = 1 esetet vizsgálni. Továbbá a bizonyítás elve nem változik, ha csak az n = 2 esetet tekintjük. Legyen x az u mondott környezetéből vett pont, és x = (x1,x2), v=(u1,x2), u=(u1,u2) Ekkor az [x,v] szakaszon ∂1f-hez a Lagrange-féle középértéktétel miatt létezik olyan ξ(x1)∈[x1,u1] szám, és a [v,u] szakaszon ∂2f-hez ζ(x2)∈[x2,u2] szám, hogy

f(x)-f(u)=f(x)-f(v)+f(v)-f(u)=\,
=\partial_1 f(\xi(x_1),x_2)(x_1-u_1)+\partial_2 f(u_1,\zeta(x_2))(x_2-u_2)=
=\partial_1f(u)(x_1-u_1)+\partial_2f(u)(x_2-u_2)+
+(\partial_1 f(\xi(x_1),x_2)-\partial_1f(u))(x_1-u_1)+(\partial_2 f(u_1,\zeta(x_2))-\partial_2f(u))(x_2-u_2)

itt az

\varepsilon_1(x)=\partial_1 f(\xi(x_1),x_2)-\partial_1f(u) és \varepsilon_2(x)=\partial_2 f(x_1,\zeta(x_2))-\partial_2f(u)

függvények folytonosak u-ban (még ha a ξ, ζ függvények nem is azok), és értékük az u-ban 0. Világos, hogy ez azt jelenti, hogy f differenciálható u-ban.

Világos, hogy a parciális deriváltak folytonossága szükséges a fenti tételben. Az alábbi példában léteznek a parciális deriváltfüggvények az u egy környzetében, de az u-ban nem folytonosak.

Nem differenciálható, nem folytonosan parciálisan differenciálható függvény

f(x,y)=\left\{\begin{matrix}\frac{xy}{\sqrt{x^2+y^2}}& \mbox{, ha }&(x,y)\ne (0,0)\\
0&\mbox{, ha }&(x,y)=(0,0)\end{matrix}\right.

parciális deriváltfüggvényei léteznek:

\frac{\partial f(x,y)}{\partial x}=\frac{y}{\sqrt{x^2+y^2}}-\frac{x^2y}{\sqrt{(x^2+y^2)^3}}

a másik hasonlóan. A 0-ban 0 mindkettő, de az (0,1/n) mentén a 0-ba tartva az 1-hez tart, ami nem 0.

f(x,y)=\left\{\begin{matrix}
0,& \mbox{ ha }(x,y)=(0,0)\\
\frac{xy(x^2-y^2)}{x^2+y^2},& \mbox{ ha }(x,y)\ne(0,0)
\end{matrix}\right.

A Young-tételnél beláttuk, hogy ekkor a 0-ban nem egyenlő a két vegyes parciális derivált. Most már azt is tudjuk miért. A függvény gradiense nem differenciálható totálisan a 0-ban. Ehhez elevenítsük föl, hogy

J^g(0,0)=H^f(0,0)=\begin{bmatrix}
0 & -1\\
1 & 0
\end{bmatrix}

ami a 90˚-os forgatás.

Számoljuk ki g értékét a (x,x) alakú pontokban:

\partial_1f(x,x)=\lim\limits_{t\to 0}\frac{f(x+t,x)-f(0,0)}{t}=\lim\limits_{t\to 0}\frac{(x+t)x((x+t)^2-x^2)}{t((x+t)^2+x^2}
\partial_xf(x,0)=\lim\limits_{t\to 0}\frac{f(x+t,0)-f(0,0)}{t}=0


\lim\limits_{t\to 0}\frac{g(t,0)-g(0,0)-J^g(0,0)\cdot (t,0)}{|t|}=\lim\limits_{t\to 0}\frac{(0,-t)}{|t|}\ne (0,0)\,

márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne.

Differenciálható, de nem folytonosan parciálisan differenciálható

A differenciálhatóság azonban nem elég ahhoz, hogy a parciális deriváltak folytonosak legyenek.

Az

f(x,y)=\left\{\begin{matrix}(x^2+y^2)\sin\cfrac{1}{x^2+y^2}, & \mbox{ha} & (x,y)\ne (0,0)\\\\
0, & \mbox{ha} & (x,y) =(0,0)
\end{matrix}\right.

differenciálható, hiszen ez az

f(\mathbf{r})=\left\{\begin{matrix} \mathbf{r}^2\cdot\sin(|\mathbf{r}|^{-2}) & \mbox{ha} & \mathbf{r}\ne \mathbf{0}\\\\
\mathbf{0}, & \mbox{ha} & \mathbf{r}= \mathbf{0}\end{matrix}\right.

függvény és r0-ban:

\mathrm{grad}(f)=\sin(|\mathbf{r}|^{-2}).\mathrm{grad}\,\mathbf{r}^2+\mathbf{r}^2.\mathrm{grad}\,\sin(|\mathbf{r}|^{-2})=
=\sin(|\mathbf{r}|^{-2}).2\mathbf{r}+\mathbf{r}^2\cdot\cos(|\mathbf{r}|^{-2})\cdot(-2)|\mathbf{r}|^{-3}.\frac{\mathbf{r}}{|\mathbf{r}|}

és grad f nem korlátos. Ez persze a parciális deriváltakon is megátszik: azok sem korlátosak.

Nevezetes függvénysorozat

  • f_n(x,y)=\frac{x^ny}{x^2+y^2}\quad f_n(0,0)=0 függvényosztály folytonossága parciális és totális deifferenciálhatósága, folytonos parciális és totális differenciálhatósága

Másodrendű parciális deriváltak

Ha f a HR2 halmazon értelmezett R-be képező, az uH-ban differenciálható függvény és a

\mathrm{grad}\,f

gradiensfüggvény szintén differenciálható u-ban, akkor f-et u-ban kétszer differenciálhatónak nevezzük és az f függény u-beli másodrendű differenciálja:

\mathrm{d}^2f(u):=\mathrm{d}(\mathrm{grad}\,f)(u)

Ennek Jacobi-mátrixa akkor is létezik, ha csak azt feltételezzük, hogy a parciális deriváltak léteznek az u egykörnyezetében, és ott differenciálhatóak. Ekkor a szóban forgó Jacobi-mátrix kvadratikus és

H^f(u)=\begin{bmatrix}
\cfrac{\partial^2 f(u)}{\partial x^2} & \cfrac{\partial^2 f(u)}{\partial y\partial x}\\\\
\cfrac{\partial^2 f(u)}{\partial x\partial y} & \cfrac{\partial^2 f(u)}{\partial y^2}
\end{bmatrix}

alakú, amit Hesse-féle mátrixnak nevezünk.

A vegyes másodrendű parciális deriváltakra vonatkozik a Young-tétel:

Tétel (Young) Kétszer differenciálható függvény vegyes másodrendű parciális deriváltjai egyenlők.

(A tétel egy gyenge verziójának könnyen átlátható szemléletes bizonyítása megtalálható itt: User:Mozo/egyéb#Young-tétel.)

A Young-tétel értelmében a Hesse-mátrix szimmetrikus illetve a d2f(u) szimmetrikus tenzor

H^f(u)=(H^f(u))^{\mathrm{T}}=\begin{bmatrix}
\partial_{11} f(u) & \partial_{12} f(u)\\\\
\partial_{12} f(u) & \partial_{22} f(u)\\
\end{bmatrix}

Általában a deriváltmátrixok nem szimmetrikusak, ez egy különleges tulajdonsága a második differenciálnak. Sőt, általában az a kérdés, hogy mi a deriválttenzor szimmetrikus és antiszimmetrikus része.

Megjegyzés. Elvileg a

\{x\in \mathbf{R}^2\mid f\in\mathrm{Diff}(x)\}\rightarrow\mathrm{Lin}(\mathbf{R}^2;\mathbf{R});\quad x\mapsto \mathrm{d}f(x)

leképezésnek kellett volna a differenciálját venni az u pontban, és ezt tekinteni a differenciálnak. Ám ez nem Rm-be, hanem egy általánosabb normált térbe, a R2 \to R lináris leképezések terébe képez (az ún. kétváltozós lineáris funkcionálok terébe). Ebben a norma az operátornorma (az operátor minimális Lipschitz-konstansa), és a tér véges dimenziós. A differenciálhatóság pontosan ugyanúgy értelmezhető, mint a többváltozs esetben. Ekkor az f függvény u-beli másodrendű differenciálja az

\mathrm{d}(\mathrm{d}f(.))(u)=\mathcal{A}:\mathbf{R}^2\rightarrow\mathrm{Lin(\mathbf{R}^2;\mathbf{R})}

lineáris leképezés, melyre teljesül a

\lim\limits_{x\to u}\frac{\mathrm{d}f(x)-\mathrm{d}f(u)-\mathcal{A}(x-u)}{||x-u||}=0_{\mathrm{Lin(\mathbf{R}^2;\mathbf{R})}}

A bázisvektorokon A a következőt veszi fel:

\lim\limits_{t\to 0}\frac{\mathrm{d}f(u+te_1)-\mathrm{d}f(u)}{t}=\mathcal{A}(e_1)

ennek a mátrixa a sztenderd bázisban

\lim\limits_{t\to 0}\frac{[\partial_1 f(u+te_1)\quad\partial_2 f(u+te_1)]-[\partial_1 f(u)\quad\partial_2 f(u)]}{t}=[\mathcal{A}(e_1)]

ami a kivonás és az osztást komponensenként elvégezve az parciális deriváltak első változó szerinti parciális deriváltjait adja:

[\mathcal{A}(e_1)]=[\partial_1(\partial_1 f)(u)\quad \partial_1(\partial_2 f)(u)]=[\partial_{11} f(u)\quad \partial_{12}f(u)]

Az 1 bázisvektoron felvett érték tehát az a lineáris operártor, melyet a fenti sorvektorral való szorzás határoz meg. A másik bázisvektoron szintén felríható ez a mátrix, így világos, hogy d(df(.))(u) jellemezhető a d2f(u) mátrixával, így azonosítható vele.


6. gyakorlat 8. gyakorlat
Személyes eszközök