Matematika A2a 2008/6. gyakorlat

A MathWikiből

A lap korábbi változatát látod, amilyen Mozo (vitalap | szerkesztései) 2013. október 21., 11:44-kor történt szerkesztése után volt.

(eltér) ←Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

Ugrás: navigáció, keresés

Ez az szócikk a Matematika A2a 2008 alszócikke.

Tartalomjegyzék

1 Folytonosság és totális differenciálhatóság
2 Iránymenti deriválhatóság és differenciálhatóság
3 Folytonos parciális differenciálhatóság
- 3.1 Nem differenciálható, nem folytonosan parciálisan differenciálható függvény
- 3.2 Differenciálható, de nem folytonosan parciálisan differenciálható
4 Egyváltozós illetve valós értékű függvény deriváltja
5 Lineáris és affin függvény deriváltja
- 5.1 Példa
6 Szélsőérték szükséges feltétele
- 6.1 Példa
7 Magasabbrendű parciális deriváltak
8 Többváltozós függvény szélsőértéke
- 8.1 Másodikderivált próba
  - 8.1.1 Példák
9 Kiegészítés

Folytonosság és totális differenciálhatóság

Tekintsük az

$g(x,y)=\left\{\begin{matrix}\begin{pmatrix}\frac{xy}{x^2+y^2}\\ x+y\end{pmatrix}& \mbox{, ha }&(x,y)\ne (0,0)\\ \begin{pmatrix}0\\ 0\end{pmatrix}&\mbox{, ha }&(x,y)=(0,0)\end{matrix}\right.$

Ekkor

$J^g(0,0)=\begin{pmatrix}0 & 0\\ 1 & 1\end{pmatrix}$

Viszont g nem totálisan diffható, mert a (t,t) mentén a (0,0)-ba tartva:

$\lim\limits_{t\to 0}\frac{g(t,t)-g(0,0)-J^g(0,0)\cdot(t,t)}{\sqrt{2}|t|}=\lim\limits_{t\to 0}\frac{(\frac{1}{2},2t)-(0,t)}{\sqrt{2}|t|}=\lim\limits_{t\to 0}\frac{(\frac{1}{2},t)}{\sqrt{2}|t|}=\lim\limits_{t\to 0}(\frac{1}{\sqrt{2}2|t|},\frac{t}{\sqrt{2}|t|})$

ami nem létezik.

Megjegyzés. Itt persze g nem folytonos, és itt is igaz az, hogy ha totálisan differenciálható egy függvény, akkor folytonos is:

Tétel. Ha f differenciálható u-ban, akkor ott folytonos is, ugyanis minden x-re:

$f(x)=f(u)+(\mathrm{d}f(u))(x-u)+\varepsilon(x)||x-u||$

amely tagjai mind folytonosak u-ban.

Iránymenti deriválhatóság és differenciálhatóság

Példa.

$f(x,y)=\left\{\begin{matrix}\frac{xy}{\sqrt{x^2+y^2}}& \mbox{, ha }&(x,y)\ne (0,0)\\ 0&\mbox{, ha }&(x,y)=(0,0)\end{matrix}\right.$

Ekkor

$\mathrm{J}^f(0,0)=[0, 0]\,$

Ha tehát differenciálható, akkor az iránymenti deriváltak (Gateau-deriváltak) is léteznek (e egységvektor):

$\partial_ef(u)=\lim\limits_{t\to 0}\frac{f(u+te)-f(u)}{t}=\mathrm{J}^f(0,0)\cdot e=e\cdot\mathrm{grad}\,f(u)$

Ám, polárkoordinátákra áttérve:

$f(x(r,\varphi),y(r,\varphi))=\frac{r^2\cos\varphi\sin\varphi}{r}=r\cos\varphi\sin\varphi=r\cdot \frac{1}{2}\sin 2\varphi$

φ = π/4-et és π + π/4-et véve a vetületfüggvény a

$t\mapsto\frac{1}{2}|t|$ ,

ami nem differenciálható a 0-ban.

Megjegyzés. Persze abból, hogy az összes iránymenti derivált létezik, abból nem következik, hogy a függvény totálisan deriválható:

Folytonos parciális differenciálhatóság

Megfordításról a következő esetben beszélhetünk.

Tétel. Ha az f:Rⁿ ⊃ $\to$ R^m függvény minden parciális deriváltfüggvénye létezik az u egy környezetében és u-ban a parciális deriváltak folytonosak, akkor u-ban f differenciálható. (Sőt, folytonosan differenciálható.)

Bizonyítás. Elegendő az m = 1 esetet vizsgálni. Továbbá a bizonyítás elve nem változik, ha csak az n = 2 esetet tekintjük. Legyen x az u mondott környezetéből vett pont, és x = ( $x 1$ , $x 2$ ), v=( $u 1$ , $x 2$ ), u=( $u 1$ , $u 2$ ) Ekkor az [x,v] szakaszon ∂₁f-hez a Lagrange-féle középértéktétel miatt létezik olyan ξ( $x 1$ )∈[ $x 1$ , $u 1$ ] szám, és a [v,u] szakaszon ∂₂f-hez ζ( $x 2$ )∈[ $x 2$ , $u 2$ ] szám, hogy

$f(x)-f(u)=f(x)-f(v)+f(v)-f(u)=\,$

$=\partial_1 f(\xi(x_1),x_2)(x_1-u_1)+\partial_2 f(u_1,\zeta(x_2))(x_2-u_2)=$

$=\partial_1f(u)(x_1-u_1)+\partial_2f(u)(x_2-u_2)+$

$+(\partial_1 f(\xi(x_1),x_2)-\partial_1f(u))(x_1-u_1)+(\partial_2 f(u_1,\zeta(x_2))-\partial_2f(u))(x_2-u_2)$

itt az

$\varepsilon_1(x)=\partial_1 f(\xi(x_1),x_2)-\partial_1f(u)$ és $\varepsilon_2(x)=\partial_2 f(x_1,\zeta(x_2))-\partial_2f(u)$

függvények folytonosak u-ban (még ha a ξ, ζ függvények nem is azok), és értékük az u-ban 0. Világos, hogy ez azt jelenti, hogy f differenciálható u-ban.

Világos, hogy a parciális deriváltak folytonossága szükséges a fenti tételben. Az alábbi példában léteznek a parciális deriváltfüggvények az u egy környzetében, de az u-ban nem folytonosak.

Nem differenciálható, nem folytonosan parciálisan differenciálható függvény

$f(x,y)=\left\{\begin{matrix}\frac{xy}{\sqrt{x^2+y^2}}& \mbox{, ha }&(x,y)\ne (0,0)\\ 0&\mbox{, ha }&(x,y)=(0,0)\end{matrix}\right.$

parciális deriváltfüggvényei léteznek:

$\frac{\partial f(x,y)}{\partial x}=\frac{y}{\sqrt{x^2+y^2}}-\frac{x^2y}{\sqrt{(x^2+y^2)^3}}$

a másik hasonlóan. A 0-ban 0 mindkettő, de az (0,1/n) mentén a 0-ba tartva az 1-hez tart, ami nem 0.

$f(x,y)=\left\{\begin{matrix} 0,& \mbox{ ha }(x,y)=(0,0)\\ \frac{xy(x^2-y^2)}{x^2+y^2},& \mbox{ ha }(x,y)\ne(0,0) \end{matrix}\right.$

A Young-tételnél beláttuk, hogy ekkor a 0-ban nem egyenlő a két vegyes parciális derivált. Most már azt is tudjuk miért. A függvény gradiense nem differenciálható totálisan a 0-ban. Ehhez elevenítsük föl, hogy

$J^g(0,0)=H^f(0,0)=\begin{bmatrix} 0 & -1\\ 1 & 0 \end{bmatrix}$

ami a 90˚-os forgatás.

Számoljuk ki g értékét a (x,x) alakú pontokban:

$\partial_1f(x,x)=\lim\limits_{t\to 0}\frac{f(x+t,x)-f(0,0)}{t}=\lim\limits_{t\to 0}\frac{(x+t)x((x+t)^2-x^2)}{t((x+t)^2+x^2)}=$

$\lim\limits_{t\to 0}\frac{(x+t)x(2tx+t^2)}{t(2x^2+2tx+t^2)}=\lim\limits_{t\to 0}\frac{(x+t)x(2x+t)}{2x^2+2tx+t^2}=\lim\limits_{t\to 0}=x$

$\partial_2f(x,x)=\lim\limits_{t\to 0}\frac{f(x,x+t)-f(0,0)}{t}=\lim\limits_{t\to 0}\frac{x(x+t)(x^2-(x+t)^2)}{t(x^2+(x+t)^2)}=$

$\lim\limits_{t\to 0}\frac{x(x+t)(-2tx-t^2)}{t(2x^2+2tx+t^2)}=-x$

Tehát g(t,t)=(t,-t), és emiatt

$\lim\limits_{t\to 0}\frac{g(t,t)-g(0,0)-J^g(0,0)\cdot (t,t)}{|t|}=\lim\limits_{t\to 0}\frac{(t,-t)-(-t,t)}{|t|}=\lim\limits_{t\to 0}\frac{(2t,-2t)}{|t|}=\lim\limits_{t\to 0}(2\mathrm{sgn}(t),-2\mathrm{sgn}(t))\ne (0,0)\,$

márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne.

Differenciálható, de nem folytonosan parciálisan differenciálható

A differenciálhatóság azonban nem elég ahhoz, hogy a parciális deriváltak folytonosak legyenek.

Az

$f(x,y)=\left\{\begin{matrix}(x^2+y^2)\sin\cfrac{1}{x^2+y^2}, & \mbox{ha} & (x,y)\ne (0,0)\\\\ 0, & \mbox{ha} & (x,y) =(0,0) \end{matrix}\right.$

differenciálható, hiszen ez az

$f(\mathbf{r})=\left\{\begin{matrix} \mathbf{r}^2\cdot\sin(|\mathbf{r}|^{-2}) & \mbox{ha} & \mathbf{r}\ne \mathbf{0}\\\\ \mathbf{0}, & \mbox{ha} & \mathbf{r}= \mathbf{0}\end{matrix}\right.$

függvény és r ≠ 0-ban:

$\mathrm{grad}(f)=\sin(|\mathbf{r}|^{-2}).\mathrm{grad}\,\mathbf{r}^2+\mathbf{r}^2.\mathrm{grad}\,\sin(|\mathbf{r}|^{-2})=$

$=\sin(|\mathbf{r}|^{-2}).2\mathbf{r}+\mathbf{r}^2\cdot\cos(|\mathbf{r}|^{-2})\cdot(-2)|\mathbf{r}|^{-3}.\frac{\mathbf{r}}{|\mathbf{r}|}$

és grad f nem korlátos. Ez persze a parciális deriváltakon is megátszik: azok sem korlátosak.

Egyváltozós illetve valós értékű függvény deriváltja

Ha f:Rⁿ $\supset\!\to$ R, akkor a definíciót még így is ki szokás mondani:

f diffható r₀-ban, ha létezik m vektor, hogy

$\lim\limits_{r\to r_0}\frac{f(r)-f(r_0)-m\cdot(r-r_0)}{|r-r_0|}=0$

Ekkor az m a gradiensvektor, melynek sztenderd bázisbeli koordinátamátrixa a Jacobi mátrix:

$\mathrm{grad}\,f(r_0)=[\partial_1f(r_0),...,\partial_nf(r_0)]$

Ha f:R $\supset\!\to$ Rⁿ, akkor a definíciót még így is ki szokás mondani:

$\exists\,f'(t_0)=\lim\limits_{t\to t_0}\frac{f(t)-f(t_0)}{t-t_0}\,$

és ekkor f'( $t 0$ ) a $t 0$ -beli deriváltvektor (ha t az idő és r=f(t) a hely, akkor ez a sebeségvektor).

Ha f:Rⁿ $\supset\!\to$ Rⁿ, akkor a differenciált deriválttenzornak is nevezik.

Példa.

Mi az

$f(r)=r^2\,$ ,

skalárfüggvény gradiense?

Válasszuk le a lineáris részét!

$r^2-r_0^2=(r-r_0)(r+r_0)=(r-r_0)(2r_0+r-r_0)=2r_0\cdot(r-r_0)+(r-r_0)^2\,$

Itt az első tag a lineáris, a második a magasabbfokú. Tehát:

$\mathrm{grad}\,r^2=2r\,$

Lineáris és affin függvény deriváltja

Tétel. Az A : Rⁿ $\to$ R^m lineáris leképezés differenciálható és differenciálja minden pontban saját maga:

$\mathrm{d}\mathcal{A}(u)=\mathcal{A}\,$

Ugyanis, legyen u ∈ Rⁿ. Ekkor

$\lim\limits_{x\to u}\frac{\mathcal{A}(x)-\mathcal{A}(u)-\mathcal{A}(x-u)}{||x-u||}=\lim\limits_{x\to u}0=0$

Tétel. Az azonosan c konstans függény esetén az dc(u) $\equiv$ 0 alkalmas differenciálnak, mert

$\lim\limits_{x\to u}\frac{c-c-0\cdot(x-u)}{||x-u||}=\lim\limits_{x\to u}0=0$

Tétel. Ha f és g a H ⊆ Rⁿ halmazon értelmezett R^m-be képező, az u ∈ H-ban differenciálható függvények, akkor minden λ számra

$\lambda.f\,$ is differenciálható u-ban és $\mathrm{d}(\lambda.f)(u)=\lambda.\mathrm{d}f(u)\,$ és

$f+g\,$ is differenciálható u-ban és $\mathrm{d}(f+g)(u)=\mathrm{d}f(u)+\mathrm{d}g(u)\,$

Ugyanis, a mondott differenciálokkal és a

$\varepsilon_{\lambda.f}=\lambda.\varepsilon_{f}\,$

$\varepsilon_{f+g}=\varepsilon_{f}+\varepsilon_{g}\,$

választással, ezek az u-ban folytonosak lesznek és a lineáris résszekel együtt ezek előállítják a skalárszoros és összegfüggvények megváltozásait.

Következmény. Tehát minden u ∈ Rⁿ-re az affin c+A diffható és

$\mathrm{d}(c+\mathcal{A})(u)=\mathcal{A}$

Példa

Az A: x $\mapsto$ 2 $x 1$ + 3 $x 2$ - 4 $x 3$ lineáris leképezés differenciálja az u pontban az u-tól független

$(\mathrm{d}\mathcal{A}(\mathbf{u}))(x_1,x_2,x_3)=2x_1+3x_2-4x_3\,$

és Jacobi-mátrixa a konstans

$\mathbf{J}^\mathcal{A}(\mathbf{u})=\begin{bmatrix}2 & 3 & -4\end{bmatrix}$

mátrix.

Világos, hogy a

$\mathrm{pr}_i:(x_1,x_2,...,x_i,...,x_n)\mapsto x_i$

koordináta vagy projekciófüggvény lineáris, differenciálja minden u pontban saját maga és ennek mátrixa:

$[\mathrm{grad}\,\mathrm{pr_i}]=\mathbf{J}^{\mathrm{pr}_i}(\mathbf{u})=\begin{bmatrix}0 & 0 & ... & 1 & ...& 0\end{bmatrix}$

ahol az 1 az i-edik helyen áll. Másként

$\partial_kx_i=\delta_{ki}$

ahol

$\delta_{ij}=\left\{\begin{matrix}1, \mbox{ ha }i=j\\0, \mbox{ ha }i\ne j \end{matrix}\right.$

azaz a Kronecker-féle δ szimbólum.

Szélsőérték szükséges feltétele

Egyelőre állapodjunk meg abban, hogy gradiensnek nevezzük a következő többváltozós vektorértékű függvényt: ha f: Rⁿ $\supset\!\to$ R parciálisan differenciálható, akkor

$\mathrm{grad}\,f(x)=(\partial_1f(x),...,\partial_nf(x))$

mely lényegében az f elsőrendű parciális deriváltjaiból képezett vektor.

Később a gradienst egy kissé másképp fogjuk értelmezni és amit most definiáltunk, az a gradiens sztenderd bázisbeli mátrixa lesz (adott pontra vonatkozóan).

Tétel - Fermat-tétel - Legyen f: Rⁿ $\supset\!\to$ R, u ∈ int Dom(f), f parciálisan differenciálható u-ban.

Ha u-ban f-nek (lokális) szélsőértéke van, akkor

$\mathrm{grad}\,f(u)=0_{\mathbf{R}^n}\,$

U.is: minden i-re az i-edik parciális függvénynek szélsőértéke van u_i-ben, így az egyváltozós Fermat-tétel miatt ezeknek a deriváltja u_i-ben 0, így a gradiens értéke 0.

Példa

$f(x,y)=x^2y^2\,$

Ennek gradiense:

$\mathrm{grad}\,f(x,y)=(2xy^2,2yx^2)$

Az

$\left. \begin{matrix} \mathrm{I.} & 2xy^2 & = & 0\\ \mathrm{II.} & 2yx^2 & = & 0\\ \end{matrix} \right\}$

egyenletrendszer megoldásai: x = 0, y tetszőleges ill. y = 0 és x tetszőleges. A szélsőértékek helyei csak ezek közül kerülhetnek ki és ezek valóban szélsőértékek is, mert ezeken a függvény 0-t vesz fel, ami a lehetséges legkisebb értéke.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot 5*x*x*y*y

Magasabbrendű parciális deriváltak

Ha f parciálisan deriválható, akkor ∂₁f és ∂₂f szintén kétváltozós függvények (a pontonként a deriváltak, mint függvényértékek értelmezésével) és érdeklődhetünk ezek parciális differenciálhatóságuk iránt. Például:

$f(x,y)=x^2y^4+x^5-y^3\,$

$\partial_xf(x,y)=xy^4+5x^4$

$\partial_yf(x,y)=x^24y^3-3y^2$

$\partial_x(\partial_xf)(x,y)=y^4+20x^3$

$\partial_y(\partial_yf)(x,y)=12x^2y^2-6y^2$

$\partial_y(\partial_xf)(x,y)=x4y^3$

$\partial_x(\partial_yf)(x,y)=4xy^3$

És valóban:

Tétel. (Young-tétel) Ha a másodrendű parciláis deriváltak léteznek az u egy környezetében és folytonosak az u pontban, akkor az u-beli vegyes másodrendű parciláis deriváltak egyenlőek:

$\partial_x(\partial_y f)(u)=\partial_y(\partial_x f)(u)$

Azaz az alábbi, úgy nevezett Hesse-mátrix szimmetrikus:

$H^f(u)=\begin{bmatrix} \cfrac{\partial^2 f(u)}{\partial x^2} & \cfrac{\partial^2 f(u)}{\partial y\partial x}\\\\ \cfrac{\partial^2 f(u)}{\partial x\partial y} & \cfrac{\partial^2 f(u)}{\partial y^2} \end{bmatrix}$

Feladat. Az a kitétel, hogy az u-ban a másodrenrű parciláis deriváltak folytonosak, nem hagyható el, ugyanis. Legyen

$f(x,y)=\left\{\begin{matrix} 0,& \mbox{ ha }(x,y)=(0,0)\\ \frac{xy(x^2-y^2)}{x^2+y^2},& \mbox{ ha }(x,y)\ne(0,0) \end{matrix}\right.$

Ekkor a 0-ban nem egyenlő a két vegyes parciális derivált.

Tekintsük a parciális deriváltakat:

$\partial_x(\partial_yf)(0,0)=\lim\limits_{x\to 0}\frac{(\partial_yf)(x,0)-(\partial_yf)(0,0)}{x}$

$\partial_y(\partial_xf)(0,0)=\lim\limits_{y\to 0}\frac{(\partial_xf)(0,y)-(\partial_xf)(0,0)}{y}$

$\partial_x(\partial_xf)(0,0)=\lim\limits_{x\to 0}\frac{(\partial_xf)(x,0)-(\partial_xf)(0,0)}{x}$

$\partial_y(\partial_yf)(0,0)=\lim\limits_{y\to 0}\frac{(\partial_yf)(0,y)-(\partial_yf)(0,0)}{y}$

Ehhez tehát elegendő kiszámítani a következő föggvényeket: y $\mapsto$ (∂_xf)(0,y), x $\mapsto$ (∂_yf)(x,0). Ehhez a parciális deriváltak:

$\partial_xf(0,y)=\lim\limits_{t\to 0}\frac{f(t,y)-f(0,0)}{t}=\left\{\begin{matrix} 0,& \mbox{ ha }y=0\\ -y,& \mbox{ ha }y\ne 0 \end{matrix}\right.$

$\partial_yf(x,0)=\lim\limits_{t\to 0}\frac{f(x,t)-f(0,0)}{t}=\left\{\begin{matrix} 0,& \mbox{ ha }x=0\\ x,& \mbox{ ha }x\ne 0 \end{matrix}\right.$

$\partial_yf(0,y)=\lim\limits_{t\to 0}\frac{f(0,y+t)-f(0,0)}{t}=0$

$\partial_xf(x,0)=\lim\limits_{t\to 0}\frac{f(x+t,0)-f(0,0)}{t}=0$

Megjegyezzük, hogy a g=(∂_xf,∂_yf) függvény (0,0)-beli parciális deriváltjai nem lehetnek folytonosak, mert ott a függvény nem totálisan diffható. Ugyanis a g Jacobi-mátrixa:

$J^g(0,0)=H^f(0,0)=\begin{bmatrix} 0 & -1\\ 1 & 0 \end{bmatrix}$

ami a 90˚-os forgatás. Ekkor a g-t a (t,0) vektorral közelítve a 0-ba:

$\lim\limits_{t\to 0}\frac{g(t,0)-g(0,0)-J^g(0,0)\cdot (t,0)}{|t|}=\lim\limits_{t\to 0}\frac{(0,-t)}{|t|}\ne (0,0)\,$

márpedig ha g minden parciális deriváltja folytonos lenne a (0,0)-ban, akkor g totálisan is deriválható lenne.

Többváltozós függvény szélsőértéke

Másodikderivált próba

Kétszer differenciálható függvényre vonatkozóan megfogalmazhatjuk a lokális maximum és minimum létezésének elégséges feltételét. Csak a kétváltozós függvényekkel foglalkozunk. Tegyük fel, hogy grad f(u) = 0 és H^f(u) az f Hesse-mátrixa

ha det H^f(u) > 0 és ∂₁₁f(u) < 0, akkor f-nek u-ban maximuma van
ha det H^f(u) > 0 és ∂₁₁f(u) > 0, akkor f-nek u-ban minimuma van
ha det H^f(u) < 0, akkor f-nek biztosan nincs szélsőértéke, ún. nyeregpontja van
ha det H^f(u) = 0, akkor a próba nem járt sikerrel, azaz további vizsgálatokat igényel annak eldöntése, hogy u szélsőérték hely-e.

Megjegyzések. Mivel kétváltozós esetben

$\mathrm{det}\,\mathrm{H}^f(u)=\partial_{11}f(u)\cdot \partial_{22}f(u)-(\partial_{12}f(u))^2$

ezért olyan eset nem létezik, hogy det H^f(u) > 0 és ∂₁₁f(u) = 0.

Világos, hogy a másodikderivált tipikusan azoknál a függvényeknél jár sikerrel, melyeket egy másodfokú függvény közelít a legjobban (aszimptotikusan másodfokúak). Ha a függvény ennél magasabb fokú, akkor a második deriváltak eltűnnek és a Hesse-mártix elfajul (vagy legalább is tipikusan elfajul).

Ha tehát

$\mathrm{H}^{f}(u)=\begin{pmatrix} A & B \\ B & C \end{pmatrix}$ , akkor $\mathrm{det\,H}^{f}(u)=AC - B^2$ ,

és így a tipikus példák a következők.

Példák

1. Ha B kicsi, azaz az AC-hez képest kis abszolútrétékű szám, akkor a szélsőérték irányába mozdul el a feladat.

$f(x,y)=x^2+xy+y^2\,$

Ekkor grad f = ( 2x + y , 2y + x ) és

$\mathrm{H}^{f}(x,y)=\begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}$

azaz 4 - 1 = 3 > 0 és 2 > 0 miatt minimum.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot x*x+x*y+y*y

2. Ha |B| nagy (azaz AC-hez képest nagy), akkor a bizonyosan nemszélsőérték irányába.

$f(x,y)=x^2-3xy+y^2\,$

Ekkor grad f = ( 2x + -3y , 2y + -3x ) és

$\mathrm{H}^{f}(x,y)=\begin{pmatrix} 2 & -3 \\ -3 & 2 \end{pmatrix}$

azaz 4 - 9 = -5 < 0 miatt nincs szélsőérték: nyeregpont.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot x*x -3*x*y+y*y

3. Negatív A és C-re és kis B-re:

$f(x,y)=-x^2+xy-y^2\,$

Ekkor grad f = ( -2x + 3y , -2y + 3x ) és

$\mathrm{H}^{f}(x,y)=\begin{pmatrix} -2 & 1 \\ 1 & -2 \end{pmatrix}$

azaz 4 - 1 = 3 > 0 és -2 < 0 miatt maximum.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot -x*x +x*y-y*y

4. Ha A és C előjele ellenkező, akkor rögtön következik, hogy nincs sz.é.

$f(x,y)=x^2+xy-y^2\,$

Ekkor grad f = ( 2x + y , -2y + x ) és

$\mathrm{H}^{f}(x,y)=\begin{pmatrix} 2 & 1 \\ 1 & -2 \end{pmatrix}$

azaz -4 - 1 = -5 < 0 azaz nyeregpont.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot x*x +x*y-y*y

5. Atipikus eset, ha AC = B². Ekkor nem jár sikerrel a próba:

$f(x,y)=x^2+2xy+y^2\,$

Ekkor grad f = ( 2x + 2y , 2y + 2x ) és

$\mathrm{H}^{f}(x,y)=\begin{pmatrix} 2 & 2 \\ 2 & 2 \end{pmatrix}$

azaz 4 - 4 = 0, azaz határozatlan eset. De tudjuk, hogy

$f(x,y)=(x+y)^2\,$

ami pontosan akkor minimális, ha x = -y, azaz ezeken a helyeken van szélsőérték.

 set pm3d

set size 0.8,0.8
set xrange [-1:1]
set yrange [-1:1]
set zrange [-2:2]
set view 50,30,1,1
unset xtics
unset ytics
unset ztics
unset key
unset colorbox

splot (x+y)*(x+y)

Kiegészítés

Skalárfüggvények szorzata

λ, μ: H $\to$ R, ahol H ⊆ Rⁿ és az u ∈ H-ban mindketten differenciálhatók, akkor λμ is és

$[\mathrm{d}(\lambda\mu)(u)]_{1j}=\partial_j(\lambda\mu)=\mu\partial_j\lambda+\lambda\partial_j\mu=[\mu(u).\mathrm{grad}\,\lambda(u)+\lambda(u).\mathrm{grad}\,\mu(u)]_{j}$

azaz

$\mathrm{grad}(\lambda\mu)(u)=\mu(u).\mathrm{grad}\,\lambda(u)+\lambda(u).\mathrm{grad}\,\mu(u)$

Példa

Számoljuk ki r² deriváltját a szorzat szabálya szerint.

Egyrészt, ha r ≠ 0, akkor

$\mathrm{grad}\,\mathbf{r}^2=\mathrm{grad}\,|\mathbf{r}|\cdot|\mathbf{r}|=2|\mathbf{r}|.\mathrm{grad}|\mathbf{r}|=2|\mathbf{r}|.\frac{\mathbf{r}}{|\mathbf{r}| } =2\mathbf{r}\,$

Másrészt, ha r = 0, akkor

$\mathbf{r}^2=0+\mathbf{0}\cdot\mathbf{r}+|\mathbf{r}|\cdot |\mathbf{r}|\,$

minden r-re fennáll, így grad(id²)(0) = 0 alkalmas az ε(r)=|r|-rel, tehát r² differenciálható 0-ban is.

a × ... operátor

Differenciálható-e és ha igen mi a differenciálja, divergenciája, rotációja a

$\mathbf{v}:\mathbf{R}^3\to\mathbf{R}^3;\quad \mathbf{v}(\mathbf{r})=\mathbf{a}\times\mathbf{r}$

leképezésnek, ahol a előre megadott konstans vektor.

Megoldás

Az a × ..., azaz az

$\mathbf{a}\times\mathrm{I}\,$

(itt I az identitás leképezés) leképezés lineáris, minthogy a vektoriális szorzás mindkét változójában lineáris (v ∈ Lin(R³;R³)), így differenciálható és differenciálja saját maga:

$\mathrm{d}(\mathbf{a}\times\mathrm{I})(\mathbf{r})=\mathbf{a}\times\mathrm{I}$

azaz

$(\mathrm{d}(\mathbf{a}\times\mathrm{I})(\mathbf{r}))\mathbf{h}=\mathbf{a}\times\mathbf{h}$

minden h és r ∈ R³ vektorra.

Jacobi-mátrixa (a sztenderd bázisbeli mátrixa) tetszőleges (x,y,z) pontban:

$\mathrm{J}^{\mathbf{a}\times\mathrm{I}}(x,y,z)= \begin{bmatrix} \;\,0 & -a_3& \;\;\,a_2\\ \;\;\,a_3 & \;\,0 & -a_1\\ -a_2 & \;\;\,a_1& \;\,0\\ \end{bmatrix}$

Mivel a főátlóbeli elemek mind nullák, ezért ebből rögtön következik, hogy div(a × I)(r) = 0.

$[\mathrm{rot}\,\mathbf{v}]_i=\varepsilon_{ijk}\partial_j\varepsilon_{klm}a_lx_m=\varepsilon_{ijk}\varepsilon_{klm}a_l\partial_j x_m=\varepsilon_{ijk}\varepsilon_{klm}a_l\delta_{jm}=\varepsilon_{ijk}\varepsilon_{klj}a_l=$

$=\delta_{kk}\delta_{il}a_l-\delta_{ki}\delta_{lk}a_l=3a_i-a_i=2a_i\,$

azaz rot v (r) = 2a. Az előbb felhasználtuk a kettős vektoriális szorzatra vonatkozó kifejtési tétel indexes alakját, a

$\varepsilon_{ijk}\varepsilon_{klm}=\delta_{jm}\delta_{li}-\delta_{jl}\delta_{im}\,$

ami azt mondja, hogy ha az ijk és klm-ben a nem azonos párok jó sorrendben következnek, akkor az epszolon 1-et, ha rossz sorrendben, akkor -1-et ad.

a $\cdot$ ... operátor

Differenciálható-e és ha igen mi a differenciálja

$\Phi:\mathbf{R}^3\to\mathbf{R};\quad \Phi(\mathbf{r})=\mathbf{a}\cdot\mathbf{r}$

leképezésnek, ahol a előre megadott konstans vektor.

Megoldás

Skalártér lévén Φ gradiensét kell kiszámolnunk. Mivel ez is lineáris leképezés, ezért differenciálható és differenciálja saját maga, azaz a gradiens vektor pont a:

$\mathrm{grad}\,(\mathbf{a}\cdot\mathbf{r})=\mathbf{a}$

Ezt persze indexes deriválással is kiszámítható:

$[\mathrm{grad}\,\Phi]_i=\partial_ia_kx_k=a_k\partial_ix_k=a_k\delta_{ik}=a_i\,$

További példa skalárfüggvényre

Hatérozzuk meg a Φ

$\Phi:\mathbf{R}^3\to\mathbf{R};\quad \Phi(\mathbf{r})=|\mathbf{i}\times\mathbf{r}|$

(ahol i az x irányú egységvektor, |.| a vektor hossza) függvény szintvonalait, differenciálhatóságát, gradiensét!

Megoldás

Érdemes koordinátás írásmódra áttérni, hiszen az i vektor úgy is a koordinátarendszerhez kapcsolódik. A vektoriális szorzás definíciója miatt

$\Phi(x,y,z)=\Phi(\mathbf{r})=|\mathbf{r}|\cdot\sin(\mathbf{i},\mathbf{r})_\angle=\sqrt{y^2+z^2}$

Tehát azok a pontok vannak azonos szintfelületen, melyeknek az [yz] síkra vett vetületük azonos hosszúságú (i × r hossza az i-re merőleges komponense r-nek). Az

y 2 + z 2 = 0

egyenlettel megadott pontokban (másként: y = 0 & z = 0 & x tetszőleges) a függvény nem differenciálható, ugyanis a Φ=0 szintfelület elfajúlt módon csak egy egyenes, az x tengely, így a gradiens vektor iránya nem egyértelmű. Ezt azzal is igazolhatjuk, ha vesszük ezekben a pontokban például az y irányú parciális függvényt:

$\Phi(x_0,0+t,0)=\sqrt{t^2}=|t|$

azaz az ( $x 0$ ,0,0) pontokhoz tartozó Φ( $x 0$ , . ,0) parciális függvény nem differenciálható a 0-ban.

Máshol a gradiensvektor, a parciális deriváltakat kiszámítva

$\mathrm{grad}\,\Phi(x,y,z)=\left(0,\frac{y}{\sqrt{y^2+z^2}}, \frac{z}{\sqrt{y^2+z^2}}\right)$

vagy másként:

$\mathrm{grad}\,\Phi(\mathbf{r})=\mathbf{i}\times \frac{\mathbf{i}\times \mathbf{r}}{|\mathbf{i}\times \mathbf{r}|}$

Megjegyezzük, hogy ehhez még a függvénykompozíció deriválási szabályával is lejuthattunk volna:

$\mathrm{grad}\,\Phi(\mathbf{r})=\mathrm{grad}\sqrt{(\mathbf{i}\times\mathbf{r})^2}=\frac{1}{2\sqrt{(\mathbf{i}\times\mathbf{r})^2}}\cdot 2(\mathbf{i}\times\mathbf{r})\times(-\mathbf{i})$

Indexes deriválás

Most csak a sokféle szorzat deriváltjának értékét számítjuk ki. Minden esetben igazolható, hogy ha a formulákban szereplő összes derivált létezik, akkor a formula érvényes (sőt, ha a függvények az adott pontban differenciálhatók, akkor a szorzat is differenciálható az adott pontban). Az mátrixelemeket indexesen számítjuk.

Feltéve például, hogy az f többváltozós skalárfüggvény parciálisan differenciálható, a gradiens elemeit így nyerjük:

$[\mathrm{grad}\,f]_i=\partial_if\,$

1. Példa

Ha f(r) = r², akkor

$\mathbf{r}^2=\sum\limits_{k=1}^3 [\mathbf{r}]_k[\mathbf{r}]_k=\sum\limits_{k=1}^3 x_kx_k=[\mathrm{Einstein\;konv.}]\;x_kx_k$

$[\mathrm{grad}\,f]_i=\partial_ix_kx_k\,=x_k\partial_ix_k+x_k\partial_ix_k\,$

de a koordinátafüggvények deriváltjairól tudjuk, hogy azoknak az értékét a Kronecker-delta adja:

$\partial_ix_k=\delta_{ik}=\left\{\begin{matrix}1,& \mathrm{ha} & i=k\\ 0,& \mathrm{ha} & i\ne k\end{matrix}\right.$

azaz

$[\mathrm{grad}\,f]_i=2x_k\delta_{ik}=2x_i=[2\mathbf{r}]_i\,$

tehát parciálisan differenciálható minden pontban és a Jacobi-mártix elemei a fentiek.

2. Példa

Ha f(r) = ar, akkor

$[\mathrm{grad}\,f]_i=\partial_ia_kx_k\,=a_k\partial_ix_k=a_k\delta_{ik}\,=a_i=[\mathbf{a}]_i$

3. Példa

Ha f(r) = |r|^α, akkor

$[\mathrm{grad}\,f]_i=\partial_i(x_kx_k)^{\alpha/2}\,=\partial_i(x_k)^{\alpha}=\frac{\alpha}{2}(x_kx_k)^{\frac{\alpha}{2}-1}2\delta_{ik}x_k\,$

itt ne feledjük, hogy k-ra szummázunk és hogy az összetett tényezőben a skaláris szorzat szerepel:

$[\mathrm{grad}\,f]_i=\alpha(x_kx_k)^{\frac{\alpha}{2}-1}x_i\,=\left[\alpha|\mathbf{r}|^\alpha\frac{\mathbf{r}}{\mathbf{r}^2}\right]_i=\left[\alpha|\mathbf{r}|^{\alpha-1}\frac{\mathbf{r}}{|\mathbf{r}|}\right]_i$

tehát parciálisan differenciálható minden pontban és a Jacobi-mártix elemei a fentiek.

Deriválttenzor és invariánsai

Ha A az f:Rⁿ ⊃ $\to$ Rⁿ leképezés differenciálja az u pontban, akkor A-t deriválttenzornak nevezzük. Minden tenzor egyértelműen előáll egy szimmetrikus és egy antiszimmetrikus tenzor összegeként:

$\mathbf{A}=\mathbf{A}_{s}+\mathbf{A}_a\,$

Ebből a szimmetrikus rész főátlbeli elemeinek összege minden bázisban ugyanaz a skaláris érték, melyet a tenzor nyomának, illetve a függvény divergenciájának nevezzük:

$\mathrm{div}(f)(u)=\mathrm{trace}(\mathbf{A})$ illetve $\mathrm{div}(f)=\sum\limits_{i=1}^n\partial_i f_i=*\partial_i f_i*$

Az utóbbi írásmód a koordinátás alakban az úgy nevezett Einstein-féle jelölési konvenció, amelynek elve, hogy a kétszer stereplő indexekre automatikusan szumma értendő.

Példa

$\mathrm{div}\,\mathbf{r}=\partial_kx_k=\delta_{kk}=\mathrm{dim}(\mathbf{R}^n)=n\,$

f:R³ ⊃ $\to$ R³ esetben a tenzor antiszimmetrikus részéhez egyértelműen létezik egy olyan a vektor, hogy minden r-re:

$\mathbf{A}_a\mathbf{r}=\mathbf{a}\times\mathbf{r}$

mely vektort az f rotációjának nevezzük:

$\mathrm{rot}f(u)\,$ és $[\mathrm{rot}f(u)]_i=\sum\limits_{j,k=1}^3\varepsilon_{ijk}\partial_j f_k=*\varepsilon_{ijk}\partial_j f_k*$

ahol

$\varepsilon_{ijk}=\left\{\begin{matrix} 1, & \mbox{ha} & (ijk)\in\{(123),(231),(312)\} \\ -1, & \mbox{ha} & (ijk)\in\{(321),(213),(132)\} \\ 0, & \mbox{egyebkent} \end{matrix}\right.$

a Levi-Civita-szimbólum.

Skalárfüggvénnyel való szorzás

λ: H $\to$ R, f:H $\to$ R^m, ahol H ⊆ Rⁿ és az u ∈ H-ban mindketten differenciálhatók, akkor λ.f is és

$[\mathrm{d}(\lambda.f)(u)]_{ij}=\partial_j(\lambda.f)=\partial_j\lambda f_i=f_i\partial_j\lambda+\lambda \partial_jf_i$

azaz

$\mathrm{d}(\lambda.f)(u)=f(u)\scriptstyle{\otimes}$ $\mathrm{grad}\lambda(u)+\lambda(u).\mathrm{d}f(u)\,$

ahol $\scriptstyle{\otimes}$ a diadikus szorzat, melynek koordinátamátrixa egy oszlopvektor (balról) és egy sorvektor (jobbról) mátrixszorzatából adódik. Ez ritkán kell teljes egészében, a két invariáns (rot-nál csak 3×3-as esetben) a gyakoribb.

$\mathrm{div}(\lambda.f)(u)=f(u)\cdot \mathrm{grad}\lambda(u)+\lambda(u)\cdot \mathrm{div}f(u)$

$[\mathrm{rot}(\lambda.f)(u)]_i=\varepsilon_{ijk}\partial_j\lambda f_k=\varepsilon_{ijk}(\partial_j\lambda)f_k+\lambda\varepsilon_{ijk}\partial_jf_k=$

$=[\mathrm{grad}\lambda(u)\times f(u)+\lambda(u).\mathrm{rot}f(u)]_i$

Vektorfüggvények skaláris szorzata

f,g:H $\to$ R^m, ahol H ⊆ Rⁿ és az u ∈ H-ban mindketten differenciálhatók, akkor f $\cdot$ g is és

$[\mathrm{d}(f\cdot g)(u)]_{1j}=\partial_j(f\cdot g)=\partial_j f_kg_k=f_k\partial_j g_k+g_k \partial_j f_k$

azaz

$\mathrm{d}(f\cdot g)(u)=(f(u)\cdot)\circ \mathrm{d}g(u)+(g(u)\cdot)\circ \mathrm{d}f(u)$

illetve a Jacobi-mátrixszal:

$\mathbf{J}^{f\cdot g}(u)=[f(u)]^\mathrm{T}\cdot \mathbf{J}^g(u) + [g(u)]^\mathrm{T}\cdot \mathbf{J}^f(u)$

ahol $[.] T$ az oszlopvektor transzponáltját, $(v\cdot)$ pedig a v vektorral történő skaláris szorzás operátorát jelöli.

5. gyakorlat	7. gyakorlat

Matematika A2a 2008/6. gyakorlat

Tartalomjegyzék

Folytonosság és totális differenciálhatóság

Iránymenti deriválhatóság és differenciálhatóság

Folytonos parciális differenciálhatóság

Nem differenciálható, nem folytonosan parciálisan differenciálható függvény

Differenciálható, de nem folytonosan parciálisan differenciálható

Egyváltozós illetve valós értékű függvény deriváltja

Lineáris és affin függvény deriváltja

Példa

Szélsőérték szükséges feltétele

Példa

Magasabbrendű parciális deriváltak

Többváltozós függvény szélsőértéke

Másodikderivált próba

Példák

Kiegészítés

Skalárfüggvények szorzata

Példa

a × ... operátor

Megoldás

a $\cdot$ ... operátor

Megoldás

További példa skalárfüggvényre

Megoldás

Indexes deriválás

1. Példa

2. Példa

3. Példa

Deriválttenzor és invariánsai

Skalárfüggvénnyel való szorzás

Vektorfüggvények skaláris szorzata

Nézetek

Személyes eszközök

Navigáció

Keresés

Eszközök

Matematika A2a 2008/6. gyakorlat

Tartalomjegyzék

Folytonosság és totális differenciálhatóság

Iránymenti deriválhatóság és differenciálhatóság

Folytonos parciális differenciálhatóság

Nem differenciálható, nem folytonosan parciálisan differenciálható függvény

Differenciálható, de nem folytonosan parciálisan differenciálható

Egyváltozós illetve valós értékű függvény deriváltja

Lineáris és affin függvény deriváltja

Példa

Szélsőérték szükséges feltétele

Példa

Magasabbrendű parciális deriváltak

Többváltozós függvény szélsőértéke

Másodikderivált próba

Példák

Kiegészítés

Skalárfüggvények szorzata

Példa

a × ... operátor

Megoldás

a ... operátor

Megoldás

További példa skalárfüggvényre

Megoldás

Indexes deriválás

1. Példa

2. Példa

3. Példa

Deriválttenzor és invariánsai

Skalárfüggvénnyel való szorzás

Vektorfüggvények skaláris szorzata

Nézetek

Személyes eszközök

Navigáció

Keresés

Eszközök

a $\cdot$ ... operátor