Szerkesztő:Mozo/ A2 bizonyítások

A MathWikiből
(Változatok közti eltérés)
a (Magtér)
(Dimenziótétel)
122. sor: 122. sor:
 
és  
 
és  
 
:<math>\lambda.(\mathbf{A}v)=\mathbf{A}(\lambda.v)</math>
 
:<math>\lambda.(\mathbf{A}v)=\mathbf{A}(\lambda.v)</math>
Bázisát ('''R'''<sup>n</sup>-ben) például úgy nyerünk, hogy a '''A''' leképezés <nowiki>[</nowiki>'''A'''<nowiki>]</nowiki> mátrixának oszlopvektorai közül Gauss-eliminációval kiválasztjuk a legtöbb vektort tartalmazó lineárisan független rendszert (példa [[Lineáris altér#4. (képtér)|itt]]).
+
Bázisát ('''R'''<sup>n</sup>-ben) például úgy nyerünk, hogy a '''A''' leképezés <nowiki>[</nowiki>'''A'''<nowiki>]</nowiki> mátrixának oszlopvektorai közül [[Gauss-elimináció]]val kiválasztjuk a legtöbb vektort tartalmazó lineárisan független rendszert (példa [[Lineáris altér#4. (képtér)|itt]]).
 +
 
 +
===Tétel és bizonyítás===
 +
'''Dimenziótétel'''. Ha '''A''' : '''R'''<sup>n</sup> <math>\to</math> '''R'''<sup>m</sup> lineáris leképezés, akkor
 +
:<math>\mathrm{Ker}(\mathbf{A}) + \mathrm{Im}(\mathbf{A}) = n</math>
 +
 
 +
''Bizonyítás.'' Ha vesszük Ker('''A''') egy
 +
:<math>B=\{b_1,...,b_k\}\,</math>
 +
bázisa akkor világos, hogy ennek elemeinek képei által kifeszített
 +
:<math>\langle\mathbf{A}b_1,\mathbf{A}b_2,...,\mathbf{A}b_k\rangle</math>
 +
altér az '''R'''<sup>m</sup>-beli triviális {0} altér. Világos, hogy ha veszük egy Ker('''A''')-n kívüli c vektort, akkor ez már nem képeződhet a {0}-ba. Megfogalmazhatjuk tehát azt a sejtést, hogy ha B-t kibővítíjük '''R'''<sup>n</sup> bázisává, mondjuk a
 +
:<math>C=\{c_1,...,c_l\}\,</math>
 +
független vektorrendszerrel, akkor C elemeinek képei Im('''A''') bázisát fogja adni. Ezt fogjuk igazolni, azaz hogy
 +
:<math>\langle\mathbf{A}c_1,\mathbf{A}c_2,...,\mathbf{A}c_l\rangle=\mathrm{Im}(\mathbf{A})</math>
 +
és ami a tétel állítását igazolja: Im('''A''') dimenziója pont ''l''.
 +
'''1.''' Először belátjuk, hogy { '''A'''c<sub>1</sub>, '''A'''c<sub>2</sub>, ...,'''A'''c<sub>''l''</sub> }  generátorrendszere Im('''A''')-nak. Legyen
 +
:<math>v=\mathbf{A}u\,</math>
 +
Mivel ''B'' + ''C'' bázisa '''R'''<sup>n</sup>-nek, ezért ''u'' előáll (egyértelmű módon)
 +
:<math>u=\lambda_1b_1+\lambda_2b_2+...+\lambda_kb_k+\mu_1c_1+\mu_2c_2+...+\mu_lc_l\,</math>
 +
alakban. De ''u'' képében a B-beliekkel előállíthatók a {0}-ba mennek, így már a C-ből jövő képek is előállítják '''A'''u-t:
 +
:<math>\mathbf{A}u=\mathbf{A}(\lambda_1b_1+\lambda_2b_2+...+\lambda_kb_k)+\mathbf{A}(\mu_1c_1+\mu_2c_2+...+\mu_lc_l)=</math>
 +
:::<math>=0+\mathbf{A}(\mu_1c_1+\mu_2c_2+...+\mu_lc_l)</math>
 +
:::<math>=\mu_1\mathbf{A}c_1+\mu_2\mathbf{A}c_2+...+\mu_l\mathbf{A}c_l</math>
 +
'''2.''' Belátjuk, hogy { '''A'''c<sub>1</sub>, '''A'''c<sub>2</sub>, ...,'''A'''c<sub>''l''</sub> }
 +
független vektorrendszer is, tehát dimenziója ''l''.
 +
 
 +
Tegyük fel, hogy vannak ''&nu;<sub>1</sub>, &nu;<sub>2</sub>, ...,&nu;<sub>l</sub>'' számok, melyekkel
 +
:<math>\nu_1\mathbf{A}c_1+\nu_2\mathbf{A}c_2+...+\nu_l\mathbf{A}c_l=0</math>
 +
Természetesen a bal oldalon kiemelhetünk '''A'''-t, tehát:
 +
:<math>\mathbf{A}(\nu_1c_1+\nu_2c_2+...+\nu_lc_l)=0</math>
 +
A függetlenséghet az kell, hogy ''&nu;<sub>1</sub>, &nu;<sub>2</sub>, ...,&nu;<sub>l</sub>''-k mind nullák legyenek. Ha indirekt módon feltennénk, hogy van köztük nemnulla, akkor

A lap 2008. május 24., 11:00-kori változata

Tartalomjegyzék

Többváltozós B–W-tétel

Lásd még:Bolzano–Weierstrass-tétel

A többdimenziós (de nem végtelendimenziós) esetben a csúcselemes bizonyítás nem működik abban az értelmeben, hogy közvetlenül nem hivatkozhatunk rájuk, mert nincs RN-ben a műveletekkel kompatibilis rendezés. Gondolhatnók arra is, hogy komponensenként használjuk az egydimenziós B–W-tételt. Ezzel a következő a probléma. Világos, hogy létezik minden projekciósorozatra egy-egy részsorozat, mely konvergens. Ám ebből egyáltalán nem következtethetünk arra, hogy ezek metszetéből kiválasztható részsorozat. Ellenpéldaként vegyünk egy R2-ben haladó sorozatot. Tegyük fel, hogy (szerencsétlen módon) az egydimenziós B–W-tétel az első komponensek sorozatából a páros indexűeket, a második komponensek közül a páratéan indexűeket választja ki. Ekkor a kétdimenziós sorozatnak nincs olyan részsosozata, mely a komponensorozatok közös indexeikből válaszható ki, tekintve, hogy a közös indexen halmaza üres.

A fentiek miatt olyan módon kell konvergens részsorozatokat kiválasztanunk, mely bizonyosan végtelen sok közös indexel rendelkeznek. A konstrukció a következő.

Bizonyítás

Legyen

(a_n)=(a_n^{(1)}, a_n^{(2)}, ..., a_n^{(N)})\in (\mathbf{R}^N)^{\mathbf{Z}^+}

egy N komponensű sorozat, mely korlátos RN-ben. Ekkor a komponenssorozatok is korlátosak. Az egydimenziós B–W-tétel szerint az

(a_n^{(1)})

sorozathoz létezik σ1 indexsorozat úgy, hogy az

(a_n^{(1)})\circ\sigma_1

konvergens részsorozat. Hasonlóképpen, de a

(a_n^{(2)})\circ\sigma_1

sorozatnak is van

(a_n^{(2)})\circ\sigma_1\circ\sigma_2

konvergens részsorozata. Megállapíthatjuk, hogy a

(a_n^{(1)})\circ\sigma_1\circ\sigma_2

sorozat szintén konvergens, mert konvergens sorozat részsorozata. Ugyanígy léteznek σ1, σ2, ..., σN indexsorozatok, hogy a

(a_n^{(1)})\circ\sigma_1
(a_n^{(2)})\circ\sigma_1\circ\sigma_2
\vdots
(a_n^{(N)})\circ\sigma_1\circ\sigma_2\circ...\circ\sigma_N

sorozatok mind konvergensek és így tetszőleges k=1...N-re

(a_n^{(k)})\circ\sigma_1\circ\sigma_2\circ...\circ\sigma_N

is az, ami pontosan azt jelenti, hogy az

(a_n)\circ\sigma_1\circ\sigma_2\circ...\circ\sigma_N

sorozat komponensenként konvergens, azaz konvergens. A

\sigma_1\circ\sigma_2\circ...\circ\sigma_N

tehát olyan indexsorozat, mely konvergens részsorozatot választ ki (an)-ből.

Ellenpélda végtelen dimenzióra

A tétel végtelen dimenziós esetben nem igaz. Vegyük példul a korlátos valós függvények

\mathrm{B}([-1,+1],\mathbf{R})\,

terében a szuprémumnormát:

||f||=_{\mathrm{def}}\sup\{|f(x)|\mid x\in [-1,+1]\}\,

és a belőle definiálható távolságot. Ebben az esetben a páratlan gyökkitevőjű gyökfüggvények

 f_n=\sqrt[2n+1]{.\;}\quad\quad (f_n(x)=\sqrt[2n+1]{x})

sorozata nem konvergens. Ez amiatt van, hogy az itteni konvergenciafogalom ugyanaz, mint a függvénysorozatok egyenletes konvergenciájának fogalma. Bár ez a függvénysorozat pontonként konvergál a szignumfüggvényhez, de a sorozat a szignumfüggvény minden környezetéből kilép. Emiatt még az is igaz, hogy egyetlen részsorozta sem lehet konvergens (azaz egyenletesen konvergens), holott a függvénysorozat maga korlátos (u.is. belefoglalható az azonosan 0 függvény 2 sugarú környezetébe).

Megjegyzés. A tétel azon iránya, mely a sorozatkompaktságot tételezi fel, igaz marad minden metrikus térben.

Weierstrass tétele

Az alábbiakban felhasználjuk a kompaktság fogalmát és Heine–Borel-tételt.

(Kompakt egy K halmaz, ha minden nyílt halmazrendszerből, melynek uniója lefedi K-t kiválasztható véges sok nyílt halmaz is, melyek véges uniója még mindig lefedi K-t.

Heine–Borel-tétel. Korlátos és zárt halmaz kompakt.)

Tétel (Weierstrass) Valós értékű, kompakt halmazon folytonos függvény felveszi minimumát és maximumát.

(Ha f ∈ C(Rn,R), Dom(f) kompakt, akkor sup(f), inf(f) ∈ Ran(f) )

Bizonyítás.

1) Először belátjuk, hogy kompakt halmazon folytonos függvény korlátos. Legyen ugyanis ε tetszőleges pozitív szám és f értelmezési tartománya K. A folytonosság miatt K minden u eleméhez létezik δ(u) pozitív szám, hogy f a Bδ(u) környezeten belül mindvégig az (f(u)-ε,f(u)+ε) intervallumon belül mara. Ekkor nyílt halmazok {Bδ(u)(u) : uK} rendszere lefedi K-t, vagyis a Heine–Borel-tétel miatt már ebből véges sok is lefed. Legyen ez {Bδ(u)(u) : uF}, ahol tehát FK véges. Ezek képei mind a (f(u)-ε,f(u)+ε) (uF)inervallumokban vannak, így a {(f(u)-ε,f(u)+ε) : uF} véges intervallumrendszer lefedi Ran(f)-et. Tehát f a "legmagasabb" intervallum felső határa és a "legalacsonyabb" intervallum alsó határa közé esik.

2) Belátjuk, hogy f felveszi a szuprémumát (és ugyanígy az infimumát is). Legyen S := sup(f) (azaz f értékkészletének legkisebb felső korlátja). Ekkor a g : K \to R, x \mapsto S-f(x)függvény nemnegatív értékeket vesz föl. Ha f nem venné fel a szuprémumát, akkor g pozitív lenne. Ekkor értelmezhető lenne a

h:K\to\mathbf{R};x\mapsto \frac{1}{S-f(x)}

függvény. h mert folytonos függvényekből van folytonosságot megőrző módon összetéve. Az 1) pont szerint korlátos is, ami azonban ellentmond annak, hogy S a szuprémum. Ugyanis f minden határon túl megközelíti S-et, azaz a különbségük reciproka minden határon túl nő.

Differenciálhatóság

Definíciója

Legyen f: Rn \supset\!\longrightarrow Rm és u ∈ int Dom(f). Azt mondjuk, hogy f differenciálható az u pontban, ha létezik olyan A: Rn \to Rm lineáris leképezés, hogy

\lim\limits_{x\to u}\frac{f(x)-f(u)-\mathcal{A}(x-u)}{||x-u||_{\mathbf{R}^n}}=0_{\mathbf{R}^m}

Ekkor A egyértelmű és az f leképezés u-bent beli deriválttenzorának vagy differenciáljának nevezzük és df(u)-val vagy Df(u)-val jelöljük. Ezt a fogalmat néha teljes differenciálnak, totális differenciálnak vagy Fréchet-deriváltnak is mondjuk.

Deriváltmátrix

Vizsgáljuk mibe viszi a bázisokat df(u) komponensleképezésenként. A df(u) lineáris leképezés (e1,e2,...,en) szetenderd bázisbeli mátrixa legyen: [df(u)] = A. Világos, hogy (df(u))(x)=A x. Először vegyük az A első sorvektorát, A1-et és az e1 egységvektor mentén tartunk u-hoz: x = u + te1. A df(u)-t definiáló határértékegyenlőség ekkor a következő alakot ölti:

0=\lim\limits_{t\to 0}\frac{f_1(u+te_1)-f_1(u)-\mathbf{A}_1\cdot(te_1)}{t}=
=\lim\limits_{t\to 0}\frac{f_1(u+te_1)-f_1(u)-t\mathbf{A}_1\cdot(e_1)}{t}=
=-\mathbf{A}_1\cdot e_1+\lim\limits_{t\to 0}\frac{f_1(u+te_1)-f_1(u)}{t}

azaz

\mathbf{A}_1\cdot e_1=\lim\limits_{t\to 0}\frac{f_1(u+te_1)-f_1(u)}{t}=\partial_1 f_1(u)

vagyis f első koordinátafüggvényének f1-nek az első változó szerinti parciális deriváltja az u pontban. A többi mátrixelemet ugyanígy:

[\mathrm{d}f(u)]=\mathbf{J}^f(u)=\begin{bmatrix}
\partial_1 f_1(u) & \partial_2 f_1(u) & \dots & \partial_n f_1(u)\\
\partial_1 f_2(u) & \partial_2 f_2(u) & \dots & \partial_n f_2(u)\\
\vdots            &     \vdots        &   \ddots    & \vdots \\
\partial_1 f_m(u) & \partial_2 f_m(u) & \dots & \partial_n f_m(u)\\
\end{bmatrix}

amelyet Jacobi-mátrixnak nevezünk.

Lineáris, konstans és affin függvény deriváltja

Az A : Rn \to Rm lineáris leképezés differenciálható és differenciálja minden pontban saját maga.

Ugyanis, legyen uRn. Ekkor

\lim\limits_{x\to u}\frac{\mathcal{A}(x)-\mathcal{A}(u)-\mathcal{A}(x-u)}{||x-u||}=\lim\limits_{x\to u}0=0

c konstans függény esetén az dc(u) \equiv 0 alkalmas differenciálnak, mert

\lim\limits_{x\to u}\frac{c-c-0\cdot(x-u)}{||x-u||}=\lim\limits_{x\to u}0=0

így világos, hogy c + A alakú affin függvények is differenciálhatóak, és differenciáljuk minden pontban az az A lineáris leképezés, melynek eltolásából az affin származik. Ezt szintén behelyettesítéssel ellenőrizhetjük.

Tehát minden uRn-re

\mathrm{d}\mathcal{A}(u)=\mathcal{A},\quad\quad\mathrm{d}c(u)\equiv 0,\quad\quad\mathrm{d}(b+\mathcal{A}\circ(id-a))(u)=\mathcal{A}

Elégséges feltétel totális differenciálhatóságra

Tétel. Ha az f:Rn\to Rm függvény minden parciális deriváltfüggvénye létezik az u egy környezetében és u-ban a parciális deriváltak folytonosak, akkor u-ban f differenciálható.

Dimenziótétel

A dimenziótétel az lineáris leképezések magterének és képterének dimenziója közötti szoros (kiegészítő jellegű) kapcsolatra mutat rá. Most csak az \mbox{ }_\mathcal{L}(Rn;Rm) leképezéseket vizsgáljuk (a tétel bármely végesdimenziós vektortérből tetszőleges vektortérbe menő lineáris függvényre is igaz.)

Magtér

Az A : Rn \to Rm lineáris leképezés magtere:

\mathrm{Ker}(\mathbf{A})=_{\mathrm{def}}\{v\in \mathbf{R}^n\mid \mathbf{A}v=0\}

világos, hogy ez altér. Ugyanis altér jelemzhető úgy, mint olyan részhalmaz a térben, mely zárt az összeadásra és a skalárral történő szorzásra. De Ker(A) ilyen, mert tetszőleges u, v vektorra

\mathbf{A}v=0\;\land\;\mathbf{A}u=0 \quad \Rightarrow\quad\mathbf{A}v+\mathbf{A}u=0\quad \Rightarrow\quad\mathbf{A}(v+u)=0

és

\mathbf{A}v=0\quad \Rightarrow\quad\lambda.(\mathbf{A}v)=0\quad \Rightarrow\quad\mathbf{A}(\lambda.v)=0

Bázisát (Rn-ben) például az A leképezés [A] mátrixának Gauss-eliminációjával és az [A]x=0 homogén egyenletrendszer megoldásával nyerhetünk (példa itt).

Képtér

Az A : Rn \to Rm lineáris leképezés képtere:

\mathrm{Im}(\mathbf{A})=_{\mathrm{def}}\{\mathbf{A}v\in \mathbf{R}^m\mid v\in \mathbf{R}^n\}

világos, hogy ez altér. Ugyanis alkalmas v és u vektorokkal:

\mathbf{A}v+\mathbf{A}u=\mathbf{A}(v+u)

és

\lambda.(\mathbf{A}v)=\mathbf{A}(\lambda.v)

Bázisát (Rn-ben) például úgy nyerünk, hogy a A leképezés [A] mátrixának oszlopvektorai közül Gauss-eliminációval kiválasztjuk a legtöbb vektort tartalmazó lineárisan független rendszert (példa itt).

Tétel és bizonyítás

Dimenziótétel. Ha A : Rn \to Rm lineáris leképezés, akkor

\mathrm{Ker}(\mathbf{A}) + \mathrm{Im}(\mathbf{A}) = n

Bizonyítás. Ha vesszük Ker(A) egy

B=\{b_1,...,b_k\}\,

bázisa akkor világos, hogy ennek elemeinek képei által kifeszített

\langle\mathbf{A}b_1,\mathbf{A}b_2,...,\mathbf{A}b_k\rangle

altér az Rm-beli triviális {0} altér. Világos, hogy ha veszük egy Ker(A)-n kívüli c vektort, akkor ez már nem képeződhet a {0}-ba. Megfogalmazhatjuk tehát azt a sejtést, hogy ha B-t kibővítíjük Rn bázisává, mondjuk a

C=\{c_1,...,c_l\}\,

független vektorrendszerrel, akkor C elemeinek képei Im(A) bázisát fogja adni. Ezt fogjuk igazolni, azaz hogy

\langle\mathbf{A}c_1,\mathbf{A}c_2,...,\mathbf{A}c_l\rangle=\mathrm{Im}(\mathbf{A})

és ami a tétel állítását igazolja: Im(A) dimenziója pont l. 1. Először belátjuk, hogy { Ac1, Ac2, ...,Acl } generátorrendszere Im(A)-nak. Legyen

v=\mathbf{A}u\,

Mivel B + C bázisa Rn-nek, ezért u előáll (egyértelmű módon)

u=\lambda_1b_1+\lambda_2b_2+...+\lambda_kb_k+\mu_1c_1+\mu_2c_2+...+\mu_lc_l\,

alakban. De u képében a B-beliekkel előállíthatók a {0}-ba mennek, így már a C-ből jövő képek is előállítják Au-t:

\mathbf{A}u=\mathbf{A}(\lambda_1b_1+\lambda_2b_2+...+\lambda_kb_k)+\mathbf{A}(\mu_1c_1+\mu_2c_2+...+\mu_lc_l)=
=0+\mathbf{A}(\mu_1c_1+\mu_2c_2+...+\mu_lc_l)
=\mu_1\mathbf{A}c_1+\mu_2\mathbf{A}c_2+...+\mu_l\mathbf{A}c_l

2. Belátjuk, hogy { Ac1, Ac2, ...,Acl } független vektorrendszer is, tehát dimenziója l.

Tegyük fel, hogy vannak ν1, ν2, ...,νl számok, melyekkel

\nu_1\mathbf{A}c_1+\nu_2\mathbf{A}c_2+...+\nu_l\mathbf{A}c_l=0

Természetesen a bal oldalon kiemelhetünk A-t, tehát:

\mathbf{A}(\nu_1c_1+\nu_2c_2+...+\nu_lc_l)=0

A függetlenséghet az kell, hogy ν1, ν2, ...,νl-k mind nullák legyenek. Ha indirekt módon feltennénk, hogy van köztük nemnulla, akkor

Személyes eszközök