Informatika1-2015/Gyakorlat3
A MathWikiből
(Változatok közti eltérés)
(→Reguláris kifejezések) |
(→Reguláris kifejezések) |
||
5. sor: | 5. sor: | ||
. ^ $ * + ? { } [ ] \ | ( ) | . ^ $ * + ? { } [ ] \ | ( ) | ||
</pre> | </pre> | ||
− | + | === Karakterosztályok=== | |
+ | Egyelőre egyetlen karakterre illesztünk. | ||
** '''\d''': tetszőleges számjegy, '''\D''': tetszőleges karakter, ami nem számjegy. | ** '''\d''': tetszőleges számjegy, '''\D''': tetszőleges karakter, ami nem számjegy. | ||
** '''\w''': tetszőleges alfanumerikus karakter, betű, szám vagy alulvonás (_), '''\W''': tetszőleges, nem alfanumerikus karakter. | ** '''\w''': tetszőleges alfanumerikus karakter, betű, szám vagy alulvonás (_), '''\W''': tetszőleges, nem alfanumerikus karakter. |
A lap 2015. szeptember 20., 11:42-kori változata
Reguláris kifejezések
A reguláris kifejezéseket akkor használjuk, amikor összetettebb karaktersort keresünk egy szövegben, illetve ilyen karakterláncokat szeretnénk helyettesíteni. Az órán a https://regex101.com/#python oldalon fogjuk kipróbálni, hogy mi hogyan működik.
- Speciális karakterek: nem ismeri fel őket, más jelentésük van, csak \ előkével tudunk rájuk keresni, pl \$, \^ stb.
. ^ $ * + ? { } [ ] \ | ( )
Karakterosztályok
Egyelőre egyetlen karakterre illesztünk.
- \d: tetszőleges számjegy, \D: tetszőleges karakter, ami nem számjegy.
- \w: tetszőleges alfanumerikus karakter, betű, szám vagy alulvonás (_), \W: tetszőleges, nem alfanumerikus karakter.
- \s: whitespace, azaz tab, sor vége, szóköz, \S tetszőleges, nem whitespace karakter.
- Mi is megadhatunk karakterosztályt: [xyz], vagy tilthatunk is, pl. [^xyz]. Előbbi az x,y,z karakterek bármelyikére illeszkedik, utóbbi bármilyen karakterre, ami nem x,y vagy z. Sőt, kötőjellel elválasztva intervallunként hivatkozhatunk a karakterekre, pl. [a-z] illeszkedik az összes kisbetűre, de az [A-Za-z0-9] is helyes, ez minden kis- és nagybetűre és számjegyre illeszkedik.
- ^: sor eleje, $, sor vége.