Szabályos kifejezések - Az utolsó útmutató

PDF letöltése

A szabályos kifejezés olyan karakterek vagy szimbólumok csoportja, amelyeket arra használnak, hogy egy adott mintát találjanak valamilyen szövegből; nevezhetjük őket szteroidos vadkártyáknak is, ha úgy tetszik. Fejlesztőként a reguláris kifejezések elsajátítása hatékony eszköz lehet az eszköztáradban; egy bizonyos ponton biztosan használnod kell majd őket a programjaidban, a keresés és helyettesítés a reguláris kifejezésekkel az IDE-kben néha nagyon jól jön, és én magam is minden egyes nap használom őket a parancssorban.

A különböző alkalmazások és programozási nyelvek különböző implementációkkal rendelkeznek a reguláris kifejezésekhez, de a mögöttes koncepciók többnyire ugyanazok. Ebben a bejegyzésben elmagyarázok mindent, amit a reguláris kifejezésekről tudni kell.

A reguláris kifejezés egy olyan minta, amely balról jobbra haladva illeszkedik egy tárgysorozathoz. A “reguláris kifejezés” szó eléggé szájbarágós, általában “regex” vagy “regexp” rövidítéssel találod a kifejezést. A reguláris kifejezést egy karakterláncon belüli szöveg helyettesítésére, űrlapok érvényesítésére, részláncok kivonására egy karakterláncból mintaillesztés alapján, és még sok másra használják.

Képzelje el, hogy egy alkalmazást ír, és meg akarja határozni a szabályokat, amikor a felhasználó kiválasztja a felhasználónevét. Szeretnénk megengedni, hogy a felhasználónév betűket, számokat, aláhúzásokat és kötőjeleket tartalmazzon. Szeretnénk korlátozni a felhasználónévben szereplő karakterek számát is, hogy ne nézzen ki csúnyán. A következő szabályos kifejezést használjuk a felhasználónév érvényesítésére:

A fenti szabályos kifejezés elfogadja a john_doe, jo-hn_doe és john12_as karakterláncokat. A Jo nem felel meg, mert ez a karakterlánc nagybetűket tartalmaz, és túl rövid is.

Tartalomjegyzék

Az alapillesztők
Meta karakter
Teljes pont
Karakterkészlet
Negatív karakterkészlet
Megismétlődések
Az Csillag
A plusz
A kérdőjel
Kérdőjelek
Karaktercsoport
Alternáció
Elmenekülő speciális karakter
Ankarok
Caret
Dollár
Szortírozott karakterkészletek
Lookaround
Pozitív Lookahead
Negatív Lookahead
Pozitív Lookbehind
Flags
Case Insensitive
Globális keresés
Multiline
Greedy vs lazy matching

Basic Matchers

A reguláris kifejezés nem más, mint egy karakterekből álló minta, amelyet arra használunk, hogy egy szövegben
keresést végezzünk. Például a the szabályos kifejezés azt jelenti: a betű
t, majd a betű h, majd a betű e.

the => The fat cat sat on the mat.

Teszteljük a szabályos kifejezést

A 123 szabályos kifejezés 123 megfelel a 123 karakterláncnak. A szabályos kifejezést a bemeneti karakterlánccal úgy vetjük össze, hogy a szabályos
kifejezés minden egyes karakterét egymás után összehasonlítjuk a bemeneti karakterlánc minden egyes karakterével. A reguláris
kifejezések általában nagy- és kisbetű-érzékenyek, így a The reguláris kifejezés
nem illeszkedne a the karakterláncra.

The => The fat cat sat on the mat.

Teszteljük a reguláris kifejezést

Meta karakterek

A metakarakterek a reguláris kifejezések építőkövei. A meta
karakterek nem önmagukért állnak, hanem valamilyen
speciális módon értelmezik őket. Egyes metakarakterek különleges jelentéssel bírnak, és szögletes zárójelekbe vannak írva. A metakarakterek a következők:

Szabályos kifejezések – Az utolsó útmutató

Tartalomjegyzék

Basic Matchers

Meta karakterek

2.1 Pont

2.2 Karakterkészlet

2.2.1 Negált karakterkészlet

2.3 Ismétlések

2.3.1 A csillag

2.3.2 A Plusz

2.3.3 A kérdőjel

2.4 Zárójelek

2.5 Karaktercsoport

2.6 Alternáció

2.7 Speciális karakter elkerülés

2.8 Horgonyok

2.8.1 Caret

2.8.2 Dollár

Szöveges karakterkészletek

Lookaround

4.1 Pozitív kereső

4.2 Negatív lookahead

4.3 Pozitív lookbehind

4.4 Negatív lookbehind

Flags

5.1 Case Insensitive

5.2 Globális keresés

5.3 Többsoros

Mohó vs. lusta illesztés

Vélemény, hozzászólás? Kilépés a válaszból