C# Regex Tutorial: Çfarë është një shprehje e rregullt C#

Ky tutorial C# Regex shpjegon se çfarë është një shprehje e rregullt në C#, sintaksa e saj, metodat e klasës Regex dhe si të përdoren këto metoda me ndihmën e shembujve:

Shprehja e rregullt në C# përdoret për të përputhur një model të caktuar karakteresh. Shprehjet e rregullta përdoren sa herë që një përdorues duhet të gjejë një model të përsëritur ose të bëjë një vërtetim të të dhënave ose edhe për të kontrolluar formatimin e të dhënave.

Një RegEx përdoret për të gjetur nëse një varg përmban ose përputhet me një model karakteresh të caktuar. Një regex është kryesisht një sekuencë karakteresh që tregon një model.

Një model mund të jetë çdo gjë që varion nga numrat, karakteret ose një kombinim i të gjithave. Regex përdoret gjerësisht për vërtetim. Analiza ose përputhja e vargjeve, për shembull, gjetja nëse një varg përputhet me formatin e monedhës, numrin e telefonit ose formatin e datës.

Klasa Regex në C#

Klasa Regex përdoret në C# për të kryer operacione regex. Ai përmban disa metoda të ndryshme që mund të përdoren për të kryer operacione të ndryshme në lidhje me regex.

Mund të përdoret për të analizuar tekstin e madh për të gjetur një sekuencë të caktuar karakteresh duke përdorur metoda që mund të përdoren për të kryer një përputhje, për të zëvendësoni ose mund të përdoret për të ndarë sekuencën e karaktereve.

Klasa regex është e pranishme brenda hapësirës së emrave; System.Text.Shprehje e rregullt. Klasa pranon një varg në formën e një sekuence karakteresh si parametër.

C# Regex Methods

që ne krijuam "^Super" mund të përputhet me të gjitha vlerat e super, madje edhe superman apo mbinatyrore, por ne nuk duam vetëm fjalën "Super".

Kjo do të thotë se duhet të ketë hapësirë ​​të bardhë pas fjalës për shënoni fundin e fjalës dhe fillimin e një fjale tjetër. Për ta bërë këtë, ne do të shtojmë simbolin "\s" në model dhe duke e bërë modelin tonë përfundimtar si

^Super\s

Skenari 3: Përdorni shprehjen e rregullt për të gjetur skedarin e vlefshëm emrat me një shtrirje të llojit të skedarit të imazhit.

Një tjetër skenar i rëndësishëm në kohë reale me të cilin përballen shpesh zhvilluesit është vërtetimi i llojeve të skedarëve. Le të themi se kemi një buton ngarkimi në ndërfaqen e përdoruesit, i cili mund të pranojë vetëm shtesat e llojit të skedarit të imazhit.

Duhet të vërtetojmë skedarin e ngarkimit të përdoruesit dhe ta informojmë atë në rast se ka ngarkuar formatin e gabuar të skedarit. Kjo mund të arrihet lehtësisht duke përdorur shprehjen e rregullt.

Duke dhënë më poshtë është një program i thjeshtë për ta kontrolluar këtë.

public static void Main(string[] args) gif)$"; Regex reg = new Regex(patternText); //When pattern matches Console.WriteLine(reg.IsMatch("abc.jpg")); Console.WriteLine(reg.IsMatch("ab_c.gif")); Console.WriteLine(reg.IsMatch("abc123.png")); //When pattern doesnt match Console.WriteLine(reg.IsMatch(".jpg")); Console.WriteLine(reg.IsMatch("ask.jpegj")); 

Output

E vërtetë

E vërtetë

E vërtetë

E gabuar

E gabuar

Shpjegim

Këtu duhet të përputhim një emri i skedarit. Një emër i vlefshëm skedari përbëhet nga tre pjesë ( emri i skedarit + . + zgjerimi i skedarit ). Duhet të krijojmë një shprehje të rregullt që të përputhet me të tre pjesët. Le të fillojmë duke përputhur pjesën e parë, domethënë emrin e skedarit. Emri i skedarit mund të përmbajë karaktere alfanumerike dhe të veçanta.

Siç u diskutua më parë, simboli për të treguar është "\w". Gjithashtu, emri i skedarit mund të jetë i një ose më shumëe ndjekur nga një pikë (.) më pas emri i faqes së internetit pas kësaj një pikë (.) dhe në fund një zgjatje domeni.

Pra, ngjashëm me skenarin e mëparshëm do të përpiqemi ta përputhim pjesë pas pjesë . Le të fillojmë së pari duke përputhur "www". Pjesë. Pra, ne fillojmë me simbolin fillestar, pastaj si "www". Është diçka që është fikse, kështu që ne përdorim simbolin e fillimit të ndjekur nga fjalët e sakta për t'u përputhur.

“^www.”

Më pas do të fillojmë të punojmë me pjesën e dytë. Pjesa e dytë e adresës së internetit mund të jetë çdo emër alfanumerik. Pra, këtu do të përdorim kllapa katrore të pranishme në klasën e karaktereve për të përcaktuar diapazonin që duhet të përputhet. Pas shtimit të pjesës së dytë me pjesën e dytë do të na japë.

“^www.[a-zA-Z0-9]{3,20}”

Këtu kemi shtuar edhe kllapa kaçurrela për të përcaktuar gjatësinë minimale dhe maksimale të karakterit për emrin e faqes. Ne kemi dhënë një minimum prej 3 dhe një maksimum 20. Ju mund të jepni çdo gjatësi minimale ose maksimale që dëshironi.

Tani, pasi kemi mbuluar pjesën e parë dhe të dytë të adresës së internetit, na mbetet vetëm e fundit pjesë, pra zgjerimi i domenit. Është mjaft e ngjashme me atë që bëmë në skenarin e fundit, ne do të përputhemi drejtpërdrejt me zgjerimet e domenit duke përdorur OR dhe duke mbyllur çdo shtesë të vlefshme të domenit brenda kllapa rrethore.

Kështu nëse i shtojmë të gjitha këto së bashku do të kemi një shprehje e plotë e rregullt që të përputhet me çdo adresë të vlefshme ueb.

www.[a-zA-Z0-9]{3,20}.(com|in|org|co\.in|net|dev)$

Skenari 5: Përdorni shprehjen e rregullt për të vërtetuar njëformati i ID-së së emailit

Le të supozojmë se kemi një formular identifikimi në faqen tonë të internetit që u kërkon përdoruesve të fusin adresën e tyre të emailit. Për arsye të dukshme, ne nuk do të duam që formulari ynë të vazhdojë më tej me adresa emaili të pavlefshme. Për të vërtetuar nëse adresa e emailit e futur nga përdoruesi është e saktë apo jo, ne mund të përdorim një shprehje të rregullt.

Më poshtë është një program i thjeshtë për të vërtetuar një adresë emaili.

public static void Main(string[] args) { string patternText = @"^[a-zA-Z0-9\._-]{5,25}.@.[a-z]{2,12}.(com|org|co\.in|net)"; Regex reg = new Regex(patternText); //When pattern matches Console.WriteLine(reg.IsMatch("[email protected]")); Console.WriteLine(reg.IsMatch("[email protected]")); //When pattern doesnt match Console.WriteLine(reg.IsMatch("[email protected]")); }

Output

E vërtetë

E vërtetë

E gabuar

Shpjegim

A adresa e vlefshme e emailit përmban alfabete, numra dhe disa karaktere të veçanta si pikë (.), vizë (-) dhe nënvizime (_) të ndjekura nga simboli "@", i cili më pas pasohet nga emri i domenit dhe zgjerimi i domenit.

Kështu, ne mund ta ndajmë adresën e emailit në katër pjesë, p.sh. identifikuesin e emailit, simbolin "@", emrin e domenit, dhe e fundit është zgjerimi i domenit.

Le të fillojmë duke shkruar një shprehje të rregullt për pjesa e parë. Mund të jetë alfa-numerik me disa karaktere të veçanta. Supozojmë se kemi një madhësi shprehjeje që varion nga 5 në 25 karaktere. Ngjashëm me mënyrën se si e kemi shkruar më parë (në skenarin e emailit), mund të dalim me shprehjen e mëposhtme.

^[a-zA-Z0-9\._-]{5,25}

Tani, duke kaluar në pjesën e dytë. Është relativisht e lehtë pasi ne duhet të përputhemi vetëm me një simbol, p.sh. "@". Shtimi i tij në shprehjen e mësipërme na jep.

^[a-zA-Z0-9\._-]{5,25}.@

Kalimi në pjesën e tretë d.m.th. emri i domenit do të jetë gjithmonë një seri më të ulëtfjalët që përputhen, alfabetet, adresat e faqeve të internetit, ID-të e postës elektronike, madje edhe llojet dhe shtesat e skedarëve.

Këta skenarë janë mjaft të dobishëm në vërtetimin në kohë reale të hyrjeve të përdoruesit pa shkruar rreshta të shumtë kodi dhe në këtë mënyrë ndihmojnë në kursimin e kohës dhe zvogëloni kompleksitetin. Këta shembuj janë përdorur për të udhëzuar përdoruesin të krijojë grupin e tij të shprehjeve të rregullta dhe kështu t'i ndihmojë ata në trajtimin e disa skenarëve të tjerë të ndryshëm.

Regex mund të jetë i thjeshtë si përdorimi i alfabetit ose numrave për t'u përshtatur me një seri të caktuar karaktere ose komplekse duke përdorur një kombinim të karaktereve të veçanta, sasiore, klasave të karaktereve, etj. për të vërtetuar formatet komplekse ose për të kërkuar një model specifik në serinë e karaktereve.

Me pak fjalë, një shprehje e rregullt është mjaft mjet i fuqishëm për një programues dhe ndihmon në zvogëlimin e sasisë së kodit që kërkohet për të kryer në një përputhje të të dhënave ose një detyrë vërtetimi.

IsMatch

Metoda më e thjeshtë dhe më e dobishme në klasën Regex është metoda IsMatch. Kjo metodë ka mbingarkesa të ndryshme për kryerjen e përputhjes së karaktereve bazuar në parametra të ndryshëm.

Më e thjeshta është

Replace(Teksti i vargut, Teksti i zëvendësimit të vargut)

Metoda e zëvendësimit pranon dy parametrat dhe kthen një vlerë vargu. Parametri i parë është sekuenca e karaktereve ose regex që dëshironi të përdorni për përputhje dhe i dyti është zëvendësimi i regex.

Metoda funksionon duke gjetur një përputhje të tekstit të dhënë dhe më pas e zëvendëson atë me teksti zëvendësues i dhënë nga përdoruesi. Nënshkrimi i metodës është vargu publik Zëvendëso(teksti i vargut, teksti i zëvendësimit të vargut)

Vargu publik[] Split(teksti i vargut)

Metoda e ndarjes nga klasa regex pranon hyrjen e vargut si parametër dhe kthen një grup që përmban nënvargje. Parametri i kaluar në metodë është vargu që duhet të ndahet.

Metoda gjen modelin e hyrjes që përputhet në varg dhe pasi identifikon ndonjë model që përputhet, e ndan vargun në atë vend në nënvarg më të vogël me çdo model që përputhet është pika e thyerjes. Metoda më pas kthen një grup që përmban të gjitha nënvargjet.

Përdorimi i metodave Regex C#

Le të hedhim një vështrim në përdorimin e këtyre metodave duke shkruar një program të thjeshtë.

public static void Main(string[] args) { string patternText = "Hello"; Regex reg = new Regex(patternText); //IsMatch(string input) Console.WriteLine(reg.IsMatch("Hello World")); //IsMatch(string input, int index) Console.WriteLine(reg.IsMatch("Hello", 0)); //IsMatch(string input, string pattern) Console.WriteLine(Regex.IsMatch("Hello World", patternText)); //Replace(string input, string replacement) Console.WriteLine(reg.Replace("Hello World", "Replace")); //Split(string input, string pattern) string[] arr = Regex.Split("Hello_World_Today", "_"); foreach(string subStr in arr) { Console.WriteLine("{0}", subStr); } }

Dalja e sa më sipërprogram

E vërtetë

E vërtetë

E vërtetë

Replace World

Përshëndetje

Botë

Sot

Shpjegimi për kodin e mësipërm:

Në fillim të programit, ne kemi krijuar një objekt dhe për modelin që do të përdorim për kodin që përputhet në hyrjen e vargut pasues, ne kemi përdorur formatimin e tekstit për t'i mbajtur gjërat të thjeshta në fillim, por nëse jeni të kënaqur, mund të filloni të përdorni modele të rregullta shprehjeje. (Ne do të diskutojmë modelin e shprehjes së rregullt në detaje ndërsa ecim përpara në këtë tutorial)

Më pas, ne do të përdorim vargun e përputhjes për të futur faktorin që kemi deklaruar si objekt të specifikuar me vargun hyrës dhe nëse përputhet atëherë ajo do të kthehet për të kthyer false.

Metoda tjetër që kemi përdorur është IsMethod (input string, int index). Kjo metodë pranon dy parametra, dhe këtu ne ofrojmë vargun e hyrjes dhe indeksin nga ku duhet të fillojë ndeshja. Për shembull, këtu ne donim të fillonim përputhjen nga fillimi i vargut të hyrjes.

Më pas demonstruam përdorimin e IsMatch (hyrja e vargut, modeli i vargut). Këtu kemi dhënë vargun e hyrjes, atëherë kemi dashur të gjejmë nëse teksti i modelit është i pranishëm në hyrje apo jo. Nëse është e pranishme, atëherë do të kthehet true (si në rastin tonë) përndryshe do të kthehet false.

Një metodë tjetër që diskutuam është zëvendësuar. Kjo metodë është mjaft e dobishme në programet ku dëshironi të bëni ndryshime në të dhënat hyrëseose ndryshoni formatin e të dhënave ekzistuese.

Këtu japim dy parametra, i pari është vargu i hyrjes dhe i dyti është vargu që mund të përdoret për të zëvendësuar vargun e mëparshëm. Kjo metodë përdor gjithashtu modelin e përcaktuar në objektin regex që përcaktuam më herët.

Një metodë tjetër e rëndësishme që kemi përdorur është split. Kjo metodë përdoret për të ndarë vargun e dhënë bazuar në disa modele të përsëritura. Këtu, ne kemi dhënë një varg "Hello_World_Today".

Le të themi se duam të heqim nënvizimin nga vargu i dhënë dhe të marrim nënvargjet. Për këtë, ne specifikojmë parametrin e hyrjes dhe më pas japim modelin që duhet të përdorim si pikë ndarjeje. Metoda kthen një grup dhe ne mund të përdorim një lak të thjeshtë si foreach për të tërhequr të gjitha vargjet.

Sintaksa e shprehjes së rregullt

Ka disa sintaksa të ndryshme si karaktere speciale, kuantifikues, klasa karakteresh, etj. që mund të përdoren për të përputhur një model të caktuar nga një hyrje e dhënë.

Në këtë pjesë të tutorialit, ne do të zhytemi thellë në sintaksën e ofruar nga regex dhe do të përpiqemi të zgjidhim disa skenarë të jetës reale duke i përdorur ato. Përpara se të vazhdojmë, sigurohuni që keni fituar idenë bazë të regex dhe metodat e ndryshme të disponueshme brenda klasës regex.

Karakteret speciale

Karakteret speciale në një regex përdoren për të caktuar disa kuptime të ndryshme në një model. Tani do të shikojmëdisa nga karakteret speciale të përdorura gjerësisht dhe kuptimi i tyre në Regex.3

Karakteret speciale Kuptimi
^ Kjo është një nga sintaksat më të përdorura. Tregon fillimin, fjalën ose modelin pasi kjo fillon të përputhet nga fillimi i tekstit hyrës.
$ Kjo shenjë përdoret për përputhjen e fjalëve nga fundi të vargut. Fjalët/modelet e shënuara përpara këtij simboli do të përputhen me fjalët e pranishme në fund të vargut.
. (pika) Pika përdoret për të përputhur një karakter të vetëm në vargun e dhënë që ndodh një herë.
\n Kjo përdoret për një të re rreshti.
\d dhe \D Shkalla e vogël 'd' përdoret për të përputhur një karakter shifror dhe shkronja e madhe 'D' përdoret për të përputhur joshifrore karakteret.
\s dhe \S Shkronjat e vogla 's' përdoren për të përputhur hapësirat e bardha dhe shkronjat e mëdha 'S' përdoren për të përputhur hapësirën jo të bardhë .
\w dhe \W Shkalla e vogël "w" përdoret për të përputhur karakteret alfanumerike/nënvizore dhe shkronjat e mëdha "W" përdoren për të përputhur jo fjalë karaktere.

Sintaksa e sasisë

Sintaksa e sasisë përdoret për të numëruar ose përcaktuar kriteret e përputhjes. Për shembull, nëse doni të kontrolloni nëse një varg i caktuar përmban një alfabet një ose më shumë herë. Le të hedhim një vështrim në disa nga kuantifikuesit e përdorur zakonisht në shprehje të rregullta.

QuantifikuesSintaksa Kuptimi
* Ky simbol përdoret për të përputhur karakterin e mëparshëm.
+ Ky simbol përdoret për të përputhur një ose më shumë karaktere në një rresht.
{n} Shifra numerike brenda kaçurrelës kllapat përdoret për të përputhur numrin e karakterit të mëparshëm të përcaktuar nga numrat brenda kllapave kaçurrelë.
{n,} Numri brenda kllapave kaçurrelë dhe ky simbol përdoret për t'u siguruar që përputhet të paktën n (d.m.th. vlera numerike brenda kllapave).
{n, m} Ky simbol përdoret për përputhjen nga karakteri i mëparshëm nga n numrin e herëve në m numrin e herëve.
? Ky simbol bën që karakteret e mëparshme të përputhen si opsionale.

Klasa e karaktereve

Klasa e karaktereve njihet gjithashtu si grupe karakteresh dhe kjo përdoret për t'i thënë motorit regex që të kërkojë një përputhje të vetme nga disa karaktere. Një klasë karakteresh do të përputhet vetëm me një karakter dhe rendi i karaktereve të mbyllura brenda grupit të karaktereve nuk ka rëndësi.

Klasa e personazheve Kuptimi
[ varg ] Simboli i kllapave katrore përdoret për t'u përshtatur për një sërë karakteresh. Për shembull, ne mund ta përdorim atë për të përcaktuar çdo karakter në rangun nga alfabeti "a" në "z" duke mbyllur diapazonin brenda kllapës si [a-z]

Ose, ne gjithashtu mund të përputhemi me numerikën "1" në " 9” duke treguarshprehje duke përdorur disa shembuj në kohë reale.

Skenari 1: Vërtetoni nëse vargu i hyrjes përbëhet nga karaktere alfabeti me 6 shifra të pandjeshme ndaj shkronjave.

Skenari më i zakonshëm për shprehje të rregullta është gjetja dhe përputhja e një fjale të caktuar. Për shembull, le të themi se dua një varg alfabetik të rastësishëm nga përdoruesi dhe ai hyrje duhet të jetë saktësisht 6 shifror.

Për të vërtetuar se mund të përdorim një shprehje të thjeshtë të rregullt. Le të shkruajmë një program për të kuptuar më mirë shkrimin dhe përdorimin e shprehjeve të rregullta.

public static void Main(string[] args) { string patternText = @"^[a-zA-Z]{6}$"; Regex reg = new Regex(patternText); //When pattern matches Console.WriteLine(reg.IsMatch("Helios")); //When pattern doesnt match Console.WriteLine(reg.IsMatch("Helo")); }

Output

E vërtetë

False

Shpjegim

Në këtë shembull, ne po përpiqemi të vërtetojmë një varg të hyrjes, për të kontrolluar nëse përmban karaktere alfabetike gjashtëshifrore. Karakteret mund të jenë si me shkronja të vogla ashtu edhe me shkronja të mëdha, kështu që duhet ta marrim parasysh edhe këtë.

Pra, këtu përcaktuam një model shprehjeje të rregullt në variablin "patternText" dhe më pas e kaluam atë në objektin regex . Tani, rreshtat e ardhshëm të kodit janë mjaft të thjeshta, ne përdorëm metodën IsMatch për të krahasuar shprehjen e rregullt dhe vargun e hyrjes.

Tani le të shohim shprehjen e rregullt që kemi krijuar. Shprehja (^[a-zA-Z]{6}$) përbëhet nga 4 pjesë të ndryshme. "^", "[a-zA-Z]", "{6}" dhe "$". Pjesa e dytë tregon karakteret që përputhen, që përdoret për të kryer përputhjen e shprehjeve, "a-z" për shkronjat e vogla dhe "A-Z" për shkronjat e mëdha.

E parakarakteri i pjesës "^" siguron që vargu të fillojë me një model të përcaktuar në pjesën e dytë, p.sh. alfabetet e vogla dhe të mëdha.

Kllapat kaçurrelë në pjesën e tretë përcaktojnë numrin e karaktereve në varg që mund të identifikohen me modelin e përcaktuar dmth 6 në këtë rast dhe simbolin "$" sigurohuni që ai të përfundojë me modelin e përcaktuar në pjesën e dytë.

^[a-zA-Z]{6}$

Skenari 2: Përdorni shprehjen e rregullt për të vërtetuar se një fjalë që fillon me "Super" dhe ka hapësirë ​​të bardhë pas kësaj, pra për të vërtetuar nëse "Super" është e pranishme në fillim të një fjalie.

Le të supozojmë se po lexojmë disa të dhëna të përdoruesit dhe duhet të sigurohemi që përdoruesi e nis gjithmonë fjalinë e tij me një fjalë, numër ose alfabet të caktuar. Kjo mund të arrihet mjaft lehtë duke përdorur një shprehje të thjeshtë të rregullt.

Le të shohim një program shembull dhe më pas të diskutojmë në detaje se si të shkruhet kjo shprehje.

 public static void Main(string[] args) { string patternText = @"^Super\s"; Regex reg = new Regex(patternText); //When pattern matches Console.WriteLine(reg.IsMatch("Super man")); //When pattern doesnt match Console.WriteLine(reg.IsMatch("Superhero")); }

Output

E vërtetë

E gabuar

Shpjegim

Po ashtu edhe në këtë shembull, kemi përdorur një konfigurim të ngjashëm kodi si në e para. Modeli i shprehjes së rregullt në këtë skenar kërkon përputhjen me një kombinim fjalësh ose fjalish që fillojnë me "Super".

^Super

Pra, siç duam të përputhemi nga fillimi i fjalës seri, do të fillojmë duke vendosur simbolin “^”, më pas do të japim modelin që duam të përputhemi, në këtë rast, “Super”. Tani modeli[1-9]

[^ varg] Kjo tregon klasën e karaktereve mohuese. Përdoret për të përputhur çdo gjë, jo në intervalin e shënuar brenda kllapës.
\ Kjo përdoret për të përputhur karaktere të veçanta që mund të kenë simbolet e tyre regex. Pjerrësia përdoret për të përputhur karakteret speciale në formën e tyre të mirëfilltë.

Grupimi

Kllapat e rrumbullakëta ose kllapat mund të përdoren për të grupuar një pjesë të rregullt shprehje së bashku. Kjo i lejon përdoruesit ose të shtojë një sasior me shprehjen.

Grupimi Kuptimi
( grup shprehja ) Kllapat e rrumbullakëta përdoren për grupimin e një shprehjeje.
karaktere kështu që do të përdorin simbolin "+". Kombinoni ato dhe marrim simbolin për pjesën e parë.
(\w+)

Kllapa e ndau këtë në pjesë. Pjesa tjetër është simboli i pikës. Meqenëse simboli i pikës ka kuptimin e tij në një regex, ne do të përdorim një vijë të prapme përpara tij për t'i dhënë një kuptim të drejtpërdrejtë. Kombinoni të dyja dhe ne kemi të mbuluara dy pjesët e para të regex.

(\w+)\.

Tani, për pjesën e tretë dhe të fundit, ne mund të përcaktojmë drejtpërdrejt shtesat e kërkuara të skedarëve të ndara nga "shkronjat alfabetike të rastit. Nëse dëshironi, mund të përfshini edhe karaktere alfabetike numerike ose të mëdha, por për këtë skenar, ne do të shkojmë me alfabete të vogla.

Nëse shtojmë shprehjen për alfabetet e vogla me gjatësi që varion nga 2 deri në 12 karaktere, atëherë do të kemi shprehjen e mëposhtme.

^[a-zA-Z0-9\._-]{5,25}.@.[a-z]{2,12}

Tani, na mbetet vetëm shprehja për zgjerimin e domenit, e ngjashme me skenarin e katërt, do të trajtojmë disa shtesa specifike të domenit. Nëse dëshironi, mund të shtoni më shumë prej tyre duke i mbyllur brenda një kllapa rrethore dhe duke i ndarë me një "

Lëviz në Krye