Programujeme v jazyku C# III. Diel 8. – Regulárne výrazy III

Michal Čižmár  /  12. 07. 2007, 00:00

Zostaviť správny regulárny výraz je často náročné, hlavne ak obsahuje zložité konštrukcie. Dnes si ukážeme niekoľko programov, ktoré nám umožňujú real-time testovať naše regEx, prípadne ho jednoduchšie zostavovať, či dokonca odhaľovať chyby v syntaxy a rýchlostne testovať. Zaoberám sa len tými, ktoré sú zadarmo a pre .NET.

[Kľúčové slová]
Rad Software Regular Expression Designer, Expresso, The Regulator

Keďže kvalitné porovnanie softvéru na testovanie regulárnych výrazov už existuje na stránke, ktorú som Vám už spomínal : regularnivyrazy.info/regexp-tools-windows.html , nebudem sa opakovať a skôr toto porovnanie rozšírim o otestovanie, hlavne čo sa týka praktickej použiteľnosti a také screen-shoty tiež veľa napovedajú a tie tam chýbajú.

>>SharpDevelop 2.2
Teraz si určite hovoríte, čo sem ten pletie celé Open-Source vývojové prostredie, že? ;-).
Sám som to až nedávno objavil, že obsahuje už integrovanú utilitu na testovanie RegEx. Nachádza sa pod menu TOOLS-REGULAR EXPRESSION TOOLKIT.

Samostatné kontrolovanie je príliš jednoduché ale použiteľné. Čo ale inde tak ľahko nenájdeme, je možnosť jednoducho vytvárať kompilované regEx (dll) bez toho, aby sme museli sami písať program. Myslím si, že je to veľmi užitočné.


Obr.1.

Podľa Obr.1. by ste vedeli už určite aj sami vyplniť jednotlivé položky a potom už len dáte vygenerovať DLL (create assembly) a to pripojíte k projektu (add references).

V minulom článku sme si ukázali, že keď už použiť regEx na väčšie množstvo dát, tak jedine v skompilovanej forme a príklad vyžadoval vygenerovať si dané DLL programovo, najlepšie len raz, pretože keby sme ho generovali zakaždým, tak zrýchlenie stráca zmysel. . Tá časť programu, ktorá ho generovala je ale zakaždým rovnaká a vyžaduje len niekoľko parametrov takže vidíte, že sa dá nahradiť peknou pomôckou, takže enjoy ;-)

Podľa mňa takého niečo (t.j. generovanie kompilovaných RegEx pomocou nástroja) nenájdete ani v platenej verzii Visual Studia 2005, či áno? Ak sa mýlim, opravte ma v diskusii dole.

>>Rad Software Regular Expression Designer (RSRED)
Tento nástroj využívam najčastejšie ja, pretože mi najlepšie vyhovuje, neznamená to ale, že je ten najlepší. Je jednoduchý na použitie, ale keď sa potrebuje vyhrať s RegExp, odporučam radšej nástroj opísaný v ďaľšom odstavci.


Stiahnuť ho môžete tu :

 Obr.2.

Na Rad Software Regular Expression Designer sa mi najviac páči, že máte panel, kde je pekne utriedený zoznam všetkých prvkov reguExp (Obr 2) a môžete podlľa toho vyskladať Váš regulárny výraz.
Samozrejme obsahuje parsovanie regExp a testovanie RegExp, ktoré slúžia na nahrádzanie podreťazcov.

Čo možem ešte vydzvihnúť je, že sa snažia zjednodušiť odľadovanie sytanxe v RegExp a ak napr. RegExp obsahuje chybu, program sa Vás pokúsi nasmerovať, v čom by asi mohol byť problém, čo sa im darí viac menej úspešne (Obr 3).


Obr.3.

>>Už ste dnes mali kávu? Čo tak jedno Expresso?
Toto je môj druhý najoblúbenjší nastroj na RegEx..
Jeho domovská stránka.
Má veľmi bohatú funčnú výbavu. Na to aby bol pre Vás úplne FREE, musíte si požiadať o inštalačný kľúč (samozrejme zadarmo) na tejto adrese.


Obr.4.


Sami podľa Obr.4. vidíte, že sa v ňom môžete naozaj vyšantiť :-), čo všetko to dokáže.
Má 2 hlavné režimy :
a) Design, kde si môžete podobne ako v RSRED vyskladať regExp. Na Obr.4 to asi veľmi dobre nevidíte, ale v okne Regex Analyzer Vám program pekne, slovne, po anglicky rozpisuje význam zadaného regEx.
b)
Test, tu môžete nielen spustit vyhodnocenie RegExp (Run Match), ale dať si najpr regEx skontrolovať (Validate) a Expresso veľmi pekne rozpíše, kde všade našiel možné chyby.

>>Optimalizácia regExp
Keď som browsil po strankch výrobcu predchádzajúceho softu, narazil som na zaujimavý odkaz.

Regular Expression Workbench

Je to veľmi primitívny nástroj na RegExp ale má zaujimavú funkciu. Môžete si nastaviť kolkoľkrát sa ma iterovať parsovnie Vami zadaného regulárneho výrazu a podľa výsledneho času, sa snaži RegEpx prípadne zjednodušiť. Takže bohužial, sám nedokáže RegExp optimalizovať, ale môže Vám pri tom pomôcť.

>>The Regulator
Tento soft je ohodnotený ako najlepší na začiatku spomínanej stránke. Tak sa naň pozrime.
Stiahnúť si ho môžeme tu
Stavím sa, že sa Vám bude páčiť funkcia AutoComplete pri písani regExp, ako môžete vidiet na Obr 5. Hneď sú aj jednotilvé znaky vysvetlené. Automaticke označovanie párov zátvoriek a ďalších dvojíc je tiež užitočne.



Obr.5.

Určite vyskúšajte kliknúť v dokumente pravým tlačítkom myši a v položke Quick Add, kde môžete postupný výberom nájsť všetky prvký regulárnych výrazov a takto nadesignovať celý regEx.

Tools – Generate Assembly -> vygeneruje DLL
Tools - Generate Code -> Podľa zvoleného jazyka VB/C# vygeneruje časť kódu, kde sa inicializuje trieda regExp, t.j. Nastavi parametre konštruktora podľa aktuálnuhch nastavení v programe, takže stačí už len prekopírovať.

>>Plugin pre Visual Studio 2005
Autor predchádzajúco programu vytvoril aj plugin pre Visual Studio 2005 verzie Express, Pro a Team.
Stačí stiahnúť z tejto stránky jedno Zip-ko

a po rozbalní prekopírovať DLL súbory do adresára ...My Documents\Visual Studio 2005\Visualizers
Potom vám umožní
v debug režime, keď si dáte náhľad na obsah určitého RegExp, dynamicky ho zobrazovať v The Regulator a analyzovať ho. S týmto som sa veľmi nehral, ale možno, že Vám sa hodí.

>>Čo bude nabudúce?
Nabudúce bude posledný diel. Nie, nebojete sa, seriál nekončí, len skočíme regulárne výrazy už iba ďalšími ukážkami použitia. Pomaly začínam rozmýšlať, čo bude ďalšia téma. Niektorí ste už mali záujem o šifrovanie v C#, ale kľudne napíšte do diskusie, aka téma by vás zaujímala. WebServices je tiež užitočná téma, prípadne komunikácia na úrovni TCP/IP by Vás mohla zaujímať. Takže píšte, Veď tento seriál tvoríme spoločne.


[Predchádzajúce diely]

Programujeme v jazyku C# III. Diel 7. – Regulárne výrazy II
Programujeme v jazyku C# III. Diel 6. – Regulárne výrazy I

Programujeme v jazyku C# III. Diel 5. –Všetko o DataSet II.
Programujeme v jazyku C# III. Diel 4. – Všetko o DataSet I.


[Zaujimavé odkazy]

Myslím, že niečo takéto sme hľadali už všetci, ktorí používame rexEx. A o niečo podobne som sa snažím aj ja. Je to knižnica príkladov regulárnych príkazov. Vraj ich je tam vyše 1700


regexlib.com/

Trochu horšie sa v tom orietnuje a hádam nikomu nebude vadiť, že popis je v angličtine. Ale je to dosť fajn.


SEE YOU!


Michal Čižmár