Regulární výrazy (C++/CLI)
Ukazuje různé řetězcové operace využívající třídy regulárních výrazů v .NET Framework.
následující témata ukazují použití oboru názvů .NET Framework System. Text. RegularExpressions (a v jednom případě metodu System. String. Split ) k vyhledávání, analýze a úpravám řetězců.
Analyzovat řetězce pomocí regulárních výrazů
Následující příklad kódu ukazuje jednoduchou analýzu řetězce pomocí třídy Regex v oboru názvů System. text. RegularExpressions . Je vytvořen řetězec obsahující více typů oddělovačů slov. Řetězec je poté analyzován pomocí třídy Regex ve spojení s třídou Match . Každé slovo ve větě se pak zobrazí samostatně.
Příklad
// regex_parse.cpp
// compile with: /clr
#using <system.dll>
using namespace System;
using namespace System::Text::RegularExpressions;
int main( )
{
int words = 0;
String^ pattern = "[a-zA-Z]*";
Console::WriteLine( "pattern : '{0}'", pattern );
Regex^ regex = gcnew Regex( pattern );
String^ line = "one\ttwo three:four,five six seven";
Console::WriteLine( "text : '{0}'", line );
for( Match^ match = regex->Match( line );
match->Success; match = match->NextMatch( ) )
{
if( match->Value->Length > 0 )
{
words++;
Console::WriteLine( "{0}", match->Value );
}
}
Console::WriteLine( "Number of Words : {0}", words );
return 0;
}
Analyzovat řetězce pomocí metody Split
Následující příklad kódu ukazuje použití metody System. String. Split k extrakci každého slova z řetězce. Řetězec obsahující více typů oddělovačů slov je vytvořen a poté je analyzován voláním rozdělení se seznamem rozevíracích seznamů. Každé slovo ve větě se pak zobrazí samostatně.
Příklad
// regex_split.cpp
// compile with: /clr
using namespace System;
int main()
{
String^ delimStr = " ,.:\t";
Console::WriteLine( "delimiter : '{0}'", delimStr );
array<Char>^ delimiter = delimStr->ToCharArray( );
array<String^>^ words;
String^ line = "one\ttwo three:four,five six seven";
Console::WriteLine( "text : '{0}'", line );
words = line->Split( delimiter );
Console::WriteLine( "Number of Words : {0}", words->Length );
for (int word=0; word<words->Length; word++)
Console::WriteLine( "{0}", words[word] );
return 0;
}
Použití regulárních výrazů pro jednoduché porovnání
Následující příklad kódu používá regulární výrazy pro vyhledání přesné shody podřetězců. Hledání se provádí pomocí metody statického spárování , která jako vstup přijímá dva řetězce. První je řetězec, který má být prohledán, a druhý je vzor, který má být vyhledán.
Příklad
// regex_simple.cpp
// compile with: /clr
#using <System.dll>
using namespace System;
using namespace System::Text::RegularExpressions;
int main()
{
array<String^>^ sentence =
{
"cow over the moon",
"Betsy the Cow",
"cowering in the corner",
"no match here"
};
String^ matchStr = "cow";
for (int i=0; i<sentence->Length; i++)
{
Console::Write( "{0,24}", sentence[i] );
if ( Regex::IsMatch( sentence[i], matchStr,
RegexOptions::IgnoreCase ) )
Console::WriteLine(" (match for '{0}' found)", matchStr);
else
Console::WriteLine("");
}
return 0;
}
Použití regulárních výrazů k extrakci datových polí
Následující příklad kódu ukazuje použití regulárních výrazů k extrakci dat ze formátovaného řetězce. Následující příklad kódu používá třídu Regex k určení vzoru, který odpovídá e-mailové adrese. Tento Patter obsahuje identifikátory polí, které lze použít k načtení částí jména uživatele a hostitele jednotlivých e-mailových adres. Třída Match se používá k provedení samotného porovnávání vzorů. Pokud je zadaná e-mailová adresa platná, uživatelské jméno a názvy hostitelů se extrahují a zobrazí.
Příklad
// Regex_extract.cpp
// compile with: /clr
#using <System.dll>
using namespace System;
using namespace System::Text::RegularExpressions;
int main()
{
array<String^>^ address=
{
"jay@southridgevideo.com",
"barry@adatum.com",
"treyresearch.net",
"karen@proseware.com"
};
Regex^ emailregex = gcnew Regex("(?<user>[^@]+)@(?<host>.+)");
for (int i=0; i<address->Length; i++)
{
Match^ m = emailregex->Match( address[i] );
Console::Write("\n{0,25}", address[i]);
if ( m->Success )
{
Console::Write(" User='{0}'",
m->Groups["user"]->Value);
Console::Write(" Host='{0}'",
m->Groups["host"]->Value);
}
else
Console::Write(" (invalid email address)");
}
Console::WriteLine("");
return 0;
}
Použití regulárních výrazů k změně uspořádání dat
následující příklad kódu ukazuje, jak lze použít podporu .NET Framework regulárních výrazů k uspořádání nebo přeformátování dat. Následující příklad kódu používá třídy Regex a Match k extrakci křestního jména a příjmení z řetězce a následné zobrazení těchto elementů názvu v obráceném pořadí.
Třída Regex slouží k vytvoření regulárního výrazu, který popisuje aktuální formát dat. Názvy dvou názvů se považují za oddělené čárkou a můžou použít kteroukoli mezeru kolem čárky. Metoda Match je pak použita k analýze každého řetězce. Pokud je úspěšná, křestní jméno a příjmení se načtou z objektu Match a zobrazí se.
Příklad
// regex_reorder.cpp
// compile with: /clr
#using <System.dll>
using namespace System;
using namespace Text::RegularExpressions;
int main()
{
array<String^>^ name =
{
"Abolrous, Sam",
"Berg,Matt",
"Berry , Jo",
"www.contoso.com"
};
Regex^ reg = gcnew Regex("(?<last>\\w*)\\s*,\\s*(?<first>\\w*)");
for ( int i=0; i < name->Length; i++ )
{
Console::Write( "{0,-20}", name[i] );
Match^ m = reg->Match( name[i] );
if ( m->Success )
{
String^ first = m->Groups["first"]->Value;
String^ last = m->Groups["last"]->Value;
Console::WriteLine("{0} {1}", first, last);
}
else
Console::WriteLine("(invalid)");
}
return 0;
}
Použití regulárních výrazů k vyhledávání a nahrazování
Následující příklad kódu ukazuje, jak lze použít regulární výraz třídy regulárního výrazu k provedení hledání a nahrazení. To se provádí pomocí metody Replace . Použitá verze přijímá dva řetězce jako vstup: řetězec, který má být změněn, a řetězec, který má být vložen na místo oddílů (pokud existuje), který odpovídá vzoru danému objektu Regex .
Tento kód nahradí všechny číslice v řetězci podtržítky (_) a pak je nahradí prázdným řetězcem a efektivně je odstraní. Stejný účinek se dá provést v jednom kroku, ale tady se pro demonstrační účely použijí dva kroky.
Příklad
// regex_replace.cpp
// compile with: /clr
#using <System.dll>
using namespace System::Text::RegularExpressions;
using namespace System;
int main()
{
String^ before = "The q43uick bro254wn f0ox ju4mped";
Console::WriteLine("original : {0}", before);
Regex^ digitRegex = gcnew Regex("(?<digit>[0-9])");
String^ after = digitRegex->Replace(before, "_");
Console::WriteLine("1st regex : {0}", after);
Regex^ underbarRegex = gcnew Regex("_");
String^ after2 = underbarRegex->Replace(after, "");
Console::WriteLine("2nd regex : {0}", after2);
return 0;
}
Použití regulárních výrazů k ověření formátování dat
Následující příklad kódu ukazuje použití regulárních výrazů pro ověření formátování řetězce. V následujícím příkladu kódu řetězec by měl obsahovat platné telefonní číslo. Následující příklad kódu používá řetězec "\d {3} -\d {3} -\d {4} ", který označuje, že každé pole představuje platné telefonní číslo. "D" v řetězci označuje číslici a argument po každé "d" označuje počet číslic, které musí být k dispozici. V takovém případě musí být číslo odděleno pomlčkami.
Příklad
// regex_validate.cpp
// compile with: /clr
#using <System.dll>
using namespace System;
using namespace Text::RegularExpressions;
int main()
{
array<String^>^ number =
{
"123-456-7890",
"444-234-22450",
"690-203-6578",
"146-893-232",
"146-839-2322",
"4007-295-1111",
"407-295-1111",
"407-2-5555",
};
String^ regStr = "^\\d{3}-\\d{3}-\\d{4}$";
for ( int i = 0; i < number->Length; i++ )
{
Console::Write( "{0,14}", number[i] );
if ( Regex::IsMatch( number[i], regStr ) )
Console::WriteLine(" - valid");
else
Console::WriteLine(" - invalid");
}
return 0;
}
Související oddíly
.NET Framework – regulární výrazy