正規表現の用途

一般的な検索処理と置換処理では、文字列を正確に指定する必要があります。静的テキストを対象とする単純検索や置換作業には十分かもしれませんが、動的テキストでは柔軟性に欠け、検索が困難になる場合もあります。

正規表現を使用すると、次のことが可能になります。

  • 文字列内のパターンのテスト。たとえば、入力文字列をテストして、文字列内に電話番号またはクレジットカード番号のパターンがあるかどうかをチェックできます。これをデータ確認と呼びます。
  • 文字列の置換。正規表現を使用して、ドキュメント内にある文字列を特定し、削除したり、ほかの文字列と置換できます。
  • パターン マッチに基づく、文字列からのサブ文字列の抽出。ドキュメントまたは入力フィールド内の特定の文字列を検索できます。

たとえば、Web サイト全体を検索して、日付の古いものを削除したり、HTML タグを置換したりする必要がある場合に、削除対象のものや置換対象の HTML タグがファイルに存在するかどうかを正規表現を使用して確認できます。削除対象または置換対象のものだけが含まれるファイルを絞り込むことができます。このようにして、正規表現を使用して日付の古いものを削除し、置換対象のタグを検索して置換できます。

また、文字列操作機能がそれほど充実していないと考えられている言語に対しても、正規表現は便利です。Visual Basic のサブセットである VBScript には、多彩な文字列操作機能があります。それに対して、JScript は C 言語と同様に、文字列操作機能にさしたる充実は見られません。正規表現を使用することで、JScript における文字列操作は格段に改善されます。また、VBScript でも正規表現を使用することでさらに機能が向上し、1 つの式で複数の文字列操作が可能になります。