about_Regular_Expressions
簡単な説明
PowerShell の正規表現について説明します。
長い説明
注意
この記事では、すべての構文について説明するのではなく、PowerShell で正規表現を使用するための構文とメソッドについて説明します。 詳細なリファレンスについては、「正規表現言語 - クイック リファレンス」を参照してください。
正規表現は、テキストとの一致に使用されるパターンです。 リテラル文字、演算子、その他のコンストラクトで構成できます。
この記事では、PowerShell での正規表現の構文について説明します。 PowerShell には、正規表現を使用する複数の演算子とコマンドレットがあります。 構文と使用方法の詳細については、以下のリンクを参照してください。
PowerShell 正規表現では、既定では大文字と小文字が区別されません。 上記の各メソッドには、大文字と小文字の区別を強制する方法が異なります。
| メソッド | 大文字と小文字の区別 |
|---|---|
Select-String |
スイッチを使用 -CaseSensitive する |
switch ステートメント |
オプションを使用 -casesensitive する |
| 演算子 | プレフィックスに 'c' (-cmatch、、-csplitまたは ) が付く-creplace |
文字リテラル
正規表現には、リテラル文字または文字列を指定できます。 式を使用すると、エンジンは厳密に指定されたテキストと一致します。
# This statement returns true because book contains the string "oo"
'book' -match 'oo'
文字クラス
文字リテラルは正確なパターンを知っている場合は機能しますが、文字クラスを使用すると、より具体的に指定できます。
文字グループ
[character group] を使用すると、任意の数の文字 [^character group] を 1 回だけ一致できます。一致する文字はグループ内に含めることはできません。
# This expression returns true if the pattern matches big, bog, or bug.
'big' -match 'b[iou]g'
一致する文字のリストにハイフン文字 (-) が含まれる場合は、文字範囲式と区別するために、リストの先頭または末尾にある必要があります。
文字範囲
パターンには、文字の範囲を指定できます。 文字には、英字、 [A-Z]数値 [0-9]、または ASCII ベース (印刷可能なすべての文字) [ -~] を指定できます。
# This expression returns true if the pattern matches any 2 digit number.
42 -match '[0-9][0-9]'
数値
文字 \d クラスは、任意の 10 進数の数字と一致します。 逆に、 は \D 10 進数以外の数字と一致します。
# This expression returns true if it matches a server name.
# (Server-01 - Server-99).
'Server-01' -match 'Server-\d\d'
単語文字
文字 \w クラスは、任意の単語文字 と一致します [a-zA-Z_0-9]。 単語以外の文字と一致するには、 を使用します \W。
# This expression returns true.
# The pattern matches the first word character 'B'.
'Book' -match '\w'
ワイルドカード
ピリオド (.) は正規表現のワイルドカード文字です。 改行 () を除く任意の文字と一致します\n。
# This expression returns true.
# The pattern matches any 4 characters except the newline.
'a1\ ' -match '....'
空白
空白文字は、文字クラスを使用して \s 一致します。 空白以外の文字は、 を使用して一致します \S。 リテラルのスペース ' ' 文字も使用できます。
# This expression returns true.
# The pattern uses both methods to match the space.
' - ' -match '\s- '
量指定子
量指定子は、入力文字列に存在する必要がある各要素のインスタンスの数を制御します。
PowerShell で使用できる量指定子の一部を次に示します。
| 量指定子 | 説明 |
|---|---|
* |
0 回以上。 |
+ |
1 回または複数回。 |
? |
0 回または 1 回。 |
{n,m} |
少なくとも n、ただし、1 回以下 m 。 |
アスタリスク () は*、前の要素の 0 個以上の回数と一致します。 その結果、要素のない入力文字列でも一致します。
# This returns true for all account name strings even if the name is absent.
'ACCOUNT NAME: Administrator' -match 'ACCOUNT NAME:\s*\w*'
プラス記号 (+) は、前の要素と 1 回または複数の回数一致します。
# This returns true if it matches any server name.
'DC-01' -match '[A-Z]+-\d\d'
疑問符は、前 ? の要素の 0 または 1 回に一致します。 アスタリスクと同様 *に、 要素が存在しない文字列にも一致します。
# This returns true for any server name, even server names without dashes.
'SERVER01' -match '[A-Z]+-?\d\d'
量 {n, m} 指定子は、いくつかの異なる方法を使用して、量指定子を詳細に制御できます。 2 番目の m 要素とコンマは , 省略可能です。
| 量指定子 | 説明 |
|---|---|
{n} |
正確な回数に n 一致します。 |
{n,} |
少なくとも回数に n 一致します。 |
{n,m} |
と 回数の n 間 m で一致します。 |
# This returns true if it matches any phone number.
'111-222-3333' -match '\d{3}-\d{3}-\d{4}'
アンカー
アンカーを使用すると、入力文字列内の一致位置に基づいて、一致が成功または失敗します。
よく使用される 2 つのアンカーは、 と ^ です $。 キャレットは ^ 文字列の始めと一致し、 $は文字列の末尾と一致します。 アンカーを使用すると、特定の位置にあるテキストを一致させて、不要な文字も破棄できます。
# The pattern expects the string 'fish' to be the only thing on the line.
# This returns FALSE.
'fishing' -match '^fish$'
注意
アンカーを含む正規表現$を定義する場合は、二重引用符 () ではなく単一引用符 ('``") を使用して正規表現を囲む必要があります。または、PowerShell によって式が変数として展開されます。
PowerShell でアンカーを使用する場合は、単一行正規表現オプションと複数行正規表現オプションの違 い を理解する必要があります。
- 複数行: 複数行モードでは、
^入力文字列$の先頭と末尾ではなく、すべての LINE の先頭の末尾に対して と が強制的に一致します。 - 単一行: 単一行モードは、入力文字列を SingleLine として扱います。
これは、改行 を
.除くすべての文字を照合するのではなく、すべての文字 (改行を含む) に強制的に一致します\n。
これらのオプションとそれらの使い方の詳細については、「正規表現言語 - クイック リファレンス 」を参照してください。
文字のエスケープ
円記号 (\) は、正規表現エンジンによって解析されない文字をエスケープするために使用されます。
予約されている文字は 次のとおりです []().\^$|?*+{}。
入力文字列で一致するには、パターンでこれらの文字をエスケープする必要があります。
# This returns true and matches numbers with at least 2 digits of precision.
# The decimal point is escaped using the backslash.
'3.141' -match '3\.\d{2,}'
テキストをエスケープできる正規表現クラスの静的メソッドがあります。
[regex]::escape('3.\d{2,}')
3\.\\d\{2,}
注意
これにより、文字クラスで使用される既存の円記号を含む、予約済みのすべての正規表現文字がエスケープされます。 必ず、エスケープする必要があるパターンの部分でのみ使用してください。
その他の文字エスケープ
特殊文字の型との一致に使用できる予約文字エスケープも用意されています。
一般的に使用される文字エスケープを次に示します。
| 文字エスケープ | 説明 |
|---|---|
\t |
タブと一致します |
\n |
改行と一致します |
\r |
復帰と一致します |
グループ、キャプチャ、および置換
グループ化構成体は、キャプチャまたは無視できる部分文字列に入力文字列を分割します。 グループ化された部分文字列は subexpressions と呼ばれる。 既定では、部分式は番号付きグループにキャプチャされます。しかし、名前も割り当て可能です。
グループ化コンストラクトは、かっこで囲まれた正規表現です。 囲まれた正規表現と一致するテキストがキャプチャされます。 次の例では、入力テキストを 2 つのキャプチャ グループに分割します。
'The last logged on user was CONTOSO\jsmith' -match '(.+was )(.+)'
True
Hashtable 自動$Matches変数を使用 して、キャプチャされたテキストを取得します。
一致全体を表すテキストは、キー に格納されます 0。 ハッシュテーブルには、一致するパターン $Matches の最初の出現のみを含む点に注意してください。
$Matches.0
The last logged on user was CONTOSO\jsmith
キャプチャは、左から右 に増加 する数値整数キーに格納されます。 Capture 1 には、ユーザー名までのすべてのテキストが含まれる。capture 2 にはユーザー名だけが含まれる。
$Matches
Name Value
---- -----
2 CONTOSO\jsmith
1 The last logged on user was
0 The last logged on user was CONTOSO\jsmith
重要
キー 0 は整数 です。 任意の Hashtable メソッドを使用して 、格納されている値にアクセスできます。
PS> 'Good Dog' -match 'Dog'
True
PS> $Matches[0]
Dog
PS> $Matches.Item(0)
Dog
PS> $Matches.0
Dog
名前付きキャプチャ
既定では、キャプチャは左から右に昇順で格納されます。
キャプチャ グループに名前 を 割り当てはまた、 この 名前 は、Hashtable 自動変数$Matchesのキー になります。
キャプチャ グループ内で、 を使用して ?<keyname> 、キャプチャされたデータを名前付きキーの下に格納します。
PS> $string = 'The last logged on user was CONTOSO\jsmith'
PS> $string -match 'was (?<domain>.+)\\(?<user>.+)'
True
PS> $Matches
Name Value
---- -----
domain CONTOSO
user jsmith
0 was CONTOSO\jsmith
PS> $Matches.domain
CONTOSO
PS> $Matches.user
jsmith
次の例では、最新のログ エントリを新しいログ ログWindows セキュリティします。 指定された正規表現は、メッセージからユーザー名とドメインを抽出し、name の場合は keys:N 、ドメインの 場合は D の下に格納します。
$log = (Get-WinEvent -LogName Security -MaxEvents 1).message
$r = '(?s).*Account Name:\s*(?<N>.*).*Account Domain:\s*(?<D>[A-Z,0-9]*)'
$log -match $r
True
$Matches
Name Value
---- -----
D CONTOSO
N jsmith
0 A process has exited....
詳細については、「正規表現での 構成体のグループ化」を参照してください。
正規表現での置換
演算子で正規表現を使用すると、 -replace キャプチャされたテキストを使用してテキストを動的に置き換えできます。
<input> -replace <original>, <substitute>
<input>: 検索する文字列<original>: 入力文字列の検索に使用される正規表現<substitute>: 入力文字列内で見つかった一致を置き換える正規表現の置換式。
注意
オペランド <original> と オペランド <substitute> は、文字エスケープなどの正規表現エンジンの規則の対象になります。
キャプチャ グループは、文字列内で参照 <substitute> できます。 置換は、グループ識別子の前の $ 文字を使用して行われます。
キャプチャ グループを参照する 2 つの方法は、 Number と By Name です。
数値 別 - キャプチャ グループの番号は左から右に付けられます。
'John D. Smith' -replace '(\w+) (\w+)\. (\w+)', '$1.$2.$3@contoso.com'John.D.Smith@contoso.com[ 名前別 ] - キャプチャ グループは、名前で参照することもできます。
'CONTOSO\Administrator' -replace '\w+\\(?<user>\w+)', 'FABRIKAM\${user}'FABRIKAM\Administrator
式 $& は、一致したテキストをすべて表します。
'Gobble' -replace 'Gobble', '$& $&'
Gobble Gobble
警告
文字は $ 文字列展開で使用されるの $ で、リテラル文字列を置換で使用するか、二重引用符を使用する場合は文字をエスケープする必要があります。
'Hello World' -replace '(\w+) \w+', '$1 Universe'
"Hello World" -replace "(\w+) \w+", "`$1 Universe"
Hello Universe
Hello Universe
また、 をリテラル文字として使用 $ する場合は、通常のエスケープ $$ 文字の代わりに を使用します。 二重引用符を使用する場合でも、 のすべてのインスタンスをエスケープして $ 、不適切な置換を回避します。
'5.72' -replace '(.+)', '$$$1'
"5.72" -replace "(.+)", "`$`$`$1"
$5.72
$5.72
詳細については、「正規表現での 置換」を参照してください。
関連項目
フィードバック
フィードバックの送信と表示