正規表現とは
正規表現(Regular Expression)は任意の文字列パターンを表すための表記方法です。正規表現を利用することで、ファイル内の文字列を強力かつ柔軟に検索することができます。
ファイル検索を初め、さまざまな場所で利用されています。
検索をする場合、特定の文字列と完全に一致するものを検索することは簡単です。しかし、次のようなものを探したい場合はどうしますか。
- 「a」で始まる5文字の文字列。2文字目に「3」「5」「7」のいずれかが含まれる
- 行末の文字が「;」である
- 行頭は数字で始まり、行末はアルファベットの小文字である
こうした文字列を検索するには、検索する文字列の条件を正確に表現する必要があります。「正規表現」はそのための表記法です。正規表現を使うと、上記の文字列は次のようにあらわすことができます。
- 「a」で始まる5文字の文字列。2文字目に「3」「5」「7」のいずれかが含まれる ⇒ a[357]…
- 行末の文字が「;」である ⇒ ;$
- 行頭は数字で始まり、行末はアルファベットの小文字である ⇒ ^[0-9].*[a-z]$