正規表現

正規表現とは

正規表現(Regular Expression)は任意の文字列パターンを表すための表記方法です。正規表現を利用することで、ファイル内の文字列を強力かつ柔軟に検索することができます。

ファイル検索を初め、さまざまな場所で利用されています。

検索をする場合、特定の文字列と完全に一致するものを検索することは簡単です。しかし、次のようなものを探したい場合はどうしますか。

  • 「a」で始まる5文字の文字列。2文字目に「3」「5」「7」のいずれかが含まれる
  • 行末の文字が「;」である
  • 行頭は数字で始まり、行末はアルファベットの小文字である

こうした文字列を検索するには、検索する文字列の条件を正確に表現する必要があります。「正規表現」はそのための表記法です。正規表現を使うと、上記の文字列は次のようにあらわすことができます。

  • 「a」で始まる5文字の文字列。2文字目に「3」「5」「7」のいずれかが含まれる ⇒ a[357]…
  • 行末の文字が「;」である ⇒ ;$
  • 行頭は数字で始まり、行末はアルファベットの小文字である ⇒ ^[0-9].*[a-z]$

前の記事

所有者