ITメモ
Make SiteMap 正規表現 / Regular Expression




【正規表現】区切り文字で区切られた文字列を抽出する方法



正規表現で、
区切文字で区切った文字列から
区切文字で区分した文字列に分割する方法がある。


「.*区切文字」で指定すると、
最後の区切文字までを選択してしまう。
「,(カンマ)」で区切った分を例に挙げると、
文字列,文字列,文字列,文字列,文字列,文字列,文字列
という文字列を、「.*,」で選択すると、
「文字列,文字列,文字列,文字列,文字列,文字列,」という文字が選択される。


正規表現「[^,],」で選択すると、
「,(カンマ)」を含まない文字列を選択するので、
「文字列,」一つだけが選択される。



区切文字で区切った文字列から、文字を抽出する書式


正規表現で区切文字で区切った文字列を抽出するには、
「区切文字」以外の文字を検索するようにする。
基本書式を理解していると、色々と応用ができるようになる。


基本的な書式

直近の区切文字までを選択する書式

([^区切り文字])区切り文字
[^区切り文字]区切り文字

直近の区切文字「,(カンマ)」までを選択する書式

[^,],
([^,]),

「(」「)」で囲むことによって、「$1」に格納され、
「$1」で呼び出すことができる。


複数の区切文字を選択する書式

([^区切り文字])区切り文字([^区切り文字])区切り文字([^区切り文字])区切り文字

「(」「)」で囲むことによって、「$1」〜「$9」に格納され、
文字を呼び出すことができるので、
正規表現によって、文字列の「置換」「変換」などが簡単にできるようになる。


複数の区切文字「,(カンマ)」を選択する書式

([^,]),([^,]),([^,]),・・・・・

「(」「)」で囲むことによって、「$1」〜「$9」に格納され、
文字を呼び出すことができるので、
正規表現によって、文字列の「置換」「変換」などが簡単にできるようになる。


Back