◀一般トップへ
6239
正規表現で漢字の熟語を抽出したい。
6242
RE: 正規表現で漢字の熟語を抽出したい。
[6239]
正規表現で漢字の熟語を抽出したい。
ろろ
2007年08月22日 12:01
(参考)[5095] 日本語空白が色つけられるなら 日本語だけを色づけることは?
/[ -黑]/k
(条件)「の」が複数個あっても対応できる。~の~の~の~
(入力)正規表現で複数個の漢字の熟語を抽出したい。
(出力)正規表現
複数個
漢字
熟語
複数個の漢字の熟語
抽出
(正規表現)
数量子の使い方が理解できませんでした。よろしくお願いします。
[6242]
RE: 正規表現で漢字の熟語を抽出したい。
すい
2007年08月23日 00:54
漢字なら
[亜-黑]
で大体良いのではないかと。
# 実際にはローマ数字(ⅰⅱⅲ...,ⅠⅡⅢ...)とか
# 一部の記号(㈱№℡∵)も含まれてしまいますので。。。
で、熟語というと、「漢字2文字以上」で良いのかな?
なら
[亜-黑]{2,}
かと。
「の」での無制限連結ありなら
[亜-黑]{2,}(の[亜-黑]{2,})*
でしょうかね。