◀一般トップへ
  • 6239 正規表現で漢字の熟語を抽出したい。
    • 6242 RE: 正規表現で漢字の熟語を抽出したい。
  • [6239] 正規表現で漢字の熟語を抽出したい。 ろろ 2007年08月22日 12:01

    (参考)[5095] 日本語空白が色つけられるなら 日本語だけを色づけることは?
    /[ -黑]/k
    (条件)「の」が複数個あっても対応できる。~の~の~の~
    (入力)正規表現で複数個の漢字の熟語を抽出したい。
    (出力)正規表現
        複数個
        漢字
        熟語
        複数個の漢字の熟語
        抽出
    (正規表現)
    数量子の使い方が理解できませんでした。よろしくお願いします。
    • [6242] RE: 正規表現で漢字の熟語を抽出したい。 すい 2007年08月23日 00:54

      漢字なら

      [亜-黑]

      で大体良いのではないかと。

      # 実際にはローマ数字(ⅰⅱⅲ...,ⅠⅡⅢ...)とか
      # 一部の記号(㈱№℡∵)も含まれてしまいますので。。。

      で、熟語というと、「漢字2文字以上」で良いのかな?
      なら

      [亜-黑]{2,}

      かと。

      「の」での無制限連結ありなら

      [亜-黑]{2,}(の[亜-黑]{2,})*

      でしょうかね。