サクラ標準のBregexpでも、面倒ですができそうです。(目的が単語にヒットということであれば、ですが)
↓などが非常に参考になります。(注:勝手にリンク)
http://www.geocities.jp/maru3128/sakura_bbs.html#M0730■やりたいこと(仮定)
・「文字列1+ハイフン+改行+文字列2」→「文字列1+文字列2」
・「文字列1+改行+文字列2」→「文字列1+スペース+文字列2」(*1)
・改行だけの行は詰めない
*1:期待通りでない場合もありそうなため、適宜実行
■手順
1.余分なスペースの削除
テキスト全選択:Ctrl+A
左側余白を削除:Alt+L
右側余白を削除:Alt+R
2.改行コードの統一
ファイルを名前を付けて保存
文字コード:SJIS
改行コード:CR+LF
3.ハイフンで終わる行を繋げる
すべて置換(以下置換は正規表現ONで。)
置換前(*2):-(\r\n)
置換後:
*2:改行をなくす場合'$'は使えない模様
■以下おまけ(*1)
4.改行だけの行を★に置換して覚えておく(やり方が美しくないです。)
すべて置換
置換前:^$
置換後:★
5.文章の節以外の改行も繋げる
すべて置換
置換前:(\r\n)
置換後(*3):
*3:単語区切りのための半角スペース
6.ピリオドとかで改行する
すべて置換
置換前:([\.\?!])
置換後(*4):$1\r\n
*4:後読みが出来ないため後方参照を使用
7.★を元に戻す
すべて置換
置換前:★
置換後:\r\n
8.余分なスペースの削除
1.と同じ
■test case (Before)
The substitution of the word including changing line
is examined by the cherry. The word including the hy-
phen is not matched.
Is there a good method in the regular expression?
▼After
The substitution of the word including changing line is examined by the cherry.
The word including the hyphen is not matched.
Is there a good method in the regular expression?