Magicode logo
Magicode
0

Pythonの正規表現で繰り返しの文字列を1つにする。

やりたいこと

PDFに埋め込まれている文字がおかしいときになんとかしたかった。 下みたいにしたい。連続で同じ文字が繰り返しのときに、一つにしたい。

ああああ → あ ああいいううううえお → あいうえお ABCABCABC → ABCABCABC 唯唯諾諾 → 唯諾

やったこと

他にも合わせたスニペット

ルイズコピペもやってみよう!

参考

後方置換とか。 色々見たけどここが揃ってる気がしました。

Pythonで正規表現を使う際のグループ化。 Pythonの場合は、$1じゃなくって\g<1>って書かなきゃいけないってのに気づくのに時間がかかりました。

Discussion

コメントにはログインが必要です。