Pythonの正規表現に関する質問です。

Question

夜会

26

24もっと見る

100pt

コンピュータウェブ制作

Pythonの正規表現に関する質問です。

ある教科書で、「教師は教師」みたいに同じ単語が助詞を挟んで繰り返される表現を、正規表現でみつけてこいという課題がありました。

それで、試しにですが、

test = '教師は教師、生徒も生徒、女の子は女の子、俺は天才'

という文字列を用意して、

re.findall(r'(.+).\1', test)

と書いてみると、

>>> test = '教師は教師、生徒も生徒、女の子は女の子、俺は天才'
>>> re.findall(r'(.+).\1', test)
['教師', '生徒', '女の子']

という実行結果になりました。
後方参照だと()の部分しか抜き出されないようで、これを「教師は教師」の形で出力するのはどうすればいいでしょうか？

回答の条件

1人10回まで

登録：2016/08/14 22:39:47
終了：2016/08/17 11:41:52

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

質問者から

夜会2016/08/15 09:10:16

re.finditer()を使って、以下のようにしたら一応それっぽいものができました。

>>> test = '教師は教師、生徒も生徒、女の子は女の子、俺は天才'

>>> results_itr = re.finditer(r'(.+).\1', test)

>>> for result in results_itr:

... print(result.group())

...

教師は教師

生徒も生徒

女の子は女の子

>>>

規約違反として通知

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

a-kuma3 · Answer 1 · 2016-08-15T10:33:13+09:00

補足に書いてある group と同じことをやっているだけですが、正規表現全体を () でグルーピング。

    re.findall(r'((.+).\2)', test)

語の繰り返しはふたつ目のグルーピングになるので、正規表現ちゅうの後方参照は \2 になります。

繰り返しをマッチさせるためのグルーピングは、正規表現の範囲ではどうしても残るので、それを取り除くにはリストをいじります。

    map(lambda a:a[0], re.findall(r'((.+).\2)', test))

mateaifish · Answer 2 · 2016-08-16T02:38:46+09:00

“Python - 数学 - データを統計量で記述する(統計電卓、平均値、最頻値、分散、標準偏差) | Kamimura's blog”

http://tweetdig.net/hashtag/Python

Pythonの正規表現に関する質問です。

質問者から

回答（2件）

a-kuma3497321542016/08/15 10:33:13

mateaifish102016/08/16 02:38:46

コメント（0件)

この質問への反応（ブックマークコメント）