RubyのCGI.escapeHTMLを使うと数値文字参照と文字実体参照の&もエンコードされてしまうのですが、これらをエンコードしない他のライブラリはありませんか？

Question

afternoontea

83

81もっと見る

100pt

コンピュータウェブ制作

RubyのCGI.escapeHTMLを使うと数値文字参照と文字実体参照の&もエンコードされてしまうのですが、これらをエンコードしない他のライブラリはありませんか？

http://d.hatena.ne.jp/afternoontea/20080709

回答の条件

URL必須
1人2回まで

登録：2008/07/09 23:42:22
終了：2008/07/15 00:39:11

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

afternoontea 2008/07/11 03:41:52

・16進数値文字参照形式は a-f の大文字小文字を考慮しないので要修正
afternoontea 2008/07/21 03:07:13

修正したメソッドでしばらく運用してみる。
http://d.hatena.ne.jp/afternoontea/20080709

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

凡 · Accepted Answer · 2008-07-10T13:52:37+09:00

escapeHTMLはcgi.rbの中を見ていただければ分かりますが、gsubで変換しているだけです。

正規表現の否定先読みを使い、除外したいものを指定すれば良いはずです。

def escapeHTML(string)
  string.gsub(/&(?!(?:amp|quot|lt|gt|#(?:\d+|x[0-9a-f]+));)/n, '&amp;').gsub(/\"/n, '&quot;').gsub(/>/n, '&gt;').gsub(/</n, '&lt;')
end

ちょっと正確か自信がないのですが、イメージは伝わると思い、回答いたしました。

参考にしてみてください。

正規表現 - Rubyリファレンスマニュアル

RubyのCGI.escapeHTMLを使うと数値文字参照と文字実体参照の&もエンコードされてしまうのですが、これらをエンコードしない他のライブラリはありませんか？

ベストアンサー

凡421752008/07/10 13:52:37

コメント（2件)

この質問への反応（ブックマークコメント）