Hatena::Diary's feed is been included some "XML invalid" SGML entities.
はてなダイアリーの feed は XML invalid な SGML entity をそのまま出していたりする。
»
とかが普通に feed 内に含まれてる件。
何使っても parse 出来ない。
いいかげん、
»
»
とかにして欲しい。
いや、<![CDATA[ ... ]]> 内だけはいいんですけどね。
いつか誰かが叩くんじゃないかなとか思ったけど、あんまり叩かれてる様子でも無さそう。
あんまり「叩く」とかしたくないのでソフトタッチで言わせてもらおうかなと思いました。
<, >, &, ", ' 以外の「名前」で表現される entity は 10 進か 16 進で数値化して欲しいです。
ちなみに弊社ではこんなのを使ったり使わなかったり。
http://search.cpan.org/dist/HTML-Entities-Numbered/
% perl -mHTML::Entities::Numbered -e'print HTML::Entities::Numbered::name2decimal_xml(q|"<»>"|);' "<»>"
% perl -mHTML::Entities::Numbered -e'print HTML::Entities::Numbered::name2hex_xml(q|"<»>"|);' "<»>"
そんな手間でもないと思うし、やって欲しいなーっていっつも思うんですが、やっていただけませんか?> id:jnaoya さん。