2006-04-07
■ [hatena][bookmark][idea]はてなブックマークのコメントが文字化けていてRSSが解析できない

http://b.hatena.ne.jp/entry/* のRSSを1から順に取得するプログラムを書いて走らせたところ、エントリIDが18のところでエラーが発生。
- エントリのURL(ID版)
- http://b.hatena.ne.jp/entry/18
- エントリのURL(http版)
- http://b.hatena.ne.jp/entry/http://www.yahoo.co.jp/
- エントリのRSS
- http://b.hatena.ne.jp/entry/rss/http://www.yahoo.co.jp/
エラーの内容は次の通り。
[Fatal Error] :3835:16: Invalid byte 1 of 1-byte UTF-8 sequence.
Googleで調べてみたところ、文字コードが正しく指定されていないと起こるエラーのようだ。
エントリのRSSを調べて見たところ、途中で文字化けを起こしていた。該当ユーザは↓
確かにコメントが文字化けている。
b:id:kjw_junichiさんとコンタクトを取って何とかしてもらう手もあるけど、とりあえずはてなアイデアに登録。実現されるかなあ…。
ところで、現在は
という手順を踏んでるけど、ダイレクトに3.を行う方法はないものだろうか。http://b.hatena.ne.jp/entry/rss/* は無いっぽいし。
コメント
トラックバック - http://fragments.g.hatena.ne.jp/SweetPotato/20060407