Hatena::Groupfragments

甘くておいしいおイモだよー このページをアンテナに追加 RSSフィード

2006-04-07

[][][]はてなブックマークのコメントが文字化けていてRSSが解析できない 20:09 はてなブックマークのコメントが文字化けていてRSSが解析できない - 甘くておいしいおイモだよー を含むブックマーク はてなブックマーク - はてなブックマークのコメントが文字化けていてRSSが解析できない - 甘くておいしいおイモだよー

http://b.hatena.ne.jp/entry/* のRSSを1から順に取得するプログラムを書いて走らせたところ、エントリIDが18のところでエラーが発生。

エントリのURL(ID版)
http://b.hatena.ne.jp/entry/18
エントリのURL(http版)
http://b.hatena.ne.jp/entry/http://www.yahoo.co.jp/
エントリのRSS
http://b.hatena.ne.jp/entry/rss/http://www.yahoo.co.jp/

エラーの内容は次の通り。

[Fatal Error] :3835:16: Invalid byte 1 of 1-byte UTF-8 sequence.

Googleで調べてみたところ、文字コードが正しく指定されていないと起こるエラーのようだ。

エントリのRSSを調べて見たところ、途中で文字化けを起こしていた。該当ユーザは↓

確かにコメントが文字化けている。

b:id:kjw_junichiさんとコンタクトを取って何とかしてもらう手もあるけど、とりあえずはてなアイデアに登録。実現されるかなあ…。

ところで、現在は

  1. http://b.hatena.ne.jp/entry/* を取得
  2. RSSのURLを決めうちで取得
  3. そのRSSを取得

という手順を踏んでるけど、ダイレクトに3.を行う方法はないものだろうか。http://b.hatena.ne.jp/entry/rss/* は無いっぽいし。

トラックバック - http://fragments.g.hatena.ne.jp/SweetPotato/20060407