住所抽出APIを作った

勉強用にHeroku & Sinatra & memcachedで作ってみました。URLを指定すると、そのページに含まれる住所を抽出します。適当な作りなので、あまり精度はよくないと思います。

本当ならば、ログ(またはmemcachedのダンプ)取れるようにしてから公開したかったのだけど、うまいやり方がよく分からないのでとりあえず公開してみました。

http://simple-samurai-17.heroku.com/api.xml?target=http://travel.rakuten.co.jp/yado/kyoto/

XMLスキーマがいまいちな感じがしないでもない&一件も抽出できない場合にはhttp status codeを吐かないといけないような気がしないでもないのですが、よく分かりません。

http://simple-samurai-17.heroku.com/api.json?target=http://r.tabelog.com/kyoto/S12/

JSONも吐きます。ただし、JSONPやXHR level 2には対応していません。

何か意見や改善点などがあれば、コメントで頂けると幸いです。