PCでEZweb公式サイトのカテゴリ順位を調べる

add to hatena hatena.comment (0) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 0 2009 年 1 月 21 日 by: baron

auのEZweb公式サイトのカテゴリで自社のサイトが何位なのか調べるために、わざわざ実機で調べていたけどau oneのPCサイトでEZweb公式サイトカテゴリが閲覧できた。

順位もちゃんと連動しているみたいなので、このページを自動で解析してやれば1つ定例作業が減る事になる。

着ムービー・着Flashの音楽カテゴリのサイト一覧を取得するPerlは以下のとおり。

PERL:
  1. use strict;
  2. use warnings;
  3. use utf8;
  4. use Perl6::Say;
  5. use URI;
  6. use Web::Scraper;
  7.  
  8. my $uri = new URI('http://k-tai.auone.jp/ezweb/04/01/list_01.html');
  9. my $res = scraper { process 'dt', 'sitename[]' => 'TEXT' }->scrape($uri);
  10. do { s/^ *(.*?) .$/$1/; say } for @{$res->{sitename}};

Web::Scraperでdtタグに囲まれているサイト名を配列で取得して、前後の不要なスペースを除去するだけ。Windows環境で実行したら、行末によく分からん\x{00A0}が付いてたので、正規表現で消してお茶濁した。

もうちょっと改造して、自分のサイト名とマッチさせる処理入れたら順位も取れるけど、サイト数が多いカテゴリだと50サイトずつしか表示されないので後ろのページも取りに行くようにしなければいけない。

めんどくさいからまた今度。

Leave a Reply

アナログ