blog/content/post/2009-06-22-00001179.md

5.7 KiB
Raw Blame History

title author date url wordtwit_post_info categories
YAMLの内容を順番に取得したいな kazu634 2009-06-22 /2009/06/22/_1275/
O:8:"stdClass":13:{s:6:"manual";b:0;s:11:"tweet_times";i:1;s:5:"delay";i:0;s:7:"enabled";i:1;s:10:"separation";s:2:"60";s:7:"version";s:3:"3.7";s:14:"tweet_template";b:0;s:6:"status";i:2;s:6:"result";a:0:{}s:13:"tweet_counter";i:2;s:13:"tweet_log_ids";a:1:{i:0;i:4661;}s:9:"hash_tags";a:0:{}s:8:"accounts";a:1:{i:0;s:7:"kazu634";}}
Perl

前回書いたPerlスクリプトだと、こんな感じでスクレイピングした結果が返ってくる。

~/working/tmp_perl/projects/scrape/starbucks on simoom634 [505] $: perl test.pl
---
shopinfo:
- 喫茶室ルノアール 田端東店
- 03-3810-2604
- 東京都北区東田端1-12-1稲垣ハイツ1階
- 年中無休平日:7:30-21:00土曜日:8:00-21:00日祭日:8:00-19:00
- 禁煙席:24席喫煙席:76席
- JR田端駅徒歩4分北口出て右手陸橋を渡り交番角右折
- ''
---
shopinfo:
- 喫茶室ルノアール 池袋東口店
- 03-3980-6352
- 東京都豊島区東池袋1-40-2池袋旗ビル2階
- 年中無休全日:7:30-23:00
- 禁煙席:38席喫煙席:32席
- JR池袋駅東口出て明治通り左並びの東池袋1丁目交差点ヤマダ電機隣
- ''
---
shopinfo:
- 喫茶室ルノアール 池袋パルコ横店
- 03-5957-7085
- 東京都豊島区東池袋1-42-8第一イン池袋ビル地下1階
- 年中無休全日:7:30-23:00
- 禁煙席:28席喫煙席:32席
- JR池袋駅東口出て大通りから駅ビル「パルコ」左横の駅前「東京点心包家」角から左に入って30m
- ''
---
shopinfo:
- 喫茶室ルノアール 巣鴨駅前店
- 03-3942-9349
- 東京都豊島区巣鴨1-15-1宮田ビル2階
- 年中無休全日:7:30-23:00
- 禁煙席:62席喫煙席:52席
- JR巣鴨駅南口徒歩分ロータリー左手パチンコ店2階
- ''
---

一つ一つのshopinfoは配列で、複数のshopinfoがあるので、基本的には二次元配列。一つのshopinfoの添え字0には店名が、1には電話番号が…といった規則性があるのだから、これはforeachじゃなくて、forを使って一つずつ取得すればいいのかないや、でもforeachでフラグか何かをたてて、添え字をカウントして上げればforeachでもいいのかな

ちょっと考えてみよう。

「perl」に関連する最近のエントリ