5.6 KiB
5.6 KiB
title | author | date | wordtwit_post_info | categories | ||
---|---|---|---|---|---|---|
YAMLの内容を順番に取得したいな | kazu634 | 2009-06-22 |
|
|
前回書いたPerlスクリプトだと、こんな感じでスクレイピングした結果が返ってくる。
~/working/tmp_perl/projects/scrape/starbucks on simoom634 [505] $: perl test.pl --- shopinfo: - 喫茶室ルノアール 田端東店 - 03-3810-2604 - 東京都北区東田端1-12-1稲垣ハイツ1階 - 年中無休平日:7:30-21:00土曜日:8:00-21:00日祭日:8:00-19:00 - 禁煙席:24席喫煙席:76席 - JR田端駅徒歩4分北口出て右手陸橋を渡り交番角右折 - '' --- shopinfo: - 喫茶室ルノアール 池袋東口店 - 03-3980-6352 - 東京都豊島区東池袋1-40-2池袋旗ビル2階 - 年中無休全日:7:30-23:00 - 禁煙席:38席喫煙席:32席 - JR池袋駅東口出て明治通り左並びの東池袋1丁目交差点ヤマダ電機隣 - '' --- shopinfo: - 喫茶室ルノアール 池袋パルコ横店 - 03-5957-7085 - 東京都豊島区東池袋1-42-8第一イン池袋ビル地下1階 - 年中無休全日:7:30-23:00 - 禁煙席:28席喫煙席:32席 - JR池袋駅東口出て大通りから駅ビル「パルコ」左横の駅前「東京点心包家」角から左に入って30m - '' --- shopinfo: - 喫茶室ルノアール 巣鴨駅前店 - 03-3942-9349 - 東京都豊島区巣鴨1-15-1宮田ビル2階 - 年中無休全日:7:30-23:00 - 禁煙席:62席喫煙席:52席 - JR巣鴨駅南口徒歩分ロータリー左手パチンコ店2階 - '' ---
一つ一つのshopinfoは配列で、複数のshopinfoがあるので、基本的には二次元配列。一つのshopinfoの添え字0には店名が、1には電話番号が…といった規則性があるのだから、これはforeachじゃなくて、forを使って一つずつ取得すればいいのかな?いや、でもforeachでフラグか何かをたてて、添え字をカウントして上げればforeachでもいいのかな?
ちょっと考えてみよう。