2013/12/6

使用Perl script進行THE INTERVIEWS網站備份

曾經紅極一時的THE INTERVIEWS網站於2013/11/17公布了即將於2014/1/6結束服務的消息
THE INTERVIEWS - お知らせ
當初我也有稍微(?)玩了一下,雖然後來都沒人問我就放置了
但是要結束服務還是有種淡淡的哀傷~
剛好今天看到有日本Perl programer 寫了一支perl script來抓取備份,分享一下用法 :)
來源 from とりあえず「ザ・インタビューズ」から記事をバックアップする雑なPerlプログラムを書いた @xtetsuji

由於我日文程度不太好,尚未徵得作者的同意轉載,所以僅就安裝使用說明,script請進入來源網址
とりあえず「ザ・インタビューズ」から記事をバックアップする雑なPerlプログラムを書いた - #interest_ae
點選The Interviews article exporter and downloader. 的連結下載
The Interviews article exporter and downloader.
點選連結後,左方有個Download Gist按鈕,按下去下載即可~
下載後會是一個gist7398853-505756466f5952c96f0f5d0fee664a0890fd484e.tar.gz的檔案,使用winrar之類的軟體將檔案中的ti-export.pl解壓縮到預計拿來存備份資料的資料夾EX: C:\interviews。
1
這樣第一步(?)就完成了!
再來是安裝perl的執行環境,一般在windows環境下有兩種選擇,一是ActiveState,另外一個是Strawberry Perl,本篇會以Strawberry Perl為教學 (其實只跑這個script根本沒差...)
總之,進入網頁後就先下載吧~~
Strawberry Perl for Windows
建議使用Recommended stable versions, 寫這篇的時候是5.18.11,使用64bits版
安裝就下一步下一步下一步完成...懶得截圖(毆

安裝結束後,打開command line ( 執行> cmd)
輸入 cpan會出現以下畫面
2
接者輸入install Web::Query 特別注意,大小寫要一樣,等出現以下畫面
3
代表安裝OK了~輸入exit離開cpan

接者用指令切換到剛剛放ti-export.pl的資料夾位置EX: cd \interviews
※PS. 如果在不同槽,記得先使用 x: 切換過去再cd

接下來使用方式很簡單,在指令列輸入 ti-export.pl interviews ID 按下enter後就可以等待結果了!XD
如果您的interview非常熱門,會停在
4
這個畫面非常久,因為此時他正在抓取資料中~尤其是圖多的狀況!
等到變成 
5
這樣的時候就可以去資料夾中收成囉~
6
Enjoy :)