2005年 04月 05日
ブログのバックアップ (巡集篇) |
"はい こちらサポセン。簡易バックアップ方法公開!"にTB
-------------------
おじさんは1995年から自分のウェブサイトを作ってきた。未だにHTMLはエディタで手打の方が作業が速いという古い人間である。作業の流れとしては、自分のパソコン(ローカルPC)上で文章を書き、画像を作り、レイアウトなどの編集をし、出来上がったところで、ファイルを"FTP"によって、サーバに上げるというのが長年身体に染みついた方法である。この方法でウェブサイトを作ると、必ず手元(自分のパソコンのHDD上)にオリジナルファイルが残る。このオリジナルファイルを適切にバックアップしていれば、自分が書いたものが消えたり散逸したりすることは、まずなかった。
しかし、最近は、自分の手元に書いた文章が残らないウェブサイト構築も行うようになってきた。言うまでもなくブログのことである。ブログの場合、データが記録保存される場所は、原則的にはブログポータルサイトのサーバのHDD上である。(専用サーバ上でMT、sbなどのブログ用ソフトウェアを動かしていたり、エディタ上で完璧な下書きをしてからPostする場合を除く) こうした場合、アップロードした画像類は手元に残るが、文章は普通は残らない。自分が時間をかけて書いたものが手元に残らないのは何となく不安である。特に、おじさんのように古くからFTPによるウェブサイト更新を行ってきた者にとっては。
おじさんの場合、書いた文章は「チラシの裏的内容」だとしても、とにかく、量が多い。1日平均で4000字は書くから、原稿用紙にすれば10枚/dayである。すでに、100エントリを超えているから、原稿用紙にして1000枚以上書いたことになる。書きためたデータは玉石混淆(ほとんどが石)ではあるが、たまには過去に書いた文章を再利用することもある。デジタルデータであるから、古いものであっても、変質したりはしないし、コピーする場合も一瞬で済む。非常に便利である。利便性だけを考えた場合、データがローカルPCにあろうと、エキサイトのサーバにあろうと、あまり関係はない。
エキサイトのサーバが順調に稼働し続けてくれれば何も問題はないのだが、エキサイトのサーバとて不死身ではない。所詮ただのハードウェア、ただのハードディスクなのであるから、時間が来れば壊れる。壊れる前にバックアップを取り、新しいディスクにデータコピーをするのが、サーバ管理会社の仕事ではあるが、事故はいつでも起こりえる。おじさんの個人的体験では、マーフィーの法則どおり、一番壊れてほしくないときに、壊れるのがハードディスクなのである。おそらくは、"RAID"システムなどで二重三重に冗長性を高めて運用をしているだろうとは思うが、それでも壊れる可能性がゼロにはならない。
自分の書いたデータの保守管理を他人まかせにしているのは、何となく不安なものである。そんなわけで、ブログのバックアップをローカルPC(自分のパソコン)にとるため、あれこれ試行錯誤をしてきた。ブログをローカル保存できるブログポータルサイトもあるらしいが、エキサイトにはそのような機能はない。ユーザ側で何とかしなければならない。
どのようなブラウザにも表示しているウェブサイトを保存する機能は付いている。「ファイル」-「名前を付けてページを保存」というものである。しかし、ブログが長期間にわたるとページ数が増え、ブラウザの機能でブログをローカル保存するのが非効率的になってくる。こうなると、専用ツールがほしくなる。
ウェブサイト一括ダウンロード/自動巡回ツールを色々試してみたが、ブログ保存に適したものは、それほど多くはなかった。ブログのような動的にHTMLを生成するウェブサイトは、なかなか保存が難しいようでである。各種試してみた結果、現在は"巡集 ver.1.59.2"という、siden氏作のフリーウェアを使っている。これが最も手間がかからず、取りこぼしも少ないのである。

巡集は、Windows XP/2000用の自動巡回&ウェブサイト一括ダウンロードソフトである。ウェブサイトのリンクを自動的にたどって、サーバ上のHTMLファイルや画像などを丸ごとダウンロードすることができる。特にブログのバックアップのためのソフトというわけではないが、結果としてローカルPC内に仮想エキサイトサーバを構築するので、ブログのバックアップをすることができるのである。
巡集では、上のスクリーンショットの「ダウンロードするURL」欄に記入されたウェブサイトの全てのファイルをダウンロードしてくれる。複数指定することも可能である。使い方は簡単で、上の図の赤いスタートマークを押せば、自動的に関連するファイルを拾ってきてくれる。具体的な使い方は、"はい こちらサポセン。簡易バックアップ方法公開!"を読めば分かると思う。
外部サーバへのリンクはたどらないようにしたり、外部サーバ上にあってもHTML以外のファイルはダウンロードするとか、2回目以降の巡回では更新されたファイルのみダウンロードするといった設定も可能であり、タイマーによる定期的自動巡回もサポートしている。
基本的には、"はい こちらサポセン。簡易バックアップ方法公開!"に書かれてある簡単な方法で大丈夫である。書いてあるとおりにすれば、文章中心のブログであれば、99%うまくローカル保存できると思う。
しかしながら、画像が多かったり、エキサイト以外の外部サーバに画像を上げていたりすると、少し設定がやっかいになる。おじさんの場合は、ブログトップバナーが外部サーバにある画像だし、他にも、ときどき外部サーバに上げてある画像を使ったりしているので、設定をいじらなければならない。巡集は、なかなか設定が微妙で、これで決定版というものに落ち着かないため、しょっちゅういじっている。以下はおじさんの場合の暫定的な設定である。

ファイルの保存先は、デフォルトの場合、実行ファイル"Junshu.exe"が置かれているフォルダの下に作られる。つまり、特に指定しなければ、C:\Program Files\Junshu\の下に作られる。おじさん、昔からプログラムフォルダにデータを置くのが嫌いなので、別ドライブの別フォルダを指定している。プログラムフォルダにデータを置くと、OS再インストールの際にバックアップが面倒なのである。
デフォルトでは、「ブログのカレンダー機能を辿らない」にはチェックが付いているが、カレンダー機能を辿ってほしいので、チェックを外している。「階層を限定する 5階層まで」としてあるが、デフォルトでは10階層である。あまり階層深くたどられると、時間はかかるし、ファイル数は増えるし、ろくなことがないので、半分に減らしている。

「詳細設定」-「取得設定」-「保存」と開いたところである。HTMLのリンク先の書き換えであるが、「許可されたURLのサーバの場合のみ書き換える」としてある。デフォルトは、「リンク先を書き換えない」である。自分のブログ内のファイルは自動的に取得するはずなのであるが、ときどきリンク先が絶対パスで、"http://xylocopal.exblog.jp/1362673"のように記されている場合があるらしく、そういうときは自分のブログ内であってもダウンロードをしない場合がある。ダウンロードされないとバックアップにならない。それを避けるため、「許可されたURLのサーバの場合は書き換える」にしてあるのである。書き換える、とはURLをインターネットのものから、ローカルPCのものに書き換えることである。どこで、許可されたサーバを設定するかは、下の図を見てほしい。

上は巡集の「詳細設定」-「URLフィルタ」を開いたところである。「以下の文字列が含まれるURLを許可」欄に、ローカルPCに保存したいサーバのURLを記述するのである。おじさんの場合は、自分が外部サーバにFTPしたファイル類もダウンロードしてほしいので、覚えがあるサーバはすべて記述してある。"xylocopal.com"、"commufa.jp"はそうした外部サーバである。"pds"というのは、エキサイトの画像保存用サーバの頭文字である。たとえば上の画像の場合、URLは下記のようになっている。
http://pds1.exblog.jp/pds/1/200504/04/43/c0014043_20115895.gif
"pds1"の他、"pds"、"pds2"などもあるようなので、単に"pds"としている。本当はもっとユニークな名前で指定しないと、たったの3文字であるから、別のサーバとかぶるかもしれない。とはいえ、この場合、"exblog.jp"を許可してしまうと、リンクしたエキサイトのブログすべてをダウンロードしようとするから、大変なことになる。ワイルドカードが使えるのか、正規表現が使えるのか、ヘルプやReadme.txtを見ても何も書いていない。
とりあえず、今はこんな設定で暫定的にバックアップを取っているが、未だに、ときどき取りこぼすことがある。あるいは無限ループに陥り、いつまでたっても巡回が終わらないこともある。設定が悪いのかと思うのだが、原因がよく分からない。巡集がバージョンアップが更新でユーザ会議室などがあるソフトであれば、聞くこともできるし、バージョンアップに期待することもできる。しかし、巡集はどうやら見捨てられてしまったようなのである。
http://hp.vector.co.jp/authors/VA037488/
上が巡集のウェブサイトであったのだが、現在はディレクトリインデックス丸出しの寂しいものとなっている。以前は、ここに詳細な使用マニュアルが掲載されたページがあったのだが、現在はもうない。とりあえず、ここにアクセスすれば最新版をダウンロードすることはできるが、このような状態になったサイトの将来性は明るいとはいえない。誰か、エキサイトブログをローカル保存するのに最適なソフトウェアを作ってくれないものだろうか。あるいは、おじさんが知らないだけで、すでに決定版があるのかもしれない。良いものがあったら教えてほしい。シェアウェアでも優秀なものであれば、使用料を払ってレジストするから。
-------------------
おじさんは1995年から自分のウェブサイトを作ってきた。未だにHTMLはエディタで手打の方が作業が速いという古い人間である。作業の流れとしては、自分のパソコン(ローカルPC)上で文章を書き、画像を作り、レイアウトなどの編集をし、出来上がったところで、ファイルを"FTP"によって、サーバに上げるというのが長年身体に染みついた方法である。この方法でウェブサイトを作ると、必ず手元(自分のパソコンのHDD上)にオリジナルファイルが残る。このオリジナルファイルを適切にバックアップしていれば、自分が書いたものが消えたり散逸したりすることは、まずなかった。
しかし、最近は、自分の手元に書いた文章が残らないウェブサイト構築も行うようになってきた。言うまでもなくブログのことである。ブログの場合、データが記録保存される場所は、原則的にはブログポータルサイトのサーバのHDD上である。(専用サーバ上でMT、sbなどのブログ用ソフトウェアを動かしていたり、エディタ上で完璧な下書きをしてからPostする場合を除く) こうした場合、アップロードした画像類は手元に残るが、文章は普通は残らない。自分が時間をかけて書いたものが手元に残らないのは何となく不安である。特に、おじさんのように古くからFTPによるウェブサイト更新を行ってきた者にとっては。
おじさんの場合、書いた文章は「チラシの裏的内容」だとしても、とにかく、量が多い。1日平均で4000字は書くから、原稿用紙にすれば10枚/dayである。すでに、100エントリを超えているから、原稿用紙にして1000枚以上書いたことになる。書きためたデータは玉石混淆(ほとんどが石)ではあるが、たまには過去に書いた文章を再利用することもある。デジタルデータであるから、古いものであっても、変質したりはしないし、コピーする場合も一瞬で済む。非常に便利である。利便性だけを考えた場合、データがローカルPCにあろうと、エキサイトのサーバにあろうと、あまり関係はない。
エキサイトのサーバが順調に稼働し続けてくれれば何も問題はないのだが、エキサイトのサーバとて不死身ではない。所詮ただのハードウェア、ただのハードディスクなのであるから、時間が来れば壊れる。壊れる前にバックアップを取り、新しいディスクにデータコピーをするのが、サーバ管理会社の仕事ではあるが、事故はいつでも起こりえる。おじさんの個人的体験では、マーフィーの法則どおり、一番壊れてほしくないときに、壊れるのがハードディスクなのである。おそらくは、"RAID"システムなどで二重三重に冗長性を高めて運用をしているだろうとは思うが、それでも壊れる可能性がゼロにはならない。
自分の書いたデータの保守管理を他人まかせにしているのは、何となく不安なものである。そんなわけで、ブログのバックアップをローカルPC(自分のパソコン)にとるため、あれこれ試行錯誤をしてきた。ブログをローカル保存できるブログポータルサイトもあるらしいが、エキサイトにはそのような機能はない。ユーザ側で何とかしなければならない。
どのようなブラウザにも表示しているウェブサイトを保存する機能は付いている。「ファイル」-「名前を付けてページを保存」というものである。しかし、ブログが長期間にわたるとページ数が増え、ブラウザの機能でブログをローカル保存するのが非効率的になってくる。こうなると、専用ツールがほしくなる。
ウェブサイト一括ダウンロード/自動巡回ツールを色々試してみたが、ブログ保存に適したものは、それほど多くはなかった。ブログのような動的にHTMLを生成するウェブサイトは、なかなか保存が難しいようでである。各種試してみた結果、現在は"巡集 ver.1.59.2"という、siden氏作のフリーウェアを使っている。これが最も手間がかからず、取りこぼしも少ないのである。

巡集は、Windows XP/2000用の自動巡回&ウェブサイト一括ダウンロードソフトである。ウェブサイトのリンクを自動的にたどって、サーバ上のHTMLファイルや画像などを丸ごとダウンロードすることができる。特にブログのバックアップのためのソフトというわけではないが、結果としてローカルPC内に仮想エキサイトサーバを構築するので、ブログのバックアップをすることができるのである。
巡集では、上のスクリーンショットの「ダウンロードするURL」欄に記入されたウェブサイトの全てのファイルをダウンロードしてくれる。複数指定することも可能である。使い方は簡単で、上の図の赤いスタートマークを押せば、自動的に関連するファイルを拾ってきてくれる。具体的な使い方は、"はい こちらサポセン。簡易バックアップ方法公開!"を読めば分かると思う。
外部サーバへのリンクはたどらないようにしたり、外部サーバ上にあってもHTML以外のファイルはダウンロードするとか、2回目以降の巡回では更新されたファイルのみダウンロードするといった設定も可能であり、タイマーによる定期的自動巡回もサポートしている。
基本的には、"はい こちらサポセン。簡易バックアップ方法公開!"に書かれてある簡単な方法で大丈夫である。書いてあるとおりにすれば、文章中心のブログであれば、99%うまくローカル保存できると思う。
しかしながら、画像が多かったり、エキサイト以外の外部サーバに画像を上げていたりすると、少し設定がやっかいになる。おじさんの場合は、ブログトップバナーが外部サーバにある画像だし、他にも、ときどき外部サーバに上げてある画像を使ったりしているので、設定をいじらなければならない。巡集は、なかなか設定が微妙で、これで決定版というものに落ち着かないため、しょっちゅういじっている。以下はおじさんの場合の暫定的な設定である。

ファイルの保存先は、デフォルトの場合、実行ファイル"Junshu.exe"が置かれているフォルダの下に作られる。つまり、特に指定しなければ、C:\Program Files\Junshu\の下に作られる。おじさん、昔からプログラムフォルダにデータを置くのが嫌いなので、別ドライブの別フォルダを指定している。プログラムフォルダにデータを置くと、OS再インストールの際にバックアップが面倒なのである。
デフォルトでは、「ブログのカレンダー機能を辿らない」にはチェックが付いているが、カレンダー機能を辿ってほしいので、チェックを外している。「階層を限定する 5階層まで」としてあるが、デフォルトでは10階層である。あまり階層深くたどられると、時間はかかるし、ファイル数は増えるし、ろくなことがないので、半分に減らしている。

「詳細設定」-「取得設定」-「保存」と開いたところである。HTMLのリンク先の書き換えであるが、「許可されたURLのサーバの場合のみ書き換える」としてある。デフォルトは、「リンク先を書き換えない」である。自分のブログ内のファイルは自動的に取得するはずなのであるが、ときどきリンク先が絶対パスで、"http://xylocopal.exblog.jp/1362673"のように記されている場合があるらしく、そういうときは自分のブログ内であってもダウンロードをしない場合がある。ダウンロードされないとバックアップにならない。それを避けるため、「許可されたURLのサーバの場合は書き換える」にしてあるのである。書き換える、とはURLをインターネットのものから、ローカルPCのものに書き換えることである。どこで、許可されたサーバを設定するかは、下の図を見てほしい。

上は巡集の「詳細設定」-「URLフィルタ」を開いたところである。「以下の文字列が含まれるURLを許可」欄に、ローカルPCに保存したいサーバのURLを記述するのである。おじさんの場合は、自分が外部サーバにFTPしたファイル類もダウンロードしてほしいので、覚えがあるサーバはすべて記述してある。"xylocopal.com"、"commufa.jp"はそうした外部サーバである。"pds"というのは、エキサイトの画像保存用サーバの頭文字である。たとえば上の画像の場合、URLは下記のようになっている。
http://pds1.exblog.jp/pds/1/200504/04/43/c0014043_20115895.gif
"pds1"の他、"pds"、"pds2"などもあるようなので、単に"pds"としている。本当はもっとユニークな名前で指定しないと、たったの3文字であるから、別のサーバとかぶるかもしれない。とはいえ、この場合、"exblog.jp"を許可してしまうと、リンクしたエキサイトのブログすべてをダウンロードしようとするから、大変なことになる。ワイルドカードが使えるのか、正規表現が使えるのか、ヘルプやReadme.txtを見ても何も書いていない。
とりあえず、今はこんな設定で暫定的にバックアップを取っているが、未だに、ときどき取りこぼすことがある。あるいは無限ループに陥り、いつまでたっても巡回が終わらないこともある。設定が悪いのかと思うのだが、原因がよく分からない。巡集がバージョンアップが更新でユーザ会議室などがあるソフトであれば、聞くこともできるし、バージョンアップに期待することもできる。しかし、巡集はどうやら見捨てられてしまったようなのである。
http://hp.vector.co.jp/authors/VA037488/
上が巡集のウェブサイトであったのだが、現在はディレクトリインデックス丸出しの寂しいものとなっている。以前は、ここに詳細な使用マニュアルが掲載されたページがあったのだが、現在はもうない。とりあえず、ここにアクセスすれば最新版をダウンロードすることはできるが、このような状態になったサイトの将来性は明るいとはいえない。誰か、エキサイトブログをローカル保存するのに最適なソフトウェアを作ってくれないものだろうか。あるいは、おじさんが知らないだけで、すでに決定版があるのかもしれない。良いものがあったら教えてほしい。シェアウェアでも優秀なものであれば、使用料を払ってレジストするから。
by xylocopal | 2005-04-05 00:12 | Computer






