ブログを変えよう(その7)

ブログ

【ダイエットログ】

体重 70.1
体脂肪率 21.2
朝食 納豆ごはん☆味噌汁★マドレーヌ
昼食 弁当
夕食 豚キムチ炒め★カレー鶏ハム☆アボカドトマト★煮物☆淡麗-★ホッピーフルセット☆ハーゲンダッツミニ
おやつ・夜食 バーボンソーダ☆バーボンロック★カニかま
摂取カロリー 2313
消費カロリー 2260
体調 3:普通

5600以上ある記事をいかに見やすくするか

4月最終日。
不思議な1ヶ月が終わってしまった。
5月も同じような月になりそうだけど。
そして、今日も難解なブログの話。
とりあえず、記事とダイエットログはほぼ移植出来た。
問題は、5600以上ある記事をいかに見やすくするか。
この段階でどんな外観になっているかは忘れてしまったが、今現在のものは、その頃よりは進化したはず。
今でも過去の記事を探す時は画面右側からカテゴリーか、月単位のカレンダーを使うが、こんな風に出来たのはもう少し後のこと。
でも、もうちょっと進歩したいとも思っている。

グローバルナビの設定ができない

3連休の残り2日となる2019年2月10・11日はデザインを研究しようと思っていたが、思うような成果は上げられなかった。
前にも触れたが、画面上部のメニュー(グローバルナビともいうらしいが)は、なかなかうまく設定ができない。
記録によると、この段階での結論は、5600以上ある記事をすべてメニューから進めるのは無理なので、カテゴリーを絞ることだけ思いついた、と記録している。
でも、seesaaの時とカテゴリーはそんなに変わってないので、この辺りは放置されているということだろうか。

内部リンク問題

2月12日の作業。
50歳の誕生日である2月25日に移行するにあたって、だいぶ先が見えてきたところではあるが、残課題の一つが内部リンク。
過去の関連する記事にリンクを飛ばす設定は、マラソン大会の記録を中心に多用しているのだが、このまま何もしないと、内部リンクをクリックした瞬間に、埋め込んであるURLどおりseesaaの記事の方に飛んでいくので、seesaaのブログを消してしまうと「Not Found」となる。
プラグインでこうした内部リンクを抽出することはできるみたいなので、そのアドレスをWordPressのアドレスに置き換えることが出来ればいいのだが、そのアドレスは個別に調べるしかない。

seesaaのアドレス一覧が作れない

ネットで色々と方法を探してはみたが、この部分は皆さん手作業で行っているようだ。
とりあえず、ひとつのExcelシートに、
①seesaaのアドレス
②記事タイトル
③ワードプレスのパーマリンク
が一覧になっていれば作業が楽になるだろうと思ったが、そもそも①の一覧を作るのは難しい。
ブログサービスによっては、sitemapから作れそうだが、seesaaは駄目らしい。

力技を使ってみた

次に挑戦したのは「IMPORTXML関数」。
Google SpreadSheetで使える関数で、URLとタイトルが取得できるのだが、やってみるとseesaaのサイトが読み込めないのかエラー。
他にも記事URLとタイトルを取得するツールを探したが、うまくいかない。
仕方なく、少し力技を使ってみた。
seesaaの場合、WorsPressのパーマリンクとは違い、記事のアドレスは「http://kanepyon.seesaa.net/article/464298362.html 」 てな具合。
seesaaのエクスポートファイルにあるテキストデータをExcelに貼付けて、並べ替えを実行すると、各記事に付番された数字が途中に並ぶ(先の例だと「464298362」で、時系列的に昇順)。
この部分をコピーし、エクスポートした27ファイル繰り返す。

ワードプレスからのエクスポートファイルとseesaaとは完全に一致しない

seesaaのアドレスは、数字部分以外は同じなので、この数字がわかることとアドレスがわかることは同義で、これで旧記事のアドレスは出そろったことになる。
ただ、seesaaの記事は古い順番から付番されているのだが、ワードプレスの方1ヶ月なり1年なり、インポートした際に付番される数字は、逆に新しい順番に登録されていることがわかった。
一応ワードプレスからのエクスポートファイルを日付の古い順に並べてはみたが、当然1日に複数の記事となる場合もあるので、seesaaとは完全に一致しない。
更に一歩進めて、seesaaとWordPressの日付順の一覧を並べて、各記事のタイトルを比較して、一致しない場合は入れ替えて調整することを検討してみた。
ワードプレスはパーマリンク、タイトルを一括してエクスポートしているが、seesaaの方は改めてタイトルを取得しなければならない。

最後はExcelマクロに頼るが、パソコンに負荷がかかる

これまた方法をネットで探し、案外簡単に出来るのかと思いきや、スプレッドシートの関数もエラーになり、最後はExcelマクロに頼ることにした。
ここから2月13日~の作業内容。
ネットで探すと、アドレスからタイトルを読み込む便利なExcelのマクロがあったので、早速seesaaのアドレス一覧で実行してみた。
1アドレスあたり約3秒くらいでタイトルに変換してくれるのだが、5611もあるとさすがに時間がかかる。
しかも300を超えたあたりから、突然動かなくなったり、エラーが出たり。
夜寝ている間にやってくれればと思ったら、パソコンが落ちて再起動していたりする。
よほど負荷がかかっているのか。

ようやく1対1のアドレス対比が出来上がった

結果的に丸2日かかって、すべての記事のタイトルを取得できたのは14日の深夜。
この結果をもとに、seesaaのアドレス、タイトルの投稿順、ワードプレスのアドレス、タイトルの日付順を並べると、タイトルが一致しないものが多数ある。
同じ日付の中での投稿がseesaaとWordPressで逆になっている模様。
最初はこれを1個ずつ並べ替えていたが、なかなか進まない。
15日の日中に「日付を第一順位、ワードプレスのIDの降順を第二順位に」することを思いつき、家に帰ってから実行。
さらにExcel関数で比較し、一致しないものを手作業で修正することで、ようやく1対1のアドレス対比が出来上がった。

約400のseesaa内部リンクの変換は手作業

2月16日~の作業内容。
seesaaとワードプレスのアドレスを対比する一覧は出来上がったが、seesaaになっている内部リンクを一括でワードプレスに変更する方法は思いつかない。
そもそも、seesaaになっている内部リンクの一覧が簡単に作成できなかった。
(もともと、これが簡単に出来ると思って、ここまで面倒な作業を続けてきたというのに)
結局FC2のエクスポートファイルをエクセルに張り付けて、seesaaのアドレスに含まれる「article」で検索という原始的な方法にたどり着いた。
内部リンクは2015年~2018年に集中していて、一つずつコピペして、約400のseesaa内部リンクの一覧が出来た。
あとはseesaa内部リンクを対比一覧表で検索し、プラグイン「search regax」に両方のアドレスを入れて一つずつ変換するという地味な作業。
400はさすがにしんどかったが、何回かに分ければリズムよくできるもので、17日の夕方位にはほぼほぼ終了。

ついにseesaaの内部リンクは駆逐

検索もれと、2014年以前のものはワードプレスの投稿一覧から呼び出して直接修正し、ついにseesaaの内部リンクは駆逐することが出来た。
と、ここまで書いてきたが、今日の記事はEVERNOTEに残されていた記述を補足したもので、正直何をやっていたかわからない部分がある。
つまり、この時はうまく出来たと思っていても、本当は出来ていない可能性がある。
理論的には、今後seesaaを削除した際にリンクエラーとなるものが出て来る可能性があるが、その時に修正したらいいだろう。
それにしても、今日の振り返りは、何でこんな面倒な作業を何日もかけて行ったのかがさっぱりわからない。
不思議だなあ。
(続く)

コメント

タイトルとURLをコピーしました