2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

【和塩】geocitiesスレ10【ジオシティーズ】

1 :名無しさん@お腹いっぱい。:2019/04/01(月) 19:45:46.57 0.net
2019年3月末で終了したgeocitiesは果たして良い鯖だったのか?
みんなでマターリ語りましょう

Yahoo!ジオシティーズからのお知らせ
http://geocities.yah...jp/v/info/index.html
拡張版ジオシティーズ
http://geocities.yahoo.co.jp/
全サービス(ジオプラス(有料)を含む)
http://geocities.yahoo.co.jp/services
旧ジオシティーズ
http://www.geocities.co.jp/ (新ジオに転送)
サービス終了のお知らせ - Yahoo!ジオシティーズ
https://info-geociti....jp/close/index.html

前スレ
【和塩】geocitiesスレ9【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1543911834/

関連スレ
【Yahoo!】ジオログ【ジオシティーズ 】
http://pc11.2ch.net/...cgi/blog/1099695255/
Yahoo!メール 11通目
http://pc11.2ch.net/...gi/esite/1236083806/
▼▲▼米塩が・・▼▲▼
http://pc11.2ch.net/.../hosting/1015764845/
【明日閉鎖】有用なジオシティーズのHPを共有して内容を保存するスレ【geocities】
http://leia.5ch.net/test/read.cgi/poverty/1554026731/

規約違反サイトや痛いサイト晒しは板違い。ネットwatch板で。http://pc11.2ch.net/net/

2 :名無しさん@お腹いっぱい。:2019/04/01(月) 21:13:01.35 0.net
関連サイト
GeoLog Project
https://thaliana.mydns.jp/GeoLog/

Geocities URL収集
https://geo.98nx.jp

Archi

3 :名無しさん@お腹いっぱい。:2019/04/01(月) 21:15:24.56 0.net
GeoCities Japan - Archiveteam
https://www.archiveteam.org/index.php?title=GeoCities_Japan

Archive Team: Not Again! Geocities Japan : Free Web : Free Download, Borrow and Streaming : Internet Archive
https://archive.org/details/archiveteam_geocitiesjp

4 :名無しさん@お腹いっぱい。:2019/04/01(月) 21:53:39.73 0.net
これからできること

保存できなかったデータの回収
・Yahoo Japan に無理を言ってデータを提供してもらう → Wayback Machine へ
・Google のキャッシュ、個人のアーカイブなどを集める → 自作アーカイブへ

Wayback Machine に保存できなかったデータの公開(自作アーカイブ)
・ウェブサイトとして公開: 普通のウェブサーバ / IPFS
・ダウンロード可能なデータとして公開: Internet Archive / 独自のサーバ / IPFS / torrent

5 :名無しさん@お腹いっぱい。:2019/04/01(月) 21:56:12.55 0.net
【今回の失敗で学んだこと】
・早めに行動しましょう
・まずは既存のプロジェクトや遺産を探しましょう
・単独ではなく組織的に動きましょう
・呼びかけや情報共有を積極的に行いましょう

6 :名無しさん@お腹いっぱい。:2019/04/01(月) 22:14:26.13 O.net
保存って、オイラのサイトも保存されてるのでしょうか?

7 :名無しさん@お腹いっぱい。:2019/04/01(月) 22:28:12.65 0.net
オラサイト懐かしいな

8 :名無しさん@お腹いっぱい。:2019/04/01(月) 23:39:58.61 0.net
>>4
これからどうするかが肝心だな
保存できなかったデータの回収は実現可能性が低いからひとまず保留しておくとして、とりあえず取り組むべきはデータの公開よ

9 :名無しさん@お腹いっぱい。:2019/04/01(月) 23:50:50.03 0.net
前スレで書かれてた知見とネット情報を元にInternet Archiveに子ページ含めて保存リクエストを投げる方法を考えたけど、少なくともジオシティーズ相手に有効活用は出来なくなってしまったな

10 :名無しさん@お腹いっぱい。:2019/04/02(火) 00:09:41.28 0.net
>>5
xreaとかfc2とかninjaも今からURL収集しといた方がいいんだろうな

11 :名無しさん@お腹いっぱい。:2019/04/02(火) 00:54:06.94 0.net
>>4
torrentだと閲覧が色々と面倒だな
データ配布形式にするかGeolog的なウェブサイトとしての公開にするかをまず決めなきゃならんのか
全部やれればそれに越したことはないんだけど

12 :名無しさん@お腹いっぱい。:2019/04/02(火) 01:52:20.59 0.net
アーカイブデータをBitTorrentで共有しよう(提案)

トラッカー
http://www.ceena.net/

クライアント
https://www.qbittorrent.org/

13 :名無しさん@お腹いっぱい。:2019/04/02(火) 02:07:06.58 0.net
XREAの永久無広告無料鯖キャンペーン4/30までだった

14 :名無しさん@お腹いっぱい。:2019/04/02(火) 02:46:08.48 0.net
>>9
書いていってくださいお願いします


何割くらい集まったんだろう

15 :名無しさん@お腹いっぱい。:2019/04/02(火) 03:40:34.68 0.net
>>9ではないけどブラウザでページ開いてキャッシュからURL一覧を取得、
ファイルから対象ドメインのリンク集めて全部ブラウザで開いてまたキャッシュからURL一覧取得、そこからまたリンク集めて・・・
を繰り返して頭にhttps://web.archive.org/save/を付けてwget --spiderでアクセスするという作業を自動化できれば一気に抜けを減らせると思うんだが

16 :Yahoo!ジオシティーズ−ジオライト解約手続き完了のお知らせ:2019/04/02(火) 03:49:14.31 O.net
----━━
Yahoo!ジオシティーズ
━━━━━
daylightkeep 様
いつもYahoo!JAPANをご利用いただきありがとうございます。Yahoo!ジオシティーズは2019年3月末を持ちましてサービスを終了いたします。
それに伴いご契約いただいているジオライトを解約いたしました。ジオライトの利用料金につきましては「2019年3月分」まで発生します。
※「2019年3月分」の請求については、2019年4月以降に行われますのでご注意ください。
なお、お客様がYahoo!ウォレットへ登録されているお支払い方法により請求方法、引き落とし日が異なります。詳細は以下のヘルプページを
ご覧ください。
◇銀行口座やクレジットカードからの引落日はいつ?
https://www.yahoo-help.jp/app/answers/detail/p/615/a_id/46898
Yahoo!ウォレットにおける請求状況は「2019年4月11日以降」に
以下のページよりご確認いただけます。
------
◇Yahoo!ウォレット-請求明細
https://web.invoice.yahoo.co.jp/invoice/web
------------
2019年3月31日中は従来通り、お客様のホームページは表示されております。
またファイルのアップロードや編集も可能です。ただし、2019年4月1日になりますと、ホームページは非公開になり、ファイルのアップロードや編集も行えなくなります。
どうぞご注意ください。
今後もホームページの公開をご希望のお客様は以下のページをご参考のうえ、他社サービスへの移行手続きを行ってくださいますようお願いいたします。
◇Yahoo!ジオシティーズ-サービス終了のお知らせ
https://info-geocities.yahoo.co.jp/close/index.html
2019年4月1日以降もFTPによるファイルのダウンロードは行えます。ダウンロードが可能な期間は「2020年3月末」となりますので、ファイルを
保存したいお客様は忘れずにダウンロードをお願いいたします。Yahoo!ジオシティーズをご利用いただきありがとうございました。
-----------
■お問い合わせ
・Yahoo!ジオシティーズに関する情報は下記のヘルプページで
ご覧いただけます。
◇Yahoo!ジオシティーズヘルプ
https://www.yahoo-help.jp/app/home/p/549/
・このメールに心当たりのない場合は、下記のお問い合わせフォーム
「お問い合わせの詳細」欄に、メールタイトルと本メール冒頭にございます
Yahoo! JAPAN IDをご記載のうえご連絡ください。
◇Yahoo!ジオシティーズ - お問い合わせフォーム
https://www.yahoo-help.jp/app/ask/p/2454/form/geocities-inquiry
------------

17 :Yahoo!ジオシティーズ終了のお知らせ:2019/04/02(火) 03:52:44.33 O.net
--------------
━━━━━━━━━━━━━
本メールはYahoo!ジオシティーズでホームページを開設されていたお客様への重要なご案内です。
最近、Yahoo!ジオシティーズの有料プランを利用停止されたお客様、ならびにホームページをすでに移行されたお客様へもお送りしております。
また、Yahoo!JAPANIDにご登録の連絡用メールアドレスとYahoo!メールアドレスの両方に送信しておりますため、内容が重複することをご容赦ください。
お心当たりがない方は、お手数ですが破棄をお願いいたします。
━━━━━━━━━━━━━━
daylightkeep様

いつもYahoo!JAPANをご利用いただきありがとうございます。

以前よりご案内しておりました通り、2019年3月31日をもって
Yahoo!ジオシティーズのサービスを終了いたしました。

Yahoo!ジオシティーズを長きに渡りご愛顧いただき、
誠にありがとうございました。

お客様がYahoo!ジオシティーズで開設されていたホームページは
すでに公開を停止しており、管理ページからの編集などが行えない
状態となっております。

これからホームページの移行作業を行う場合は、お手数ですが
以下のページに記載の「ホームページやドメインの移行方法」や
「よくあるご質問」をご確認のうえご対応くださいますよう
お願いいたします。

◇Yahoo!ジオシティーズサービス終了のお知らせ
https://yahoo.jp/gWXYkq

【ご注意ください】
2020年4月1日になりますと、Yahoo!ジオシティーズで保存している
すべてのデータが削除されますので、早めのご対応をお願いいたします。

長い間Yahoo!ジオシティーズをご利用いただき、誠にありがとうございました。

━━━━━━━━━━━━━━━━━━━━
お問い合わせは、お手数ですが下記のページからお願いいたします。

◇Yahoo!ジオシティーズヘルプ
https://www.yahoo-help.jp/app/home/p/549/
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

□発行:ヤフー株式会社
□住所:東京都千代田区紀尾井町1番3号
□編集:Yahoo!ジオシティーズ
□発行日:2019年4月1日
□Yahoo!JAPANプライバシーポリシー
https://about.yahoo.co.jp/docs/info/terms/chapter1.html#cf2nd

18 :ガラケー:2019/04/02(火) 03:58:54.25 O.net
タイトル:
Yahoo! JAPAN
URL:
https://secure.softbank.ne.jp/secure.mobile.yahoo.co.jp/p/portal/notice/view


Yahoo! JAPAN

お知らせ
携帯電話版サービス提供終了のお知らせ
いつもご利用いただき、ありがとうござます。
このたびYahoo! JAPANでは、近年におけるインターネット利用環境の変化や、ユーザーの皆さまの利用状況を踏まえて検討を重ねた結果、2019年5月7日をもって携帯電話版のサービス提供を終了させていただくことにいたしました。

サービス終了以降は、携帯電話版Yahoo! JAPANトップページのほか、Yahoo!検索、Yahoo!ニュース、Yahoo!天気・災害のすべてのページにアクセスできなくなります。

19 :ガラケー:2019/04/02(火) 04:02:30.33 O.net
※ソフトバンクの携帯電話向け「Yahoo!ケータイ」トップページは引き続きご利用いただけます。

現在サービスをご利用いただいている皆さまには、多大なご不便をおかけすることとなり、誠に申し訳ございません。
2000年のサービス開始以

20 :ガラケー:2019/04/02(火) 04:04:15.50 O.net
2000年のサービス開始以来、長年ご愛顧いただき、ありがとうございました。スタッフ一同お礼申し上げます。

Yahoo! JAPANでは、これからも皆さまの生活がより便利で豊かになるサービスを提供してまいります。
今後は、スマートフォンやパソコンにて引き続きご利用いただければ幸いです

(2019年03月04日)
ナYahoo!トップ
ご意見・ご要望

21 :名無しさん@お腹いっぱい。:2019/04/02(火) 04:06:54.41 O.net
知恵ノート廃止
●知恵袋任意削除可能
●知恵ノート撤廃

次はヤフーブログの縮小にかかるらしいし、なんでこんなに縮小してんの?

22 :名無しさん@お腹いっぱい。:2019/04/02(火) 11:31:07.68 0.net
>>21
金と人手が足りないんでしょ

23 :名無しさん@お腹いっぱい。:2019/04/02(火) 12:08:43.87 0.net
>>15
この作業を皆でやれればまだある程度は取り返せるはずなんだよな
GeoLog Projectはもうアーカイブ作業を終了したと告知してたけど、できればGoogleのキャッシュを集める作業は続けてほしい ArchiveTeamの集めたデータにもなんだかんだ言って結構漏れがある

24 :名無しさん@お腹いっぱい。:2019/04/02(火) 13:14:00.16 0.net
>>15 >>23
GeoLog Project >>2 で行き当たらなかったURL

http://www.geocities.co.jp/SiliconValley-Cupertino/6708/fujitsu.html
http://www.geocities.co.jp/SiliconValley-Cupertino/6708/fujitsu_list.html

----------

http://www.geocities.jp/le_grand_concierge/
# Webページとしての例は、
http://www.geocities.jp/le_grand_concierge/_geo_contents_/Fujitu/MPG3409AT_2.htm
http://www.geocities.jp/le_grand_concierge/_geo_contents_/ST34342A/ST34342A.htm
# など。

25 :名無しさん@お腹いっぱい。:2019/04/02(火) 14:15:56.40 0.net
list.txtのサイトを保存してたという人、早くこのスレに来てくれ...

26 :名無しさん@お腹いっぱい。:2019/04/02(火) 15:57:05.89 0.net
Hatenaみたいな小さい会社でも『はてな ダイアリー』は閲覧は可能なままだし後継サービスの『Hatenaブログ』は続けているしサービス続けてんのになんだろうyahooジャパンは?

次は何のサービスを止めるんだろうYahooは

27 :名無しさん@お腹いっぱい。:2019/04/02(火) 16:01:18.87 0.net
ブログでしょ
あっちもアーカイブするなら早めに取り掛かったほうがいいな

28 :名無しさん@お腹いっぱい。:2019/04/02(火) 17:41:24.98 O.net
古典だって全てが保存された訳ではない。
残らずに歴史から消えた物も存在したはずだ。

なのに、なんで現代の法律を無視して
残そうとしなくてはならないのか?

29 :名無しさん@お腹いっぱい。:2019/04/02(火) 17:58:34.71 0.net
その文脈だと「なのに」が正常に機能してないことに気づけ

30 :名無しさん@お腹いっぱい。:2019/04/02(火) 18:57:08.25 0.net
ガラケー専用サイトとか有料サイトのデータは、サ終したら完全に消える事に成るかも(・・?

31 :名無しさん@お腹いっぱい。:2019/04/02(火) 18:59:15.29 0.net
国民的文化遺産が失われたんだ

32 :名無しさん@お腹いっぱい。:2019/04/02(火) 19:08:24.49 0.net
日本が遅れてるだけ
アメリカならこれはフェアユースだよ

ちなみに自分のサイトがアーカイブされたくないなら削除要請できるよ
archive.today は削除してくれないけどね

33 :名無しさん@お腹いっぱい。:2019/04/02(火) 19:27:41.06 0.net
>>27
ブログはコメント欄があるからもっと大変
ヤフーブログみたいに広告貼れなくて昔からあるとこは、常連とコメントでやり取りしてるのが多い

34 :名無しさん@お腹いっぱい。:2019/04/02(火) 19:52:39.43 0.net
出羽守は消えて、どうぞ

35 :名無しさん@お腹いっぱい。:2019/04/02(火) 20:21:06.99 0.net
まるごと移管してくれとは言わないからせめて来年の期限までweb.archive.orgへのアーカイブのみ可能にしてほしいわ

36 :名無しさん@お腹いっぱい。:2019/04/02(火) 20:45:15.42 0.net
>>32

こういうスマホ万能厨的なバカw

37 :GeoLog Project :2019/04/02(火) 20:48:35.53 0.net
>>23
キャッシュのURL等があれば手動で個別回収はできますが、
Googleキャッシュは機械的にリンクをたどっての回収はできない(何か識別符号みたいなのがついてる)
気がするので、ちょっと厳しい気がします

>>25
list.txt の管理をされていた方が、そのままアーカイブの作業もされていました
時期は未定ですが、アーカイブされたデータを頂いて、GeoLogにマージする計画です

38 :185:2019/04/02(火) 21:14:24.29 0.net
毎日ではないですが、スレはちょこちょこ見てますよー。
>>37 の通り、こちらはこちらでアーカイブを作成してます。

>>24
今確認したら、下記の2つは私のアーカイブでは存在してました。
http://www.geocities.co.jp/SiliconValley-Cupertino/6708/fujitsu.html
http://www.geocities.co.jp/SiliconValley-Cupertino/6708/fujitsu_list.html

残りの2つは残念ながら手元にはなかったですが、下記URLは無事アーカイブされているのを確認しました。
le_grand_concierge/_geo_contents_/JaakuAmerika/AmeKen1.html
le_grand_concierge/_geo_contents_/WinXPOwnerChange/WinXPOwnerChange.html

まだちょっと先になるとは思いますが、GeoLogさんの所にマージ予定です。

39 :名無しさん@お腹いっぱい。:2019/04/02(火) 23:23:03.04 0.net
余計なお世話だけど、185氏もトリップ付けたらどうだろう
万が一本人確認が必要になった時に備えてさ

40 :名無しさん@お腹いっぱい。:2019/04/02(火) 23:30:43.05 0.net
一部手動で絶対パス直したりBASEをコメントアウトしたりしちゃったんだがこれGeoLogさん貰っても困るかな
編集前にバックアップ取っときゃよかった

41 :名無しさん@お腹いっぱい。:2019/04/02(火) 23:42:51.62 0.net
>>40
とりあえずどの辺を弄ったかの説明を付けてGeoLogさんに保管してもらったら?

42 :GeoLog Project :2019/04/02(火) 23:57:59.21 0.net
>>40
どのあたりを直したかにもよりますが、相対パス化であればGeoLogでもやってますので、
>>41 さんのコメント通り、説明付きで頂ければ助かります
(そのまま使えるかは見てみないと分かりませんが…)

43 :名無しさん@お腹いっぱい。:2019/04/03(水) 00:13:05.49 0.net
>>41,42
ありがとうございます、とりあえずできる限り変更点まとめておきます

44 :名無しさん@お腹いっぱい。:2019/04/03(水) 00:17:14.18 0.net
おもしろいね
https://thaliana.mydns.jp/GeoLog/www.geocities.co.jp/HeartLand/2105/

45 :名無しさん@お腹いっぱい。:2019/04/03(水) 00:33:44.65 0.net
>>15
thx
なるほど、わからん

46 :名無しさん@お腹いっぱい。:2019/04/03(水) 00:34:38.47 0.net
https://thaliana.mydns.jp/GeoLog/www.geocities.co.jp/HeartLand/2143/

47 :名無しさん@お腹いっぱい。:2019/04/03(水) 00:42:22.00 0.net
なかなか
https://thaliana.mydns.jp/GeoLog/www.geocities.co.jp/Bookend/1001/

48 :名無しさん@お腹いっぱい。:2019/04/03(水) 01:47:14.39 0.net
>>18
ガラケー全部終了とは・・・
まだまだ使ってる人も多いのに

ガラケーといえばガラケーで作ったホームページも歴史資料になると思う
終了したサービス多いけど続いてるところもある
ジオはある程度大人が作ってたけど携帯サイトは当時の若者文化
このスレ住民には需要ないかな

>>21
知恵ノートって何だっけ?
何年か前に終了した知恵袋の補足書いてる人多かったやつ?

>>26
どうなんだろうね(´・ω・`)

49 :名無しさん@お腹いっぱい。:2019/04/03(水) 02:09:20.53 0.net
>>34 >>36
フェアユースって知ってる?
まずは投稿内容をちゃんと理解してから返信しようね

50 :名無しさん@お腹いっぱい。:2019/04/03(水) 02:23:25.31 0.net
和塩の自サイトをグーグルキャッシュで閲覧したら画像が全て空欄になった
画像検索経由だとキャッシュがまだ残ってる。(site:指定で画像検索)

51 :名無しさん@お腹いっぱい。:2019/04/03(水) 02:34:04.29 0.net
ガラケー用関連のデータは9割ぐらい既に失われてるイメージ

52 :名無しさん@お腹いっぱい。:2019/04/03(水) 02:39:35.76 0.net
昔流行ったケータイ小説とかって今でも読めるの?

53 :名無しさん@お腹いっぱい。:2019/04/03(水) 03:27:05.10 0.net
>>50
キャッシュ関連は使いにくいね

54 :名無しさん@お腹いっぱい。:2019/04/03(水) 06:18:23.25 0.net
>>2
ここに行けば、まだジオシティーズのホームページが見られてとても嬉しいです

55 :名無しさん@お腹いっぱい。:2019/04/03(水) 07:26:59.17 0.net
魔法のiランド

56 :Project Pigeonhole :2019/04/03(水) 11:42:16.04 0.net
GeoLog Projectさん、geo.98nx.jpさん、その他の名無しの皆様、本当にお疲れさまでした。
私の個人的事情でアーカイブ作業を続けられなくなってしまい、申し訳ありませんでした。大したお手伝いが出来なかった自分が不甲斐ないです。
GeoLog Projectさんの元にマージされたデータは、私の個人的事情が片付き次第全て私がバックアップする予定です。

57 :名無しさん@お腹いっぱい。:2019/04/03(水) 11:52:08.61 0.net
>>49
当然知ってますよ日本の法律にはないものです
だから出羽守は消えて、どうぞ

58 :名無しさん@お腹いっぱい。:2019/04/03(水) 12:14:18.35 0.net
日本の著作権法にフェアユースの規定はないわけだから、引き合いに出してもしょうがないのは確か
でもウェブアーカイブ自体は違法でも何でもないぞ?
公開はグレーゾーンだけど保存すること自体は白

59 :185 :2019/04/03(水) 12:56:02.68 0.net
>>39 確かにそろそろトリップ付けた方がいいですね。これで行きます。

60 :名無しさん@お腹いっぱい。:2019/04/03(水) 15:37:04.31 0.net
>>24 に追加
GeoLog Project >>2 で行き当たらなかったURL

http://www.geocities.jp/jabiranet/se/cecile.htm

61 :名無しさん@お腹いっぱい。:2019/04/03(水) 15:44:45.43 0.net
>>24 に追加
GeoLog Project >>2 で行き当たらなかったURL

http://www.geocities.jp/radiomann/HomePageRadio/Radio_Company.html

62 :名無しさん@お腹いっぱい。:2019/04/03(水) 16:50:45.78 0.net
>>24 に追加
GeoLog Project >>2 で行き当たらなかったURL

http://www.geocities.jp/lion_maru0305/top.htm

63 :185 :2019/04/03(水) 20:42:08.02 0.net
>>60-62
新ジオの方はGeoLogさんでアーカイブが追いつかないという事で私の方で主に作業しています。
なのでマージされるまでは結構歯抜けがあると思います。
特に新区分のページで見当たらない物の報告はそれからにしてもらえると。。。
(本家はもう見れなくなってるので、今更急ぐ事もないでしょうし。)

ちなみにその3サイトは私の手元のアーカイブで存在しているのを確認しました。

64 :名無しさん@お腹いっぱい。:2019/04/03(水) 21:09:12.91 0.net
>>63
> 特に新区分のページで見当たらない物の報告はそれから
漏らし・取りこぼしを検索キャッシュからサルベージ補完 >>15 >>23
するとしたら逆に、キャッシュが消えないうちに急いだほうがいいのでは?

65 :名無しさん@お腹いっぱい。:2019/04/03(水) 21:44:56.34 0.net
>>64
>>37

アーカイブとはそんなに関係ないけど185氏に質問
保存したアーカイブの量は総計でどれくらいでした?

66 :名無しさん@お腹いっぱい。:2019/04/03(水) 22:19:55.07 0.net
テックベンチャー革命って結構有名な筈のサイトなのに、ウェイバックマシンにもGoogleキャッシュにも無いのか…

http://www.geocities.co.jp/SiliconValley-Oakland/1386/ATT00019.htm

67 :名無しさん@お腹いっぱい。:2019/04/03(水) 22:28:47.59 0.net
>>66
そのページはGeoLogにあったよ

68 :185 :2019/04/03(水) 22:34:23.07 0.net
>>64
とりあえず、今は完了したアーカイブの整理(圧縮&バックアップ、フルパスの相対パス化、ウイルス・マルウェアのスキャン)などで手一杯で、キャッシュまでは手が回りそうにないです。
とはいえ何も情報を出せないのもどうかと思うので、近日中に私のアーカイブのHTM/HTMLファイルリストを作成して公開しようと思います。
リストのテキストファイルは進捗が半分くらいだと思うのですが、既に4953830行、260MBに達していて、最終的にはその倍の行数になりそうです...。

ちなみにリストは
1st.geocities.jp/AAA/index.html
1st.geocities.jp/AAA/top.html
1st.geocities.jp/AAA/subdir/index.htm
....
というようにhtm/htmlがテキストで一覧されています。(単にgrepしているだけなので、html.jpgみたいなゴミも多少は混ざってます)

リストが公開できたら、誰かURLがリストに載ってるかどうかを確認するサイト作ってくれたら嬉しいな...

>>65
新ジオの他に旧ジオも一部混ざっていて総容量は2.1TB
ファイル数(i-node)がおおよそ55831126くらいって所です。

69 :名無しさん@お腹いっぱい。:2019/04/03(水) 22:56:32.29 0.net
>>68
原本をwarc化してIAに提出する予定はありますか?

70 :GeoLog Project :2019/04/03(水) 23:49:23.46 0.net
>>60-62
アーカイブはされていてもまだアクセスできない状態のデータは
数100GB単位であるので、準備ができるまでしばしお待ちください
ちなみに>>61 はこちらのアーカイブにもあるようです

71 :名無しさん@お腹いっぱい。:2019/04/04(木) 00:40:18.44 0.net
>>69
IA は Wayback Machine 内へ受け入れてくれるの?
それともアイテムとして保存されるだけ?

72 :名無しさん@お腹いっぱい。:2019/04/04(木) 01:10:25.47 0.net
>>1
ふえぇぇぇん(>_<)

73 :名無しさん@お腹いっぱい。:2019/04/04(木) 01:21:43.29 0.net
chrome_cache_viewってソフト、作業中焦ってたせいで見落としてたがこれコマンドライン使えばキャッシュのファイルの元URLをリスト化出来たのか・・・もっとじっくり見れば良かった

74 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:18:03.30 0.net
総容量は2.1TB

たったの  あきれた  個人サーバーでも楽勝

75 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:20:30.82 0.net
しかし番地ごとに見ていたら
まともにホームベージ作ってるのは20件に1件くらいだった。

76 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:41:15.14 0.net
別会社にサービス移行するのとか検討しなかったのかねぇ

ちなみにmixi閉鎖とかTwitterサービス終了するとなったらこれのログ収集するかと言われると自分はしないなぁ…今回みたいな熱意が湧かない

77 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:46:55.73 0.net
グーグル検索「site:www.geocities.co.jp "web.fc2.com"」を行い
タイトル末尾に「fc2」がついてる結果の「キャッシュ」を見ると
『これは Google に保存されている http:// 〜 web.fc2.com/ のキャッシュです』
アドレスが和塩からfc2へ自動付け替えする機能。興味深いのは転送設定しなかった失効組が主にそうなってる

78 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:47:27.20 0.net
>>76
SNSは流石に保存する価値のないノイズが多すぎるなぁ・・・Google+はArhiveTeamがやってたらしいけど
https://www.reddit.com/r/plexodus/comments/az285j/saving_of_public_google_content_at_the_internet/

79 :名無しさん@お腹いっぱい。:2019/04/04(木) 02:59:09.66 0.net
ArhiveじゃねえやArchiveだ
そういえばArchiveTeamでいろいろソフトウェア紹介してるのな
https://www.archiveteam.org/index.php?title=Software

80 :名無しさん@お腹いっぱい。:2019/04/04(木) 05:03:40.20 0.net
どうして俺は終わってから便利なものの存在に気付いてしまうの
https://github.com/iipc/awesome-web-archiving/blob/master/README.md#tools--software
https://docs.google.com/spreadsheets/d/1FqxwaZnIhhQ7jDCC-W64NMRf5rDeh2Shx3u01MsBmTQ/htmlview#

81 :名無しさん@お腹いっぱい。:2019/04/04(木) 05:20:32.58 0.net
使うならIA公式のHeritrixかな

82 :名無しさん@お腹いっぱい。:2019/04/04(木) 08:17:01.76 0.net
IAにsaveできるならそれを使うだろう。
wgetだと絞り込むのに一旦ローカル保存する必要あるらしいし。
手動でURLリスト作って再帰無し保存なら使えるがリスト作るのは普通に苦行だ。
wgetでyahoo blogをsaveすると時々400が返ってくるが、この時エラーがIAに保存されてしまっているのでログからURL特定して手動で保存し直せばよさげ。
記事だけならともかくコメント等も含めると手動リスト作るのも挫けそう。

83 :名無しさん@お腹いっぱい。:2019/04/04(木) 10:30:03.34 0.net
>>82
Yahoo ブログについては失敗を繰り返さないためにもArchiveTeamの方でプロジェクトを作ったほうがいい
日本のサイトは全然知られてないからこれで外人の助っ人を集めるしかない
このスレだけだと技術力が足りないし、個人アーカイブは信頼性が低すぎる

84 :名無しさん@お腹いっぱい。:2019/04/04(木) 11:19:22.28 0.net
wikipediaで出典がジオシティーズになっている情報が結構多いらしいから、日本語版wikipediaのトップを説得してウィキペディア発のweb.archive.orgからジオシティーズFTPへのアクセスを許可するキャンペーンを試みるのもありかもしれない。

85 :Project Pigeonhole :2019/04/04(木) 11:33:10.97 0.net
>>84
日本語版Wikipediaに貼られているジオシティーズのリンクは、185さんと私が全てlist.txtに登録したはずだったと思います

86 :名無しさん@お腹いっぱい。:2019/04/04(木) 11:45:06.07 0.net
>>83
このスレで英語の出来る人がArchiveTeamに入るしかないのか

87 :名無しさん@お腹いっぱい。:2019/04/04(木) 11:45:23.97 0.net
>>84-85
Wikipediaの出典として使えるのはInternet Archiveなどの信頼できるアーカイブだけ
結局は出典を消すかヤフーにわがまま言うかどちらかしかないね
https://ja.wikipedia.org/wiki/Wikipedia:%E5%87%BA%E5%85%B8%E3%82%92%E6%98%8E%E8%A8%98%E3%81%99%E3%82%8B#%E3%83%AA%E3%83%B3%E3%82%AF%E5%88%87%E3%82%8C%E3%81%AE%E5%9B%9E%E9%81%BF%E3%81%A8%E4%BF%AE%E5%BE%A9

88 :名無しさん@お腹いっぱい。:2019/04/04(木) 11:47:56.61 0.net
>>86
ジオシティーズのアーカイブを担当したhiroiさんが協力してくれればつよい
日本人ユーザの知識とArchiveTeamの技術力があれば完璧

89 :名無しさん@お腹いっぱい。:2019/04/04(木) 11:49:47.51 0.net
>>84
jawpの管理者勢は頭固いのばっかりだから無理だよ
許可されるはずがない

90 :名無しさん@お腹いっぱい。:2019/04/04(木) 13:08:30.62 0.net
多分ATはこれ使っているのではないかと思われる。俺はIRC使ったことないのでよくわからんが。

ArchiveBot - Archiveteam
https://www.archiveteam.org/index.php?title=ArchiveBot

91 :名無しさん@お腹いっぱい。:2019/04/04(木) 14:01:20.96 0.net
Yahooブログの本スレはなかったから、ブログ板あたりにアーカイブ活動のスレを立てた方がいいな
このスレの住人のジオシティーズアーカイブで得られた知見とArchive Teamとの連携があればなんとかなるはず

92 :名無しさん@お腹いっぱい。:2019/04/04(木) 15:14:01.03 0.net
貴重なサイトは大半が引っ越ししたので
ジオに残ったのはジジイの旅行記とか日記、価値なし。

93 :名無しさん@お腹いっぱい。:2019/04/04(木) 15:19:14.10 0.net
Yahoo! ブログにエクスポート機能なし とかマジですか 嫌な会社ですな

94 :名無しさん@お腹いっぱい。:2019/04/04(木) 15:33:23.45 0.net
>>92
あなたが知らないだけで価値があるけど移転しなかったところは一杯あるよ

95 :名無しさん@お腹いっぱい。:2019/04/04(木) 15:36:03.36 0.net
この移行ツールがどれほどなのかによるね
コメントは無理だろうなあ

https://promo-blog.yahoo.co.jp/close/index.html
現在、他社ブログサービスへの移行ツールを準備中です。
5月9日より提供開始いたしますので、その際改めて詳細をこちらでご案内いたします。
お待たせいたしまして、大変恐縮ではございますが、 今しばらくお待ちいただけますよう
よろしくお願いいたします。

96 :名無しさん@お腹いっぱい。:2019/04/04(木) 17:38:03.05 0.net
>>24
http://www.geocities.jp/kotsusozosha/

97 :185 :2019/04/04(木) 20:30:20.14 0.net
アーカイブ済みのURLリストです。
なお、0バイトの空ファイルは除外しています。
ttps://www.axfc.net/u/3970589

98 :名無しさん@お腹いっぱい。:2019/04/04(木) 21:31:28.94 0.net
スレ立てたのでYahoo!ブログの話題はこちらでお願いします
https://mevius.5ch.net/test/read.cgi/blog/1554380939/

99 :名無しさん@お腹いっぱい。:2019/04/04(木) 23:17:20.89 0.net
>>97
すげぇや・・・html以外も入れたらどうなってしまうんだ

100 :名無しさん@お腹いっぱい。:2019/04/04(木) 23:29:07.71 0.net
>>97
ログファイル以外で680MBもあるテキストファイルなんて初めて見たよ、すごい量ですね

284 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★