2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【保存・記録】ウェブアーカイブ総合 Page.01

1 :192.168.0.774:2019/04/06(土) 21:31:22.29 ID:KqAD+H9+0.net
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

2 :192.168.0.774:2019/04/06(土) 21:44:40.44 ID:ToHayX3A0.net
いちおつ

3 :192.168.0.774:2019/04/06(土) 22:53:39.40 ID:khb0d4nX0.net
>>1 乙です

4 :192.168.0.774:2019/04/06(土) 22:57:35.43 ID:C58mCeVw0.net
なんか、良く解ってない奴がスレ立てた感がもりもり

5 :192.168.0.774:2019/04/06(土) 23:08:18.32 ID:W+Cd7+OG0.net
随分ふんわりとした否定だな

6 :192.168.0.774:2019/04/07(日) 00:26:33.03 ID:8q7+ly+v0.net
スレ立てする時に5chの使い方と日本語以外に解ってなきゃいけないことがあるなんて初めて聞いた

7 :192.168.0.774:2019/04/07(日) 06:32:56.08 ID:rvx0PlzU0.net
サービスの使い方、お知らせなど
日経トレンディネットは3月31日に更新終了、日経クロストレンドへ統合します
https://trendy.nikkeibp.co.jp/atcl/manual/15/1048699/022200013/
2019年03月01日
既存の「日経トレンディネット」の記事は、4月以降、順次閲覧ができなくなり、6月30日にはすべての記事の閲覧ができなくなります(一部は「日経クロストレンド」で閲覧可能です)。
長い間のご利用、ありがとうございました。

8 :192.168.0.774:2019/04/07(日) 06:55:45.40 ID:rvx0PlzU0.net
2019年8月15日(木) niconareサービス終了について
https://blog.nicovideo.jp/niconews/104611.html

4月11日(木) 投稿者向けのデータダウンロード機能の提供

投稿者の方がご自身の投稿いただいたスライドや、
スライドについたコメントをダウンロードできる機能を提供いたします。

この機能はniconareのサービス終了日までご利用いただくことができます。

7月18日(木) スライドの投稿、およびコメント投稿機能の提供終了

これ以降はスライドの視聴および、
投稿済みスライド情報の編集のみ行うことができます。

9 :192.168.0.774:2019/04/07(日) 06:58:08.86 ID:rvx0PlzU0.net
今後、はてなグラフ、ポケットはてななど、複数のサービスの提供を終了する予定です
http://hatena.g.hatena.ne.jp/hatena/20180911/1536650034

終了予定
はてなグラフ ( http://graph.hatena.ne.jp )
はてな認証 ( http://auth.hatena.ne.jp )
はてな検索 ( http://search.hatena.ne.jp )
はてなMobileGateWay ( http://mgw.hatena.ne.jp )
ポケットはてな ( http://mobile.hatena.ne.jp)
各サービスのフィーチャーフォン向けの機能・サポート
はてなキーワードAPI ( http://developer.hatena.ne.jp/ja/documents/keyword )
はてなメッセージAPI ( http://developer.hatena.ne.jp/ja/documents/message )
はてなポイント送信機能

10 :192.168.0.774:2019/04/07(日) 07:11:15.82 ID:4ZacPRRJ0.net
最近は本当にサービス終了多いな・・・

11 :192.168.0.774:2019/04/07(日) 07:32:13.57 ID:rvx0PlzU0.net
https://www.cabling-ol.net/cabledirect/news/news190401-1.php
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトの閉鎖日時が決まりましたのでお知らせいたします。  
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトは、2019年5月31日(金曜日)の午後12時をもって閉鎖することとさせていただきますので、お知らせいたします。

12 :192.168.0.774:2019/04/07(日) 07:37:42.65 ID:rvx0PlzU0.net
Adobe Flashのサポート終了まであと2年。消えゆくFlashゲームを保存する「Flashpoint」の登録作品がリリースから1年で1万タイトルを超える
https://news.denfaminicogamer.jp/news/181225g

歴史の中に消えようとするデジタルコンテンツを収集し保存するボランティア団体「Archive Team」に所属するBen Latimore氏が、終焉の危機にひんしているFlashゲームを収集し、誰もがプレイできるプラットフォーム「Flashpoint」を公開してから1年が経つ。

13 :192.168.0.774:2019/04/07(日) 07:40:18.59 ID:rvx0PlzU0.net
パブー閉店に伴うブクログからのお知らせ
http://info.booklog.jp/?eid=1007

【パブー・サービス終了までのスケジュール】
2019年6月30日(日) パブー新規作品の作成・公開の停止、プロ版サービス終了、新規会員登録停止
2019年9月30日(月) パブー閉店(商品販売の終了)
2019年10月1日(火)ブクログでのパブー検索終了
2019年11月30日(土) パブー側のログイン機能の停止
2019年12月1日(日)ブクログ本棚のパブー発行書籍の書影の非表示化

14 :192.168.0.774:2019/04/07(日) 07:48:48.33 ID:kQbvec6m0.net
>>10

儲からないからね

15 :192.168.0.774:2019/04/07(日) 09:57:35.03 ID:4ZacPRRJ0.net
とりあえずニコナレ1ページ保存してみたけどやっぱ動的?なサイトだとそう簡単には動いてくれないな
https://web.archive.org/web/20190407004022/https://niconare.nicovideo.jp/watch/kn4316
専門的な知識無いからわかんないや

>>14
情報集めといて一気に消滅させるのやめてほしいわ・・・
結局どのサイトも最終的には消えて無くなるんだろうけどさ

16 :192.168.0.774:2019/04/07(日) 10:38:53.84 ID:8q7+ly+v0.net
【魚拓】とか【Internet Archive】とかスレタイに付けないと検索にひっかからなさそうな気がするわ
立て直した方が良いんじゃないの?

17 :192.168.0.774:2019/04/07(日) 10:55:17.23 ID:rvx0PlzU0.net
Janne Da Arc オフィシャルファンクラブ「マドモアゼルなあなた達」会員の皆様へ
Janne Da Arc解散に伴うファンクラブ解体のお知らせ
https://fanclub.janne.co.jp/

18 :192.168.0.774:2019/04/07(日) 11:20:57.88 ID:rvx0PlzU0.net
【サイト閉鎖のお知らせ】睡眠情報メディア・フミナーズ
https://fuminners.jp/journal/entertainment/16241/

睡眠情報メディア・フミナーズは、2019年3月末日をもって全ての記事の更新をストップし、準備が整い次第、サイトを閉鎖することとなりました。

19 :192.168.0.774:2019/04/07(日) 12:11:36.84 ID:ddJkY//e0.net
おまんこ

20 :192.168.0.774:2019/04/07(日) 13:56:52.92 ID:PI3RUhLx0.net
【意図しないデータ消失事故にアーカイブが活かされた事例】

・2019年3月18日
2003年にサービスを開始して以来、2億人以上のユーザー数を誇っていた米音楽系SNS「Myspace」が、
過去12年間に投稿された写真、動画、音声の全てのファイルをサーバー移行失敗により消失したと発表。

これにより1400万組のアーティストによる5000万以上も楽曲が損失したこととなり、世界各地では亡くなった友人や家族との思い出が消えてしまったなどという悲痛の声があがった。


・2019年4月1日
インターネット・アーカイブが「MySpaceが消失した音楽ファイルのうち、約50万曲が匿名の学術グループによって提供された」と発表し、そのファイルを公開した。
喪失した音楽ファイル全体の1%にも満たない曲数ではあるが、復旧したデータ量は1.3TBにも及ぶ。
今後の第三者によるデータ提供に注目が集まっている。


Myspaceの喪失データのうち約50万件の音楽ファイルが学術グループにより復活
https://gigazine.net/news/20190405-recover-half-million-myspace-songs/

21 :192.168.0.774:2019/04/07(日) 14:30:36.57 ID:rvx0PlzU0.net
2019.02.26 サービス終了のお知らせ
http://www.mapfan.net/news/index.html#190226

平素は「MapFan.net」をご愛顧頂きまして、誠にありがとうございます。

「MapFan.net」は、2020年3月31日をもちましてサービス終了させて頂きます。
ユーザーの皆様には大変ご迷惑をおかけ致しますが、何卒ご理解賜りますようお願い申し上げます。

サービス終了に伴い、2019年2月26日時点で「通常版」*1をご利用中のユーザー様につきましては、有効期限を2020年3月31日まで延長させて頂きました。
サービス終了までご利用頂けますので、継続利用手続きの必要はございません。
なお、新規購入につきましては、サービス終了する1年前の2019年3月31日をもちまして、お手続きを停止致しました。

また、「MapFan.net」は終了致しますが、今後は、MapFanプレミアム会員向けサービス *2の中で、パソコン用地図ソフトをご利用いただけるよう準備しております(2019年度中予定)。

22 :192.168.0.774:2019/04/07(日) 14:38:15.11 ID:rvx0PlzU0.net
全サービス終了のお知らせ | DNSを自由に簡単に。Dozens(ダズンズ)
https://dozens.jp/close/

サービス終了までのスケジュール
・2019年3月1日(金)
新規会員登録・有料プランへのアップグレード受付終了
・2019年9月30日(月)
コントロールパネル・APIの停止
・2019年10月31日(木)
DNSサーバーの停止・サービスの完全終了

23 :192.168.0.774:2019/04/07(日) 17:43:24.63 ID:FMiv5iU/0.net
>>16

同意する

24 :192.168.0.774:2019/04/07(日) 18:13:55.69 ID:PI3RUhLx0.net
色々なサイトの情報が集まってきているからwikiとかがあった方がいいかもね

25 :192.168.0.774:2019/04/07(日) 20:26:45.76 ID:8q7+ly+v0.net
【Internet Archive】ウェブアーカイブ総合 Page.01【ウェブ魚拓】
のスレタイで立て直すけどいい?

26 :192.168.0.774:2019/04/07(日) 20:39:47.53 ID:R6TrddMD0.net
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】
こっちのほうが見やすいかも

27 :192.168.0.774:2019/04/07(日) 20:41:13.58 ID:8q7+ly+v0.net
>>26
そっちの方がいいね

28 :192.168.0.774:2019/04/07(日) 21:03:08.45 ID:5OnOP9Lv0.net
テンプレのURL中のカンマも何とかしろよ
要らんものにも付いてるし、大文字を使うだけで回避できるのもある

29 :192.168.0.774:2019/04/07(日) 21:21:30.37 ID:PI3RUhLx0.net
archive.today は https じゃなくて httpだぞ

30 :192.168.0.774:2019/04/07(日) 21:22:54.38 ID:PI3RUhLx0.net
これでも回避できるかな
http://archive%2efo/
http://archive%2eis/
http://archive%2etoday/

31 :192.168.0.774:2019/04/07(日) 21:47:48.30 ID:8q7+ly+v0.net
これでいいかな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

32 :192.168.0.774:2019/04/07(日) 21:55:01.17 ID:PI3RUhLx0.net
(Rock54回避のためピリオドをカンマに変更)が消えてないよ

33 :192.168.0.774:2019/04/07(日) 22:01:00.95 ID:8q7+ly+v0.net
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

34 :192.168.0.774:2019/04/07(日) 22:15:14.47 ID:5OnOP9Lv0.net
http://Archive.is/

35 :192.168.0.774:2019/04/07(日) 22:22:56.39 ID:8q7+ly+v0.net
>>33-34でスレ立てるけど良いよね?

36 :192.168.0.774:2019/04/07(日) 22:37:00.78 ID:PI3RUhLx0.net
テンプレ3つと比較したら圧倒的に認知されてないけど一応この2つのアーカイブサイトもある

WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st

37 :192.168.0.774:2019/04/07(日) 23:14:50.73 ID:8q7+ly+v0.net
>>36
これも追加しておくわ

38 :192.168.0.774:2019/04/08(月) 00:10:23.59 ID:csp1RLRO0.net
これ以上意見なさそうなんで立て直してくる

39 :192.168.0.774:2019/04/08(月) 00:16:32.72 ID:csp1RLRO0.net
本文はこれにする
ただスレタイの文字数制限に引っ掛かってしまったんでどこか削らないと駄目だな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

40 :192.168.0.774:2019/04/08(月) 00:34:32.72 ID:kFS6Xl/I0.net
ジオシティーズ消える前に立てないあほ

41 :192.168.0.774:2019/04/08(月) 00:43:05.43 ID:csp1RLRO0.net
>>40
ジオシティーズスレでのアーカイブ活動の振り返りから生まれたスレらしいのでそれはそう

スレタイだけど、これならインターネット板の制限に収まるはず これで良いよね
ウェブアーカイブ総合【Internet Archive・魚拓】#1

42 :192.168.0.774:2019/04/08(月) 00:45:54.81 ID:HokS2hQ10.net
archive.st はいらんでしょ

43 :192.168.0.774:2019/04/08(月) 00:50:15.61 ID:HokS2hQ10.net
【魚拓】ウェブアーカイブ総合1【Internet Archive】
スレタイこれでもいける

44 :192.168.0.774:2019/04/08(月) 00:54:42.68 ID:csp1RLRO0.net
>>43
この板のスレタイ制限は48バイトなんだが、それは50バイトだからオーバーしてしまう

45 :192.168.0.774:2019/04/08(月) 01:04:44.88 ID:csp1RLRO0.net
>>42
あっても良いんじゃない

46 :192.168.0.774:2019/04/08(月) 02:17:39.24 ID:Lv11LAhu0.net
パート数増える事考えると少し余裕もたせたいね

47 :192.168.0.774:2019/04/08(月) 04:47:52.01 ID:Lv11LAhu0.net
魚拓諦めてIAだけのほうがいいのかな
【InternetArchive】ウェブアーカイブ総合 Page.1
いっそ文字数制限の緩和を申請してみるのもいいかもしれない

48 :192.168.0.774:2019/04/08(月) 06:12:04.28 ID:1L4c/w+i0.net
>>24

あー、そうだな。

誰かにウィキ作ってほしい。

49 :192.168.0.774:2019/04/08(月) 08:07:46.10 ID:1ZNe+OlH0.net
wikiはみんなで作るものだぞ

50 :192.168.0.774:2019/04/08(月) 09:29:10.99 ID:kuGZ5jM70.net
共同編集サイトで有名なのってwiki以外だとgoogleドキュメントくらいか
他に候補ある?

51 :192.168.0.774:2019/04/08(月) 09:37:42.02 ID:csp1RLRO0.net
>>47
文字数制限緩和の申請は賛成だけど、どれくらい待たされるか分からん(そもそも許可されないかも)し、とりあえず>>48のスレタイで立てるよ

52 :192.168.0.774:2019/04/08(月) 09:38:41.30 ID:csp1RLRO0.net
>>48じゃなくて>>41だった

53 :192.168.0.774:2019/04/08(月) 09:41:17.79 ID:kuGZ5jM70.net
【ウェブ魚拓】インターネットアーカイブ総合 #1

一つの案として。

54 :192.168.0.774:2019/04/08(月) 09:44:44.34 ID:Lv11LAhu0.net
立て直す前にwiki作っとかない?
どうせならもうテンプレに突っ込んどいちゃったほうがいいと思うんだけど

55 :192.168.0.774:2019/04/08(月) 13:23:24.39 ID:Gn50FMSd0.net
>>49

最初の設定は誰かが単独で行うだろ。

56 :192.168.0.774:2019/04/08(月) 13:23:40.54 ID:Gn50FMSd0.net
>>54

同意

57 :192.168.0.774:2019/04/08(月) 13:25:37.41 ID:Gn50FMSd0.net
>>1

> Archive Team
> https://archiveteam.org/


これは知らなかった。

58 :192.168.0.774:2019/04/08(月) 13:54:47.88 ID:csp1RLRO0.net
>>53
Internet Archiveのスレと間違われそう

誰かwikiの管理をできる時間がある人がいたらwiki作成宜しく
自分は管理者業務とか無理だわ

59 :192.168.0.774:2019/04/08(月) 14:42:32.50 ID:kuGZ5jM70.net
どこか既存のwikiに専用のページを作るっていう方法もある
アーカイブ関係のwikiがすでにあればそういうところがいいんだけど

60 :192.168.0.774:2019/04/08(月) 17:21:50.82 ID:7Gb6dlTw0.net
一分に一件ずつ保存しても一日1440頁しか保存できない。

61 :192.168.0.774:2019/04/08(月) 18:46:46.19 ID:csp1RLRO0.net
これで立てようとしたけどホスト規制に引っ掛かってしまったので誰か頼んだ

タイトル:ウェブアーカイブ総合【Internet Archive・魚拓】#1
内容:
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズの件から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

・旧スレ
http://mevius.5ch.net/test/read.cgi/internet/1554553882

62 :192.168.0.774:2019/04/08(月) 20:23:02.60 ID:IXy1N+9U0.net
正直そんなに慌てて次スレ建てなくてもいい
このスレでwikiの作成や話し合いを十分にやってから立てればいい

63 :192.168.0.774:2019/04/08(月) 21:41:07.95 ID:csp1RLRO0.net
それもそうか
Wiki作るって言っても無計画にやったら瓦解するだろうし、具体的に何を書く(書いていい)Wikiなのか決めとかないと

64 :192.168.0.774:2019/04/08(月) 23:09:47.96 ID:73UxGWOW0.net
規律と理念、主要なアーカイブサイトのアーカイブリクエスト方法と見方、主要なツールの使い方、アーカイブに便利なソフトウェア一覧、関連リンク集、サービス終了が告知されている中で保存に公益性がありそうなサイト一覧、将来的に保存が必要になりそうなサイト一覧
とか?
多少ArchiveTeamに倣ったほうがよさそう

65 :192.168.0.774:2019/04/09(火) 00:37:25.02 ID:qC7dF5bK0.net
他力本願で技術力が足りない人が多すぎるから、人を集めることも重要だな

66 :192.168.0.774:2019/04/09(火) 01:27:21.91 ID:vAsLhlqU0.net
【12日まで】500円を貰える春のばらまきキャンペーン開催中です     

@ スマホのApp Storeから「プリン(pring)」をインストールする  
A 会員登録を済ませる    
B 下図の通りに進む    
https://pbs.twimg.com/media/D3pIexoU0AY4_so.jpg 
C コードを登録 [5gAYSz]  
    
これで五百円を貰えます  
スマホでセブンATMからお金を下ろせたり便利なアプリですので是非お試し下さい。   

67 :192.168.0.774:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0.net
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?

68 :192.168.0.774:2019/04/09(火) 06:11:46.94 ID:bDBZAOBP0.net
>>67

その二択なのか?

69 :192.168.0.774:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0.net
MediaWiki 一択でしょ

70 :192.168.0.774:2019/04/09(火) 07:42:31.88 ID:aX1j4Hrw0.net
>>64
というか ArchiveTeam の日本語版を作ったほうがいいな
向こうが全てにおいて優れているから自分達で1から始める理由がない
日本支部的な感じで翻訳から始めよう

71 :192.168.0.774:2019/04/09(火) 10:44:41.80 ID:47CWuxog0.net
そのまま日本語化は無理だろうね、法律違うし
アーカイブをまとめてtorrentで配布とかそもそもサイトをアーカイブして勝手に公開することとか
禁止しないといけないこと、解釈を変えないといけないこと色々あるでしょう

72 :192.168.0.774:2019/04/09(火) 12:18:20.83 ID:j/bARIBT0.net
Torrent配布は日本では完全に無理だな
Archive Teamはインターネットアーカイブをデータを提供しているらしいから、それに倣った方がいい

73 :192.168.0.774:2019/04/09(火) 17:30:25.36 ID:ilhSCREf0.net
そういえば少し前にググルマップがゼンリン切ったけど、ゼンリンが提供してた部分以外で何か独自の消失したものってあった?

74 :192.168.0.774:2019/04/09(火) 20:25:46.98 ID:R0ew9YH30.net
このスレってパソコン初心者感がすごいな
このまま進んでも上手くいかないだろうな、というのが見てて分かる

75 :192.168.0.774:2019/04/09(火) 20:40:23.16 ID:TX2XtJeD0.net
随分ふんわりとした否定だな

76 :192.168.0.774:2019/04/09(火) 21:42:02.72 ID:j/bARIBT0.net
初心者っぽいポイントを挙げてみろよ
出来ないならそれは単にイチャモン付けてるだけだぞ

77 :192.168.0.774:2019/04/09(火) 21:51:39.41 ID:j/bARIBT0.net
×初心者っぽいポイント
○上手くいかないであろう根拠

逆に聞くが>>74はどうやったら上手くいくと思うよ?

78 :192.168.0.774:2019/04/09(火) 22:06:36.56 ID:Ybc45mGn0.net
適当に作ったブックマークレット各種
google cache化
javascript:{window.open('http://webcache.googleusercontent.com/search?q=cache:'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/submit/?url='+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}

GeoLog化
javascript:{window.open('https://thaliana.mydns.jp/GeoLog/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

79 :192.168.0.774:2019/04/09(火) 22:34:51.34 ID:Ybc45mGn0.net
適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('http://archive.today/?run=1&url='+encodeURIComponent(document.location)))

Web魚拓化
javascript:{window.open('http://gyo.tc/'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

80 :192.168.0.774:2019/04/09(火) 23:12:16.41 ID:thZOPaUB0.net
グッジョブ

81 :192.168.0.774:2019/04/10(水) 14:33:20.20 ID:0KzfqGnC0.net
>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。

82 :192.168.0.774:2019/04/10(水) 15:33:03.08 ID:y92qvzSP0.net
>>1
INTERNATIONAL INTERNET PRESERVATION CONSORTIUM - IIPC
http://netpreserve.org/

83 :192.168.0.774:2019/04/10(水) 18:38:04.28 ID:kmjY19lr0.net
>>78
Internet Archiveスレから引用

http://mevius.5ch.net/test/read.cgi/internet/1554553882/78-79

/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http://https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

84 :192.168.0.774:2019/04/10(水) 22:12:15.15 ID:5UKQiW/z0.net
/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ

85 :192.168.0.774:2019/04/10(水) 22:14:34.68 ID:Qi/9tnuY0.net
/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの

86 :192.168.0.774:2019/04/10(水) 23:12:54.50 ID:0KzfqGnC0.net
保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href+''));eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/2/'+escape(window.location.href+''));eval();}

87 :192.168.0.774:2019/04/11(木) 00:46:30.73 ID:2s+xSUEt0.net
/web/URLでも最新に飛べるけどな

88 :192.168.0.774:2019/04/11(木) 10:08:33.22 ID:NcP8kiVw0.net
このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ

89 :192.168.0.774:2019/04/11(木) 10:41:01.74 ID:zpHmesQE0.net
上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか?

90 :192.168.0.774:2019/04/11(木) 11:12:44.61 ID:JiNXg/cV0.net
良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね

日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う

91 :192.168.0.774:2019/04/11(木) 11:26:31.44 ID:3yDWyDnm0.net
>>89
タイトル案

【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓:ウェブアーカイブ1:Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1😂InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1

92 :192.168.0.774:2019/04/11(木) 12:00:59.64 ID:aWNM129m0.net
魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい

93 :192.168.0.774:2019/04/11(木) 12:04:19.18 ID:aWNM129m0.net
>>91
追加

ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1

>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい

94 :192.168.0.774:2019/04/11(木) 12:18:42.95 ID:zpHmesQE0.net
となるとやっぱりウェブアーカイブ総合は外せないか?
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・

95 :192.168.0.774:2019/04/11(木) 12:26:06.26 ID:D+Yqkgbv0.net
魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない

96 :192.168.0.774:2019/04/11(木) 13:18:54.90 ID:aWNM129m0.net
ウェブ魚拓は固有名詞としても使うだろ
https://info.5ch.net/index.php/魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな

97 :192.168.0.774:2019/04/11(木) 13:20:20.32 ID:aWNM129m0.net
>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな

98 :192.168.0.774:2019/04/11(木) 13:59:00.00 ID:D+Yqkgbv0.net
そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない

99 :192.168.0.774:2019/04/11(木) 14:44:54.16 ID:zpHmesQE0.net
【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカイブもwebアーカイブにすれば54バイト
64バイトまで引き上げてもらえば全部入る
【ウェブ魚拓】を抜けば48バイトに収まる
とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか
なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした
https://i.imgur.com/cNx29z9.png

100 :192.168.0.774:2019/04/11(木) 15:23:27.94 ID:rHrFPNjW0.net
大抵「Archive」でスレタイ検索するなあ自分は

101 :192.168.0.774:2019/04/11(木) 16:54:04.85 ID:aWNM129m0.net
「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん

102 :192.168.0.774:2019/04/11(木) 18:36:21.34 ID:3yDWyDnm0.net
「魚拓」 でも引っかかるから「ウェブ」は要らないね
https://www.google.com/search?q=%E9%AD%9A%E6%8B%93+site%3A5ch.net

というか普通にスレあった
https://mevius.5ch.net/test/read.cgi/esite/1498902308

>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)


103 :192.168.0.774:2019/04/11(木) 18:59:21.43 ID:zpHmesQE0.net
ウェブアーカイブ(に関するものを)総合(したスレッド)
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ

104 :192.168.0.774:2019/04/11(木) 19:37:27.64 ID:3yDWyDnm0.net
いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」 にしてる感じ
ウェブアーカイブの技術としては1つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない

105 :192.168.0.774:2019/04/11(木) 19:55:40.33 ID:3yDWyDnm0.net
今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね

@ ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
A ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)

アーカイブ技術という意味で使っても良いかと思う

106 :192.168.0.774:2019/04/11(木) 23:09:34.96 ID:L2Qvrxob0.net
>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。

107 :192.168.0.774:2019/04/12(金) 00:06:00.46 ID:dU8Shh4A0.net
公式が公開しているものをコピペしたのも含まれてるのかな

108 :192.168.0.774:2019/04/12(金) 03:12:04.19 ID:IEOgrIFJ0.net
todayは公式のやつだったかも。てへぺろッ

109 :192.168.0.774:2019/04/12(金) 07:27:14.62 ID:SClfSpUI0.net
67 名前:192.168.0.774
投稿日:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?


69 名前:192.168.0.774
投稿日:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ



まずここから考えよう

110 :192.168.0.774:2019/04/12(金) 07:30:12.18 ID:SClfSpUI0.net
シーサーブログのシーサーウィキというのもあるらしいが。

111 :192.168.0.774:2019/04/12(金) 07:35:28.30 ID:SClfSpUI0.net
Wiki3(うぃきさん)
https://twitter.com/wiki_three
(deleted an unsolicited ad)

112 :192.168.0.774:2019/04/12(金) 07:36:46.55 ID:SClfSpUI0.net
Seesaa Wiki(シーサーウィキ)とはシーサー
株式会社が運営するレンタルウィキサービスである。

@wiki(あっとうぃき、atwiki)とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド(パートスレ)まとめに用いられることが多い。

(以上ウィキペディアより)

113 :192.168.0.774:2019/04/12(金) 12:28:44.53 ID:xJcFOgmj0.net
MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
https://pukiwiki.osdn.jp

114 :192.168.0.774:2019/04/12(金) 16:01:45.26 ID:U3RvVBMo0.net
ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな

115 :192.168.0.774:2019/04/12(金) 16:32:28.92 ID:zTEegk2Q0.net
相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという

>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ

116 :192.168.0.774:2019/04/12(金) 17:13:46.28 ID:OzOD5/Ux0.net
高圧的に的確な指示出しててワロタ

117 :192.168.0.774:2019/04/12(金) 19:41:50.36 ID:ntUyAAnO0.net
2年ちょっと前に無くなったniftyの@homeで2TB前後なのか…

https://internet.watch.impress.co.jp/docs/news/751124.html

118 :192.168.0.774:2019/04/12(金) 19:44:52.10 ID:IEOgrIFJ0.net
初心者とかどうでも良い。使えさえすれば。

119 :192.168.0.774:2019/04/12(金) 19:48:37.42 ID:3kWgI93v0.net
今必要なのは初心者じゃないけどな

120 :192.168.0.774:2019/04/12(金) 23:04:13.37 ID:6eRxenyu0.net
使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ

121 :192.168.0.774:2019/04/12(金) 23:06:32.84 ID:6eRxenyu0.net
>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな

122 :192.168.0.774:2019/04/13(土) 04:31:44.74 ID:PBKRoLHf0.net
ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ

123 :192.168.0.774:2019/04/13(土) 05:50:27.39 ID:oa76VPkq0.net
>>122

それで異存はない。

124 :192.168.0.774:2019/04/13(土) 10:15:26.73 ID:ybhQs0Es0.net
そしてwikiサービス終了するんですね分かります

125 :192.168.0.774:2019/04/13(土) 14:37:20.47 ID:BP9fC9wY0.net
終了したらどこか別のところへ移転すれば良い

126 :192.168.0.774:2019/04/13(土) 17:53:03.37 ID:BP9fC9wY0.net
>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね

127 :192.168.0.774:2019/04/13(土) 19:36:41.35 ID:LxikEBfR0.net
>>126
126名無しさん@お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ?
そういうところは5chに無いのかな

総合ってはじめに使い出したのは俺なんだけどな

128 :192.168.0.774:2019/04/13(土) 20:07:13.70 ID:HJ17KfG20.net
>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた

129 :192.168.0.774:2019/04/13(土) 20:07:54.32 ID:HJ17KfG20.net
ID:BP9fC9wY0です

130 :192.168.0.774:2019/04/14(日) 01:04:52.71 ID:CM5+hhVJ0.net
日本だとウェブアーカイブは著作権侵害(犯罪)になるからこのスレ危ないよね?
逮捕されたくないので消えます

131 :192.168.0.774:2019/04/14(日) 01:25:36.52 ID:nTd5PtnI0.net
実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね

132 :192.168.0.774:2019/04/14(日) 02:56:48.93 ID:v+D0MDAi0.net
まだ親告罪だから訴えられなければセーフ

133 :192.168.0.774:2019/04/14(日) 03:08:40.08 ID:v+D0MDAi0.net
ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず(多分)
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない

Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず

134 :192.168.0.774:2019/04/14(日) 03:17:25.65 ID:SqtAvvkZ0.net
ウェブ魚拓の運営も捕まってないよね

135 :192.168.0.774:2019/04/14(日) 03:26:04.24 ID:qw07bbn30.net
削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど

136 :192.168.0.774:2019/04/14(日) 03:44:40.89 ID:v+D0MDAi0.net
>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある

137 :192.168.0.774:2019/04/15(月) 03:23:24.42 ID:zgYzoRmr0.net
Shoutwikiでサイト立てるのは誰がやる?
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない

138 :192.168.0.774:2019/04/15(月) 22:12:08.31 ID:k4EioB070.net
いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか

139 :192.168.0.774:2019/04/15(月) 22:26:55.43 ID:+QZpIriz0.net
>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い

140 :192.168.0.774:2019/04/15(月) 22:40:37.04 ID:k4EioB070.net
それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・

141 :192.168.0.774:2019/04/15(月) 23:09:48.42 ID:OIWksCm90.net
wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言ってもツールの使い方を翻訳するくらいしかできないだろう

本格的なアーカイブ作業をするのならArchiveTeamに入るべき
日本支部を作るにしても結局はArchiveTeam本部の力が必要

日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない
ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない

142 :192.168.0.774:2019/04/15(月) 23:10:03.44 ID:+QZpIriz0.net
それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする

143 :192.168.0.774:2019/04/15(月) 23:17:05.99 ID:+QZpIriz0.net
ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか

144 :192.168.0.774:2019/04/15(月) 23:19:08.03 ID:d2BbUiX90.net
とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば

145 :192.168.0.774:2019/04/15(月) 23:20:08.99 ID:+QZpIriz0.net
日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ

146 :192.168.0.774:2019/04/17(水) 12:15:06.93 ID:KC94xqUc0.net
英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね

147 :192.168.0.774:2019/04/17(水) 13:25:55.62 ID:pBKnwE2u0.net
ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
(ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い)
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ

148 :192.168.0.774:2019/04/18(木) 20:54:33.70 ID:231mhavm0.net
Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理

149 :192.168.0.774:2019/04/19(金) 12:33:49.48 ID:Sck2kHkT0.net
結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな

150 :192.168.0.774:2019/04/20(土) 01:32:08.39 ID:nlnJtIGb0.net
完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う

151 :192.168.0.774:2019/04/20(土) 02:38:53.71 ID:EOflkhQE0.net
ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね

152 :192.168.0.774:2019/04/20(土) 03:32:20.14 ID:j74qt4l90.net
全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか?と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。

153 :192.168.0.774:2019/04/20(土) 10:06:44.64 ID:uNdtbvPn0.net
あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ

154 :192.168.0.774:2019/04/20(土) 17:20:29.58 ID:nlnJtIGb0.net
>>152
何のツール使ってんの?

155 :192.168.0.774:2019/04/21(日) 03:12:31.96 ID:BVyeUYoM0.net
昔に比べてネット人口が増えたけど、PCユーザー自体は減ってるんじゃ無いかと…

156 :192.168.0.774:2019/04/21(日) 16:10:39.88 ID:HZbpua5K0.net
増えてますよ

157 :192.168.0.774:2019/04/21(日) 16:34:58.79 ID:+zJhJQgi0.net
法人向けは売れてるだろうけど一般家庭はスマホばっかりでPC減ってるでしょ

158 :192.168.0.774:2019/04/24(水) 03:14:37.20 ID:KjJLD36j0.net
>>151
これって割と深刻なことじゃね?

159 :192.168.0.774:2019/04/24(水) 04:15:47.92 ID:015wg1cT0.net
旗を揚げられる人間がいないだけなんじゃないかとも思うけどね
知識とやる気が揃ってなきゃできねぇ
俺は白旗なら掲げられるぞ

160 :192.168.0.774:2019/04/25(木) 00:55:31.95 ID:keVKSV/80.net
旗掲げたいけど今年いっぱいは時間が取れねぇ

161 :あめ :2019/04/29(月) 05:15:38.68 ID:qYOC6Fj20.net
何をそんなに困ってるのかわからない
後は WebRecoder + ipwb を簡単にできたらおっけーじゃないの?

162 :192.168.0.774:2019/04/30(火) 02:07:11.84 ID:4bCzSUvm0.net
>>161
ログを読もう
端的に言うとやらなきゃいけない事が多い割に率先して出来る人間がいない

163 :192.168.0.774:2019/04/30(火) 16:16:38.40 ID:4bCzSUvm0.net
>>161
それだけでおっけーじゃないから皆こうやって話し合ってるのよ

164 :192.168.0.774:2019/05/03(金) 12:31:09.57 ID:/o+BXXwL0.net
テラバイトを溜めこむ、デジタルゴミ屋敷に棲むデータホーダーたち
https://www.gizmodo.jp/2019/05/digitalhoarder.html
断捨離にコンマリ。
そんなテクニックを使いでもしなければ、人は一度手にいれたものは、どうにも手放したくない
生き物のよう。
形ある物は必ず壊れる、諸行無常の響きはインターネットの世界でも鳴りわたっているようです。
わたしはハードディスクはかならずひとつ外付けを使ってデータをローカルと外付けの2回ずつ
保存しているんですよね。いまはそれはNASに変わりましたが、以前はDVDに焼いて保存したり、
FTPを使ったり、クラウドが台頭するようになってからはクラウドも多用していますが、どうも
クラウドもソーシャルメディアも永遠の存在ではなさそう。
今回は米Gizmodoで組んでいる「ゴミ」特集のひとつを翻訳しました。外部ジャーナリストのSteven
Melendezの書き下ろしです。ちょっと長いですが考えさられる内容。ぜひ、じっくりとご覧ください。

165 :192.168.0.774:2019/05/03(金) 12:57:09.31 ID:rDYW7khY0.net
gizmodoが世間からどういう評価を受けてるかわかった上でそれ貼ってるの?

166 :192.168.0.774:2019/05/03(金) 17:24:56.15 ID:AncjvUWJ0.net
腐れTwitter.5chまとめサイトよりマシ程度

167 :192.168.0.774:2019/05/03(金) 17:39:06.81 ID:s/8yyqZn0.net
どちらかというと >>164 はアーカイブに対してポジティブな記事だよ
ちょっと煽り気味の釣りタイトルだけどちゃんとアーカイビストの偉業を紹介してる
素直に褒めたくない意地悪さがにじみ出てるけどね

168 :192.168.0.774:2019/05/04(土) 00:44:21.71 ID:I7t6q7HU0.net
大量のアーカイブを管理するには個人だと限界があるわな
団体を作って分担作業し、出来ることならInternet Archiveのように社会的信用を得ないといけない

169 :192.168.0.774:2019/05/04(土) 09:00:26.72 ID:bL2u5kxf0.net
動画は円盤保存
画像と文字は印刷保存

170 :あめ :2019/05/05(日) 05:55:19.34 ID:YysNkSBx0.net
>>162
実はスレがたったときから居て1から読んでるんだよなぁ
記事少し作るだけでここまで悩む不思議
>>74 の未来を変えるために降臨したのに

171 :192.168.0.774:2019/05/05(日) 15:45:48.96 ID:fUOQo4az0.net
>>170
ならあんたが未来を変えてくれ

172 :192.168.0.774:2019/05/05(日) 15:49:26.42 ID:fUOQo4az0.net
そもそもIPFSで本当に良いのかって話になったまま議論が止まってたはず
そこからArchive Team Japan的なものを作ろうじゃないかって話になって、そんなものに貢献できる日本人はもう本家に行ってるだろって話になって、
日本人でウェブアーカイブやってる人自体少数だよねって話になって、結局グダグダになって現在に至る

173 :192.168.0.774:2019/05/06(月) 19:41:21.46 ID:6bTK53bC0.net
まず5ch自体オワコンだから人が集まるはずないよな

174 :192.168.0.774:2019/05/07(火) 16:01:29.67 ID:nOGBK00T0.net
それ
5chで集められる人数なんてたかが知れてるから、外部サイト作ってTwitterとかで広めないとキツい
優秀なエンジニアはTwitterにかなり集ってるし、関心を持ってもらえれば良いんだが

175 :py :2019/05/14(火) 19:06:58.64 ID:cP8wStLG0.net
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1

176 :192.168.0.774:2019/05/15(水) 02:01:39.76 ID:kfIYGIBa0.net
>>175
Internet Archiveスレでも情報共有しとけ
手動Save Pages Now以外の方法を知らない人達ばかりだから相当喜ばれるぞ

177 :192.168.0.774:2019/05/16(木) 17:03:10.13 ID:/p1LTvuX0.net
ヤフー「Yahoo!コンテンツディスカバリー」サービスの終了を発表
https://media-innovation.jp/2019/05/16/yahoo-revealed-they-stop-ycd/

【解約と配信停止のスケジュール】
6月中旬頃 解約通知書の発送開始予定
9月2日 コンテンツ修正相談受付終了
9月6日 コンテンツ修正相談の結果問合せ終了
9月13日 入稿時審査受付終了・タグ発行・掲載面ブロック等の配信設定業務受付終了
9月20日 入稿時審査の問合せ終了
9月30日 Yahoo!コンテンツディスカバリー 配信停止(順次)
11月29日まで Yahoo!コンテンツディスカバリー 管理ツール等の最終停止(順次)

178 :192.168.0.774:2019/05/18(土) 21:20:44.41 ID:thTbnaVW0.net
Yahooブログアーカイブ活動スレより引用

0031 Trackback(774) 2019/05/18 14:30:36
yahooブログは「記事がありません」のページで404を返すのだが、web2IAWBM.dmsが404のページを解析できなくてリンクをたどれていない可能性がある。
ブラウザでは普通にリンクをたどれる。
ID:l5DCkLS9

179 :192.168.0.774:2019/05/21(火) 16:36:54.75 ID:nRmqsex+0.net
サイトごとにやってると分かるけど、途中で止まってることがよくあるから、
終わったらブラウザで確認した方が良い。

180 :192.168.0.774:2019/05/23(木) 11:34:52.72 ID:LNdDY8yz0.net
Archiveteam (Google 翻訳)
https://translate.google.co.jp/translate?hl=ja&sl=en&tl=ja&u=https%3A%2F%2Fwww.archiveteam.org%2F

181 :192.168.0.774:2019/05/26(日) 10:51:40.72 ID:oi3wUViY0.net
Index of /
ttp://infoseek_rip.g.ribbon.to/

182 :192.168.0.774:2019/05/26(日) 11:04:21.99 ID:oi3wUViY0.net
>>78
GeoLog Project
https://geolog.mydns.jp/
> お知らせ
>
> 2019/05/12 16:30
> ・URLを変更しました。リンク切れ等の不具合がもしあればご連絡ください。
> まだ旧ドメイン名が残っている部分がありますが、こちらは順次修正します。
> ・GeoCities URL収集 ttps://geo.98nx.jp/ 様にてアーカイブされたデータを順次統合中です。
>
> 2019/05/08 23:50
> ・近日中に、以下のとおりURLを変更します。
> 旧URL:https://thaliana.mydns.jp/GeoLog/
> 新URL:https://geolog.mydns.jp/
> 移転後も、旧URLはリダイレクトとして残す予定です。

183 :192.168.0.774:2019/05/26(日) 16:31:09.43 ID:LgR2vTtS0.net
>>1
>>3
>>5
>>6
死ね無能基地外

184 :192.168.0.774:2019/05/28(火) 23:18:36.54 ID:6dDxcHOe0.net
中学生かな?
まだ夏休みには早いと思うんだけど

185 :192.168.0.774:2019/05/29(水) 00:22:00.05 ID:LYQto7Hh0.net
毎日が日曜日

186 :192.168.0.774:2019/05/29(水) 02:16:14.09 ID:rgaJjZzR0.net
ん、IA調子悪いのか?

187 :192.168.0.774:2019/05/29(水) 03:41:38.21 ID:rgaJjZzR0.net
涼しいからスクリプト走らせようと思ったのに

188 :192.168.0.774:2019/06/07(金) 03:14:38.91 ID:EZciTwz+0.net
サーバーエラー出てる間のは保存されてないのに緑のチェックマークで成功扱いになるから注意して

189 :192.168.0.774:2019/06/09(日) 15:40:45.70 ID:S0wca8Kg0.net
メーリングリストの老舗「freeml」終了 22年の歴史に幕
https://www.itmedia.co.jp/news/articles/1906/03/news096.html

190 :192.168.0.774:2019/06/12(水) 05:55:56.93 ID:DnPdDFAp0.net
ニュース記事は2ページ目以降が保存されていないことが多いよな。
魚拓も、1ページ目を保存しただけでは、2ページ目以降は保存されないよな?
パッと見保存されているように見える

191 :192.168.0.774:2019/06/13(木) 02:01:24.77 ID:DBW1u0DS0.net
Webcite、何故かアクセスできない

192 :192.168.0.774:2019/06/13(木) 02:43:36.27 ID:Fctk1dcQ0.net
>>191
あぁまたか、あそこは良く DNS から消える。
でもサーバはしっかり生きてるんだな、これが。

193 :192.168.0.774:2019/06/17(月) 14:43:18.30 ID:Xz9V42zC0.net
GASにアーカイヴ作業させられないかな
10分おきに起動

194 :192.168.0.774:2019/06/18(火) 15:34:14.81 ID:MI2+ZpWl0.net
ニュース記事みたらSave Pageするのが習慣になってきた。

195 :192.168.0.774:2019/06/19(水) 17:32:14.54 ID:iJXbWhxE0.net
>>193
できそうな気もするがどうなんだろう

196 :192.168.0.774:2019/06/21(金) 09:20:23.40 ID:poW6yzCt0.net
同一のIPからの連続取得は制限されています。
同一のIPから24時間に60回以上の取得は出来ません。
https://i.imgur.com/1j0uQZj.jpg

197 :192.168.0.774:2019/06/21(金) 14:13:34.55 ID:9K2NkZ870.net
一日に間隔をあけて数回アーカイブするくらいなら何とかなるのでは
誰か試して見てくれ

198 :192.168.0.774:2019/06/22(土) 15:09:24.70 ID:S8tpOgcn0.net
ArchiveBoxというものを見つけた
自前のマシンでウェブアーカイブをするためのオープンソースソフトウェアだって
https://archivebox.io/

199 :192.168.0.774:2019/06/22(土) 15:19:39.24 ID:S8tpOgcn0.net
>>198
基本的にCUIで操作するものなので注意
自分でリンクを辿るのではなく、アーカイブするURLのリストを読み込ませる方式らしい
HTMLやWARCはもちろん、画像やPDFでの出力にも対応してるのが便利そう

200 :192.168.0.774:2019/06/23(日) 20:49:35.28 ID:27h915gg0.net
[JavaScript] Wayback Machine Script - Pastebin.com
https://pastebin.com/ZxryGY8F
Automatically save the page you visited (or all links you can see) to "Wayback Machine".
試していないので使えるかどうかはわからない

201 :192.168.0.774:2019/06/25(火) 23:07:44.50 ID:5uQFWJVA0.net
IAが昼過ぎからずっとメンテ

202 :192.168.0.774:2019/06/26(水) 22:53:23.97 ID:Qb0QQC6K0.net
配布終了したフリーソフトの保管庫も欲しい

203 :192.168.0.774:2019/06/28(金) 15:19:25.28 ID:JC6hqmSv0.net
getASFstreamも実行ファイルがIAから削除されてるな。

204 :192.168.0.774:2019/06/28(金) 15:22:44.92 ID:JC6hqmSv0.net
getASFstreamはVectorのが生きてたからまだ平気か。

205 :192.168.0.774:2019/07/03(水) 17:10:46.83 ID:0BbpBYkz0.net
ルートラボ2020年3月末終了
https://www.itmedia.co.jp/news/articles/1907/03/news096.html

これはWayback Machineでも保存できないので同じようなサービスにデータを
移行したもの以外のデータは消え去ることとなる。

これからこのようにアーカイブできないデータは増えていく一方だろう。

206 :192.168.0.774:2019/07/06(土) 04:08:11.16 ID:6FkUH5GE0.net
アーカイブできないデータの筆頭がオンラインゲーム・ブラウザゲーム・ソーシャルゲームだよねえ

207 :192.168.0.774:2019/07/06(土) 14:21:01.48 ID:GinQGT8r0.net
昔流行ったフラッシュはアドレス直打ちSavePageNowで保存できたけどゲームは分からん。

208 :192.168.0.774:2019/07/10(水) 09:08:38.60 ID:/L/aFHKF0.net
goo blogの「株式日記と経済展望」がいつの間にか見れなくなってる
IA見ると2019年1月7日の記事の最後にしばらく休みますと書かれている
https://web.archive.org/web/20190314154224/https://blog.goo.ne.jp/2005tora

209 :192.168.0.774:2019/07/10(水) 16:20:17.46 ID:fnXJF4Pm0.net
Wayback Machineやたら重いんだけど
時間帯によるもの?

210 :192.168.0.774:2019/07/11(木) 07:59:17.31 ID:7Pk3v1uW0.net
スクリプト走らせてる人が70人近くいるはずだし重くなっても不思議は無い。
保存されているかを確認するために実際に開いて確認してから保存している。
同じページを何度も確認していたなんてこともあると思う。

211 :192.168.0.774:2019/07/13(土) 00:39:32.34 ID:Y10L19C40.net
ここの住人にYahooブログをアーカイブしてほしい

212 :192.168.0.774:2019/07/13(土) 13:20:12.05 ID:LEU3bec70.net
異様に書き込み減ったし多分みんな保存してる。
個別にURL指定してくれれば優先する。

213 :192.168.0.774:2019/07/16(火) 11:16:16.55 ID:hXIS632N0.net
ジオシティーズの時のようにURal収集フォームみたいなのがあれば便利なんだけどな

214 :192.168.0.774:2019/07/16(火) 11:17:07.12 ID:hXIS632N0.net
タイプミス
URLな

215 :192.168.0.774:2019/07/17(水) 12:47:13.54 ID:8BflpvwW0.net
質問です。
Wayback Machineを使って、見たかったサイトは見つかったのですが、画像はありませんでした。
その画像を見つけることはもうできないのでしょうか?

216 :192.168.0.774:2019/07/21(日) 06:02:59.22 ID:PLd/1lFQ0.net
GASは程度にもよるが増やしすぎるとすぐこうなる。思ったより使えない。
> サービスで 1 日に使用しているコンピュータ時間が長すぎます

217 :192.168.0.774:2019/07/25(木) 09:40:55.79 ID:1TUd1BHY0.net
>>215
諦めた方が早いかと思われ

218 :215:2019/07/28(日) 17:53:01.59 ID:2hYx5uH+0.net
>>217
そうなんですか、残念ですがありがとうございます

219 :192.168.0.774:2019/07/29(月) 23:47:11.38 ID:0ZDdCLv30.net
https://i.imgur.com/UsIWVu4.jpg

220 :192.168.0.774:2019/07/30(火) 03:06:48.87 ID:w+bM/0cg0.net
ロリコンはネトウヨ
女叩きしてるのはBBA
DQNも何方かと言えばネトウヨ色が強い

5chとネット上で、金魚の糞を巻き散らかしてるのはコイツら

221 :192.168.0.774:2019/07/30(火) 18:42:36.22 ID:rAPLQn650.net
改憲なんてしてもアメリカが作った自作自演の戦争に巻き込まれて戦争犯罪に加担するだけじゃん。
愛国者なら9条改正には反対しないと。どこの国も上層部は裏で繋がっている、つまり中国韓国ロシアはアメリカと通じていて、本当の敵はアメリカの中にいる。
敵国条項は残っているんだから日本がちょっとでも怪しい動きしたらロシア中国韓国アメリカから攻撃されて今度こそ日本無くなるぞ。
そして、緊急事態条項は独裁完成法。
独裁完成したら安倍晋三が死ぬまで安倍政権が続くぞ。

222 :192.168.0.774:2019/08/06(火) 03:38:43.37 ID:AvYpPa1T0.net
ヤプログ! サービス終了のお知らせ
https://yaplog.jp/staff/archive/914

223 :192.168.0.774:2019/08/16(金) 10:44:48.49 ID:c/w5mu590.net
>>175のやつ最近のログ見たら保存されてないのに保存済みと表示されて保存してないURLある事に気付いた。
IA側が仕様変更したのか?

224 :192.168.0.774:2019/08/16(金) 10:48:02.20 ID:c/w5mu590.net
>>223
Show Allでは確かにキャプチャーがあるのに、それを開くとHrm.で表示できない。

225 :192.168.0.774:2019/08/17(土) 23:15:30.53 ID:Z4rWSf4u0.net
閉鎖がアナウンスされてるサービスについては、
Wikipediaから参考文献などとしてリンクを貼られているサイト、Twitterでシェアされているサイトを優先してアーカイブした方がいい
ジオシティーズの時もこの方式が取られてたと思う
Yahooブログのアーカイブを考えてる人がいたら参考にしてくれ

226 :192.168.0.774:2019/08/18(日) 05:20:36.47 ID:zB3uGj7T0.net
>>222

アドブロックが普及しすぎて、ブログサービスはどこも儲かっていないらしい。

227 :192.168.0.774:2019/08/18(日) 22:44:14.13 ID:lH1BP5oP0.net
最近はアンチアドブロックとかもあるよね

228 :192.168.0.774:2019/08/18(日) 23:41:17.08 ID:m6no0JBr0.net
>>226
スマートフォンだと余り普及して無いけど、
スマートフォンでブログやる人って少ないのかな…

229 :192.168.0.774:2019/08/21(水) 04:09:45.48 ID:x9gIR2Do0.net
https://shibuya-game.com/archives/53188

諸般の事情により、SHIBUYA GAMEは2019年9月20日をもちまして更新を停止し、2019年末をもって閉鎖します。

230 :192.168.0.774:2019/08/21(水) 14:50:30.18 ID:b3NNDeZP0.net
>>229
https://shibuya-game.com/all-posts/page/1
このURLを起点に全記事のURLを抜き取ってInternet Archiveなり何なりに投げればいいな
作業する余裕のある人あと1か月でよろしく

231 :192.168.0.774:2019/08/21(水) 14:54:06.94 ID:b3NNDeZP0.net
>>230
今のところ1768個の記事があるらしい

232 :192.168.0.774:2019/08/22(木) 23:08:10.94 ID:c46PChaz0.net
水谷修のサイト保存してくれた人いるのか

233 :192.168.0.774:2019/09/14(土) 14:16:10.61 ID:Xphq9GAC0.net
情報が古くても需要がありそうなのは
小説・漫画・映画のレビュー・考察サイト
ゲーム関係のサイト(攻略サイト・レビューサイトなど)
Web小説
あたりか

234 :192.168.0.774:2019/09/15(日) 22:34:40.70 ID:6+5CjbXu0.net
興味あるので保守

235 :215:2019/09/20(金) 05:31:59.01 ID:QM3MI5eR0.net
アーカイブしたいサイトがある時、どうやって保存するの?
Winなら巡集みたいなソフト使ってやるの? Macではターミナル?

236 :192.168.0.774:2019/09/23(月) 03:23:58.52 ID:TCqq29480.net
ニコ生アラートのバイナリ保存されていない…残念

237 :192.168.0.774:2019/09/23(月) 03:47:25.00 ID:TCqq29480.net
>>235
>>175

238 :215:2019/09/23(月) 05:25:08.76 ID:2+4wj0ye0.net
>>237
Windowsしか書いてないけど、macで行ける?

239 :192.168.0.774:2019/09/23(月) 08:45:19.53 ID:TCqq29480.net
Macはもってないので分からない。
>>175のやつWindowsでも機能していない可能性がある。保存されたって出てるけど実際は保存されていないとか。

240 :192.168.0.774:2019/09/25(水) 18:16:46.74 ID:TR/fy2AH0.net
サービス終了に関するご報告
https://www.rich.co.jp/news_article/20190930/

>この度、2015年よりサービスを続けてまいりましたメディア「ヘルスケア大学」について、当社事業領域の整理に伴い社内リソースを別領域に集中させることに決定し、2019年9月30日にサービスを終了することとなりました。

241 :192.168.0.774:2019/09/27(金) 23:51:14.06 ID:4H4+28EN0.net
ワイ「古い車買ったろ。整備は大変そうやけど、ネットには先人の知恵がいっぱいや」

1 :名無しさん@おーぷん:19/09/27(金)23:31:11 ID:2JG主 ×
ジオシティーズ「ん?」
ディオン「んん?」
ニフティー「んんん?」

2:名無しさん@おーぷん:19/09/27(金)23:31:38 ID:2JG主 ×
先人の知恵、消える

3:名無しさん@おーぷん:19/09/27(金)23:31:46 ID:6EZ ×
しゃーない

5:名無しさん@おーぷん:19/09/27(金)23:32:30 ID:cUL ×
悲しいなぁ…

242 :192.168.0.774:2019/09/28(土) 08:08:34.63 ID:bq44L+WV0.net
各アーカイブサービスの検索機能が優秀なら良いんだけどな
保存してもそれを探し出せないなら死蔵と変わらんな

243 :192.168.0.774:2019/09/29(日) 01:09:52.47 ID:q9QXqdnD0.net
無料ソフトウェアのサイトは保存されてても実行ファイルを含むzipファイルは保存されていません。
可能な限り保存します。

244 :192.168.0.774:2019/09/29(日) 01:34:12.78 ID:T/2cpgi20.net
>>242
単にアーカイブしたファイルの中身に対して検索を行えるかどうかの話。
それを優秀などという語でしか表現できない貧弱なボキャブラリー。

245 :192.168.0.774:2019/09/29(日) 02:04:44.22 ID:q9QXqdnD0.net
Googleとかで「 site:web.archive.org」を付けて検索するのが現実的かと。

246 :192.168.0.774:2019/09/29(日) 11:02:46.70 ID:IeSWqng50.net
wikiうんぬんの話が出ているので、いくつか使ったことがあるから書いておくけど
atwiki SeesaaWiki FC2wiki などはそれぞれ記法が独特でバックアップが取れない
atwikiは特に仕様がころころ変わる上に不具合発生率も高くて、書き込みだけに集中できないし
アカウントを削除してもサーバーからデーターが完全削除されないみたい

pukiwiki/pukiwiki plusベースのところはdumpデーターは取得できるけど
運営が個人だったり個人で会社を作ってやっているところはその人がどうにかなると連絡が取れなくなる
それでもサーバーやドメインが維持されいるとサービスは利用できるけど
ある日突然使えなくなることがある

247 :192.168.0.774:2019/09/29(日) 12:20:42.26 ID:T/2cpgi20.net
コンテンツ制作側としてのバックアップの話をここでやってどーするの。

248 :192.168.0.774:2019/09/29(日) 12:33:23.11 ID:IeSWqng50.net
個人サイトで無料/有料に関わらず共用サーバーを使っている場合
サーバー管理会社によってサーバーのスペック変更が行われると
サービスが終了していなくてもサイトが閲覧不可になることがあるよね

PHP5.3までしか対応していないものを使ってサイト運営をしているのに
サーバー側がPHP7.2にしちゃったとか
サーバーを丸ごと交換してデフォルトがUTF-8になったのに
サイトのほうでcharsetを指定していないとか
DBのバージョンが上がってデーターが呼び出せなくなった
等の理由で、閲覧が困難になるケース

閲覧しに行って真っ白だったり文字化けしていたりするのはこの辺の理由

249 :192.168.0.774:2019/09/29(日) 12:56:37.11 ID:T/2cpgi20.net
なんだ、新手のスレ埋め立てかw

250 :192.168.0.774:2019/09/29(日) 13:09:54.41 ID:T/2cpgi20.net
そういやPukiWikiのサイトをInternetArchiveで保存させる場合、
一覧ページから数階層分のURLを掘って、その全URLに/save/リクエストを
発行すれば完了だろうな。
適当なツールが無ければIrvineとメモ帳のテキスト置換機能を使えばよい。
ソースのバックアップの話はスレチ。

251 :192.168.0.774:2019/09/29(日) 17:04:53.57 ID:q9QXqdnD0.net
このスレで使うwikiが消滅する場合の対策の話じゃないの。

252 :192.168.0.774:2019/09/29(日) 22:23:17.96 ID:n8nVup7e0.net
>>244
人の揚げ足取る暇があったらアーカイブしろ

253 :242=252:2019/09/29(日) 22:32:55.86 ID:n8nVup7e0.net
だいたいページ内容の走査だけで検索機能実装しても優秀とは到底言えないからな
検索エンジンサービスのようにページランク等を考慮して初めて、優秀というかようやく使いものになる
アーカイブサービスのように膨大な数のページを検索しなきゃいけない場合は、そういったアルゴリズムの必要性がさらに高まる
こういう話をいちいちするのが面倒だから話を全部ひっくるめて「優秀」の一語で表現した
これで満足か?

254 :192.168.0.774:2019/09/29(日) 22:36:12.79 ID:n8nVup7e0.net
ページランクは固有名詞に近いからランキングアルゴリズムと言うべきだったかもしれない

255 :192.168.0.774:2019/09/29(日) 22:40:09.36 ID:n8nVup7e0.net
クソリプが跋扈するツイッターや人口の多い他の5ch板ならまだしも、
このご時世にこんな専門板で、横からいきなり会話してる訳でもない相手からレスが飛んでくるとは思わなかった
随分面食らったわ

256 :192.168.0.774:2019/09/29(日) 22:48:43.54 ID:T/2cpgi20.net
Wiki立てる話自体が消えたと思ってたw

257 :192.168.0.774:2019/09/30(月) 11:04:24.16 ID:MZVGPwZn0.net
>>256
また話が出るかもしれないから一応書いておいただけ

atwiki上のサイトで差分が見れないところがあったから
archive.orgで探してみたけど
archive.orgのbotをatwikが蹴っているみたいで最近はエラーページが保存されちゃってる

意図的にそのページを残したい人がarchive.orgのアカウントを作って残す場合は別として
消えちゃったページを後からarchive.orgで探すのは難しくなっていると思うよ
クローリングの期間がだいぶ開いている
これはGoogleのキャッシュもそうだと思う
サイトを運営している人がGoogleのアカウントを取得して
Google Search Consoleからクローリングのリクエストを出して当然ってなってきているみたい

258 :192.168.0.774:2019/09/30(月) 15:43:12.38 ID:yT22Xmkr0.net
>>245
実際に検索してみると分かるけど、その方法だと引っかからないアーカイブが結構あるんだよな
Googleのクローリングが追いついてないんだと思うけど

259 :192.168.0.774:2019/09/30(月) 17:16:29.06 ID:yT22Xmkr0.net
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/l50/

74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる

260 :192.168.0.774:2019/10/08(火) 01:13:45.16 ID:MXp0IOeT0.net
Twitter埋め込みが一切保存されない問題

261 :215:2019/10/08(火) 08:01:40.33 ID:GswYVQiV0.net
>>260
アメリカの図書館にいけよ

262 :192.168.0.774:2019/10/08(火) 14:30:06.60 ID:fXMCPs+v0.net
アメリカの図書館はもうTwitterの全保存やめたんじゃなかったか

263 :192.168.0.774:2019/10/18(Fri) 01:06:58 ID:F6Bah8760.net
当時の「魔法のiらんど」上で作られたサイトは現在ではほとんど残っていない。
WebArchiveでも表層しか掘れないサイトばかりである。
当時の掲示板でのやりとり等はもちろん、かのクレリアさんが自サイトに書き記していた構築解説ですらも現在は散逸してしまった。

264 :192.168.0.774:2019/10/25(金) 10:22:59.94 ID:ZZgmHhFq0.net
手動で一ページずつやってもToo Many Requestsになって捗らないな。
Wayback Machineは金払うから一気に取得かアップロードさえて欲しい。

265 :192.168.0.774:2019/11/03(日) 20:32:03.04 ID:I05N5XH+0.net
もしかしたらしたらば掲示板やばいかもしれんな

266 :192.168.0.774:2019/11/03(日) 22:05:54.91 ID:IGp2y1Ub0.net
>>265

理由は?

267 :192.168.0.774:2019/11/04(月) 01:30:31.73 ID:d2EYioZ60.net
>>264
有料取得依頼みたいなんなかったっけ

最近Archive Today重いのは俺だけかい?
すぐNetwork Errorになる

268 :192.168.0.774:2019/11/04(月) 07:36:42.44 ID:1kde+9Me0.net
したらば掲示板が丸一日メンテナンスしてたみたいですな。

269 :192.168.0.774:2019/11/05(火) 18:04:06.02 ID:P7AeCNyG0.net
>>258
そういや最近グーグルってサイト作成者がクロール要求しないと
なかなかクロールしてくれないってどっかの記事で読んだような気がする。

↓こういうのをテキストエディタで作ってからIrvineの「URLを展開して貼り付け」をすると全頁まとめて登録できる。画像一覧とかも同様
https://blogs.yahoo.co.jp/************/MYBLOG/yblog.html?m=l&p=[1-最後のページ番号]
例のスクリプトの登録漏れをある程度減らせると思う。

270 :192.168.0.774:2019/11/10(日) 04:30:49.20 ID:gZ07cm7t0.net
誰かここに載ってるサイトだけでも保全してくれ

yahoo!ブログ使用サイト - DoldoWorkz
https://moondoldo.com/DoldoWorkz/?yahoo%EF%BC%81%E3%83%96%E3%83%AD%E3%82%B0%E4%BD%BF%E7%94%A8%E3%82%B5%E3%82%A4%E3%83%88

271 :192.168.0.774:2019/11/10(日) 19:44:29.07 ID:OJOj/1ou0.net
何故自分でやらないのか

272 :192.168.0.774:2019/11/10(日) 22:43:10.93 ID:Qg+FaNtt0.net
ジオシティーズの時もそうだったが、特定サービスのアーカイブって何だかんだ言ってかなりの時間と労力を必要とするんだよ
自分でやりたいのは山々だが、そこに労力を注ぎ込める余裕がない
なのでアーカイブをやっている人が多少は集まっているであろうここに投げた

273 :270=272:2019/11/10(日) 22:45:26.50 ID:Qg+FaNtt0.net
>>270のサイトの作者と自分は何にも関係ないことは一応断っておく

274 :192.168.0.774:2019/11/11(月) 09:12:05.10 ID:DmcMWPY20.net
Yahooブログにアーカイブすべき物なんてあるのか?

275 :192.168.0.774:2019/11/11(月) 10:42:59.86 ID:HD2VAMf80.net
単なる日常記録も多いけど、そこらのジオシティーズよりも濃い情報が詰まってるものも多いよ
自分が知ってる範囲だと、今は消えた街並みの記録や京都のマイナーな神社の訪問記、イギリスでの聖人信仰の研究サイト、ゲーム業界の裏話やゲーム攻略などがあるよ
自分が知ってる範囲のブログだけはいくつかWayback Machineに突っ込んだが、他にも有益な情報がたくさん眠ってると思うよ
Yahooブログなんて消えても誰も困らないだろうと思ってる人が結構いるみたいだが、とんでもない偏見だよ

276 :GeoLog Project :2019/11/11(月) 20:36:22.34 ID:kHI2SrFf0.net
>>270
試しにhttrackに突っ込んだら画像のリンクが取れず、
調べたら元のHTMLにはないリンクを後から生成して突っ込んでますね。。。

動的サイト嫌いです。。。

277 :192.168.0.774:2019/11/11(月) 23:27:18.77 ID:HD2VAMf80.net
動的サイトのWebアーカイブ用クローリングとなるとHeritrix(Internet Archiveが使ってるクローラ)の出番ですね
実績もあるし高性能で拡張性もそれなりにあるものの、マシンの要求スペックが比較的高めなのが難点か

278 :192.168.0.774:2019/11/14(木) 17:49:41.79 ID:zR5VNa+N0.net
Heritrixの最低動作スペック自体はそこまで高くないよ
ただ、リッチなコンテンツを含むページをアーカイブしようとするとメモリを食うことがある
あと基本的にLinux環境しかサポートしていないので、人によっては手が出しにくいかもしれない

279 :GeoLog Project :2019/11/15(金) 00:48:08.16 ID:jfECE9r+0.net
Windows でも動くには動きますね
しかしやたら遅い・・・

280 :192.168.0.774:2019/11/17(日) 22:45:04.48 ID:n+VdMpHA0.net
メモリ持て余してるけどストレージが足りない
ArchiveTeamWarrior的なのがあれば参加するんだけど

281 :192.168.0.774:2019/11/19(火) 15:35:27.56 ID:WcaVo5T50.net
ArchiveTeamに常駐してる人がここにいれば捗るんだが

282 :192.168.0.774:2019/11/22(金) 05:16:46 ID:8zBYuW1S0.net
むしろ元のHTMLの方には正しいリンク先URLがあるんじゃないの。
それで画像取得できないだろうか

283 :GeoLog Project :2019/11/22(金) 20:15:18.83 ID:fS5sbz5I0.net
>>282
拡大すると大きめの画像のあるページってどこかありますか?

284 :192.168.0.774:2019/11/24(日) 23:10:35.97 ID:Sj5SnpvV0.net
>>283
「拡大すると大きめの画像のある」って言うのがどういう意味かよく分からないので、もう少し詳しく説明をお願いしたい

285 :215:2019/11/25(月) 05:25:36 ID:U4MdffN+0.net
>>284
ライトボックスとかじゃない?

286 :GeoLog Project :2019/11/25(月) 20:34:05.84 ID:KvWZhxVE0.net
>>284
言葉足らずですみません

Yahoo!ブログは画像をクリックすると別ページに飛んで元の大きい画像が見られるらしいのですが、
ページのimgタグに書いてある画像より、元画像の方が大きい例があるかどうかを気にしました
>>282 の「元のHTML」に元画像へのリンクがあるのか確認したかったので

287 :192.168.0.774:2019/11/27(水) 13:24:37 ID:+cJOWs3G0.net
Twitter、休眠アカウント削除へ 対象アカウントに12月11日までにログインするよう警告
https://www.itmedia.co.jp/news/spv/1911/27/news069.html

これ亡くなった著名人などのアカウントも容赦なく削除するらしいから、期限までに出来る限りアーカイブしておきたいところ
Twitterで #休眠アカウント削除 がトレンド入りしてるから、アカウントが消えるのが嘆かれてる故人のアカウントはこれでかなり拾えると思う

288 :215:2019/11/27(水) 18:54:59.39 ID:y0cHyaRo0.net
>>287
やり方おせーてくれたら手伝えるけど

289 :192.168.0.774:2019/11/27(水) 19:47:11.55 ID:+cJOWs3G0.net
ArchiveTeamが動き出したな
https://twitter.com/textfiles/status/1199459588594176000
(deleted an unsolicited ad)

290 :192.168.0.774:2019/11/27(水) 21:52:41.92 ID:+cJOWs3G0.net
>>288
とりあえず一番手っ取り早い方法は、>>289のツイートに貼られてるリンク先の入力フォームから、
保存して欲しいアカウントのIDを入力して送ること
もしかしたら他にも誰かが保存プロジェクトをやってるかもしれないから要調査だな

291 :192.168.0.774:2019/11/30(土) 02:24:56 ID:mj1OwWx+0.net
minori official web site
http://www.minori.ph/
このサイト、キャプチャできない

292 :192.168.0.774:2019/11/30(土) 04:08:01.49 ID:IS98dA580.net
>>291
海外からのアクセスに対し 403 Forbidden エラーを返すよう
設定されているみたいですから、Internet Archive や Archive.is では
無理でしょうね。
さらにそのエラーページは他サイトへの遷移スクリプトが
埋め込んであるので、フツーの人はエラー扱いされていることすら
気付けないでしょう。

当該エラーページの HTML ソースを貼っておきます。
https://pastebin.com/Vy7uYhiK

293 :215:2019/11/30(土) 05:13:24.84 ID:Yk7eFuvo0.net
>>290
DLだけ、自分でってことはできないの?

294 :192.168.0.774:2019/11/30(土) 10:31:13.20 ID:b+Bfz/GQ0.net
>>293
自分のPC中にアーカイブをローカルで保存することは出来ないかってこと?
Heritrixなど動的サイトを処理できるクローラを使えば問題なく出来る、出来るけどアーカイブは死蔵してたら意味が無いからね
自分だけで閲覧する用に保存しておくこともありうるけどそれはアーカイブとは言えない
ArchiveTeamが収集したファイルはWayback Machineに登録されるようになってるので、そういう意味では安全

295 :192.168.0.774:2019/12/02(月) 04:15:35.70 ID:Z+Zveon+0.net
最近のToday
https://i.imgur.com/zJ1Sw31.jpg

296 :192.168.0.774:2019/12/03(火) 03:09:24.37 ID:zKh+7e4i0.net
Current Running Warrior Project: Yahoo! Groups

297 :192.168.0.774:2019/12/03(火) 03:21:33.26 ID:W45k6bBP0.net
Yahoo GroupsはYahooブログとは全くの別サービスだから早とちりすんなよ

298 :192.168.0.774:2019/12/03(火) 03:23:09.41 ID:W45k6bBP0.net
これのことだよ
https://japanese.engadget.com/2019/10/17/yahoo-groups-21-12-14/

299 :192.168.0.774:2019/12/04(水) 17:38:24.46 ID:OvwZOsOX0.net
本日のToday
https://i.imgur.com/n9jpxpY.jpg

300 :192.168.0.774:2019/12/06(金) 00:57:47 ID:QIt7pou20.net
300

301 :192.168.0.774:2019/12/14(土) 23:22:02.29 ID:AA4HPrSj0.net
Ci-en移行に伴うDLsite blogサービス提供終了予定のお知らせ
ttp://home-info.dlsite.com/archives/9427708.html

302 :192.168.0.774:2019/12/15(日) 18:24:18.14 ID:r3L4BzMu0.net
Yahooブログ今日までか

303 :192.168.0.774:2019/12/16(月) 16:10:29.42 ID:RltCXRJ+0.net
ほとんど何もできなかった

304 :192.168.0.774:2019/12/16(月) 19:43:00.36 ID:oxia7Ong0.net
少しは頑張れよ

305 :192.168.0.774:2019/12/16(月) 22:27:54.54 ID:P9Fjib/40.net
人いねえもの
呼び掛けが不十分だとこうなってしまう

306 :192.168.0.774:2019/12/17(火) 00:52:29.58 ID:SWkI+H1w0.net
>>272 >>294
リンク構造維持できて程々の容量に収まるなら分割rarやzipに纏めてもらってもいい。

今は低速スマホしか使う余裕無くなったから巡集やWeboxみたいな取り込みアプリで一括アーカイブ化するのも無理だし
読売の縮刷版CD/DVDなんかは1年分で12万もするし

307 :192.168.0.774:2019/12/17(火) 04:05:12 ID:FbEfAMeJ0.net
スマホ(笑

308 :192.168.0.774:2019/12/17(火) 23:19:41.41 ID:ZjrTQ21f0.net
ネットサービス企業は、スマホからの収益がメインやから、

PCだけに成ったら大倒産時代や

309 :192.168.0.774:2019/12/18(水) 01:13:33 ID:7iAMrhRQ0.net
色々と話がとっ散らかって来たな
>>306からして何が言いたいのか今一つ要領を得ない

310 :192.168.0.774:2019/12/19(木) 20:23:09.25 ID:s5RLoz8q0.net
もうyaplogに行ってる

311 :192.168.0.774:2019/12/19(木) 22:41:03.12 ID:yyGOrfnZ0.net
yaplogって1月でサービス終了するらしいけど
https://nlab.itmedia.co.jp/nl/articles/1908/03/news034.html

312 :192.168.0.774:2019/12/19(木) 23:36:07.17 ID:P9Gt+F0u0.net
geocitiesのアーカイブサイトは複数ある様だけどYahoo!ブログも有る?

313 :192.168.0.774:2019/12/20(金) 01:21:34.83 ID:W2QHpneb0.net
>>312
Yahooブログスレの方にも載ってないから今のところないんじゃないかな

314 :192.168.0.774:2019/12/28(土) 07:55:33.34 ID:GiJFu1gz0.net
Archive.TodayはグーグルやBingのキャッシュを保存した場合でも原本URLを認識できるのが素晴らしい。

315 ::2019/12/29(日) 21:46:36.02 ID:3C6Rg8sC0.net
archive.todayのTwitterの魚拓がモバイル版にならなくなった?
アカウントは新UI、ツイートは旧PC用UI

316 ::2019/12/30(月) 13:29:31.10 ID:dXRB6Vq/0.net
>>315
それどころかアカウントの魚拓がかなり下の方までスクロールされた状態で保存されるようになった
つまり1回の魚拓でかなりたくさんのツイートが保存されるようになった
いいね

317 :192.168.0.774:2019/12/30(月) 23:49:45.17 ID:Sts0O97Y0.net
>>314
検索で出ないことあるからやっぱ微妙だった

318 :192.168.0.774:2019/12/31(火) 18:45:45.57 ID:eDEktBsz0.net
Webサイトの保存ってみんなどうやってしてるの?
このスレにすでに書いてたらすまん

319 :192.168.0.774:2020/01/02(木) 07:10:20.03 ID:5F6LDkXn0.net
ローカル保存&魚拓

320 :192.168.0.774:2020/01/02(木) 10:39:14.28 ID:ucP82yGj0.net
魚拓ってのは
https://megalodon.jp/
でローカル保存ってのはchromeなんかにあるオフラインで読む系機能であってる?

321 :192.168.0.774:2020/01/03(金) 19:36:03.17 ID:c4MpYdMH0.net
それであってる

322 :192.168.0.774:2020/01/04(土) 18:01:40.04 ID:G3xvEvXn0.net
激重で読み込めない…

323 :192.168.0.774:2020/01/04(土) 20:37:51.83 ID:YBh70eiZ0.net
Scheduled Maintenance
The Internet Archive's sites are offline for scheduled maintenance and upgrades.
Please check our twitter feed @internetarchive for updates.
Sorry for the inconvenience.

324 :192.168.0.774:2020/01/05(日) 21:23:51.28 ID:JtWpXhr50.net
Yaplog取ってたらこんなの出てた
https://web.archive.org/web/20200105113649/yaplog.jp/mahou93/archive/645

325 :192.168.0.774:2020/01/06(月) 15:29:48.32 ID:HEWxGNJX0.net
>>321
ありがとう

326 :192.168.0.774:2020/01/09(木) 07:45:46.22 ID:0Jucozb10.net
4年以上未ログインの Yahoo! JAPAN ID、2020年2月から順次利用停止へ
https://japanese.engadget.com/jp-2020-01-07-4-yahoo-japan-id-2020-2.html

これひょっとしてYahooボックスで公開されてるファイルとかもごっそり消えちゃうんじゃ・・・
と思ったけどほとんど見かけないから影響あんまり無いかな

327 :192.168.0.774:2020/01/09(木) 21:40:15.88 ID:y/kpjRu/0.net
Yahooボックスってサービス終了して無かったのか…

328 :192.168.0.774:2020/01/18(土) 22:33:46.55 ID:Mw+axOW50.net
魔法のiらんどは2020年春に大リニューアルします! - 魔法のiらんど https://maho.jp/renewal/
オワタ

329 :192.168.0.774:2020/01/19(日) 04:35:51.86 ID:qrJ0vAPo0.net
やったぜ

330 :192.168.0.774:2020/01/19(日) 06:21:23 ID:c42zUqjI0.net
>>328

魔法のiらんど はまだ存在しているのかw

331 :192.168.0.774:2020/01/24(金) 17:33:52.87 ID:TbU4PUEj0.net
https://archive.org/

ここに

http://ishidate.my.coocan.jp/index.html

の、「Visual C++の勉強部屋」は保存できてるようなんだけど
「Visual Studio Community 2017でPythonを始める」が
トップだけあって他のリンクが上手く保存が出来てないようなんだけど
残す方法ありますか?始めてやろうとしてるので変な残し方をしたら気まずい・・・

332 :192.168.0.774:2020/01/24(金) 17:40:24.75 ID:TbU4PUEj0.net
あれ?慌てただけで反映されてなかっただけかな?

http://ishidate.my.coocan.jp/python/python.htm

上から2個目まではアーカイブされてました、すみません
一個ずつセーブしていくのかな?2個目はやってないはずなんだけど
トップページをセーブすると、自動で全部の保存処理をしてくれてるのだろうか?

333 :192.168.0.774:2020/01/24(金) 19:35:46 ID:DGrUFhpx0.net
>>331-332
すみません、反映するまで時間が掛かってただけのようです
順調に保存が進みました

334 :192.168.0.774:2020/01/30(木) 04:23:53 ID:DpjoWFqw0.net
上の保存出来たと思ったら何も変わってなかった
もう訳が解らん、個人的にローカルへ残す事にします・・・

335 :192.168.0.774:2020/01/30(木) 09:17:01 ID:QEGy6HlG0.net
最近財政難を表明してからInternet Archiveはやけに不安定だからなあ
Internet Archiveのシステムはページをクロールする部分とクロールしたページを表示する部分に分かれてるんだけど、最近は後者の部分がやけに不安定だったりする
閲覧できてないだけで実は保存できてたりすることもあるけど、不安ならオフラインコピーや他のアーカイブサイトを使うといい

336 :192.168.0.774:2020/01/30(木) 09:18:37 ID:QEGy6HlG0.net
まあ財政難表明する以前からちょくちょく不安定になることはあったんだけど、最近は不安定になる頻度がやたら高くなってきてる
保存されるアーカイブの量にリソースが追いついてないらしい

337 :GeoLog Project :2020/02/10(月) 00:45:52.91 ID:QUFKIIvC0.net
魔法のiらんど のURL収集を始めることにしました
知っているURLがあれば追加してください
https://geolog.mydns.jp/maho/

338 :192.168.0.774:2020/02/10(月) 15:13:07.48 ID:GaTPIR040.net
Geocitiesのときはいくつかブックマークから追加したけどiらんどはなかったよ・・・

339 :192.168.0.774:2020/02/17(月) 12:57:14.40 ID:JLl8Pqxs0.net
Wayback Machine ツイッターが簡単に登録できなくなったね
try againになる

340 :192.168.0.774:2020/02/21(金) 08:24:33 ID:SqQJO7aU0.net
ウェブ魚拓にロボット扱いされるようになった。
手動でやってるのに。
https://i.imgur.com/eqgUaln.jpg

341 :192.168.0.774:2020/02/21(金) 08:42:25.85 ID:SqQJO7aU0.net
と思ったらReCaptcha導入でgyo.tc/urlまでもが廃止されたのかよ。
ReCaptchaの画面に飛ばしてくれればいいだけなのに。
タイトル画像詐欺になってるがな。

342 :192.168.0.774:2020/02/21(金) 08:50:19.65 ID:SqQJO7aU0.net
右下のリキャプチャマーク表示されてから5秒数えてから押せばいけるっぽい?

343 :192.168.0.774:2020/02/25(火) 14:42:33.24 ID:RVV1cF750.net
https://web.archive.org/
ここ一週間くらい調子悪いね?

保存できたと思って翌日くらいに見ようとしたら消えてて見られなくなってる

344 :192.168.0.774:2020/02/25(火) 23:55:53.96 ID:jlsY//Cy0.net
Internet Archiveはアーカイブ実行用クローラ(Heritrix)と
保存したアーカイブの専用ビューワ(Wayback)を組み合わせて動いてるんで、
保存したアーカイブがサーバ不調で一時的に見られなくなってても、
アーカイブさえきちんと出来てればそのうち問題なく見られるようになる

345 :192.168.0.774:2020/02/27(木) 12:58:06.64 ID:mwbfDK4S0.net
>>344
本当ですね!
さっき見てみたら復旧されたようでちゃんと保存できてました!

346 :192.168.0.774:2020/02/29(土) 11:53:24.69 ID:zPIV21fz0.net
アーカイヴトゥデイがGoogleキャッシュだけでなくBingキャッシュも原本と関連付けてくれれば神なんだが。

347 :215:2020/03/20(金) 19:04:44 ID:JhAw491V0.net
大住:僕は父親が来て、探偵ファイルをやめるべき理由を膨大に書き連ね
「これ以上やるなら親子関係を考えざるを得ない」と結んだ手紙を置いていきました。

wwwwwwwww

348 :192.168.0.774:2020/03/24(火) 15:24:23.68 ID:y1vf31FW0.net
Mが九つ…これはリッジレーサーのあの曲ですねぇ…間違い無い

349 :192.168.0.774:2020/03/29(日) 00:39:38.40 ID:fQaeQ4aI0.net
【リマインド】 魔法のiらんど
2020年 3/31 リニューアルに伴いホームページ機能終了
アーカイブの必要がある場合は早急に対応を。

https://maho.jp/renewal/

350 :192.168.0.774:2020/04/11(土) 13:13:02 ID:wGeDLnxf0.net
削除されたなろう小説や Wayback Machineでも見れないサイトを見たいなあ

351 :192.168.0.774:2020/04/12(日) 03:38:35.21 ID:9mojHch+0.net
レビューサイトや攻略サイトはどんなに古くても価値があると思う

352 :192.168.0.774:2020/04/17(金) 16:09:58.55 ID:jHjl/hvx0.net
Todayにリキャプチャ付いた。かわりに画像単体のキャプチャができるようになっていた。

353 :192.168.0.774:2020/04/17(金) 17:07:42.90 ID:hEp8fbMZ0.net
archive.today (archive.is)

URLがいくつもあるわけだが

archive.today
archive.is
archive.li
archive.fo
archive.vn
archive.md
archive.ph

ひとつがサーバーダウンしている時には
他のURLも使えないのかどうか。

354 :192.168.0.774:2020/04/17(金) 19:43:09.88 ID:DEdL3XQ50.net
>>353
名前を色々と増やし始めたのはこれが発端。
http://echo.5ch.net/test/read.cgi/esite/1189771222/587-590

ドメイン名乗っ取り攻撃に対する冗長性確保が目的。
何れかの名前が乗っ取られても他の名前で利用できるようにしてあるだけで、
> ひとつがサーバーダウンしている時には
> 他のURLも使え
〜るといった 20 年前みたいな事は意図していないはず。
http://o.5ch.net/1n6sx.png

355 :192.168.0.774:2020/05/10(日) 10:41:36 ID:qgpD+Q890.net
「DLsite blog」サービス終了予定のお知らせ【5/28(木) 13:59まで】
http://home-info.dlsite.com/archives/9506936.html
月末ではなく28日昼まで

356 :192.168.0.774:2020/05/10(日) 18:31:31.05 ID:0BWUOz3X0.net
>>355

> 「DLsite blog」

そんなブログサービスがあるということを今はじめて知った

357 :192.168.0.774:2020/05/13(水) 22:57:43 ID:+6V16oE90.net
>>351
そう簡単に常識が変わるわけではないジャンルだしな

358 :192.168.0.774:2020/05/21(木) 20:23:00.43 ID:tw1fIQhk0.net
ニッチなニーズかもしれませんがスクリプトを公開しました。
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper

359 :192.168.0.774:2020/05/25(月) 18:40:03 ID:DqvUJCjh0.net
2020年6月30日
連合型SNS『マストドン』 日本2位,3位のインスタンスが閉鎖
・msdtn.jp (登録20万人, 5500万トゥート)
・mastodon.cloud (利用者数6万人, 340万トゥート)

SNS『mstdn.jp』、誹謗中傷への対応の事務負担増に耐えられないと判断して6月30日で閉鎖へ
https://news.yahoo.co.jp/byline/shinoharashuji/20200525-00180247/

運営引き継ぎも募集しているらしい
https://mstdn.jp/about

360 :192.168.0.774:2020/06/12(金) 19:07:45.35 ID:Ex7ysahg0.net
コレで問題無しかな?
>>359
終了予定だった国内最大級のマストドンインスタンス「mstdn.jp」、サービス譲渡し継続
https://nlab.itmedia.co.jp/nl/articles/2006/11/news153.html

361 :192.168.0.774:2020/06/12(金) 20:04:22.23 ID:kaj5j2rY0.net
>>360

外資は儲からないと判断するとすぐ撤退する傾向が強いからなあ。不安。

362 :192.168.0.774:2020/06/12(金) 23:01:41.40 ID:r8G+EqEg0.net
「誹謗中傷の証拠取得用に」と謳った「Twitter魚拓」なるWebサービスが出来てバズってるが、
やってることは単にスクショ撮ってimgurに上げるだけらしい
スクショはブラウザの開発者機能でいくらでも改竄できるし、
これならArchive.isの方がずっと優秀だな
スクショに法的な証拠能力ってあるのかな

363 :192.168.0.774:2020/06/12(金) 23:03:10.00 ID:r8G+EqEg0.net
>>361
買収先は確かTwitter非公式クライアントの開発チームじゃなかったっけ
儲からないのは織り込み済みじゃないかな?

364 ::2020/06/15(月) 08:25:53.32 ID:8HydZjTx0.net
webrecorder.ioの名前とURLが変わった
https://blog.conifer.rhizome.org/2020/06/11/webrecorder-conifer.html
新しいURL
https://conifer.rhizome.org/

365 :192.168.0.774:2020/06/18(木) 15:31:00.91 ID:YE4F+hQG0.net
Twitter魚拓に画像ハッシュを電子署名で埋め込む機能がやっと付いたらしい
結局画像を撮る前の段階で偽造可能なのはどうしようもないけど

366 :192.168.0.774:2020/06/20(土) 02:54:49.17 ID:h9ZrYl1H0.net
archive todayの魚拓検索でURL以外の文字列入力すると
Googleのカスタム検索経由で全文検索できるようになってるな

367 :192.168.0.774:2020/06/20(土) 03:30:32.99 ID:7f7o1of+0.net
旧Yahoo地図が完全終了するらしい
ジオカタログ製の世界地図が便利だったから終了するのは惜しい

https://map.ultra-zone.net/y/35.681236/139.767125/6

368 :192.168.0.774:2020/06/20(土) 12:12:23.28 ID:D5VLdHFC0.net
Googleのやつより見やすいな
日本語で書いてあるせいか?

369 :192.168.0.774:2020/06/24(水) 20:08:29.48 ID:VaXpj8XL0.net
149 名前:名無しさん@ggmatome :2020/06/24(水) 19:41:32 ID:GJp4RZxo0
Adobe Flash Playerの2020年末サービス終了は、古いゲームの公式サイトとかに影響が出そう

370 :192.168.0.774:2020/06/25(木) 23:41:47.74 ID:dwRtuOnD0.net
ArchiveTeamがなんかやってるかなと思ったけどまだ動いてないっぽい

371 :192.168.0.774:2020/06/27(土) 14:07:35 ID:qfiK+Scz0.net
Flashの保存活動やってる人自体はいるよ
ArchiveTeamが動いてないだけかと

372 :192.168.0.774:2020/07/01(水) 06:54:14.16 ID:pvfyXrsy0.net
This URL has been excluded from the Wayback Machine.のサイトも掘り出したいわね

373 :192.168.0.774:2020/07/01(水) 07:00:53.26 ID:pvfyXrsy0.net
Wayback Machineで見れない主なドメイン
http://dion.ne.jp/
http://biglobe.ne.jp/
http://homepage2.nifty.com/

374 :192.168.0.774:2020/07/01(水) 11:22:29.30 ID:ha7maYO50.net
かなりデカい保存対象がやってきた

NAVERまとめ サービス終了のお知らせ : NAVERまとめ公式ブログ
http://navermatome-official.blog.jp/archives/83259956.html

>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。​​
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。​

375 :192.168.0.774:2020/07/01(水) 20:40:49.49 ID:36DWDi3y0.net
naverブランドじゃ将来性見えないもんな
かといってヤフー、ラインブランドに変えてまでやるほどでもないし

376 :192.168.0.774:2020/07/01(水) 22:39:13.89 ID:4eKj5JMl0.net
>>373
いちいちブロックしてたらキリがないなろう系サイトはともかく
こういうドメインは一部のサイトだけ見れないように緩和してほしいわ

377 :192.168.0.774:2020/07/02(木) 03:05:37.80 ID:qEIVQ0nx0.net
Webサイト保存してる人はなに使ってる?

自分は巡集とWebsite Explorerを使ってる

378 :192.168.0.774:2020/07/02(木) 22:25:47.86 ID:PGzwXvql0.net
>>371
ちなみにFlash のアーカイブって何やるの?

379 :192.168.0.774:2020/07/02(木) 22:55:14.72 ID:VMG0QPRf0.net
>>374
ほぼコピペしか無いサイトだからオリジナルのデータは少なそう…

380 :192.168.0.774:2020/07/03(金) 01:54:56.18 ID:pnZtief20.net
>>379
8割方はどうでもいいコピペまとめなんだけど、これを個人サイトみたいに使ってる人や、真っ当な有益情報をまとめてくれてる人もいるんだよね
そういった情報が消えるのはもったいないし、今後困る人がいそう

381 :192.168.0.774:2020/07/03(金) 22:23:28.54 ID:0J0hhHF10.net
来年から新しい著作権法が施行されるらしいけど、
ウェブ魚拓とかの古いデータが、削除されたりしないか少し心配

382 :192.168.0.774:2020/07/03(金) 23:54:06.51 ID:pnZtief20.net
ウェブ魚拓は削除申請来たらバンバン消してるらしいから今更感ある
archive.todayやInternet Archiveは著作権の前にサーバ処理が追いつくのか心配

383 :192.168.0.774:2020/07/04(土) 13:35:00.45 ID:inafeRIM0.net
>>382
同意

384 :192.168.0.774:2020/07/08(水) 22:28:06.73 ID:JMicZAgO0.net
NAVERまとめだけじゃ無くLINEノベルも終了か…
ソフトバンクグループ特有のサービス終了ラッシュ

385 :192.168.0.774:2020/07/09(木) 01:28:23.13 ID:c1obRcGo0.net
へー、ソフバンは避けよう

386 :192.168.0.774:2020/07/09(木) 03:09:48.75 ID:K/ssIawO0.net
朝鮮系は避けてたから掠りもしないw

387 :192.168.0.774:2020/07/09(木) 07:32:19.74 ID:qxukY3NX0.net
ヤフーと合併するってことはこういうことだ
米国のヤフーがその典型で、買収した企業やサービスはことごとく閉鎖させてるしね

388 :192.168.0.774:2020/07/09(木) 08:42:41.16 ID:c1obRcGo0.net
潰したい企業を買収してからわざと潰すっていう性格の悪い投資家の話聞いたことがあるけど
まさかヤフーがそれだったりしないよな

389 :192.168.0.774:2020/07/13(月) 15:08:26.85 ID:JeHTcZXr0.net
>>384
うーんこの

390 :192.168.0.774:2020/07/14(火) 15:25:35.44 ID:bp/ba6L20.net
>>351
変則将棋とかのニッチすぎるカードゲームやボードゲームのサイトもだね

391 :192.168.0.774:2020/07/15(水) 12:36:07.34 ID:6KInjDIb0.net
保存する価値が特に高いサイト
(時間が経っても役に立たなくなることがまずないため)

レビューサイト
ゲーム攻略サイト
ボードゲーム・カードゲーム関係(ただしTCGなどは除く)
タロット占いなどの占い系
料理レシピ・裁縫などの家事系

392 :192.168.0.774:2020/07/16(木) 02:27:44.38 ID:okkeNa+i0.net
ウェブ小説サイトとかも

393 :192.168.0.774:2020/07/17(金) 17:41:35.04 ID:iWA6pxH10.net
旅行・探検系も含めていいかも
あと災害etcで現存しない場所の訪問記とか

394 :192.168.0.774:2020/07/18(土) 01:13:41.89 ID:MoAmN+OG0.net
昔のイベント体験記もだな

395 :192.168.0.774:2020/07/18(土) 01:27:31.30 ID:MoAmN+OG0.net
ついでに暇つぶしにネット検索してたら
ocn1.netなるサイトを発見した

396 :192.168.0.774:2020/07/18(土) 02:15:45.46 ID:HI8FU48P0.net
>>395
https://www.google.com/search?q=site:ocn1.net&lr=lang_ja&newwindow=1&hl=ja&tbs=lr:lang_1ja&sxsrf=ALeKk03M6bSG2JwS_U8icd02MQFRuM0Vsg:1595006071724&ei=d9wRX__qK7KCr7wPofi7mAQ&start=200&sa=N&ved=2ahUKEwi_gsfS5NTqAhUywYsBHSH8DkM4ZBDw0wN6BAhlEDQ&biw=944&bih=1083

397 :192.168.0.774:2020/07/18(土) 14:45:04.72 ID:42EZKBGK0.net
>>391-394
こういうサイトを優先的に保存すべきだな

398 :192.168.0.774:2020/07/19(日) 04:44:14.87 ID:lFOHvKxW0.net
こういう魚拓系サイトってエロ動画とか保存いけんの?

399 :192.168.0.774:2020/07/19(日) 14:44:03.36 ID:5VoHw/dK0.net
ocn1.netってサーバー名だったのかサイト名ではなかったのか
キューブのへやは一通り保存しといたけど他にもいっぱいあるやん

400 :192.168.0.774:2020/07/21(火) 21:19:19.64 ID:iEzABfS/0.net
2020年8月31日(月)サービス終了
暮らしのレシピ投稿サイト 「 nanapi 」
https://nanapi.jp/

料理:約11000ページ
ライフハック & 雑学系:約8000ページ

暮らしの情報サイトnanapi終了のお知らせ
https://nanapi.jp/info/9
Twitter @nanapi
https://twitter.com/nanapi
(deleted an unsolicited ad)

401 :192.168.0.774:2020/07/22(水) 00:43:31 ID:Qv2V5tOA0.net
>>400
保存する価値が高いな

402 :192.168.0.774:2020/07/22(水) 06:22:06.26 ID:5ZyfxxsF0.net
検索サイトにアーカイブが引っ掛かる又はWeb Archiveに保存されてる以外だと実質的な消滅に等しい

403 :192.168.0.774:2020/07/25(土) 12:03:11.28 ID:vPQBVdbR0.net
> お知らせです。Neverまとめ終了に伴い、【実走!酷道・険道のまとめ】についても、終了させることにしました。
>2013年以来、約7年間のご利用有難う御座いました。
>道路ネタについては、引き続きツイートしていきます。どうぞ、宜しくお願いします。
twitter.com/kendou774/status/1286852266280890368
(deleted an unsolicited ad)

404 :192.168.0.774:2020/07/25(土) 20:28:57.46 ID:op0juaWZ0.net
ウェイバックでアーカイブしたNAVERまとめ記事でページ移動しようとすると
URLにgrid=falseっていうパラメータが追加されるみたい
誰か原因わかる人いる?
このせいでせっかくアーカイブしても2ページ目以降が参照できない問題が起きてしまう

405 :192.168.0.774:2020/07/25(土) 23:03:50.67 ID:vPQBVdbR0.net
>>404
自分が取ったアーカイブはそんな症状は出てないな
その問題が出たアーカイブのURLを教えてくれんか

406 :192.168.0.774:2020/07/26(日) 00:15:07.54 ID:6TmDXbEI0.net
>>405
例えばこのまとめのアーカイブ
2159020990876963301

2ページ目のボタンを押すとこのページに移動してエラー
2159020990876963301?page=2&grid=false

何度か試すと通常通りのページが表示される時もあるようで、今一どういう条件で発生するのかわからない

407 :192.168.0.774:2020/07/28(火) 01:55:57.75 ID:GOjmQFzm0.net
>>406
そのまとめではエラーにならなかったが、別の複数のまとめでエラー発動したわ
条件は全然分からないな

408 :192.168.0.774:2020/07/31(金) 18:21:02.96 ID:hz5s2lhM0.net
最近/save/の後にURLつけてブラウザで踏んで保存しようとするととんでもなく時間かかるようになってるんだけど
もっと早く保存する方法ないかな

409 :192.168.0.774:2020/07/31(金) 19:38:16.52 ID:gaCi8uhU0.net
>>408
同じく
しかもちゃんと保存できてるかどうかも怪しい

410 :192.168.0.774:2020/07/31(金) 20:26:07 ID:TTL90URn0.net
これ使えんの?
175 名前:py ◆o3kzHb/in8w0 [sage] 投稿日:2019/05/14(火) 19:06:58.64 ID:cP8wStLG0
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1

411 :192.168.0.774:2020/07/31(金) 21:15:44.33 ID:x6UEbNzr0.net
>>410
自分で使ってみては?
レビューしてくれ

412 :192.168.0.774:2020/07/31(金) 22:16:46 ID:BOBaNxn40.net
>>411
>>408-409
へのレスしたつもりなんだけどね
誤解させてごめんねw

413 :192.168.0.774:2020/07/31(金) 22:59:42 ID:x6UEbNzr0.net
>>412
理解した

このところ/save/にURL繋げて直接保存させるのやってないから分からんけど、
ブラウザのsave page nowのフォームから保存するときとは色々処理が違うのかもね
最近Waybackの調子が特に良くないらしいから多分サーバ自体の問題だとは思うけど

414 :192.168.0.774:2020/08/02(日) 02:59:54.76 ID:BxGk29Xt0.net
Naverまとめを色々漁ってたらネット上で出回ってるコラの元画像・出典を集めたやつがあった
単なる宣伝まとめに完全汚染される前は、こういう地味だけど役立つまとめを書く人がそこそこいたんだけどな...
00年代から10年代のインターネットの残滓みたいな側面もあっただけに惜しい話だ
ArchiveTeamにどうにかして持っていきたい

415 :192.168.0.774:2020/08/04(火) 10:42:23 ID:kQccth3l0.net
昔のエロゲーとか普通の深夜アニメとかの公式サイトで保存されていないページが時々ある

416 :192.168.0.774:2020/08/07(金) 14:35:38.67 ID:SiHrQHil0.net
Googleマップの埋め込みはArchiveTodayで録れる

417 :192.168.0.774:2020/08/15(土) 19:40:30.73 ID:PMZXDU5C0.net
>>398
無理じゃね?

418 :192.168.0.774:2020/08/16(日) 20:27:14.92 ID:98xsFRfG0.net
ストリーミング配信のクロールは技術的に結構難しい

419 :192.168.0.774:2020/08/16(日) 20:27:47.53 ID:98xsFRfG0.net
動画を保存するならメタデータを含めた上で普通にダウンロードした方がいい

420 :192.168.0.774:2020/08/18(火) 18:55:08 ID:e28RrLlN0.net
トップページは見れるけど細かい中身までは保存されてないのか見れないことが多いわね 特に画像や動画は死んでる

421 :192.168.0.774:2020/08/18(火) 21:04:20.75 ID:xoxZKMa90.net
さくらインターネット専用サーバ
2020年11月30日で全て終了

422 :192.168.0.774:2020/08/18(火) 23:33:08.82 ID:FetPd1Vj0.net
>>421
古い専用サーバだけが対象

>この度、1997年6月より提供開始した「専用サーバ」および2007年1月より提供開始した「専用サーバ Platform Ad / St」につきまして、
>2020年11月をもちまして、サービスを終了いたします。
>これらサービスは、サービス開始から10年以上の期間が経過しており、今後、保守部材の確保ができず、サービス継続が困難な状況でございます。
>さくらの専用サーバ(2012年2月 提供開始 〜 現在申込受付)」はサービス終了の対象ではございません。
https://server.sakura.ad.jp/dedicated_server_end/

423 :192.168.0.774:2020/08/19(水) 17:14:03.56 ID:iZ5+0Ecr0.net
>>422
既に消えてるページあるよ
エロゲの回想未収録エロを個別セーブデータで対応してくれてたサイトとか
まあlzhの脆弱性騒動でlzh書庫セーブデータはsなしhttp,xp,win7締め出しみたいにサーバ側に既に全消去されてたけど
http://daidokoro.sakura.ne.jp/data/eroge_data.htm
http://web.archive.org/web/20180430112946/http://daidokoro.sakura.ne.jp:80/data/eroge_data.htm

NGワード引っかかったから、気になるなら半角にテキストエディタかなんかで変換して

424 :192.168.0.774:2020/09/06(日) 17:22:46.19 ID:CBf1XfYV0.net
サービス終了のお知らせ

長らくのご利用まことにありがとうございます。
大変恐れ入りますが、当サービスは2020年9月末をもって終了させていただきます。
mobile space

携帯(ケータイ)無料ホームページ提供フリーサイト「MobileSpace(モバスペ)」
http://m-space.jp/

425 :192.168.0.774:2020/09/07(月) 12:06:40.69 ID:3OpmkuSp0.net
Naverまとめのバックアップしてる有志いないかー?
自分も最近バックアップしてるんだがURL集めとかどこにすればいいかわからない

426 :192.168.0.774:2020/09/07(月) 15:14:13.63 ID:3OpmkuSp0.net
>>404
それはしゃあない、NAVERまとめは2ページ以降のURLも規則的だから、そこは見る側がインターネットアーカイブからURLをいじってアーカイブを見る方法しかないと思う
2ページ以降のURLがわかる以上アーカイブするにあたってそこまで気にしなくてもいい

427 :192.168.0.774:2020/09/08(火) 03:14:53.75 ID:rgMOAV4l0.net
>>397
同意

428 :192.168.0.774:2020/09/08(火) 22:10:50 ID:+a/fwcct0.net
将来役に立つか分らんけど書いとく
Naverまとめは2ページ目以降のURL末尾が
?: ?page=ページ番号
?: ?&page=ページ番号
の2パターンあるので注意
通常であれば2ページ目→?、3ページ目以降→?のパターンで保存されてるはず(だが例外もある)
あとはこの辺 >>404 >>406

429 :192.168.0.774:2020/09/09(水) 08:08:33.67 ID:iGXkHt4n0.net
とりあえず作ったからURL集めここにしないか?
NAVERの終了近づいてるから立てといた
https://jbbs.shitaraba.net/internet/25479/

5chだと多量URLは規制くらうし、かといっていちいちGeoLogみたいなURL集め場作るのもあれだし
したらばはGoogle検索ひっかかるししたらば自体もアーカイブできるから万が一にも備えられるしURL保管庫としては優秀
後から集めたURLにタイトルつけてスレ立てすれば後世代の人がググって見つけられる可能性が出てくるのが大きい
他にサービス終了候補出たらここにスレ立ててURL集める感じで

430 :192.168.0.774:2020/09/09(水) 22:03:15 ID:GaAB5Js70.net
>>429

汎用的に使えるし次スレからここのテンプレに入れた方がいいな

>>429は念の為にトリップ付けてしたらばと5ch両方に書き込んでおくと良いかも
したらばと5ch(&おーぷん2ch)とではトリップの生成アルゴリズムが違うらしく同じ名前でも違うトリップになるけど、とりあえずでも管理人だという証明がある方が何かと安心だしね

431 :◆Oddz6L15vQ :2020/09/09(水) 22:23:41 ID:iGXkHt4n0.net
>>430
OK、付けておく

432 :192.168.0.774:2020/09/10(木) 17:58:45.52 ID:lCL9EyAY0.net
150万記事くらいURLかき集めてタイトルとページ数もセットで保存してあるよ
ArchiveTeamにも先月渡したんだけどどうやら忙しいらしくて動きがない

433 :192.168.0.774:2020/09/10(木) 20:34:28.12 ID:S0dI6L/m0.net
>>432
ArchiveTeamに渡すってことはインターネットアーカイブには保存できてないってこと?

434 :192.168.0.774:2020/09/11(金) 15:17:14.37 ID:FY5rw0Vj0.net
>>433
ArchiveTeamが保存したサイトはWayback Machineにアップロードされて、最終的にちゃんとInternet Archiveに保存される仕組みになってる

435 :192.168.0.774:2020/09/11(金) 15:43:42.84 ID:FY5rw0Vj0.net
>>432
150万はすごいな、何を使って収集したのか気になる
あとArchiveTeamとのコンタクトってどうやって取ったん?
サイトの説明を色々読んでるけど窓口が見つからない

436 :192.168.0.774:2020/09/11(金) 17:53:04.83 ID:vIEy03BU0.net
>>434
いや、そういう意味ではなくArchiveTeamの動きないってことはインターネットアーカイブに保存できてないんじゃないかってこと
もしインターネットアーカイブに現時点で保存できなくて、ArchiveTeamに動きなければ>>432がローカルで保存できてない限り9月30日を迎えたらそれも無駄になる

437 :192.168.0.774:2020/09/11(金) 18:38:50.57 ID:FY5rw0Vj0.net
>>436
なるほどな、確かにArchiveTeamに動きがなかったら保存されないね

ArchiveTeamが今どういう状況なのかがよく分からないんだけど、本当にNAVERまとめは一切手付かずなのかな?

438 :192.168.0.774:2020/09/11(金) 19:41:43.80 ID:vIEy03BU0.net
>>437
いろいろ保存してるけど本当に2ページ以降はクロールされてないよ
クローラーの仕様でGoogle検索に出る1ページだけは保存されるけど
だから人力で保存されてる記事はあんまりないね

439 :192.168.0.774:2020/09/12(土) 09:44:43.85 ID:+xgSs3Ql0.net
>>438
もう自分でクローラソフト動かしてローカルに保存した方が安心じゃね?
ネットのデータなんて今じゃいつ消えるか分からない
もうバックアップのバックアップ(調子悪くてバックアップ後に取り外したHDDに入れっぱなしのデータ等)くらいのオマケ

アーカイブサイトに保存して安心してたら見られなくなってて、
txtでちょっとメモした断片的情報しか手元に残ってなくて絶望したわ

440 :192.168.0.774:2020/09/12(土) 12:00:07.88 ID:G5q1lmCg0.net
>>439
確かにそれもそうだし愛読書のごとく読むようなウェブページはpdf化してるけどさ
やはりローカル保存じゃ限界がある、数万記事とか保存しようものならHDD持たないし
それにアーカイブに保存する理由はみんなが見れるからね、知恵袋や古い2chの過去ログ見ててそこのリンクがリンク切れになっても大丈夫なようにある
インターネットアーカイブが消えるときってやっぱり削除要請に応じてるからなのかな
今のところ自分で保存した記事で消えた経験はないが、削除要請以外の自動削除はないと信じたい

441 :192.168.0.774:2020/09/12(土) 12:06:20.24 ID:G5q1lmCg0.net
ちなみにArchivetodayや他の魚拓サイトは個人経営らしいから経営者が死んだらサーバー更新できず見られなくなるから、そこに大事なものがあればローカル保存したほうがいい、数十年後に見られなくなってる可能性あるし
やはり数百年後の人類に情報を残すなら法人経営のインターネットアーカイブ

442 :192.168.0.774:2020/09/12(土) 14:19:44.63 ID:smUg5j0l0.net
>>439
そうなんだよなあ
前にインターネットアーカイブで閲覧してた削除済みのサイトが
「This URL has been excluded from the Wayback Machine」で
見られなくなってしまってローカルに保存していなくて今も後悔してるわ
前は見られていた分ショックがでかい

こういうのってドメイン再取得した人が解除申請出すしかまた見られる
方法ないのかね?
これって「完全に削除」されたわけじゃなくて単純に「除外」された状態らしいから

443 :192.168.0.774:2020/09/12(土) 19:09:30.26 ID:G5q1lmCg0.net
>>442
除外したってことはやっぱりサーバーの容量不足とかじゃなくて要請に応えただけか
サービス終了とかじゃなくてそのページがあると都合が悪いからって意図的に消してるのはローカル保存しかないと思うよ
俺は何回も読むサイトは1ページだけならpdf化してる
さすがに保存対象のURLが何個もあるサイトを全部やるのは面倒だけど
ドメイン再取得していけるかはわからんけど管理者であったことを証明しないとさすがに難しいんじゃないか?でも今の管理者ではダメとも限らないしなー

444 :192.168.0.774:2020/09/12(土) 19:14:06.20 ID:GdLneOCP0.net
>>443
クローラソフトで.mhtやindex.html等で階層いくつ潜るか設定してクロールすればいいじゃん

445 :192.168.0.774:2020/09/12(土) 19:35:49.12 ID:smUg5j0l0.net
>>443
>>444
微妙なラインだよなー
ぶっちゃけるとそのサイトはジオシティーズドメインのページで、ジオシティーズの
URLは普通にアーカイブ何万も保存されてて見られるんだけど、そのドメインのサイトは
除外されてるんだよな
自分はそもそもの管理者じゃなくてそのページのファンで、もしまた見られるなら
自分が読んで楽しみたいだけなんだけど、やっぱ厳しいかもしれんな

446 :192.168.0.774:2020/09/14(月) 03:08:56.33 ID:W68LNMti0.net
ArchiveTeamがNAVERまとめのアーカイブ作業に取り組み始めてくれてたみたい
進捗はわからないけど、これでひとまず安心かな
漏れもあるだろうから重要なページは各自で保存する必要があるけどね

>>435
pythonでスクリプト組んで収集した
ArchiveTeamはIRCを使って活動してる
サイトの#から始まるリンクをクリックすれば各プロジェクトに対応したチャットルームに行けるよ
コマンド入力でクローラ操作してる人がいるArchiveBotの部屋が活発なイメージ

447 :435:2020/09/14(月) 04:11:09.04 ID:Np2NU3M80.net
>>446
なるほど、どうもありがとう
ArchiveTeamが動いてくれたなら最悪の事態は避けられるはずだな...
もちろん>>432(446)の収集したURLあってこその事だから自分も見習わないといけないが

448 :446:2020/09/14(月) 11:29:54.09 ID:sR0ATY0Y0.net
NAVERまとめデータ共有
csvデータ(URL, ページ数, タイトル)記事数:1472709, 更新日昇順, 192 MB
https://web.archive.org/web/20200913150754if_/https://transfer.notkiska.pw/r9mfn/NAVER_matome_article_list.csv

※収集後に更新されたことでタイトル、ページ数が異なったり削除されていたりする可能性あり
トピック一覧ページから収集したからトピックが設定されてない記事は1つも収集できてない

449 :192.168.0.774:2020/09/14(月) 15:27:58.62 ID:Np2NU3M80.net
>>448
503エラーのページがアーカイブされているんだが

450 :192.168.0.774:2020/09/14(月) 15:30:52.44 ID:fWxNFkB80.net
ごめんなさい。恥ずかしいのですがarchiveteamって何ですか?

451 :192.168.0.774:2020/09/14(月) 15:32:16.47 ID:Np2NU3M80.net
Wayback Machineが一時的に落ちてただけだった
何回かリロードしたらちゃんとダウンロード出来たわ、すまん

452 :192.168.0.774:2020/09/14(月) 15:36:10.18 ID:Np2NU3M80.net
>>450
ウェブアーカイブを組織的にやってる(おそらく非営利の)団体
ArchiveTeamが保存したコンテンツはInternet Archiveで公開される仕組みになってる
正直に言うと自分もArchiveTeamの公式サイトを読んでる途中だから、具体的な活動の様子とかはちょっとわからない
https://ja.wikipedia.org/wiki/Archive_Team
https://www.archiveteam.org/

453 :192.168.0.774:2020/09/17(木) 17:02:04.46 ID:/9nSrgLL0.net
【ネット】1000万件以上の研究論文がオンライン上から消失することを防ぐインターネットアーカイブの取り組みとは?  [すらいむ★]
http://egg.5ch.net/test/read.cgi/scienceplus/1600244016/

454 :192.168.0.774:2020/09/24(木) 21:11:36.87 ID:kg/LREFg0.net
Braveの機能を使って少額寄付した

455 :192.168.0.774:2020/09/25(金) 12:26:47.34 ID:Cm7cjbfH0.net
>>454
Braveいいよね特にスマホ
ポイントサイトで乞食活動やるよか割もいいし

456 :192.168.0.774:2020/09/28(月) 05:48:18.46 ID:ydgdSdUA0.net
今更NAVERまとめをローカルに落とそうとしているのだが
Website Explorer・WinHTTrack・Cyotek WebCopy
はうまくいかず(設定ミスがあるのか?)

NAVER&FC2まとめダウンローダ
http://shimarisu.webcrow.jp/naver_matome.html

は画像もhtmlも一応取れるのだがhtmlにダウンロードした画像
はリンクされてない。
後はmhtとpdfぐらいしか無く……

他の人はどのようにローカルに落としているのでしょうか?

457 :192.168.0.774:2020/09/29(火) 11:41:45.96 ID:IYXlvscX0.net
そもそもローカルに落としてないな...
Wayback Machineに頼ってる

458 :192.168.0.774:2020/09/30(水) 00:31:14.62 ID:6Ozi/51l0.net
Naverまとめはほぼバックアップされてるっぽいから安心した
ただNaverのトピックのアーカイブの表示がいろいろおかしい、まったく違う記事名出たりする
どうやらNaver側はURLの大文字と小文字を区別してるのにウェイバックマシン側では区別してないから発生するバグっぽい
トピック見れなかったら別の時間のアーカイブ参照すると見れることがある
例えばトピックのIDがaaabbの場合IDがAaaBbやAAABBの別トピックもウェイバックマシン側がaaabbとして扱うから収集された時間で記事が混在する
2ページ以降のトピック表示は2ページ目の存在による
aaabbにだけ2ページ目以降が存在すればaaabbしか表示されない、他のIDにもあると2ページ以降も混在状態になる
aaabbに2ページ目がなくてAaaBbにある場合もURLいじったりして2ページ以降行くとAaaBbの2ページ目が表示される
NAVERまとめ共有データの中を特定のワードで検索してそこのまとめにアクセスして所属トピック押せばある程度好きなトピックに飛べるから有効に使えると思ったけど少し難ありか
記事にはまったく関係ないから大丈夫、トピックURLが英数字5文字で大文字小文字の違いで別ID扱いされる仕様により起きてるだけだから
記事の中身のURLで個別化されている部分は全部数字だから大丈夫

459 :192.168.0.774:2020/09/30(水) 14:43:23.75 ID:g0DIZp7G0.net
ツイッターを見ているとNAVERまとめがなくなったことを喜んでる人結構多いし、
何なら「あんなの保存しとく価値はない」みたいな意見も見受けられる
でも、アーカイブが必要かどうかを判断するのは現在生きている自分たちじゃなく将来の人々だと思うんだよね

自分もYahooブログが終わった時は「あんなの保存したってしょうがないだろう」と思っていた側だったんだけど、サ終してしばらく経ったある時、
自分の専門分野に関するとある重要な記録がYahooブログ上で公開されていたらしいこと、
なおかつブログ主が亡くなっていて再公開の見込みもないこと、
そしてどこにもそのアーカイブが残っていないらしいことが判明して、かなり後悔した事があった
これはあくまで一例に過ぎないけども、とにかくWebアーカイブを取る必要があるかどうかは取る側の人間ですら判断できるものじゃないんだと思うわ
長文&自分語りすまない

460 :192.168.0.774:2020/09/30(水) 14:52:44.90 ID:g0DIZp7G0.net
しかしまあNAVERまとめをブログ代わりに使ってた人結構多かったみたいだな

461 :192.168.0.774:2020/09/30(水) 15:31:27.75 ID:aEbDHVq00.net
>>459
バカッターなんて結論決まってて後押し(確証バイアス)がほしい時だけ見るもんだよ
今回のなんて馬鹿は想像力も共感力も低くて他人の痛みが分からないから見るだけ無駄だったわけだし

462 :192.168.0.774:2020/09/30(水) 17:47:30.32 ID:g0DIZp7G0.net
>>461
確かにそれはそういうものなのかもしれないな

463 :192.168.0.774:2020/10/04(日) 01:53:55.83 ID:t5NF2s3S0.net
ArchiveTeamのリソースほんとすごいな...

464 :192.168.0.774:2020/10/05(月) 21:28:33.39 ID:PD0n9p530.net
「Webスペース」 サービス提供終了について
https://www.so-net.ne.jp/info/2020/op20200908_0039.html

平素はSo-netをご利用いただき、誠にありがとうございます。

このたび、誠に勝手ながら、2021年1月28日(木)をもちまして、「Webスペース」サービスの提供を終了させていただくこととなりました。

465 :192.168.0.774:2020/10/05(月) 21:28:48.86 ID:PD0n9p530.net
https://www.so-net.ne.jp/option/upp/
U-page+は、2021年1月28日(木)15:00 にサービスの提供を終了します

466 :192.168.0.774:2020/10/06(火) 12:42:46.60 ID:phjE2/zo0.net
so-netが終了したらまた古のインターネットが色々消えるな

467 :192.168.0.774:2020/10/06(火) 22:52:50.75 ID:DBLhvSyO0.net
So-netブログはSeesaaに成ったからブログ以外か…

468 :192.168.0.774:2020/10/07(水) 04:16:18.40 ID:dojvgnQy0.net
自分のブクマに入ってたのはこれくらいだな
埋もれてるけど価値があるページはかなり沢山ありそうな気がする
http://www002.upp.so-net.ne.jp/jsrc/dust/eva.html
http://www004.upp.so-net.ne.jp/anubis/index.html
http://www004.upp.so-net.ne.jp/upc/
http://www004.upp.so-net.ne.jp/kuhiwo/dazai/index.html

469 :GeoLog Project :2020/10/11(日) 16:23:42.66 ID:wq/dYYyR0.net
so-netのURL収集を始めることにしました
知っているURLがあれば追加してください
現時点でユーザー名単位で2万程度、個別URLでは300万くらいDBに入ってます

https://geolog.mydns.jp/so-net/

特にJavaScript等から呼び出されるファイル群は網羅が難しいので、何か良い手があれば

470 ::2020/10/13(火) 01:07:49.82 ID:y1bzU/4u0.net
>>469
日本語版ウィキペディアの外部リンクから2000個ほど抽出したんですが、スクリプトでの送信とかって受け付けてます?
(既に収集済みのものとだいぶ被りがありそうですが)

471 :GeoLog Project :2020/10/13(火) 19:39:50.63 ID:5fIpkaAP0.net
>>470
特に制限はしてないですが、処理速度的に現実的ではない気がするので、
フォームを改行区切りで複数受け付けられるように直したいと思います

472 :GeoLog Project :2020/10/13(火) 22:03:48.69 ID:5fIpkaAP0.net
>>470
複数行投入できるようにしました

473 :192.168.0.774:2020/10/13(火) 23:27:30.09 ID:vjEziSOV0.net
geocitiesのときはそれなりに貢献できたけど今回はブクマ見てもso-netなかったわ・・・

474 :あめ :2020/10/18(日) 05:37:28.91 ID:SRaefsBF0.net
【告知】ニコニコ動画のコメントサーバーリニューアルについて
https://blog.nicovideo.jp/niconews/141893.html
> マイメモリー機能の提供を終了
> ・マイメモリーの新規作成や、 既存マイメモリーの視聴ができなくなります
> 削除された動画へのコメント投稿とコメント表示の終了
> ・ 動画タイトルや説明文などの情報も表示されなくなります

期限は「2021年の春までに実施」とのこと

475 :192.168.0.774:2020/10/18(日) 15:46:35.08 ID:kWrTLNjS0.net
削除済み動画を全部リストアップして、動画説明文/タイトル/コメントなどの情報を取得していく感じか
コメントに関してはXML形式で取得する手法があったような気がする
マイメモリー機能は使ったことないから分からん

476 :192.168.0.774:2020/10/18(日) 15:47:20.86 ID:kWrTLNjS0.net
sm1から順に数字をカウントアップしていけばいいのかな

477 :192.168.0.774:2020/10/19(月) 19:56:27.93 ID:PssRg44Z0.net
>>472
検索で引っかかったサイトは送信した
WaybackMachineにも保存できないかな

478 :192.168.0.774:2020/10/20(火) 00:42:22.74 ID:U91haJxZ0.net
モバイルサイトのないサイトは来春インデックスから消える? Googleアナリストが明言
https://internet.watch.impress.co.jp/docs/yajiuma/1283657.html

479 :192.168.0.774:2020/10/20(火) 18:21:05.26 ID:eWiUZHxk0.net
>>478
Google検索なんて糞化が酷くてもう使ってないからどーでもいい

480 :192.168.0.774:2020/10/20(火) 23:29:11.48 ID:Puq2k3e00.net
世界一使われてる検索エンジンだしな
個人の好みとしてはGoogleが何をしたってどうでもいいとしても、
影響力を考えると決して無視はできないよ

481 :192.168.0.774:2020/10/21(水) 03:05:19.74 ID:2kIOGutW0.net
数年前からネットサーフィン=スマホに成ったからなぁ…

482 :192.168.0.774:2020/10/21(水) 18:11:15.59 ID:le0ESoNU0.net
Google 絶対じゃなくなったんであまり件数ヒットしない検索ワードは Bing や Yandex 併用だよ。

483 :192.168.0.774:2020/10/21(水) 22:24:10.23 ID:Yfu1DTmm0.net
DuckDuckGoで出ない時だけGoogle

484 :192.168.0.774:2020/10/23(金) 16:57:51.30 ID:qVAboCuj0.net
>>477
誰かがArchiveTeamにURLリスト渡してくれれば多分保存できる
NAVERまとめの時はアーカイブ開始までに1ヶ月くらいかかったから保存したい場合は早めに相談したほうがいいかも

485 :192.168.0.774:2020/11/03(火) 09:39:05.85 ID:q2UfgLtS0.net
wgetでWARC.GZファイルを書き出したとき画像ファイルとかも格納される?
どなたかご存知だったらお願いします

486 :192.168.0.774:2020/11/04(水) 22:28:08.38 ID:iEXbTPK90.net
>>485
WARCは画像ファイルや音声ファイルも含めてページを丸ごと保存する仕組みになっているから、
--page-requisitesオプションを付けて確実に画像がダウンロードされるように指定すれば、ちゃんと画像が格納されるはず

487 :192.168.0.774:2020/11/04(水) 22:30:48.96 ID:iEXbTPK90.net
WARCの概要を解説してる日本語サイトをいくつか貼っておく
https://warp.ndl.go.jp/contents/reccommend/mechanism/mechanism_warc.html
https://qiita.com/mugwort_rc/items/459d4872168e2cc28ba1

488 :192.168.0.774:2020/11/05(木) 16:18:21.95 ID:bSeXiffE0.net
>>487
ありがとです
--page-requisitesがうまく反映されてなかったみたいでした

489 :192.168.0.774:2020/11/05(木) 17:30:05.38 ID:M9nLXqV10.net
コロナ騒動の最中に消えていったお店のサイトも手動で保存している。

490 :192.168.0.774:2020/11/08(日) 00:21:48.98 ID:c3JWvanA0.net
「Infoseek」一部サービス終了のお知らせ(11/2追記)
https://plaza.rakuten.co.jp/usersupport/diary/202008210000/

Infoseekトップページ変更、翻訳、辞書が終了

491 :192.168.0.774:2020/11/22(日) 08:30:10.87 ID:q2CdPGCc0.net
>>469 を使ってみた
URLをページ内検索で探したらなかったのに、送信するとDBにあると出た...
ページ内検索がダメなのかな
あと、文字化けしているところがあるけど大丈夫なのかな

492 :GeoLog Project :2020/11/22(日) 13:39:23.43 ID:nA7b/lhh0.net
>>491
どのURLでしょう?

ロジック上は文字コードを考慮していないので、文字化けはそのせいかもしれないです
一応UTF-8のはずなんですが

493 :192.168.0.774:2020/11/26(木) 12:16:05.64 ID:8QHBEnW70.net
ttps://archive.st が全然取れなくなってしまった

494 :192.168.0.774:2020/12/04(金) 19:50:57.91 ID:UDGmJ95l0.net
>>493

復旧した?

495 :192.168.0.774:2020/12/04(金) 21:37:24.55 ID:Onk8N+kv0.net
そこってサイトによって取れたり取れなかったりしない?

496 :192.168.0.774:2020/12/05(土) 10:13:49.51 ID:jr20iitY0.net
>>493
そこって消える前のフリーウェアとかアーカイブ出来ないクソじゃね

497 :192.168.0.774:2020/12/10(木) 20:48:32.73 ID:vQ+C+6Ux0.net
>>496
自分の目的が果たせないものをクソ扱いするのは幼稚だからやめような
フリーウェアはInternet Archiveに持っていくとか、
証拠に使うから削除されたくないものは削除申請が通りにくいarchive.today使うとか、
各サービスを使い分けるのがより無難だよ

498 :192.168.0.774:2020/12/12(土) 15:13:48.12 ID:ELOCcQrr0.net
「Yahoo!ライフマガジン」サービス終了のお知らせ
この度「Yahoo!ライフマガジン」は、2021年3月31日(水)をもちまして、サービスを終了させていただくことになりました。
記事コンテンツは、引き続き「Yahoo! MAP」アプリ上でご覧いただけます。
これまで長きにわたりご利用いただき、ありがとうございました。

499 :192.168.0.774:2020/12/14(月) 04:34:30.82 ID:h53jvyxt0.net
chakuwiki存亡の危機

友人との永遠のお別れ
https://midorikawa.themedia.jp/posts/10408887/

運営していた谷口 一刀さんが8月に亡くなられた事により
12月にドメイン名でのアクセスが不能になった。
(IP https://52.69.139.163/ では可能)

遺族は存続に消極的みたいな模様。


バックアップはしてみたいものの
かなりの容量だと思われるからなあ〜
どのぐらいの大きさなんだろうな。

500 :192.168.0.774:2020/12/14(月) 06:32:22.27 ID:9FaOalLE0.net
もっと早く情報投げて貰えればドメイン失効前にどうにか出来たのに

501 :192.168.0.774:2020/12/14(月) 07:41:39.26 ID:gA+U1PtW0.net
>>499
https://chakuriki-alb-971307490.ap-northeast-1.elb.amazonaws.com
も可能

502 :192.168.0.774:2020/12/14(月) 14:54:55.41 ID:9FaOalLE0.net
ChakuwikiってMediaWikiだったのか
それなら一応記事のエクスポート機能があるから、これに頼るのが現実的かな
https://www.mediawiki.org/w/index.php?title=Help:Export/ja

503 :192.168.0.774:2020/12/14(月) 16:04:34.06 ID:gA+U1PtW0.net
>>502
[[特別:統計]]によると記事だけで17,306個もあるみたい
Botとかで一度にエクスポートできるの?

504 :192.168.0.774:2020/12/14(月) 16:08:04.03 ID:gA+U1PtW0.net
>>503
勘違いしてた。一度にできる方法があるのか

505 :192.168.0.774:2020/12/14(月) 16:32:18.01 ID:9FaOalLE0.net
chakuwikiスレにこのスレッドのURLを書くだけ書いてきた

506 :192.168.0.774:2020/12/14(月) 17:13:49.04 ID:evtrCVrO0.net
みんな有能やん

507 :192.168.0.774:2020/12/14(月) 17:25:23.30 ID:4RCQuIfW0.net
archive teamにwiki保存担当のwiki teamってのがあるからそこで事情を話せば多分保存してくれる

wiki teamのチャットルーム
https://webirc.hackint.org/#irc://irc.hackint.org/#wikiteam

wiki teamについて
https://www.archiveteam.org/index.php/WikiTeam

508 :507:2020/12/14(月) 18:15:31.65 ID:4RCQuIfW0.net
どうなるか分からないけどwiki teamに伝えておいた
今調べてくれてるらしい

509 :192.168.0.774:2020/12/14(月) 19:01:14.69 ID:9FaOalLE0.net
>>508
GJ

510 :507:2020/12/14(月) 19:29:16.39 ID:4RCQuIfW0.net
SSLの問題で通常のwikiのダンプツールが機能しないらしい
詳しい人いますか?

511 :507:2020/12/14(月) 19:38:36.21 ID:4RCQuIfW0.net
すまんアーカイブの準備がある程度できたらしい
wiki team

512 :507:2020/12/14(月) 20:10:05.26 ID:4RCQuIfW0.net
変更になるかもしれないけど今のところChakuwikiのアーカイブ状況は
このページから確認できる (ident: 2ns616z58rh5gawijen5s2foi)
http://dashboard.at.ninjawedding.org/3

アーカイブ対象のURLは https://52.69.139.163/
ある程度時間が経ったらWayback Machineに反映されるよ

513 :192.168.0.774:2020/12/14(月) 20:33:04.32 ID:azqdHITb0.net
乙!

514 :192.168.0.774:2020/12/14(月) 20:33:12.40 ID:u61g8tyn0.net
有能

515 :192.168.0.774:2020/12/14(月) 21:19:05.89 ID:v8wPmt2c0.net
教えて下さい。
Chakuwikiのこのページをアーカイブ化したいんですが、
なぜかうまくいきません。
https://52.69.139.163/index.php/中野_(中野区)
なにかエラーかバグが起きているようなのですが、
回避策はないのでしょうか。

516 :192.168.0.774:2020/12/14(月) 21:26:38.73 ID:9FaOalLE0.net
>>515
Internet ArchiveのSave Page Nowで'Job failed'とか出るということなら、それはInternet Archive側の内部エラーだからどうにもならない

517 :192.168.0.774:2020/12/14(月) 21:27:56.18 ID:h53jvyxt0.net
>>512
アーカイブ対象はIPで保存しているようだけど
Wayback Machineにはドメイン名でアクセスできるのでしょうか?

518 :192.168.0.774:2020/12/14(月) 21:34:23.14 ID:9FaOalLE0.net
>>517
無理なはず
アーカイブをした対象のURLがIPアドレスであるならば、Wayback MachineにもIPアドレスのまま保存されます
chakuwiki側がドメインを改めてIPに紐づけた上で、もう一度アーカイブを取り直すしかないです

519 :192.168.0.774:2020/12/14(月) 22:27:22.40 ID:y0BEHrZG0.net
>>507
archive.org にサイト指定してarchive bot走らせること依頼出来るの知らんかった
ニコニコ実況もできたのかな

520 :192.168.0.774:2020/12/14(月) 22:49:25.71 ID:9FaOalLE0.net
>>515
さっきそのページ試してみたけど普通に取れましたよ
多分chakuwikiかInternet Archiveのどちらかでたまたま内部エラーが起きたんじゃないかと思う

521 :192.168.0.774:2020/12/14(月) 23:07:45.15 ID:v8wPmt2c0.net
>>520
ありがとうございます。
教えてちゃん状態で申し訳ありません。
こちらのページは可能でしょうか。半角記号が間に入ると保存できないということなのかと思いましたが、常にそうでもないようで……
https://52.69.139.163/index.php/玉造_(大阪市)
https://52.69.139.163/index.php/小阪_(東大阪市)
https://52.69.139.163/index.php/仁川_(兵庫)

522 :520:2020/12/15(火) 00:35:35.36 ID:Y7gKbm450.net
>>521
全て保存できてます

507氏の申請により、海外のArchiveTeamという非営利団体がbotをぶん回して現在進行系でアーカイブを取ってくれてます
ArchiveTeamのbotが収集したデータはInternet Archive上に移管されるようになっているので、わざわざ手動でアーカイブ取る意味は薄いです

523 :192.168.0.774:2020/12/15(火) 01:45:51.77 ID:L/BURrrN0.net
やはりArchiveTeamはつよい

524 :192.168.0.774:2020/12/15(火) 03:45:40.17 ID:Y7gKbm450.net
chakuwikiのAWSの契約がいつ切れるか分からない以上、時間との戦いって感じかね
保存対象として読み込まれてるリソースの数は現時点で総計173万個
さすがに1ヶ月後までには終わってると思うんだけど心配だな

525 :192.168.0.774:2020/12/15(火) 07:57:43.86 ID:Vnn2vEmu0.net
>>507
>>522
ありがとうございます。
因みにそのアーカイブサイト上のChakuwikiページはどちらになるか、わかりますでしょうか。

526 :192.168.0.774:2020/12/15(火) 11:39:28.70 ID:BgcXnTgc0.net
>>525
反映される時期は不明だけどWayback Machineから
https://52.69.139.163/ で始まるURLで検索すれば閲覧できるようになるよ
ちなみに保存されたルートはアーカイブされたページの右上にあるAbout this captureを押せばわかる
Live Web Proxy Crawlsは一般人が通常通り手動で保存した場合で、Archive teamとかだったらbot経由で保存されてる
https://i.imgur.com/O6IOeI2.jpg
https://i.imgur.com/GL1hLBT.jpg

527 :192.168.0.774:2020/12/15(火) 12:51:45.53 ID:K0GtvYEh0.net
少なくともChakuwiki関係者の誰かがドメイン取って
Chakuwiki.netから52.69.139.163に転送するようにすればつながるのかな?

確かサイト移転どかで転送する際はアーカイブでも転送してくれたっけ?

528 :192.168.0.774:2020/12/15(火) 15:14:02.30 ID:Y7gKbm450.net
>>527
そこまで至れり尽くせりではない
Internet Archiveがドメインの名前解決をしてくれるわけじゃないので、
新しくドメインを取ったところで、52.69.139.163で取られたアーカイブには転送されない

529 :192.168.0.774:2020/12/15(火) 15:23:48.12 ID:agHpSR5h0.net
https://blog.nicovideo.jp/niconews/141893.html
2021年の春までにニコニコ動画の削除跡地の動画タイトル、説明文、コメントが消えるらしいので
どうにかしてアーカイブを取りたい

ただ、保存ツールはNicomentXenoglossiaが使いやすいんだけど、
アクセス制限の関係上1時間で250件くらいしか落とせないから全削除動画を落とすのは現実的じゃない

仕方ないからコメントは諦めて動画タイトルと説明文だけでも視聴ページからアーカイブしたいと思ったんだけど、
今年に入ってから削除動画は非ログイン状態だと一切表示できなくなってるんだよね…
ArchiveTeamはログイン状態でアーカイブすることって出来るんですか?

530 :192.168.0.774:2020/12/15(火) 17:13:19.13 ID:Y7gKbm450.net
>>529
自分はArchiveTeamと直接連絡を取ったことはないので断言はできないけど、
可能な限りの融通は効かせてくれるんじゃないかと思う
とりあえずArchiveBotのIRCで相談してみてはどうだろう、DeepL翻訳やみらい翻訳を駆使すれば英語が無理でも何とかなる
https://archiveteam.org/index.php?title=Internet_Archive
https://archiveteam.org/index.php?title=ArchiveBot

531 :192.168.0.774:2020/12/15(火) 17:55:09.16 ID:agHpSR5h0.net
>>530
ありがとうございます
交渉してみます

532 :192.168.0.774:2020/12/15(火) 18:52:56.51 ID:Vnn2vEmu0.net
>>526
ありがとうございます。
こちらのスレの皆様には本当に助けていただきました。
ありがとうございました。

533 :192.168.0.774:2020/12/15(火) 21:45:39.63 ID:/3eTgo780.net
>>530
今の機械翻訳は優秀だし、日本の教育水準はなんだかんだ高いから、
高校まで真面目に英語やってれば大学でサボってても機械翻訳のおかしなところ微調整で長文も余裕

534 :192.168.0.774:2020/12/16(水) 00:43:03.58 ID:ZACL66BA0.net
このスレへの書き込みのみを見る限り、chakuwikiはこのスレが建ってから初めて大規模アーカイブにまで持ち込めた案件ってことになるのかな
実際に依頼したのは>>507ではあるけど

535 :192.168.0.774:2020/12/16(水) 00:44:24.01 ID:ZACL66BA0.net
でも情報をここに書き込んでくれた>>499がいなかったらそもそもArchiveTeamへの連絡にこぎつけることもできなかった訳だしな

536 :192.168.0.774:2020/12/16(水) 01:04:34.43 ID:p+5BPWXT0.net
連絡しなくてもサイト全体をダウンロードする方法を書いてくれた人もいるのに、
ここの住民は知識だけで人に任せるしかできず、初めからやる気がないんだろ

537 :192.168.0.774:2020/12/16(水) 04:37:34.04 ID:ZACL66BA0.net
>>536
上で書かれてるサイト全体をアーカイブする方法は、主に使ってる技術とサイトの規模の問題で全く使い物にならない
ArchiveTeamは実績も知見も関係各所へのコネもあるところなので、
大規模なサイトを対象にする場合はあそこの力を借りるしかない
こういう言い方はしたくないが、知識もなければ自前でクローラ回したこともない癖にイチャモン付けないで欲しいわ

538 :192.168.0.774:2020/12/16(水) 11:52:40.02 ID:vM349Ric0.net
>>537
個人でやれる事なんてせいぜい大型個人サイトまでだもんね
wikiみたく大勢が集まって作っていくようなのは漏れが出やすいしね

539 :192.168.0.774:2020/12/16(水) 14:39:30.07 ID:ZACL66BA0.net
ジオシティーズもGeoLogプロジェクトが半年くらいかけて収集してたけど、ArchiveTeamはその10倍くらいの量を60%くらいの時間で処理してた記憶

540 :192.168.0.774:2020/12/16(水) 19:10:33.02 ID:JSA/MYWc0.net
>>539
有能すぎて草

541 :192.168.0.774:2020/12/16(水) 23:02:03.61 ID:ukZ3LQFO0.net
>>531
自分も保存したいと思ってた
IRCログだとアクセス間隔を開けないといけないという話で終わっている気がするけどどうなるんだろう‥
とりあえず具体的な日程が出次第即IRC側に報告しよう

542 :192.168.0.774:2020/12/17(木) 12:28:41.32 ID:uZBzbV0r0.net
記事のアーカイブ化
https://52.69.139.163/index.php/Chakuwiki:%E5%80%9F%E4%BA%95%E6%88%B8#.E8.A8.98.E4.BA.8B.E3.81.AE.E3.82.A2.E3.83.BC.E3.82.AB.E3.82.A4.E3.83.96.E5.8C.96

543 :192.168.0.774:2020/12/17(木) 20:15:51.98 ID:YcW6IKDX0.net
お尋ねしたいんですが、Webarchiveで一度アーカイブされていて、
きちんとその状況が確認できていたものが、
アーカイブから消されることってあるのでしょうか。

因みにアーカイブしていたのはChakuwikiの一部ページです。

544 :192.168.0.774:2020/12/17(木) 21:28:26.50 ID:67XwC+lO0.net
前からたまになかったっけ?このスレでも上の方で何度か言われてたような

545 :192.168.0.774:2020/12/17(木) 23:12:31.52 ID:A7vSMMBJ0.net
>>543
そのサイトの運営者(chakuwikiで言えば亡くなった創設者の人)は、自分がそのサイトの運営者だという証拠を提出した上でアーカイブの削除を要請できる
この要請が通れば、Internet Archiveから既存のアーカイブが削除されるようになっている
chakuwikiに関してはおそらくそういう心配はないと思う
可能性があるとしたら遺族が削除申請を出すことかな

546 :192.168.0.774:2020/12/17(木) 23:17:57.23 ID:A7vSMMBJ0.net
あとInternet Archiveのサーバはよく不具合を起こす
これのせいで、ちゃんと取れているはずのアーカイブが一時的に見れなくなったり、
アーカイブはちゃんと取れているのに、まだ取られていないという誤った表示が出てきたりすることがある
多分だけど>>543はその不具合にたまたま遭遇したんだと思う

これはInternet Archiveのサーバ内部の問題なので、こちらが取れる対処法はない
サーバの調子が良くなってまた見れるようになるのを待つしかない

547 :192.168.0.774:2020/12/17(木) 23:20:53.20 ID:A7vSMMBJ0.net
借井戸に「今週月曜日に取ったはずのアーカイブがごっそり消えている」って報告があったけど、
これは>>546で説明したサーバ不具合の典型的症状やね...

548 :192.168.0.774:2020/12/18(金) 20:05:26.93 ID:I5zRjHzA0.net
Chakuwikiのアーカイブについて
https://52.69.139.163/index.php/
のドメインで今アーカイブをとっているのですが、"()"の他に"!"や"&"がURLに入っているページもWayback Machineではうまく保存できないことが判明しました
(archive.todayでは保存できたのですが…)

549 :192.168.0.774:2020/12/19(土) 02:11:50.74 ID:Xqo4Hlfy0.net
>>548
もしかしてAPIでチェックしてる?
APIでは一部記号(自分が確認出来たのは"&")が入ってるとアーカイブされててもレスポンスが空の不具合がある
カレンダー側では問題なく確認出来るよ

550 :192.168.0.774:2020/12/19(土) 15:18:27.59 ID:hlXdl83U0.net
今日Chakuwikiのアーカイブを見て回ったら多くのページが保存されていました。
少なくとも普通に閲覧に支障がないレベルでアーカイブ化が完了しております。

551 :192.168.0.774:2020/12/22(火) 00:11:10.59 ID:ck8IlUdE0.net
攻略サイトのアーカイブがあったら便利だと思う

552 :192.168.0.774:2020/12/22(火) 13:53:42.96 ID:A07YUt/w0.net
@wikiとか?
〜wikiとかwiki系で攻略wiki作ってるの多いよね

553 :192.168.0.774:2020/12/22(火) 14:12:52.20 ID:FQJnL9rZ0.net
atwiki系のサイトがサービス終了したら影響大きいだろうな

554 :192.168.0.774:2020/12/22(火) 15:44:40.36 ID:dhdxyEHd0.net
ランス10みたく色んなwikiに情報あるならまだマシだけど、
攻略サイト作成者や利用者が声がデカイ一部の一強厨にゴリ押しされて、
2番手移行を併合しようとするような流れになったら困る

分かれてるのは作成者とその周辺と気が合わないというのもあるだろうけど、
いつ消えるか分からないこのご時世、何かあった時のための避難所0では無保険過ぎて不安だし

555 :192.168.0.774:2020/12/23(水) 22:26:51.27 ID:Ff2Y6ihq0.net
chakuwiki、とうとうサーバ自体が消えたっぽい

556 :192.168.0.774:2020/12/23(水) 22:40:04.53 ID:Y66pe0em0.net
あらら

557 :192.168.0.774:2020/12/23(水) 23:32:41.83 ID:Ff2Y6ihq0.net
もうちょっと早めに分かってればなぁ
Mediawkiの機能を使った記事や画像のエクスポート自体は完了しているらしいのが不幸中の幸いかな

558 :192.168.0.774:2020/12/24(木) 16:06:55.70 ID:JkNaumUN0.net
chakuwiki.org

559 :192.168.0.774:2020/12/24(木) 16:07:47.57 ID:JkNaumUN0.net
>>558
クローンサイトらしい

560 :192.168.0.774:2020/12/25(金) 00:43:20.22 ID:cNkRqGyv0.net
>>552
HTMLで書かれた個人サイトも忘れずに

561 :192.168.0.774:2020/12/25(金) 22:50:27.91 ID:9qhqNqL90.net
今時個人サイトのゲーム攻略は絶滅危惧種でしょ
だからこそ保存しなきゃいけない訳だが

562 :192.168.0.774:2020/12/26(土) 15:11:07.30 ID:8pI8HusK0.net
>>561
ぶっちゃけエロゲ攻略サイト以外の個人ゲーム攻略サイトなくね?w
どーでもいい、スクショもない感想サイトや呟きレベルならあるけど

563 :192.168.0.774:2020/12/26(土) 17:11:37.89 ID:BbmhGsC00.net
>>562
昔はエロゲ以外のゲームのやつも結構あったんだよ
だからこそ「絶滅危惧種」って言った訳

564 :192.168.0.774:2020/12/27(日) 07:00:17.63 ID:1AIVcw2g0.net
Wayback machine がFlashをアーカイブして2021年以降も使えるようになるって本当?

565 :192.168.0.774:2020/12/27(日) 12:27:01.23 ID:OAvLElxI0.net
>>564
どの程度網羅してるのかはわからないけどここから確認できるね
https://archive.org/details/softwarelibrary_flash
好きなのクリックすればPCからでもスマホからでもflash playerなしで実行できる

データ持ってる場合はアカウント作ってこの記事の下辺りにある手順でアップロードすればいいらしい
http://blog.archive.org/2020/11/19/flash-animations-live-forever-at-the-internet-archive/

566 :192.168.0.774:2020/12/27(日) 12:49:34.69 ID:nAtd+FF20.net
過去にwayback machineで保存されたWebページからデータからぶっこ抜いてinternet archiveにアップロードしてみんなが使えるようにしてる人もいるみたい
https://twitter.com/textfiles/status/1330334049915858944
(deleted an unsolicited ad)

567 :192.168.0.774:2020/12/29(火) 00:49:00.02 ID:fGs7aR1x0.net
Wayback MachineでアーカイブされているサイトのFlashで作られたメニューって2021年以降に見られるのかな?
調べてもよくわからない…

568 :192.168.0.774:2020/12/30(水) 18:17:22.94 ID:90IN69Gr0.net
若干スレチかもしれないけどどこに書けばいいのかわからないので
ニコニコ動画の「テクノ」の記事に貼ってあった
ttp://techno.org/electronic-music-guide/
このサイト、とても参考になるけど全体がFlashで出来ていて、ローカルに保存したswfでもRuffleを使ってみても(今のところ)きちんと動かなくて
このままじゃ来年見られ無くなっちゃうから元のサイト(www.di.fm)の方にFlash以外での形式で公開してほしいって伝えたいけど自分には英語力がない…
誰か英語のできる人が伝えてほしい

569 :192.168.0.774:2020/12/30(水) 18:22:29.55 ID:90IN69Gr0.net
>>568
568です
ニコニコ動画→ニコニコ大百科の間違いでした

570 :192.168.0.774:2020/12/30(水) 20:33:01.57 ID:7rdlBseX0.net
>>568
よく分からないけどこのサイトってどこかの法人が運営してるものっぽいね
他のページは更新されてるのにこれはFlashのまま放棄されているあたり、運営側としても更新する予定はないんだと思うけど

571 :192.168.0.774:2020/12/30(水) 20:34:00.97 ID:7rdlBseX0.net
あと、依頼するならここよりもテクノ系の5chスレッドを探して書き込んだ方がいいと思うよ

572 :192.168.0.774:2020/12/31(木) 12:32:10.38 ID:5dDGXSjX0.net
>>565
有名なものならあるようですね
もっと増えて欲しいな

573 :192.168.0.774:2020/12/31(木) 15:27:29.78 ID:jUqjw1pb0.net
ttps://automaton-media.com/articles/newsjp/20200203-112338/
こういったものもあるみたい
仕組みはいまいちよく分からないが

574 :192.168.0.774:2021/01/01(金) 17:14:31.78 ID:vTF78S5L0.net
https://ch.nicovideo.jp/nicotalk/blomaga/ar1955376
【ニコニコ動画】コメントサーバー・システムのリニューアルと、それにともなう一部機能の終了について

前にも出てたが動画跡地の他にコメントの過去ログも完全には見られなくなる模様。
うp直後のコメントとか見たい時があるので取得しておきたいけど何か良い方法は無いかな

575 :192.168.0.774:2021/01/01(金) 17:57:54.92 ID:61If5RTI0.net
だいたい再現ってのはコメントの一部を消すってことじゃなくてコンマ以下の秒数とか表示位置が若干変わるってことじゃないかな?
過去のコメントアートが楽しめなくなるってことだから結局よろしくないんだけど

576 :192.168.0.774:2021/01/01(金) 18:04:16.35 ID:VRDQC31q0.net
どんどんつまらないインターネットになってくな

577 :192.168.0.774:2021/01/01(金) 23:46:40.12 ID:ORqqm+qO0.net
削除動画のコメントについてはArchiveTeamに依頼しようとしてた人いたよね
どうなったんだろう

578 :192.168.0.774:2021/01/08(金) 20:40:53.18 ID:23QpLw4X0.net
>>559
アフィで原住民ともめた曰く付きが管理人

579 :192.168.0.774:2021/01/10(日) 11:31:17.49 ID:rsgyZDHH0.net
2ch(5ch)が閉鎖されたら過去ログはどこかアーカイブしてるのかな

580 :192.168.0.774:2021/01/12(火) 00:33:19.63 ID:aav8V+4w0.net
>>579
ある程度は既にアーカイブされてるんじゃないだろうか
まあ閉鎖が発表されたら誰かがアーカイブプロジェクト立ち上げるだろうけど

581 :192.168.0.774:2021/01/12(火) 01:22:47.19 ID:uojRCtJs0.net
完全ではないけどmimizunとかログ速とか

582 :192.168.0.774:2021/01/12(火) 21:45:06.15 ID:tYoR8j5L0.net
そもそも昔から2ch過去ログサイトはいっぱいあるよね
まあ最近見ないから消えたかもしれんけど

583 :192.168.0.774:2021/01/13(水) 03:35:42.25 ID:XzQwgawd0.net
過去ログサイトとウェブアーカイブってちょっと違うような気はする
まあWayback Machineに入ってないスレは沢山あるだろうね

584 :192.168.0.774:2021/01/16(土) 17:03:51.78 ID:3A5W7IEK0.net
ニコ動そのものがサービス終了したら動画のアーカイブはどうなるんだろう
やっぱりArchiveTeamかな

585 :192.168.0.774:2021/01/18(月) 19:39:35.39 ID:1x0bZ4YH0.net
動画データってアーカイブ可能なの!?
じゃあ…Pornhubのデータは…

586 :192.168.0.774:2021/01/18(月) 21:20:43.57 ID:IjzqQxcQ0.net
>>585
一般に動画のアーカイブは技術的に難しい
ストリーミング配信の動画なんかは特に難しい

587 :192.168.0.774:2021/01/18(月) 22:35:35.34 ID:+jP6yxXM0.net
動画ダウンローダあるんだからアーカイブ自体は可能
無劣化は無理っぽいけど

588 :192.168.0.774:2021/01/19(火) 22:37:31.86 ID:lxRWFQ6M0.net
mp4のまま丸々上げてるサイトなら別だけど普通は無理だよ
自分でダウンロードして動画のアーカイブの方にアップロードするしかない

589 :192.168.0.774:2021/01/19(火) 22:51:33.07 ID:7KqAH0Yd0.net
そりゃ情弱には無理
痛いpc雑誌読者以下の情弱っぽいし

590 :192.168.0.774:2021/01/20(水) 07:30:47.61 ID:WT4rpqz70.net
ストリーミング形式はHeritrixも無理らしいという話は聞いたことがある
本当かは知らん

591 :192.168.0.774:2021/01/20(水) 20:17:20.26 ID:EkoIINwL0.net
そういえば既に知っている人もいるかも知れないが、URLのリストから一括でSavePageNowできるアドオンがある
Firefox、Chromeともにウェブストアにはないけど起動時に読み込めば、一括保存(BulkSave)、右クリックで保存とかができる
https://github.com/internetarchive/wayback-machine-webextension
ここのInstalling the Latest Buildのところにインストール方法が載ってる

592 :192.168.0.774:2021/01/20(水) 23:22:59.02 ID:dMVBuuQl0.net
>>591
野良だからな〜
コード読める人、こういうの↓の検証頼む

【Firefox,Chrome】危険なアドオン・拡張機能の一覧を作るスレ【Edge,etc】 [無断転載禁止]©2ch.net
https://egg.5ch.net/test/read.cgi/software/1483763294/33

33 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2018/02/13(火) 11:00:20.51 ID:aB7Xo92Z0
ソース見てXMLHttpRequestかfetchが書いてある場合は注意した方が良い。
XMLHttpRequestかfetchはpostで情報送信できるので。manifestのパーミッションも不要だし。
拡張で情報送信できるのはこの2つの関数だけだと思う。

593 :GeoLog Project :2021/01/26(火) 22:50:10.34 ID:A19kfSBt0.net
ArchiveTeamがso-netも始めたみたいですね
https://wiki.archiveteam.org/index.php/So-net_U-Page%2B

594 :192.168.0.774:2021/01/28(木) 22:55:09.92 ID:qWdIByIL0.net
WayBackMachineにSo-netが追加されてた
今回は全てを取得することはできなかったみたいだがほとんどを取得できたみたい
感謝ですね

595 :192.168.0.774:2021/01/29(金) 13:46:14.84 ID:fKGUCp210.net
so-netもサービス終了か

596 :192.168.0.774:2021/01/30(土) 05:46:22.13 ID:jbLv2ZF+0.net
外出自粛で引きこもり増えてるんだからウェブサービス全盛かと思うのにな
サービス終了ラッシュで流れ弾のどれかに当たって鬱こもり増えそう

597 :192.168.0.774:2021/01/30(土) 18:06:31.16 ID:9LlaKpOV0.net
IPFSが普及すれば価値のある情報がもうちょっとは残りやすくなるのかな
ピン打つだけでローカルに保存できるの便利

598 :192.168.0.774:2021/01/30(土) 22:13:26.31 ID:g+UddPtz0.net
>>596
家でもスマホって人が多数派だろうからPC向けのサービスには辛い時代

599 :192.168.0.774:2021/02/07(日) 22:03:08.65 ID:PATKCzwG0.net
そういや自分で適当にサイト立ち上げてそこにバックアップしたいURL書き込み、してIAでsave outlinks使えば実質的にそこに書いてあるURL一括でバックアップできるよな?
save outlinksは会員限定機能で特定のページ内に書いてあるURL全部バックアップする機能

600 :192.168.0.774:2021/02/07(日) 22:19:27.61 ID:PATKCzwG0.net
これ思いついて今までURLに置換ツールで/save/つけてクリップボード一括開きしてたのが馬鹿らしくなった
あれサーバーに負担かけるしエラーの確認だので時間とられるし
注意点としては余計なリンク作らないことだな、だからブログとかでやるのはやめたほうがいい
何回も同じリンクをバックアップするから規制される可能性もあるし、真っ白なページ作ってURL記述が最善
読取用にHTMLでURL記述する必要があるが置換ツール使うかブックマークインポート使えば簡単にできるはず

601 :192.168.0.774:2021/02/08(月) 11:45:19.12 ID:bbPCsvBH0.net
何個だったか忘れたが、save outlinksは読み込める外部リンクの数に上限があったはずだからそれは要注意だな

602 :192.168.0.774:2021/02/08(月) 12:45:54.21 ID:AksXCukq0.net
やってみたらできた
URLの一覧をHTMLコードに変換してホームページ作成サイトにアップロードしてからそのリンクをバックアップ
save outlinksでバックアップできるURLは100個が限界で100個超えてたらランダムに選ばれるみたいだから要注意
FC2ホームページ使うと最後にPowered by FC2ホームページ っていうリンクが強制で1つ最後に入ってしまうから実質は99個が限界かな
完全に真っ白なページ(広告もなし)作れれば理想なんだがどっかないかな、ちなみにAndroidスマホをWebサーバー化したらバックアップ時にエラーが出た

603 :192.168.0.774:2021/02/08(月) 14:34:59.59 ID:bbPCsvBH0.net
>>602
GitHub PagesかNetlify使ったら?
前者はGitの知識がないと厳しいから実質後者一択かな

604 :192.168.0.774:2021/02/08(月) 20:07:50.66 ID:AksXCukq0.net
>>603
なるほど、やってみたけどやはり手軽なのはFC2だな、indexファイル含めたフォルダごとアップロードしないといけないのは地味に手間だ
FC2はファイルマネージャーにドラッグドロップするだけでアクセスできるようになるからかなり時間効率はいい
複数バックアップのリスクもこれ見る限りでは大丈夫そうではあるな
https://imgur.com/a/f0XwCdA.png

605 :192.168.0.774:2021/02/08(月) 20:10:39.63 ID:AksXCukq0.net
ただ複数ファイル最初からアップロードするならNetlify使ってやったほうがやりやすいかもね
100ジャストだから数えやすいし
URLに/ファイル名 つけるだけでまとめてアップロードしたhtmlにはアクセス可能

606 :192.168.0.774:2021/02/08(月) 22:35:56.52 ID:AksXCukq0.net
https://i.imgur.com/WXbHftz.jpg
https://i.imgur.com/xdvJ1eJ.jpg
とりあえずまとめてバックアップしてみたけど上限の100個でも問題なくできるね
特定のURLがずっとSavingが続く場合は画面のURLをバックアップ成功したの含めて全部コピーしてメモ帳に貼り付けしてサクラエディタとかで「Done!」が入ってる行を一括削除処理するとバックアップできてないURLだけメモ帳に残せる
そしたらサクラエディタで/web/2/付け足して数日経ったらまとめて開いて保存できてるか確認、一見ずっとsavingになってても後で確認したら保存できてる可能性が高い、バックアップできてなければ再度バックアップ
これで、手間がだいぶ減る
あとFC2ホームページは日本語の入ってるURLは文字化けするね、netlifyは特に何も設定しなくても文字化けはしない

607 :192.168.0.774:2021/02/08(月) 23:09:30.63 ID:AksXCukq0.net
あと、これやるならsave error pagesのチェックは毎回外したほうがいいかも
大量にやるとバックアップされる側が一時重くなるのもあるから404ページが保存されてしまうかもしれない

608 :192.168.0.774:2021/02/09(火) 01:20:04.21 ID:WeH/rIuE0.net
ゲームやりながらほぼ放置でURL1600個バックアップできた、一度に100個保存できるのは革命だな
やはりsave error pagesのチェック外すのは必須、結構高い頻度でgatewayエラー出るから
多くて100個中5個くらい、出るときはだいたい1.2個エラーになる
チェック外しておくとwaybackmahineがどのURLがエラーで保存できなかったか通知してくれるからそれは手動で個別にバックアップ

609 :192.168.0.774:2021/02/09(火) 16:38:32.21 ID:zDnBjMvk0.net
>>608
さすがに大量のリンクをアーカイブするのはSPN側のキャパもあるだろうしArchiveTeamに頼んでSPNじゃないところでアーカイブしたほうがいいと思う。
じゃないとSPNのサービス縮小、最悪の場合はSPN終了になりかねない
ArchiveTeamのIRCでDeepl翻訳とか使って言うと対応してくれるらしいので
https://webirc.hackint.org/#irc://irc.hackint.org/#archiveteam-bs

610 :192.168.0.774:2021/02/10(水) 00:34:19.03 ID:z46S15zT0.net
Save Page Nowあんまり使いすぎてSPN自体が無くなったらどうしようもないから、自分はSPNでアーカイブする量をセーブしてる
多くても週300くらい

611 :192.168.0.774:2021/02/10(水) 18:55:46.65 ID:m/SVxvNY0.net
>>609
Save outlinks自体が大量バックアップしてくれっていうような機能だし大丈夫じゃないか?
ブログとかだったら意図的じゃなくても1ページ50リンク以上あるとかザラだし、大量バックアップ推奨してなかったらあんな機能普通つけないよ
個人的に無会員で大量にタブ開いてバックアップするのが一番負担かけるやり方だと思うわ、それよりはかなり負担少ないように感じる
save outlinksが会員限定機能な以上邪魔になったらアカウント制限しにくるだけ、何個も重複してバックアップとか意図的に負担かけるようなことしなければ平気だとは思うけど、ただしやりすぎは禁物かもね
あと正直archive teamは画像のバックアップを正常にとれないみたいだから画像ありきのページだと正直依頼するには微妙かもしれない、Naverまとめとか画像まともに表示されてないものが多い、手動で保存したものはしっかり表示される
waybackmachineの自動クロールも画像保存されないことある、手動だとやはり保存される
負担減らしたいならバックアップ済はバックアップしないってチェック項目あればいいのにね

612 :192.168.0.774:2021/02/11(木) 10:34:08.22 ID:f+DQ9uVI0.net
別に問題ないと思うよ
よく負荷がどうこうっていうけど、個人サイトじゃあるまいし影響は無い

613 :192.168.0.774:2021/02/12(金) 02:19:02.11 ID:D+7XoyFI0.net
容量の負荷は軽減出来るが処理負荷は増えそう

614 :192.168.0.774:2021/02/15(月) 17:24:11.93 ID:BROhNSp40.net
【告知】ニコニコ動画のコメントサーバーリニューアルに向けた機能提供終了・変更のお知らせ【PC版ニコニコ動画】|ニコニコインフォ
https://blog.nicovideo.jp/niconews/147588.html

615 :192.168.0.774:2021/02/15(月) 18:01:13.52 ID:KmI3cA970.net
>>614
■ 実施スケジュール

実施日時 実施内容
2021年3月1日(月)
過去ログ機能の変更
過去ログのURL共有機能を提供
2021年3月15日(月)
削除された動画へのコメント投稿とコメント表示の終了
 - 動画タイトルや説明文などの情報も表示されなくなります
マイメモリー機能の提供を終了
 - マイメモリーの新規作成や、 既存マイメモリーの視聴ができなくなります
2021年 春以降
動画コメントサーバーを新コメントサーバーに順次リニューアル
2021年リニューアル
完了後
動画投稿一覧などに表示される最新コメントに、投稿者用NG設定を適用
「コメント投稿ユーザーをNG登録」する機能の効果を永続化
自分が投稿したコメントを削除できるように

616 :192.168.0.774:2021/02/21(日) 10:24:19.04 ID:0mwGDu3d0.net
会員になることのメリットって何かある?

617 :192.168.0.774:2021/02/21(日) 12:57:56.20 ID:Ya0mID5E0.net
outlinksとGoogleSpreadsheetのバッチ処理が使える。

618 :192.168.0.774:2021/02/22(月) 10:04:51.68 ID:+ks65Y9m0.net
超便利

619 :192.168.0.774:2021/02/23(火) 10:23:00.62 ID:uox55Xkf0.net
iRONNA終了
> 2014年10月にスタートした総合オピニオンサイト「iRONNA」は、
> 諸般の事情により2021年3月下旬をもって新規コンテンツの公開を終了することになりました。(中略)
>  尚、終了後もこれまでのiRONNAのコンテンツが閲覧できる環境を維持するための態勢構築を進めています。(後略)
https://ironna.jp/article/16883
閲覧は維持してくれるらしいので緊急性はない。

620 :192.168.0.774:2021/02/23(火) 16:53:36.76 ID:qBkXHra00.net
総記事数1万7000くらいか

621 :192.168.0.774:2021/02/23(火) 17:22:19.47 ID:BW828Cy80.net
せっかくwaybackmachineでアーカイブしたのに、どうアーカイブされているか見ようとしたら別の日にアーカイブされたものに飛ばされてしまった。
少し待たないとダメな感じ?

622 :192.168.0.774:2021/02/23(火) 18:18:35.09 ID:uox55Xkf0.net
基本少し待って確認だけどそれでも反映されてなかったり、反映されてるけど取れてなかったりする。

623 :192.168.0.774:2021/02/24(水) 22:58:36.25 ID:3JX98v140.net
ここ最近は調子悪いからしばらく様子見たほうがいいよ

624 :192.168.0.774:2021/02/27(土) 08:23:57.01 ID:6CS9oMdW0.net
この前読んだ漫画に、WaybackMachineを使っているシーンがあった
1コマ程度だけど

625 :192.168.0.774:2021/02/27(土) 20:23:05.25 ID:Ly2ncyWo0.net
Archive Teamでニコ動のコメントとメタデータ(タイトルとか説明文)の保存が始まった
動画の中でも日本からしか見れないものとかはArchiveTeamの人からは取得できないらしく
Dockerを扱える人いたらWarriorというパッケージを導入すれば誰でも貢献できるのでやってくれるとありがたい
https://hub.docker.com/r/archiveteam/warrior-dockerfile/
https://wiki.archiveteam.org/index.php?title=ArchiveTeam_Warrior

626 :192.168.0.774:2021/02/27(土) 21:59:52.26 ID:Jb4WnfRj0.net
わおナイス

627 :192.168.0.774:2021/03/01(月) 00:57:53.21 ID:ihnmbLOX0.net
最近ニコ動の調子が悪いのはこれのせいなの?
落とすようなのはリスクあるから自分とこのIPではあまりやりたくないな…

628 :192.168.0.774:2021/03/01(月) 01:35:46.84 ID:wfxDiFoy0.net
割と可能性はあるな

【3/1 0時追記】動画が視聴できない不具合など【調査中・ニコニコ動画】
連日の不具合につき、ご利用の皆様にご不便をおかけし、大変申し訳ございません。
本不具合について、海外からの通常の量ではないアクセスにより、引き起こされております。
現在、さらなる原因調査と、追加の対応を行っております。

不具合発生時間
2021年2月28日(日) 06:06頃〜

https://blog.nicovideo.jp/niconews/148255.html

629 :192.168.0.774:2021/03/01(月) 02:04:13.92 ID:wfxDiFoy0.net
この公式ページの情報によると2月27日23時頃から断続的に不具合が起こってるらしいね
ニコ動アーカイブのトラッカーはここから確認できるっぽい
残り70万/3500万で今も動いてる
https://tracker.archiveteam.org/niconico/

630 :192.168.0.774:2021/03/01(月) 02:11:24.07 ID:0zo7s6Wq0.net
luaスクリプト読んでみたら、waitもかけずに全力でぶん回すようになってるじゃん
そりゃニコ動も不安定になるわ。DDoSそのものだもん
ttps://github.com/ArchiveTeam/niconico-grab/blob/ade778c0df8bd3ee5b0aa497c79e9ed97a604883/niconico.lua#L356

631 :192.168.0.774:2021/03/01(月) 06:14:48.33 ID:L+5MH82N0.net
>>630
間隔を1秒たりとも空けてないとは思わなかった
プルリクエストした方がええんかな
ArchiveTeam側に連絡取れるようならあちら側で対処してもらうよう依頼した方が良さそうかな

632 :192.168.0.774:2021/03/01(月) 06:26:19.58 ID:L+5MH82N0.net
今気付いたがアーカイブする対象の動画はどういう指定になってるんだろう
sm+数字連番とかで指定されているようならnmはどうなるんだ

633 :192.168.0.774:2021/03/01(月) 06:34:33.80 ID:LwaG001V0.net
間隔なしでアクセスしてたのか
連絡できる方お願いします

634 :192.168.0.774:2021/03/02(火) 21:56:05.22 ID:lV2sHV+Y0.net
https://entame.nifty.com/

635 :192.168.0.774:2021/03/03(水) 21:00:06.05 ID:qMU8PBl90.net
>>629
保存が止まってるような気がする

636 :192.168.0.774:2021/03/03(水) 22:36:32.38 ID:IvY6bDaH0.net
意図的に止めたか、UserAgentとかでブロックされたか

637 :192.168.0.774:2021/03/04(木) 19:19:41.51 ID:0W4MjtMV0.net
今日archive.isでページを保存しようとしたら
「One more step
Please complete the security check to access archive.is」という画面になった
(そのページのURLは”ttps://archive.is/submit/”、あと”私はロボットではありません”っていうのも出てくる)
こうなるのはなぜ?

638 :192.168.0.774:2021/03/04(木) 19:42:08.01 ID:bGr5q6NW0.net
>>637
ボットからのアクセスからじゃないかをチェックするため
「私はロボットではありません」ってボックスをクリックかタップするとボットでは無いことを証明出来る

639 :192.168.0.774:2021/03/06(土) 07:37:06.43 ID:hlDxyvDV0.net
>>636
>>628で「対策を行なった」らしいから止められている可能性もあるね

640 :192.168.0.774:2021/03/07(日) 20:08:35.16 ID:9bQuMkRs0.net
訴えられればいいのに電脳ゴミ屋敷屋

641 :192.168.0.774:2021/03/13(土) 23:55:10.58 ID:8jEEmAHJ0.net
ニコ動のやつWaybackMachineで見れるようになってる
けど、コメントは無い模様
ttp://web.archive.org/web/20210228064205/https://www.nicovideo.jp/watch/sm100000

642 :192.168.0.774:2021/03/13(土) 23:59:45.89 ID:dBDnkJKI0.net
上の方で、「はてな」のサービス終了に触れてるのを見かけたけど、2020年1月末で終わったはてなグループについては誰も言及してないあたりそんなにも影が薄いサービスだったんだろうか…
はてなグループ終了時に運営がデータエクスポートしてくれるやつを実際に頼んだ人っているんだろうかね。

643 :192.168.0.774:2021/03/14(日) 17:08:52.84 ID:P0VVc7Hv0.net
はてなグループなついw
Twitter調べたらエクスポート依頼してる人いたよ 掲示板やタスクのデータはjson形式で送られてるみたい

644 :192.168.0.774:2021/03/23(火) 13:54:01.80 ID:cJkTjzqf0.net
ニコニコのユーザーブロマガもサービス終了
https://site.nicovideo.jp/ch/userblomaga_thanks/
>2021年10月7日をもってユーザーブロマガの提供を終了することとなりました。

645 :192.168.0.774:2021/03/23(火) 14:43:54.48 ID:dIBn548U0.net
最近のニコニコはサービスの改善を図ってか古いものを終了させてるね
いちユーザーとしてはようやくニコニコが大規模に改修されるのかという安堵があるけど、アーカイブしなければならないものが増えるのは厄介だな

646 :192.168.0.774:2021/03/23(火) 16:22:26.81 ID:dIBn548U0.net
MMDモデルのライセンス情報をブロマガに書いてた人もいるらしい
全員が全員とも引っ越しできるはずはないからライセンス関係のトラブルが起きそう

647 :192.168.0.774:2021/03/23(火) 17:16:07.79 ID:v4cm6WhT0.net
ブロマガは地味に有用な情報埋まってるからなあ

648 :192.168.0.774:2021/03/23(火) 22:13:36.29 ID:jZ9ukRPV0.net
長く続いていたところだが、掲示板サービス終了らしい
http://www.aimix-z.com/bbs.cgi?room=sample1

649 :192.168.0.774:2021/03/23(火) 22:53:01.21 ID:F3Q9JjE00.net
来年の今頃はau3G終了で古い掲示板が更に無くなりそう…

650 :192.168.0.774:2021/03/24(水) 14:26:11.85 ID:hCLf6Q2s0.net
「Webメディア『WHAT’s IN? tokyo』終了のお知らせ」
https://tokyo.whatsin.jp/634630
3月末日をもって終了らしい

651 :192.168.0.774:2021/03/24(水) 14:30:00.31 ID:hCLf6Q2s0.net
>>650
結構有名なアーティストのインタビューとかライブレポートが載ってるから早めにやった方がいいかも

652 :192.168.0.774:2021/03/24(水) 19:19:31.06 ID:Dbq8uDYn0.net
>>651
自分でいくつかアーカイブ作業したけど記事やコラムもいっぱいあるから自力でやるには限界がある…
Archive Teamに頼めないかな(でも画像の表示とかできるようになるか心配、有名人の写真とか結構載ってるから)

653 :192.168.0.774:2021/03/25(木) 10:53:09.11 ID:CDcBUVtC0.net
>>652
>>507あたりから読んでみるといいかも

654 :192.168.0.774:2021/03/25(木) 13:43:04.79 ID:dIw+mgHL0.net
今ざっと確認してみた感じほとんど保存されてるから
頼む必要はなさそう

655 :192.168.0.774:2021/03/27(土) 09:00:04.94 ID:IQF/ehSw0.net
>>654
保存されてないものも多いようだけど..

656 :192.168.0.774:2021/03/27(土) 22:55:42.50 ID:kNI170E5C
「コンサル・IT業界」を俺が全解説する やりたい事ない就活生は全員集合!
https://www.youtube.com/watch?v=zJReZO1ND6c&t=2003s
努力不足でSESに転職
https://www.youtube.com/watch?v=enk3CgyuFDo
【転職】日系大手企業から外資系企業への転職は困難な道だ
https://www.youtube.com/watch?v=2HESzMFgN4M
【就活】非体育会系はどう戦うべきなのか?
https://www.youtube.com/watch?v=x6aW7E538KY
「圧倒的努力」と言いたがる奴www
https://www.youtube.com/watch?v=kI-ZkKhQLZY

657 :192.168.0.774:2021/03/28(日) 06:18:56.92 ID:Qy1cjUak0.net
【2ちゃんねる】#山本一郎のYahooニュース個人記事全削除に西村ひろゆきも思わずコメント [みつを★]
https://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1616663159/

658 :192.168.0.774:2021/03/28(日) 10:20:45.25 ID:7uSirFX90.net
質問です
なぜWayback Machineやarchive.isでのTwitterのページは昔のUIの表示で保存されるのですか?

659 :192.168.0.774:2021/03/28(日) 10:25:32.20 ID:wf8cUzOd0.net
>>658
Waybackmachineのユーザーエージェント情報が不明または古いブラウザのものだから

660 :192.168.0.774:2021/03/28(日) 23:27:36.83 ID:W3XigIE00.net
Twitterの旧UIって前に廃止された様な気が…

661 :192.168.0.774:2021/03/30(火) 16:11:02.65 ID:iT+KYP130.net
>>658
Twitterの旧UIは2年くらい前に廃止されたはずだけど、それ以前に取られたアーカイブの話してる?
もしそうなら、それがウェブアーカイブというものだからですとしか答えられない
廃止以後に取られたアーカイブで旧UIになってるものはそもそも遭遇した事がない

662 :192.168.0.774:2021/03/30(火) 16:13:47.90 ID:iT+KYP130.net
>>654
保存されてないの結構あるから依頼の必要があると思う
もう少し注意して確認してみてくれ

663 :192.168.0.774:2021/03/30(火) 21:13:15.91 ID:us3SRCC+0.net
>>662
今waybackのAPIで7300記事の保存状況を確認したところエラーが起きたのは30記事くらいだった
念のためこれはアーカイブし直してるけど何か抜けてたりミスしてるところがあるのかな

664 :192.168.0.774:2021/03/31(水) 02:52:17.69 ID:sigMsPVG0.net
テレビ番組表の記録
っていう2007年からの膨大な番組表データを記録しているサイトがあるんだけど、
番組の詳細内容が表示されなくなったり過剰なアクセス制限があったりと最近改悪が激しい

Waybackのクロールも拒否してるし、
貴重なデータの割にこのサイトにしか残っていない情報が多いので今後ちょっと不安だ

665 :192.168.0.774:2021/03/31(水) 03:15:05.06 ID:sigMsPVG0.net
ググってみたら最近アーカイブし始めた方がいるみたい
https://mevius.5ch.net/test/read.cgi/tv/1613085950/

666 :192.168.0.774:2021/04/01(木) 00:28:51.15 ID:b0/dZpQp0.net
503のせいで四月馬鹿サイトのキャプチャができない

667 :192.168.0.774:2021/04/02(金) 02:20:51.93 ID:E098KUjC0.net
aimix-BBSというレンタル掲示板を見たら今月末でサービス終了するそうだ…

668 :192.168.0.774:2021/04/02(金) 02:49:27.61 ID:N4klKkfU0.net
【よほど都合が悪いようだ】LINEに否定的だった山本一郎氏、自身のヤフー記事1000本がヤフーによって削除される    [Toy Soldiers★]
https://asahi.5ch.net/test/read.cgi/newsplus/1616979021/

669 :192.168.0.774:2021/04/02(金) 04:18:45.08 ID:E098KUjC0.net
あら>>648で既出かすまん

670 :192.168.0.774:2021/04/02(金) 19:27:58.48 ID:SuFyZiNQ0.net
>>668
グロ 右翼のオナニー

671 :192.168.0.774:2021/04/04(日) 23:07:03.32 ID:1NgTlwaH0.net
503はでなくなったぽいな
ちゃんと保存出来てる

672 :192.168.0.774:2021/04/06(火) 10:45:21.00 ID:bcYYdv9U0.net
archive.todayの検索したページ全部ローカルに落としたいんですけどいい方法ありませんか?

673 :192.168.0.774:2021/04/06(火) 10:49:57.61 ID:bcYYdv9U0.net
一つ一つだと時間が、、、

674 :192.168.0.774:2021/04/06(火) 12:52:00.97 ID:zmjScz9w0.net
「同人用語の基礎知識」
https://www.paradisearmy.com/doujin/
が閉鎖されたようだ。

4日までは存在、5日に閉鎖されたようだ
まあ大体アーカイブに保存されてるようだが。

675 :192.168.0.774:2021/04/06(火) 13:11:01.58 ID:si5uHLGE0.net
選択範囲のリンクをコピーするアドオンでコピー。
改行置換できるテキストエディタで
「(改行)https://archive.ph/」を 「.zip(改行)http://archive.fo/download/」に 置換してダウンローダーに登録。

676 :192.168.0.774:2021/04/06(火) 21:44:46.66 ID:bcYYdv9U0.net
>>675
ごめん。素人すぎて理解できない。ありがとう

677 :192.168.0.774:2021/04/06(火) 22:36:34.89 ID:kP1K0WKb0.net
>>674
つながるけど

678 :192.168.0.774:2021/04/07(水) 22:24:00.01 ID:jaaDWMPS0.net
>>644 に出てるブロマガってarchive teamで動いてる?
動いてなかったら誰か頼んでもらえます?

679 :192.168.0.774:2021/04/09(金) 20:51:54.18 ID:qy0N6K120.net
>>674
今試したが繋がるね
サーバダウンかドメインの期限切れだったのでは

680 :192.168.0.774:2021/04/14(水) 12:17:08.79 ID:48TpJwRy0.net
ここで聞いていいかわからないけどiPhoneでサイト丸ごと保存できるようなアプリってある?

681 :192.168.0.774:2021/04/14(水) 18:25:29.79 ID:bpOyJRlR0.net
ローカルの話だったらプリントしてpdfとして保存するのが楽
ネット使っていいならInternet archive

682 :192.168.0.774:2021/04/14(水) 18:27:41.00 ID:bpOyJRlR0.net
safariでできる、真ん中のボタン押してプリント押してpdfプレビュー見えたら拡大してから右上のボタン押してファイルに保存

683 :192.168.0.774:2021/04/14(水) 18:29:19.40 ID:ZWSQBuck0.net
横からだけど、それでサイトを丸ごと保存できるの?

684 :192.168.0.774:2021/04/15(木) 00:23:03.00 ID:CGl/6bWS0.net
>>683
「サイト丸ごと」が全てのページって意味なら無理
IAのアカウント作ってTOPページからアーカイブすれば近い事は出来るけど

685 :192.168.0.774:2021/04/15(木) 00:25:00.78 ID:EOF13stj0.net
1ページ全部保存できるよ、pdfのページの切れ目は気になるかもしれんけど

686 :192.168.0.774:2021/04/15(木) 18:46:33.49 ID:NH0zTLbd0.net
そのページだけでなくサイト全体、全てのページという意味でした
紛らわしくて申し訳ない

687 :192.168.0.774:2021/04/22(木) 02:30:48.66 ID:AxQTCk/Z0.net
以下全然関係ないメモ
wget --spiderでやってログをTxtファイルに出力
TxtファイルからURLを抽出して別のTxtファイルに出力
GoogleSpreadSheetを開いてファイル>インポート、アップロードのタブを開いてTxtファイルをインポート
Internet ArchiveのBatchでArchiveする

688 :192.168.0.774:2021/04/22(木) 12:02:39.96 ID:/9qqH/bs0.net
ClipTrapっていう神ツール見つけた
これ使うと起動中にクリップボードを勝手にメモ帳に書き込んでくれる、URL収集が格段に楽になった
今までコピーして自分でメモ帳に貼り付けてたのが起動してURLをコピーするだけでよくなる

https://web.archive.org/web/20210223043918/https://www.dcmembers.com/skwire/wp-content/uploads/sites/5/apps/cliptrap/ClipTrap.zip

689 :192.168.0.774:2021/05/01(土) 11:40:31.74 ID:9IzoZg0U0.net
いいねそのツール

aimix bbsはまだ繋がるけど時間の問題か

690 :192.168.0.774:2021/05/02(日) 01:11:35.64 ID:lC3RPbeK0.net
試しに自分が使ってたコミュニティのaimixbbsログ取ってるけど
7件ごとしか表示できないからクッソめんどいねコレ
あとWAで保存したあとに表示されるURLがバグってページ内に使われてるjavascriptのURLが出たりする
しばらくして保存指定したURLで見るとちゃんと取れてるけども

691 :192.168.0.774:2021/05/02(日) 13:35:59.09 ID:vaVxAMxx0.net
「There are no running processes.」を真に受けて複数同時にBatchを走らせちまった

692 :192.168.0.774:2021/05/03(月) 07:15:00.86 ID:/kznU+lx0.net
みんカラのブログはUserAgent無しだとwgetがエラーになるっぽいな

693 :192.168.0.774:2021/05/08(土) 07:51:11.20 ID:9Fhy2QW70.net
さすがにUserAgentは適当なブラウザのを指定しとけよw
UserAgentにbotって入ってるだけでブロックするクソサイトもあるし

694 :192.168.0.774:2021/05/18(火) 21:27:51.57 ID:oveHwTzF0.net
最近思うけど個人サイトっていくら有名でも10年後に見られる保証はないんだよね…
そこはか通信とかchakuwikiみたいに管理してた人が突然亡くなっちゃうこともあるし(幸い両方とも移転したけど)

695 :192.168.0.774:2021/05/19(水) 19:21:18.50 ID:jJ5ExFLB0.net
>>694
本当にその通りだと思うわ
見つけた時にできる限り保存しておくに限る

696 :192.168.0.774:2021/05/21(金) 15:01:04.55 ID:7xzrhdl00.net
bbspinkのスレを取得しようとすると403になってうまくいかないなー昔は出来たぽいのに
5chのほうは今もスレURLそのままでいけるんだけど

697 :192.168.0.774:2021/05/28(金) 21:25:26.51 ID:2ckbrUc60.net
こころんにあるミラーってWaybackMachineに保存しようとすると504を返してきて保存できないね

698 :192.168.0.774:2021/06/15(火) 21:34:37.24 ID:fVgCsqNm0.net
【重要】PC版GREEのサービス終了のお知らせ
2021年6月24日 15:00(木)をもちまして、PC版GREEのサービス提供を終了させていただくこととなりました。

■提供を終了するサービス
サービス終了後は、下記を含む全ての機能がご利用いただけなくなります。
・ゲームプレイ
・ゲーム内アイテムの利用
・GREEコインの購入
・チャットやコミュニティなどのSNS機能
・アバター機能
・会員登録/退会
・日記の外部ブログへの転載機能
※日記の転載先として登録済URLは削除されます
※外部ブログから投稿済の日記はそのまま残ります
https://jp.apps.gree.net/ja/static/page/20210201_pcnotices

699 :192.168.0.774:2021/06/16(水) 20:55:19.05 ID:O3qSVHMS0.net
ガラケー版GREEは2021年11月25日終了

700 :192.168.0.774:2021/06/16(水) 23:50:49.53 ID:ghZg6gWC0.net
うい

701 :192.168.0.774:2021/07/05(月) 03:42:36.80 ID:BBrljrOf0.net
SiteMixというレン鯖の調子が悪いらしい。
ttps://it.srad.jp/story/21/06/29/1618244/
まだ消滅しないとは思うけど、個人HPがたくさん残ってるのと、
適当なURLをarchive.org/wayback/availableに投げたら、結構保存されてないので、
消える前に保存したほうがいいかも。

702 :192.168.0.774:2021/07/05(月) 09:11:16.10 ID:8On27QWK0.net
iPhoneアプリのOffice Pagesってもう機能してないのかな
使ってる人います?

703 :192.168.0.774:2021/07/06(火) 01:28:03.18 ID:7zXDsYGH0.net
>>701
手遅れの可能性もある

704 :192.168.0.774:2021/07/19(月) 13:30:59.74 ID:fiblEnSF0.net
今日最初の保存でYou have already reached the limit of active sessions.出すな

705 :192.168.0.774:2021/07/22(木) 10:00:06.11 ID:Ar5GRjJC0.net
フリーソフトの再配布まとめもほしいなあ

706 :192.168.0.774:2021/08/17(火) 08:48:52.70 ID:5NZSHDeK0.net
わかる

707 :192.168.0.774:2021/09/02(木) 11:41:25.91 ID:3hkeXiph0.net
2020年頃からtwitterのツイートも一個一個自動でアーカイブ取るようになったけど
取るようになる以前のツイートとか元鍵垢の鍵かかってた頃のツイートとか兎に角過去に遡ってまでやってくれないのは無能だと思う

前に鍵垢が一時的に開いてたのがあって夜通し手動でアーカイブ取ってたが500くらいしか録れない内に鍵かけ直されちゃった
アクセストークンとか使えたらわざわざいつ開くかわからん鍵が開くまで待つ必要もなくなるんだが…

708 :192.168.0.774:2021/09/02(木) 11:42:26.46 ID:3hkeXiph0.net
>>707
書き忘れたけどWaybackMachineの話ね

709 :192.168.0.774:2021/09/05(日) 13:32:33.59 ID:QmbZsHyP0.net
『ウェブクロウ』サービス終了のお知らせ
『スターサーバーフリー』「フリーWPプラン」「フリーWPプレミアムプラン」の提供終了のお知らせ
https://www.netowl.jp/news_detail.php?view_id=2886
https://www.netowl.jp/news_detail.php?view_id=2887

どちらも2022年3月31日正午サービス終了とのこと

710 :192.168.0.774:2021/09/05(日) 15:40:36.27 ID:mfjx+saw0.net
工エエェェ(´д`)ェェエエ工

711 :192.168.0.774:2021/09/05(日) 16:10:23.55 ID:wlPS8xY70.net
この辺のドメインのサイトは全滅するってことなのかな

・ウェブクロウ初期ドメイン
webcrow.jp
・ウェブクロウプラス初期ドメイン一覧(138種類)
https://www.webcrow.jp/service/original_domain.php

712 :192.168.0.774:2021/09/05(日) 16:25:46.16 ID:hHeoYwam0.net
mpeg4.jpってのは全然使われてなさそうだな

713 :GeoLog Project :2021/09/05(日) 19:14:31.17 ID:ukXe2CKd0.net
アーカイブする余裕はないですが、URL収集だけは作りますか…

714 :192.168.0.774:2021/09/05(日) 22:04:48.06 ID:hHeoYwam0.net
おお、ありがとう!

715 :GeoLog Project :2021/09/06(月) 01:55:14.24 ID:asulMEb90.net
https://geolog.mydns.jp/webcrow/

716 :192.168.0.774:2021/09/07(火) 10:24:27.31 ID:tjiIa94U0.net
現状、Wayback Machine とGeoLogでアーカイブが存在しないジオシティーズのサイトは
もう2度と見ることは不可能ですか?
親父との思い出がすべて消えてしまったようなので非常に残念

717 :192.168.0.774:2021/09/07(火) 13:09:59.05 ID:LYRD7+970.net
>>521
無理だね
ただほとんどアーカイブされてるからアーカイブされてないやつは少ない

718 :192.168.0.774:2021/09/07(火) 13:10:38.87 ID:LYRD7+970.net
>>717
安価ミス

>>716

719 :192.168.0.774:2021/09/08(水) 18:41:42.82 ID:yT2ioJcy0.net
今日archiveis落ちてます?

720 :192.168.0.774:2021/09/09(木) 11:25:30.05 ID:FyBcnQE10.net
ふとArchiveTodayのURL見てて思ったんだけど
ここのURLって大小英数字で5文字だけど、これだと(26*2+10)^5で9億チョイにしかならないんだよね
9億ってInternet archiveの1か月分にすらならないんだけど流石に少なすぎない?
本当に全部アーカイブしてるのかな

721 :192.168.0.774:2021/09/09(木) 11:31:57.72 ID:FyBcnQE10.net
>>720
ごめん自己解決した
運営ブログに書いてあった
https://blog.archive.today/post/661314951417315328/what-percentage-of-5-char-codes-is-used-now-full

冷静に考えたらIAのアーカイブ量が多すぎるだけか

722 :192.168.0.774:2021/09/10(金) 13:52:15.68 ID:1Zu8rxzZ0.net
ニコニコのブロマガがそろそろ終わる
URLはナンバー割り振りだからスクリプト等での取得は楽そうだが…

723 :192.168.0.774:2021/09/10(金) 21:29:09.64 ID:xVzJmdtd0.net
それ分からない

724 :192.168.0.774:2021/09/15(水) 15:02:30.62 ID:eir66lMu0.net
5chの過去ログの閲覧が有料会員限定になってしまった
sc使えば見られるらしいが有益なスレは念のため魚拓とるようにした方がいいかも

725 :192.168.0.774:2021/09/16(木) 00:58:25.90 ID:1xT4uIKN0.net
itestだけだな
PC版は見れる

726 :192.168.0.774:2021/09/16(木) 03:17:33.64 ID:zSMJSyx20.net
PC版を見れるうちに ってことかな

727 :192.168.0.774:2021/09/16(木) 05:05:04.36 ID:0ExHl1wP0.net
>>724
scも最近はクロールがすぐいかれるので必要なログはちゃんと押さえておく必要がある
/test/read.cgi/patisserie/1506253827/l50

728 :192.168.0.774:2021/09/16(木) 12:27:15.17 ID:HjXFmpnmO.net
2ちゃんねる過去ログは「ぬこ」使え。過去過ぎるのはほぼ消えたけど。

729 :192.168.0.774:2021/09/17(金) 00:20:21.39 ID:9TrqYaCb0.net
itestの過去ログまた見れるようになったな
あれも専ブラみたいなもんだからたぶん仕様変更による不具合、元々専ブラじゃ過去ログは見れないし
PC版はHTMLだから影響なかった

730 :192.168.0.774:2021/09/23(木) 16:38:00.26 ID:SnlBsIcL0.net
「東京大学見聞伝ゼミナール」 ttp://kenbunden.net/general/
「dacapo」 ttps://dacapo.piichi.jp/
どっちもここ数年更新されてないからアーカイブしたほうがいいのだろうか?

731 :192.168.0.774:2021/09/23(木) 19:18:56.23 ID:5qf7Ids20.net
みんなクイック魚拓javaでinternet archiveとarchive todayの取得していないのか? URLのリストがあれば一括で取得できるけど
まだ消えていない個人ブログならfeedlyに登録して、Title-Only Viewで記事の一覧を上から下まで選択して、copy selected linksでURLのリストを取得できる
Screaming Frog SEO Spiderとかを使ってURL取得する方法もあるけど

732 :192.168.0.774:2021/09/23(木) 19:19:54.95 ID:5qf7Ids20.net
それとYoutubeの各動画の説明欄にある帰属情報の表示ページが2021年9月以降に廃止されるらしい

帰属情報にはクリエイティブ・コモンズ情報(CC-3.0)が記されている動画があって、そういった動画はまるまるウィキメディア・コモンズに動画を転載して実質的なバックアップとすることができる。もちろん、ウィキメディアのコミュニティが教育的でないと判断したら削除されるが、結構生き残るから試して見る価値はある

帰属情報欄が消されると、ウィキメディアの査読者たちがYoutube上でクリエイティブ・コモンズの動画かどうか確認できないから、消されてしまう。それを回避するためには各動画ページのアーカイブを取得する必要がある

733 :192.168.0.774:2021/09/26(日) 06:38:01.90 ID:w6nU2vk/0.net
archive.phで.txtをアーカイブした場合、プレーンテキストを表示させるにはどうしたら良い?

734 :192.168.0.774:2021/10/08(金) 09:10:38.92 ID:DAZmEcuV0.net
https://wayforward.archive.org/

735 :192.168.0.774:2021/10/09(土) 16:11:44.25 ID:wG4zenqO0.net
「音楽文」サービス終了のお知らせ
https://ongakubun.com/notice/7

736 :192.168.0.774:2021/10/29(金) 01:31:40.54 ID:aL+Cspmv0.net
スレ違い気味ですみません

ttp://tojinomiko-tomoshibi.jp/
上記の冒頭での「斬る」エフェクトアニメがどうしても保存できません
どうすればいいでしょうか?

737 :192.168.0.774:2021/10/29(金) 11:12:11.18 ID:QSc2canI0.net
>>736
アニメーションを自分の端末に保存したいってことかな?
ソースを見ると1枚の画像をブラウザの処理で変形させてアニメーションにしてるから
画面収録とかして保存するしかないと思う

738 :192.168.0.774:2021/10/29(金) 11:55:15.50 ID:aL+Cspmv0.net
>>737
サンクス
やっぱりそうかあ>1枚の画像をブラウザの処理で変形させてアニメーションにしてる
静止画保存で妥協します

739 :192.168.0.774:2021/10/29(金) 12:33:00.97 ID:aL+Cspmv0.net
って、開発者モードから静止画が取れないみたいですね
キャプチャ(画面撮影)くらいしか方法がないのかな?

740 :192.168.0.774:2021/10/29(金) 14:40:08.52 ID:QSc2canI0.net
>>739
画像はここから確認できるよ
http://tojinomiko-tomoshibi.jp/imgs/top/issen.png

741 :192.168.0.774:2021/10/29(金) 19:43:33.53 ID:aL+Cspmv0.net
>>740
いやもう本当にサンクス おかげで助かりました

742 :192.168.0.774:2021/11/16(火) 17:17:26.39 ID:JttJ7yZa0.net
>>730
kenbunden.net Internet Archiveに保存されてなかった80ページほどのURLを昨日SPNに投げて保存しといた
dacapo.piichi.jp こっちも保存されてなかった1700ページぐらいをSPNに投げて保存した
>>735
10月末にArchiveteamが巡回保存済、誰か依頼出したみたい

743 :192.168.0.774:2021/11/16(火) 21:13:44.38 ID:YQB5gBe+0.net
Archiveteamがやってくれるなら、ノンアフィまとめサイトも一括で魚拓取ってほしい
記事数が1年で1万近くあるから手動じゃ無理だわ
http://himasoku1123.blogspot.com
http://nikisoku.blogspot.com

744 :192.168.0.774:2021/11/17(水) 12:33:14.44 ID:In0ODzl20.net
自動化してまとめ記事作ってるところもあるだろうし際限なさそう

745 :192.168.0.774:2021/11/19(金) 12:17:06.05 ID:CyrJshBK0.net
>>742
729です ありがとうございます
いま見聞伝の昔のサイト「KENBUNDEN2009」(ttp://kenbunden.net/wpmu/)のアーカイブをInternet Archiveで途中までとっているのですが
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/blog/2010/03/15/%EF%BC%94%EF%BC%8E%E5%8F%96%E6%9D%90%E2%97%86%E6%B0%B8%E6%B1%9F%E6%9C%97%E5%85%88%E7%94%9F%EF%BC%88%E3%83%A9%E3%82%A4%E3%82%BF%E3%83%BC%EF%BC%89/
ttp://kenbunden.net/wpmu/?attachment_id=1097
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E3%80%8C%E8%A1%97%E3%83%B2%E6%83%B3%E3%83%95%E3%80%8D/
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E3%80%8C%E8%87%AA%E5%88%86%E4%BA%8B%E5%8C%96%E3%80%8D%E3%81%99%E3%82%8B%E3%80%82/
ttp://kenbunden.net/wpmu/?attachment_id=1068
ttp://kenbunden.net/wpmu/blog/2009/12/01/%E2%97%86intro-2/
ttp://kenbunden.net/wpmu/hiroyasu/2009/09/23/nins%E3%82%B7%E3%83%B3%E3%83%9D%E3%82%B8%E3%82%A6%E3%83%A0%E4%BA%8B%E5%89%8D%E5%8F%96%E6%9D%90%E6%9D%BE%E6%B2%A2%E5%85%88%E7%94%9F/
これらのページがURLに含まれる記号等のせいかきちんとアーカイブできません

746 :192.168.0.774:2021/11/19(金) 18:59:05.02 ID:Pk06F6JR0.net
>>745です
上記のURLの内
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/?attachment_id=1068
以外はアーカイブできました これより後だと
ttp://kenbunden.net/wpmu/blog/2009/12/01/%E2%97%86intro-2/
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E8%99%B9%E3%81%AF%E9%BB%92%E3%81%84%EF%BC%81%EF%BC%9F/
ttp://kenbunden.net/wpmu/?attachment_id=1063/
ttp://kenbunden.net/wpmu/blog/2009/06/03/%E3%80%90%E7%95%AA%E5%A4%96%E7%B7%A8%E3%80%91%E3%80%8Enuovo-cinema-paradiso%E3%80%8F%EF%BC%88%E3%83%88%E3%83%AB%E3%83%8A%E3%83%88%E3%83%BC%E3%83%AC1989%EF%BC%89/
ttp://kenbunden.net/wpmu/blog/2009/05/12/%E5%89%8D%E6%9B%B8%E3%81%8D/
が時間を置いても今のところだめです

747 :192.168.0.774:2021/11/21(日) 04:32:28.52 ID:clopneT/0.net
>>745-746
Save Page Nowから保存しようとすると俺の環境でも出来なかったけど、
curl使って/save/に投げたら保存できた

?attachment_id=1063と?attachment_id=1068はNot Foundでページが自体が無いけど、
Save Page Nowで保存できたよ

取りこぼし無ければ俺が確認できたブログ記事118ページ全て保存できてるはず

748 :192.168.0.774:2021/11/23(火) 18:21:37.02 ID:W/yKXnUq0.net
ツイセーブってアーカイヴ的な意味でTwitterの保存に使えるのかな

749 :192.168.0.774:2021/12/11(土) 19:00:09.35 ID:2OqI6BpU0.net
エキサイトフレンズサービス
ttps://friends.excite.co.jp/notice/?type=info&no=172
サービス提供の終了 2022年4月27日(水)15時

750 :192.168.0.774:2021/12/22(水) 16:07:43.18 ID:i8v1M90L0.net
ttps://ameblo.jp/imai-yuzo/entry-12716798529.html
今井ゆうぞうさんのブログが明後日の19時に閉鎖されるそうです

751 :192.168.0.774:2022/01/01(土) 08:02:10.22 ID:1JWOwe190.net


752 :192.168.0.774:2022/01/30(日) 10:58:40.76 ID:2zlArtBu0.net
ttps://shop.plaza.rakuten.co.jp/
店長の部屋Plus+は2022年1月をもって提供を終了致します。長きに渡りご愛読ありがとうございました。

753 :192.168.0.774:2022/02/03(木) 07:58:26.18 ID:sxAD5/Ob0.net
スクウェア・エニックスの開発資料を管理するプロジェクト「SAVE」のセッションをレポート。ゲーム開発の過去を探ることで,未来につなげる
https://www.4gamer.net/games/999/G999905/20220126058/

754 :192.168.0.774:2022/02/04(金) 13:46:00.41 ID:IFofhrOr0.net
気色悪すぎるポエマー基地外婆
痛い妄想婆。芸能人のゴシップネタに顔文字で嘲笑い中傷しか少ししたら即消し。
自分にひたすら赤ポチ付け命懸け
周囲に青ポチ連打。
若ぶってる還暦近いニート婆
https://news.yahoo.co.jp/profile/id/FuFiWDuNeXn41agPfYcGqcw-/comments

755 :192.168.0.774:2022/02/08(火) 15:54:59.53 ID:23mO94fl0.net
「ウェブリブログサービス終了(2023/1)のお知らせ」
ttps://info.at.webry.info/202201/article_2.html

756 :192.168.0.774:2022/02/11(金) 21:11:14.31 ID:hbmD4GnQ0.net
あけおめ

757 :192.168.0.774:2022/02/15(火) 14:21:23.44 ID:73XsCTsE0.net
TechCrunch Japanおよびエンガジェット日本版 終了のお知らせ
https://www.beboundless.jp/press/corporate-announcement-02-15-2022

これ誰かArchive Teamに連絡してもらえないかな
どちらも日本のITニュースサイトの草分け的なサイトで、過去記事が完全に無くなってしまうと結構な影響が出る

758 :192.168.0.774:2022/02/15(火) 16:50:44.74 ID:SFqpnXng0.net
>>757
なくなるのか…。

759 :756:2022/02/15(火) 20:04:52.81 ID:73XsCTsE0.net
>>757
CCPA(カリフォルニア州消費者プライバシー法)
の問題で米国のIPアドレスからはアクセス出来ないという話もあるから、
アーカイブ時は日本国内でクローラ動かす方が無難かもしれないということを補記しておきます
https://twitter.com/ken_sugar/status/1388338534788919298
https://twitter.com/niw/status/1493465935126032384
(deleted an unsolicited ad)

760 :192.168.0.774:2022/02/16(水) 03:26:15.80 ID:BKSYw+Hj0.net
キチガイ糞ヤフコメ民
こいつに青ポチいっぱい頼む
https://news.yahoo.co.jp/profile/id/jrdL5ASRZGSNJlwTZCjMgr_1lw--/comments

761 :192.168.0.774:2022/02/16(水) 15:41:04.72 ID:Z1Ikjh2D0.net
>>757
TechCrunch Japanは現時点で3190ページまである
各20記事載ってるから計63800記事くらい
https://jp.techcrunch.com/page/3190/

762 :192.168.0.774:2022/02/16(水) 16:06:31.58 ID:Z1Ikjh2D0.net
エンガジェット日本版はハードル高そうだね
パッと見た感じだと動的なページ読み込みでmaxで最新の200記事くらいしか確認できない

763 :192.168.0.774:2022/02/16(水) 16:29:22.79 ID:Z1Ikjh2D0.net
エンガジェットは公式ツイートからリンク引っ張ってくる感じが現実的なのかな
https://twitter.com/engadgetjp
(deleted an unsolicited ad)

764 :192.168.0.774:2022/02/17(木) 10:31:12.61 ID:XjL575Qm0.net
>>763
それだと古い記事の取得が難しくない?

765 :192.168.0.774:2022/02/19(土) 20:57:57.17 ID:6EQfnQ7T0.net
https://www.dead-link-checker.com/ja/
これに突っ込めばいけるんじゃ?
余計な文字や他のURLはサクラエディタの置換ツールで消せる

766 :192.168.0.774:2022/02/21(月) 12:32:00.33 ID:RaPc4gma0.net
「ビジュアルブログサービス「g.o.a.t」サービス提供終了のお知らせ」
https://www.goat.at/information/20211124.html
2022年5月31日サービス提供終了だそう

767 :192.168.0.774:2022/02/24(木) 12:10:39.23 ID:U/Jr/u3T0.net
tweetsaveのサイトが消えてしまった…

https://tweetsave.com

768 :192.168.0.774:2022/02/24(木) 23:02:37.80 ID:TTEMIZe60.net
あらま

769 :192.168.0.774:2022/03/01(火) 16:03:16.34 ID:fwCwRkUg0.net
見た限りTechCrunch Japanはほぼすべてのページが保存されてるから更新停止以降にページ一覧をアーカイブするだけでいけそうだけどそれで大丈夫だよな?

770 :192.168.0.774:2022/03/01(火) 17:44:29.93 ID:fwCwRkUg0.net
と思ったけど米国版にリダイレクトされてるから無理だ
結局日本のipでとらないといけない

771 :192.168.0.774:2022/03/01(火) 20:22:17.47 ID:kjwJQzj60.net
BLOGOS サービス終了のお知らせ
https://blogos.com/feature/blogos_close

サイトの公開を終了する2022年5月31日以降、編集部執筆のオリジナル記事など一部の記事のみlivedoor ニュースにアーカイブされ、その他の転載記事は閲覧することができなくなります。

772 :192.168.0.774:2022/03/01(火) 22:22:22.23 ID:JNCFZ5HK0.net
>>771
サイト更新終了は3/31

773 :192.168.0.774:2022/03/05(土) 18:55:25.04 ID:JfM0EMs40.net
【重要なお知らせ】teacup. byGMOのサービス終了につきまして(3月01日 14時00分)【重要なお知らせ】teacup. byGMOのサービス終了につきまして(3月01日 14時00分)
https://www.teacup.com/information/view?id=243
2022年8月1日(月)13:00にサービス終了らしい

774 :192.168.0.774:2022/03/05(土) 19:02:54.10 ID:JfM0EMs40.net
>>773です
すみません、記事タイトルを二重にコピペしているのに気づかず投稿してしまいました

775 :192.168.0.774:2022/03/05(土) 19:04:47.75 ID:lIy6/OLr0.net
いいじゃないのー

776 :192.168.0.774:2022/03/06(日) 15:23:24.56 ID:8Eb0by620.net
ネット掲示板の文化は衰退するしかないのか

777 :192.168.0.774:2022/03/08(火) 21:46:01.42 ID:5zB+Bh040.net
各種の小さな掲示板が村社会のように乱立する時代じゃなく、
単一の巨大なSNSプラットフォームで緩やかに繋がる時代にシフトしたって事だろうね
5chもそのうち無くなるよ

778 :192.168.0.774:2022/03/08(火) 21:53:23.25 ID:5zB+Bh040.net
ArchiveTeamのdeathwatchにengadgetとTechCrunchが追加されてたが、進捗どうなってるかな
https://wiki.archiveteam.org/index.php/Deathwatch#2022

779 :GeoLog Project :2022/03/08(火) 23:47:43.19 ID:WuIe8n+Q0.net
>>778
webcrowのURL収集ページがWikiに載っててたまげました・・・

780 :192.168.0.774:2022/03/11(金) 11:35:55.19 ID:xWsaYXS20.net
>>773
https://navy.ap.teacup.com/info/960.html
ブログのサービスも終了するみたい

781 :192.168.0.774:2022/03/11(金) 20:41:52.02 ID:dMI2duLO0.net
明らかに荒らすのが目的の怪しい書き込みが勢いあるスレに定期的に湧いたりしてるしね5ch
ぶっちゃけツイッターは都合・耳障りの悪い書き込みは通報されてるから外面のいい書き込みばっかで好きじゃない
フォロワー数200はないと当たらない抽選リツイート広告もうざいけど

782 :192.168.0.774:2022/03/18(金) 22:31:31.38 ID:szX8RIiK0.net
13 番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 0222-Gxrt)[] 2022/03/18(金) 10:12:48.10 ID:WOefpNSE0

過去ログも無い
フラッシュゲームも無い
画像映像すべてDeleted表示
個人サイトは404NOTFOUND
便利な新サービスができてもすぐ終了

最新のものが瞬間的にしか存在しないのが2010年代のインターネットであった
検索結果がアフィまみれなのが2010年代のインターネットであった


【電子書籍】Microsoft Storeから電子書籍が削除。購入書籍は全額返金
http://egg.5ch.net/test/read.cgi/bizplus/1554275673/
Google Play Music、サービス終了。8月末から音楽のダウンロードが不可に [434464885]
https://leia.5ch.net/test/read.cgi/poverty/1596600303/
【IT】Yahoo!ブログがサービス終了--黎明期のサービス続々終了
http://egg.5ch.net/test/read.cgi/bizplus/1551370150/
infoseekの無料HPサービスを使ってる全HPが11/1の2:00限りで見れなくなるぞー ネット遺産消滅 ★3
http://hato.5ch.net/test/read.cgi/news/1288538812/
ニフティ、個人などのホームページ14万件が1カ月後に自動消滅、8割以上が放置されたまま [無断転載禁止]c2ch.net [594632409]
http://hitomi.5ch.net/test/read.cgi/poverty/1472451809/
【lycos】ライコス消滅まであと1日【infoseek】
http://news19.5ch.net/test/read.cgi/news/1062256363/
【悲報】インターネットがまとめサイトのせいでどんどん使い辛くなってると話題に
http://leia.2ch.net/test/read.cgi/poverty/1538296178/
【お知らせ】Yahoo!ジオシティーズは、2019年3月末をもちましてサービスを終了させていただくこととなりました★2
http://asahi.5ch.net/test/read.cgi/newsplus/1538426761/
個人サイトってもう完全に消えたよな 今は検索に引っかかるようにしたブログか、要件だけ伝える簡素な会社HPか、どちらかしかない [998357762]
https://leia.5ch.net/test/read.cgi/poverty/1541513802/
魔法のiらんど、ホームページ・ブログサービス終了 小説投稿サイトにリニューアル [495152168]
https://leia.5ch.net/test/read.cgi/poverty/1579211303/
【悲報】レンタル掲示板のteacup.が8月1日でサービス終了 25年の歴史に幕 [632443795]
https://hayabusa9.5ch.net/test/read.cgi/news/1646374116/
インターネットがつまらなくなった理由とは? スマホキッズの流入、アフィキッズの流入、飛び交うネットスラング・・ [175746563]
http://leia.5ch.net/test/read.cgi/poverty/1538426531/
いつから日本のインターネットってこんなにつまらなくなったんだろうな [377388547]
http://leia.2ch.net/test/read.cgi/poverty/1513348977/
短い情報を数ページに渡って読ませた挙げ句、最後に「いかがでしたか」って書いてあるまとめサイトのゴミっぷり [566475398]
http://leia.5ch.net/test/read.cgi/poverty/1552338977/

15年前のお前ら「一度ネットで炎上したら一生残るずwww」ほとんど残ってない件 [811796219]
https://leia.5ch.net/test/read.cgi/poverty/1617362844/

【悲報】「ネットの情報は永遠に残る」が完全に嘘だったことが判明。10年前のWebの情報は8割、20年前は99%が消失 [976470219]
http://leia.5ch.net/test/read.cgi/poverty/1538708384/

783 :192.168.0.774:2022/03/18(金) 23:43:51.79 ID:DKmBxVJn0.net
【重要】サービス終了のお知らせ
http://2style.net/support-end.html
「2Style.net無料ホームページサービス/無料レンタルサーバーホスティング」が一部サービスを除き2022年3月31日で終了

784 :192.168.0.774:2022/03/31(木) 02:51:54.80 ID:ErUtL89n0.net
Internet Archive
@internetarchive
·15時間
📣 ATTENTION: PG&E our local power company is implementing a planned power outage tomorrow between approx. 7:00-7:30 AM Pacific, near one of our main data centers.
Please expect some disruptions in service. Thank you for your patience.

785 :192.168.0.774:2022/03/31(木) 03:19:47.30 ID:ErUtL89n0.net
Internet Archive
@internetarchive
ATTENTION: PG&E, our local power company, is implementing a planned power outage today near one of our datacenters.
They now report that they will be done before 2pm PT.
Please expect some disruptions in service. Thank you for your patience.

786 :192.168.0.774:2022/04/01(金) 09:25:02.27 ID:/u3wwaak0.net
>>783です
まだ今の時点では「2Style.net」のページが閲覧できます

787 :192.168.0.774:2022/04/19(火) 02:19:01.52 ID:/NniRQ7b0.net
http://web.archive.org/web/20010302070753/http://www.senpre.com/
のFlashの方で再生されていたmusic.swfファイルがどうしても欲しいのですが、
どこにも見つかりません
どこかにないでしょうか
http://web.archive.org/web/20010303030055oe_/http://www.senpre.com/music.swf

788 :192.168.0.774:2022/04/19(火) 13:13:36.41 ID:Q9RUGxtI0.net
swfまで保存してくるアーカイブなんてないだろ

789 :192.168.0.774:2022/04/21(木) 17:34:44.42 ID:CDAqJWFb0.net
2002年頃に閉鎖された趣味系の個人サイトがWayback Machineに記録されてたんだけど、
15個くらいあるページ(html)のうち1つだけがアーカイブされてなかった・・・残念だ
なんでこのページだけ?って気持ちはあるけど、まぁそういうものだと思って諦めるしかないよね

どこか他のアーカイバで保存されてないかと探したけど案の定なさそう
Wayback Machineで見つからなければジエンドか

790 :192.168.0.774:2022/04/21(木) 17:55:08.09 ID:2BhHZRWk0.net
Waybackになくて他にあったことはほとんどないなぁ確かに

791 :192.168.0.774:2022/04/21(木) 23:25:26 ID:DQbVufnt0.net
ログイン必須なとことかInternet Archiveが保存から除外してるサイトだと
Wayback Machineにはなく他だとあるってことがよくあるけど
そういうの別に関係ないサイトでWayback Machineにはなく他だとあるっていうのは言われてみれば今までなかったかもなー
あるにはあるんだろうけど

792 :192.168.0.774:2022/04/22(金) 01:42:05.73 ID:+AC+HCAC0.net
2000年くらいまでのネットは今とはだいぶ空気違くて、時々懐かしくなって見たくなるんだよな
素朴だけど良いサイトいっぱいあった

793 :192.168.0.774:2022/04/27(水) 18:01:43.52 ID:iJ8p7/dI0.net
終了するサービスを時系列でまとめてみました
「g.o.a.t」「BLOGOS」 2022年5月31日→
「teacup.」 2022年8月1日(月)13:00→
「ウェブリブログ」 2023年1月31日(2022年1月18日以降新規記事投稿のないブログは2022年12月1日に閲覧終了)

794 :192.168.0.774:2022/04/28(木) 17:40:16.98 ID:nfzmfljf0.net
「Web上に記事が残らない」ことは何が問題なのか
https://www.itmedia.co.jp/news/spv/2204/28/news136.html

795 :192.168.0.774:2022/04/28(木) 18:23:53.45 ID:nfzmfljf0.net
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
https://news.careerconnection.jp/entame/134251/?amp=1

796 :192.168.0.774:2022/05/07(土) 14:31:38 ID:xW1GHZ640.net
>>777
「SNSはネット掲示板に代わるもの」というには心もとないのになぁ
ネット掲示板は影響力とか肩書きとか関係なしに交流とか情報発信ができるが、SNSはそうはいかない
ひたすらひとりごとしてるだけならまだしも、誰かしらに見てもらいたい書き込みだと不便

797 :192.168.0.774:2022/05/07(土) 17:02:21 ID:UY+P1SK20.net
SNSはネタになりそうな作話で大量のレスポンスを釣って、
「バズったので~」って宣伝するいいね乞食がマジでキモ過ぎて無理
有名人が実名晒して宣伝してたBlogを、誰でも簡単に見てもらえるようにした仕組みだけど、
企業広告じゃない拙劣で低俗な「広告」が溢れすぎてて話にならない
動画もニートが金儲けのために必死でアップしてるだけだし

掲示板は個人ユーザーが書き込んでも原則利益に繋がらない仕組みなのが健全
ステマはあるけど

798 :192.168.0.774:2022/05/08(日) 06:26:24 ID:WdAN0K/o0.net
>>797
そもそもSNSって中華とかにある言論統制あるじゃん
ビッグネームに否定的なレスすると、粗探し通報されまくってアカ停止
片面提示大好きの愚民向け

799 :192.168.0.774:2022/05/09(月) 13:41:20.45 ID:mDbEsZ6E0.net
昔のネットはよかったなぁ
今と違って消費・消耗するような場ではなかった
懐古主義とか嫌いなはずなのに、こんなふうにノスタルジーに浸るようになるとは

800 :192.168.0.774:2022/05/13(金) 11:05:33.26 ID:HLy+pK6d0.net
どなたかアーカイブお願いします

「玄人志向」のサポート掲示板が終了へ、15年の歴史に幕 閉鎖後は過去の投稿も閲覧不可に
https://www.itmedia.co.jp/news/articles/2205/11/news124.html

801 :192.168.0.774:2022/05/14(土) 08:35:48.06 ID:d1eHR6fV0.net
>>800
Archive Teamに相談してみては?
少なくとも俺は大規模アーカイブするソフトとか使ってなく、webアーカイブという概念への貢献度の低い一利用者にすぎないため特に貢献できない…

802 :192.168.0.774:2022/05/17(火) 18:28:22.74 ID:uOl3oXdZ0.net
>>800
12日に誰かがSPNでたくさんのページを保存してる
抜けてるのだけやればいいよ

803 :192.168.0.774:2022/05/25(水) 22:01:51.56 ID:Q9rsYdoD0.net
こういうのって企業は平気と閉鎖するけど、ブランド戦略としては悪手じゃないのか
掲示板じゃないけど、何十年も前の自社製品の取説とか公開し続けてる企業ってすごい好印象だわ

804 :192.168.0.774:2022/05/28(土) 21:27:59.70 ID:gnJ54i+v0.net
>>795

当時はブログパーツがたくさんあって、これが良かったんだがなあ…。しくしく。

805 :192.168.0.774:2022/06/02(木) 10:25:41.92 ID:6ESUNEMt0.net
言論サイト「BLOGOS」、サービス終了→過去記事削除 「cakes」「SlowNews」などに続き
https://www.itmedia.co.jp/business/spv/2205/31/news212.html

806 :192.168.0.774:2022/06/09(木) 01:49:25.09 ID:LfM2lWHS0.net
どうなのよ

https://ghostarchive.org/

https://lavender.5ch.net/test/read.cgi/news4plus/1654697299/

807 :192.168.0.774:2022/06/09(木) 02:54:36.10 ID:MnJqqY9m0.net
元記事(Taiwan News)はInternet Archiveでも保存されてるのに何故Ghost Archiveを紹介したんだろうか

808 :192.168.0.774:2022/06/12(日) 12:45:25.93 ID:jWoeKDPs0.net
gigazineはInternet Archive弾いてるし、嫌いなんじゃね
知らんけど

809 :192.168.0.774:2022/06/16(木) 06:39:41.81 ID:sQjnP0OR0.net
今年だけで既に9本の記事にWayback MachineのURL貼ってるな、GIGAZINEさんは。
右手でアーカイブURLを貼りながら、左手ではブルースター・ケールに中指突き立てて削除要請という絵面。

810 :192.168.0.774:2022/06/18(土) 13:36:50.84 ID:dJ4p7a0d0.net
>>809
最近まではアーカイブ出来てたんだけどね
noteみたいに特に何かあったわけでもないのに不思議だ

811 :192.168.0.774:2022/06/18(土) 22:14:57.06 ID:H3SY4jTj0.net
正直最近のGigazineは政治的偏りが出てきてるように思うから外的な圧力があるのか保存されると都合が悪いのかってところだろう

812 :192.168.0.774:2022/07/11(月) 11:57:06.50 ID:HoZJHzgL0.net
国立国会図書館のアーカイブも非公開なってるな

813 :192.168.0.774:2022/07/13(水) 18:48:14.77 ID:9ioxaolt0.net
IAにアーカイブしないでウェブ魚拓使ってる人って何が目的なのか気になる
消される確率や開示リスクを考えたら何もメリットないと思うんだけど

814 :192.168.0.774:2022/07/15(金) 12:18:02.34 ID:SbXJdT4o0.net
魚拓って検索するとそれが最初に出てくるからな
それしか知らないんだろう

815 :192.168.0.774:2022/07/21(木) 11:48:47.24 ID:A4jqpbL00.net
最近today不安定だな

816 :192.168.0.774:2022/07/31(日) 17:00:29.92 ID:KUi/t+bC0.net
山上のツイート消えちゃったのか
ツイッターってWayback Machineで取れるんだっけ?

817 :192.168.0.774:2022/08/01(月) 08:57:00.33 ID:FYRWIllf0.net
今更だけど、teacup.の掲示板をSaveする際、掲示板の2ページ以降のURLの末尾に;や/を入れないと、「次のページ》」などのリンクが繋がらなくなるので、Tipsポイント。

例:
「8038.teacup.com/muhihi/bbs?page=2&」でURLを指定してSaveすると
「8038.teacup.com/muhihi/bbs?page=2」で保存されて、閲覧時3ページ目以降のリンクが切れるので、
「8038.teacup.com/muhihi/bbs?page=2&;」と指定する必要がある。

818 :192.168.0.774:2022/08/01(月) 09:06:00.75 ID:FYRWIllf0.net
teacup.の掲示板やブログが、NAVERまとめやGeoCitiesの時みたいに有志によって保存されんのね…。

無念あとは頼む (他力本願)

819 :192.168.0.774:2022/08/01(月) 10:43:17.30 ID:qFg/6NZR0.net
呟きはinstanceも意外と穴

820 :192.168.0.774:2022/08/04(木) 22:28:49.37 ID:puvcQAIF0.net
どなたかよろしくお願いいたします...

> 京都大学オープンコースウェア(OCW)の閉鎖について
> 京都大学高等教育研究開発推進センターは2022年9月末に廃止されることになりました。京都大学オープンコースウェア(OCW)も、残念ながら9月中旬以降にサイトを閉鎖することになりました。2005年以来、京都大学OCWをご利用いただき誠にありがとうございました。
https://ocw.kyoto-u.ac.jp/news/6/

821 :192.168.0.774:2022/08/04(木) 22:31:16.91 ID:puvcQAIF0.net
ライセンスはCC BY-NC-SAなので、アーカイブ及び再配布は認められるようです
https://ocw.kyoto-u.ac.jp/guideline/#ref

822 :192.168.0.774:2022/08/09(火) 02:33:23.62 ID:ke8LkrWk0.net
pinkのスレすげえ保存難しくね?

823 :192.168.0.774:2022/08/09(火) 03:02:05.89 ID:ke8LkrWk0.net
現状だと5ch-ranking.comが取得してるものはそれをアーカイブすることで一応可能だが
ここがキャッシュしてないスレがお手上げ状態

824 :192.168.0.774:2022/08/26(金) 16:06:28.90 ID:KLH4TeT40.net
.ph/ で保存したつもりのエラーページが破棄されてるのか出てこなくなった

825 :192.168.0.774:2022/09/02(金) 07:30:26.49 ID:+0hUFwJw0.net
ghostはノロノロ待たせてエラー吐くようになった。
成仏かなー。

826 :192.168.0.774:[ここ壊れてます] .net
[CEDEC 2022]「復刻できないあのゲームを、合法的にプレイできるようにするために、今できること」レポート。キーワードは裁定制度と納本制度
https://www.4gamer.net/games/999/G999905/20220826060/


[CEDEC 2022]スクウェア・エニックスの過去資産サルベージプロジェクトの“今”が語られた「実践!資料保存活動の現場編」聴講レポート
https://www.4gamer.net/games/999/G999905/20220826086/


[CEDEC 2022]ゲームは大きな財産。ゲーム展示や開発資料の活用方法を,多様な見地から俯瞰する
https://www.4gamer.net/games/999/G999905/20220826043/

827 :192.168.0.774:2022/09/09(金) 20:33:37.78 ID:XkqpAB1c0.net
この運動をしてる人らの興味関心がそうなのか、古いゲームにしか目を向けられてないが、
ソシャゲも頼むわ
雨後の筍のごとく出てくるのにサ終で何も残らないんよ

828 :192.168.0.774:2022/09/10(土) 04:45:47.90 ID:Np9v8fvP0.net
>>827
ブラウザゲーで公開されてるファイルの一部はたまにアーカイブに送ってるが
flashゲーみたいに動作する状態での保存はできんからな
JAVAのですら内部で呼び出すファイルのアドレスが書き換わってしまうためにそのままでは動かん

829 :192.168.0.774:2022/09/10(土) 22:55:52.26 ID:OKuA9sBP0.net
ソシャゲがソシャゲであるためにはサーバ側の処理が不可欠
サービスが終了してるならもう何も出来ない

830 :192.168.0.774:2022/09/10(土) 23:18:51.94 ID:svSJBUbd0.net
そのサーバー側の処理も含めてどうにかスタンドアローン化するか、
それが非現実的な場合は動作する状態でなくても、
静的な状態でも良いから何かしらのアーカイブ化をしてほしいわけだ

831 :192.168.0.774:2022/09/11(日) 14:14:25.65 ID:XkRKFEua0.net
海外だとオフライン版とか勝手に作られてるし、
単にスキルないだけ

832 :192.168.0.774:2022/09/11(日) 22:27:35.18 ID:+H/C2qB+0.net
1万人より100万人、100万人よりも1億人というふうにファンの裾野が広ければ上位個体が発生するし、野良サーバーも生まれ、語り部サーバーになる。

833 :192.168.0.774:2022/09/13(火) 18:31:00.61 ID:taJfRpp70.net
https://twitter.com/kitoakari_1016/status/1569191723062149121

https://twitter.com/kitoakari_1016/status/1569204688545021952

https://twitter.com/kitoakari_1016/status/1569321693453381632

これらのページの過去のデータがインターネットアーカイブに保存されていない?
クローラー回ったのにそれぞれ公開されたとき保存する人が居なかったのか?
それとも拒否された?
(deleted an unsolicited ad)

834 :sage:2022/09/13(火) 20:29:41.72 ID:taJfRpp70.net
そんなにURがヤバイ性能だったら3周年まで実装するのは待てとあれほど・・・。
なぜ周年前に実装した?

前年の8月のフェス限やパーティ限もそうだったし。

835 :192.168.0.774:2022/09/13(火) 20:30:14.92 ID:taJfRpp70.net
>>834の書き込みは間違いでした。
失礼しました。

836 :192.168.0.774:2022/09/15(木) 20:24:22.68 ID:+VNL1tON0.net
NY市の「9/11トリビュート・ミュージアム」が恒久的に閉鎖 コロナ禍の財政難で
https://www.cnn.co.jp/amp/article/35192027.html

>発表によれば展示品や記録映像の大半は、ニューヨーク州オルバニーにあるニューヨーク州博物館に移される。

>ただミュージアムのウェブサイト自体は今後もオンライン上で存続する。↓
https://911tributemuseum.org

837 :192.168.0.774:2022/09/27(火) 17:45:22.56 ID:NwHdk8lW0.net
アトラスがサ終した『真・女神転生』MMOを復活させたファンを提訴…「取り返しのつかない損害を与えている」と主張
https://www.gamespark.jp/article/2022/09/27/122858.html

838 :192.168.0.774:2022/10/07(金) 14:10:07.48 ID:Gm23UfBP0.net
teacup.掲示板 何とかしてでも自動でクロールしてIAに保存すればよかったと思ってる。
そんな技術自分には無いけど後悔してる。

839 :192.168.0.774:2022/10/25(火) 09:42:16.70 ID:5dp/GsMD0.net
それも人生

840 :192.168.0.774:2022/11/09(水) 10:32:05.57 ID:qeLxudMX0.net
12月でサービス終了らしい
https://geolog.mydns.jp/

841 :192.168.0.774:2022/11/09(水) 22:03:50.96 ID:KJLZEhd40.net
こんなのあったんか・・・見たかったとこはリンク切れのアーカイブやった残念

842 :192.168.0.774:2022/11/10(木) 03:14:11.27 ID:65CCCiKn0.net
>>840
インターネットアーカイブにはデータ渡してあるのかな

843 :192.168.0.774:2022/11/12(土) 22:00:11.37 ID:hJ1L2Sdc0.net
ヤフーニュースだとコメント欄部分の数行ダイジェストは閲覧都度ライブで取りに行ってるみたいだな。👍👎の数を見るとわかる

844 :192.168.0.774:2022/11/12(土) 22:04:03.57 ID:hJ1L2Sdc0.net
.orgでカレンダー日付にポインタ当てて保存時刻を選ぶ奴が出てくるまでのグールグール♪がクソ長くて苛々することがある。

845 :192.168.0.774:2022/11/13(日) 09:45:33.49 ID:oaOJTvfG0.net
>>844
前は早かったんだけどな
段々遅くなってる気がする

846 :192.168.0.774:2022/11/16(水) 06:37:25.11 ID:MBOIyKEq0.net
.phのqueue待ちで最後の最後に変な表示でエラーとか最悪

847 :192.168.0.774:2022/11/18(金) 07:00:39.92 ID:KRegOq6w0.net
>>755
12/1からウェブリブログも終了するからURL収集して後悔のないようにしないと

848 :192.168.0.774:2022/11/24(木) 14:14:44.58 ID:eU6nWylr0.net
.ghostは長く待たされた挙句に保存も出来ないフェイクサイトになり果てた模様

849 :192.168.0.774:2022/11/25(金) 08:11:49.45 ID:T7gUZ+DV0.net
来週Twitterの凍結垢の復活祭が巻き起こりそう
収拾つかなくなって再凍結のパターンを想定すると千載一遇のアーカイブチャンスかも
https://twitter.com/elonmusk/status/1595869526469533701
(deleted an unsolicited ad)

850 :192.168.0.774:2022/11/26(土) 02:39:51.92 ID:XEVjePrl0.net
todayは今モルドバ鯖がメインか。
twitter直撮りは待たされるけどインスタンス系は200queueごぼう抜きですぐ終わる謎の現象。

851 :192.168.0.774:2022/11/27(日) 17:59:57.39 ID:BvGPumAM0.net
このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
次をお試しください

接続を確認する
プロキシとファイアウォールを確認する
ERR_CONNECTION_REFUSED

852 :192.168.0.774:2022/11/29(火) 00:39:41.77 ID:dQ2KTYIn0.net
.org、カレンダー画面にも表示されるのに保存されてない謎の症状。

853 :192.168.0.774:2022/12/01(木) 12:36:42.61 ID:Ra0VHK8/0.net
恩赦の余波
The capture will start in ~* minute, ** seconds because we are doing too many captures of twitter.com right now. You may close your browser window and the page will still be saved.

854 :あめ :2022/12/02(金) 17:25:06.69 ID:cfSG1PGB0.net
ニコニコミュニティの掲示板のレスをすべてアーカイブする方法を教えてほしい
なんかdatで取れたような気がする

855 :192.168.0.774:2022/12/09(金) 17:11:33.69 ID:h0OeAQTO0.net
イーロン・マスク
Twitterの15億もの活動停止アカウントを削除するらしい
https://twitter.com/elonmusk/status/1601124219009409024
(deleted an unsolicited ad)

856 :192.168.0.774:2022/12/12(月) 01:11:37.20 ID:Av3sCgkO0.net
そら困ったな

857 :192.168.0.774:2022/12/14(水) 16:31:20.77 ID:SaVczf8Y0.net
Twitter公式やGoogleウェブの日本語検索結果ページを直接取ると文字化けしちまうからArchive.isに取ったやつを複取りしてたが常時取得エラーになってしまった。

858 :192.168.0.774:2023/01/02(月) 02:12:37.57 ID:r7CHuQEY0.net
幻の番組、各地の図書館などで公開へ…放送ライブラリーが新事業「配信事業者とすみ分けできる」
https://www.yomiuri.co.jp/culture/tv/20221227-OYT1T50177/

859 :192.168.0.774:2023/01/13(金) 23:27:21.56 ID:rKU1x0K50.net


860 :192.168.0.774:2023/01/15(日) 13:05:35.73 ID:Ki9xTup70.net
パンドラTV1月末でサービス終了
http://www.pandora.tv/company/notice/view/1/1177

861 :192.168.0.774:2023/02/06(月) 18:08:17.44 ID:sbf557/90.net
ここって個人運営だけどメディアに紹介されてるような有名サイトの終了の情報貼るのは駄目ですか?

862 :192.168.0.774:2023/02/06(月) 18:09:42.52 ID:sbf557/90.net
>>861
若干訂正
「個人運営だけどメディアに紹介されてるような有名サイト」です

863 :192.168.0.774:2023/02/13(月) 21:41:19.47 ID:DUzuNsxg0.net
別に良いんじゃない?

864 :192.168.0.774:2023/02/18(土) 23:53:44.67 ID:z8azrzaA0.net
>>863
ありがとうございます
ハッピーフロア閉鎖のお知らせ
https://happyfloor.net/annex/close.htm
こちらのページも閉鎖するそうです
http://blog.happyfloor.net/
https://hanabi.happyfloor.net/

865 :192.168.0.774:2023/02/19(日) 11:21:00.06 ID:fZ1Jytpd0.net
とりあえずIAで保存実行してみたけどすでにやってあったみたいだね
ブログ記事は個別保存していかないとだめかな?

866 :192.168.0.774:2023/03/01(水) 23:44:12.47 ID:4Lv8OVCl0.net
世界的には結構アーカイブサイトは変動してるんだな。
元サイトによって尻切れトンボになったりの対策・使い分けで複数使ってるけど。
なんかツイッターの凍結アカはアーカイブ無視して現在情報参照させられてる気がするんだが気のせいか?

867 :192.168.0.774:2023/03/04(土) 06:02:15.03 ID:xrbGQDNX0.net
3年くらい?前からIAのIPが@wikiにスパム扱いされてるみたいで
アーカイブ取ろうとしても専用ページにジャンプさせられるから取れないな

868 :192.168.0.774:2023/03/04(土) 22:49:21.39 ID:piyyUyni0.net
ghostはクソだな


nginx error!
The page you are looking for is temporarily unavailable. Please try again later.
Website Administrator
Something has triggered an error on your website. This is the default error page for nginx that is distributed with Fedora. It is located /usr/share/nginx/html/50x.html

You should customize this error page for your own site or edit the error_page directive in the nginx configuration file /etc/nginx/nginx.conf.

[ Powered by nginx ] [ Powered by Fedora ]

869 :192.168.0.774:2023/03/07(火) 00:57:35.23 ID:jOe6rLBG0.net
まったくだ

870 :192.168.0.774:2023/03/09(木) 14:34:48.09 ID:01o/RAs/0.net
IAの保存ツイートは"Something went wrong. Try reloading."に置換されてるのか

871 :192.168.0.774:2023/03/27(月) 16:00:14.90 ID:x3Vx/oK90.net
IAさん、フェアユース認められず敗訴
storage.courtlistener.com/recap/gov.uscourts.nysd.537900/gov.uscourts.nysd.537900.188.0.pdf
UNITED STATES DISTRICT COURT SOUTHERN DISTRICT OF NEW YORK
The plaintiffs in this action, four book publishers, allege that the defendant, an organization whose professed mission is to provide universal access to all knowledge, infringed the plaintiffs’ copyrights in 127 books (the “Works in Suit”) by scanning print copies of the Works in Suit and lending the digital copies to users of the defendant’s website without the plaintiffs’ permission.
The defendant contends that it is not liable for copyright infringement because it makes fair use of the Works in Suit. See 17 U.S.C. § 107. The parties now crossmove for summary judgment. For the following reasons, the plaintiffs’ motion for summary judgment is granted, and the defendant’s motion for summary judgment is denied.
ユナイテッド・ステーツ・ディー・コート ニューヨーク州南部地区
本訴訟の原告である書籍出版社4社は、あらゆる知識への普遍的なアクセスを提供することを使命とする団体である被告が、原告の許可なく訴訟作品の印刷物をスキャンしてデジタルコピーを被告のウェブサイトの利用者に貸し出すことにより、127冊の書籍(「訴訟作品」)に関する原告の著作権を侵害したと主張するものである。
被告は、訴訟著作物を公正に利用しているため、著作権侵害の責任を負わないと主張している。合衆国法典第17編第107条を参照。現在、両当事者は略式判決を求めて交差している。以下の理由により、原告の略式判決申立は認められ、被告の略式判決申立は却下される。

872 :192.168.0.774:2023/03/28(火) 19:07:26.59 ID:YVjB5VmQ0.net
>>871
緊急図書館は正直やり過ぎだったな
あれのせいで目を付けられた

873 :192.168.0.774:2023/03/29(水) 08:34:35.07 ID:oezul0dK0.net
順番待ち長すぎてツイート魚拓はSwwTr(Something went wrong. Try reloading.)多い

874 :192.168.0.774:2023/04/03(月) 11:35:00.72 ID:pCaKP+8h0.net
Instagramのユーザーページ(www.instagram.com/{ユーザー名}/)見れなくなってる。投稿記事は見れるが。


ページが見つかりません • Instagram

このページはご利用いただけません。
リンクに問題があるか、ページが削除された可能性があります。Instagramに戻る

875 :192.168.0.774:2023/04/03(月) 19:18:59.97 ID:pCaKP+8h0.net
Instagramのユーザーページって、IAもarchive.isもウェブ魚拓もキャッシュ取れないよね…?
キャッシュ取れるアーカイブサイトってある?

IAは、ログイン画面にリダイレクトされたり、「Please try again in ~600 min. Crawling this host is paused because they notified us that they are overloaded right now.」
archive.isは、Not Found (yet?)  投稿記事(/p/*)は取れたり取れなかったり。
ウェブ魚拓は、robots.txtブロック

876 :192.168.0.774:2023/04/05(水) 20:48:48.79 ID:cywY8s8c0.net
英語wikiのList of Web archiving initiativesでも参照してインスタ保存出来てるところを探すしかないかな

877 :192.168.0.774:2023/04/08(土) 01:43:21.82 ID:wb01j5vG0.net
画像データだけは直リンクで取れたと思う

878 :192.168.0.774:2023/04/09(日) 11:41:00.30 ID:extJdL900.net
>>876
へーこんな記事あったんだ

879 :memo:2023/04/09(日) 11:49:00.76 ID:extJdL900.net
Steamも対策されてるか。 まあいいや。

https://archive.is/LiBVq

880 :192.168.0.774:2023/04/13(木) 06:32:41.26 ID:+O/6rHBC0.net
取れぬ

881 :192.168.0.774:2023/04/14(金) 15:47:25.69 ID:NWabO92K0.net
混雑で遅延になるくらいなら寄付額で優先度振り分けすればいいのになー、使い物にならんよ

アーカイブサイト運営が忖度で混雑を放置してないかね

882 :192.168.0.774:2023/04/14(金) 16:15:57.47 ID:NWabO92K0.net
際どい内容を発表するときはアーカイブが混雑している時間帯にすれば良いってことになるな

883 :192.168.0.774:2023/04/16(日) 23:13:03.25 ID:6MwVud6d0.net
.todayはpdfが間抜けな尻切れトンボになって分散保存にもならない

884 :192.168.0.774:2023/04/18(火) 02:36:39.85 ID:ZB8dEz+O0.net
todayはpdfは対応してないって言ってた気がする

885 :192.168.0.774:2023/04/21(金) 04:47:44.92 ID:lgtz7rlq0.net
【悲報】imgur(いむがー)、ガチのマジで逝く。5月からエロ画像を全て削除、また未登録者の全ての画像を削除、投稿禁止へ
http://greta.5ch.net/test/read.cgi/poverty/1681970989/

886 :192.168.0.774:2023/04/21(金) 14:15:21.67 ID:WZpfvCf90.net
サービス終了難民の類にグロや児ポが含まれてればアーカイブ運営に削除要請来たり閉鎖の危機は予想できる所

887 :192.168.0.774:2023/05/06(土) 13:21:12.20 ID:7npAI4V10.net
Haasie: imgurの画像をアーカイブするサイト
https://haasie.com

【使い方】
テキストボックスに https://i.imgur.com/* のリンクを改行区切りで入力して Backup をクリック
保存後は https://i.haasie.com/* のリンクから閲覧可能


5月15日に、ポルノ画像・匿名ユーザーが投稿した非アクティブコンテンツが削除されるという報告を受けて開発に至ったとのこと
↓開発者の投稿
https://news.ycombinator.com/item?id=35835971

888 :192.168.0.774:2023/05/09(火) 05:07:53.59 ID:XNJpBCSJ0.net
イーロン・マスクがTwitterの非アクティブアカウントを削除していると発表
https://twitter.com/elonmusk/status/1655608985058267139

Twitterポリシーによると30日以上ログインしていないと非アクティブ判定
長期間非アクティブ状態だと削除される可能性あり
https://help.twitter.com/en/rules-and-policies/inactive-twitter-accounts
(deleted an unsolicited ad)

889 :192.168.0.774:2023/05/09(火) 08:04:54.63 ID:pNdYyC010.net
>>888
中国のqqとかいうやつと同じ事してて草
イーロン・マスクはチャイニーズだった!?

890 :192.168.0.774:2023/05/09(火) 17:49:19.14 ID:GhFHYYjY0.net
 
↓ポルトガルのサービスらしいけどココはWebページの保存が出来るわけじゃないのかね?

https://arquivo.pt/

891 :192.168.0.774:2023/05/10(水) 05:37:33.82 ID:mRmRJ/wr0.net
保存はできるけど特定国から集中するとポリシー変更、削除、閲覧ブロックはあり得る
》Termos e Condições
》O Arquivo.pt é um serviço disponibilizado em www.arquivo.pt, da responsabilidade e gestão da FCT| FCCN cujo objetivo é o arquivo periódico de conteúdos portugueses disponibilizados publicamente na Internet e posterior disponibilização ao público através de um sistema de pesquisa integrado.
(deepl翻訳)ご利用条件
Arquivo.ptは、FCT|FCCNの責任と管理のもと、www.arquivo.pt、インターネット上で公開されているポルトガル語のコンテンツを定期的にアーカイブし、統合検索システムを通じて一般に提供することを目的としたサービスです。
》Caso a FCT|FCCN tenha conhecimento de que está a armazenar conteúdos cuja ilicitude for manifesta, procederá nos termos do Decreto-Lei n.º 7/2004 de 7 de janeiro, impossibilitando o acesso aos mesmos.
(deepl翻訳)FCT|FCCNが、不正な性質が明らかなコンテンツを保存していることを知った場合、1月7日の法令第7/2004号の条項に従って手続きを行い、これらのコンテンツへのアクセスを不可能にするものとします。

892 :192.168.0.774:2023/05/10(水) 05:57:42.94 ID:FTjMaooS0.net
>>889
キンペーと共依存なの知らんのか?
あいつが目指してるのは中国的な支配構造だぞ

893 :192.168.0.774:2023/05/10(水) 15:24:20.34 ID:MwZh1enT0.net
【Twitter】ツイッター休眠アカウント削除 30日に1回ログイン必要に [837857943]
https://hayabusa9.5ch.net/test/read.cgi/news/1683581318/

【SNS】ツイッター、休眠アカウント削除へ アーカイブ化とマスク氏 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1683624208/

【Twitter】イーロン・マスク「30日に1回はログインしなきゃアカウントBANね」Twitter民阿鼻叫喚
https://greta.5ch.net/test/read.cgi/poverty/1683626336/

894 :192.168.0.774:2023/05/15(月) 19:15:19.38 ID:XSXnXJWE0.net
odnとsynapseのホームページサービスが終了するらしい

https://www.odn.ne.jp/odn_info/20230413.html
https://www.synapse.jp/info/cgi/?pr2023040501&ref=top

895 :192.168.0.774:2023/05/16(火) 03:10:26.10 ID:1h5RbfcV0.net
>>894
odnのホームページのホスト名はこの2つっぽいな
www1.odn.ne.jp
www2.odn.ne.jp

896 :192.168.0.774:2023/05/17(水) 14:23:07.05 ID:oETQfxsR0.net
.pt試してconclude押してしばらく待ったけど通らないのか時間差なのか分からん状態

897 :192.168.0.774:2023/05/18(木) 07:36:46.89 ID:CO9ZGfrQ0.net
同じドメインのページを他の人は.ptで録れてるのに俺の要望が通らないのはなぜだろう

898 :192.168.0.774:2023/05/19(金) 11:14:45.53 ID:Po3S6t3r0.net
ブラウザの標準機能の範囲でVPNも試したが駄目だった

899 :192.168.0.774:2023/05/20(土) 15:29:42.73 ID:T4pkTbRc0.net
わざわざそこ使う必要ある?

900 :192.168.0.774:2023/05/20(土) 18:32:48.18 ID:kFZD/XZK0.net
“互換機”をカタログ化したWebサイト「Unauthorizon」が公開に。全世界9000種類以上のマシンが大集結
https://www.4gamer.net/games/999/G999905/20230519084/

901 :192.168.0.774:2023/05/21(日) 12:38:09.77 ID:h7w7HN4Y0.net
長期的にはtodayもorgもどうなるか分からないから開拓地が必要

902 :192.168.0.774:2023/05/21(日) 18:20:50.04 ID:xet5iWQI0.net
wayback machineだけが信頼できる

903 :192.168.0.774:2023/05/21(日) 19:01:33.72 ID:h7w7HN4Y0.net
wayback machineもtodayも特定条件ではスクリプトが原本サイトに取りに行ってるようなんだよね
貫通現象とでも呼ぶべきか

904 :192.168.0.774:2023/05/23(火) 21:13:02.75 ID:NSn51fDn0.net
【NHKおはよう日本】"ビデオテープの危機"
https://twitter.com/nhk_ohayou/status/1660858843398647809?s=46&t=48_p2TqgHPk_AZa2L6IH5A
(deleted an unsolicited ad)

905 :192.168.0.774:2023/05/23(火) 23:40:11.49 ID:NSn51fDn0.net
>>904
↑追記
【NHK】「ビデオテープ」の貴重な映像がなくなりつつあると話題に [663277603]
https://i.imgur.com/l1SrJP7.jpg
https://greta.5ch.net/test/read.cgi/poverty/1684794892/l50

906 :192.168.0.774:2023/05/28(日) 21:34:12.91 ID:OLDh0esP0.net
静的HTMLページを手軽に生成・シェアできる https://txti.es が2023年7月1日に閉鎖
相次ぐ悪用に耐えかねたらしい

907 :192.168.0.774:2023/05/30(火) 09:46:30.64 ID:d4IYWeQl0.net
【ドラクエの日】「そして伝説へ…」ドラゴンクエストⅢ発売日の新宿に“勇者たち”の大行列(1988年2月10日)【NEWS DIG ARCHIVE】
https://m.youtube.com/watch?v=sLnXaSEcwzU

908 :192.168.0.774:2023/05/31(水) 23:16:56.05 ID:OSAI1sTm0.net
Vtuberの配信をアーカイブしてたRagtag Archiveが2023年7月24日に閉鎖するらしい
https://archive.ragtag.moe/

保存したい動画がある場合は早めにダウンロードした方が良いとのこと
https://dl.kitsu.red/ragtag-archive-announcement.pdf

909 :192.168.0.774:2023/06/01(木) 11:59:37.14 ID:Zyr5NdMH0.net
>>908
るしあと再会できたわありがとう

910 :192.168.0.774:2023/06/11(日) 17:50:18.74 ID:BFKhT9Er0.net
RedditのAPI値上げ声明に対し、サードパーティアプリ淘汰に繋がると大規模ストライキ決行へ
明日月曜日から4000以上のコミュニティが非公開になる模様
無期限非公開のリスクに備えてArchiveTeam Warriorは絶賛フル稼働中

Reddit blackout: Subreddits to go private on Monday
https://www.bbc.com/news/technology-65855608
ブラックアウトトラッカー
https://reddark.untone.uk
ArchiveTeam has saved over 10.8 BILLION Reddit links so far. We need YOUR help running ArchiveTeam Warrior to archive subreddits before they're gone indefinitely after June 12th! : DataHoarder
https://reddit.com/r/DataHoarder/comments/142l1i0/archiveteam_has_saved_over_108_billion_reddit/

911 :192.168.0.774:2023/06/20(火) 06:12:37.22 ID:80zqFpd30.net
Lord

912 :192.168.0.774:2023/06/22(木) 20:39:35.37 ID:t61gvSRe0.net
test.

913 :memo:2023/06/22(木) 20:41:00.40 ID:t61gvSRe0.net
http://archive.is/0W6A8
http://archive.is/Ew2Ag
http://archive.is/bfzpp

914 :memo:2023/06/22(木) 21:34:00.43 ID:t61gvSRe0.net
https://archive.vn/CgNfk
https://archive.is/eav6Z

915 :192.168.0.774:2023/07/03(月) 19:42:30.30 ID:SZEw+3KY0.net
ArchiveBoxって捏造に使われやしないかちと心配

916 :192.168.0.774:2023/07/05(水) 17:12:47.46 ID:x3g1nPM10.net
>>915
あれは自分のコンテンツを保存することが目的なので、そもそも証明手段にはならないよ

917 :192.168.0.774:2023/07/21(金) 02:27:01.96 ID:snjg/V2SK
誰た゛ったか國会て゛『軍隊は国民を守らない』って言ってたな
地球破壞テ□リス├税金泥棒自閉隊が都心付近まて゛クソへリやらC-130やらクソ爆音航空機飛ばしまくって低周波騒音引き起こしてるしな
(低周波騷音kwsk→https://www.env.go.jp/content/900405730.pdf
曰本に原爆落とした世界最惡のならす゛者國家に見習うべきことは.曰本に原爆落とした世界最惡のならす゛者国家憲法修正第二条だろ
税金という名目で金銭強奪して私権侵害して地球破壞するだけの地球に湧いた害虫公務員と銃刀法ってのは霸権主義國家の典型なんだぞ
某腐敗の権化か゛討ち取られた事件を曰本に原爆落とした世界最惡のならす゛者國家て゛は,銃刀法意味ねえじゃん(直訳)って報道されとるわ
銃刀法廃止のみか゛防衛、軍事費増大とは税金泥棒どもによる侵略準備であって軍拡競爭による壊滅リスクが高まるた゛けだと覚えよう!
核落とされたら軍隊なと゛無意味、高価な通常ミサヰルはウクライナて゛も分かるように━発撃ってほぼ死人セ゛囗、税金泥棒自閉隊存在価値セ゛ロ

創価学会員は.何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最惡の殺人腐敗組織公明党を
池田センセ─がロをきけて容認するとか本氣で思ってるとしたら侮辱にもほと゛か゛あるそ゛!
hTтрs://i、imgur.сom/hnli1ga.jpeg

918 :192.168.0.774:2023/07/18(火) 23:05:41.66 ID:wJHDKi820.net
レトロゲームの87%はもう遊ぶことができなくなっている
https://gigazine.net/news/20230711-retro-games-disappearance/

現在も入手可能なレトロゲームは1割程度。アーカイブが困難すぎるゲーム業界
https://www.gizmodo.jp/2023/07/difficulty-in-obtaining-retro-games.html

>映画『タイタニック』がVHSでしか手に入らないようなものです。
もし、博物館のガラスケースの中で再生されている状態でしか『タイタニック』を見る術がないとしたらどう思いますか?

919 :192.168.0.774:2023/07/28(金) 18:20:51.34 ID:ui0JR2g50.net
archive.today死んでる?
アクセスしても「Welcome to nginx!」って表示される

920 :192.168.0.774:2023/08/17(木) 18:48:37.12 ID:HU46gLci0.net
愚痴なんだが、
Twitterの各アカウントのトップページに出るツイートが、「X」に変わった辺りからツイート並び順の仕様が変わったせいで、最新のツイート順に魚拓できなくて結構困る。


いつのまにかIAの3200件ツイート保存機能って無くなったんだな。

921 :192.168.0.774:2023/08/17(木) 18:50:01.69 ID:HU46gLci0.net
愚痴なんだが、
Twitterの各アカウントのトップページに出るツイートが、「X」に変わった辺りからツイート並び順の仕様が変わったせいで、最新のツイート順に魚拓できなくて結構困る。。。


いつのまにかIAの3200件ツイート保存機能って無くなったんだな。

922 :192.168.0.774:2023/08/18(金) 08:05:33.38 ID:DfG01Ot20.net
Googleのポリシー変更に伴い、2年間非アクティブなGoogleアカウントが2023年12月1日から削除対象へ

> Googleアカウントが少なくとも2年間使用またはサインインされていない場合、Googleワークスペース(Gmail、ドキュメント、ドライブ、ミート、カレンダー)およびGoogleフォト内のコンテンツを含む、アカウントとそのコンテンツを削除する場合があります。


アクティブ判定の基準など詳細情報は下記記事参照

無効な Google アカウントに関するポリシーを更新しました(2023/5/19)
https://japan.googleblog.com/2023/05/GoogleAccount.html
無効な Google アカウントに関するポリシー
https://support.google.com/accounts/answer/12418290?hl=ja

923 :192.168.0.774:2023/08/18(金) 09:08:51.44 ID:12R/F5090.net
テクノロジー系ニュースサイトCNETが、検索エンジンのSEO対策として古い記事を大量削除していることが内部情報により判明
この手法はcontent pruningと呼ばれるSEO対策のひとつとして確立されている模様

Googleはこれを受けて反論ツイートを投稿、なおその反論に対し懐疑的な意見を持つネットユーザーも多く見受けられる


日本のニュースサイトの場合は、過去記事を削除するなんてのは当たり前で、数ヶ月前の記事が見られないなんてことはザラだからそれ以前の問題なんだけども

CNETがGoogle検索のランキングを向上させるために古い記事を大量削除、一方でGoogleは古いコンテンツでも大丈夫だと反論(2023/8/10)
https://gigazine.net/news/20230810-cnet-delete-article-google-seo/

924 :192.168.0.774:2023/08/20(日) 17:06:13.52 ID:6wDSbppV0.net
あsdf

925 :192.168.0.774:2023/08/20(日) 17:19:59.50 ID:6wDSbppV0.net
Twitterにはログインしない程のユーザーだけど、archive.isですら確実に冪等的にツイートを保存しづらくなった仕様改変、本当残念。

「Not Found (yet?)」になったり、mhtml保存も途中のツイートが見切れたり、

「ツイート書き込みの証拠を残す」とかも結構困難だろうなと。

926 :192.168.0.774:2023/09/05(火) 18:44:54.77 ID:+CTFTnL00.net
tesaet

927 :192.168.0.774:2023/09/05(火) 18:46:00.55 ID:+CTFTnL00.net
もう5chのスレも、IAではError code 520を返されたり、archive.isですら「Not Found (yet?)」で取得できなかった。

書き込みや閲覧の専ブラの規制もキツイ5ch。

928 :192.168.0.774:2023/09/08(金) 11:24:01.79 ID:qKw8POOn0.net
ウェブ魚拓保存する度にreCAPTCHAテストで、6問ぐらい出されてちゃんと画像を選んでるのに「もう一度お試しください。」

それを何回もやってるのに失敗になって嫌気がさしてくる。わしゃロボットか。


Chromeのシークレットウィンドウで魚拓を人力で取ってるのに。

929 :192.168.0.774:2023/09/08(金) 11:30:01.67 ID:qKw8POOn0.net
> エクスポート機能もないような閉鎖的プラットフォームにせっせと投稿するような間違いを、人はなぜ何度も繰り返すのか?
https://youkoseki.com/f/2021_html

5ch(2ch)もTwitterみたいに使い捨てなプラットフォームになってしまったのだと。と今更気付いた。

ブラウザでスレを見てても重いし。


「書きこみ&クッキー確認」画面の時点で強制スルーされ書きこまれちゃうし。

930 :192.168.0.774:2023/09/09(土) 08:55:00.98 ID:3736ejUH0.net
Twitterのメディア検索のツイートの並びって日時降順じゃないのか…。X以前もその並び順だったっけ…。


https://twitter.com/search?q=%E6%83%85%E5%A0%B1I%20%E6%95%99%E7%A7%91%E6%9B%B8&src=typed_query&f=media

archive.isに保存しようとすると「Not Found (yet?)」だし。
(deleted an unsolicited ad)

931 :192.168.0.774:2023/09/09(土) 09:51:01.35 ID:3736ejUH0.net
今のTwitter(X)は、板チョコ1枚を全部バラしてしまってる状態に近い。

未ログインだと、バラバラに切り割れ分けられたダミー(※)な板チョコになるが、
ログインすると、一部分だけ、割られてない板チョコを享受できる。


※食品サンプルとか。

932 :192.168.0.774:2023/09/09(土) 10:11:00.78 ID:3736ejUH0.net
日本人(団体でなく個人)のTwitterの使い方としては、口コミや陰口の延長だと思っている。

----

日本人以外の使い方の傾向や海外事情は知らないが、もしXが日本のその傾向を理解か把握が無くシステムを変えてるとす
ると、方針が合わなかったり融通が利かなくなってくる可能性。

単に一般論で、使う側の事情や使い勝手を把握してないと使いづらくなる。に過ぎないだろうが。

933 :192.168.0.774:2023/09/09(土) 10:45:01.20 ID:3736ejUH0.net
NHKの番組とかでも見る、現TwitterとXでの表記揺れについて
X(Twitter)
Twitter(X)
TwitterX


など表記に色々候補があると思うが

x=Twitter なら、一般向けに限っては「Twitter」表記のままでいい気がした。

934 :192.168.0.774:2023/09/09(土) 11:14:01.13 ID:3736ejUH0.net
「GNU/Linux」の例だと「Twitter/X」
海外のMVタイトルの「アーティスト名 - 曲名」表記例に倣うと「X/Twitter」

「Twitter X」とかで軽くググったが、
b.hatena.ne.jp/entry/https://www.itmedia.co.jp/news/articles/2309/06/news158.html

これが正解かよ。

935 :192.168.0.774:2023/09/09(土) 11:24:00.81 ID:3736ejUH0.net
09時半過から逃避してか駄弁ってたら、もうこんな時間…。

936 :192.168.0.774:2023/09/09(土) 11:29:01.86 ID:3736ejUH0.net
情報が捌けなくなってる…

937 :192.168.0.774:2023/09/09(土) 11:35:00.87 ID:3736ejUH0.net
このスレッドのレス、どちらかというとツリー型の方がいいな。多分。

938 :192.168.0.774:2023/09/13(水) 08:30:28.19 ID:j3jMns/A0.net
ブラウザで
archive.todayを叩くと
archive.phにリダイレクトして
↓の画面になるんだけど
https://i.imgur.com/rIj3UMI.png

ドメインが.isに変わったのが反映されてない?
DNSサーバーの設定か何かが間違えてんのかな?

939 :192.168.0.774:2023/09/13(水) 09:53:53.31 ID:P4XBRFsg0.net
ツイート保存はnitterでも良くね?まあ訴訟絡みには使えないだろうし、nitterの有志サーバーが飛んだら個々の仕様検証も出来なくなるので脆弱だが

940 :192.168.0.774:2023/09/13(水) 21:43:41.21 ID:gFcddnfB0.net
Yahooニュースのアーカイブを保管するサイトらしい
https://yahoo-archive.activetk.jp

自動巡回で保存されるのかな?
(画像はYahooのCDN直叩きで、恐らく保存されてるのはテキストのみ)

ソースコード
https://end2end.tech/dcbb65019bb4

作者ツイート:https://twitter.com/ActiveTK5929/status/1701917875609715025
(deleted an unsolicited ad)

941 :192.168.0.774:2023/09/16(土) 23:10:40.53 ID:Ow+h1ktP0.net
>>940
普通にInternetArchiveでいい気がするけど
まぁ分散化されるのは良いこと

942 :192.168.0.774:2023/09/21(木) 07:56:00.91 ID:JVPizmuq0.net
502 Bad Gateway
nginx/1.18.0 (Ubuntu)
https://megalodon.jp/

※復帰済

943 :192.168.0.774:2023/09/23(土) 22:08:25.17 ID:Zvh9/x5L0.net
>>939
なんでnitterだと訴訟で使えなくなるの?

944 :192.168.0.774:2023/09/26(火) 03:07:26.06 ID:NdzKENx+0.net
Internet Archiveに保存されてるサイトをローカルに保存したいんだが、良い方法はないか
wgetは何かうまくいかないしブラウザで一ページずつ保存するのも面倒

945 :192.168.0.774:2023/09/26(火) 22:56:31.11 ID:VP9Z7Tjk0.net
>>943
nitterがツイート内容を改ざんしている可能性があるから
Twitter直取りよりは信用度が落ちる

>>944
これとか?使ったことないから分らんけど
https://github.com/hartator/wayback-machine-downloader

946 :192.168.0.774:2023/09/30(土) 00:38:53.02 ID:QkH/6pUe0.net
どんなことでも相談してみて。助けるよ。

947 :ぼやき:2023/10/01(日) 08:22:04.23 ID:RnrJ/PMK0.net
X/Twitterについてもあまり詳しくないけど

Nitterってnitter.netが大元な本家でいいんだよな‥? (他: nitter.1d4.us nitter.cz)

でもnitter.netでのツイートをarchive.isで保存しようとすると、Not Found (yet?)で必ず失敗して保存できない覚えがあったような。


(nitter.)czの場合は、保存できた覚えがあるけど、czやusなどのNitterミラー版の発信元や信頼性って不明な印象で(※自分はまだ調べてない)、

もしページを信頼性も保ったまま恒久的に残そうとしたら総合的にはnet版以外のNitterは何かうまくいかなさそうな印象が。

948 :テスト:2023/10/01(日) 08:43:01.92 ID:RnrJ/PMK0.net
サンプル:
https://nitter.net/Taito_Hey/status/1707568135640088871

web.archive.org は保存可能で
archive.is は「Not Found (yet?)」


ちなみに、ユーザーのトップページをIAにsaveすると、トップページにあった画像は保存できていない。
https://web.archive.org/web/20230930232600/https://nitter.net/Taito_Hey

949 :192.168.0.774:2023/10/01(日) 08:49:01.44 ID:RnrJ/PMK0.net
もしarchive.isで保存できても、
「「https://nitter.net/Taito_Hey/status/1707568135640088871#m」と「#m」が付いてて
と表記揺れしてリンクが散逸してしまう可能性があるから、現archive.isの仕様だと意外と面倒な問題があるな…と。

950 :で、:2023/10/01(日) 08:54:01.82 ID:RnrJ/PMK0.net
そんな事よりも、

Nitter(>>939)といい、ArchiveBox(>>0914)といい、それらをここで最近知ったけど、

皆どこで そういう便利な物があるっていう事を知り得てるの? ツイッター?ニュースサイト?

951 :946の続き:2023/10/01(日) 09:26:01.85 ID:RnrJ/PMK0.net
(この場合、やっぱりここ ツリー型の方が見やすいんだろうな…。)

----

詰まるところ


nitter.czで見た物と
nitter.netで見た物、

「どちらも原本である」っていう事が分かるようにできればいいんだろうな。

(なんなら「twitter.comとNitterが同一であるか? またはそれを証明可能か?」ができればいいんだろうが。)

952 :949:2023/10/01(日) 09:39:01.87 ID:RnrJ/PMK0.net
そうなると、Web3(ブロックチェーン)???

超うろ覚えだけど、あれってあれなのか。エンドユーザーに浸透するの?

953 :192.168.0.774:2023/10/01(日) 12:53:27.91 ID:QbUlJotb0.net
>>951
TwitterとNitterの違いはツイートの時間表記だけ
Twitterは日本時間だけどNitterはUTCになってる
でもアカウント名、IDとかツイート内容は同じだから同一であると証明できるんじゃないですか

954 :192.168.0.774:2023/10/02(月) 01:30:11.89 ID:3/wo9WhU0.net
>>945
ありがとう
これはなかなか良い
リンクをローカル用に修正してくれないのが欠点だが、保存だけなら完璧

955 :192.168.0.774:2023/10/05(木) 15:54:01.76 ID:i6GCcsDS0.net
ここはお前のTwitter(X)やブログじゃないんだから毎度だらだら連投しないである程度考えまとめたり結論出してから1つのレスで書き込んでくれないか

956 :950:2023/10/05(木) 21:51:08.86 ID:NdAg2WJu0.net
意外と読んでる人いるのね、このスレって。レスの勢いが鈍行なので。

てっきり、(>>952までの途中過程の)自分のレスは、取捨して読み飛ばしてくれてるものだと思ってた。(ちなみに >>947を書き込んだ際は、間違ってageてしまった。)



>>953
「Nitter側が、本当にツイート内容などを改竄してないか?」「ツイート内容変更後に、原本(Twitter)とNitterで差異が無いか?」とかの証明は難しいんでしょうね。

957 :931:2023/10/06(金) 07:48:00.80 ID:iu8iKKZW0.net
>>933-934
なんとなく表記揺れをまとめると

X(旧Twitter)
X(Twitter)
Twitter(X)
TwitterX
x=Twitter (従来通りTwitter表記呼称、あるいは Xと書いて 読みはツイッター)
Twitter/X
X/Twitter
x.com (https://www.affility.co.jp/?p=1770 )

958 :192.168.0.774:2023/10/06(金) 10:37:09.47 ID:iu8iKKZW0.net
昨夜あたりから、archive.isで ウェブ魚拓(トップページ)を保存しようとすると、

「Welcome to nginx!」画面になって、再アクセスすると

「このサイトにアクセスできません archive.is からの応答時間が長すぎます。」

と、一定時間アクセスできなくなる気がする。

例: https://archive.is/submit/?submitid=sxIrd9y3YbEtDKkLjC8I3IfsId506PIYo1H3XOT5fjyjpXszt70KHIOege2rgiV3&url=http%3A%2F%2Fmegalodon.jp%2F


もしかしたら、archive.isの使用者ごと弾かれるNGなサイトURLでもあって、archive.is側は判定しているんだろうか?

しかし、5chも重いなあ…最近。

959 :192.168.0.774:2023/10/10(火) 14:48:25.08 ID:AfINMwgb0.net
>>945
まNitterのほうがX(Twitter)本体のUIよか圧倒的に挙動も軽いから、訴訟以外のバックアップ取りなら最強だけどな

960 :192.168.0.774:2023/10/11(水) 18:05:55.84 ID:xUx5SPHW0.net
Archive todayに削除依頼を送っているんだけど、こいつほんまに通さないな。
良い方法ない?

961 :192.168.0.774:2023/10/11(水) 20:18:18.45 ID:jHEB4zsh0.net
archive.todayの削除に成功したのってはるかぜちゃんの新しい方の弁護士と尊師だけなんじゃなかったっけ
確か現地の弁護士経由かつかなりしっかり動かないと全部突っぱねられるんじゃなかった?

962 :192.168.0.774:2023/10/11(水) 20:55:34.32 ID:xUx5SPHW0.net
>>958
このまま潰れてくんねぇかな。

963 :192.168.0.774:2023/10/11(水) 20:56:39.25 ID:xUx5SPHW0.net
>>961
流石にふざけてると思うわ。

964 :192.168.0.774:2023/10/11(水) 20:57:58.76 ID:xUx5SPHW0.net
法的手順をチラつかせたら削除されたってヤフー知恵遅れを見たが、どうなんだろうな。

965 :192.168.0.774:2023/10/11(水) 21:06:00.49 ID:EL8C4Tol0.net
ドメインも著作権も全部自分に帰属してるんだがな。
ウェイバックマシンは、テキストファイルを用意して、サイトにアドレス置いたら消してくれたんだが。
こいつは、手順も不明確且つ削除してくれる望みが薄そう。
どうかしてるぜ。

966 :192.168.0.774:2023/10/11(水) 21:07:44.35 ID:xUx5SPHW0.net
DMCAとかで検索エンジンから表示は消せても、ウェブサイトの削除依頼はできないんだからなぁ
どうにかならんもんかね。

967 :192.168.0.774:2023/10/11(水) 21:32:14.34 ID:xUx5SPHW0.net
ISPに通報するのが有用とも聞いたけどどうなの?

968 :192.168.0.774:2023/10/12(木) 02:18:23.64 ID:7bMyoE320.net
サービスが終了しそうになっても、誰かしら引き継いだり売ったりするんじゃないのか?
まぁそもそもインターネットアーカイブのサービス終了ってのは想像がつかないが。

969 :192.168.0.774:2023/10/12(木) 02:21:30.42 ID:7bMyoE320.net
実際、運営は個人レベルだったはずだから、寿命を迎えれば消えてなくなるかもな。
それ相応の団体化するとそう簡単には行かないが。
それこそ寄付金があるからな。あれが潰れるってのはあまり考えれられない。

970 :192.168.0.774:2023/10/12(木) 22:24:19.71 ID:Cc0NPZ9j0.net
>>967
todayは何度もドメイン変えたり、過去に児ポ通報攻撃にあっても生き残ってるので無理じゃないかな
まぁURL分からなきゃまず誰もアクセス出来ないし、諦めて忘れた方が良いと思う

971 :192.168.0.774:2023/10/14(土) 17:33:19.38 ID:Jcc+eBcl0.net
早い話、日本人のnitterサーバー管理者を証拠申請すれば済むような

972 :192.168.0.774:2023/10/16(月) 11:40:48.28 ID:azdWzTrc0.net
セルフホストしたらええんちゃう
https://matoken.org/blog/2021/02/17/self-hosting-the-lightweight-twitter-front-end-nitter/

973 :192.168.0.774:2023/10/16(月) 11:41:38.02 ID:azdWzTrc0.net
セルフホストしたらええんちゃう
tps://matoken.org/blog/2021/02/17/self-hosting-the-lightweight-twitter-front-end-nitter/ ↩

974 :192.168.0.774:2023/10/16(月) 17:36:48.55 ID:BkCyhBrA0.net
.orgだとイスラエル首相がツイートした焼死赤子の写真が全部"Hmm...this page doesn’t exist. Try searching for something else."
.todayで1件だけ見れる

975 :192.168.0.774:2023/10/18(水) 16:16:06.14 ID:RIuGCdRE0.net
今気づいたんだけどツイートの直リンクだとログインなしで見れるのね
Nitter からスクレイプして直リンク取得でwaybackmachineに打ち込めるやん!

976 :192.168.0.774:2023/10/19(木) 17:03:11.12 ID:YZO3LNYf0.net
>>975
一部見れないツイートがあるのと(おそらくR18認定)、リプライが見れなくなったから一つひとつアーカイブしなきゃいけないけどね

977 :192.168.0.774:2023/10/19(木) 18:32:56.68 ID:BbSSQwx/0.net
nitterはシクブラとか職場でR18突破するために見つけたんだよね、イーロン以前

978 :192.168.0.774:2023/10/20(金) 05:27:28.98 ID:MWss6HyY0.net
Nitterのスクレイプ試したけど2万ツイートぐらいで取得できなくなる?
インスタンスにもよるのかな一度だけ三万ツイート取得できたけど

979 :192.168.0.774:2023/10/22(日) 10:17:10.67 ID:ZodK+h9h0.net
.org沈黙したな

980 :192.168.0.774:2023/10/22(日) 13:31:28.62 ID:S1DF3x8M0.net
orz

981 :192.168.0.774:2023/10/22(日) 17:52:16.71 ID:hiS5hxVm0.net
Twitter公式が旧UI完全廃止で重ったるい現行UI強制来た時にnitterを発掘した。

982 :192.168.0.774:2023/10/24(火) 17:22:09.42 ID:ZAGhQ3u+0.net
衆議院議員が陰部ポロリXに.orgも.todayも役立たず

983 :192.168.0.774:2023/10/29(日) 22:21:48.35 ID:Ft9/6eOi0.net
todayのpixivアカウント消えたっぽいな

984 :192.168.0.774:2023/11/02(木) 00:41:26.94 ID:zMOd/xdd0.net
『どっとうpろだ』が 2023/11/30 を持ってサービス終了
サービス終了と同時に全データも削除とのこと

985 :192.168.0.774:2023/11/02(木) 00:47:19.52 ID:zMOd/xdd0.net
>>984
https://i.imgur.com/9XMxo3F.png

986 :192.168.0.774:2023/11/05(日) 19:40:01.13 ID:IXzGmb0O0.net
TVでた蔵(https://datazoo.jp/ )が重い 最近。

消失すると地味に困るかも。

987 :192.168.0.774:2023/11/05(日) 20:05:07.55 ID:k4gYNeRG0.net
※「価格com テレビ紹介情報」は株式会社ワイヤーアクションが提供するTV放送ログを掲載しています。
https://kakaku.com/tv/

まあ会社が飛んだら提供も止まるし削除だろうけどな

988 :984:2023/11/06(月) 15:39:04.93 ID:hjrGk5W/0.net
いや、でた蔵が重い要因や理由は何だろう?っていう話。


----

「電波ログテキストマイニング(録画バカ一代)」(http://dnptxt.com/)が、消えてしまった。

もうちょっと持つかと思ったがダメだったか。


こういうサービスや記録のサイトって、意外と需要が無く誰もサイト丸ごと保存やIAとかに公開しないんだろうか。


----

gooテレビ番組って関西の番組内容の抄録もあって、でた蔵より充実してたな…。これも誰も丸ごと保存してなさそうだし。

関西版でた蔵って無いんだろうか。

989 :192.168.0.774:2023/11/07(火) 05:21:16.35 ID:OLRw/jQk0.net
Way backだとツイート直リンクでアーカイブできなくなってるのか
白い画面しか表示されない、todayは大丈夫だけど

990 :192.168.0.774:2023/11/07(火) 06:19:38.23 ID:dk3XRua60.net
https://nudefusion.com/ja?referral=g7708g4w040va1i

991 :192.168.0.774:2023/11/07(火) 14:58:27.31 ID:2Phbl9ID0.net
>>989
ちょっと前から表示は出来なくなってる
ソースを見るとツイート内容の保存はされてるらしい

992 :192.168.0.774:2023/11/08(水) 20:24:56.72 ID:FYJKvk760.net
面倒だからtwitter直じゃなくてnitterリンクでwayback にプッシュした方がいいな
Todayはキャプチャまみれで大量に取りにくいんだよな

993 :192.168.0.774:2023/11/15(水) 07:02:27.68 ID:aRjHD32L0.net
亜種
https://ghostarchive.org/

994 :192.168.0.774:2023/11/15(水) 11:57:08.59 ID:Ip7omGo40.net
ghostはURLの最後に*付けて芋づる式検索が出来なかったり容量オーバー名目で記録拒否されたリする

995 :192.168.0.774:2023/11/15(水) 14:05:35.00 ID:FWXSB1gA0.net
>>993
Shift JISとか化けてない?

996 :192.168.0.774:2023/11/15(水) 14:06:33.20 ID:FWXSB1gA0.net
>>990
グロ

997 :192.168.0.774:2023/11/20(月) 17:59:00.89 ID:pAClgikJ0.net
もし自分が次スレを立てるなら、

次スレのスレタイは

【保存・記録】ウェブアーカイブ総合 page.02

という表記にしようかと思ってる。(これでもピリオドの部分も微妙な感じがするが。)

上記などに異議が無いなら上記で次スレを立ててるかも。(万が一、規制に巻き込まれてとかで次スレを立てられなかったらごめん。)



それで「いや自分が次スレ立てたい」という人がいるなら、任せた。

そもそも次スレの需要があるかどうか不明だが。

998 :192.168.0.774:2023/11/21(火) 02:15:29.47 ID:gtrkUTCl0.net
きっしょ

999 :192.168.0.774:2023/11/21(火) 07:25:03.07 ID:QN4SUfby0.net
表記なんか確認する必要ないだろ
【保存・記録】ウェブアーカイブ総合 Page.02
https://mevius.5ch.net/test/read.cgi/internet/1700519014/

1000 :192.168.0.774:2023/11/22(水) 10:46:01.18 ID:QZxCudHS0.net
>>999
じゃあ「Page.01」のそのピリオドは何の意味なんだ?
例えば「p.52 (52ページ)」というような略記法な使い方とも違うじゃん。

そんな表記だと、キャピタライゼーションルールとも違うわけだし、そんなんだったら「Page」は「page」になる方が好ましいだろうが。


>>998
この無知者め

1001 :192.168.0.774:2023/11/22(水) 11:16:03.00 ID:S5C4Okpm0.net
気持ち悪すぎる

1002 :192.168.0.774:2023/11/22(水) 11:24:01.44 ID:eA83YbWK0.net
無意味な煽り合いはやめてね

1003 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1003
271 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200