2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

Internet Archive総合 (web.archive.org) #5

1 :名無しさん@お腹いっぱい。:2023/07/28(金) 06:58:53.37.net
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
 ------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/


前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
(deleted an unsolicited ad)

2 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:00:04.50.net
【QA】

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。

Q.寄付したいんだけど?
こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください
https://archive.org/donate

Q.すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
https://web.archive.org/save/

Q.アカウント作ったらなんかいいことあるの?
A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える

Q.spn@archive.orgにメールでURLを送ったら保存されるの?
A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい

3 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:00:23.53.net
Q.インスタのURLが保存できないんだけど
A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます

Q.robots.txtでia_archiverをDisallowしても無視されるの?
A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い

Q.鯖落ちしてる?
A.ここで鯖状態を見れる
https://analytics0.archive.org/stats/wb.php
https://archive.org/stats/

Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています

Q.Save Page Nowの制限などの仕様は?
A.ここを参照
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも

4 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:15.35.net
Q.「The capture is estimated to start in XX minutes.」って何?
A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手

Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください

Q.The server didn't respond in time for https://(保存しようとしたURL)
A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります

Q.「You have already reached the limit of active sessions」が出た
A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される

Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC)

5 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:22.75.net
Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、
ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります

Q.「Cannot get status of spn2-乱数」のエラーは何?
A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください

Q.「404 Not Found」のエラーは何?
A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう

Q.「Sorry Job failed」が出た
A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください

6 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:40.39.net
便利なツール
https://github.com/webrecorder/webrecorder-player/
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
https://github.com/hartator/wayback-machine-downloader
https://github.com/overcast07/wayback-machine-spn-scripts
https://github.com/akamhy/waybackpy
https://github.com/JustAnotherArchivist/snscrape
https://github.com/bibanon/tubeup

7 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:55.63.net
拒否URL関係まとめ

This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/

This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/

サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる

ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine

8 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:02:57.18.net
アーカイブ済のURL一覧を出力する方法
1. http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt にアクセス
2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること
3. 大量のテキストが出るので全選択してコピー
4. Excel立ち上げてCtrl+Aで全選択して貼り付け
5. 「テキストから列へ」を選んでスペースを基準にセルを区切る
6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする

同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能


引用元: https://exposureninja.com/blog/extract-urls-archive-org/
https://mevius.5ch.net/test/read.cgi/esite/1628793497/332

9 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:25:43.19.net
>>1おつ

Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.net/test/read.cgi/esite/1475246713/5

5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?

10 :名無しさん@お腹いっぱい。:2023/07/28(金) 16:21:28.75.net
おつでありんす

11 :名無しさん@お腹いっぱい。:2023/07/28(金) 19:06:10.70.net
todayだとヤフーニュースが保存できなくなってる
だからInternet Archiveで保存することが増えた

慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは?
news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16

12 :名無しさん@お腹いっぱい。:2023/07/28(金) 19:09:18.35.net
私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。
主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。
その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、
むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。
ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。
誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、
審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。

todayでも↑のコメントを保存したかったなあ…

13 :名無しさん@お腹いっぱい。:2023/07/29(土) 03:23:34.53.net
盲人でも野球の審判を業務として行えるという実例ですね

14 :名無しさん@お腹いっぱい。:2023/07/29(土) 14:34:01.29.net
twitterのプロフィールはwaybackmachineで保存できなくなった
個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ

15 :名無しさん@お腹いっぱい。:2023/07/31(月) 10:26:16.62.net
tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ?
他の人がアップロード出来なくなるから普通に迷惑なんだが

16 :名無しさん@お腹いっぱい。:2023/08/01(火) 12:14:52.09.net
ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの?

17 :名無しさん@お腹いっぱい。:2023/08/01(火) 14:26:51.27.net
>>16
自分は魚拓サイト初心者だから専門的な知識とかは余り持ってないけど
IAやtodayでは動画サイトの動画は恐らく保存されないと思う

18 :名無しさん@お腹いっぱい。:2023/08/02(水) 09:01:22.40 ?2BP(1000).net
sssp://img.5ch.net/ico/nida.gif
>>16 >>17
IAはYouTubeだけ特別に動画も保存される仕様になってる

19 :名無しさん@お腹いっぱい。:2023/08/02(水) 11:49:36.01.net
>>14
今はプロフィールも保存できるね(ログインしなくても閲覧出来る)

方針コロコロ変えすぎでわけが分からないよイーロン

20 :名無しさん@お腹いっぱい。:2023/08/02(水) 14:26:37.14.net
動画サイトが動画直リン保存すればいける場合もあんのか

21 :名無しさん@お腹いっぱい。:2023/08/04(金) 14:12:38.34.net
またTwitterのプロフィール取れなくなってるわ
あのさぁ・・・

22 :名無しさん@お腹いっぱい。:2023/08/05(土) 21:26:33.08 .net
あれ?また取れるようになってるな
非ログイン状態でも見れるプロフィールと見れないやつがある?
条件が分からん

23 :名無しさん@お腹いっぱい。:2023/08/06(日) 01:13:10.24 .net
なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。

もう訳わからんわw

24 :名無しさん@お腹いっぱい。:2023/08/07(月) 10:27:43.52 .net
archive.orgって画像複数を一括保存とか出来る?
いちいち一つずつURL入力保存しないといけないの?

25 :名無しさん@お腹いっぱい。:2023/08/07(月) 10:37:01.96 .net
>>24
API が公開されているから、画像に限らずそれ利用するスクリプトを組めばよい。
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

26 :名無しさん@お腹いっぱい。:2023/08/08(火) 07:22:55.57 .net
>>24
Have you ever wanted to archive all the web pages linked from an email message?

Well, you are in luck because now you can forward that email to savepagenow@archive.org”
and after a few minutes you will get an email back filled with Wayback Machine playback URLs.

27 :名無しさん@お腹いっぱい。:2023/08/08(火) 12:31:37.42 .net
>>7
>
> サイトの仕様で取れないもの
> https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
> https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
>





↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
 
 

28 :名無しさん@お腹いっぱい。:2023/08/08(火) 12:46:26.56 .net
前スレ埋まってないんだから前スレに書きなよ

29 :名無しさん@お腹いっぱい。:2023/08/10(木) 00:08:00.56 .net
dclogもサービス終了

30 :名無しさん@お腹いっぱい。:2023/08/10(木) 06:52:14.96 .net
>>29
終了告知から終了まで1か月もないとはひどいサービスだな

31 :名無しさん@お腹いっぱい。:2023/08/13(日) 02:05:43.24 .net
音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴
https://www.reuters.com/legal/music-labels-sue-internet-archive-over-digitized-record-collection-2023-08-12/

32 :名無しさん@お腹いっぱい。:2023/08/13(日) 18:25:16.62 .net
Sheetsのbatch処理ここ数日ずっとqueuedのままや
そんなに使ってる人おるんか

33 :名無しさん@お腹いっぱい。:2023/08/14(月) 01:51:11.53 .net
archiveってpornhubとかエロ動画直リン保存ってしていいの?

34 :名無しさん@お腹いっぱい。:2023/08/14(月) 05:36:17.08 .net
>>33
やめとけやめとけ、お前のお母さん悲しむぞ

こんなのも絶対に見ちゃいかんw
https://archive.org/details/adultcdroms

35 :名無しさん@お腹いっぱい。:2023/08/14(月) 13:55:59.20 .net
>>31
日本語記事も出た

ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開
https://www.techno-edge.net/article/2023/08/13/1742.html

36 :名無しさん@お腹いっぱい。:2023/08/14(月) 19:47:23.54 .net
>>33
internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、
archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい

余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど
wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな
https://wiki.archiveteam.org/index.php/Porn

37 :名無しさん@お腹いっぱい。:2023/08/16(水) 07:35:06.43 .net
最近フラッシュのページのアーカイブ見るとruffleっていうSWFエミュレータが起動してフラッシュを再生してくれるようになったな

38 :名無しさん@お腹いっぱい。:2023/08/17(木) 09:37:24.83 .net
xtubeの動画のアーカイブもなんとかなりませんか
どうせどっかにあるんだろ

39 :名無しさん@お腹いっぱい。:2023/08/21(月) 07:41:35.73 .net
SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの?
authorizationヘッダを付けずにAPI呼ぶと、
"You need to be logged in to use Save Page Now."
ってエラーになっちゃう。
anonymousの制約で十分だから、APIキー無しで使いたいんだけどな

40 :名無しさん@お腹いっぱい。:2023/08/21(月) 17:51:35.50 .net
>>39
それ、応答を HTML でも返せるところを
Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。
どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。

41 :名無しさん@お腹いっぱい。:2023/08/21(月) 22:43:21.39 .net
現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので
あまり深く考えない方がいい

42 :名無しさん@お腹いっぱい。:2023/08/22(火) 22:54:25.65 .net
ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな

43 :名無しさん@お腹いっぱい。:2023/08/23(水) 22:13:20.02 .net
ここ最近自動でアーカイブされてないこと多いよな。
御叱りでも受けたか?

44 :名無しさん@お腹いっぱい。:2023/08/23(水) 22:15:20.98 .net
>>14 イーロンの仕業か。

45 :名無しさん@お腹いっぱい。:2023/08/24(木) 09:10:55.59 .net
ここ数日やけに接続エラーが起きてると思ったらこれなんだよね。
スクリプトは当面 HTTP へ切り替えるかぁ。
sssp://o.5ch.net/21qn1.png

46 :名無しさん@お腹いっぱい。:2023/08/24(木) 18:22:24.75 .net
>>45
道理で最近つながりづらいことが多いと思ったら・・・
俺環だけではなかったのか

47 :名無しさん@お腹いっぱい。:2023/08/26(土) 03:04:26.70 .net
久々に SPN2 API のドキュメントを見返していたら、
/save/ に新設のパラメータがあることに気づいたぁ。

use_user_agent=<XXX>
Use custom HTTP User-Agent value when capturing the target page.

2022-07-28 日付けの版で追加されてたのね。

48 :名無しさん@お腹いっぱい。:2023/08/26(土) 11:12:00.83 .net
Sorry Job failed
と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った
ただの表示バグだと思いたい

49 :名無しさん@お腹いっぱい。:2023/08/28(月) 17:44:50.52 .net
Atwikiってspn で取れなくなってる?
エラー吐いてる

50 :名無しさん@お腹いっぱい。:2023/08/28(月) 18:00:19.46 .net
と、何のエラーか説明すらできない言語障碍児が申しております。
sssp://o.5ch.net/21rqu.png

51 :名無しさん@お腹いっぱい。:2023/08/28(月) 18:12:11.36 .net
おま環じゃなかったか
アニオタwiki消えそうだから保存しようとしたんだけどなー
Archiveboxで自分でwarc取るしかないか
センキュー

52 :名無しさん@お腹いっぱい。:2023/08/28(月) 19:13:33.15 .net
HTTP status=403
atwiki側が意図的に排除してる

エラー吐いてる、だけじゃ何もわからんな

53 :名無しさん@お腹いっぱい。:2023/08/28(月) 19:38:17.09 .net
atwikiって前は取れた気がするけど
方針変えたのか?

54 :名無しさん@お腹いっぱい。:2023/08/28(月) 20:32:04.13 .net
https://web.archive.org/web/20230828112759/w.atwiki.jp/aniwotawiki/
403から200に戻ったw

55 :名無しさん@お腹いっぱい。:2023/08/29(火) 17:46:42.89 .net
Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな
というかいい加減httpからhttpsに転送するようにして欲しい

56 :名無しさん@お腹いっぱい。:2023/08/31(木) 09:07:02.89 .net
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/975

975 名前:名無しさん@お腹いっぱい。[] 投稿日:2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう

↑エアプ野郎w

57 :名無しさん@お腹いっぱい。:2023/08/31(木) 11:07:06.36 .net
http://homepage2.nifty.com/J-R/enjoy%20pich.htm
↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど
これの理由(誰が、いつ申請したか)を知る事って出来る?

禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine


個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ
個人HPこそ後世に残したい

58 :名無しさん@お腹いっぱい。:2023/08/31(木) 22:19:54.68 .net
>>56
> 保存されるやつみたら文字化けしてるし

テキストエンコーディング変換前のファイル見れるだろ

59 :名無しさん@お腹いっぱい。:2023/09/01(金) 02:04:41.12 .net
>>58

多分このことじゃね?

https://web.archive.org/web/20230711093514/https://agree.5ch.net/operate/dat/1608930977.dat

60 :名無しさん@お腹いっぱい。:2023/09/01(金) 06:24:58.23 .net
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
https://web.archive.org/web/20230711093514im_/https://agree.5ch.net/operate/dat/1608930977.dat

61 :名無しさん@お腹いっぱい。:2023/09/01(金) 13:11:43.12 .net
>>57
理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね
確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので
あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ

62 :名無しさん@お腹いっぱい。:2023/09/02(土) 07:00:06.31 .net
YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。
何やってんだよインターネットアーカイブに保存する人は!全然チェックされてないじゃん!
やる気あんのか?寝てたのか?
どうして誰も保存しないんだ?自動アーカイブはどうした?

https://www.youtube.com/watch?v=jjZEQ9Nocp4

https://www.youtube.com/watch?v=lnlyZlIRO1U

63 :名無しさん@お腹いっぱい。:2023/09/02(土) 07:42:50.72 .net
YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。
公開から10時間後とか。
自動アーカイブはどうしたのか?

64 :名無しさん@お腹いっぱい。:2023/09/02(土) 13:11:42.88 .net
5chをアーカイブしてもエラーページになる事が増えたなぁ
重くなってるのか?

65 :名無しさん@お腹いっぱい。:2023/09/03(日) 18:03:57.56 .net
一番上に書いてあるvideoとかmusicってなんですか?
いろいろありますけど保存してもいいんですかね?

66 :名無しさん@お腹いっぱい。:2023/09/03(日) 19:52:30.07 .net
昔と違い私的理由で使う人が多すぎて
ゴミ集積場化が止まらない

67 :名無しさん@お腹いっぱい。:2023/09/03(日) 22:28:57.02 .net
archive.today繋がらない
おま環?
>>66
たとえばどんなサイトの事言ってるの?

68 :名無しさん@お腹いっぱい。:2023/09/04(月) 17:39:35.18 .net
>>64
同感

たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも
8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない

web.archive.org/web/20230000000000*/https://nova.5ch.net/test/read.cgi/livegalileo/1693474206

69 :名無しさん@お腹いっぱい。:2023/09/05(火) 10:44:06.47 .net
同じスレを何度も保存する意味あるの?

70 :名無しさん@お腹いっぱい。:2023/09/05(火) 17:30:52.63 .net
1000までいってないなら意味あるんじゃない

71 :名無しさん@お腹いっぱい。:2023/09/05(火) 20:42:01.45 .net
もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな

【悲報】安倍晋三語録、「同意」を表すものが存在しない
nova.5ch.net/test/read.cgi/livegalileo/1693837620

IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる → archive.is/I6WEN

72 :名無しさん@お腹いっぱい。:2023/09/05(火) 23:40:36.69 .net
昔の魚拓見ようにも重いのかエラー出るな

73 :名無しさん@お腹いっぱい。:2023/09/06(水) 00:36:21.59 .net
>>71
nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。
その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。

https://agree.5ch.net/test/read.cgi/operate/1673084281/16-

74 :名無しさん@お腹いっぱい。:2023/09/06(水) 15:40:13.70 .net
>>73
なるほど
確かにエラーが起こるのはnovaが多かったな
永久に解除されない、なんてことにならなきゃいいが・・・

75 :名無しさん@お腹いっぱい。:2023/09/07(木) 17:59:45.87 .net
【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される
nova.5ch.net/test/read.cgi/livegalileo/1693978274

このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった
archive.li/pGUd4

76 :名無しさん@お腹いっぱい。:2023/09/09(土) 08:46:02.23 .net
家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。
手動で取ってただけでアク禁にされたのか

77 :名無しさん@お腹いっぱい。:2023/09/09(土) 09:07:31.51 .net
>>76
それ、一週間前にうちもやられた。
仕方なく筑波 VPN 挿して、同じようにガンガン回したけどそっちは止められることが無かった。
何が引っ掛かったのか、全くもって判らん。

78 :名無しさん@お腹いっぱい。:2023/09/09(土) 22:32:08.21 .net
>>76だけど半日くらいで解除されたっぽい

79 :名無しさん@お腹いっぱい。:2023/09/10(日) 12:26:18.58 .net
>>73-74
eggもエラー起きるな

80 :名無しさん@お腹いっぱい。:2023/09/12(火) 01:16:30.06 .net
Twitterまた取れなくなってね?

81 :名無しさん@お腹いっぱい。:2023/09/13(水) 01:14:09.55 .net
前スレのころ20分ぐらいつながらないことがあったが、
それ以上に長くつながらない・・・

82 :名無しさん@お腹いっぱい。:2023/09/13(水) 07:16:08.88 .net
81の件、ようやくつながった

83 :名無しさん@お腹いっぱい。:2023/09/14(木) 16:24:12.75 .net
twitter、じゃなくてX取れなくなってるな
個別のポストはtodayの方で辛うじて取れるが

84 :名無しさん@お腹いっぱい。:2023/09/15(金) 05:44:55.86 .net
twitterで良くね
Xとか勝手に名称変えたアホ以外誰も言ってねえわ

85 :名無しさん@お腹いっぱい。:2023/09/15(金) 11:00:18.27 .net
ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、

86 :archive.is/tTrQN:2023/09/15(金) 20:45:51.70 .net
前スレ955への返信だがグーグルキャッシュなどを経由すれば
好き嫌いドットコムのコメント欄も魚拓とれる場合がある

webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people
/result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593

87 :名無しさん@お腹いっぱい。:2023/09/18(月) 12:38:04.07 .net
>>76
アク禁にされたっぽい
保存はやってなかった、心当たりがあるのは多数の保存済みアーカイブを一斉に開いただけ

88 :名無しさん@お腹いっぱい。:2023/09/19(火) 01:23:34.92 .net
ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない?
イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい

89 :名無しさん@お腹いっぱい。:2023/09/20(水) 16:11:43.42 .net
Batch process Google Sheetsがabort出来ないバグ何とかしてくれ
相手側に負荷がかかってたらどうすんだよ

90 :89:2023/09/20(水) 16:18:49.76 .net
やっと止まったわ、遅すぎ

91 :名無しさん@お腹いっぱい。:2023/09/21(木) 10:05:32.27 .net
5ちゃんも有料化云々でヤバそうだし
スレアーカイブしといた方が良さそうだな…
そろそろ消えそうな予感

92 :名無しさん@お腹いっぱい。:2023/09/21(木) 13:38:51.45 .net
いつ復旧するかなー
sssp://o.5ch.net/21zr1.png

93 :名無しさん@お腹いっぱい。:2023/09/23(土) 18:28:51.16 .net
Attempts to archive this video failed.
はなんなんだよ

94 :名無しさん@お腹いっぱい。:2023/09/24(日) 13:01:59.07 .net
savepagenowを実行したあとにgoogleのサポートページ?に飛ばされるのはどういう仕様?

95 :名無しさん@お腹いっぱい。:2023/09/24(日) 14:22:50.44 .net
twitterの記録取れなくなるのは将来に禍根を残すと思うわ。
数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。

96 :名無しさん@お腹いっぱい。:2023/09/24(日) 18:43:53.30 .net
今のツイッターって?failedScript=vendorつけても無理になったの?

97 :名無しさん@お腹いっぱい。:2023/09/25(月) 18:24:55.68 .net
フウーεε=( ~ε~ )y-゚゚゚

98 :名無しさん@お腹いっぱい。:2023/09/29(金) 16:40:42.99 .net
teacup. byGMOレンタル掲示板あんま残ってねえな

99 :名無しさん@お腹いっぱい。:2023/10/03(火) 16:40:59.85 .net
もう5chの過去ログ課金しないと見れないっぽいね

100 :名無しさん@お腹いっぱい。:2023/10/04(水) 10:45:27.46 .net
>>99
現役鯖の分はまだ落ちてくるけどなぁ
https://mevius.5ch.net/esite/oyster/1628/1628793497.dat
/oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが

105 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★