2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

Internet Archive総合 (web.archive.org) #5

1 :名無しさん@お腹いっぱい。:2023/07/28(金) 06:58:53.37.net
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
 ------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/


前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
(deleted an unsolicited ad)

2 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:00:04.50.net
【QA】

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。

Q.寄付したいんだけど?
こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください
https://archive.org/donate

Q.すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
https://web.archive.org/save/

Q.アカウント作ったらなんかいいことあるの?
A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える

Q.spn@archive.orgにメールでURLを送ったら保存されるの?
A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい

3 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:00:23.53.net
Q.インスタのURLが保存できないんだけど
A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます

Q.robots.txtでia_archiverをDisallowしても無視されるの?
A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い

Q.鯖落ちしてる?
A.ここで鯖状態を見れる
https://analytics0.archive.org/stats/wb.php
https://archive.org/stats/

Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています

Q.Save Page Nowの制限などの仕様は?
A.ここを参照
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも

4 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:15.35.net
Q.「The capture is estimated to start in XX minutes.」って何?
A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手

Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください

Q.The server didn't respond in time for https://(保存しようとしたURL)
A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります

Q.「You have already reached the limit of active sessions」が出た
A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される

Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC)

5 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:22.75.net
Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、
ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります

Q.「Cannot get status of spn2-乱数」のエラーは何?
A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください

Q.「404 Not Found」のエラーは何?
A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう

Q.「Sorry Job failed」が出た
A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください

6 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:40.39.net
便利なツール
https://github.com/webrecorder/webrecorder-player/
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
https://github.com/hartator/wayback-machine-downloader
https://github.com/overcast07/wayback-machine-spn-scripts
https://github.com/akamhy/waybackpy
https://github.com/JustAnotherArchivist/snscrape
https://github.com/bibanon/tubeup

7 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:01:55.63.net
拒否URL関係まとめ

This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/

This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/

サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる

ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine

8 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:02:57.18.net
アーカイブ済のURL一覧を出力する方法
1. http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt にアクセス
2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること
3. 大量のテキストが出るので全選択してコピー
4. Excel立ち上げてCtrl+Aで全選択して貼り付け
5. 「テキストから列へ」を選んでスペースを基準にセルを区切る
6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする

同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能


引用元: https://exposureninja.com/blog/extract-urls-archive-org/
https://mevius.5ch.net/test/read.cgi/esite/1628793497/332

9 :名無しさん@お腹いっぱい。:2023/07/28(金) 07:25:43.19.net
>>1おつ

Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.net/test/read.cgi/esite/1475246713/5

5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?

10 :名無しさん@お腹いっぱい。:2023/07/28(金) 16:21:28.75.net
おつでありんす

11 :名無しさん@お腹いっぱい。:2023/07/28(金) 19:06:10.70.net
todayだとヤフーニュースが保存できなくなってる
だからInternet Archiveで保存することが増えた

慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは?
news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16

12 :名無しさん@お腹いっぱい。:2023/07/28(金) 19:09:18.35.net
私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。
主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。
その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、
むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。
ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。
誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、
審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。

todayでも↑のコメントを保存したかったなあ…

13 :名無しさん@お腹いっぱい。:2023/07/29(土) 03:23:34.53.net
盲人でも野球の審判を業務として行えるという実例ですね

14 :名無しさん@お腹いっぱい。:2023/07/29(土) 14:34:01.29.net
twitterのプロフィールはwaybackmachineで保存できなくなった
個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ

15 :名無しさん@お腹いっぱい。:2023/07/31(月) 10:26:16.62.net
tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ?
他の人がアップロード出来なくなるから普通に迷惑なんだが

16 :名無しさん@お腹いっぱい。:2023/08/01(火) 12:14:52.09.net
ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの?

17 :名無しさん@お腹いっぱい。:2023/08/01(火) 14:26:51.27.net
>>16
自分は魚拓サイト初心者だから専門的な知識とかは余り持ってないけど
IAやtodayでは動画サイトの動画は恐らく保存されないと思う

18 :名無しさん@お腹いっぱい。:2023/08/02(水) 09:01:22.40 ?2BP(1000).net
sssp://img.5ch.net/ico/nida.gif
>>16 >>17
IAはYouTubeだけ特別に動画も保存される仕様になってる

19 :名無しさん@お腹いっぱい。:2023/08/02(水) 11:49:36.01.net
>>14
今はプロフィールも保存できるね(ログインしなくても閲覧出来る)

方針コロコロ変えすぎでわけが分からないよイーロン

20 :名無しさん@お腹いっぱい。:2023/08/02(水) 14:26:37.14.net
動画サイトが動画直リン保存すればいける場合もあんのか

21 :名無しさん@お腹いっぱい。:2023/08/04(金) 14:12:38.34.net
またTwitterのプロフィール取れなくなってるわ
あのさぁ・・・

22 :名無しさん@お腹いっぱい。:2023/08/05(土) 21:26:33.08 .net
あれ?また取れるようになってるな
非ログイン状態でも見れるプロフィールと見れないやつがある?
条件が分からん

23 :名無しさん@お腹いっぱい。:2023/08/06(日) 01:13:10.24 .net
なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。

もう訳わからんわw

24 :名無しさん@お腹いっぱい。:2023/08/07(月) 10:27:43.52 .net
archive.orgって画像複数を一括保存とか出来る?
いちいち一つずつURL入力保存しないといけないの?

25 :名無しさん@お腹いっぱい。:2023/08/07(月) 10:37:01.96 .net
>>24
API が公開されているから、画像に限らずそれ利用するスクリプトを組めばよい。
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

26 :名無しさん@お腹いっぱい。:2023/08/08(火) 07:22:55.57 .net
>>24
Have you ever wanted to archive all the web pages linked from an email message?

Well, you are in luck because now you can forward that email to savepagenow@archive.org”
and after a few minutes you will get an email back filled with Wayback Machine playback URLs.

27 :名無しさん@お腹いっぱい。:2023/08/08(火) 12:31:37.42 .net
>>7
>
> サイトの仕様で取れないもの
> https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
> https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
>





↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
 
 

28 :名無しさん@お腹いっぱい。:2023/08/08(火) 12:46:26.56 .net
前スレ埋まってないんだから前スレに書きなよ

29 :名無しさん@お腹いっぱい。:2023/08/10(木) 00:08:00.56 .net
dclogもサービス終了

30 :名無しさん@お腹いっぱい。:2023/08/10(木) 06:52:14.96 .net
>>29
終了告知から終了まで1か月もないとはひどいサービスだな

31 :名無しさん@お腹いっぱい。:2023/08/13(日) 02:05:43.24 .net
音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴
https://www.reuters.com/legal/music-labels-sue-internet-archive-over-digitized-record-collection-2023-08-12/

32 :名無しさん@お腹いっぱい。:2023/08/13(日) 18:25:16.62 .net
Sheetsのbatch処理ここ数日ずっとqueuedのままや
そんなに使ってる人おるんか

33 :名無しさん@お腹いっぱい。:2023/08/14(月) 01:51:11.53 .net
archiveってpornhubとかエロ動画直リン保存ってしていいの?

34 :名無しさん@お腹いっぱい。:2023/08/14(月) 05:36:17.08 .net
>>33
やめとけやめとけ、お前のお母さん悲しむぞ

こんなのも絶対に見ちゃいかんw
https://archive.org/details/adultcdroms

35 :名無しさん@お腹いっぱい。:2023/08/14(月) 13:55:59.20 .net
>>31
日本語記事も出た

ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開
https://www.techno-edge.net/article/2023/08/13/1742.html

36 :名無しさん@お腹いっぱい。:2023/08/14(月) 19:47:23.54 .net
>>33
internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、
archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい

余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど
wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな
https://wiki.archiveteam.org/index.php/Porn

37 :名無しさん@お腹いっぱい。:2023/08/16(水) 07:35:06.43 .net
最近フラッシュのページのアーカイブ見るとruffleっていうSWFエミュレータが起動してフラッシュを再生してくれるようになったな

38 :名無しさん@お腹いっぱい。:2023/08/17(木) 09:37:24.83 .net
xtubeの動画のアーカイブもなんとかなりませんか
どうせどっかにあるんだろ

39 :名無しさん@お腹いっぱい。:2023/08/21(月) 07:41:35.73 .net
SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの?
authorizationヘッダを付けずにAPI呼ぶと、
"You need to be logged in to use Save Page Now."
ってエラーになっちゃう。
anonymousの制約で十分だから、APIキー無しで使いたいんだけどな

40 :名無しさん@お腹いっぱい。:2023/08/21(月) 17:51:35.50 .net
>>39
それ、応答を HTML でも返せるところを
Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。
どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。

41 :名無しさん@お腹いっぱい。:2023/08/21(月) 22:43:21.39 .net
現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので
あまり深く考えない方がいい

42 :名無しさん@お腹いっぱい。:2023/08/22(火) 22:54:25.65 .net
ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな

43 :名無しさん@お腹いっぱい。:2023/08/23(水) 22:13:20.02 .net
ここ最近自動でアーカイブされてないこと多いよな。
御叱りでも受けたか?

44 :名無しさん@お腹いっぱい。:2023/08/23(水) 22:15:20.98 .net
>>14 イーロンの仕業か。

45 :名無しさん@お腹いっぱい。:2023/08/24(木) 09:10:55.59 .net
ここ数日やけに接続エラーが起きてると思ったらこれなんだよね。
スクリプトは当面 HTTP へ切り替えるかぁ。
sssp://o.5ch.net/21qn1.png

46 :名無しさん@お腹いっぱい。:2023/08/24(木) 18:22:24.75 .net
>>45
道理で最近つながりづらいことが多いと思ったら・・・
俺環だけではなかったのか

47 :名無しさん@お腹いっぱい。:2023/08/26(土) 03:04:26.70 .net
久々に SPN2 API のドキュメントを見返していたら、
/save/ に新設のパラメータがあることに気づいたぁ。

use_user_agent=<XXX>
Use custom HTTP User-Agent value when capturing the target page.

2022-07-28 日付けの版で追加されてたのね。

48 :名無しさん@お腹いっぱい。:2023/08/26(土) 11:12:00.83 .net
Sorry Job failed
と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った
ただの表示バグだと思いたい

49 :名無しさん@お腹いっぱい。:2023/08/28(月) 17:44:50.52 .net
Atwikiってspn で取れなくなってる?
エラー吐いてる

50 :名無しさん@お腹いっぱい。:2023/08/28(月) 18:00:19.46 .net
と、何のエラーか説明すらできない言語障碍児が申しております。
sssp://o.5ch.net/21rqu.png

51 :名無しさん@お腹いっぱい。:2023/08/28(月) 18:12:11.36 .net
おま環じゃなかったか
アニオタwiki消えそうだから保存しようとしたんだけどなー
Archiveboxで自分でwarc取るしかないか
センキュー

52 :名無しさん@お腹いっぱい。:2023/08/28(月) 19:13:33.15 .net
HTTP status=403
atwiki側が意図的に排除してる

エラー吐いてる、だけじゃ何もわからんな

53 :名無しさん@お腹いっぱい。:2023/08/28(月) 19:38:17.09 .net
atwikiって前は取れた気がするけど
方針変えたのか?

54 :名無しさん@お腹いっぱい。:2023/08/28(月) 20:32:04.13 .net
https://web.archive.org/web/20230828112759/w.atwiki.jp/aniwotawiki/
403から200に戻ったw

55 :名無しさん@お腹いっぱい。:2023/08/29(火) 17:46:42.89 .net
Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな
というかいい加減httpからhttpsに転送するようにして欲しい

56 :名無しさん@お腹いっぱい。:2023/08/31(木) 09:07:02.89 .net
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/975

975 名前:名無しさん@お腹いっぱい。[] 投稿日:2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう

↑エアプ野郎w

57 :名無しさん@お腹いっぱい。:2023/08/31(木) 11:07:06.36 .net
http://homepage2.nifty.com/J-R/enjoy%20pich.htm
↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど
これの理由(誰が、いつ申請したか)を知る事って出来る?

禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine


個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ
個人HPこそ後世に残したい

58 :名無しさん@お腹いっぱい。:2023/08/31(木) 22:19:54.68 .net
>>56
> 保存されるやつみたら文字化けしてるし

テキストエンコーディング変換前のファイル見れるだろ

59 :名無しさん@お腹いっぱい。:2023/09/01(金) 02:04:41.12 .net
>>58

多分このことじゃね?

https://web.archive.org/web/20230711093514/https://agree.5ch.net/operate/dat/1608930977.dat

60 :名無しさん@お腹いっぱい。:2023/09/01(金) 06:24:58.23 .net
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
https://web.archive.org/web/20230711093514im_/https://agree.5ch.net/operate/dat/1608930977.dat

61 :名無しさん@お腹いっぱい。:2023/09/01(金) 13:11:43.12 .net
>>57
理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね
確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので
あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ

62 :名無しさん@お腹いっぱい。:2023/09/02(土) 07:00:06.31 .net
YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。
何やってんだよインターネットアーカイブに保存する人は!全然チェックされてないじゃん!
やる気あんのか?寝てたのか?
どうして誰も保存しないんだ?自動アーカイブはどうした?

https://www.youtube.com/watch?v=jjZEQ9Nocp4

https://www.youtube.com/watch?v=lnlyZlIRO1U

63 :名無しさん@お腹いっぱい。:2023/09/02(土) 07:42:50.72 .net
YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。
公開から10時間後とか。
自動アーカイブはどうしたのか?

64 :名無しさん@お腹いっぱい。:2023/09/02(土) 13:11:42.88 .net
5chをアーカイブしてもエラーページになる事が増えたなぁ
重くなってるのか?

65 :名無しさん@お腹いっぱい。:2023/09/03(日) 18:03:57.56 .net
一番上に書いてあるvideoとかmusicってなんですか?
いろいろありますけど保存してもいいんですかね?

66 :名無しさん@お腹いっぱい。:2023/09/03(日) 19:52:30.07 .net
昔と違い私的理由で使う人が多すぎて
ゴミ集積場化が止まらない

67 :名無しさん@お腹いっぱい。:2023/09/03(日) 22:28:57.02 .net
archive.today繋がらない
おま環?
>>66
たとえばどんなサイトの事言ってるの?

68 :名無しさん@お腹いっぱい。:2023/09/04(月) 17:39:35.18 .net
>>64
同感

たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも
8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない

web.archive.org/web/20230000000000*/https://nova.5ch.net/test/read.cgi/livegalileo/1693474206

69 :名無しさん@お腹いっぱい。:2023/09/05(火) 10:44:06.47 .net
同じスレを何度も保存する意味あるの?

70 :名無しさん@お腹いっぱい。:2023/09/05(火) 17:30:52.63 .net
1000までいってないなら意味あるんじゃない

71 :名無しさん@お腹いっぱい。:2023/09/05(火) 20:42:01.45 .net
もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな

【悲報】安倍晋三語録、「同意」を表すものが存在しない
nova.5ch.net/test/read.cgi/livegalileo/1693837620

IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる → archive.is/I6WEN

72 :名無しさん@お腹いっぱい。:2023/09/05(火) 23:40:36.69 .net
昔の魚拓見ようにも重いのかエラー出るな

73 :名無しさん@お腹いっぱい。:2023/09/06(水) 00:36:21.59 .net
>>71
nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。
その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。

https://agree.5ch.net/test/read.cgi/operate/1673084281/16-

74 :名無しさん@お腹いっぱい。:2023/09/06(水) 15:40:13.70 .net
>>73
なるほど
確かにエラーが起こるのはnovaが多かったな
永久に解除されない、なんてことにならなきゃいいが・・・

75 :名無しさん@お腹いっぱい。:2023/09/07(木) 17:59:45.87 .net
【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される
nova.5ch.net/test/read.cgi/livegalileo/1693978274

このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった
archive.li/pGUd4

76 :名無しさん@お腹いっぱい。:2023/09/09(土) 08:46:02.23 .net
家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。
手動で取ってただけでアク禁にされたのか

77 :名無しさん@お腹いっぱい。:2023/09/09(土) 09:07:31.51 .net
>>76
それ、一週間前にうちもやられた。
仕方なく筑波 VPN 挿して、同じようにガンガン回したけどそっちは止められることが無かった。
何が引っ掛かったのか、全くもって判らん。

78 :名無しさん@お腹いっぱい。:2023/09/09(土) 22:32:08.21 .net
>>76だけど半日くらいで解除されたっぽい

79 :名無しさん@お腹いっぱい。:2023/09/10(日) 12:26:18.58 .net
>>73-74
eggもエラー起きるな

80 :名無しさん@お腹いっぱい。:2023/09/12(火) 01:16:30.06 .net
Twitterまた取れなくなってね?

81 :名無しさん@お腹いっぱい。:2023/09/13(水) 01:14:09.55 .net
前スレのころ20分ぐらいつながらないことがあったが、
それ以上に長くつながらない・・・

82 :名無しさん@お腹いっぱい。:2023/09/13(水) 07:16:08.88 .net
81の件、ようやくつながった

83 :名無しさん@お腹いっぱい。:2023/09/14(木) 16:24:12.75 .net
twitter、じゃなくてX取れなくなってるな
個別のポストはtodayの方で辛うじて取れるが

84 :名無しさん@お腹いっぱい。:2023/09/15(金) 05:44:55.86 .net
twitterで良くね
Xとか勝手に名称変えたアホ以外誰も言ってねえわ

85 :名無しさん@お腹いっぱい。:2023/09/15(金) 11:00:18.27 .net
ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、

86 :archive.is/tTrQN:2023/09/15(金) 20:45:51.70 .net
前スレ955への返信だがグーグルキャッシュなどを経由すれば
好き嫌いドットコムのコメント欄も魚拓とれる場合がある

webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people
/result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593

87 :名無しさん@お腹いっぱい。:2023/09/18(月) 12:38:04.07 .net
>>76
アク禁にされたっぽい
保存はやってなかった、心当たりがあるのは多数の保存済みアーカイブを一斉に開いただけ

88 :名無しさん@お腹いっぱい。:2023/09/19(火) 01:23:34.92 .net
ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない?
イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい

89 :名無しさん@お腹いっぱい。:2023/09/20(水) 16:11:43.42 .net
Batch process Google Sheetsがabort出来ないバグ何とかしてくれ
相手側に負荷がかかってたらどうすんだよ

90 :89:2023/09/20(水) 16:18:49.76 .net
やっと止まったわ、遅すぎ

91 :名無しさん@お腹いっぱい。:2023/09/21(木) 10:05:32.27 .net
5ちゃんも有料化云々でヤバそうだし
スレアーカイブしといた方が良さそうだな…
そろそろ消えそうな予感

92 :名無しさん@お腹いっぱい。:2023/09/21(木) 13:38:51.45 .net
いつ復旧するかなー
sssp://o.5ch.net/21zr1.png

93 :名無しさん@お腹いっぱい。:2023/09/23(土) 18:28:51.16 .net
Attempts to archive this video failed.
はなんなんだよ

94 :名無しさん@お腹いっぱい。:2023/09/24(日) 13:01:59.07 .net
savepagenowを実行したあとにgoogleのサポートページ?に飛ばされるのはどういう仕様?

95 :名無しさん@お腹いっぱい。:2023/09/24(日) 14:22:50.44 .net
twitterの記録取れなくなるのは将来に禍根を残すと思うわ。
数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。

96 :名無しさん@お腹いっぱい。:2023/09/24(日) 18:43:53.30 .net
今のツイッターって?failedScript=vendorつけても無理になったの?

97 :名無しさん@お腹いっぱい。:2023/09/25(月) 18:24:55.68 .net
フウーεε=( ~ε~ )y-゚゚゚

98 :名無しさん@お腹いっぱい。:2023/09/29(金) 16:40:42.99 .net
teacup. byGMOレンタル掲示板あんま残ってねえな

99 :名無しさん@お腹いっぱい。:2023/10/03(火) 16:40:59.85 .net
もう5chの過去ログ課金しないと見れないっぽいね

100 :名無しさん@お腹いっぱい。:2023/10/04(水) 10:45:27.46 .net
>>99
現役鯖の分はまだ落ちてくるけどなぁ
https://mevius.5ch.net/esite/oyster/1628/1628793497.dat
/oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが

101 :名無しさん@お腹いっぱい。:2023/10/04(水) 14:13:19.96 .net
Sorry
Cannot resolve host ipv6.icanhazip.com.

IPv6 の名前解決ができなくなってる

102 :名無しさん@お腹いっぱい。:2023/10/05(木) 21:27:26.21 .net
todayがちと重い

103 :名無しさん@お腹いっぱい。:2023/10/07(土) 15:40:46.22 .net
>>99
単純に重いだけじゃない?

104 :名無しさん@お腹いっぱい。:2023/10/07(土) 18:44:36.46 .net
今繋がらないんだけど、私だけですか?

105 :104:2023/10/07(土) 18:57:20.21 .net
Wi-Fiに切り替えたら繋がった。
どうやらアク禁らしい。
普通に閲覧してただけだし、何も心当たりないんだけど…

106 :87:2023/10/07(土) 20:45:50.36 .net
>>105
その「閲覧」もヤバい

107 :104:2023/10/07(土) 23:17:39.68 .net
>>106
えっ、そうなの?
とりあえず今はアク禁解除されたっぽいけど、
アク禁になる条件って、短時間にたくさん見るとか?

108 :名無しさん@お腹いっぱい。:2023/10/08(日) 11:31:56.88 .net
人間レベルの閲覧でアク禁になるなんて聞いたことないが
ただの勘違いじゃないの?

109 :名無しさん@お腹いっぱい。:2023/10/08(日) 11:55:37.48 .net
画像が大量にあるページでそのほとんど取れてなかったりするとすぐ開けなくなる

110 :名無しさん@お腹いっぱい。:2023/10/08(日) 13:14:20.29 .net
>>109
> 画像が大量にあるページでそのほとんど取れてなかったり

その取れてない画像、全て/save/にリダイレクトされてるから
結果として大量にアーカイブ要求を発行することになるんだよね

んで、その時にアーカイブされるのは3つ程度であとは全て429エラー
運が悪いとそのままアク禁

111 :名無しさん@お腹いっぱい。:2023/10/10(火) 14:58:47.09 .net
>>99
過去ログについては一応、2chSCへも殆どがミラーされてるはずだけどな…。

112 :名無しさん@お腹いっぱい。:2023/10/12(木) 23:37:32.61 .net
油断は禁物

あとpink系は全部だめ
5ch新設板系も全部だめ

113 :名無しさん@お腹いっぱい。:2023/10/12(木) 23:58:45.47 .net
scはクロールされてるなと思って後で確認すると途中でクロールが止まってそのままというのがかなりある
こういう状態になるとクロール再開しないケースが多く5ch側が飛んだ時に頭のほうしか控えが取れてなかったりする

114 :名無しさん@お腹いっぱい。:2023/10/16(月) 02:19:32.91 .net
過去ログ、今年中は見れない可能性あるらしいな・・・

0119Ace ★
2023/10/13(金) 09:40:26.65ID:CAP_USER
過去ログについてですが、現状はアーカイブ圧縮状態で
展開再配置は相当に時間がかかる見込みです。
完了は年を越す可能性もあります。

https://agree.5ch.net/test/read.cgi/operate/1697113482/119

115 :名無しさん@お腹いっぱい。:2023/10/18(水) 23:04:25.87 .net
たまに総アーカイブ数が294 billionって表示されるの何なんだ?

116 :名無しさん@お腹いっぱい。:2023/10/20(金) 22:59:55.77 .net
>>112
一応なんG板とか、2014年春以降に新設された板でもSC側のbbsmenu一覧ページに追加されてないだけで、

[ http://tomcat.2ch.(えすしー)/livegalileo/ ]

…の鯖名から開けばアーカイブされてたりするけど、PINKともども最近の過去ログについては本鯖のモノが未だ活きてる。

117 :名無しさん@お腹いっぱい。:2023/10/23(月) 17:58:57.35 .net
X保存できるようになってる

118 :名無しさん@お腹いっぱい。:2023/10/23(月) 17:58:58.33 .net
X保存できるようになってる

119 :名無しさん@お腹いっぱい。:2023/10/23(月) 17:59:05.79 .net
X保存できるようになってる

120 :名無しさん@お腹いっぱい。:2023/10/23(月) 18:00:35.82 .net
連投すまん
ミスった

121 :名無しさん@お腹いっぱい。:2023/10/24(火) 14:07:36.28 .net
>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに

122 :名無しさん@お腹いっぱい。:2023/10/24(火) 14:07:46.22 .net
>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに

123 :名無しさん@お腹いっぱい。:2023/10/25(水) 20:59:15.52 .net
video.twimgとれなくなった?

124 :名無しさん@お腹いっぱい。:2023/10/27(金) 02:04:52.34 .net
>>123
普通に取れるけど

125 :名無しさん@お腹いっぱい。:2023/11/02(木) 00:20:55.25 .net
こんなのがいつのまに
2022年11月18日 23時00分レビュー
無料&広告なしで個人サイトを作成できるGeocities風サービス「Neocities」を使ってみたよレビュー
https://gigazine.net/news/20221118-neocities-free-website/

126 :名無しさん@お腹いっぱい。:2023/11/05(日) 02:15:27.98 .net
利用者の多いコンテンツの生殺与奪を特定小数人が握ってるのは危なっかしいよな
ttps://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1698901347/
まあつべはバックアップを隠し持ってそうだけど こんな金になりそうなもん手放さねえだろうし 一般人が直に利用できないだけで

127 :名無しさん@お腹いっぱい。:2023/11/05(日) 17:54:34.46 .net
日本の書籍が著作権ありのもたまにいいのがアップされてたのが、騒動以後いっこもアップされなくなったなあ
結構暇つぶしにいいのに

128 :名無しさん@お腹いっぱい。:2023/11/08(水) 01:45:12.70 .net
質問です
・今開いているサイトの魚拓をワンクリックで取る方法はありますか?
(いちいちInternet Archiveのサイトを開いてコピーしたURLをペーストして決定を押すのがちょっと面倒です

・サイト全体(orサイトの複数ページ)を自動で保存してくれる機能はありますか?

129 :名無しさん@お腹いっぱい。:2023/11/08(水) 11:53:44.52 .net
>>128
公式のページで使えと書かれている拡張機能
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak
https://chrome.google.com/webstore/detail/archive-page/gcaimhkfmliahedmeklebabdgagipbia

130 :名無しさん@お腹いっぱい。:2023/11/08(水) 12:48:50.05 .net
アクティブチーム何やってんだよ。
なんで下記のURLは誰もアーカイブしてないんだ?

https://www.youtube.com/watch?v=XGeNeLWnYdc

131 :名無しさん@お腹いっぱい。:2023/11/08(水) 13:50:28.69 .net
アクティブチームw
https://o.5ch.net/223si.png

132 :名無しさん@お腹いっぱい。:2023/11/09(木) 20:53:09.04 .net
どうしてもすぐにアーカイブしたい動画があるならtubeupを使って自分でうpするか
Yt-dlpを使ってメタデータを含めてローカルに落とすのが理想や!

133 :名無しさん@お腹いっぱい。:2023/11/10(金) 23:40:24.43 .net
ArchiveTeamは特定の動画(削除の危機がある, ニュース, 政治etc)に限定して保存してるから、保存したい動画は手動保存する必要がある
リソースは有限だからね
↓詳細
https://wiki.archiveteam.org/index.php/YouTube#Scope

134 :名無しさん@お腹いっぱい。:2023/11/11(土) 13:29:16.82 .net
Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。
あれって何でああなってるの?たとえば以下のページなど。
https://web.archive.org/web/20021017173116/http://www.namco.co.jp/home/cs/lineup/mrdriller/page01.html

このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。
当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。
今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。

135 :名無しさん@お腹いっぱい。:2023/11/11(土) 13:32:47.70 .net
確認されてないから画像が抜け落ちてる

136 :名無しさん@お腹いっぱい。:2023/11/11(土) 15:59:18.06 .net
>>134
そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、
それまでは指示された単一のファイルをアーカイブするだけだったから。

アーカイブされた HTML をクライアント側のブラウザで表示したときに
個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が
なされたこともあったが、それ自体も 2010 年代中盤だったはず。

137 :名無しさん@お腹いっぱい。:2023/11/11(土) 19:27:03.13 .net
そうかなぁ?
俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。
以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。
https://web.archive.org/web/20131007222449/http://www.spike-chunsoft.co.jp/fr/index.html

138 :名無しさん@お腹いっぱい。:2023/11/11(土) 19:39:27.54 .net
>>137
それ Alexa のクローラが保存したアーカイブだしw
sssp://o.5ch.net/2245t.png

139 :名無しさん@お腹いっぱい。:2023/11/11(土) 20:41:42.88 .net
>>137
https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%8D%E3%83%83%E3%83%88%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96
IA自身がクローラーを回して収集活動を始めるまでの歴史について知っておくと良い。

140 :名無しさん@お腹いっぱい。:2023/11/11(土) 21:56:56.93 .net
昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´・ω・`)

141 :名無しさん@お腹いっぱい。:2023/11/13(月) 01:18:15.56 .net
IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ
画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第
例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない

142 :名無しさん@お腹いっぱい。:2023/11/13(月) 11:01:00.35 .net
確実に保存したい時は
InternetArchiveとArchive.todayどっちもアーカイブしてるわ
それで大体残ると思うけどどうだろ

143 :名無しさん@お腹いっぱい。:2023/11/13(月) 21:58:51.62 .net
>>141
それで精度だったり保存量にばらつきがあるんすね

144 :名無しさん@お腹いっぱい。:2023/11/14(火) 22:23:03.18 .net
ここ最近自動アーカイブがされてないようだけど一体どうしたんだ?

145 :名無しさん@お腹いっぱい。:2023/11/15(水) 13:06:21.31 .net
ここのアーカイブ開いても年齢確認から先に進めない

ラズパイでエロゲ
https://sirius10.net/Games/hgames.php

146 :名無しさん@お腹いっぱい。:2023/11/15(水) 13:33:45.41 .net
>>145
クッキー喰ったことにすればアーカイブはできるな。
使うのは API の capture_cookie パラメータ。
https://web.archive.org/web/20231115043115/sirius10.net/Games/hgames.php

147 :名無しさん@お腹いっぱい。:2023/11/15(水) 16:29:16.84 .net
えっ?年齢認証のページも保存できたの?初めて知った。
以前、以下のページを保存したかったけど諦めたんだ。
https://www.konami.com/games/pcemini/jp/ja/
もしこのページ保存できるなら、上部メニューの8ページほど保存しといてほしい。もしくはそのAPIの使い方を具体的に教えてほしい。
まだ誰も上手く保存できてないみたいだし。

148 :名無しさん@お腹いっぱい。:2023/11/15(水) 16:34:01.70 .net
保存してほしいのは以下の6個のURL。もし保存できるのであればだけど。
https://www.konami.com/games/pcemini/jp/ja/
https://www.konami.com/games/pcemini/topics/jp/ja/topics_9
https://www.konami.com/games/pcemini/feature/jp/ja/
https://www.konami.com/games/pcemini/faq/jp/ja/
https://www.konami.com/games/pcemini/inquiry/jp/ja/
https://www.konami.com/games/pcemini/product/jp/ja/

149 :名無しさん@お腹いっぱい。:2023/11/15(水) 16:54:07.39 .net
保存したい気持ち、解るなぁ
https://web.archive.org/web/20231115074138/www.konami.com/games/pcemini/jp/ja/

150 :名無しさん@お腹いっぱい。:2023/11/15(水) 17:04:47.72 .net
>>149
確認できたわ、ありがとう!
Internet Archiveを極めてるね!

151 :名無しさん@お腹いっぱい。:2023/11/15(水) 23:20:06.19 .net
>>146
すげえ、ありがとう

152 :名無しさん@お腹いっぱい。:2023/11/18(土) 14:45:36.85 .net
If something goes wrong please click here to send us an error report.
ってやつ、下じゃなくて上に配置してくれないかな・・・
何回誤送信したか分からん

153 :名無しさん@お腹いっぱい。:2023/11/18(土) 15:42:54.81 .net
twitter保存できないことが最近増えてるみたいだけど、archivetodayでも保存できない場合は、cacheリンクをぶち込むと保存できるでー

154 :名無しさん@お腹いっぱい。:2023/11/19(日) 14:41:27.28 .net
twitter以外の保存できないサイトも、

https://webcache.googleusercontent.com/search?q=cache:保存したいリンク

をWabackmachineに入れればキャッシュを保存できる。

155 :名無しさん@お腹いっぱい。:2023/11/19(日) 14:44:57.55 .net
認証要る系は無理

156 :名無しさん@お腹いっぱい。:2023/11/19(日) 19:17:19.50 .net
twitterならnitterで良くね?

157 :名無しさん@お腹いっぱい。:2023/11/19(日) 19:21:06.50 .net
リダイレクトページを保存して過去のアーカイブ上書きして使いづらくする問題
なんで放置されてんだよ!

158 :名無しさん@お腹いっぱい。:2023/11/20(月) 04:47:38.50 .net
俺も基本nitterキャプってるなTwitter取得する時は

159 :名無しさん@お腹いっぱい。:2023/11/21(火) 01:55:39.65 .net
"The requested video has been archived but is not currently available for playback."と"Attempts to archive this video failed."が出たときが一番ダルい

160 :名無しさん@お腹いっぱい。:2023/11/22(水) 20:57:37.32 .net
イーロン・マスクのせいで、1tweetごとにarchiveしないといけなくなったけど、
より問題なのは、tweet群が本人の削除やアカウント停止などで消されてしまったら、
archiveがあってもtweet同士のつながりがわからなくなること。
以前はtweetを1カ所か何カ所かwayback machineで押さえれば、スレッド丸ごとarchiveできたのに。

161 :名無しさん@お腹いっぱい。:2023/11/23(木) 07:29:06.67 .net
何度保存しても「Hrm. The Wayback Machine has not archived that URL.」が出続ける。

162 :名無しさん@お腹いっぱい。:2023/11/23(木) 16:23:31.19 .net
>>160
ほんとゴミだよな
戻してくれないもんかね…

163 :名無しさん@お腹いっぱい。:2023/11/25(土) 06:53:47.53 .net
>>161
https://web.archive.org/save/

このページからやればできる。

164 :名無しさん@お腹いっぱい。:2023/11/25(土) 07:21:35.68 .net
>>161
> 何度保存しても

数日後、その何度も保存したのが一斉にカレンダーに登場するパターンw

165 :名無しさん@お腹いっぱい。:2023/11/25(土) 15:36:03.02 .net
SPNって一日1000ページ保存が上限なのか。初めて引っかかった。outlink込みでやってたからか。

あと最近頻繁にログアウトしてしまうんだけどこれも不具合なのかな。

166 :名無しさん@お腹いっぱい。:2023/11/27(月) 21:08:31.71 .net
>>162
戻る可能性もありそう。

ツイッターの閲覧制限 「経済的な理由という指摘もある」と辛坊治郎
https://news.1242.com/article/448206
Twitter閲覧制限 の理由:データスクレイピング の全てを わかりやすく 説明します
https://sotatek.jp/blogs/all-about-the-reason-behind-twitter-new-view-limit/
「情報はタダじゃない」訴える意図? Twitter閲覧制限 “スクレイピング”…サーバー負荷にマスク氏不満か
https://news.ntv.co.jp/category/society/9517009c0a124432a4ae38cecc2a2cf4
【解説】ツイッター“閲覧制限”なぜ? 考えられる2つの理由 マスク氏の狙いは
https://news.ntv.co.jp/category/society/78ed7d1aae84431889171d51800beb37
Twitterの閲覧制限が起きた理由|今後のビジネスへの影響は?
https://blog.formzu.com/twitter_limit

167 :名無しさん@お腹いっぱい。:2023/11/28(火) 12:24:55.48 .net
>>165
> SPNって一日1000ページ保存が上限
それ何処から来た数字よ?

https://web.archive.org/save/status/user
sssp://o.5ch.net/2261s.png

168 :名無しさん@お腹いっぱい。:2023/11/28(火) 21:40:26.81 .net
イーロンの野郎また何かやらかしたのか。

169 :名無しさん@お腹いっぱい。:2023/11/29(水) 10:54:45.08 .net
どっとうpろだ.orgサービス終了かよ
知らなかった

170 :名無しさん@お腹いっぱい。:2023/11/30(木) 19:42:48.90 .net
忘れた頃に消えてくれるからお世話になったなぁ・・・
長いことおつかれさんでした

171 :名無しさん@お腹いっぱい。:2023/12/01(金) 16:35:49.47 .net
saveできない状態

172 :名無しさん@お腹いっぱい。:2023/12/01(金) 18:34:12.83 .net
普段は「Not Found」が出ても何遍か更新すると正常に戻るが、今は何遍更新しても・・・

173 :名無しさん@お腹いっぱい。:2023/12/01(金) 19:28:00.38 .net
マジか。保存対象URL側に問題あるのかと諦めて魚拓で済ましたけどIA側の問題だったのか

174 :名無しさん@お腹いっぱい。:2023/12/01(金) 20:03:23.58 .net
URL側の場合は「Not Found」というか普段から「このURLは保存不可」的なのが出るが、
今はどのサイトを入力しても「Not Found」

175 :名無しさん@お腹いっぱい。:2023/12/01(金) 21:10:57.63 .net
JSON で user status を得ようとしても 503 が返る
逝っちゃってるねぇ
https://web.archive.org/save/status/user

176 :名無しさん@お腹いっぱい。:2023/12/01(金) 21:28:40.39 .net
今日朝からnot foundだったから来てみたらおま環じゃなかったか

177 :名無しさん@お腹いっぱい。:2023/12/01(金) 23:30:32.34 .net
ようやくできるようになったが、4時間待ち(待ち時間は環境によるだろうが)

178 :名無しさん@お腹いっぱい。:2023/12/01(金) 23:31:28.89 .net
復活したけど、これじゃ今日のページ存できないな
The capture will start in ~7 hours, 39 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

179 :名無しさん@お腹いっぱい。:2023/12/02(土) 15:23:15.03 .net
待ち時間未明よりは減ってるが、まだ1時間待ち(環境によるだろうが)
ただし、PDF絡みの取得は問題なし

180 :名無しさん@お腹いっぱい。:2023/12/02(土) 15:52:02.12 .net
重い

181 :名無しさん@お腹いっぱい。:2023/12/03(日) 02:47:23.34 .net
14 hoursとか取得時間かかりすぎ

182 :名無しさん@お腹いっぱい。:2023/12/03(日) 19:22:18.20 .net
やっと直ったか

183 :名無しさん@お腹いっぱい。:2023/12/03(日) 19:46:55.79 .net
ページを保存しようとしたら

The capture will start in ~3 hours, 5 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

と言われて、まだ終わらないけど、MP4動画単体を保存したら瞬時に保存された。

2023/12/03(日)19:39:14
URL: https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4
Job: https://web.archive.org/save/status/spn2-a3a61ee7a77e38b016777f4e7c9b1139d337b0d8 [success][0.29s][初]
成功: https://web.archive.org/web/20231203103915/https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4 - 2023/12/03(日)19:39:15

184 :名無しさん@お腹いっぱい。:2023/12/04(月) 03:03:18.62 .net
>>183
.jpg とか .png とか .zip とか、ヘッドレスブラウザでレンダせず
ファイル単体を保存するだけで済むものはそんな感じ。
.pdf も outlinks の走査はされるけど何故か速い。

185 :名無しさん@お腹いっぱい。:2023/12/05(火) 01:10:50.73 .net
でた蔵の過去のテレビ番組のアーカイブ2022年12月以前の削除されちゃったんだな、最悪
gooといい価格コムといい削除するなら最初から公開しなきゃいいのに
NHKも一時期過去の番組表見れないようにしてたし何の目的なんだろうな
維持するのも金がかかるのかねえ

186 :名無しさん@お腹いっぱい。:2023/12/05(火) 10:15:27.60 .net
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862

187 :名無しさん@お腹いっぱい。:2023/12/05(火) 10:15:30.24 .net
更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862

188 :名無しさん@お腹いっぱい。:2023/12/05(火) 20:35:42.29 .net
こんな糞重いクルクルクルクルしてるだけのゴミクズサイト
すでに2億円も寄付されてるの糞受けるな
裏金アベノイミン党みたいな連中だ

189 :名無しさん@お腹いっぱい。:2023/12/06(水) 10:55:02.43 .net
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.

saveできない
また逝ってるのかな

190 :名無しさん@お腹いっぱい。:2023/12/06(水) 12:06:41.28 .net
またエラー吐いてる・・・

191 :名無しさん@お腹いっぱい。:2023/12/06(水) 17:58:46.73 .net
まーた404 NOT FOUNDだぞー

192 :名無しさん@お腹いっぱい。:2023/12/06(水) 19:14:32.73 .net
OH!! NO!!

193 :名無しさん@お腹いっぱい。:2023/12/06(水) 20:29:25.03 .net
やっと復旧した

┃ 午前9:18 ・ 2023年12月6日
https://twitter.com/textfiles/status/1732192819098292677
┃ Jason Scott @textfiles
┃ Power has gone out at the @internetarchive primary datacenter; waiting for it to return.

┃ 午前10:04 ・ 2023年12月6日
https://twitter.com/internetarchive/status/1732204429066289608
┃ Internet Archive @internetarchive
┃ Sorry, http://archive.org and http://openlibrary.org will be back in a few,

┃ but a short term power outage was long enough to make recovery take a little while.

┃ We apologize.
(deleted an unsolicited ad)

194 :名無しさん@お腹いっぱい。:2023/12/07(木) 15:12:31.98 .net
停電多すぎね?アメリカってそんな停電するの?

195 :名無しさん@お腹いっぱい。:2023/12/11(月) 10:14:59.64 .net
あ゙あ゙あ゙あ゙あ゙ーーー
https://o.5ch.net/227eo.png

196 :名無しさん@お腹いっぱい。:2023/12/11(月) 19:40:20.47 .net
ここ何日か>>195のような表示がそのときそのときで出たり出なかったり
取得そのものができないよりは増しとはいえ・・・

197 :名無しさん@お腹いっぱい。:2023/12/11(月) 19:45:40.20 .net
>>196
やっぱそうだよね、自分の環境のせいかと思ってたけど

198 :名無しさん@お腹いっぱい。:2023/12/11(月) 21:54:33.55 .net
Donateしまくらなきゃな

199 :195:2023/12/11(月) 22:16:37.71 .net
11 時間 42 分経過、結局アーカイブされてなかったからリクエスト発行し直した。
てゆーか 10 時間とか 20 時間とか言われても、数分後に同じ URL のアーカイブを
再リクエストしたらタイミングによってはすぐ保存してくれることもあるので
こういう時はやり直すのが正解だと理解することにした。

200 :名無しさん@お腹いっぱい。:2023/12/12(火) 01:25:40.30 .net
緑色の一日おき程度に取得した不完全なのを見かけるけどこういう事象の跡なのね

201 :名無しさん@お腹いっぱい。:2023/12/12(火) 19:24:45.55 .net
Save outlinksで取得出来るページ数減らされてる…

202 :名無しさん@お腹いっぱい。:2023/12/12(火) 20:23:08.77 .net
何個まで?

203 :名無しさん@お腹いっぱい。:2023/12/12(火) 20:25:41.13 .net
まあここ最近、調子悪いからな。
しばらくすれば元に戻るかも。

204 :名無しさん@お腹いっぱい。:2023/12/12(火) 20:51:11.11 .net
近い内にサーバー飛んでサ終かもな

205 :名無しさん@お腹いっぱい。:2023/12/12(火) 21:35:01.32 .net
Sorry

You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more.

206 :名無しさん@お腹いっぱい。:2023/12/12(火) 22:59:52.35 .net
なんかめちゃスムーズにspnリクエスト送れるようになってる
昨日ぐらいまでめっちゃ糞詰まり起こしてたのに

207 :名無しさん@お腹いっぱい。:2023/12/12(火) 23:51:14.97 .net
>>205
アカウント作れよ、上限が 300 倍に増えるぞ

てゆーか登録ユーザの daily_captures_limit の値、30000 まで減ってるのな
https://o.5ch.net/227k4.png

208 :名無しさん@お腹いっぱい。:2023/12/12(火) 23:55:59.07 .net
Sorry
Job failed
ってIAの画面がアーカイブされてる?ときって失敗ってことなんかな

209 :名無しさん@お腹いっぱい。:2023/12/13(水) 00:05:36.88 .net
>>208
自分の経験ではアーカイブできてる事も失敗してる事もある
そういう時は web.archive.org/web/2/ に対象の URL を付けて
最新のアーカイブを表示させてみてる

210 :名無しさん@お腹いっぱい。:2023/12/13(水) 00:13:02.17 .net
せっかく>>206と思ったら今度は・・・
今までの1割とは落差がでかい

211 :名無しさん@お腹いっぱい。:2023/12/13(水) 03:24:05.46 .net
何回やってもどのサイトでもsorryになって保存できない

212 :名無しさん@お腹いっぱい。:2023/12/13(水) 04:01:02.50 .net
ろくに英語も読めないのにここでアーカイブ取ろうとしてるからだよ

213 :名無しさん@お腹いっぱい。:2023/12/13(水) 08:31:24.05 .net

日本語のサイトしか保存した事ないけど…
つか1日100件なんて保存してないのに⇓が出る
前にキャッシュcookie消去したらarchiveでの履歴も消えちゃったから消すの嫌なんだけどなあ

Sorry
You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more

214 :名無しさん@お腹いっぱい。:2023/12/13(水) 08:59:55.49 .net
100件も取得してなくても出るとか・・・ますます謎

215 :名無しさん@お腹いっぱい。:2023/12/13(水) 11:42:51.22 .net
>>214
> 2023/12/13(水) 08:59:55.49

カウンターがリセットされる時刻の 5 秒前w
昨日の分も一緒にカウントされてるんじゃないの

216 :名無しさん@お腹いっぱい。:2023/12/13(水) 17:44:14.23 .net
画像とか含めてじゃないの

217 :名無しさん@お腹いっぱい。:2023/12/13(水) 18:18:11.85 .net
>>215
214だが、>>213と同一ではない
こっちは100件超えてたからまだしも、>>213のようなこともあると驚いたまで

218 :名無しさん@お腹いっぱい。:2023/12/13(水) 19:04:25.63 .net
>>207
同時実行可能なセッション数も微妙に調整してますね

2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0}
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}

219 :名無しさん@お腹いっぱい。:2023/12/13(水) 22:13:35.46 .net
一方、アカウントなしの場合は>>4にあるとおり1分あたり3件
昨年の途中まで4件、今年でもわずかに4件だったことも
https://mevius.5ch.net/test/read.cgi/esite/1628793497/453
https://mevius.5ch.net/test/read.cgi/esite/1628793497/637
https://mevius.5ch.net/test/read.cgi/esite/1628793497/729

220 :名無しさん@お腹いっぱい。:2023/12/14(木) 09:04:07.36 .net
「日付」が切り替わってカウント数が0に戻るのは日本時間朝9時です

221 :名無しさん@お腹いっぱい。:2023/12/15(金) 17:24:20.13 .net
SPN2APIでリファラーって送る方法ある?

222 :名無しさん@お腹いっぱい。:2023/12/15(金) 22:35:38.95 .net
無いね
ページ内で使われてる画像なんかには送られてるみたいだけど

223 :名無しさん@お腹いっぱい。:2023/12/15(金) 22:44:59.91 .net
>>222
無いか〜・・・、サンクス

224 :名無しさん@お腹いっぱい。:2023/12/16(土) 01:38:13.04 .net
nitter.net保存できなくなってる。
nitter.czならtodayの方で保存できるが

225 :名無しさん@お腹いっぱい。:2023/12/17(日) 20:30:36.67 .net
Twitterはもう保存できなくなったのか?
保存した後、だいぶ経ってから保存されているはずの日付を見に行ったら中身が何もない。
そういうのばかり。

226 :名無しさん@お腹いっぱい。:2023/12/18(月) 15:22:07.99 .net
Twitter側の仕様変更のせいで見た目はアーカイブできなくなった
ソースを見るとツイート内容はアーカイブされてるっぽい

227 :名無しさん@お腹いっぱい。:2023/12/18(月) 15:57:48.09 .net
本家のtwitter.comも、nitter.netもウェイバックマシンでは保存できなくなってる。
今は、nitter.czをarchive.todayの方にぶち込むしか方法がない。

228 :名無しさん@お腹いっぱい。:2023/12/18(月) 16:54:37.67 .net
今でも更新続ければ保存はできるけど、数日待たないとできなかったりで安定はしない

229 :名無しさん@お腹いっぱい。:2023/12/21(木) 04:31:49.98 .net
登録しても制限をかけるなら、有料プランを導入してくれ

230 :名無しさん@お腹いっぱい。:2023/12/21(木) 09:52:22.88 .net
最近すこし保存しようとして更新するとすぐアク禁されて駄目だわ

231 :名無しさん@お腹いっぱい。:2023/12/22(金) 15:05:19.09 .net
アク禁ってされたことないんだけど、どんな表示でるんだ

232 :名無しさん@お腹いっぱい。:2023/12/22(金) 15:05:21.69 .net
アク禁ってされたことないんだけど、どんな表示でるんだ

233 :名無しさん@お腹いっぱい。:2023/12/22(金) 15:06:53.26 .net
すまん連投になってもた

234 :名無しさん@お腹いっぱい。:2023/12/22(金) 15:15:17.32 .net
>>231-233
相手サーバが無反応になる
何も返らないからブラウザ組み込みのエラーメッセージが出る

235 :名無しさん@お腹いっぱい。:2023/12/23(土) 17:21:40.52 .net
2〜3秒に1回位のアクセスに抑えておけばまずアク禁はされないと思うが

236 :名無しさん@お腹いっぱい。:2023/12/24(日) 20:12:20.28 .net
アーカイブチームの皆さんは自分の事しか考えてないの?
あれだけ顧客第一つったろ!

237 :131:2023/12/24(日) 23:14:02.35 .net
>>236
アーカイブチームって覚えられたんだw
すごいね

238 :名無しさん@お腹いっぱい。:2023/12/25(月) 14:38:28.21 .net
次はアーカイブチームとインターネットアーカイブは無関係って事を覚えような

239 :名無しさん@お腹いっぱい。:2023/12/26(火) 07:40:40.52 .net
自動保存できなくなったの?

240 :名無しさん@お腹いっぱい。:2023/12/28(木) 19:50:12.24 .net
https://archive.is/rt7gI
Archive.org is DOWN for everyone.

241 :名無しさん@お腹いっぱい。:2023/12/29(金) 15:27:27.42 .net
SPNとSPN-outlinksで結果が変わるの謎過ぎるな
SPNだと取れるのにoutlinksの方はエラーが出るサイトがたまにある
わざわざ別の環境使ってるのか?

242 :名無しさん@お腹いっぱい。:2023/12/29(金) 16:01:08.08 .net
と書いておいて何のエラーか一切説明しない低能

243 :名無しさん@お腹いっぱい。:2024/01/03(水) 15:31:04.59 .net
>>220

φ(`д´)メモメモ...

244 :名無しさん@お腹いっぱい。:2024/01/05(金) 00:43:45.29 .net
archive.todayのほう死んでます?

245 :名無しさん@お腹いっぱい。:2024/01/05(金) 02:20:34.95 .net
一時間くらい前、ぐるぐるアイコンを表示したままリロードを繰り返す状態だったな。

246 :名無しさん@お腹いっぱい。:2024/01/05(金) 21:00:47.72 .net
アーカイブ開こうとすると実アドレスの方に飛ばされる症状が出てる
アーカイブに保存された形跡はある ただこれも保存済みアドレスが検索で出たりでなかったりがある

247 :名無しさん@お腹いっぱい。:2024/01/07(日) 08:45:36.21 .net
相変わらずこの時間帯の Tor 経由でのアーカイブは厳しいw
あと 15 分待つか
sssp://o.5ch.net/22b4z.png

248 :名無しさん@お腹いっぱい。:2024/01/08(月) 16:23:46.89 .net
既出だったらスマン
アーカイブされたページ自体をユーザ側のアクションで検索エンジンのインデックスに登録することって可能なんかな

検索してみるといくつかの日本のサイトのアーカイブがGoogleにインデックス登録されてるんだよな
でもWaybackが自分でクロール申請したはずはないから何か方法があるんじゃないかと思ってる

例えば自分で立てたサイトにアーカイブへの直リンクを貼っておいて、自分のサイトをインデックス登録してリンク先をクロールさせるとか

249 :名無しさん@お腹いっぱい。:2024/01/09(火) 05:18:09.59 .net
うまいことpixivのアーカイブ取る方法はないものか

250 :名無しさん@お腹いっぱい。:2024/01/09(火) 19:55:25.90 .net
閉鎖したサイトを丸々コピーして稼いでる攻略サイトが増えてるわ
https://xneo.jp/
https://kouryaku7.com/

251 :名無しさん@お腹いっぱい。:2024/01/10(水) 07:22:01.53 .net
うーむ
特定のホストにて、各 URL につき「一時間以上空けろ」ではなく
「一日一回のみアーカイブ可」ということか。
ちなみにホスト名は www.sqlite.org。
sssp://o.5ch.net/22bkm.png

252 :名無しさん@お腹いっぱい。:2024/01/10(水) 11:46:54.75 .net
そんなにSPNの条件厳しくなったのか

253 :名無しさん@お腹いっぱい。:2024/01/10(水) 15:40:19.81 .net
昔このスレに居たスポーツ新聞野郎なら発狂してる事案w

254 :名無しさん@お腹いっぱい。:2024/01/10(水) 16:08:44.56 .net
>>18によるとYouTubeは動画も保存される仕様とのことだけど
その仕様になったのは最近?
6~7年前にアーカイブされたYoutubeページに辿り着いたら
動画部分は保存されていなかった

255 :名無しさん@お腹いっぱい。:2024/01/11(木) 00:50:47.06 .net
ログインしても数個取るとすぐログアウトさせられるのはおま環?

256 :名無しさん@お腹いっぱい。:2024/01/11(木) 02:24:05.23 .net
クッキーを消した、有効期限切れ (一年間)、それ以外の原因でのログアウトは無いな。

257 :名無しさん@お腹いっぱい。:2024/01/11(木) 16:04:39.91 .net
>>254
動画によって保存されてたりされなかったりする、基準は分からん
why:のところにyoutubecrawlが無いスナップショットは動画が保存されてない

258 :名無しさん@お腹いっぱい。:2024/01/12(金) 18:40:22.52 .net
Save Page Now browser crashed on http://naenara.com.kp/main/index/ja/first.

259 :名無しさん@お腹いっぱい。:2024/01/14(日) 05:07:51.98 .net
初めて目にしたかも
sssp://o.5ch.net/22c29.png

260 :名無しさん@お腹いっぱい。:2024/01/15(月) 00:29:16.40 .net
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?

261 :名無しさん@お腹いっぱい。:2024/01/15(月) 00:29:45.25 .net
IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?

262 :名無しさん@お腹いっぱい。:2024/01/15(月) 00:30:15.98 .net
ごめんダブった

263 :名無しさん@お腹いっぱい。:2024/01/15(月) 00:59:42.60 .net
>>260-261
タイムスタンプ部分とディレクトリ名末尾に "*" とか
https://web.archive.org/web/*/www.sqlite.org/2023/*

検索対象の母数が一万件を超える場合は CDX Server API でリストを出してから
ローカルで抽出とか
https://mevius.5ch.net/test/read.cgi/esite/1628793497/332-333

264 :名無しさん@お腹いっぱい。:2024/01/15(月) 02:24:29.46 .net
>>263
リプありがとうございます。
せっかく教えてくださったのに、自分の説明が足らなくて分からなかったのですが、やりたいことはこんな感じです

たとえば、↓のshow allを開くとディレクトリ内のコンテンツが表示されますが
その中のG71-VNW1013.isoを検索して見つける事はできますか?
ttps://archive.org/details/msi-afterburner-driver-and-utility

ttps://archive.org/search
に入力して検索をした場合、タイトルや説明欄しか拾わないので
どうしたものかと思っていました

265 :名無しさん@お腹いっぱい。:2024/01/15(月) 03:12:52.31 .net
ファイル名での検索が可能なら、例えばこんなアップロードは
もっと閲覧数が増えているのではないかと思います。
https://archive.org/details/vps0000000000020160306

266 :名無しさん@お腹いっぱい。:2024/01/15(月) 11:04:23.01 .net
>>265
そっか…ありがとうございましたm(_ _)m

267 :名無しさん@お腹いっぱい。:2024/01/15(月) 14:20:12.75 .net
検索システムはもっと強化してほしいよなぁ
一度も閲覧されてない化石と化したアーカイブとか大量にありそう
まぁあまり強化するとDMCA案件が増えそうなので悩ましいけど

268 :名無しさん@お腹いっぱい。:2024/01/17(水) 09:51:54.39 .net
ログインしても同時保存制限厳しい…(4つまで)
あと、一気にまとめて取得する方法ってないの?一個一個やってると面倒臭い

269 :名無しさん@お腹いっぱい。:2024/01/17(水) 18:53:45.11 .net
4 つねぇ、どうしたのかしら。
https://web.archive.org/save/status/user
sssp://o.5ch.net/22cik.png

270 :名無しさん@お腹いっぱい。:2024/01/17(水) 19:26:47.07 .net
>>268
savepagenow@archive.org に電子メールを送信/転送するとメール中のURIをアーカイブした結果のメールが数~数十分後に返信されてくる

271 :名無しさん@お腹いっぱい。:2024/01/18(木) 00:05:13.23 .net
「ウェブ魚拓」や「archive.today」では保存できるのに「wayback machine」ではできないということは、
Xは「wayback machine」を嫌がっているということか?

ウェブ魚拓
https://megalodon.jp/
archive.today
https://archive.md/

272 :名無しさん@お腹いっぱい。:2024/01/18(木) 00:12:17.43 .net
別に今でもX保存できるけど

273 :名無しさん@お腹いっぱい。:2024/01/18(木) 00:59:42.30 .net
>>272
保存した日付のところを見に行った?

たとえばこれ。


Saved 1 time January 13, 2024.
https://web.archive.org/web/20240000000000*/https://twitter.com/BasedMikeLee/status/1745945126793626064
https://megalodon.jp/2024-0117-2350-04/https://twitter.com:443/BasedMikeLee/status/1745945126793626064
https://archive.md/clxnV
(deleted an unsolicited ad)

274 :名無しさん@お腹いっぱい。:2024/01/18(木) 02:24:21.59 .net
「保存」は出来てるよ、表示が崩れてるだけ
CTRL+Uでソースを見ればツイート内容は保存されてるのが分かる

275 :名無しさん@お腹いっぱい。:2024/01/18(木) 02:40:16.78 .net
https://web.archive.org/web/20240117173332/https://twitter.com/googlejapan/status/1747091305128477149

これなんかは動画まで含めてちゃんと取れたことを確認した
(deleted an unsolicited ad)

276 :名無しさん@お腹いっぱい。:2024/01/18(木) 02:49:37.22 .net
>>274
見られないなら保存した意味がない。

277 :名無しさん@お腹いっぱい。:2024/01/19(金) 21:26:20.93 .net
インターネットアーカイブのブログ、ずっと同じ糖質に粘着されてるの笑う
それでも削除しないのは流石だがw

278 :名無しさん@お腹いっぱい。:2024/01/28(日) 01:57:58.03 .net
スラドのアーカイブを取ろうと思ったら、このサイト記事一覧ページって無いのか?
ajaxでmore moreで辿るしか無いんだろうか・・・
もう終わりだよ

279 :名無しさん@お腹いっぱい。:2024/01/28(日) 02:34:53.07 .net
>>278
日付別の一覧、例えば昨日 (2024-01-26) のストーリー一覧なら
https://srad.jp/story/24/01/26/
から
https://mobile.srad.jp/story/24/01/24/2339228/
https://mobile.srad.jp/story/24/01/24/2346248/
https://it.srad.jp/story/24/01/24/2351254/
https://srad.jp/story/24/01/25/1337233/
https://it.srad.jp/story/24/01/25/1340217/
・・・
と記事番号とカテゴリ名を含む URL は得られるかと思います。

280 :279:2024/01/28(日) 02:39:44.69 .net
おっとそれは一昨日だったw
PC を UTC タイムゾーンで動かしているのでうっかり・・・
https://o.5ch.net/22epx.png

281 :名無しさん@お腹いっぱい。:2024/01/28(日) 09:17:36.54 .net
>>273
https://web.archive.org/web/20240126113327/https://twitter.com/s96shiho/status/1723541214925029490

これもそうだけど、スマホでなら見られるのにPCだと見られないのはなぜだろうか?

>>275
それはPCでも見られた。
(deleted an unsolicited ad)

282 :名無しさん@お腹いっぱい。:2024/01/28(日) 13:04:59.85 .net
>>279
すごい、ありがとう!
そのURLは気付かなかった。
しかし、ページングは無さそうだから1日1リクエストとしても日記タレコミ記事で3*365*年数 か・・・。

283 :名無しさん@お腹いっぱい。:2024/01/28(日) 15:30:54.71 .net
あと3日半だから絶望的じゃん

284 :名無しさん@お腹いっぱい。:2024/01/28(日) 15:51:21.68 .net
月曜日に発表があって週末が1回しかないって急すぎるよ。
しかもスラドってコメント欄がperlのajaxで読み込んでるからアーカイブだとまともに表示できないだろうし

285 :名無しさん@お腹いっぱい。:2024/01/29(月) 09:18:53.73 .net
savepagenow@archive.org に取得したいページのURL送ったんだけど、ほとんどError! Capture timed outになる・・・
これってサーバー重くて失敗したのかな?

286 :名無しさん@お腹いっぱい。:2024/01/31(水) 16:01:30.81 .net
Save Page Now browser crashed
なんかエラー吐いて来るね・・・
取れてる奴もあるけど違いがわからん

287 :名無しさん@お腹いっぱい。:2024/01/31(水) 16:14:30.83 .net
それ Linux バイナリをアーカイブさせると良く出くわすな。
force_get=on を指定すると問題無く行けてるから、おそらく
コンテンツをヘッドレスブラウザでレンダしようとして失敗してるんだと思う。

288 :名無しさん@お腹いっぱい。:2024/02/01(木) 05:22:38.32 .net
Srad はアーカイブチームが動いてるって見たけど
個人でバックアップしている人もおるんか

289 :名無しさん@お腹いっぱい。:2024/02/01(木) 14:17:08.29 .net
スラド閉鎖撤回したな
まぁ不安定な状況である事には変わらないからアーカイブはした方が良い

290 :名無しさん@お腹いっぱい。:2024/02/02(金) 15:14:07.28 .net
The capture will start in ~1 hour, 1 minute because our service is currently overloaded.
また1時間後とか言われるようになっちゃった・・・

291 :名無しさん@お腹いっぱい。:2024/02/02(金) 18:58:54.38 .net
個人的に巡回ソフトでアーカイブ出来てたシンプル極まりない頃が懐かしい

292 :名無しさん@お腹いっぱい。:2024/02/04(日) 09:19:08.45 .net
Save Page Now browser crashed
ヤフオクのページを取得しようとすると出る

293 :名無しさん@お腹いっぱい。:2024/02/04(日) 12:09:51.36 .net
アーカイブしても画像が保存されないのキツイな
昔から収集方法変えてないみたいだけど
運営陣は変えるつもりないんだろうか
色々相性問題とかあって変えられないのかな?

294 :名無しさん@お腹いっぱい。:2024/02/04(日) 12:32:11.99 .net
>>293
大ぼら乙

295 :名無しさん@お腹いっぱい。:2024/02/04(日) 13:30:12.10 .net
サイトによるのでは

296 :名無しさん@お腹いっぱい。:2024/02/04(日) 16:23:38.85 .net
今でも画像はアーカイブ開いて取得しないといけない

297 :名無しさん@お腹いっぱい。:2024/02/04(日) 16:36:51.96 .net
【2020 年頃まで】
画像の保存は完全にユーザ任せ
(クローラを使っていたり、或いは
普通のブラウザでも保存開始後にすぐ閉じたりすると保存されない)
【それ以降】
ヘッドレスブラウザを実装、ある程度の画像は同時にアーカイブできるようになった

>>293 の言う昔って、いつの話よ?

298 :名無しさん@お腹いっぱい。:2024/02/05(月) 21:56:56.61 .net
動的サイトを取ろうとして取れないと勘違いしてるパターンじゃない?
画像は4年前から取れてるし、最近だと自動でアウトリンクまで辿ってくれるようになってるが

299 :名無しさん@お腹いっぱい。:2024/02/06(火) 10:29:25.54 .net
Tor を使っていると、本当にいろんな体験ができるw
この時の出口ノードは 🇳🇴 185.243.218.61。
https://o.5ch.net/22g6c.png

300 :名無しさん@お腹いっぱい。:2024/02/07(水) 01:46:05.35 .net
Google検索のキャッシュリンクが廃止で過去のページが閲覧不可に
https://pc.watch.impress.co.jp/docs/news/1566730.html

>Googleは、検索結果ページで利用できたWebページのキャッシュへのリンクを削除した。

これまで検索結果の各Webページのキャッシュにアクセスできるリンクが用意されており、Webページの過去の状態や削除される前の状態などが確認できたが、このリンクが削除されたかたち。検索演算子「cache:」を使ったアクセスはまだ行なえるが、将来的にはこちらも利用できなくなる予定だという。

これにともないGoogleでは、キャッシュへのリンクに代わって、Internet Archiveへのリンクを追加したいとも考えているという。

301 :名無しさん@お腹いっぱい。:2024/02/08(木) 07:44:47.71 .net
オープンになったことで話題のBlueskyはarchive.todayで昔のTwitterみたいにスレッド丸ごとアーカイブできるようだ。
ところがWayback Machineでは保存できないみたい。

302 :名無しさん@お腹いっぱい。:2024/02/08(木) 10:56:12.30 .net
>>300
IAにリンク貼るならGoogleから多額の寄付金もらえそう

303 :名無しさん@お腹いっぱい。:2024/02/08(木) 11:50:26.63 .net
とうとう古い端末から Archive.md が開けなくなってしまた。


>>300
回線が重い時テキストだけ読むので重宝だったのにGoogleキャッシュ廃止メチャク不便やん。

304 :名無しさん@お腹いっぱい。:2024/02/08(木) 12:15:36.70 .net
流れをぶった切って済まんが
https://download.sysinternals.com/ 配下の URL にて >>251 に遭遇。

ソフトウェア配布サイトをターゲットにした措置だとは思うが
Sysinternals のようにファイル名にリビジョン番号を記載せず
同じ URL のまま中身を差し替えていくサイトでは、
短期間で更新が繰り返されると保存されないリビジョンが出てくる。

305 :名無しさん@お腹いっぱい。:2024/02/10(土) 16:54:28.54 .net
This URL has been already captured 6 times today, which is a daily limit we have set for that host. Please try again tomorrow.
10回制限からなんか減った?

306 :名無しさん@お腹いっぱい。:2024/02/10(土) 17:13:12.85 .net
6 回バージョン登場か。

>>305
その後ろの関係詞節、高校辺り出てれば充分読めると思うが?
中卒は知らん。

307 :名無しさん@お腹いっぱい。:2024/02/10(土) 21:36:47.45 .net
>>306
いや以前は10回制限だったのに6回になったなってだけ

308 :名無しさん@お腹いっぱい。:2024/02/10(土) 22:21:20.99 .net
>>307
個別に 1 回だけとか 6 回までとか指定されてるホストが出てきてるんだよ、
だから関係詞節も読めと言ってるの。

309 :名無しさん@お腹いっぱい。:2024/02/12(月) 13:36:03.14 .net
Wayback Machineってdoc形式のファイルやdocx形式のファイルも保存できるんだね
ホント便利だな

310 :名無しさん@お腹いっぱい。:2024/02/12(月) 16:04:03.39 .net
一日一回のみとか10回のみのエラーってAPIドキュメントには無いよね?
特別に指定されてるんだろうか

311 :名無しさん@お腹いっぱい。:2024/02/14(水) 16:25:56.42 .net
X(twitter)はnitter.czにリンクを変えて、archive.todayにぶち込んで保存してる。
他にも方法あるかもしれんけど

312 :名無しさん@お腹いっぱい。:2024/02/15(木) 18:30:11.00 .net
そういやnitterの開発終了したんだってな
今のところ動いてるインスタンスはあるけど、これからどうなんだろ

313 :名無しさん@お腹いっぱい。:2024/02/15(木) 23:04:23.48 .net
これからどうやってtwitter保存すればいいんだろう

314 :名無しさん@お腹いっぱい。:2024/02/17(土) 01:09:16.83 .net
youtubeの動画保存って無くなったのか?
youtubecrawlのコレクションは増え続けてるから動いてるはずなんだが、未だに保存されん・・・
国内メディアのニュース動画だからブロックされてる訳でも無いと思うんだがなぁ

315 :名無しさん@お腹いっぱい。:2024/02/17(土) 09:06:16.83 .net
>>313
Twitter保存できるようになってましたよ
https://web.archive.org/web/20240216073841/https://twitter.com/elonmusk/status/1757474164850798632
https://web.archive.org/web/20240216154723/https://twitter.com/elonmusk/status/1757840768923021363
https://web.archive.org/web/20240217000150/https://twitter.com/elonmusk/status/1757924482885583112
(deleted an unsolicited ad)

316 :名無しさん@お腹いっぱい。:2024/02/17(土) 18:37:04.84 .net
>>315
ホンマや

317 :名無しさん@お腹いっぱい。:2024/02/21(水) 03:43:18.85 .net
>>281 が PC でも見られる、ってことは保存し直しの必要は無しか。
しかしアーカイブの表示内容が変化するってのは、別の意味で気持ち悪い。

318 :名無しさん@お腹いっぱい。:2024/02/21(水) 16:29:14.97 .net
ページ数、なかなか9000億超えないな

319 :名無しさん@お腹いっぱい。:2024/02/21(水) 17:19:47.55 .net
今もだけど、たまにアーカイブ数が減るのは何なんだろうか
しばらくすると元に戻るけど

320 :名無しさん@お腹いっぱい。:2024/02/21(水) 21:40:13.97 .net
取得時間がまた2時間とか伸びて面倒

321 :名無しさん@お腹いっぱい。:2024/02/24(土) 02:00:32.15 .net
ヘッダー部分の下からが表示されないんだねど自分だけかな。キャッシュ消したり再起動しても直らん

322 :名無しさん@お腹いっぱい。:2024/02/26(月) 16:37:22.05 .net
>>321
サイトが重いとそうなる
その場合でもhttps://web.archive.org/saveに直接飛べば保存できたりする

323 :名無しさん@お腹いっぱい。:2024/03/03(日) 13:23:54.98 .net
ブルースカイは、アカウントの設定(ログアウトしたユーザーからの可視性)よっては取得できないから注意

324 :名無しさん@お腹いっぱい。:2024/03/03(日) 16:09:52.87 .net
セッションハイジャック耐性の無いサイトなら
capture_cookie パラメータ辺り使えば行けるんだけどなぁ

325 :名無しさん@お腹いっぱい。:2024/03/03(日) 23:23:39.94 .net
数日前からtodayの調子が悪くて調べたらcloudflareDNSと相性悪いのか

326 :名無しさん@お腹いっぱい。:2024/03/04(月) 06:55:51.29 .net
ページを保存させて完了画面も確認したのに、そのページが表示されないな
カレンダー形式の一覧に反映されるまでにはこれまでも時間がかかっていたけど
保存ページ自体が数十分待っても出てこないのは初めて

327 :名無しさん@お腹いっぱい。:2024/03/04(月) 07:06:56.05 .net
今もう一度見てみたら、既にカレンダー形式の日付には青丸が付いているのに
さっき保存した保存時刻(UTC)をクリックしてもその内容が表示されないという現象が起きてる

328 :名無しさん@お腹いっぱい。:2024/03/04(月) 14:03:06.47 .net
最近はよくある
半日くらい待つと出てくる

329 :名無しさん@お腹いっぱい。:2024/03/05(火) 17:33:40.00 .net
i.imgur.comのページは一瞬で保存できるのなんでなんだろ

330 :名無しさん@お腹いっぱい。:2024/03/05(火) 19:50:05.76 .net
>>329
1. 対象 URL に HEAD リクエストを投げる。

2. レスポンスヘッダから単一の画像ファイルであることを検知。
(Content-Type: image/jpeg 等)

3. ヘッドレスブラウザは不要と判断、後回しにせず即アーカイブ作業に移る。

対象が HTML の場合は後回しにされることが多いが、おそらく
ヘッドレスブラウザで HTML をパースして追加の画像等を拾ってきたり、
JavaScript を実行させる必要があるなど負荷が重いから。
HEAD リクエストが送られる件については >>3 のドキュメントの force_get の項を参照。

331 :名無しさん@お腹いっぱい。:2024/03/06(水) 01:49:37.87 .net
ニコニコ動画のフォロワー欄が途中までしか保存されない問題ってどうすれば解決できますか?

www.nicovideo.jp/user/23396749/follow/follower

https://archive.is/4Efzj

上記のユーザーならフォロワーは僅か40なので情報量が大きすぎるという訳でもないはずなのですが

332 :名無しさん@お腹いっぱい。:2024/03/10(日) 15:14:50.96 .net
5chのnovaサーバーだけ取れなくなってる?

333 :名無しさん@お腹いっぱい。:2024/03/10(日) 15:18:40.98 .net
今日調子悪い?

334 :名無しさん@お腹いっぱい。:2024/03/10(日) 15:18:44.98 .net
今日調子悪い?

335 :名無しさん@お腹いっぱい。:2024/03/10(日) 15:35:56.28 .net
>>332
>>73

>>333-334
capture_outlinks=on にしても全然 outlinks を拾ってくれないね、それ以外は知らん。

336 :名無しさん@お腹いっぱい。:2024/03/10(日) 19:42:19.84 .net
https://nova.5ch.net/livegalileo/
https://nova.5ch.net/novatr/
各板のトップは国外から見られるが、個別スレを開こうとすると 520 エラーが返る。
Internet Archive のサーバは米国にあるから当然エラーとなる。
https://o.5ch.net/22p66.png

337 :名無しさん@お腹いっぱい。:2024/03/11(月) 01:13:22.82 .net
今日は一日繋がらなかったな

338 :名無しさん@お腹いっぱい。:2024/03/11(月) 21:15:52.76 .net
>>331
じゅんじゅ@\( ・ω・)/ www.nicovideo.jp/user/41124243
元グリーンベレー user/13675361 ・ lalala user/2765923
蘭‐Ran‐ user/18878661 ・ めざすくん user/27507212
わるよい user/3953893 ・ ゆ〜の user/2915294
sou user/11352489 ・ モッチチ user/6511183 ・ 海鼠 user/4114082

339 :名無しさん@お腹いっぱい。:2024/03/11(月) 21:21:31.64 .net
イモグラの画像、保存できてない時有るな

340 :名無しさん@お腹いっぱい。:2024/03/15(金) 02:19:07.21 .net
ビタミーナ王国物語以外でイモグラなんてワードを見かけるとは夢にも思わなかった

341 :名無しさん@お腹いっぱい。:2024/03/15(金) 03:07:50.06 .net
【保存・記録】ウェブアーカイブ総合 Page.02
https://mevius.5ch.net/test/read.cgi/internet/1700519014/

342 :名無しさん@お腹いっぱい。:2024/03/15(金) 16:03:39.90 .net
imgur 画像のリファラ検査が始まり、直リンが禁止されてアーカイヴできなくなった。
https://i.imgur.com/8oRShxz.jpeg

https://imgur.com/8oRShxz
ページ内の埋め込み画像はリファラが送られるが、この URL では駄目。

https://imgur.com/8oRShxz/embed
この URL のアーカイヴを保存させればよい。

結果
https://web.archive.org/web/20240315065808im_/i.imgur.com/8oRShxzl.jpg

343 :名無しさん@お腹いっぱい。:2024/03/16(土) 14:31:32.48 .net
>>342
その方法を今試してみたけど保存できてないよ。
保存したファイルと元のファイル比較してみれば分かるけど解像度もファイルサイズも違うしURL末尾辺りに謎の小文字lが付加されてる。

344 :342:2024/03/16(土) 15:04:21.21 .net
>>343
あーほんとだ、気付かんかった

8oRShxz
8oRShxzl

何か良い方法は無いかな

345 :名無しさん@お腹いっぱい。:2024/03/17(日) 02:41:47.70 .net
dotupがやたらと嫌われてたけど俺はimgurの方が嫌いだわ( ´_ゝ`)

346 :名無しさん@お腹いっぱい。:2024/03/20(水) 18:03:48.97 .net
Loadingでずっと進まないんだけど
今archive.todayってTwitter保存できないの?
archive.orgの方は出来るみたいだけど
アドレスが長くなるからtodayの方を使いたい

>>342
関係ないけど
リファラ検査で出始めたJaneのimgurサムネイルエラーは
https://egg.5ch.net/test/read.cgi/software/1708963746/185n
で回避した

347 :名無しさん@お腹いっぱい。:2024/03/20(水) 18:47:49.51 .net
>>346
なんだ山下の犬か

348 :名無しさん@お腹いっぱい。:2024/03/22(金) 05:15:15.83 .net
NHKが運営するネット上の特設ページ、続々と運営終了。放送法改正を見据えた動きか

https://internet.watch.impress.co.jp/docs/yajiuma/1577805.html

2024年4月1日10:00をもちまして、以下特設ページの掲載を終了(番組ストリーミングを含む)いたします。(NHKゴガク)
https://www.nhk.or.jp/gogaku/
NHK、「政治マガジン」など6サイト更新停止へ 新サービスを検討(朝日新聞デジタル)
https://www.asahi.com/articles/ASS375VHPS36UCVL04P.html
NHKやばいな。どんどんデジタルサービス終了させている。声調確認くんとか、凄く良かったのに。デジタル頑張っていた中の人たちが気の毒。(Togetter)
https://togetter.com/li/2334548

349 :名無しさん@お腹いっぱい。:2024/03/23(土) 15:57:54.15 .net
特許や意匠権の参考文献にURLが記載されてる事って多いんだけどさ
昔のホームページだと404かつ何処にもアーカイブされてないとかざら何だよな
せめてその辺は国がアーカイブしないと将来的に困ったことにならんのか?と思う

350 :名無しさん@お腹いっぱい。:2024/03/23(土) 18:36:41.16 .net
今死んでるな?

351 :名無しさん@お腹いっぱい。:2024/03/23(土) 20:47:29.68 .net
>>349
この国の政府って困ったことに未来にも過去にも興味が全くないですよ

352 :名無しさん@お腹いっぱい。:2024/03/24(日) 02:26:23.04 .net
>>349
WARPでアーカイブしてるよ
https://warp.da.ndl.go.jp/

353 :名無しさん@お腹いっぱい。:2024/03/24(日) 13:22:02.87 .net
>>352
これ特許庁自体は保存されてるけど、参考文献URLまで保存されてるってどこかに書いてある?

354 :名無しさん@お腹いっぱい。:2024/03/25(月) 09:41:34.78 .net
https://archive.org/web/images/icon_savePage.png
なぜか "Save Page Now" の前のアイコンが
https://archive.org/about/404.html へリダイレクトされてしまっている。
sssp://o.5ch.net/22t26.png

355 :名無しさん@お腹いっぱい。:2024/03/28(木) 12:58:45.39 .net
現在繋がらない?

356 :名無しさん@お腹いっぱい。:2024/03/28(木) 13:00:30.23 .net
15分くらい前まで繋がってたけど今は繋がらないね、Temporarily Offlineだからメンテ中かな

357 :名無しさん@お腹いっぱい。:2024/03/28(木) 13:39:19.92 .net
ttps://twitter.com/textfiles/status/1773203790159565077
また停電だってよ去年もあったね
(deleted an unsolicited ad)

358 :名無しさん@お腹いっぱい。:2024/03/28(木) 14:33:39.21 .net
503エラーちょこちょこ出るけど、復帰したね乙でした

359 :名無しさん@お腹いっぱい。:2024/03/28(木) 15:36:57.20 .net
Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの?
save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。

360 :名無しさん@お腹いっぱい。:2024/03/29(金) 09:32:43.89 .net
詐欺紛いのサイトがアーカイブを徹底的に拒否しているのは笑える
https://www.sotwe.com/DuceTCG

361 :名無しさん@お腹いっぱい。:2024/03/29(金) 09:45:43.27 .net
>>360
拒否してるのはサイトじゃなくてTwitterWebViewerの方だった。俺の勘違い

362 :名無しさん@お腹いっぱい。:2024/03/29(金) 09:53:56.79 .net
>>360
こっち見たらええやん
https://x.com/DuceTCG

363 :名無しさん@お腹いっぱい。:2024/04/01(月) 14:58:37.43 .net
UAによって弾いてるぽい

364 :名無しさん@お腹いっぱい。:2024/04/02(火) 02:31:48.54 .net
imgur、画像の直リンは無理だとしても postpagebeta=0 というクッキーを食べたことにして
こういうアーカイブを取れば行けるなぁ。
つまり capture_cookie パラメータを使用。
https://web.archive.org/web/1/imgur.com/EwuqXZU

365 :名無しさん@お腹いっぱい。:2024/04/02(火) 02:48:58.54 .net
これは失敗。
https://web.archive.org/web/1/imgur.com/sBfrwVv
imgur でアダルト判定を食らった画像を表示させて "Yes, I'm over 18" をクリックしたときに追加されるクッキーの中に
over18=1 ってのがあるけど、それも食べたことにすれば行けるかな。

366 :名無しさん@お腹いっぱい。:2024/04/02(火) 02:59:57.86 .net
おお、行けた行けた。
https://web.archive.org/web/1/imgur.com/fb5LVDx

367 :名無しさん@お腹いっぱい。:2024/04/02(火) 15:12:43.62 .net
SPNではできないやつ?

368 :名無しさん@お腹いっぱい。:2024/04/02(火) 19:17:02.33 .net
どうも postpagebeta=0 のクッキーだけ送っておけば、
リファラ無しの画像直リンでも OK っぽいな。

>>367
スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど
後者では入力できないパラメータを送る必要があるんだよね。
https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから
上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば
たぶん保存できる。
https://pastebin.com/uEZ1Dbqi

369 :インターネットアーカイブ:2024/04/02(火) 23:58:17.49 .net
>>368
サンクス。保存できたっぽい
こんな荒技があったとは

370 :名無しさん@お腹いっぱい。:2024/04/04(木) 04:15:40.02 .net
>>368
保存できていたのに保存できなくなったぽい?

371 :名無しさん@お腹いっぱい。:2024/04/04(木) 05:45:40.47 .net
えっ
https://web.archive.org/web/1im_/i.imgur.com/ASA6zDH.png

372 :名無しさん@お腹いっぱい。:2024/04/04(木) 13:26:28.62 .net
imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。
それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を
クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。

373 :名無しさん@お腹いっぱい。:2024/04/05(金) 11:14:39.24 ID:F8qFxii7g
公明党竹谷とし子か゛女性の視点ガーだのほざいて女性健康研究ナショナ儿センタ−だの女性デジタル人材育成プランた゛のに莫大な税金投入
リスキリングって先端技術を学ぶわけて゛もなく小学生が独学でできることを税金使って教えてやれってんた゛からまさに特別支援学校
これが女性だというなら女性とは知的障害者の代名詞だろ
羞恥心もなくこんな逆差別主張を国会で平然とやるんた゛から女性は無能なクセに権利主張ばかりでコスパ悪いとレッテ儿貼られて当然
赤の他人に寄生して権利強奪することしか考えられないカタワの声が大きくなるに比例して日本社会が崩壊しているわけだが
日本全國クソ航空騒音まみれにして静音環境て゛なければ成り立たない知的産業壊滅させて生活に仕事に子の学習環境まで根絶やしにして
莫大な温室効果ガスまき散らさせて気候変動させて災害連発させて私腹を肥やしてるのか゛世界最悪の殺人違憲組織公明党強盜殺人の首魁
蓄財з億円超の斉藤鉄夫ら国土破壊省だし.腐敗集団自民党をここまで付け上がらせた諸悪の根源こそが公明党だと頭に刻み込もう!
(ref.] ttрs://www.call4.jp/info.php?tуρe=items&id=I0000062
ttρs://haneda-projecT.jimdofree.com/ , ttps://flighΤ-rouтe.Com/
ttps://n-souonhigaisosyoudan.amebaownd.com/

374 :名無しさん@お腹いっぱい。:2024/04/06(土) 22:10:26.61 .net
Resources (ページ内画像等) としてアーカイブされた URL がカレンダ表示に登場するまでに
時間が掛かってる
https://o.5ch.net/22wzg.png

375 :名無しさん@お腹いっぱい。:2024/04/07(日) 12:36:44.17 .net
APIでリファラも送れるようにしてくれないかな
cookieやUAは送れるのにリファラは対応してないの何で?

376 :名無しさん@お腹いっぱい。:2024/04/07(日) 16:46:14.94 .net
間違った転送先を保存してしまい何故か修正できないヤツ
https://web.archive.org/web/20240407072915/https://i.imgur.com/UtKDI8X.jpeg
アニメ絵と実写エロ注意

377 :名無しさん@お腹いっぱい。:2024/04/07(日) 17:16:13.24 .net
大文字小文字違いかw
uTKdi8x
UtKDI8X

378 :名無しさん@お腹いっぱい。:2024/04/08(月) 16:06:38.65 .net
archive.today
数日前からX(旧Twitter)のアーカイブできなくなってる?

379 :名無しさん@お腹いっぱい。:2024/04/09(火) 18:51:29.66 .net
>>378
自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。

380 :名無しさん@お腹いっぱい。:2024/04/10(水) 21:37:00.24 .net
404だ

381 :名無しさん@お腹いっぱい。:2024/04/14(日) 14:05:36.49 .net
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.

382 :アーカイブ:2024/04/15(月) 06:08:58.29 .net
またイモグラ保存できなくなったんじゃないだろうな
もうイモグラは使わないでくれ

383 :名無しさん@お腹いっぱい。:2024/04/15(月) 11:30:27.65 .net
ふむふむ
https://web.archive.org/web/1im_/i.imgur.com/x0kLEHW.png

384 :アーカイブ:2024/04/15(月) 14:34:30.98 .net
OutLinksを使うと保存できてる時もあるっぽいな。
これが原因か?

385 :アーカイブ:2024/04/15(月) 16:54:08.33 .net
いや関係無いっぽいな。
試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。
取れる画像と取れない画像があるのか?

386 :名無しさん@お腹いっぱい。:2024/04/15(月) 21:48:34.29 .net
ゲッ、いつの間に同一URLの保存回数が一日5回までに減ってやがる…
https://web.archive.org/web/0im_/https://files.catbox.moe/xei3k9.PNG
19年の頃は保存回数制限もなく保存再開出来る時間も10分間隔だったんだがなぁ…

387 :名無しさん@お腹いっぱい。:2024/04/15(月) 21:58:25.42 .net
>>386
>>305-308
さらに少なく、一日一回だけに制限しているホストもあるからね。

388 :アーカイブ:2024/04/16(火) 08:03:08.50 .net
保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。

389 :名無しさん@お腹いっぱい。:2024/04/17(水) 02:34:56.23 .net
自分がアーカイブを取ってるサイトは大概 1 回だけなんだよなぁ。
https://o.5ch.net/22bkm.png

390 :名無しさん@お腹いっぱい。:2024/04/19(金) 22:35:13.33 .net
そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。
そもそもあいつの資金源どうなってんだ?

391 :名無しさん@お腹いっぱい。:2024/04/19(金) 22:39:26.28 .net
運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。
国を出ないなら、このまま吹き飛びそうだな。

392 :名無しさん@お腹いっぱい。:2024/04/20(土) 13:11:21.35 .net
【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか

拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される

画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません
gyazo.com/2dea0146024edc6952878c8d25b9b572

393 :名無しさん@お腹いっぱい。:2024/04/20(土) 13:57:11.01 .net
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?

394 :名無しさん@お腹いっぱい。:2024/04/20(土) 13:57:11.53 .net
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?

395 :名無しさん@お腹いっぱい。:2024/04/20(土) 15:31:34.61 .net
>>392-394
アホー知恵袋にでも行って質問なさい、おじいちゃん
https://chiebukuro.yahoo.co.jp/

396 :名無しさん@お腹いっぱい。:2024/04/23(火) 19:37:25.85 .net
アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。

397 :名無しさん@お腹いっぱい。:2024/04/23(火) 20:04:37.85 .net
>>396
「アーカイブ」ってまだちゃんと覚えてられてるんだw
>>130-131

398 :名無しさん@お腹いっぱい。:2024/04/29(月) 03:17:02.51 .net
あー重い重い

399 :名無しさん@お腹いっぱい。:2024/04/29(月) 19:58:05.90 .net
ttps://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる

400 :アーカイヴ:2024/04/30(火) 22:20:03.49 .net
さっきまでめっちゃ調子よかったのに503

401 :名無しさん@お腹いっぱい。:2024/04/30(火) 22:42:01.31 .net
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>392 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>393-394 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>396 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>397 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。

402 :名無しさん@お腹いっぱい。:2024/04/30(火) 22:42:04.16 .net
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>392 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>393-394 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>396 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>397 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。

403 :名無しさん@お腹いっぱい。:2024/04/30(火) 22:49:38.87 .net
>>388
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。

404 :名無しさん@お腹いっぱい。:2024/05/02(木) 16:55:42.41 .net
>>402
130の動画なら保存されてるのでは?
youtubecrawlのコレクションに入ってるが

405 :名無しさん@お腹いっぱい。:2024/05/04(土) 11:12:18.18 .net
Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど
繋がらないんだよね・・・コード 0xF2 のエラーが返る
https://archive6zg5vrdwm4ljllgxleekeoj43lqayscd4d4kmhnyblq4h3ead.onion/
https://o.5ch.net/2348e.png

406 :名無しさん@お腹いっぱい。:2024/05/04(土) 12:01:16.02 .net
またメンテか
次はいつ復旧するのやら

407 :名無しさん@お腹いっぱい。:2024/05/04(土) 15:36:31.33 .net
>>404
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。

408 :名無しさん@お腹いっぱい。:2024/05/04(土) 15:36:33.70 .net
>>404
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。

409 :アーカイヴ:2024/05/05(日) 15:10:31.41 .net
Save Page Now browser crashed on https://imgur.com/p5BPbjq.

410 :名無しさん@お腹いっぱい。:2024/05/05(日) 16:04:43.50 .net
何回か連打してればバックグラウンドで保存に成功するケースが殆ど。
https://o.5ch.net/234ik.png

411 :名無しさん@お腹いっぱい。:2024/05/06(月) 15:54:44.08 .net
archive.todayってMicrosoftのサーバー経由してるのなんで?
MSのサーバーをhostsで遮断したら保存できなくなった

412 :名無しさん@お腹いっぱい。:2024/05/06(月) 21:39:08.18 .net
>>7
quoraもサルベージできない

105 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★