Internet Archive総合 (web.archive.org) #5
1 :名無しさん@お腹いっぱい。 :2023/07/28(金) 06:58:53.37.net なんだかんだでお世話になってるInternet Archiveについて語りましょう Internet Archive http://archive.org/ インターネット・アーカイブ - Wikipedia http://ja.wikipedia.org/wiki/InternetArchive ------------------ Twitter https://twitter.com/internetarchive/ 関連スレ 【保存・記録】ウェブアーカイブ総合 Page.01 https://mevius.5ch.net/test/read.cgi/internet/1554553882/ 前スレッド Internet Archive総合 (web.archive.org) #4 https://mevius.5ch.net/test/read.cgi/esite/1628793497/ (deleted an unsolicited ad)
2 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:00:04.50.net 【QA】 Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても 真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、 16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。 Q.寄付したいんだけど? こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください https://archive.org/donate Q.すぐに保存したい場合は? Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す https://web.archive.org/save/ Q.アカウント作ったらなんかいいことあるの? A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える Q.spn@archive.orgにメールでURLを送ったら保存されるの? A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい
3 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:00:23.53.net Q.インスタのURLが保存できないんだけど A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます Q.robots.txtでia_archiverをDisallowしても無視されるの? A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い Q.鯖落ちしてる? A.ここで鯖状態を見れる https://analytics0.archive.org/stats/wb.php https://archive.org/stats/ Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何? A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています Q.Save Page Nowの制限などの仕様は? A.ここを参照 https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも
4 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:01:15.35.net Q.「The capture is estimated to start in XX minutes.」って何? A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手 Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes. A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります 気になるなら1時間後ぐらいにもう一度保存してください Q.The server didn't respond in time for https://( 保存しようとしたURL) A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります Q.「You have already reached the limit of active sessions」が出た A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC)
5 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:01:22.75.net Q.「This URL has been excluded from the Wayback Machine. 」って何? A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、 ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります Q.「Cannot get status of spn2-乱数」のエラーは何? A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください Q.「404 Not Found」のエラーは何? A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう Q.「Sorry Job failed」が出た A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください 保存できてない場合はやり直してください
6 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:01:40.39.net 便利なツール https://github.com/webrecorder/webrecorder-player/ https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits https://github.com/hartator/wayback-machine-downloader https://github.com/overcast07/wayback-machine-spn-scripts https://github.com/akamhy/waybackpy https://github.com/JustAnotherArchivist/snscrape https://github.com/bibanon/tubeup
7 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:01:55.63.net 拒否URL関係まとめ This URL has been excluded from the Wayback Machine. https://note.com/ https://gigazine.net/ https://boards.4channel.org/ https://bokete.jp/ https://yoshidakenkou.net/ https://tanteifile.com/ https://motherless.com/ https://www.lancers.jp/ This URL is in our block list https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て https://movie.eroterest.net/ https://anime.eroterest.net/ サイトの仕様で取れないもの https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる ArchiveTeamのexcludedまとめ https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine
8 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:02:57.18.net アーカイブ済のURL一覧を出力する方法 1. http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt にアクセス 2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること 3. 大量のテキストが出るので全選択してコピー 4. Excel立ち上げてCtrl+Aで全選択して貼り付け 5. 「テキストから列へ」を選んでスペースを基準にセルを区切る 6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする 同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能 引用元: https://exposureninja.com/blog/extract-urls-archive-org/ https://mevius.5ch.net/test/read.cgi/esite/1628793497/332
9 :名無しさん@お腹いっぱい。 :2023/07/28(金) 07:25:43.19.net >>1 おつ Internet Archive総合 (web.archive.org) #2 https://mevius.5ch.net/test/read.cgi/esite/1475246713/5 5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46 テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?
10 :名無しさん@お腹いっぱい。 :2023/07/28(金) 16:21:28.75.net おつでありんす
11 :名無しさん@お腹いっぱい。 :2023/07/28(金) 19:06:10.70.net todayだとヤフーニュースが保存できなくなってる だからInternet Archiveで保存することが増えた 慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは? news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16
12 :名無しさん@お腹いっぱい。 :2023/07/28(金) 19:09:18.35.net 私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。 主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。 その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、 むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。 ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。 誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、 審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。 todayでも↑のコメントを保存したかったなあ…
13 :名無しさん@お腹いっぱい。 :2023/07/29(土) 03:23:34.53.net 盲人でも野球の審判を業務として行えるという実例ですね
14 :名無しさん@お腹いっぱい。 :2023/07/29(土) 14:34:01.29.net twitterのプロフィールはwaybackmachineで保存できなくなった 個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ
15 :名無しさん@お腹いっぱい。 :2023/07/31(月) 10:26:16.62.net tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ? 他の人がアップロード出来なくなるから普通に迷惑なんだが
16 :名無しさん@お腹いっぱい。 :2023/08/01(火) 12:14:52.09.net ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの?
17 :名無しさん@お腹いっぱい。 :2023/08/01(火) 14:26:51.27.net >>16 自分は魚拓サイト初心者だから専門的な知識とかは余り持ってないけど IAやtodayでは動画サイトの動画は恐らく保存されないと思う
18 :名無しさん@お腹いっぱい。 :2023/08/02(水) 09:01:22.40 ?2BP(1000).net sssp://img.5ch.net/ico/nida.gif >>16 >>17 IAはYouTubeだけ特別に動画も保存される仕様になってる
19 :名無しさん@お腹いっぱい。 :2023/08/02(水) 11:49:36.01.net >>14 今はプロフィールも保存できるね(ログインしなくても閲覧出来る) 方針コロコロ変えすぎでわけが分からないよイーロン
20 :名無しさん@お腹いっぱい。 :2023/08/02(水) 14:26:37.14.net 動画サイトが動画直リン保存すればいける場合もあんのか
21 :名無しさん@お腹いっぱい。 :2023/08/04(金) 14:12:38.34.net またTwitterのプロフィール取れなくなってるわ あのさぁ・・・
22 :名無しさん@お腹いっぱい。 :2023/08/05(土) 21:26:33.08 .net あれ?また取れるようになってるな 非ログイン状態でも見れるプロフィールと見れないやつがある? 条件が分からん
23 :名無しさん@お腹いっぱい。 :2023/08/06(日) 01:13:10.24 .net なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。 もう訳わからんわw
24 :名無しさん@お腹いっぱい。 :2023/08/07(月) 10:27:43.52 .net archive.orgって画像複数を一括保存とか出来る? いちいち一つずつURL入力保存しないといけないの?
25 :名無しさん@お腹いっぱい。 :2023/08/07(月) 10:37:01.96 .net >>24 API が公開されているから、画像に限らずそれ利用するスクリプトを組めばよい。 https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
26 :名無しさん@お腹いっぱい。 :2023/08/08(火) 07:22:55.57 .net >>24 Have you ever wanted to archive all the web pages linked from an email message? Well, you are in luck because now you can forward that email to savepagenow@archive.org” and after a few minutes you will get an email back filled with Wayback Machine playback URLs.
27 :名無しさん@お腹いっぱい。 :2023/08/08(火) 12:31:37.42 .net >>7 > > サイトの仕様で取れないもの > https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる > https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる > ↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
28 :名無しさん@お腹いっぱい。 :2023/08/08(火) 12:46:26.56 .net 前スレ埋まってないんだから前スレに書きなよ
29 :名無しさん@お腹いっぱい。 :2023/08/10(木) 00:08:00.56 .net dclogもサービス終了
30 :名無しさん@お腹いっぱい。 :2023/08/10(木) 06:52:14.96 .net >>29 終了告知から終了まで1か月もないとはひどいサービスだな
31 :名無しさん@お腹いっぱい。 :2023/08/13(日) 02:05:43.24 .net 音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴 https://www.reuters.com/legal/music-labels-sue-internet-archive-over-digitized-record-collection-2023-08-12/
32 :名無しさん@お腹いっぱい。 :2023/08/13(日) 18:25:16.62 .net Sheetsのbatch処理ここ数日ずっとqueuedのままや そんなに使ってる人おるんか
33 :名無しさん@お腹いっぱい。 :2023/08/14(月) 01:51:11.53 .net archiveってpornhubとかエロ動画直リン保存ってしていいの?
34 :名無しさん@お腹いっぱい。 :2023/08/14(月) 05:36:17.08 .net >>33 やめとけやめとけ、お前のお母さん悲しむぞ こんなのも絶対に見ちゃいかんw https://archive.org/details/adultcdroms
35 :名無しさん@お腹いっぱい。 :2023/08/14(月) 13:55:59.20 .net >>31 日本語記事も出た ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開 https://www.techno-edge.net/article/2023/08/13/1742.html
36 :名無しさん@お腹いっぱい。 :2023/08/14(月) 19:47:23.54 .net >>33 internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、 archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい 余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな https://wiki.archiveteam.org/index.php/Porn
37 :名無しさん@お腹いっぱい。 :2023/08/16(水) 07:35:06.43 .net 最近フラッシュのページのアーカイブ見るとruffleっていうSWFエミュレータが起動してフラッシュを再生してくれるようになったな
38 :名無しさん@お腹いっぱい。 :2023/08/17(木) 09:37:24.83 .net xtubeの動画のアーカイブもなんとかなりませんか どうせどっかにあるんだろ
39 :名無しさん@お腹いっぱい。 :2023/08/21(月) 07:41:35.73 .net SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの? authorizationヘッダを付けずにAPI呼ぶと、 "You need to be logged in to use Save Page Now." ってエラーになっちゃう。 anonymousの制約で十分だから、APIキー無しで使いたいんだけどな
40 :名無しさん@お腹いっぱい。 :2023/08/21(月) 17:51:35.50 .net >>39 それ、応答を HTML でも返せるところを Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。 どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。
41 :名無しさん@お腹いっぱい。 :2023/08/21(月) 22:43:21.39 .net 現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので あまり深く考えない方がいい
42 :名無しさん@お腹いっぱい。 :2023/08/22(火) 22:54:25.65 .net ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな
43 :名無しさん@お腹いっぱい。 :2023/08/23(水) 22:13:20.02 .net ここ最近自動でアーカイブされてないこと多いよな。 御叱りでも受けたか?
44 :名無しさん@お腹いっぱい。 :2023/08/23(水) 22:15:20.98 .net >>14 イーロンの仕業か。
45 :名無しさん@お腹いっぱい。 :2023/08/24(木) 09:10:55.59 .net ここ数日やけに接続エラーが起きてると思ったらこれなんだよね。 スクリプトは当面 HTTP へ切り替えるかぁ。 sssp://o.5ch.net/21qn1.png
46 :名無しさん@お腹いっぱい。 :2023/08/24(木) 18:22:24.75 .net >>45 道理で最近つながりづらいことが多いと思ったら・・・ 俺環だけではなかったのか
47 :名無しさん@お腹いっぱい。 :2023/08/26(土) 03:04:26.70 .net 久々に SPN2 API のドキュメントを見返していたら、 /save/ に新設のパラメータがあることに気づいたぁ。 use_user_agent=<XXX> Use custom HTTP User-Agent value when capturing the target page. 2022-07-28 日付けの版で追加されてたのね。
48 :名無しさん@お腹いっぱい。 :2023/08/26(土) 11:12:00.83 .net Sorry Job failed と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った ただの表示バグだと思いたい
49 :名無しさん@お腹いっぱい。 :2023/08/28(月) 17:44:50.52 .net Atwikiってspn で取れなくなってる? エラー吐いてる
50 :名無しさん@お腹いっぱい。 :2023/08/28(月) 18:00:19.46 .net と、何のエラーか説明すらできない言語障碍児が申しております。 sssp://o.5ch.net/21rqu.png
51 :名無しさん@お腹いっぱい。 :2023/08/28(月) 18:12:11.36 .net おま環じゃなかったか アニオタwiki消えそうだから保存しようとしたんだけどなー Archiveboxで自分でwarc取るしかないか センキュー
52 :名無しさん@お腹いっぱい。 :2023/08/28(月) 19:13:33.15 .net HTTP status=403 atwiki側が意図的に排除してる エラー吐いてる、だけじゃ何もわからんな
53 :名無しさん@お腹いっぱい。 :2023/08/28(月) 19:38:17.09 .net atwikiって前は取れた気がするけど 方針変えたのか?
54 :名無しさん@お腹いっぱい。 :2023/08/28(月) 20:32:04.13 .net https://web.archive.org/web/20230828112759/w.atwiki.jp/aniwotawiki/ 403から200に戻ったw
55 :名無しさん@お腹いっぱい。 :2023/08/29(火) 17:46:42.89 .net Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな というかいい加減httpからhttpsに転送するようにして欲しい
56 :名無しさん@お腹いっぱい。 :2023/08/31(木) 09:07:02.89 .net Internet Archive総合 (web.archive.org) #4 https://mevius.5ch.net/test/read.cgi/esite/1628793497/975 975 名前:名無しさん@お腹いっぱい。[] 投稿日:2023/07/24(月) 07:55:27.47 放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます 保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある 普通の過去ログやる方が有意義におもう ↑エアプ野郎w
57 :名無しさん@お腹いっぱい。 :2023/08/31(木) 11:07:06.36 .net http://homepage2.nifty.com/J-R/enjoy%20pich.htm ↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど これの理由(誰が、いつ申請したか)を知る事って出来る? 禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine 個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ 個人HPこそ後世に残したい
58 :名無しさん@お腹いっぱい。 :2023/08/31(木) 22:19:54.68 .net >>56 > 保存されるやつみたら文字化けしてるし テキストエンコーディング変換前のファイル見れるだろ
59 :名無しさん@お腹いっぱい。 :2023/09/01(金) 02:04:41.12 .net >>58 多分このことじゃね? https://web.archive.org/web/20230711093514/https://agree.5ch.net/operate/dat/1608930977.dat
60 :名無しさん@お腹いっぱい。 :2023/09/01(金) 06:24:58.23 .net スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ https://web.archive.org/web/20230711093514im_/https://agree.5ch.net/operate/dat/1608930977.dat
61 :名無しさん@お腹いっぱい。 :2023/09/01(金) 13:11:43.12 .net >>57 理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね 確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ
62 :名無しさん@お腹いっぱい。 :2023/09/02(土) 07:00:06.31 .net YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。 何やってんだよインターネットアーカイブに保存する人は!全然チェックされてないじゃん! やる気あんのか?寝てたのか? どうして誰も保存しないんだ?自動アーカイブはどうした? https://www.youtube.com/watch?v=jjZEQ9Nocp4 https://www.youtube.com/watch?v=lnlyZlIRO1U
63 :名無しさん@お腹いっぱい。 :2023/09/02(土) 07:42:50.72 .net YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。 公開から10時間後とか。 自動アーカイブはどうしたのか?
64 :名無しさん@お腹いっぱい。 :2023/09/02(土) 13:11:42.88 .net 5chをアーカイブしてもエラーページになる事が増えたなぁ 重くなってるのか?
65 :名無しさん@お腹いっぱい。 :2023/09/03(日) 18:03:57.56 .net 一番上に書いてあるvideoとかmusicってなんですか? いろいろありますけど保存してもいいんですかね?
66 :名無しさん@お腹いっぱい。 :2023/09/03(日) 19:52:30.07 .net 昔と違い私的理由で使う人が多すぎて ゴミ集積場化が止まらない
67 :名無しさん@お腹いっぱい。 :2023/09/03(日) 22:28:57.02 .net archive.today繋がらない おま環? >>66 たとえばどんなサイトの事言ってるの?
68 :名無しさん@お腹いっぱい。 :2023/09/04(月) 17:39:35.18 .net >>64 同感 たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも 8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない web.archive.org/web/20230000000000*/https://nova.5ch.net/test/read.cgi/livegalileo/1693474206
69 :名無しさん@お腹いっぱい。 :2023/09/05(火) 10:44:06.47 .net 同じスレを何度も保存する意味あるの?
70 :名無しさん@お腹いっぱい。 :2023/09/05(火) 17:30:52.63 .net 1000までいってないなら意味あるんじゃない
71 :名無しさん@お腹いっぱい。 :2023/09/05(火) 20:42:01.45 .net もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな 【悲報】安倍晋三語録、「同意」を表すものが存在しない nova.5ch.net/test/read.cgi/livegalileo/1693837620 IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる → archive.is/I6WEN
72 :名無しさん@お腹いっぱい。 :2023/09/05(火) 23:40:36.69 .net 昔の魚拓見ようにも重いのかエラー出るな
73 :名無しさん@お腹いっぱい。 :2023/09/06(水) 00:36:21.59 .net >>71 nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。 その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。 https://agree.5ch.net/test/read.cgi/operate/1673084281/16-
74 :名無しさん@お腹いっぱい。 :2023/09/06(水) 15:40:13.70 .net >>73 なるほど 確かにエラーが起こるのはnovaが多かったな 永久に解除されない、なんてことにならなきゃいいが・・・
75 :名無しさん@お腹いっぱい。 :2023/09/07(木) 17:59:45.87 .net 【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される nova.5ch.net/test/read.cgi/livegalileo/1693978274 このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった archive.li/pGUd4
76 :名無しさん@お腹いっぱい。 :2023/09/09(土) 08:46:02.23 .net 家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。 手動で取ってただけでアク禁にされたのか
77 :名無しさん@お腹いっぱい。 :2023/09/09(土) 09:07:31.51 .net >>76 それ、一週間前にうちもやられた。 仕方なく筑波 VPN 挿して、同じようにガンガン回したけどそっちは止められることが無かった。 何が引っ掛かったのか、全くもって判らん。
78 :名無しさん@お腹いっぱい。 :2023/09/09(土) 22:32:08.21 .net >>76 だけど半日くらいで解除されたっぽい
79 :名無しさん@お腹いっぱい。 :2023/09/10(日) 12:26:18.58 .net >>73-74 eggもエラー起きるな
80 :名無しさん@お腹いっぱい。 :2023/09/12(火) 01:16:30.06 .net Twitterまた取れなくなってね?
81 :名無しさん@お腹いっぱい。 :2023/09/13(水) 01:14:09.55 .net 前スレのころ20分ぐらいつながらないことがあったが、 それ以上に長くつながらない・・・
82 :名無しさん@お腹いっぱい。 :2023/09/13(水) 07:16:08.88 .net 81の件、ようやくつながった
83 :名無しさん@お腹いっぱい。 :2023/09/14(木) 16:24:12.75 .net twitter、じゃなくてX取れなくなってるな 個別のポストはtodayの方で辛うじて取れるが
84 :名無しさん@お腹いっぱい。 :2023/09/15(金) 05:44:55.86 .net twitterで良くね Xとか勝手に名称変えたアホ以外誰も言ってねえわ
85 :名無しさん@お腹いっぱい。 :2023/09/15(金) 11:00:18.27 .net ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、
86 :archive.is/tTrQN :2023/09/15(金) 20:45:51.70 .net 前スレ955への返信だがグーグルキャッシュなどを経由すれば 好き嫌いドットコムのコメント欄も魚拓とれる場合がある webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people /result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593
87 :名無しさん@お腹いっぱい。 :2023/09/18(月) 12:38:04.07 .net >>76 アク禁にされたっぽい 保存はやってなかった、心当たりがあるのは多数の保存済みアーカイブを一斉に開いただけ
88 :名無しさん@お腹いっぱい。 :2023/09/19(火) 01:23:34.92 .net ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない? イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい
89 :名無しさん@お腹いっぱい。 :2023/09/20(水) 16:11:43.42 .net Batch process Google Sheetsがabort出来ないバグ何とかしてくれ 相手側に負荷がかかってたらどうすんだよ
90 :89 :2023/09/20(水) 16:18:49.76 .net やっと止まったわ、遅すぎ
91 :名無しさん@お腹いっぱい。 :2023/09/21(木) 10:05:32.27 .net 5ちゃんも有料化云々でヤバそうだし スレアーカイブしといた方が良さそうだな… そろそろ消えそうな予感
92 :名無しさん@お腹いっぱい。 :2023/09/21(木) 13:38:51.45 .net いつ復旧するかなー sssp://o.5ch.net/21zr1.png
93 :名無しさん@お腹いっぱい。 :2023/09/23(土) 18:28:51.16 .net Attempts to archive this video failed. はなんなんだよ
94 :名無しさん@お腹いっぱい。 :2023/09/24(日) 13:01:59.07 .net savepagenowを実行したあとにgoogleのサポートページ?に飛ばされるのはどういう仕様?
95 :名無しさん@お腹いっぱい。 :2023/09/24(日) 14:22:50.44 .net twitterの記録取れなくなるのは将来に禍根を残すと思うわ。 数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。
96 :名無しさん@お腹いっぱい。 :2023/09/24(日) 18:43:53.30 .net 今のツイッターって?failedScript=vendorつけても無理になったの?
97 :名無しさん@お腹いっぱい。 :2023/09/25(月) 18:24:55.68 .net フウーεε=( ~ε~ )y-゚゚゚
98 :名無しさん@お腹いっぱい。 :2023/09/29(金) 16:40:42.99 .net teacup. byGMOレンタル掲示板あんま残ってねえな
99 :名無しさん@お腹いっぱい。 :2023/10/03(火) 16:40:59.85 .net もう5chの過去ログ課金しないと見れないっぽいね
100 :名無しさん@お腹いっぱい。 :2023/10/04(水) 10:45:27.46 .net >>99 現役鯖の分はまだ落ちてくるけどなぁ https://mevius.5ch.net/esite/oyster/1628/1628793497.dat /oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが
101 :名無しさん@お腹いっぱい。 :2023/10/04(水) 14:13:19.96 .net Sorry Cannot resolve host ipv6.icanhazip.com. IPv6 の名前解決ができなくなってる
102 :名無しさん@お腹いっぱい。 :2023/10/05(木) 21:27:26.21 .net todayがちと重い
103 :名無しさん@お腹いっぱい。 :2023/10/07(土) 15:40:46.22 .net >>99 単純に重いだけじゃない?
104 :名無しさん@お腹いっぱい。 :2023/10/07(土) 18:44:36.46 .net 今繋がらないんだけど、私だけですか?
105 :104 :2023/10/07(土) 18:57:20.21 .net Wi-Fiに切り替えたら繋がった。 どうやらアク禁らしい。 普通に閲覧してただけだし、何も心当たりないんだけど…
106 :87 :2023/10/07(土) 20:45:50.36 .net >>105 その「閲覧」もヤバい
107 :104 :2023/10/07(土) 23:17:39.68 .net >>106 えっ、そうなの? とりあえず今はアク禁解除されたっぽいけど、 アク禁になる条件って、短時間にたくさん見るとか?
108 :名無しさん@お腹いっぱい。 :2023/10/08(日) 11:31:56.88 .net 人間レベルの閲覧でアク禁になるなんて聞いたことないが ただの勘違いじゃないの?
109 :名無しさん@お腹いっぱい。 :2023/10/08(日) 11:55:37.48 .net 画像が大量にあるページでそのほとんど取れてなかったりするとすぐ開けなくなる
110 :名無しさん@お腹いっぱい。 :2023/10/08(日) 13:14:20.29 .net >>109 > 画像が大量にあるページでそのほとんど取れてなかったり その取れてない画像、全て/save/にリダイレクトされてるから 結果として大量にアーカイブ要求を発行することになるんだよね んで、その時にアーカイブされるのは3つ程度であとは全て429エラー 運が悪いとそのままアク禁
111 :名無しさん@お腹いっぱい。 :2023/10/10(火) 14:58:47.09 .net >>99 過去ログについては一応、2chSCへも殆どがミラーされてるはずだけどな…。
112 :名無しさん@お腹いっぱい。 :2023/10/12(木) 23:37:32.61 .net 油断は禁物 あとpink系は全部だめ 5ch新設板系も全部だめ
113 :名無しさん@お腹いっぱい。 :2023/10/12(木) 23:58:45.47 .net scはクロールされてるなと思って後で確認すると途中でクロールが止まってそのままというのがかなりある こういう状態になるとクロール再開しないケースが多く5ch側が飛んだ時に頭のほうしか控えが取れてなかったりする
114 :名無しさん@お腹いっぱい。 :2023/10/16(月) 02:19:32.91 .net 過去ログ、今年中は見れない可能性あるらしいな・・・ 0119Ace ★ 2023/10/13(金) 09:40:26.65ID:CAP_USER 過去ログについてですが、現状はアーカイブ圧縮状態で 展開再配置は相当に時間がかかる見込みです。 完了は年を越す可能性もあります。 https://agree.5ch.net/test/read.cgi/operate/1697113482/119
115 :名無しさん@お腹いっぱい。 :2023/10/18(水) 23:04:25.87 .net たまに総アーカイブ数が294 billionって表示されるの何なんだ?
116 :名無しさん@お腹いっぱい。 :2023/10/20(金) 22:59:55.77 .net >>112 一応なんG板とか、2014年春以降に新設された板でもSC側のbbsmenu一覧ページに追加されてないだけで、 [ http://tomcat.2ch. (えすしー)/livegalileo/ ] …の鯖名から開けばアーカイブされてたりするけど、PINKともども最近の過去ログについては本鯖のモノが未だ活きてる。
117 :名無しさん@お腹いっぱい。 :2023/10/23(月) 17:58:57.35 .net X保存できるようになってる
118 :名無しさん@お腹いっぱい。 :2023/10/23(月) 17:58:58.33 .net X保存できるようになってる
119 :名無しさん@お腹いっぱい。 :2023/10/23(月) 17:59:05.79 .net X保存できるようになってる
120 :名無しさん@お腹いっぱい。 :2023/10/23(月) 18:00:35.82 .net 連投すまん ミスった
121 :名無しさん@お腹いっぱい。 :2023/10/24(火) 14:07:36.28 .net >>107-108 残念ながら自分も・・・ 前は20分ぐらいつながらなかったのが、 最近は締め付けが厳しくなりそれでは済まないレベルに
122 :名無しさん@お腹いっぱい。 :2023/10/24(火) 14:07:46.22 .net >>107-108 残念ながら自分も・・・ 前は20分ぐらいつながらなかったのが、 最近は締め付けが厳しくなりそれでは済まないレベルに
123 :名無しさん@お腹いっぱい。 :2023/10/25(水) 20:59:15.52 .net video.twimgとれなくなった?
124 :名無しさん@お腹いっぱい。 :2023/10/27(金) 02:04:52.34 .net >>123 普通に取れるけど
125 :名無しさん@お腹いっぱい。 :2023/11/02(木) 00:20:55.25 .net こんなのがいつのまに 2022年11月18日 23時00分レビュー 無料&広告なしで個人サイトを作成できるGeocities風サービス「Neocities」を使ってみたよレビュー https://gigazine.net/news/20221118-neocities-free-website/
126 :名無しさん@お腹いっぱい。 :2023/11/05(日) 02:15:27.98 .net 利用者の多いコンテンツの生殺与奪を特定小数人が握ってるのは危なっかしいよな ttps://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1698901347/ まあつべはバックアップを隠し持ってそうだけど こんな金になりそうなもん手放さねえだろうし 一般人が直に利用できないだけで
127 :名無しさん@お腹いっぱい。 :2023/11/05(日) 17:54:34.46 .net 日本の書籍が著作権ありのもたまにいいのがアップされてたのが、騒動以後いっこもアップされなくなったなあ 結構暇つぶしにいいのに
128 :名無しさん@お腹いっぱい。 :2023/11/08(水) 01:45:12.70 .net 質問です ・今開いているサイトの魚拓をワンクリックで取る方法はありますか? (いちいちInternet Archiveのサイトを開いてコピーしたURLをペーストして決定を押すのがちょっと面倒です ) ・サイト全体(orサイトの複数ページ)を自動で保存してくれる機能はありますか?
129 :名無しさん@お腹いっぱい。 :2023/11/08(水) 11:53:44.52 .net >>128 公式のページで使えと書かれている拡張機能 https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak https://chrome.google.com/webstore/detail/archive-page/gcaimhkfmliahedmeklebabdgagipbia
130 :名無しさん@お腹いっぱい。 :2023/11/08(水) 12:48:50.05 .net アクティブチーム何やってんだよ。 なんで下記のURLは誰もアーカイブしてないんだ? https://www.youtube.com/watch?v=XGeNeLWnYdc
131 :名無しさん@お腹いっぱい。 :2023/11/08(水) 13:50:28.69 .net アクティブチームw https://o.5ch.net/223si.png
132 :名無しさん@お腹いっぱい。 :2023/11/09(木) 20:53:09.04 .net どうしてもすぐにアーカイブしたい動画があるならtubeupを使って自分でうpするか Yt-dlpを使ってメタデータを含めてローカルに落とすのが理想や!
133 :名無しさん@お腹いっぱい。 :2023/11/10(金) 23:40:24.43 .net ArchiveTeamは特定の動画(削除の危機がある, ニュース, 政治etc)に限定して保存してるから、保存したい動画は手動保存する必要がある リソースは有限だからね ↓詳細 https://wiki.archiveteam.org/index.php/YouTube#Scope
134 :名無しさん@お腹いっぱい。 :2023/11/11(土) 13:29:16.82 .net Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。 あれって何でああなってるの?たとえば以下のページなど。 https://web.archive.org/web/20021017173116/http://www.namco.co.jp/home/cs/lineup/mrdriller/page01.html このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。 当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。 今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。
135 :名無しさん@お腹いっぱい。 :2023/11/11(土) 13:32:47.70 .net 確認されてないから画像が抜け落ちてる
136 :名無しさん@お腹いっぱい。 :2023/11/11(土) 15:59:18.06 .net >>134 そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、 それまでは指示された単一のファイルをアーカイブするだけだったから。 アーカイブされた HTML をクライアント側のブラウザで表示したときに 個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が なされたこともあったが、それ自体も 2010 年代中盤だったはず。
137 :名無しさん@お腹いっぱい。 :2023/11/11(土) 19:27:03.13 .net そうかなぁ? 俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。 以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。 https://web.archive.org/web/20131007222449/http://www.spike-chunsoft.co.jp/fr/index.html
138 :名無しさん@お腹いっぱい。 :2023/11/11(土) 19:39:27.54 .net >>137 それ Alexa のクローラが保存したアーカイブだしw sssp://o.5ch.net/2245t.png
139 :名無しさん@お腹いっぱい。 :2023/11/11(土) 20:41:42.88 .net >>137 https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%8D%E3%83%83%E3%83%88%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96 IA自身がクローラーを回して収集活動を始めるまでの歴史について知っておくと良い。
140 :名無しさん@お腹いっぱい。 :2023/11/11(土) 21:56:56.93 .net 昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´・ω・`)
141 :名無しさん@お腹いっぱい。 :2023/11/13(月) 01:18:15.56 .net IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ 画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第 例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない
142 :名無しさん@お腹いっぱい。 :2023/11/13(月) 11:01:00.35 .net 確実に保存したい時は InternetArchiveとArchive.todayどっちもアーカイブしてるわ それで大体残ると思うけどどうだろ
143 :名無しさん@お腹いっぱい。 :2023/11/13(月) 21:58:51.62 .net >>141 それで精度だったり保存量にばらつきがあるんすね
144 :名無しさん@お腹いっぱい。 :2023/11/14(火) 22:23:03.18 .net ここ最近自動アーカイブがされてないようだけど一体どうしたんだ?
145 :名無しさん@お腹いっぱい。 :2023/11/15(水) 13:06:21.31 .net ここのアーカイブ開いても年齢確認から先に進めない ラズパイでエロゲ https://sirius10.net/Games/hgames.php
146 :名無しさん@お腹いっぱい。 :2023/11/15(水) 13:33:45.41 .net >>145 クッキー喰ったことにすればアーカイブはできるな。 使うのは API の capture_cookie パラメータ。 https://web.archive.org/web/20231115043115/sirius10.net/Games/hgames.php
147 :名無しさん@お腹いっぱい。 :2023/11/15(水) 16:29:16.84 .net えっ?年齢認証のページも保存できたの?初めて知った。 以前、以下のページを保存したかったけど諦めたんだ。 https://www.konami.com/games/pcemini/jp/ja/ もしこのページ保存できるなら、上部メニューの8ページほど保存しといてほしい。もしくはそのAPIの使い方を具体的に教えてほしい。 まだ誰も上手く保存できてないみたいだし。
148 :名無しさん@お腹いっぱい。 :2023/11/15(水) 16:34:01.70 .net 保存してほしいのは以下の6個のURL。もし保存できるのであればだけど。 https://www.konami.com/games/pcemini/jp/ja/ https://www.konami.com/games/pcemini/topics/jp/ja/topics_9 https://www.konami.com/games/pcemini/feature/jp/ja/ https://www.konami.com/games/pcemini/faq/jp/ja/ https://www.konami.com/games/pcemini/inquiry/jp/ja/ https://www.konami.com/games/pcemini/product/jp/ja/
149 :名無しさん@お腹いっぱい。 :2023/11/15(水) 16:54:07.39 .net 保存したい気持ち、解るなぁ https://web.archive.org/web/20231115074138/www.konami.com/games/pcemini/jp/ja/
150 :名無しさん@お腹いっぱい。 :2023/11/15(水) 17:04:47.72 .net >>149 確認できたわ、ありがとう! Internet Archiveを極めてるね!
151 :名無しさん@お腹いっぱい。 :2023/11/15(水) 23:20:06.19 .net >>146 すげえ、ありがとう
152 :名無しさん@お腹いっぱい。 :2023/11/18(土) 14:45:36.85 .net If something goes wrong please click here to send us an error report. ってやつ、下じゃなくて上に配置してくれないかな・・・ 何回誤送信したか分からん
153 :名無しさん@お腹いっぱい。 :2023/11/18(土) 15:42:54.81 .net twitter保存できないことが最近増えてるみたいだけど、archivetodayでも保存できない場合は、cacheリンクをぶち込むと保存できるでー
154 :名無しさん@お腹いっぱい。 :2023/11/19(日) 14:41:27.28 .net twitter以外の保存できないサイトも、 https://webcache.googleusercontent.com/search?q=cache: 保存したいリンク をWabackmachineに入れればキャッシュを保存できる。
155 :名無しさん@お腹いっぱい。 :2023/11/19(日) 14:44:57.55 .net 認証要る系は無理
156 :名無しさん@お腹いっぱい。 :2023/11/19(日) 19:17:19.50 .net twitterならnitterで良くね?
157 :名無しさん@お腹いっぱい。 :2023/11/19(日) 19:21:06.50 .net リダイレクトページを保存して過去のアーカイブ上書きして使いづらくする問題 なんで放置されてんだよ!
158 :名無しさん@お腹いっぱい。 :2023/11/20(月) 04:47:38.50 .net 俺も基本nitterキャプってるなTwitter取得する時は
159 :名無しさん@お腹いっぱい。 :2023/11/21(火) 01:55:39.65 .net "The requested video has been archived but is not currently available for playback."と"Attempts to archive this video failed."が出たときが一番ダルい
160 :名無しさん@お腹いっぱい。 :2023/11/22(水) 20:57:37.32 .net イーロン・マスクのせいで、1tweetごとにarchiveしないといけなくなったけど、 より問題なのは、tweet群が本人の削除やアカウント停止などで消されてしまったら、 archiveがあってもtweet同士のつながりがわからなくなること。 以前はtweetを1カ所か何カ所かwayback machineで押さえれば、スレッド丸ごとarchiveできたのに。
161 :名無しさん@お腹いっぱい。 :2023/11/23(木) 07:29:06.67 .net 何度保存しても「Hrm. The Wayback Machine has not archived that URL.」が出続ける。
162 :名無しさん@お腹いっぱい。 :2023/11/23(木) 16:23:31.19 .net >>160 ほんとゴミだよな 戻してくれないもんかね…
163 :名無しさん@お腹いっぱい。 :2023/11/25(土) 06:53:47.53 .net >>161 https://web.archive.org/save/ このページからやればできる。
164 :名無しさん@お腹いっぱい。 :2023/11/25(土) 07:21:35.68 .net >>161 > 何度保存しても 数日後、その何度も保存したのが一斉にカレンダーに登場するパターンw
165 :名無しさん@お腹いっぱい。 :2023/11/25(土) 15:36:03.02 .net SPNって一日1000ページ保存が上限なのか。初めて引っかかった。outlink込みでやってたからか。 あと最近頻繁にログアウトしてしまうんだけどこれも不具合なのかな。
166 :名無しさん@お腹いっぱい。 :2023/11/27(月) 21:08:31.71 .net >>162 戻る可能性もありそう。 ツイッターの閲覧制限 「経済的な理由という指摘もある」と辛坊治郎 https://news.1242.com/article/448206 Twitter閲覧制限 の理由:データスクレイピング の全てを わかりやすく 説明します https://sotatek.jp/blogs/all-about-the-reason-behind-twitter-new-view-limit/ 「情報はタダじゃない」訴える意図? Twitter閲覧制限 “スクレイピング”…サーバー負荷にマスク氏不満か https://news.ntv.co.jp/category/society/9517009c0a124432a4ae38cecc2a2cf4 【解説】ツイッター“閲覧制限”なぜ? 考えられる2つの理由 マスク氏の狙いは https://news.ntv.co.jp/category/society/78ed7d1aae84431889171d51800beb37 Twitterの閲覧制限が起きた理由|今後のビジネスへの影響は? https://blog.formzu.com/twitter_limit
167 :名無しさん@お腹いっぱい。 :2023/11/28(火) 12:24:55.48 .net >>165 > SPNって一日1000ページ保存が上限 それ何処から来た数字よ? https://web.archive.org/save/status/user sssp://o.5ch.net/2261s.png
168 :名無しさん@お腹いっぱい。 :2023/11/28(火) 21:40:26.81 .net イーロンの野郎また何かやらかしたのか。
169 :名無しさん@お腹いっぱい。 :2023/11/29(水) 10:54:45.08 .net どっとうpろだ.orgサービス終了かよ 知らなかった
170 :名無しさん@お腹いっぱい。 :2023/11/30(木) 19:42:48.90 .net 忘れた頃に消えてくれるからお世話になったなぁ・・・ 長いことおつかれさんでした
171 :名無しさん@お腹いっぱい。 :2023/12/01(金) 16:35:49.47 .net saveできない状態
172 :名無しさん@お腹いっぱい。 :2023/12/01(金) 18:34:12.83 .net 普段は「Not Found」が出ても何遍か更新すると正常に戻るが、今は何遍更新しても・・・
173 :名無しさん@お腹いっぱい。 :2023/12/01(金) 19:28:00.38 .net マジか。保存対象URL側に問題あるのかと諦めて魚拓で済ましたけどIA側の問題だったのか
174 :名無しさん@お腹いっぱい。 :2023/12/01(金) 20:03:23.58 .net URL側の場合は「Not Found」というか普段から「このURLは保存不可」的なのが出るが、 今はどのサイトを入力しても「Not Found」
175 :名無しさん@お腹いっぱい。 :2023/12/01(金) 21:10:57.63 .net JSON で user status を得ようとしても 503 が返る 逝っちゃってるねぇ https://web.archive.org/save/status/user
176 :名無しさん@お腹いっぱい。 :2023/12/01(金) 21:28:40.39 .net 今日朝からnot foundだったから来てみたらおま環じゃなかったか
177 :名無しさん@お腹いっぱい。 :2023/12/01(金) 23:30:32.34 .net ようやくできるようになったが、4時間待ち(待ち時間は環境によるだろうが)
178 :名無しさん@お腹いっぱい。 :2023/12/01(金) 23:31:28.89 .net 復活したけど、これじゃ今日のページ存できないな The capture will start in ~7 hours, 39 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
179 :名無しさん@お腹いっぱい。 :2023/12/02(土) 15:23:15.03 .net 待ち時間未明よりは減ってるが、まだ1時間待ち(環境によるだろうが) ただし、PDF絡みの取得は問題なし
180 :名無しさん@お腹いっぱい。 :2023/12/02(土) 15:52:02.12 .net 重い
181 :名無しさん@お腹いっぱい。 :2023/12/03(日) 02:47:23.34 .net 14 hoursとか取得時間かかりすぎ
182 :名無しさん@お腹いっぱい。 :2023/12/03(日) 19:22:18.20 .net やっと直ったか
183 :名無しさん@お腹いっぱい。 :2023/12/03(日) 19:46:55.79 .net ページを保存しようとしたら The capture will start in ~3 hours, 5 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved. と言われて、まだ終わらないけど、MP4動画単体を保存したら瞬時に保存された。 2023/12/03(日)19:39:14 URL: https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4 Job: https://web.archive.org/save/status/spn2-a3a61ee7a77e38b016777f4e7c9b1139d337b0d8 [success][0.29s][初] 成功: https://web.archive.org/web/20231203103915/https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4 - 2023/12/03(日)19:39:15
184 :名無しさん@お腹いっぱい。 :2023/12/04(月) 03:03:18.62 .net >>183 .jpg とか .png とか .zip とか、ヘッドレスブラウザでレンダせず ファイル単体を保存するだけで済むものはそんな感じ。 .pdf も outlinks の走査はされるけど何故か速い。
185 :名無しさん@お腹いっぱい。 :2023/12/05(火) 01:10:50.73 .net でた蔵の過去のテレビ番組のアーカイブ2022年12月以前の削除されちゃったんだな、最悪 gooといい価格コムといい削除するなら最初から公開しなきゃいいのに NHKも一時期過去の番組表見れないようにしてたし何の目的なんだろうな 維持するのも金がかかるのかねえ
186 :名無しさん@お腹いっぱい。 :2023/12/05(火) 10:15:27.60 .net 更新終了および閉鎖のお知らせ 2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。 2024年3月31日にサイトの完全閉鎖を予定しております。 https://wezz-y.com/archives/95862
187 :名無しさん@お腹いっぱい。 :2023/12/05(火) 10:15:30.24 .net 更新終了および閉鎖のお知らせ 2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。 2024年3月31日にサイトの完全閉鎖を予定しております。 https://wezz-y.com/archives/95862
188 :名無しさん@お腹いっぱい。 :2023/12/05(火) 20:35:42.29 .net こんな糞重いクルクルクルクルしてるだけのゴミクズサイト すでに2億円も寄付されてるの糞受けるな 裏金アベノイミン党みたいな連中だ
189 :名無しさん@お腹いっぱい。 :2023/12/06(水) 10:55:02.43 .net Not Found The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again. saveできない また逝ってるのかな
190 :名無しさん@お腹いっぱい。 :2023/12/06(水) 12:06:41.28 .net またエラー吐いてる・・・
191 :名無しさん@お腹いっぱい。 :2023/12/06(水) 17:58:46.73 .net まーた404 NOT FOUNDだぞー
192 :名無しさん@お腹いっぱい。 :2023/12/06(水) 19:14:32.73 .net OH!! NO!!
193 :名無しさん@お腹いっぱい。 :2023/12/06(水) 20:29:25.03 .net やっと復旧した ┃ 午前9:18 ・ 2023年12月6日 ┃ https://twitter.com/textfiles/status/1732192819098292677 ┃ Jason Scott @textfiles ┃ Power has gone out at the @internetarchive primary datacenter; waiting for it to return. ┃ 午前10:04 ・ 2023年12月6日 ┃ https://twitter.com/internetarchive/status/1732204429066289608 ┃ Internet Archive @internetarchive ┃ Sorry, http://archive.org and http://openlibrary.org will be back in a few, ┃ ┃ but a short term power outage was long enough to make recovery take a little while. ┃ ┃ We apologize. (deleted an unsolicited ad)
194 :名無しさん@お腹いっぱい。 :2023/12/07(木) 15:12:31.98 .net 停電多すぎね?アメリカってそんな停電するの?
195 :名無しさん@お腹いっぱい。 :2023/12/11(月) 10:14:59.64 .net あ゙あ゙あ゙あ゙あ゙ーーー https://o.5ch.net/227eo.png
196 :名無しさん@お腹いっぱい。 :2023/12/11(月) 19:40:20.47 .net ここ何日か>>195 のような表示がそのときそのときで出たり出なかったり 取得そのものができないよりは増しとはいえ・・・
197 :名無しさん@お腹いっぱい。 :2023/12/11(月) 19:45:40.20 .net >>196 やっぱそうだよね、自分の環境のせいかと思ってたけど
198 :名無しさん@お腹いっぱい。 :2023/12/11(月) 21:54:33.55 .net Donateしまくらなきゃな
199 :195 :2023/12/11(月) 22:16:37.71 .net 11 時間 42 分経過、結局アーカイブされてなかったからリクエスト発行し直した。 てゆーか 10 時間とか 20 時間とか言われても、数分後に同じ URL のアーカイブを 再リクエストしたらタイミングによってはすぐ保存してくれることもあるので こういう時はやり直すのが正解だと理解することにした。
200 :名無しさん@お腹いっぱい。 :2023/12/12(火) 01:25:40.30 .net 緑色の一日おき程度に取得した不完全なのを見かけるけどこういう事象の跡なのね
201 :名無しさん@お腹いっぱい。 :2023/12/12(火) 19:24:45.55 .net Save outlinksで取得出来るページ数減らされてる…
202 :名無しさん@お腹いっぱい。 :2023/12/12(火) 20:23:08.77 .net 何個まで?
203 :名無しさん@お腹いっぱい。 :2023/12/12(火) 20:25:41.13 .net まあここ最近、調子悪いからな。 しばらくすれば元に戻るかも。
204 :名無しさん@お腹いっぱい。 :2023/12/12(火) 20:51:11.11 .net 近い内にサーバー飛んでサ終かもな
205 :名無しさん@お腹いっぱい。 :2023/12/12(火) 21:35:01.32 .net Sorry You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more.
206 :名無しさん@お腹いっぱい。 :2023/12/12(火) 22:59:52.35 .net なんかめちゃスムーズにspnリクエスト送れるようになってる 昨日ぐらいまでめっちゃ糞詰まり起こしてたのに
207 :名無しさん@お腹いっぱい。 :2023/12/12(火) 23:51:14.97 .net >>205 アカウント作れよ、上限が 300 倍に増えるぞ てゆーか登録ユーザの daily_captures_limit の値、30000 まで減ってるのな https://o.5ch.net/227k4.png
208 :名無しさん@お腹いっぱい。 :2023/12/12(火) 23:55:59.07 .net Sorry Job failed ってIAの画面がアーカイブされてる?ときって失敗ってことなんかな
209 :名無しさん@お腹いっぱい。 :2023/12/13(水) 00:05:36.88 .net >>208 自分の経験ではアーカイブできてる事も失敗してる事もある そういう時は web.archive.org/web/2/ に対象の URL を付けて 最新のアーカイブを表示させてみてる
210 :名無しさん@お腹いっぱい。 :2023/12/13(水) 00:13:02.17 .net せっかく>>206 と思ったら今度は・・・ 今までの1割とは落差がでかい
211 :名無しさん@お腹いっぱい。 :2023/12/13(水) 03:24:05.46 .net 何回やってもどのサイトでもsorryになって保存できない
212 :名無しさん@お腹いっぱい。 :2023/12/13(水) 04:01:02.50 .net ろくに英語も読めないのにここでアーカイブ取ろうとしてるからだよ
213 :名無しさん@お腹いっぱい。 :2023/12/13(水) 08:31:24.05 .net ? 日本語のサイトしか保存した事ないけど… つか1日100件なんて保存してないのに⇓が出る 前にキャッシュcookie消去したらarchiveでの履歴も消えちゃったから消すの嫌なんだけどなあ Sorry You cannot make more than 100 captures per day. Please email us at "info@archive.org" if you would like to discuss this more
214 :名無しさん@お腹いっぱい。 :2023/12/13(水) 08:59:55.49 .net 100件も取得してなくても出るとか・・・ますます謎
215 :名無しさん@お腹いっぱい。 :2023/12/13(水) 11:42:51.22 .net >>214 > 2023/12/13(水) 08:59:55.49 カウンターがリセットされる時刻の 5 秒前w 昨日の分も一緒にカウントされてるんじゃないの
216 :名無しさん@お腹いっぱい。 :2023/12/13(水) 17:44:14.23 .net 画像とか含めてじゃないの
217 :名無しさん@お腹いっぱい。 :2023/12/13(水) 18:18:11.85 .net >>215 214だが、>>213 と同一ではない こっちは100件超えてたからまだしも、>>213 のようなこともあると驚いたまで
218 :名無しさん@お腹いっぱい。 :2023/12/13(水) 19:04:25.63 .net >>207 同時実行可能なセッション数も微妙に調整してますね 2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0} 2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0} 2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0} 2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0} 2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0} 2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
219 :名無しさん@お腹いっぱい。 :2023/12/13(水) 22:13:35.46 .net 一方、アカウントなしの場合は>>4 にあるとおり1分あたり3件 昨年の途中まで4件、今年でもわずかに4件だったことも https://mevius.5ch.net/test/read.cgi/esite/1628793497/453 https://mevius.5ch.net/test/read.cgi/esite/1628793497/637 https://mevius.5ch.net/test/read.cgi/esite/1628793497/729
220 :名無しさん@お腹いっぱい。 :2023/12/14(木) 09:04:07.36 .net 「日付」が切り替わってカウント数が0に戻るのは日本時間朝9時です
221 :名無しさん@お腹いっぱい。 :2023/12/15(金) 17:24:20.13 .net SPN2APIでリファラーって送る方法ある?
222 :名無しさん@お腹いっぱい。 :2023/12/15(金) 22:35:38.95 .net 無いね ページ内で使われてる画像なんかには送られてるみたいだけど
223 :名無しさん@お腹いっぱい。 :2023/12/15(金) 22:44:59.91 .net >>222 無いか〜・・・、サンクス
224 :名無しさん@お腹いっぱい。 :2023/12/16(土) 01:38:13.04 .net nitter.net保存できなくなってる。 nitter.czならtodayの方で保存できるが
225 :名無しさん@お腹いっぱい。 :2023/12/17(日) 20:30:36.67 .net Twitterはもう保存できなくなったのか? 保存した後、だいぶ経ってから保存されているはずの日付を見に行ったら中身が何もない。 そういうのばかり。
226 :名無しさん@お腹いっぱい。 :2023/12/18(月) 15:22:07.99 .net Twitter側の仕様変更のせいで見た目はアーカイブできなくなった ソースを見るとツイート内容はアーカイブされてるっぽい
227 :名無しさん@お腹いっぱい。 :2023/12/18(月) 15:57:48.09 .net 本家のtwitter.comも、nitter.netもウェイバックマシンでは保存できなくなってる。 今は、nitter.czをarchive.todayの方にぶち込むしか方法がない。
228 :名無しさん@お腹いっぱい。 :2023/12/18(月) 16:54:37.67 .net 今でも更新続ければ保存はできるけど、数日待たないとできなかったりで安定はしない
229 :名無しさん@お腹いっぱい。 :2023/12/21(木) 04:31:49.98 .net 登録しても制限をかけるなら、有料プランを導入してくれ
230 :名無しさん@お腹いっぱい。 :2023/12/21(木) 09:52:22.88 .net 最近すこし保存しようとして更新するとすぐアク禁されて駄目だわ
231 :名無しさん@お腹いっぱい。 :2023/12/22(金) 15:05:19.09 .net アク禁ってされたことないんだけど、どんな表示でるんだ
232 :名無しさん@お腹いっぱい。 :2023/12/22(金) 15:05:21.69 .net アク禁ってされたことないんだけど、どんな表示でるんだ
233 :名無しさん@お腹いっぱい。 :2023/12/22(金) 15:06:53.26 .net すまん連投になってもた
234 :名無しさん@お腹いっぱい。 :2023/12/22(金) 15:15:17.32 .net >>231-233 相手サーバが無反応になる 何も返らないからブラウザ組み込みのエラーメッセージが出る
235 :名無しさん@お腹いっぱい。 :2023/12/23(土) 17:21:40.52 .net 2〜3秒に1回位のアクセスに抑えておけばまずアク禁はされないと思うが
236 :名無しさん@お腹いっぱい。 :2023/12/24(日) 20:12:20.28 .net アーカイブチームの皆さんは自分の事しか考えてないの? あれだけ顧客第一つったろ!
237 :131 :2023/12/24(日) 23:14:02.35 .net >>236 アーカイブチームって覚えられたんだw すごいね
238 :名無しさん@お腹いっぱい。 :2023/12/25(月) 14:38:28.21 .net 次はアーカイブチームとインターネットアーカイブは無関係って事を覚えような
239 :名無しさん@お腹いっぱい。 :2023/12/26(火) 07:40:40.52 .net 自動保存できなくなったの?
240 :名無しさん@お腹いっぱい。 :2023/12/28(木) 19:50:12.24 .net https://archive.is/rt7gI Archive.org is DOWN for everyone.
241 :名無しさん@お腹いっぱい。 :2023/12/29(金) 15:27:27.42 .net SPNとSPN-outlinksで結果が変わるの謎過ぎるな SPNだと取れるのにoutlinksの方はエラーが出るサイトがたまにある わざわざ別の環境使ってるのか?
242 :名無しさん@お腹いっぱい。 :2023/12/29(金) 16:01:08.08 .net と書いておいて何のエラーか一切説明しない低能
243 :名無しさん@お腹いっぱい。 :2024/01/03(水) 15:31:04.59 .net >>220 φ(`д´)メモメモ...
244 :名無しさん@お腹いっぱい。 :2024/01/05(金) 00:43:45.29 .net archive.todayのほう死んでます?
245 :名無しさん@お腹いっぱい。 :2024/01/05(金) 02:20:34.95 .net 一時間くらい前、ぐるぐるアイコンを表示したままリロードを繰り返す状態だったな。
246 :名無しさん@お腹いっぱい。 :2024/01/05(金) 21:00:47.72 .net アーカイブ開こうとすると実アドレスの方に飛ばされる症状が出てる アーカイブに保存された形跡はある ただこれも保存済みアドレスが検索で出たりでなかったりがある
247 :名無しさん@お腹いっぱい。 :2024/01/07(日) 08:45:36.21 .net 相変わらずこの時間帯の Tor 経由でのアーカイブは厳しいw あと 15 分待つか sssp://o.5ch.net/22b4z.png
248 :名無しさん@お腹いっぱい。 :2024/01/08(月) 16:23:46.89 .net 既出だったらスマン アーカイブされたページ自体をユーザ側のアクションで検索エンジンのインデックスに登録することって可能なんかな 検索してみるといくつかの日本のサイトのアーカイブがGoogleにインデックス登録されてるんだよな でもWaybackが自分でクロール申請したはずはないから何か方法があるんじゃないかと思ってる 例えば自分で立てたサイトにアーカイブへの直リンクを貼っておいて、自分のサイトをインデックス登録してリンク先をクロールさせるとか
249 :名無しさん@お腹いっぱい。 :2024/01/09(火) 05:18:09.59 .net うまいことpixivのアーカイブ取る方法はないものか
250 :名無しさん@お腹いっぱい。 :2024/01/09(火) 19:55:25.90 .net 閉鎖したサイトを丸々コピーして稼いでる攻略サイトが増えてるわ https://xneo.jp/ https://kouryaku7.com/
251 :名無しさん@お腹いっぱい。 :2024/01/10(水) 07:22:01.53 .net うーむ 特定のホストにて、各 URL につき「一時間以上空けろ」ではなく 「一日一回のみアーカイブ可」ということか。 ちなみにホスト名は www.sqlite.org。 sssp://o.5ch.net/22bkm.png
252 :名無しさん@お腹いっぱい。 :2024/01/10(水) 11:46:54.75 .net そんなにSPNの条件厳しくなったのか
253 :名無しさん@お腹いっぱい。 :2024/01/10(水) 15:40:19.81 .net 昔このスレに居たスポーツ新聞野郎なら発狂してる事案w
254 :名無しさん@お腹いっぱい。 :2024/01/10(水) 16:08:44.56 .net >>18 によるとYouTubeは動画も保存される仕様とのことだけど その仕様になったのは最近? 6~7年前にアーカイブされたYoutubeページに辿り着いたら 動画部分は保存されていなかった
255 :名無しさん@お腹いっぱい。 :2024/01/11(木) 00:50:47.06 .net ログインしても数個取るとすぐログアウトさせられるのはおま環?
256 :名無しさん@お腹いっぱい。 :2024/01/11(木) 02:24:05.23 .net クッキーを消した、有効期限切れ (一年間)、それ以外の原因でのログアウトは無いな。
257 :名無しさん@お腹いっぱい。 :2024/01/11(木) 16:04:39.91 .net >>254 動画によって保存されてたりされなかったりする、基準は分からん why:のところにyoutubecrawlが無いスナップショットは動画が保存されてない
258 :名無しさん@お腹いっぱい。 :2024/01/12(金) 18:40:22.52 .net Save Page Now browser crashed on http://naenara.com.kp/main/index/ja/first.
259 :名無しさん@お腹いっぱい。 :2024/01/14(日) 05:07:51.98 .net 初めて目にしたかも sssp://o.5ch.net/22c29.png
260 :名無しさん@お腹いっぱい。 :2024/01/15(月) 00:29:16.40 .net IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
261 :名無しさん@お腹いっぱい。 :2024/01/15(月) 00:29:45.25 .net IAで、ディレクトリ内のファイル名に対して検索をする方法ってある?
262 :名無しさん@お腹いっぱい。 :2024/01/15(月) 00:30:15.98 .net ごめんダブった
263 :名無しさん@お腹いっぱい。 :2024/01/15(月) 00:59:42.60 .net >>260-261 タイムスタンプ部分とディレクトリ名末尾に "*" とか https://web.archive.org/web/*/www.sqlite.org/2023/* 検索対象の母数が一万件を超える場合は CDX Server API でリストを出してから ローカルで抽出とか https://mevius.5ch.net/test/read.cgi/esite/1628793497/332-333
264 :名無しさん@お腹いっぱい。 :2024/01/15(月) 02:24:29.46 .net >>263 リプありがとうございます。 せっかく教えてくださったのに、自分の説明が足らなくて分からなかったのですが、やりたいことはこんな感じです たとえば、↓のshow allを開くとディレクトリ内のコンテンツが表示されますが その中のG71-VNW1013.isoを検索して見つける事はできますか? ttps://archive.org/details/msi-afterburner-driver-and-utility ttps://archive.org/search に入力して検索をした場合、タイトルや説明欄しか拾わないので どうしたものかと思っていました
265 :名無しさん@お腹いっぱい。 :2024/01/15(月) 03:12:52.31 .net ファイル名での検索が可能なら、例えばこんなアップロードは もっと閲覧数が増えているのではないかと思います。 https://archive.org/details/vps0000000000020160306
266 :名無しさん@お腹いっぱい。 :2024/01/15(月) 11:04:23.01 .net >>265 そっか…ありがとうございましたm(_ _)m
267 :名無しさん@お腹いっぱい。 :2024/01/15(月) 14:20:12.75 .net 検索システムはもっと強化してほしいよなぁ 一度も閲覧されてない化石と化したアーカイブとか大量にありそう まぁあまり強化するとDMCA案件が増えそうなので悩ましいけど
268 :名無しさん@お腹いっぱい。 :2024/01/17(水) 09:51:54.39 .net ログインしても同時保存制限厳しい…(4つまで) あと、一気にまとめて取得する方法ってないの?一個一個やってると面倒臭い
269 :名無しさん@お腹いっぱい。 :2024/01/17(水) 18:53:45.11 .net 4 つねぇ、どうしたのかしら。 https://web.archive.org/save/status/user sssp://o.5ch.net/22cik.png
270 :名無しさん@お腹いっぱい。 :2024/01/17(水) 19:26:47.07 .net >>268 savepagenow@archive.org に電子メールを送信/転送するとメール中のURIをアーカイブした結果のメールが数~数十分後に返信されてくる
271 :名無しさん@お腹いっぱい。 :2024/01/18(木) 00:05:13.23 .net 「ウェブ魚拓」や「archive.today」では保存できるのに「wayback machine」ではできないということは、 Xは「wayback machine」を嫌がっているということか? ウェブ魚拓 https://megalodon.jp/ archive.today https://archive.md/
272 :名無しさん@お腹いっぱい。 :2024/01/18(木) 00:12:17.43 .net 別に今でもX保存できるけど
273 :名無しさん@お腹いっぱい。 :2024/01/18(木) 00:59:42.30 .net >>272 保存した日付のところを見に行った? たとえばこれ。 Saved 1 time January 13, 2024. https://web.archive.org/web/20240000000000*/https://twitter.com/BasedMikeLee/status/1745945126793626064 https://megalodon.jp/2024-0117-2350-04/https://twitter.com:443/BasedMikeLee/status/1745945126793626064 https://archive.md/clxnV (deleted an unsolicited ad)
274 :名無しさん@お腹いっぱい。 :2024/01/18(木) 02:24:21.59 .net 「保存」は出来てるよ、表示が崩れてるだけ CTRL+Uでソースを見ればツイート内容は保存されてるのが分かる
275 :名無しさん@お腹いっぱい。 :2024/01/18(木) 02:40:16.78 .net https://web.archive.org/web/20240117173332/https://twitter.com/googlejapan/status/1747091305128477149 これなんかは動画まで含めてちゃんと取れたことを確認した (deleted an unsolicited ad)
276 :名無しさん@お腹いっぱい。 :2024/01/18(木) 02:49:37.22 .net >>274 見られないなら保存した意味がない。
277 :名無しさん@お腹いっぱい。 :2024/01/19(金) 21:26:20.93 .net インターネットアーカイブのブログ、ずっと同じ糖質に粘着されてるの笑う それでも削除しないのは流石だがw
278 :名無しさん@お腹いっぱい。 :2024/01/28(日) 01:57:58.03 .net スラドのアーカイブを取ろうと思ったら、このサイト記事一覧ページって無いのか? ajaxでmore moreで辿るしか無いんだろうか・・・ もう終わりだよ
279 :名無しさん@お腹いっぱい。 :2024/01/28(日) 02:34:53.07 .net >>278 日付別の一覧、例えば昨日 (2024-01-26) のストーリー一覧なら https://srad.jp/story/24/01/26/ から https://mobile.srad.jp/story/24/01/24/2339228/ https://mobile.srad.jp/story/24/01/24/2346248/ https://it.srad.jp/story/24/01/24/2351254/ https://srad.jp/story/24/01/25/1337233/ https://it.srad.jp/story/24/01/25/1340217/ ・・・ と記事番号とカテゴリ名を含む URL は得られるかと思います。
280 :279 :2024/01/28(日) 02:39:44.69 .net おっとそれは一昨日だったw PC を UTC タイムゾーンで動かしているのでうっかり・・・ https://o.5ch.net/22epx.png
281 :名無しさん@お腹いっぱい。 :2024/01/28(日) 09:17:36.54 .net >>273 https://web.archive.org/web/20240126113327/https://twitter.com/s96shiho/status/1723541214925029490 これもそうだけど、スマホでなら見られるのにPCだと見られないのはなぜだろうか? >>275 それはPCでも見られた。 (deleted an unsolicited ad)
282 :名無しさん@お腹いっぱい。 :2024/01/28(日) 13:04:59.85 .net >>279 すごい、ありがとう! そのURLは気付かなかった。 しかし、ページングは無さそうだから1日1リクエストとしても日記タレコミ記事で3*365*年数 か・・・。
283 :名無しさん@お腹いっぱい。 :2024/01/28(日) 15:30:54.71 .net あと3日半だから絶望的じゃん
284 :名無しさん@お腹いっぱい。 :2024/01/28(日) 15:51:21.68 .net 月曜日に発表があって週末が1回しかないって急すぎるよ。 しかもスラドってコメント欄がperlのajaxで読み込んでるからアーカイブだとまともに表示できないだろうし
285 :名無しさん@お腹いっぱい。 :2024/01/29(月) 09:18:53.73 .net savepagenow@archive.org に取得したいページのURL送ったんだけど、ほとんどError! Capture timed outになる・・・ これってサーバー重くて失敗したのかな?
286 :名無しさん@お腹いっぱい。 :2024/01/31(水) 16:01:30.81 .net Save Page Now browser crashed なんかエラー吐いて来るね・・・ 取れてる奴もあるけど違いがわからん
287 :名無しさん@お腹いっぱい。 :2024/01/31(水) 16:14:30.83 .net それ Linux バイナリをアーカイブさせると良く出くわすな。 force_get=on を指定すると問題無く行けてるから、おそらく コンテンツをヘッドレスブラウザでレンダしようとして失敗してるんだと思う。
288 :名無しさん@お腹いっぱい。 :2024/02/01(木) 05:22:38.32 .net Srad はアーカイブチームが動いてるって見たけど 個人でバックアップしている人もおるんか
289 :名無しさん@お腹いっぱい。 :2024/02/01(木) 14:17:08.29 .net スラド閉鎖撤回したな まぁ不安定な状況である事には変わらないからアーカイブはした方が良い
290 :名無しさん@お腹いっぱい。 :2024/02/02(金) 15:14:07.28 .net The capture will start in ~1 hour, 1 minute because our service is currently overloaded. また1時間後とか言われるようになっちゃった・・・
291 :名無しさん@お腹いっぱい。 :2024/02/02(金) 18:58:54.38 .net 個人的に巡回ソフトでアーカイブ出来てたシンプル極まりない頃が懐かしい
292 :名無しさん@お腹いっぱい。 :2024/02/04(日) 09:19:08.45 .net Save Page Now browser crashed ヤフオクのページを取得しようとすると出る
293 :名無しさん@お腹いっぱい。 :2024/02/04(日) 12:09:51.36 .net アーカイブしても画像が保存されないのキツイな 昔から収集方法変えてないみたいだけど 運営陣は変えるつもりないんだろうか 色々相性問題とかあって変えられないのかな?
294 :名無しさん@お腹いっぱい。 :2024/02/04(日) 12:32:11.99 .net >>293 大ぼら乙
295 :名無しさん@お腹いっぱい。 :2024/02/04(日) 13:30:12.10 .net サイトによるのでは
296 :名無しさん@お腹いっぱい。 :2024/02/04(日) 16:23:38.85 .net 今でも画像はアーカイブ開いて取得しないといけない
297 :名無しさん@お腹いっぱい。 :2024/02/04(日) 16:36:51.96 .net 【2020 年頃まで】 画像の保存は完全にユーザ任せ (クローラを使っていたり、或いは 普通のブラウザでも保存開始後にすぐ閉じたりすると保存されない) 【それ以降】 ヘッドレスブラウザを実装、ある程度の画像は同時にアーカイブできるようになった >>293 の言う昔って、いつの話よ?
298 :名無しさん@お腹いっぱい。 :2024/02/05(月) 21:56:56.61 .net 動的サイトを取ろうとして取れないと勘違いしてるパターンじゃない? 画像は4年前から取れてるし、最近だと自動でアウトリンクまで辿ってくれるようになってるが
299 :名無しさん@お腹いっぱい。 :2024/02/06(火) 10:29:25.54 .net Tor を使っていると、本当にいろんな体験ができるw この時の出口ノードは 🇳🇴 185.243.218.61。 https://o.5ch.net/22g6c.png
300 :名無しさん@お腹いっぱい。 :2024/02/07(水) 01:46:05.35 .net Google検索のキャッシュリンクが廃止で過去のページが閲覧不可に https://pc.watch.impress.co.jp/docs/news/1566730.html >Googleは、検索結果ページで利用できたWebページのキャッシュへのリンクを削除した。 これまで検索結果の各Webページのキャッシュにアクセスできるリンクが用意されており、Webページの過去の状態や削除される前の状態などが確認できたが、このリンクが削除されたかたち。検索演算子「cache:」を使ったアクセスはまだ行なえるが、将来的にはこちらも利用できなくなる予定だという。 これにともないGoogleでは、キャッシュへのリンクに代わって、Internet Archiveへのリンクを追加したいとも考えているという。
301 :名無しさん@お腹いっぱい。 :2024/02/08(木) 07:44:47.71 .net オープンになったことで話題のBlueskyはarchive.todayで昔のTwitterみたいにスレッド丸ごとアーカイブできるようだ。 ところがWayback Machineでは保存できないみたい。
302 :名無しさん@お腹いっぱい。 :2024/02/08(木) 10:56:12.30 .net >>300 IAにリンク貼るならGoogleから多額の寄付金もらえそう
303 :名無しさん@お腹いっぱい。 :2024/02/08(木) 11:50:26.63 .net とうとう古い端末から Archive.md が開けなくなってしまた。 >>300 回線が重い時テキストだけ読むので重宝だったのにGoogleキャッシュ廃止メチャク不便やん。
304 :名無しさん@お腹いっぱい。 :2024/02/08(木) 12:15:36.70 .net 流れをぶった切って済まんが https://download.sysinternals.com/ 配下の URL にて >>251 に遭遇。 ソフトウェア配布サイトをターゲットにした措置だとは思うが Sysinternals のようにファイル名にリビジョン番号を記載せず 同じ URL のまま中身を差し替えていくサイトでは、 短期間で更新が繰り返されると保存されないリビジョンが出てくる。
305 :名無しさん@お腹いっぱい。 :2024/02/10(土) 16:54:28.54 .net This URL has been already captured 6 times today, which is a daily limit we have set for that host. Please try again tomorrow. 10回制限からなんか減った?
306 :名無しさん@お腹いっぱい。 :2024/02/10(土) 17:13:12.85 .net 6 回バージョン登場か。 >>305 その後ろの関係詞節、高校辺り出てれば充分読めると思うが? 中卒は知らん。
307 :名無しさん@お腹いっぱい。 :2024/02/10(土) 21:36:47.45 .net >>306 いや以前は10回制限だったのに6回になったなってだけ
308 :名無しさん@お腹いっぱい。 :2024/02/10(土) 22:21:20.99 .net >>307 個別に 1 回だけとか 6 回までとか指定されてるホストが出てきてるんだよ、 だから関係詞節も読めと言ってるの。
309 :名無しさん@お腹いっぱい。 :2024/02/12(月) 13:36:03.14 .net Wayback Machineってdoc形式のファイルやdocx形式のファイルも保存できるんだね ホント便利だな
310 :名無しさん@お腹いっぱい。 :2024/02/12(月) 16:04:03.39 .net 一日一回のみとか10回のみのエラーってAPIドキュメントには無いよね? 特別に指定されてるんだろうか
311 :名無しさん@お腹いっぱい。 :2024/02/14(水) 16:25:56.42 .net X(twitter)はnitter.czにリンクを変えて、archive.todayにぶち込んで保存してる。 他にも方法あるかもしれんけど
312 :名無しさん@お腹いっぱい。 :2024/02/15(木) 18:30:11.00 .net そういやnitterの開発終了したんだってな 今のところ動いてるインスタンスはあるけど、これからどうなんだろ
313 :名無しさん@お腹いっぱい。 :2024/02/15(木) 23:04:23.48 .net これからどうやってtwitter保存すればいいんだろう
314 :名無しさん@お腹いっぱい。 :2024/02/17(土) 01:09:16.83 .net youtubeの動画保存って無くなったのか? youtubecrawlのコレクションは増え続けてるから動いてるはずなんだが、未だに保存されん・・・ 国内メディアのニュース動画だからブロックされてる訳でも無いと思うんだがなぁ
315 :名無しさん@お腹いっぱい。 :2024/02/17(土) 09:06:16.83 .net >>313 Twitter保存できるようになってましたよ https://web.archive.org/web/20240216073841/https://twitter.com/elonmusk/status/1757474164850798632 https://web.archive.org/web/20240216154723/https://twitter.com/elonmusk/status/1757840768923021363 https://web.archive.org/web/20240217000150/https://twitter.com/elonmusk/status/1757924482885583112 (deleted an unsolicited ad)
316 :名無しさん@お腹いっぱい。 :2024/02/17(土) 18:37:04.84 .net >>315 ホンマや
317 :名無しさん@お腹いっぱい。 :2024/02/21(水) 03:43:18.85 .net >>281 が PC でも見られる、ってことは保存し直しの必要は無しか。 しかしアーカイブの表示内容が変化するってのは、別の意味で気持ち悪い。
318 :名無しさん@お腹いっぱい。 :2024/02/21(水) 16:29:14.97 .net ページ数、なかなか9000億超えないな
319 :名無しさん@お腹いっぱい。 :2024/02/21(水) 17:19:47.55 .net 今もだけど、たまにアーカイブ数が減るのは何なんだろうか しばらくすると元に戻るけど
320 :名無しさん@お腹いっぱい。 :2024/02/21(水) 21:40:13.97 .net 取得時間がまた2時間とか伸びて面倒
321 :名無しさん@お腹いっぱい。 :2024/02/24(土) 02:00:32.15 .net ヘッダー部分の下からが表示されないんだねど自分だけかな。キャッシュ消したり再起動しても直らん
322 :名無しさん@お腹いっぱい。 :2024/02/26(月) 16:37:22.05 .net >>321 サイトが重いとそうなる その場合でもhttps://web.archive.org/save に直接飛べば保存できたりする
323 :名無しさん@お腹いっぱい。 :2024/03/03(日) 13:23:54.98 .net ブルースカイは、アカウントの設定(ログアウトしたユーザーからの可視性)よっては取得できないから注意
324 :名無しさん@お腹いっぱい。 :2024/03/03(日) 16:09:52.87 .net セッションハイジャック耐性の無いサイトなら capture_cookie パラメータ辺り使えば行けるんだけどなぁ
325 :名無しさん@お腹いっぱい。 :2024/03/03(日) 23:23:39.94 .net 数日前からtodayの調子が悪くて調べたらcloudflareDNSと相性悪いのか
326 :名無しさん@お腹いっぱい。 :2024/03/04(月) 06:55:51.29 .net ページを保存させて完了画面も確認したのに、そのページが表示されないな カレンダー形式の一覧に反映されるまでにはこれまでも時間がかかっていたけど 保存ページ自体が数十分待っても出てこないのは初めて
327 :名無しさん@お腹いっぱい。 :2024/03/04(月) 07:06:56.05 .net 今もう一度見てみたら、既にカレンダー形式の日付には青丸が付いているのに さっき保存した保存時刻(UTC)をクリックしてもその内容が表示されないという現象が起きてる
328 :名無しさん@お腹いっぱい。 :2024/03/04(月) 14:03:06.47 .net 最近はよくある 半日くらい待つと出てくる
329 :名無しさん@お腹いっぱい。 :2024/03/05(火) 17:33:40.00 .net i.imgur.comのページは一瞬で保存できるのなんでなんだろ
330 :名無しさん@お腹いっぱい。 :2024/03/05(火) 19:50:05.76 .net >>329 1. 対象 URL に HEAD リクエストを投げる。 ↓ 2. レスポンスヘッダから単一の画像ファイルであることを検知。 (Content-Type: image/jpeg 等) ↓ 3. ヘッドレスブラウザは不要と判断、後回しにせず即アーカイブ作業に移る。 対象が HTML の場合は後回しにされることが多いが、おそらく ヘッドレスブラウザで HTML をパースして追加の画像等を拾ってきたり、 JavaScript を実行させる必要があるなど負荷が重いから。 HEAD リクエストが送られる件については >>3 のドキュメントの force_get の項を参照。
331 :名無しさん@お腹いっぱい。 :2024/03/06(水) 01:49:37.87 .net ニコニコ動画のフォロワー欄が途中までしか保存されない問題ってどうすれば解決できますか? www.nicovideo.jp/user/23396749/follow/follower https://archive.is/4Efzj 上記のユーザーならフォロワーは僅か40なので情報量が大きすぎるという訳でもないはずなのですが
332 :名無しさん@お腹いっぱい。 :2024/03/10(日) 15:14:50.96 .net 5chのnovaサーバーだけ取れなくなってる?
333 :名無しさん@お腹いっぱい。 :2024/03/10(日) 15:18:40.98 .net 今日調子悪い?
334 :名無しさん@お腹いっぱい。 :2024/03/10(日) 15:18:44.98 .net 今日調子悪い?
335 :名無しさん@お腹いっぱい。 :2024/03/10(日) 15:35:56.28 .net >>332 >>73 >>333-334 capture_outlinks=on にしても全然 outlinks を拾ってくれないね、それ以外は知らん。
336 :名無しさん@お腹いっぱい。 :2024/03/10(日) 19:42:19.84 .net https://nova.5ch.net/livegalileo/ https://nova.5ch.net/novatr/ 各板のトップは国外から見られるが、個別スレを開こうとすると 520 エラーが返る。 Internet Archive のサーバは米国にあるから当然エラーとなる。 https://o.5ch.net/22p66.png
337 :名無しさん@お腹いっぱい。 :2024/03/11(月) 01:13:22.82 .net 今日は一日繋がらなかったな
338 :名無しさん@お腹いっぱい。 :2024/03/11(月) 21:15:52.76 .net >>331 じゅんじゅ@\( ・ω・)/ www.nicovideo.jp/user/41124243 元グリーンベレー user/13675361 ・ lalala user/2765923 蘭‐Ran‐ user/18878661 ・ めざすくん user/27507212 わるよい user/3953893 ・ ゆ〜の user/2915294 sou user/11352489 ・ モッチチ user/6511183 ・ 海鼠 user/4114082
339 :名無しさん@お腹いっぱい。 :2024/03/11(月) 21:21:31.64 .net イモグラの画像、保存できてない時有るな
340 :名無しさん@お腹いっぱい。 :2024/03/15(金) 02:19:07.21 .net ビタミーナ王国物語以外でイモグラなんてワードを見かけるとは夢にも思わなかった
341 :名無しさん@お腹いっぱい。 :2024/03/15(金) 03:07:50.06 .net 【保存・記録】ウェブアーカイブ総合 Page.02 https://mevius.5ch.net/test/read.cgi/internet/1700519014/
342 :名無しさん@お腹いっぱい。 :2024/03/15(金) 16:03:39.90 .net imgur 画像のリファラ検査が始まり、直リンが禁止されてアーカイヴできなくなった。 https://i.imgur.com/8oRShxz.jpeg ↓ https://imgur.com/8oRShxz ページ内の埋め込み画像はリファラが送られるが、この URL では駄目。 ↓ https://imgur.com/8oRShxz/embed この URL のアーカイヴを保存させればよい。 ↓ 結果 https://web.archive.org/web/20240315065808im_/i.imgur.com/8oRShxzl.jpg
343 :名無しさん@お腹いっぱい。 :2024/03/16(土) 14:31:32.48 .net >>342 その方法を今試してみたけど保存できてないよ。 保存したファイルと元のファイル比較してみれば分かるけど解像度もファイルサイズも違うしURL末尾辺りに謎の小文字lが付加されてる。
344 :342 :2024/03/16(土) 15:04:21.21 .net >>343 あーほんとだ、気付かんかった 8oRShxz 8oRShxzl 何か良い方法は無いかな
345 :名無しさん@お腹いっぱい。 :2024/03/17(日) 02:41:47.70 .net dotupがやたらと嫌われてたけど俺はimgurの方が嫌いだわ( ´_ゝ`)
346 :名無しさん@お腹いっぱい。 :2024/03/20(水) 18:03:48.97 .net Loadingでずっと進まないんだけど 今archive.todayってTwitter保存できないの? archive.orgの方は出来るみたいだけど アドレスが長くなるからtodayの方を使いたい >>342 関係ないけど リファラ検査で出始めたJaneのimgurサムネイルエラーは https://egg.5ch.net/test/read.cgi/software/1708963746/185n で回避した
347 :名無しさん@お腹いっぱい。 :2024/03/20(水) 18:47:49.51 .net >>346 なんだ山下の犬か
348 :名無しさん@お腹いっぱい。 :2024/03/22(金) 05:15:15.83 .net NHKが運営するネット上の特設ページ、続々と運営終了。放送法改正を見据えた動きか https://internet.watch.impress.co.jp/docs/yajiuma/1577805.html 2024年4月1日10:00をもちまして、以下特設ページの掲載を終了(番組ストリーミングを含む)いたします。(NHKゴガク) https://www.nhk.or.jp/gogaku/ NHK、「政治マガジン」など6サイト更新停止へ 新サービスを検討(朝日新聞デジタル) https://www.asahi.com/articles/ASS375VHPS36UCVL04P.html NHKやばいな。どんどんデジタルサービス終了させている。声調確認くんとか、凄く良かったのに。デジタル頑張っていた中の人たちが気の毒。(Togetter) https://togetter.com/li/2334548
349 :名無しさん@お腹いっぱい。 :2024/03/23(土) 15:57:54.15 .net 特許や意匠権の参考文献にURLが記載されてる事って多いんだけどさ 昔のホームページだと404かつ何処にもアーカイブされてないとかざら何だよな せめてその辺は国がアーカイブしないと将来的に困ったことにならんのか?と思う
350 :名無しさん@お腹いっぱい。 :2024/03/23(土) 18:36:41.16 .net 今死んでるな?
351 :名無しさん@お腹いっぱい。 :2024/03/23(土) 20:47:29.68 .net >>349 この国の政府って困ったことに未来にも過去にも興味が全くないですよ
352 :名無しさん@お腹いっぱい。 :2024/03/24(日) 02:26:23.04 .net >>349 WARPでアーカイブしてるよ https://warp.da.ndl.go.jp/
353 :名無しさん@お腹いっぱい。 :2024/03/24(日) 13:22:02.87 .net >>352 これ特許庁自体は保存されてるけど、参考文献URLまで保存されてるってどこかに書いてある?
354 :名無しさん@お腹いっぱい。 :2024/03/25(月) 09:41:34.78 .net https://archive.org/web/images/icon_savePage.png なぜか "Save Page Now" の前のアイコンが https://archive.org/about/404.html へリダイレクトされてしまっている。 sssp://o.5ch.net/22t26.png
355 :名無しさん@お腹いっぱい。 :2024/03/28(木) 12:58:45.39 .net 現在繋がらない?
356 :名無しさん@お腹いっぱい。 :2024/03/28(木) 13:00:30.23 .net 15分くらい前まで繋がってたけど今は繋がらないね、Temporarily Offlineだからメンテ中かな
357 :名無しさん@お腹いっぱい。 :2024/03/28(木) 13:39:19.92 .net ttps://twitter.com/textfiles/status/1773203790159565077 また停電だってよ去年もあったね (deleted an unsolicited ad)
358 :名無しさん@お腹いっぱい。 :2024/03/28(木) 14:33:39.21 .net 503エラーちょこちょこ出るけど、復帰したね乙でした
359 :名無しさん@お腹いっぱい。 :2024/03/28(木) 15:36:57.20 .net Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの? save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。
360 :名無しさん@お腹いっぱい。 :2024/03/29(金) 09:32:43.89 .net 詐欺紛いのサイトがアーカイブを徹底的に拒否しているのは笑える https://www.sotwe.com/DuceTCG
361 :名無しさん@お腹いっぱい。 :2024/03/29(金) 09:45:43.27 .net >>360 拒否してるのはサイトじゃなくてTwitterWebViewerの方だった。俺の勘違い
362 :名無しさん@お腹いっぱい。 :2024/03/29(金) 09:53:56.79 .net >>360 こっち見たらええやん https://x.com/DuceTCG
363 :名無しさん@お腹いっぱい。 :2024/04/01(月) 14:58:37.43 .net UAによって弾いてるぽい
364 :名無しさん@お腹いっぱい。 :2024/04/02(火) 02:31:48.54 .net imgur、画像の直リンは無理だとしても postpagebeta=0 というクッキーを食べたことにして こういうアーカイブを取れば行けるなぁ。 つまり capture_cookie パラメータを使用。 https://web.archive.org/web/1/imgur.com/EwuqXZU
365 :名無しさん@お腹いっぱい。 :2024/04/02(火) 02:48:58.54 .net これは失敗。 https://web.archive.org/web/1/imgur.com/sBfrwVv imgur でアダルト判定を食らった画像を表示させて "Yes, I'm over 18" をクリックしたときに追加されるクッキーの中に over18=1 ってのがあるけど、それも食べたことにすれば行けるかな。
366 :名無しさん@お腹いっぱい。 :2024/04/02(火) 02:59:57.86 .net おお、行けた行けた。 https://web.archive.org/web/1/imgur.com/fb5LVDx
367 :名無しさん@お腹いっぱい。 :2024/04/02(火) 15:12:43.62 .net SPNではできないやつ?
368 :名無しさん@お腹いっぱい。 :2024/04/02(火) 19:17:02.33 .net どうも postpagebeta=0 のクッキーだけ送っておけば、 リファラ無しの画像直リンでも OK っぽいな。 >>367 スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど 後者では入力できないパラメータを送る必要があるんだよね。 https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから 上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば たぶん保存できる。 https://pastebin.com/uEZ1Dbqi
369 :インターネットアーカイブ :2024/04/02(火) 23:58:17.49 .net >>368 サンクス。保存できたっぽい こんな荒技があったとは
370 :名無しさん@お腹いっぱい。 :2024/04/04(木) 04:15:40.02 .net >>368 保存できていたのに保存できなくなったぽい?
371 :名無しさん@お腹いっぱい。 :2024/04/04(木) 05:45:40.47 .net えっ https://web.archive.org/web/1im_/i.imgur.com/ASA6zDH.png
372 :名無しさん@お腹いっぱい。 :2024/04/04(木) 13:26:28.62 .net imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。 それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。
373 :名無しさん@お腹いっぱい。 :2024/04/05(金) 11:14:39.24 ID:F8qFxii7g 公明党竹谷とし子か゛女性の視点ガーだのほざいて女性健康研究ナショナ儿センタ−だの女性デジタル人材育成プランた゛のに莫大な税金投入 リスキリングって先端技術を学ぶわけて゛もなく小学生が独学でできることを税金使って教えてやれってんた゛からまさに特別支援学校 これが女性だというなら女性とは知的障害者の代名詞だろ 羞恥心もなくこんな逆差別主張を国会で平然とやるんた゛から女性は無能なクセに権利主張ばかりでコスパ悪いとレッテ儿貼られて当然 赤の他人に寄生して権利強奪することしか考えられないカタワの声が大きくなるに比例して日本社会が崩壊しているわけだが 日本全國クソ航空騒音まみれにして静音環境て゛なければ成り立たない知的産業壊滅させて生活に仕事に子の学習環境まで根絶やしにして 莫大な温室効果ガスまき散らさせて気候変動させて災害連発させて私腹を肥やしてるのか゛世界最悪の殺人違憲組織公明党強盜殺人の首魁 蓄財з億円超の斉藤鉄夫ら国土破壊省だし.腐敗集団自民党をここまで付け上がらせた諸悪の根源こそが公明党だと頭に刻み込もう! (ref.] ttрs://www.call4.jp/info.php?tуρe=items&id=I0000062 ttρs://haneda-projecT.jimdofree.com/ , ttps://flighΤ-rouтe.Com/ ttps://n-souonhigaisosyoudan.amebaownd.com/
374 :名無しさん@お腹いっぱい。 :2024/04/06(土) 22:10:26.61 .net Resources (ページ内画像等) としてアーカイブされた URL がカレンダ表示に登場するまでに 時間が掛かってる https://o.5ch.net/22wzg.png
375 :名無しさん@お腹いっぱい。 :2024/04/07(日) 12:36:44.17 .net APIでリファラも送れるようにしてくれないかな cookieやUAは送れるのにリファラは対応してないの何で?
376 :名無しさん@お腹いっぱい。 :2024/04/07(日) 16:46:14.94 .net 間違った転送先を保存してしまい何故か修正できないヤツ https://web.archive.org/web/20240407072915/https://i.imgur.com/UtKDI8X.jpeg アニメ絵と実写エロ注意
377 :名無しさん@お腹いっぱい。 :2024/04/07(日) 17:16:13.24 .net 大文字小文字違いかw uTKdi8x UtKDI8X
378 :名無しさん@お腹いっぱい。 :2024/04/08(月) 16:06:38.65 .net archive.today 数日前からX(旧Twitter)のアーカイブできなくなってる?
379 :名無しさん@お腹いっぱい。 :2024/04/09(火) 18:51:29.66 .net >>378 自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。
380 :名無しさん@お腹いっぱい。 :2024/04/10(水) 21:37:00.24 .net 404だ
381 :名無しさん@お腹いっぱい。 :2024/04/14(日) 14:05:36.49 .net Not Found The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
382 :アーカイブ :2024/04/15(月) 06:08:58.29 .net またイモグラ保存できなくなったんじゃないだろうな もうイモグラは使わないでくれ
383 :名無しさん@お腹いっぱい。 :2024/04/15(月) 11:30:27.65 .net ふむふむ https://web.archive.org/web/1im_/i.imgur.com/x0kLEHW.png
384 :アーカイブ :2024/04/15(月) 14:34:30.98 .net OutLinksを使うと保存できてる時もあるっぽいな。 これが原因か?
385 :アーカイブ :2024/04/15(月) 16:54:08.33 .net いや関係無いっぽいな。 試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。 取れる画像と取れない画像があるのか?
386 :名無しさん@お腹いっぱい。 :2024/04/15(月) 21:48:34.29 .net ゲッ、いつの間に同一URLの保存回数が一日5回までに減ってやがる… https://web.archive.org/web/0im_/https://files.catbox.moe/xei3k9.PNG 19年の頃は保存回数制限もなく保存再開出来る時間も10分間隔だったんだがなぁ…
387 :名無しさん@お腹いっぱい。 :2024/04/15(月) 21:58:25.42 .net >>386 >>305-308 さらに少なく、一日一回だけに制限しているホストもあるからね。
388 :アーカイブ :2024/04/16(火) 08:03:08.50 .net 保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。
389 :名無しさん@お腹いっぱい。 :2024/04/17(水) 02:34:56.23 .net 自分がアーカイブを取ってるサイトは大概 1 回だけなんだよなぁ。 https://o.5ch.net/22bkm.png
390 :名無しさん@お腹いっぱい。 :2024/04/19(金) 22:35:13.33 .net そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。 そもそもあいつの資金源どうなってんだ?
391 :名無しさん@お腹いっぱい。 :2024/04/19(金) 22:39:26.28 .net 運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。 国を出ないなら、このまま吹き飛びそうだな。
392 :名無しさん@お腹いっぱい。 :2024/04/20(土) 13:11:21.35 .net 【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか 拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される 画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません gyazo.com/2dea0146024edc6952878c8d25b9b572
393 :名無しさん@お腹いっぱい。 :2024/04/20(土) 13:57:11.01 .net Wayback machineで除名を申し入れされたとして、 それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ? そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
394 :名無しさん@お腹いっぱい。 :2024/04/20(土) 13:57:11.53 .net Wayback machineで除名を申し入れされたとして、 それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ? そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
395 :名無しさん@お腹いっぱい。 :2024/04/20(土) 15:31:34.61 .net >>392-394 アホー知恵袋にでも行って質問なさい、おじいちゃん https://chiebukuro.yahoo.co.jp/
396 :名無しさん@お腹いっぱい。 :2024/04/23(火) 19:37:25.85 .net アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。
397 :名無しさん@お腹いっぱい。 :2024/04/23(火) 20:04:37.85 .net >>396 「アーカイブ」ってまだちゃんと覚えてられてるんだw >>130-131
398 :名無しさん@お腹いっぱい。 :2024/04/29(月) 03:17:02.51 .net あー重い重い
399 :名無しさん@お腹いっぱい。 :2024/04/29(月) 19:58:05.90 .net ttps://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草 検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる
400 :アーカイヴ :2024/04/30(火) 22:20:03.49 .net さっきまでめっちゃ調子よかったのに503
401 :名無しさん@お腹いっぱい。 :2024/04/30(火) 22:42:01.31 .net てかメンテの表示出てるじゃん。今夜はもう無理かな。 >>392 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。 >>393-394 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの? >>396 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。 削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。 >>397 てか>>130 で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
402 :名無しさん@お腹いっぱい。 :2024/04/30(火) 22:42:04.16 .net てかメンテの表示出てるじゃん。今夜はもう無理かな。 >>392 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。 >>393-394 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの? >>396 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。 削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。 >>397 てか>>130 で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
403 :名無しさん@お腹いっぱい。 :2024/04/30(火) 22:49:38.87 .net >>388 そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。 確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。
404 :名無しさん@お腹いっぱい。 :2024/05/02(木) 16:55:42.41 .net >>402 130の動画なら保存されてるのでは? youtubecrawlのコレクションに入ってるが
405 :名無しさん@お腹いっぱい。 :2024/05/04(土) 11:12:18.18 .net Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど 繋がらないんだよね・・・コード 0xF2 のエラーが返る https://archive6zg5vrdwm4ljllgxleekeoj43lqayscd4d4kmhnyblq4h3ead.onion/ https://o.5ch.net/2348e.png
406 :名無しさん@お腹いっぱい。 :2024/05/04(土) 12:01:16.02 .net またメンテか 次はいつ復旧するのやら
407 :名無しさん@お腹いっぱい。 :2024/05/04(土) 15:36:31.33 .net >>404 今見てみたら、動画ファイルの保存まではできてないみたい。 確認用コード curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc" ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。 保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
408 :名無しさん@お腹いっぱい。 :2024/05/04(土) 15:36:33.70 .net >>404 今見てみたら、動画ファイルの保存まではできてないみたい。 確認用コード curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc" ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。 保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
409 :アーカイヴ :2024/05/05(日) 15:10:31.41 .net Save Page Now browser crashed on https://imgur.com/p5BPbjq.
410 :名無しさん@お腹いっぱい。 :2024/05/05(日) 16:04:43.50 .net 何回か連打してればバックグラウンドで保存に成功するケースが殆ど。 https://o.5ch.net/234ik.png
411 :名無しさん@お腹いっぱい。 :2024/05/06(月) 15:54:44.08 .net archive.todayってMicrosoftのサーバー経由してるのなんで? MSのサーバーをhostsで遮断したら保存できなくなった
412 :名無しさん@お腹いっぱい。 :2024/05/06(月) 21:39:08.18 .net >>7 quoraもサルベージできない
105 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★
本文 スレッドタイトル 投稿者