最近、消えたサイトがInternet Archiveにある率がすこぶる低い どうすんのこれ

1 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:46:43.34 ID:C6HY376i0

https://archive.org

2 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:47:39.14 ID:198Oytbl0
あれって自動でクロールしてんの?
それとも誰かが手動でやってんの?
23 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:07:46.16 ID:v4mOKkvI0
>>2
手動でもできるよ
Chrome用の拡張もあるから使うと便利。ボタンポチで保存できる
25 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:10:58.46 ID:dbf9O44m0
>>2
手動でやってリンクだけクロールするすっげえ雑な仕様
ただ手動でポチったタイミング分全部ちゃんと保存されてるのは便利
3 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:49:11.56 ID:DffdJgzx0
インターネットは思ったよりポンコツだったな
やっぱ紙媒体が最強
4 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:49:13.50 ID:vs0Q8iPD0
昔からチマチマ保存してるが俺の趣味の範囲だけだしな
大事なサイトは自分で保存しろよ
5 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:52:32.30 ID:C6HY376i0

しかも、時間によってアクセス数に制限が設けられたようだ
6 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:52:42.54 ID:eP9RA9m6r
wikipediaと同じで資金不足らしい
リソースがないから最近は自動クロールも控え目だとか
7 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:53:26.89 ID:eP9RA9m6r
個人的にはwikipediaに投げ銭するくらいならこっちに寄付してやって欲しいくらいだが
8 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:53:37.48 ID:C6HY376i0
マイニングみたいに
有志のパソコンをリソースにできないの?
9 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:54:49.35 ID:LwilgyzX0
SafariのInternet Archive機能拡張が404を検知するとアーカイブ見る?ってゴリ押しして来て若干ウザい
追跡ブロック機能でアクセスできないだけなのに頻繁に出てくる
設定画面もないし
10 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:55:23.81 ID:1gNy5VPTd
寄付してやれよ
飯塚pediaなんかよりよっぽどいいだろ
14 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:57:56.86 ID:4oVT44qJ0
>>10
そもそも民間の寄付に依存しながら維持できるような規模のプロジェクトじゃねーだろ
11 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:56:03.43 ID:Umqt75wL0
記事をスクリプトで表示しているのもあるかも
13 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:57:47.95 ID:tyiSnfYu0
時系列毎に保存してるの見てこんなん続くわけないとは思った
15 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:58:39.45 ID:C6HY376i0
P2Pじゃダメなの?
16 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 02:58:56.44 ID:Umqt75wL0
魚拓方式にすればいいのに
17 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:00:12.34 ID:C6HY376i0
>>16
7年前に試したけど
アクセスするとクロールするっぽいよ
18 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:00:38.38 ID:vs0Q8iPD0
動画とか巨大ファイル弾くだけでもかなり負荷は減るだろーにな
19 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:01:29.72 ID:C6HY376i0
クロールしていないだけじゃなく
消されているのも多数ある模様
20 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:01:58.02 ID:EDiTp0Er0
古き良きページランクアルゴリズムで良くリンクされてるページは残す、みたいなもんはできないんだろか?🤔
って思ったけど、最近リンクを辿るってあんま無いな
21 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:03:15.85 ID:JGs2uoq10
いまとなっては誰も覚えていないWinnyとかのほうが
データの保存性は高いように思える
サーバに頼らない方式だから不確実性も高いが
22 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:05:11.04 ID:LLwXqUhka
電子の海で永遠になんて幻想だったな
24 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:09:18.98 ID:KCYK7R6E0
保存されるのを拒否してるサイト?の闇の深さ
26 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2020/12/30(水) 03:14:52.25 ID:PB5BYN3Q0
消えたサイトが多すぎるからな
NAVERだけで180万記事も消えたんだぞ

コメント

タイトルとURLをコピーしました