强制存档网站拿起这个方便的工具网页

网站档案服务,如互联网档案:Wayback机器是非常有用的,当你需要看到旧版本的网站,无论是怀旧或因为你正在寻找一个特定的信息位,已被改写或删除(如一个故事,你写的前雇主,例如)。...
Illustration for article titled Force Archive Websites to Pick up Webpages with This Handy Tool

网站档案服务,如互联网档案:Wayback机器是非常有用的,当你需要看到旧版本的网站,无论是怀旧或因为你正在寻找一个特定的信息位,已被改写或删除(如一个故事,你写的前雇主,例如)。

然而,这些服务并不完美。有时,存档站点可能无法创建站点的快照—通常是在您最需要快照的时候。或者有人配置了他们站点的robots.txt文件来阻止存档服务执行自动爬网。没有乐趣。

多亏了主板上的一个新工具,您现在可以尝试同时跨三个不同的归档服务归档站点的当前版本:Wayback Machine、archive.is和Perma.cc(如果您已经为它们设置了免费帐户)。

安装主板的归档实用程序需要一点腿部工作,但也不太棘手。您首先需要安装Python的requests、json和archiveis模块,这些都是主板的mass\u归档工具工作所必需的(唉,这不仅仅是一些简单的可执行文件或实用程序,你可以运行。)安装它们和json的最好方法是先安装pip,然后用它来下载模块。您可以在这里找到archiveis,也可以使用pip安装它。

您还需要从前面提到的GitHub项目中获取mass\u archive.py脚本。准备好后,在macOS或Linux中调出一个终端并键入以下内容(显然,将example.com替换为您要存档的网站):

python mass\u archive.py example.com

如果在Windows中通过提升的命令提示符使用Python,那么可以从代码中省略初始的“Python”。

  • 发表于 2021-05-15 02:21
  • 阅读 ( 81 )
  • 分类:互联网

你可能感兴趣的文章

18个你想了解的小而有用的macos功能

... 8强制查找器中大小相等的列 ...

  • 发布于 2021-03-12 01:49
  • 阅读 ( 247 )

如何创建自己的私有自托管ReadItLater应用程序

...出现。如果您不能承受丢失这些内容的代价,可以使用web存档工具来存储网页的副本。 ...

  • 发布于 2021-03-19 09:29
  • 阅读 ( 302 )

如何清洁和整理你的trello板:5个简单的提示

... 1存档旧板 ...

  • 发布于 2021-03-22 15:21
  • 阅读 ( 349 )

如何管理你的数字文件:9个提示和工具,让你有条理

... 除非你是一个强制性的组织者和标签,以及把每个文件正确地放在你的驱动器,有一个很好的机会,你花了太多的时间只是搜索他们。为了获得更好的体验,可以尝试在云中以及本地存...

  • 发布于 2021-03-23 10:14
  • 阅读 ( 232 )

七大最佳在线rar提取器

... 1b1在线存档 ...

  • 发布于 2021-03-25 08:53
  • 阅读 ( 332 )

如何在chrome中管理自定义缩放级别

... Chrome还具有强制缩放功能。但你知道吗,你可以设置自定义缩放水平为每个网页与一点的工作? ...

  • 发布于 2021-03-26 13:32
  • 阅读 ( 275 )

如何硬刷新web浏览器(绕过缓存)

...的信息。要解决这个问题,很容易使用简单的键盘快捷键强制浏览器完全重新加载页面的本地副本(缓存)。下面是如何做到这一点。 什么是浏览器缓存(a browser cache)? 为了加快浏览速度,web浏览器将网站数据的副本保存为一...

  • 发布于 2021-04-02 04:04
  • 阅读 ( 250 )

如何在googlechrome的每个网站上强制使用暗模式

Chrome78有一个新的窍门。它可以在你访问的每个网站上强制启用黑暗模式,结束你漂亮的黑暗桌面上那些令人眼花缭乱的白色背景。 更新:从chromeos78开始,这个标志显然在chromeos上引起了严重的问题。如果你正在使用Chromebook,...

  • 发布于 2021-04-03 00:32
  • 阅读 ( 220 )

如何整理网页浏览器书签

...。您的书签可以变得更紧凑,更容易识别一眼。 将网页存档,而不是为其添加书签 如果你真的发现自己在书签中记下了一些东西,可以考虑把所有这些东西都放在一个特定的文件夹里,就像一个书签的“收件箱”。每隔几周浏...

  • 发布于 2021-04-04 00:35
  • 阅读 ( 186 )

如何在网页关闭时访问它

...存页”以查看Bing缓存中的副本。 方案二:回程机 Internet存档的回程机还允许您查看网页的旧副本。在Google缓存只提供一个最近缓存副本的地方,Wayback机器提供了一个web页面的多个旧版本,可以更进一步地返回,这样您可以看...

  • 发布于 2021-04-07 22:46
  • 阅读 ( 82 )
fy7jj2765
fy7jj2765

0 篇文章

相关推荐