用这个开源工具从任何网站获取变化提醒
创始人
2024-03-02 12:54:38
0

使用 changedetection.io 在网站发生变化或更新时获得提醒。

那一年是 2020 年,关于大流行病的消息迅速涌来,每个人都感到完全被类似的新闻文章所淹没,提供了不同程度的更新。

但我需要知道的是,我们的官方准则何时改变。最后,这就是对我来说最重要的事情。

无论关注的是大流行病还是最新的科技新闻,提前了解网站内容的变化都至关重要。

changedetection.io 项目为网站变更检测和通知提供了一个简单但强大的开源解决方案。它很容易设置,而且可以通知 70 多个(还在不断增加)不同的通知系统,如 Matrix、Mattermost、NextcloudSignalZulipHome Assistant、电子邮件等等。它还能通知专有应用,如 Discord、Office365、Reddit、Telegram 和许多其他应用。

但 changedetection.io 并不只是局限于观察网页内容。你也可以监视 XML 和 JSON 源,它将建立一个 RSS 馈送,记录变化的网站。

由于其内置的 JSON 简单存储系统,不需要设置复杂的数据库来接收和存储信息。你可以 使用 Docker 镜像运行 或用 pip 安装它。该项目有一个 全面的维基帮助页,大多数常见的问题都有涵盖。

对于使用复杂 JavaScript 的网站,你可以用内置的 Playwright 内容获取器 将你的 changedetection.io 连接到 Chromium 或 Chrome 浏览器。

运行后,在你的浏览器(默认情况下是 http://localhost:5000)中访问该应用。如果你的电脑可以从外部网络访问,你可以在 设置 Settings 中设置一个密码。

change detection watch list

提交你想监控的页面的 URL。有几个与如何过滤该网页有关的设置。例如,你很可能不想知道一家公司在其网站页脚列出的股票价格何时发生变化,但你可能想知道他们在其博客上发布的新闻文章。

监控一个网站

想象一下,你想添加你最喜欢的网站 Opensource.com 进行监控。你只想知道主要标注文章何时包含 “python” 一词,并且通过 Matrix 收到通知。

要做到这点,首先要使用“ 视觉选择器 Visual Filter Selector ”工具。(这需要连接 playwright 浏览器界面)。

Find an element to monitor

该工具会自动计算出针对内容的最佳 Xpath 或 CSS 过滤器。否则,你会从每天的页面更新中得到大量的噪音。

接下来,访问“ 过滤器和触发器 Filters & Triggers ”标签。

Filters and triggers

在 “ CSS/JSON/XPATH 过滤器 CSS/JSON/XPATH Filter ”区域(蓝色圆圈),你可以看到上一步自动生成的 CSS 过滤器。

有几个有用的过滤器,比如“ 移除元素 Remove elements ”(适合移除嘈杂的元素)、“ 忽略文本 Ignore text ”、“ 触发/等待文本 Trigger/wait for text ”,和“ 如果文本匹配则阻止变化检测 Block change-detection if text matches ”(用于等待一些文本消失,如“售罄”)。

在“ 触发/等待文本 Trigger/wait for text ”(红色圆圈)中,输入你想监测的关键词。(在这个例子中是 “python”)。

最后一步是在“ 通知 Notifications ”选项卡中,你要在那里配置你想收到的通知。下面我使用 Matrix API 添加了一个 Matrix 房间作为通知目标。

Notifications tab

通知的 URL 的格式是 matrixs://username:password@matrix.org/#/room/#room-name:matrix.org

然而,t2Bot 格式也支持。这里有更多的 Matrix 通知选项

就是这些了! 现在只要内容有变化,你就会通过 Matrix 收到信息。

还有更多

changedetection.io 还有很多东西。如果你喜欢调用一个自定义的 JSON API,你不需要使用通知的 API(使用 jsons:// )。你还可以创建一个自定义的 HTTP 请求(POST 和 GET),在检查前执行 JavaScript(也许是为了预先填充一个用户名和密码的登录字段),以及更多有趣的功能,更多的功能将陆续推出。

不要再浏览网站,而是开始监测网络吧!

图片提供:(Leigh Morresi, CC BY-SA 4.0)


via: https://opensource.com/article/22/9/changedetection-io-open-source-website-changes

作者:Leigh Morresi 选题:lkxed 译者:geekpi 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

用这个开源工具从任何网站获...
使用 changedetection.io 在网站发生变化或更新时...
2024-03-02 12:54:38

热门资讯

Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
Epic 游戏商店现在可在 S... 现在可以在 Steam Deck 上运行 Epic 游戏商店了,几乎无懈可击! 但是,它是非官方的。...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
从 Yum 更新中排除特定/某... 作为系统更新的一部分,你也许需要在基于 Red Hat 系统中由于应用依赖排除一些软件包。如果是,如...
通过 SaltStack 管理... 我在搜索Puppet的替代品时,偶然间碰到了Salt。我喜欢puppet,但是我又爱上Salt了:)...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
Opera 浏览器内置的 VP... 昨天我们报道过 Opera 浏览器内置了 VPN 服务,用户打开它可以防止他们的在线活动被窥视。不过...
如何检查你的 Linux 系统... 不知道在使用哪个初始化系统?以下是方法。每个主流 Linux 发行版(包括 Ubuntu、Fedor...