Save The Web Project – Telegram
Save The Web Project
重启了一个老项目,请帮忙跑 docker 容器。🌝操作步骤见 README,非常简单^^^。
新增了一个项目: acfunction,操作同上。
计分板: https://3.tracker.saveweb.org/stats/live/ukamnadca
注意:此项目以探测为主,所以 Archived Items 计数为 0 很正常。
又新增了一个项目:aixifan_videoinfo,操作同上
计分板: https://3.tracker.saveweb.org/stats/live/ofnioediv_nafixia
注:由于会漏内存,所以此容器每 3h 会自动重启。
😁132
接下来开什么新坑好呢?
https://archive.org/search?query=subject%3Awikiteam3&sort=-date

庆祝!wikiteam3 已存档了 30k 份各种 MediaWiki 站。
🥰2
STWP 2025 第 39 至第 42 周周报

- 修了 dokuwikidumper 子线程挂起问题。
- @IceCodeNew 牛马打包 lowapk, acdanmaku, aixifan_videoinfo
- tracker 的任务元数据迁到 mongodb
- tracker 添加黑名单、实时事件功能
- 任务生成器改成了读配置文件,自动跑
- 各 warrior 加上了 pyroscope
- @Ovler 修了 biliarchiver 向 i18n format string {:.2f} 传入 0 会爆炸的妙妙问题。
- @OverflowCat 🐱开了个代号为 c2025-6 的项目,这是一个用 user.js 存某网站的实验性项目,这猫不让我公开这个项目,订户可以考虑 py 一下猫(比如送猫一台华为 MateBook Pro 鸿蒙PC),看这猫愿不愿意让你参与。🤪
- @waterwhiter 浅浅地给丑搜更了依赖。
Please open Telegram to view this post
VIEW IN TELEGRAM
4
STWP 2025 第 43 周周报

无。
11🕊5💩4
有什么好方法/API批量删除(dismiss)这些已被封号的 spam 账户的 join requests 吗?
不胜其扰。
#事故

{box,search}.saveweb.org 数据丢失&回滚。

有心的朋友可能发现丑搜 (search) 的搜索索引停留在了上个月19 号,这是因为……

(box) 跑在一台遗留的 vps 上,半年前由于服务商的问题(服务商后台被骇了),被挂马,我就轮换了下 restic 的密钥,但是忘了更新这台机子的环境变量了。

上个月 20 号,我寻思这机子上没有东西了,就不续费让它自行删机。

29 号才发现出锅了,悲。那为啥删机后这么久都没发现呢?没加监控……

---

幸好丑搜的数据还在,接下来准备用丑搜的数据来查漏补缺,能补多少算多少。

以后一定用正经的 resticprofile+prometheus+grafana 跑自动备份+备份状态监控,再也不在 crontab 里写一行 restic backup 就了事了。

⚰️⚰️⚰️⚰️⚰️⚰️⚰️
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯1252🤡1
Forwarded from tacwolfrevo
☺️☺️😊☺️🤨😳🙁🥺
😄还是那句话跟着👍🌉STWP项目拉满 主打的就是存档❤️新风口  新机会 安全稳定😀大家要把握好机会😀😀😌😀😀😀😃

1️⃣🏠🌉🅰️💦🔝⬆️⬅️➡️因为最近太忙没有充足的时间给大家更新爬虫 请大家理解🥺
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥151🥰1
https://wikikeeper.saveweb.org/

两天,消耗了两亿两千万 GLM-4.7 Tokens 造出的 「wikiapiary」替代品:WikiKeeper。

不过 vibe 过程完全不能做到无人值守,需要不断给它喂领域知识给提示,不然它会死钻牛角尖出不来。

主要就两个功能:

- 能看简单的页面、编辑数、活跃用户随时间变化的图。
- 索引 wiki dump

目前正在追踪 81,780 个 MediaWiki 站点的数据。
("Archived" 这项数据还在缓慢同步中,目前同步了 7k 多个 wiki)

如果没有收录,可以自行添加。
2026 新年好,
首先感谢 永祥老师 @liangyongxiang 从 2023-05 以来一直让我们白嫖一台 Hetzner 的 AX41-NVME 服务器,它长期以来是我们的主服务器。
现在俺有🍚了,不能一直白嫖永祥的。该服务器已于今日转移到俺账号下,今后由俺支付账单。
感谢 永祥过去三年的大爆米!
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍3😭3