Save The Web Project
大家好,经过两个月的摸鱼开发(特别感谢 @MistyNya 😂),我们将开始存档 MediaWiki 以及 DokuWiki 站点。 如果您知道一些 wiki 站点,请在评论区扔链接。中文站优先。 存档工具是在前人的基础上改进/开发的,以GPLv3开源,分别为: MediaWiki: https://github.com/mediawiki-client-tools/mediawiki-scraper/ (又名 wikiteam3 ) https://github.com/saveweb/wikiteam3…
https://github.com/saveweb/pukiwiki-dumper
用于存档 PukiWiki 的 PukiWiki-Dumper 写好了。使用方法与 DokuWiki-Dumper 类似,欢迎使用。
频道里的大家肯定都不是直接的目标用户,估计您根本没听说过这个 Wiki 系统。
#PukiWiki #Japanese
<https://news.1rj.ru/str/saveweb_projects/16875>
用于存档 PukiWiki 的 PukiWiki-Dumper 写好了。使用方法与 DokuWiki-Dumper 类似,欢迎使用。
频道里的大家肯定都不是直接的目标用户,估计您根本没听说过这个 Wiki 系统。
#PukiWiki #Japanese
<https://news.1rj.ru/str/saveweb_projects/16875>
GitHub
GitHub - saveweb/pukiwiki-dumper: A tool for archiving PukiWiki
A tool for archiving PukiWiki. Contribute to saveweb/pukiwiki-dumper development by creating an account on GitHub.
👀2
Save The Web Project
我们预计春节后可以向画吧画师提供个人绘画作品备份导出。
现在我们可为画吧的画师提供备份导出。
流程见: https://wiki.saveweb.org/画吧:takeout
流程见: https://wiki.saveweb.org/画吧:takeout
👍4
🤣16🤮2👍1
# 我们不再存档萌百
去年年后,存档萌娘百科就变得愈发困难。
萌百的 WAF 不断升级,不断推出新的奇葩反爬方式,存档所需的 API 也都关了。
且萌百还对其它镜像站项目做了针对性反爬。
现在已经是军备竞赛了。 wikiteam3 这一通用工具已不能存档萌百。
https://archive.org/details/wiki-zh.moegirl.org.cn-20230814 是我们打的最后一份 wikidump,除非未来萌百主动放宽访问限制,我们应该不会做新的 wikidump 了。
注:网站设置内容墙并不违反 CC BY-NC-SA 3.0
去年年后,存档萌娘百科就变得愈发困难。
萌百的 WAF 不断升级,不断推出新的奇葩反爬方式,存档所需的 API 也都关了。
且萌百还对其它镜像站项目做了针对性反爬。
现在已经是军备竞赛了。 wikiteam3 这一通用工具已不能存档萌百。
https://archive.org/details/wiki-zh.moegirl.org.cn-20230814 是我们打的最后一份 wikidump,除非未来萌百主动放宽访问限制,我们应该不会做新的 wikidump 了。
注:网站设置内容墙并不违反 CC BY-NC-SA 3.0
zh.moegirl.org.cn
萌娘百科 万物皆可萌的百科全书 - zh.moegirl.org.cn
🙏14🤨7😢3
Save The Web Project
现在我们可为画吧的画师提供备份导出。 流程见: https://wiki.saveweb.org/画吧:takeout
尝试跟画吧合作为画师提供作品备份。但与画吧老板交涉无果,谈着谈着他就不回消息了。
非常可惜,截至目前我们只给3位画师提供了备份。
非常可惜,截至目前我们只给3位画师提供了备份。
👍3
多年前,🌽🦊说要学习 ArchiveTeam ,建立 STWP 自己的 Tracker、Warrior 。
但是两年了,经过反复鞭尸催促,三个 repos 里还是只有
近日多个项目需要分布式爬网,1️⃣🌉只好整了一个简单的 Tracker 出来。
https://github.com/saveweb/solar_tracker
半个月后就是五四青年节啦,敬告各位青年,不要学习🌽🦊!
但是两年了,经过反复鞭尸催促,三个 repos 里还是只有
README.md、.gitignore 和一个幻想出来的 apidoc/server.yml 。近日多个项目需要分布式爬网,1️⃣🌉只好整了一个简单的 Tracker 出来。
https://github.com/saveweb/solar_tracker
半个月后就是五四青年节啦,敬告各位青年,不要学习🌽🦊!
🐳13🥰4😁2
pip(x) install https://static.saveweb.org/lowapk_v2-2.0.3-py3-none-any.whl
lowapk_v2
WE NEED YOUR HELP, THIS IA A LONG TERM PROJECT.
ETA: 6000h
追不上,根本追不上。
😁7❤2
pip(x) install https://static.saveweb.org/huashijie-1.0.1-py3-none-any.whl
huashijie_work
画世界。与上条消息是不同的项目,可与上面那个可以同时跑。(但单个项目不要多开)
源码: https://github.com/saveweb/huashijie_work
GitHub
GitHub - saveweb/huashijie_work
Contribute to saveweb/huashijie_work development by creating an account on GitHub.
非常神奇啊,目前已知四位朋友各自给 lowapak 和 huashijie 打了 docker image。(两个项目的活跃节点加起来才 49 个,果然朋友们人均 Docker 大师 )
目前,经过激烈角逐,DigitalDragon 打的 images 胜出!
https://hub.docker.com/r/digitaldragons/saveweb-huashijie (
https://hub.docker.com/r/digitaldragons/saveweb-lowapk ()
欢迎各位有赛博洁癖的朋友继续挑战 Docker 的下限!
目前,
https://hub.docker.com/r/digitaldragons/saveweb-huashijie (
49.93 MB)https://hub.docker.com/r/digitaldragons/saveweb-lowapk (
55.94 MB准备5月4日开一个名为 Dig The Web 的 CTF 欢乐赛。(以庆祝 STWP 3周年,2333)
开个投票看看有多少人有兴趣来玩?人少的话就算了。
开个投票看看有多少人有兴趣来玩?人少的话就算了。
Anonymous Poll
60%
可
40%
不来
Save The Web Project
Niconico 的页游发布平台 Game Atsumaru 将在18小时后关闭, > 希望寻求有带宽、储存条件的志愿者们帮忙操作存档脚本: https://github.com/yts98/game-atsumaru-discovery > 有懂爬取 Unity 的大佬吗?或是跟 Akashic Engine、TyranoBuilder、GameMaker Studio、Tonyu System、Visual Novel Maker打过交道的? > 能帮忙的人愈多愈好。 by @yth98 详情及讨论请至:…
#寻人启事
坏消息, yts98 失踪了(GitHub/IRC/Telegram 已半年未见他上线/活动),并且他还没有将归并后 1.4TB 的 Game Atsumaru 的 warc 上传 IA。
因此,如果 yts98 未来不回来的话,我们可能失去了这部分数据。
———
- 当时 yzqzss 负责的 ID 段的数据在传给 yts98 一个月后就删了。
- 来自 ArchiveTeam 的 thuban 他的本地还有 221GB 数据。(正在上传 IA)
- 当时参与存档项目的 matatabi 和 threedeeitguy 两位还在吗?如果你们本地还保留着当时的 warc 的话就好了。
坏消息, yts98 失踪了(GitHub/IRC/Telegram 已半年未见他上线/活动),并且他还没有将归并后 1.4TB 的 Game Atsumaru 的 warc 上传 IA。
因此,如果 yts98 未来不回来的话,我们可能失去了这部分数据。
———
- 当时 yzqzss 负责的 ID 段的数据在传给 yts98 一个月后就删了。
- 来自 ArchiveTeam 的 thuban 他的本地还有 221GB 数据。(正在上传 IA)
- 当时参与存档项目的 matatabi 和 threedeeitguy 两位还在吗?如果你们本地还保留着当时的 warc 的话就好了。
😢11👍3
Save The Web Project
🎉🎂 Save The Web Project 两岁啦! 大家有什么想说的吗?或者希望我们接下来做哪些方面的工作?😀
🎉🎂 Save The Web Project 三岁啦!
大家有什么想说的吗?或者希望我们接下来做哪些方面的工作?😀
大家有什么想说的吗?或者希望我们接下来做哪些方面的工作?😀
🥰12👍3
Save The Web Project pinned «🎉🎂 Save The Web Project 三岁啦! 大家有什么想说的吗?或者希望我们接下来做哪些方面的工作?😀»