Save The Web Project – Telegram
Save The Web Project
为了 STWP 不长期咕咕咕🌚,我们将每周发布项目进展简讯。 --- 第 14 周项目摘要。 20230401 ~ 20230403: @jsun969 在尝试给 uglysearch.othing.xyz 写前端:https://github.com/saveweb/saveweb-search-frontend 20230405: saveweb/review-2022 收录 +1 20230403 ~ 20230406: * 播客存档项目开工,写存档工具:https://github.co…
#丑搜 #搜索引擎 #博客

> 什么,你不知道“丑搜”?这是一个索引了 133k+ 篇中文独立博客文章的搜索引擎。

🤗

由于半年前的一次服务器存储告急,为了腾空间就把丑搜的全文索引数据库删了。于是丑搜宕了快半年了……咕咕咕。

昨天重写了后端以及工作流,又捡起 @jsun969 去年给丑搜写的“新”前端,改进了下让它再次上线,现在它不丑了.jpg。或许不能再叫它丑搜了。

https://search.saveweb.org

* 加了查看快照的功能
* 可以实时更新数据库全文索引了(为防垃圾站瞬发投毒,暂不启用实时索引)
* 可按文章发布时间排序(前端还未实现)
* [NOTE]: 新前端还没做打字机模式

原丑搜还留着,目前充当 API: https://search-api.saveweb.org
👍10🥰3
降本增效中……(砍掉几台多余的服务器,每月省 200¥)

- 丑搜,暂关。
- @code_arxiv_bot ,暂关
- biliarchiver API ,暂关
- bilibili 新 item 通知频道,暂关
- blog.save-web.org ,将迁移
- 旧的互联网公墓 wiki,将合并到 wiki.saveweb.org
🤯15🔥2😁2👍1
https://github.com/keirf/greaseweazle/wiki/Blue-Pill-Adapter

准备做两三个 greaseweazle F1 (Blue Pill Adapter) 用于软盘存档项目(磁通量级别地读取软盘原始数据)。在嘉立创打了 25 片 F1 的 PCB,多余的二十多片板子闲着也是闲着。

这里有人要 greaseweazle F1 吗?参与软盘存档,领。

<https://news.1rj.ru/str/saveweb_projects/115>
🤯2
“开源中国”半年多前把 https://osdn.net 收购了,但是收购了之后啥动作也不做,各种服务都快宕完了。
人家日本用户全都跑光了(都宕机大半年了,不跑不是人)。

看不懂这波操作。
🤣16🤮2👍1
# 我们不再存档萌百

去年年后,存档萌娘百科就变得愈发困难。
萌百的 WAF 不断升级,不断推出新的奇葩反爬方式,存档所需的 API 也都关了。

且萌百还对其它镜像站项目做了针对性反爬。
现在已经是军备竞赛了。 wikiteam3 这一通用工具已不能存档萌百。

https://archive.org/details/wiki-zh.moegirl.org.cn-20230814 是我们打的最后一份 wikidump,除非未来萌百主动放宽访问限制,我们应该不会做新的 wikidump 了。

注:网站设置内容墙并不违反 CC BY-NC-SA 3.0
🙏14🤨7😢3
Save The Web Project
现在我们可为画吧的画师提供备份导出。 流程见: https://wiki.saveweb.org/画吧:takeout
尝试跟画吧合作为画师提供作品备份。但与画吧老板交涉无果,谈着谈着他就不回消息了。

非常可惜,截至目前我们只给3位画师提供了备份。
👍3
某仙人炫的两张图,现在 CC0 下公布。匿了。
🥰12
多年前,🌽🦊说要学习 ArchiveTeam ,建立 STWP 自己的 Tracker、Warrior 。

但是两年了,经过反复鞭尸催促,三个 repos 里还是只有 README.md.gitignore 和一个幻想出来的 apidoc/server.yml

近日多个项目需要分布式爬网,1️⃣🌉只好整了一个简单的 Tracker 出来。

https://github.com/saveweb/solar_tracker

半个月后就是五四青年节啦,敬告各位青年,不要学习🌽🦊
🐳13🥰4😁2
胆汁胆汁~永远不会变质~~
🤣15
Forwarded from 下课铃
中国互联网出现到现在刚好 30 年。30 年后又是什么样子
pip(x) install https://static.saveweb.org/lowapk_v2-2.0.3-py3-none-any.whl
lowapk_v2


WE NEED YOUR HELP, THIS IA A LONG TERM PROJECT.

ETA: 6000h
追不上,根本追不上。
😁72
pip(x) install https://static.saveweb.org/huashijie-1.0.1-py3-none-any.whl
huashijie_work


画世界。与上条消息是不同的项目,可与上面那个可以同时跑。(但单个项目不要多开)
源码: https://github.com/saveweb/huashijie_work
非常神奇啊,目前已知四位朋友各自给 lowapak 和 huashijie 打了 docker image。(两个项目的活跃节点加起来才 49 个,果然朋友们人均 Docker 大师

目前,经过激烈角逐,DigitalDragon 打的 images 胜出!

https://hub.docker.com/r/digitaldragons/saveweb-huashijie (49.93 MB)
https://hub.docker.com/r/digitaldragons/saveweb-lowapk (55.94 MB)

欢迎各位有赛博洁癖的朋友继续挑战 Docker 的下限!