Save The Web Project – Telegram
#新闻 #Miraheze #MediaWiki

Miraheze (一家非营利的 MediaWiki 农场)决定关站。
https://meta.miraheze.org/wiki/Board/Policies/20230615-Statement


## 时间表:

目前~:停止新 Wiki 的注册
~2023-08-31: 仍可访问和编辑 Wiki。
~2023-09-01: 关站,从数据中心下线。

## 备份:

Miraheze 表示只要资金允许,会无限期按照要求提供全部 wiki 的全部备份,并且提供如何访问这些备份的信息。
用户可以在 Special:DataDump 下载 XML dump,但是图片等媒体资源的备份需要开工单请求(?)。

## 事发原因

似乎是社区/团队内部问题,与资金关系不大(?):
https://mastodon.social/@miraheze/110506683712194935
😢8
Save The Web Project
https://bcy.net/item/detail/7243752692219124791 半次元 将于 2023/07/12 停服 正在紧急存档…… !!! 半次元存档项目群已开 !!!: https://news.1rj.ru/str/saveweb_projects/319 #FourDimensions
#请求帮助

我们想抽样测试一下我们已经爬取到的内容占全站的比例。(覆盖率)

如果您是半次元用户,请在本条消息的评论区留言,我们想通过您的点赞/喜欢列表来做抽样。非常感谢!

#半次元 #banciyuan #wuciyuan #FourDimensions
# STWP 2023 第 25 周周报

## 第 25 周项目摘要

### 萤火圈

> 已为 5 位萤火圈用户提供了个人公开数据备份。

### 半次元

> 半次元全部图片已下载完毕,总量 95 TB;source
> 半次元存档状态见 here by @MistyNya

### 播客

> 尝试使用 Golang 重写播客存档的工具;source
> 小宇宙保护性存档;source
> 存档范围确定,忽略 iTunes 平台上的播客。source

### BiliBili

+ 自动化 OCR 识别“周刊哔哩哔哩排行榜”的视频编号 (bvid/avid) 的程序 schroedinger-extractor 开发中。source, demo] by @OverflowCat

### 广播电台

+ 正协助 Internet Archive 从 radio.cn, cnr.cn 下载并存档各种广播。source by @yzqzss

---

## 其他综合慢讯

+ 霏凡论坛又又又将继续,但发展前景仍然未知。source
+ 天涯论坛的创始人(邪明)和早期用户仍在争吵转型路线问题。source
+ Miraheze 组建了新的团队,项目将继续。source
+ Ragtag Archive 可能会把视频上传到 IA 。IRC: #archiveteam-bs
+ WikiApiary 仍处于只读状态,已经一个月了。

2023-06-19 ~ 2023-06-25
👍8🥰2😁2🏆11
Niconico 的页游发布平台 Game Atsumaru 将在18小时后关闭,

> 希望寻求有带宽、储存条件的志愿者们帮忙操作存档脚本: https://github.com/yts98/game-atsumaru-discovery
> 有懂爬取 Unity 的大佬吗?或是跟 Akashic Engine、TyranoBuilder、GameMaker Studio、Tonyu System、Visual Novel Maker打过交道的?
> 能帮忙的人愈多愈好。

by @yth98

详情及讨论请至:
https://news.1rj.ru/str/saveweb_projects/5882/7716

Update:
20230628 11:08 (UTC+8) 现已关站,所有页面和 api 均被重定向到了 <https://blog.nicovideo.jp/niconews/194994.html> 。
EP00
Save The Web Project
一年过去了,STWP 的鸽子们的第零期播客终于剪好了……

录音录制于 2022-06-23 ,所以请忽略我们在谈些一年前的旧闻。都是在乱聊。

口误更正:
“不可见的空格”为“零宽字符”
事实更正:
Internet Archive 是单冗余。

#STWP #Podcast
7🥰1
亚马逊 Kindle 中国电子书店今天(2023-06-30)将关闭购买功能。

> 用户需要在 2024 年 6 月 30 日之前,将自己购买的电子书下载并保存。

如何将从 Kindle 中国电子书商店购买的电子书备份到本地 - 书伴
Twitter 现已开启登陆墙,游客已无法免登陆预览推文、账号主页等。

(目前,Nitter 等第三方客户端仍然可用)

Update: 本消息发出数小时后, Nitter 也不可用了。

#新闻
🤡31🤮9😢4👎2
ArchiveTeam 那边的半次元存档 warrior 现在终于开始了。
感兴趣的可以去参加。
https://wiki.archiveteam.org/index.php/半次元

Tracker: https://tracker.archiveteam.org/banciyuan
IRC: #wuciyuan@hackint.org (同 Matrix homeserver)

注:受速率限制, AT 可能无法在剩下9天内完成全站存档。
🙏8
Forwarded from 风向旗参考快讯
唱片公司就数字化唱片收藏起诉互联网档案馆

环球音乐集团、索尼音乐娱乐公司和其他唱片公司周五(美国当地时间)起诉非营利性互联网档案馆(Internet Archive),指控其收集老式唱片的数字化音乐,侵犯了其版权。

唱片公司向曼哈顿联邦法院提起的诉讼称,档案馆的“Great 78 计划”充当了弗兰克·辛纳屈、艾拉·菲茨杰拉德、迈尔斯·戴维斯和比莉·哈乐黛等音乐家歌曲的“非法唱片店” 。

他们列出了档案馆涉嫌侵犯的 2,749 项录音版权。唱片公司表示,他们在此案中遭受的损失可能高达 4.12 亿美元。

位于旧金山的互联网档案馆以数字方式存档网站、书籍、录音和其他材料。它将自己比作图书馆,并表示其使命是“提供对所有知识的普遍访问”。

Great 78 项目鼓励捐赠 78-rpm 唱片(从 1900 年代初到 1950 年代的主流唱片格式),以便该组织进行数字化,以“确保这些文化材料的保存,供子孙后代学习和欣赏”。其网站称,该收藏包括超过 400,000 段录音。

该诉讼称,这些录音都可以在授权的流媒体服务上获取,并且“不存在丢失、遗忘或毁坏的危险”。

—— 路透社
👎20🤨1
Save The Web Project
大家好,经过两个月的摸鱼开发(特别感谢 @MistyNya 😂),我们将开始存档 MediaWiki 以及 DokuWiki 站点。 如果您知道一些 wiki 站点,请在评论区扔链接。中文站优先。 存档工具是在前人的基础上改进/开发的,以GPLv3开源,分别为: MediaWiki: https://github.com/mediawiki-client-tools/mediawiki-scraper/ (又名 wikiteam3 ) https://github.com/saveweb/wikiteam3…
#寻找大冤种

MediaWiki 存档项目现需要“大”vps,特寻江湖人士给我们白嫖或合租🤣

要求:
- 国际互联网
- 大宽带(100m 起步,不计量带宽。计量带宽也可以,报销流量费)
- 大硬盘(300G 以上)
- 大内存(最低4G+,内存越大,zstd 可以获得更好的压缩率。5% 时间占压)
- cpu (无要求。10% 时间的 100% 占用。)
- 对 root 权限无要求。

如果您有意🙈,欢迎进群:
https://news.1rj.ru/str/saveweb_projects/118
或 PM @yzqzss

可打广告。🌚

## 另附 wikidump 通知频道
https://news.1rj.ru/str/+CEST75VuQdMxNjI9
(注:目前一半是我们存的,一半是 wikibot 存的)
👍4
> WordPress 推出 The 100-Year Plan, 100 年托管服务(带 100 年域名付费)$38,000 刀。且如果是公开站,将自动提交到 Internet Archive 。

哈?推送 IA 存档还需要花钱???

试试 https://github.com/saveweb/wordpress-rss-archiver ,将任意 WordPress 的全部文章的 URL 推送到 IA WBM ,免费!🤡
👍4🥰31
https://github.com/ngosang/trackerslist

GitHub 上知名的 BitTorrent Trackers List 仓库数小时前 404 。(及其用户页也 404 了)
具体还不知道是主动删除还是被迫销号。

#新闻
😢1