Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
Memo —— 视频音频的本地文字转换器

🔘 Memo 是一个用于将视频和音频转为文字的软件,它可以进行多语言识别与文字翻译,特点是通过 GGML 在本地环境下运行大语言模型

🔄 你可以上传本地媒体或者通过资源的网络链接(支持 YouTube 和 Podcast)读取内容,而后选择适合的大语言模型,目前模型分为支持多语言或英语两类,又按「转换速度/效果」分为不同等级。转换的文字与媒体播放关联,能够以段落或字幕格式呈现,可进行多语言翻译和字幕导出

🔗 Memo 目前处在早期的试用测试阶段,有多项功能还在开发中(比如本地实时录音转文字、转换内容搜索、媒体介绍自动生成等)。如果你想试用的话,微信搜索 MemoHQ 添加产品助手入群,可下载 Mac 或 Windows 版本

频道:@RollerRolling
4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Spiderverse 2 —— 幕后制作合集

在蜘蛛侠 2 上映后,团队里的许多画师都纷纷在自己的 Twitter 上面分享了他们参与过的片段以及幕后的一些小故事。我把我看到的这些分享都整理了一下作为合集列出来了,很感谢蜘蛛侠团队里的大家愿意这样公开幕后的制作过程,也很希望这部电影能再次获奖 ——

🔸 上面的视频就是动画师 Seng 在制作 Miles 和蜘蛛恐龙打斗的幕后过程 (source)
🔸 原来 Miles 从徘徊者到蜘蛛侠的命运改变在第一部里面就埋下了伏笔 (source)
🔸 印度蜘蛛 Pavitr (茶茶)的动作是参考了印度最古老的武术流派之一 Kalaripayattu (source)
🔸 Pavitr 自我介绍的那一段的所有动作都是参考了动画师事先预录了的动作来画的 (source)
🔸 更多的 Pavitr 动作录制参考 (source)
🔸 Pavitr 早期的服饰探索 (source)
🔸 地球 928 的初期画稿 (source)
🔸 台湾画师 Kat Tsai 分享了她画的 Miles 和 Miguel 后期打斗的效果 (非常推荐大家去追踪她的 IG,她时常会分享很多幕后的故事)(source)
🔸 女蜘蛛侠 Gwen 的早期画稿 (source)
🔸 Gwen 的动作测试 —— 参考体了操选手的动作 (source)
🔸 朋克蜘蛛侠 Hobbie 的早期画稿 (source)
🔸 原来朋克 Hobbie 的不同身体部位的 fps 都一样!!(source)
🔸 Hobbie 的早起动画测试 (source)
🔸 如何架构 Hobbie 的场景图层 (source)
🔸 摩托蜘蛛侠 Jessica Drew 的处境场景的初稿 (source)
🔸 蜘蛛侠 2 里面的蜘蛛丝是透过新软件重建的 (source)
🔸 解救直升飞机的场景 (source)
🔸 2099 蜘蛛侠 Miguel 的早期所有探索 (source)
🔸 动画师为 Miles 一家在学校和大学顾问对话录制的表情参考 (source)
🔸 14 岁男孩 Preston 是电影里乐高蜘蛛侠的动画师 (source)

频道:@RollerRolling
🏆4🆒4👍1
Wonder Dynamics 实测 —— 头号玩家男主角创业了

👓 或许有一部分的我们都看过「玩家一号」这部讲 VR 的电影,苹果这次发布 Vision Pro 时的广告场景也是向「玩家一号」里面的场景致敬过的

📹 没错,电影里面的男主角 Tye Sheridan 在几年前合伙创办了一家叫做 Wonder Dynamics 的 AI + CG 公司,他们的旗舰软件 Wonder Studio 可以一键将 CG 模型与真人合成,极大的简化了 CG 角色制作动画、打光以及将其与现实场景融合的过程

🌐 上面的视频是他把。最令人惊艳的是:在生成完这个视频以后,你可以把视频里面的人物以 Blender 格式导出去做二创或是更多的后期处理。整个 blender 的档案里面有 mocap source in fbx, alpha mask, clean plate sequence, etc。听说他们是使用了超过 20 个 ML 模型,包括了 body segmentation, motion tracking, inpainting, light estimation, etc

频道:@RollerRolling
🆒2
Pake —— 回归轻量的桌面 APP

🖥 对于许多 PC 端用户而言,在浏览器中可以打开的应用一般不会再下载其桌面版本,这就像小程序之于原生 APP 一样,不过 Pake 提供了回归桌面应用的选项

📦 Pake 是一系列将网页封装成小型桌面 APP 的应用合集,通过使用 Rust Tauri 作为底层的框架, Pake 系列的应用有着内存小、风格可定、体验顺畅的优点,且支持 Mac, Windows 和 Linux 三种系统

🔗 目前 Pake 系列包括:微信读书,Twitter,ChatGPT,YouTube,小红书等,在其 github 主页提供了不同系统版本的下载链接。如果你也热爱折腾代码,可以尝试「定制开发」更多功能

👀 而除了下载使用 Pake 外,你也能加入它的 Tg 讨论群或关注发起人 Tw93 获取更多资讯

频道:RollerRolling
3👍1
Demo Inn Shanghai — 月系列的活动

或许大家也在这个频道里面看到我们提及「demo」和「prototype」这些概念多次了。我(Weiwei)和朋友海辛决定试试在上海办起来线下的 demo night。我们是这样定义 Demo Inn Shanghai 的:「与其说它是一个 networking 活动,它更像是一场 intellectual party。这不是一个比谁更酷更有想法的竞技场,来的人都不是社牛,而是那些有点喜欢折腾些什么的你我 TA。」

目前,我们分别在六月和七月各办了一场此活动,见到了许多不同领域的 demo 和创作者。下一期打算办在八月的第二个礼拜六,为了有更充足的讨论时间,我们做了一些调整:
🔸 活动开始时间提前到晚上 7 点,7:00 - 7:30 来亲手试用往期同学成型的 demo
🔸 新来的朋友需要带一个 demo (实物或是 PPT 都可以)来分享,我们鼓励大家 demo 时可以多分享一些幕后的思路和故事

我们的游戏规则依旧是:
🔹 “Yes, and” 相信对方能完成的基础上提建议
🔹 避免介绍自己的学校/公司/ VC
🔹 避免叫彼此大佬/老师/哥/姐/您

💬 欢迎在上海的各位可以找我报名~
🫡 海报由 Sen 制作!

频道:@RollerRolling
👍102👏2
This media is not supported in your browser
VIEW IN TELEGRAM
Symphony in Acid —— 语言游戏律动电子音乐

🔊 Max Cooper 是一位电子音乐家,他在 2022 年一张名为 Unspoken Words 的专辑中与创意编程艺术家 Ksawery Komputery 合作,为其中的一首单曲 Symphony in Acid 制作了一个动态互动网页

👁‍🗨 在 Symphony in Acid 这首曲子中,Max 将管弦乐与酸浩室(Acid house)两种曲风融合,试图将音乐嵌入到一个高度密集复杂而又网格般严谨的结构中,如同维特根斯坦绵密的文本一般

🎶 心领神会的 Ksawery 更是将 Symphony in Acid 的每一个音符都和维特根斯坦《逻辑哲学论》中的文字进行映射,并按照相同的原则编写特定的呈现效果。当所有音符组合在一起,复杂的视觉效果便伴随律动涌现

🤫 在 Symphony in Acid 的网页上,你可以利用方向键与其进行互动。你还可以在 Unspoken Words 的专辑网站中投稿属于你的不可言说之词,而后网站会自动生成匹配的动画效果。「对于不可言说之物,我们唯有保持沉默」

频道:@RollingRoller
👏2
無駄づくり —— 深有同感的无用发明

👋 「無駄」在日语里表示没用、徒劳、白费功夫,如果你看过 JOJO 应该会很熟悉它,反派 Dio 会不断重复这个词以嘲讽对手

🦿 同样来自日本的藤原麻里菜就喜欢捣鼓「無駄」的东西,并创立了自己的品牌「無駄づくり」即无用的发明:时刻保持眼神交流的礼貌眼镜,帮你逃脱 Zoom 会议的网卡装置,随风飘舞的塑料袋桌面摆设… 这里你可以看到全览

🔫 相较于 Joseph's Machines 这类来自欧美的更技术流的「无用创作者」,藤原麻里菜更着眼于日常的「同感时刻」:譬如是在地铁上遇到靠着你睡的乘客,或是在床上看手机被砸到,她都会为此造出一个专用于此场景的物件,但用不用得上就智者见智了

💸 有趣的是,無駄づくり的线上商店中好多物品都售罄了,看来无聊还是生命中不可或缺的旋律呀

频道:@RollerRolling
8😁5👍1
透明盒子计划 —— 打破信息的壁垒

◻️ 今天推荐一个偶尔发现的 Newsletter,它在 Substack 上名叫「透明盒子计划」,定价每个月 5 美元

📥 作者希望通过使用卢曼(Niklas Luhmann)的卡片盒笔记法(Zettelkasten)来进行课题性的学习,把离散的思考装进盒子,然后将它们整理成文与订阅者分享,所以叫做「透明盒子」

📝 有关 Newsletter 的题材,「透明盒子计划」关注心智的启发,因此它的分享涵盖思维方式、概念理解、认知心理学等,这里你可以看到它的书单。就文体而言,总共分为随笔、笔记整理和主题阅读三个系列,最近新推出了一个「Evergreen」系列,用以推荐或翻译常青文章

☑️ 阅读下来发觉「透明盒子计划」一直在尝试用更易懂的行文阐释复杂及抽象的主题,据作者自述这样是为了打破语言所形成的信息壁垒,「透明」之外也要「传递」

频道:@RollerRolling
6
📞 哈喽各位,Weiwei 和 Sen 这几天由于事务繁忙,很抱歉将停更几日,下周我们会 move on 😬
🏆124
Media is too big
VIEW IN TELEGRAM
如何(不)被自动驾驶汽车撞到 —— 别被当成人

🚶🏻‍♀️ 我们的老朋友来自日本的设计艺术家 Tomo Kihara 联合 base 在伦敦的玩乐设计机构 Playfool 推出了一款「发生」在街道的游戏,它的目的有点古怪:让参与的玩家「不被当人」

🚙 这款游戏名叫「如何(不)被自动驾驶汽车撞到」,它的设定是基于在当下以及未来盛行的自动驾驶汽车。我们都知道识别周遭的环境尤其是行人,是自动驾驶汽车的核心技术难点。而这些未来即将穿梭于城市间的一双双移动之眼是否具有盲点?这便是此款游戏所旨在探寻的,它鼓励玩家利用各种方式逃脱 AI 的识别,试探算法的边界

📹 这是一个具有双重意义的游戏:一方面正如它所对外所宣传的,玩家的每一次胜利都暴露了 AI 检测行人的能力不足,发现了现存算法的缺陷,从而帮助其不断优化以保证人们的安全;另一方面,它让参与和围观的人们在欢笑声中意识到,如此先进和难以战胜的监控系统正在悄悄入侵生活的角角落落,除了人身安全我们或许还有更多亟待讨论的话题

🎮 以游戏的方式干预社会性问题,以轻松的互动暗地里包裹反思,这也是 Tomo 和 Playfool 一贯的设计哲学。毕竟,谁能拒绝来一场游戏呢?

频道:@RollerRolling
15🦄4
Post post —— 让物流参与到设计里

🖋 Skrekkogle 曾经是一个设计事务所,在接项目其余的时间里,他们也会自己研发和贩卖他们的产品。Post post 是他们制作的、无比让我欣赏的自研产品之一

🫠 这款产品是一件只生产了 111 件的艺术装饰品,用金属制成,并用镭射切割出许多三角型的造型。不过,这款产品也邀请了快递公司一同来加入「完成作品」的一环。他们在寄送这个产品的快递包装上面会贴上类似「请碾压我」、「不要手下留情」、「坐上来」的贴纸,邀请快递一同帮这个产品 ”变形“

👀 这也使得这 111 件产品,每件都独一无二,有着自己专属的纹路和皱褶,却也不减少一丝丝的美感

频道:@RollerRolling
7