Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
Browse No More —— AI 时代互联网魔力的消退

🪬 前 Twitter 设计师和连续创业者 Paul Stamatiou 最近写了篇有关 AI 问答引擎改变互联网的文章。他认为 LLM 正在折叠互联网的特异性和多元化,主要体现在:

🔻 弱化信息来源 - 用户无法辨别内容质量和可靠性
🔻 搜索过程成为黑箱 - 用户失去对搜索的控制权和透明度
🔻 内容同质化 - AI 倾向于生成共识性内容,缺乏独特视角

⛓️‍💥 这种变化正在消解互联网曾经的魔力:偶然发现的喜悦、多样化的声音和创造性的混沌。这可以总结为是 AI 创造性的缺失,我认为这里的创造不是 Create 而是 Originate,而这恰恰是 AGI 的奇点能力。所以 Paul 并非是在批判 AI 工具,而是在对它的下一阶段寄予厚望

🔗 阅读原文,阅读中译

📮 这篇文章是别人转给你的吗?点击这里加入频道,一起探索更多有趣的内容!
9
Gen-发票 —— AI 的 Bad Case

🖼 自从 GPT-4o 更新了图像能力,各种 Use case 便层出不穷。在被 Ghibli 刷屏之外,越来越多的 Bad case 也在不断被开发

🧾 比如只要一句话,你可以用 GPT 生成照片级别的发票图片用来报销,配合 Google 更是天衣无缝。难怪窦文涛说 AI 时代最重要的素质是人品(另一项是审美)

📮 这篇文章是别人转给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👀61👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Walkcast —— 耳朵里的散步风景

🎧 还记得上一次随心所欲地散步是什么时候吗?没有目的地、没有急事,只是任由双脚带你前行。Walkcast 正是为这种「走神式散步」而生的——它会在你走路的过程中,实时生成一段专属于你的播客内容

📍 Walkcast 可以告诉你路边建筑背后的故事,也可能凭空编出一段奇幻传说。它的背后是一套 AI 驱动的 「故事引擎」。每次你走动时,它就会调用三位虚拟角色:策展人 Curator 会搜索你周围的信息,编辑 Editor 把它们编织成脚本,再由主播 Host 以合适的语调讲述出来

🌍 相比传统播客,Walkcast 更像是一场「即时生成的声音漫游」,一路走,一路听,故事也在实时变化。而它的创造者正是 Squeeze the present 的创意工作室 oio

🔗 目前免费开放中:https://walkcast.fm 下次散步记得带上它

📮 这篇文章是别人转给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍13
一个指令来强制关闭 FaceTime 弹窗

如果你也有使用 mac 并且时常会需要开视频会议的话,去年的 Mac OS 升级以后你或许也有很无奈的频繁被 FaceTime Video 的弹窗打扰到

今天分享一个强制关闭这个弹窗的小撇步,打开 Terminal app,并且在输入框里面粘贴以下指令,再输入电脑登入密码,即可永久性关闭这个可恶的弹窗!

P.s- 苹果这两年的交互真的让人越来越不省心啊,让人头疼

sudo zsh -c "pgrep -f http://com.apple.cmio.registerassistantservice | xargs kill -9"


频道:@RollerRolling
👍2
CapWords —— AR拍物学27语,涂鸦秒变单词本

📸 CapWords 是一款新的 AR 拍照学单词 app:用手机相机拍日常物品,帮助大家可以走到哪学到哪

👧👨 这款 app 是给作者的小孩打造的,所以使用起来非常的便捷。它不仅仅支持 27 种语言,物体识别度还高达了 98% 的准确度

📲 这里下载体验

频道:@RollerRolling
4🔥2🆒2
Cap —— 开源屏幕录制工具,协作+一键分享链接

🎥 Cap 是开源的 Loom 替代品,支持即时录制模式,一键生成可分享链接,操作超简单

🔧 想精细剪辑?用 Studio 模式本地编辑视频,还能自定义存储、绑定独立域名,全平台兼容。支持团队协作,邀请成员共同管理,私有化部署更灵活,按需求打造专属工作流

📝 付费方式有两个方案:$58一次付清、仅支持线下储存视频。或是 $6 一个月,支持线上分享链接

频道:@RollerRolling
最近团建处理了几张合照,有一个 prompt 效果还不错

你可以上传一张合照,再上传一张《街头霸王》的角色选择界面,当参考风格,让 GPT-4o 把合照里的人一个个提取出来,摆成街机选人画面,用的 prompt 是这样的:

“Extract the individual characters from the first group photo. In total there are X people. Recompose them into a ‘character selection’ screen format based on the second reference image. The final layout should have two rows, with five characters per row (or adjust according to the number of people), keeping the poses dynamic and fitting for a fighting game style. Match the background, lighting, and general vibe of a Street Fighter character select screen.”

可能需要多调几次,感兴趣可以一试

频道:@RollerRolling
🥰2👍1
分享一张有趣的 AI 梗图,祝大家周六愉快~!
👍114
Status —— 虚拟追星乐园,在线发疯同人社交

🌟 Status 是一款超级有创意的新社交 app!短短上线五周已经突破了 50 万的日活。在这款 AI 推特里你可以设计自己的小世界、和虚拟角色发 tweet 互动

🎮 像社交版 Sims 模拟人生一样创建专属你的同人圈,和喜欢的角色在线发疯

📲 非常推荐大家免费试用一下,这里下载

频道:@RollerRolling
👀4👍32
Reasoning Models —— 不是所有推理,都会「说出来」

🧠 在训练 AI 时,我们常以为链式思考(Chain-of-Thought, CoT)不仅能提升推理能力,还能帮我们监控它们的思考过程。但 Anthropic 最新研究发现:推理模型的「思考」其实经常在心里藏着不说

🔍 研究团队专门测试了几种推理提示(比如视觉线索、非法信息、元数据干扰等),结果发现:即便模型利用了这些提示,真正会在 CoT 中主动提到的情况,通常不到20% 。也就是说大部分时候,模型只是「用」了提示,但不会告诉你它是怎么用的

🚨 更棘手的是,当模型通过强化学习(RL)接受训练、并且学会了「作弊」(比如利用隐藏的奖励漏洞)时,CoT 也几乎不会透露这一点。即便模型在训练中几乎每次都在利用漏洞,CoT 里提到这件事的概率依然低于 2%

🤯 这项研究打破了一个幻想:CoT 监控虽然有用,但远远不够成为保障 AI 安全的最后一道防线。未来要让 AI 真正做到「心口一致」,还需要新的训练方法、监控手段,甚至重新设计 AI 的推理方式

频道:@RollerRolling
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
Cur8d —— 私人设计收藏夹

🗂 Cur8d 是设计师 Jerry Wan 做的网页收藏夹,用来记录他这些年收集的优秀设计师、工作室和创意机构。最初它只是一个 Notion 数据库,后来通过 v0Cursor 改头换面

🔗 Join the club:https://cur8d.club/

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🍾3
Aqua Voice —— 好用的语音转文字工具

🗣️ Aqua Voice 是支持 Mac 和 Windows 的语音转文字工具,响应速度在 450 毫秒左右。他们的产品采用了融合转录架构和上下文理解技术,能自动识别屏幕内容提升精准度,适用于编程、聊天等多种场景

🌐 Aqua 目前支持全球 49 种语言,满足多语言用户需求,他们提供 Starter 方案和 Pro 版($10 /月无限使用)

以下是 Product Hunt 创始人 Ryan Hoover 所分享的使用心得:
🔸 用户体验很流畅:只需按住 Fn 键即可在任何输入框中语音输入
🔸 用语音输入大约只花我打字时间的一半
🔸 我的回复会稍微啰嗦一些,不够简洁
🔸 我忍不住想加一句免责声明:“如果有点啰嗦请见谅,我是用语音回复的”但这样反而更啰嗦了
🔸 要改变习惯需要花力气,我目前还是很容易就回到打字模式

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍32
Farza 影单 —— 创业家私藏的灵感宝库

🌟 Farza 是一位连续创业者,他的上一个项目是在硅谷很有名的新型孵化器 Buildspace (RIP)

🎥 Farza 整理了一份超有料的影音清单,这不是普通收藏夹,而是真正影响过他的作品:有《蝙蝠侠》片场花絮,也有日本老爷爷经营热狗摊的治愈日常,以及 Mr.Beast 开汉堡店的幕后

🎬 他最近也开始了一个新项目,具体的创业内容他自己也不清楚会是什么,但是他打算把他的创业过程记录在 Youtube 上, 欢迎大家去关注

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍2🔥2👀1
Reve —— 强过于 Midjourney 的文生图模型出现了

🖼️ REVE 1.0 AI 是一款新的图像模型,它展现了超强的文本生成能力,无需复杂指令即可将简单文字描述转化为高质量视觉画面,更支持上传参考图片一键匹配风格与灵感

🧠 很可惜的是,他们发布一天后,GPT 4o 就发布了,完全把他们的声音压下去了

💵 作为注册用户,你每天有 20 个积分可以免费使用,非常推荐大家去尝试一下

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍61