Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
Status —— 虚拟追星乐园,在线发疯同人社交

🌟 Status 是一款超级有创意的新社交 app!短短上线五周已经突破了 50 万的日活。在这款 AI 推特里你可以设计自己的小世界、和虚拟角色发 tweet 互动

🎮 像社交版 Sims 模拟人生一样创建专属你的同人圈,和喜欢的角色在线发疯

📲 非常推荐大家免费试用一下,这里下载

频道:@RollerRolling
👀4👍32
Reasoning Models —— 不是所有推理,都会「说出来」

🧠 在训练 AI 时,我们常以为链式思考(Chain-of-Thought, CoT)不仅能提升推理能力,还能帮我们监控它们的思考过程。但 Anthropic 最新研究发现:推理模型的「思考」其实经常在心里藏着不说

🔍 研究团队专门测试了几种推理提示(比如视觉线索、非法信息、元数据干扰等),结果发现:即便模型利用了这些提示,真正会在 CoT 中主动提到的情况,通常不到20% 。也就是说大部分时候,模型只是「用」了提示,但不会告诉你它是怎么用的

🚨 更棘手的是,当模型通过强化学习(RL)接受训练、并且学会了「作弊」(比如利用隐藏的奖励漏洞)时,CoT 也几乎不会透露这一点。即便模型在训练中几乎每次都在利用漏洞,CoT 里提到这件事的概率依然低于 2%

🤯 这项研究打破了一个幻想:CoT 监控虽然有用,但远远不够成为保障 AI 安全的最后一道防线。未来要让 AI 真正做到「心口一致」,还需要新的训练方法、监控手段,甚至重新设计 AI 的推理方式

频道:@RollerRolling
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
Cur8d —— 私人设计收藏夹

🗂 Cur8d 是设计师 Jerry Wan 做的网页收藏夹,用来记录他这些年收集的优秀设计师、工作室和创意机构。最初它只是一个 Notion 数据库,后来通过 v0Cursor 改头换面

🔗 Join the club:https://cur8d.club/

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🍾3
Aqua Voice —— 好用的语音转文字工具

🗣️ Aqua Voice 是支持 Mac 和 Windows 的语音转文字工具,响应速度在 450 毫秒左右。他们的产品采用了融合转录架构和上下文理解技术,能自动识别屏幕内容提升精准度,适用于编程、聊天等多种场景

🌐 Aqua 目前支持全球 49 种语言,满足多语言用户需求,他们提供 Starter 方案和 Pro 版($10 /月无限使用)

以下是 Product Hunt 创始人 Ryan Hoover 所分享的使用心得:
🔸 用户体验很流畅:只需按住 Fn 键即可在任何输入框中语音输入
🔸 用语音输入大约只花我打字时间的一半
🔸 我的回复会稍微啰嗦一些,不够简洁
🔸 我忍不住想加一句免责声明:“如果有点啰嗦请见谅,我是用语音回复的”但这样反而更啰嗦了
🔸 要改变习惯需要花力气,我目前还是很容易就回到打字模式

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍32
Farza 影单 —— 创业家私藏的灵感宝库

🌟 Farza 是一位连续创业者,他的上一个项目是在硅谷很有名的新型孵化器 Buildspace (RIP)

🎥 Farza 整理了一份超有料的影音清单,这不是普通收藏夹,而是真正影响过他的作品:有《蝙蝠侠》片场花絮,也有日本老爷爷经营热狗摊的治愈日常,以及 Mr.Beast 开汉堡店的幕后

🎬 他最近也开始了一个新项目,具体的创业内容他自己也不清楚会是什么,但是他打算把他的创业过程记录在 Youtube 上, 欢迎大家去关注

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍2🔥2👀1
Reve —— 强过于 Midjourney 的文生图模型出现了

🖼️ REVE 1.0 AI 是一款新的图像模型,它展现了超强的文本生成能力,无需复杂指令即可将简单文字描述转化为高质量视觉画面,更支持上传参考图片一键匹配风格与灵感

🧠 很可惜的是,他们发布一天后,GPT 4o 就发布了,完全把他们的声音压下去了

💵 作为注册用户,你每天有 20 个积分可以免费使用,非常推荐大家去尝试一下

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍61
【独家】Teddy —— 前 Midjourney 程序员的新短信式音乐社交 app

🎵 Midjourney 程序员 Greg Hochmuth 的新作 Teddy 开始内测啦!这款轻松的 App 主打用类似短信的界面来与陌生人分享音乐,你可以直接在聊天框里甩歌曲,也会在无预警的情况下收到来自全球的歌曲分享

📱 Greg一直痴迷音乐发现的新形式,这次把「发现音乐」变成对话游戏,目前还在内测阶段且只支持 Spotify

📲 想尝鲜的乐迷可以前往 Testflight 获取这个内侧权限~

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
2
Media is too big
VIEW IN TELEGRAM
神经世界——AI生成无需建模的互动虚拟环境

🌳 作者 Ollin Boer Bohan 利用深度神经网络,将现实中的森林转化为可互动的虚拟世界。他通过手机录像记录路径与运动数据,训练AI模型自动生成动态画面,无需传统游戏开发中的场景建模与灯光编程。虽然初期效果较为粗糙,但已能实现基础运行。

🤖 通过增加控制信息、扩展内存、引入多分辨率处理,系统逐步升级。他最终采用了四尺度非对称UNet架构,训练耗时约100个GPU小时,画面流畅度和真实感显著提升。就像用照片记录现实一样,AI 直接学习了物理世界中的光影变化。

🎮 传统游戏开发像手绘油画,需要精细雕琢每一个细节;而神经网络生成的世界更像摄影,以极高效率捕捉现实。未来,构建高拟真虚拟环境或许会像拍摄数码照片一样便捷。作者还提到其他类似的世界模拟项目,并计划在更多场景中测试这一技术路线。

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
4
从基础模型到界面之战 —— Scott Belsky剖析AI产品未来竞争格局

Scott Belsky 是 Adobe 前高级副总裁、现任 A24 合伙人,长期关注创意产业与科技趋势的交汇点 他近期分享了关于生成式AI时代产品创新的几点关键建议:
🔸 如果你在打造基础模型(foundational models),必须快速向上推进(move up the stack),建立更高层次的应用与服务
🔸 必须掌握并利用第一方数据(first-party data)以驱动个性化体验,同时搭建连接器整合第三方数据,但要注意差异化优势不会持久,且在即将到来的“双边数据战争”中变得更加困难
🔸 捕捉社交图谱或职业图谱(social/professional graph),以提升推荐系统和算法的相关性与精准度
🔸 如果你的护城河仅依赖系统提示词(system prompts),优势将很快消失
🔸 上下文窗口(context window)必须持续扩展,因为“个性化效应”正在成为新的“网络效应”,对用户留存与产品自增长(PLG)至关重要
🔸 市场竞争将集中在界面层(interface layer),而最终掌控界面的,是操作系统:消费者端如 iOS、Android、浏览器(未来可能包括 Meta 等新平台),企业端则是各类职能系统(enterprise OSes)

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍4🤮1
Media is too big
VIEW IN TELEGRAM
Aperture —— 对手机注意力的微小重构

📵 在这个信息过载的时代,技术本该帮我们更专注,却常常成为干扰的源头。而设计工作室 Special Projects 提出了一种简洁而诗意的解决方案:只需将手机翻过来,手机盖自然就成了一个「显示刚刚好信息」的窗口。这个概念名叫 Aperture,意为「小孔」

🪟 通过这扇小窗口,你可以继续接收重要信息(短信、来电),也可以用更纯粹的方式拍照、导航或听音乐。它自定义了一个临时的操作系统,只保留你想专注完成的任务,让干扰的内容「够不着你」

👁 Aperture 的理念并不复杂,它借助一个翻盖壳和软件配合,构建了一个微型交互空间。它像是一种数字时代的身体练习法,一个可以随时翻面开启的小仪式,让你在工作、烹饪、或和朋友相处时都更容易保持在场,而不是滑入下一个社交或推送的黑洞

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
6🔥4🤩3🤔2
Perplexity 现在可以在 WhatsApp 上用了!

💬 你可以直接发消息给 +1 (833) 436-3285,问问题、查资料、让它生成图片,还能看到引用来源。官方说很快还会有更多功能上线,有兴趣可以 WhatsApp 试一下

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍3😁2
真正的「代理」,不是软件

📄《Agency Is Eating the World》一文中,Replit 的创始工程师、数据科学家 Gian Segato 指出:如今我们口中的 「agent」,大多只是能完成任务的自动化工具,它们仍依赖人类指令、被动执行任务。而真正的 agent,是那些用 AI 构建个人杠杆、主动出手解决问题的人

🧭 这改变了整个游戏规则。AI 工具让实现变得便宜、迅速、几乎默认可得。你不再需要成为专家,才能完成专家级任务。关键不再是「怎么做」,而是「知道要做什么」;不在于手艺,而在于判断。架构胜于实现,意图胜于技能

🏢 这对现有的商业逻辑是一次底层震荡。过去的公司靠流程、分工和层级延续稳定,如今,一人公司开始替代传统组织;高能动性个体正打破岗位边界,在通才与 AI 合力下,实现前所未有的效率密度。这不是个别现象,而是结构性转变

🌱 Agency,正成为一种新的时代信号。不是等机会来,而是自己成为系统中的新变量

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍5🌭2
Die With Me —— 5%电量开启的末日临终社交

🪫 「Die With Me」是一款另类聊天 app:只有当手机电量降到 5 % 以下 才能登入。那短短的“断电倒计时”里,你会被拉进一个全球聊天室,与同样濒临关机的陌生人一起“集体告别”

🧑🏽‍🎨 该项目由比利时艺术家 Dries Depoorter 与 David Surprenant 联合阿姆斯特丹纪录片节实验室打造。完整的创作理念可在官方网站查看。

📱 想亲自体验?
🔸 App Store: 下载链接
🔸 Google Play: 下载链接

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍94🤯4
Daniel de Bruin —— 把科技按下慢速键

 还记得我们两年多前分享的艺术家 Daniel de Bruin 吗?那时,他做了一款纯手动操作的 3D 陶瓷打印机,用机械结构代替代码编程

📈 如今,他成了「机械系网红」,YouTube 频道订阅数突破 19 万,热门影片包括百层 Googol Gearbox生物感应游乐设施 Neurotransmitter 3000

💐 他的项目把工程学、行为艺术与哲学反思揉在一起,是「反技术姿态」与「硬核制造」的并存范例。他的手动装置贴心的提醒着我们:降低效率,有时反而让创意升温

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍1
访谈 Cursor 创始人 —— 颠覆编程未来的直觉协作革命

🤖 Lenny Newsletter 最新一期播客请到 Cursor AI 的 CEO Michael Truell,聊了聊 AI 如何颠覆传统编程 他提到未来写代码可能不再依赖复杂语法,而是通过更直觉的 AI 协作方式,甚至预测未来几年技术圈会出现「统治级」的 AI 编程工具,市场潜力远超大家想象

🧠 从自动化 CAD 转型做 AI 编程工具,Cursor 团队分享了超速成长的秘诀:比起硬核编码能力,逻辑设计和对产品的「品味」在 AI 时代更关键。他们还自主研发了专属 AI 模型,证明不跟风大厂也能闯出新赛道

🎧 完整访谈已在 YouTubeSpotifyApple Podcasts 上线

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
👍32