Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
Poetry Camera —— 一键将眼前风景转化为诗歌

📸 Poetry Camera 是 Kelin Carolyn ZhangRyan Mather 做的 AI 相机:结合摄影与诗歌创作,用 Raspberry Pi 驱动

🤖 按下快门后,计算机视觉识别图像关键元素,再由 GPT 转化为俳句或十四行诗。这个相机最特别的点是作品会即时用内置的发票打印机打印出来,让数字艺术回归实体触感

🌈 这个开源项目目前已和 Anthropic 合作过,在伦敦的 TATE 博物馆展出

📮 这篇文章是转发给你的吗?点击这里加入频道
👍5🥰2
AI 随想:Cloud LLM vs Local LLM —— 算力与隐私的终极对决

🪄 最近看到一篇文章,讲到阿里巴巴认为未来 95% 的大模型 Tokens 会在云上传输,本地只会占到5%,所以会更加坚定的在云计算这项基础设施上投钱

👀 我看到这个结论的时候停顿了一下,真的是这样吗?某种程度上我更相信本地跑的模型未来会成为主流。如果回顾历史,当初的 IBM 靠着他们的 Work Stations(工作站)主宰了电脑市场,他们完全忽略了有一天个人电脑可能会达到一个大家所认为的「足够好」的性能水平,也因此整个电脑市场被叫做微软和苹果的小公司给吃下了

💾 IBM等公司认为企业会更青睐这种可控的专业环境,但他们低估了个人自主权和便利性的吸引力,个人电脑性能的巨大提升最终使得权衡倾向于个人计算

✍🏽 那么问题来了,未来的某一天我们会不会因为隐私和其他原因而都首选本地语言模型呢?

📮 这篇文章是转发给你的吗?点击这里加入频道
👍93
This media is not supported in your browser
VIEW IN TELEGRAM
Sesame AI —— 突破恐怖谷的真人级语音AI

🎙️ Sesame 在研究语音技术如何突破「恐怖谷效应」,主打「语音临场感」——让AI对话像真人般真实自然,能感知情绪、理解语境,对话时让人感觉被重视

💡 核心技术包括情绪识别(捕捉对话中的情感变化)、自然对话节奏(停顿/打断/重音的真实模拟)、场景适配(根据情境调整语气)和稳定人设(保持性格一致性)。最近发布的语音伴侣 demo 展示了友好度与表现力的优化成果

🤖 新推出的 CSModel 直接处理音频特征,比传统文本转语音模型更高效。它能实时理解上下文,像真人对话般灵活接话,解决了传统AI对话生硬的问题。技术文档详细拆解了模型架构与训练方法,揭秘如何用多模态技术提升语音交互的细腻度

📮 这篇文章是转发给你的吗?点击这里加入频道
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
Rabbit Holes AI —— 研究者专用的无限思维画布

🌐 Rabbit Holes AI 专为深度探索设计 用「无限画布」让 AI 对话无限延伸 无需重复提问就能持续深挖话题 像思维导图般自由分支讨论 还能避免 AI 胡编乱造 适合需要精准信息的研究者或开发者

🏢 支持本地储存对话记录,随时调用 Claude/Gemini 等多种最新模型,自带 API 密钥对接超方便,还能在 Discord 获得实时支援

📮 这篇文章是转发给你的吗?点击这里加入频道
🔥4
Claude 系统指令揭秘 —— AI 对话的隐藏操作系统

🧠 上个月,Anthropic 官网更新了系统提示词的细节,重点介绍了 Claude 3.7 Sonnet 模型 这款混合推理模型是 Claude 3 家族的新成员,比同系列的 Haiku 和 Opus 更聪明,还能直接处理图片和 PDF 文件

📝 系统提示词也做了优化让回答更贴心,上图附上了 Claude 系统提示词的一些巧思,我感觉这些提示词真的让我看到了 Anthropic 这家公司和 OpenAI 的不同。想了解具体操作可以直接戳 Anthropic 官网的系统提示词专区

🔗 现在 Messages API 可以直接用网址调用图片和 PDF 资源

📮 这篇文章是转发给你的吗?点击这里加入频道
👍5🤝3
This media is not supported in your browser
VIEW IN TELEGRAM
Flora AI —— 创意专业人士的「无限画布」

💡 Flora 是一款为专业创意人涌现灵感的设计工具,它的宣言是「AI 创意工具不应仅仅是生成 AI 垃圾的玩具」,目前产品已与著名设计工作室 Pentagram 和 NYU ITP 开展合作

💻 在界面方面 Flora 使用了和 flowith 类似的画布模式,用户可以在上面生成文本块、图像和视频,以及它们的各种变体。画布的可延展性很好地承载了这一发散流程,同时它也预制了很多 Creative flow 作为样板

👓 我的使用体验是:高质量的生成内容,简易的操作,考究的界面,稍显卡顿的画布

🌿 体验入口:https://www.florafauna.ai

📮 这篇文章是转发给你的吗?点击这里加入频道
👍53🥰1
数学公式→绘画

🟰 Hamid Naderi Yeganeh 是 UCL 数学系的学生,擅长利用数学公式进行绘画创作,他的作品曾被《美国数学月刊》选为封面背景图。更多关于他的创作过程,可参见他的维基百科页面

🔍 他的 Post 下一直会有属于这个时代的评论「这是 AI 所做不到的」。不过即便 AI 能做到人们费尽心思才能达成的事情,从无到有的创造和过程的乐趣总会是为人的意义

📮 这篇文章是转发给你的吗?点击这里加入频道
81👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Time Lines —— 24hr 流动涂鸦时钟

🕑 设计师 Shashwath 尝试重新定义时间记录方式,用涂鸦替代传统钟表。每道笔迹代表 24 小时,红色圆点实时定位此刻,让时间感知更直观生动

✍️ 这款迷你 APP 把时间转化为视觉符号,像手稿一样自由创作。每一天都是一幅独特的轨迹图。我很喜欢这种记录方式 —— 它模糊了日期界限,让每一刻都成为连续创作的一部分

📱 整个 APP 是直接用 Cursor 写成的,你可以在这里下载

📮 这篇文章是转发给你的吗?点击这里加入频道
4👍4🤩2
Flashes —— Bluesky 的类 Instagram APP

📸 Flashes 是 Bluesky 最新推出的类 Instagram 图片分享 APP,进一步扩展其去中心化社交网络,主打「用户自主」——让用户掌控自己的数据、算法和社交体验,摆脱平台垄断

💡 核心亮点包括多样化的图片分享形式(支持动态图片墙和相册展示)、自定义算法(用户可选择或创建自己的信息流排序方式)、开放协议(基于 AT Protocol,支持第三方客户端接入)和内容掌控权(用户可决定如何分发和管理自己的内容)。Flashes 被视为对传统封闭社交平台的直接挑战,推动更开放、透明的社交网络生态

🔗 iOS 下载链接

📮 这篇文章是转发给你的吗?点击这里加入频道
👍3
Tolan —— 越聊越懂你的治愈系 AI 萌友

👽 分享一款超萌的外星 AI 伙伴 Tolan,它全身由柔和的曲线和缤纷色彩组成,像从童话里蹦出来的小可爱。设计初衷是陪伴用户聊天、反思并共同成长,带来独特的情感互动体验

💬 Tolan 能根据你的喜好和习惯定制对话内容,像真正朋友一样越相处越懂你这种 AI 伴侣突破传统模式,用充满想象力的方式重新定义数字时代的亲密关系

🌈 根据苹果商店的数据分析,这款 app 上个月突破了 200K 的下载量,并且有 300k 美金的月收入

📱 这里下载尝试(注:注册流程走完后就会弹出付费墙)

📮 这篇文章是转发给你的吗?点击这里加入频道
👍2🏆2
This media is not supported in your browser
VIEW IN TELEGRAM
LatentLit —— AI 编剧逻辑全透视

🧠 LatentLit 是个用 AI 分析文学的新工具,能自动生成故事还带详细解析,让你看懂 AI 是怎么从零开始创作的

🔍 用大型语言模型(LLM)来做文学分析,这种可解释性设计对创作者很友好,边用边学 AI 的脑回路

🖥️ 推荐用电脑访问效果更佳:https://latentlit.goodfire.ai

📮 这篇文章是转发给你的吗?点击这里加入频道
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Sesame CSM —— 最真实的AI 语音生成模型开源了

🎙️ 月初分享的主打「语音临场感」的 Sesame,开源了语音模型 CSM-1B。这是一款基于 Meta 的 Llama 架构 1B 参数,支持商用,通过 Apache 2.0 协议免费开放,能生成多种自然音色,但未针对特定人声优化

⚠️ 团队强调禁止模仿真人声线 防范虚假信息传播 公司获 a16z 等投资 正开发全天候 AI 眼镜,未来语音助手或与穿戴设备深度结合

📮 这篇文章是转发给你的吗?点击这里加入频道
👍42
统计一下大家的所在地区
Anonymous Poll
83%
亚洲
5%
欧洲
5%
美洲
7%
其他
This media is not supported in your browser
VIEW IN TELEGRAM
Townscaper —— 治愈系沙盒|算法生成童话小岛

🏗️ 分享一个我很喜欢的治愈的沙盒建造游戏 Townscraper,随手点点就能生成童话风小岛 弯曲街道、空中城堡、运河桥梁全靠算法自动生成,没有任务压力纯享受创造乐趣

🎨 调色盘选个喜欢的颜色,在网格上随意堆叠色块,系统会智能转换成精致小房子、拱门楼梯、绿意庭院瞬间出现,每次布局都能解锁意想不到的建筑组合

📱 支持 PC 、Switch 和手机多平台,Steam 和 Google Play 都能入手。开发者 Oskar Stålberg 把它做成「会呼吸的玩具」,适合想放松大脑随手发挥创意的玩家

📮 这篇文章是转发给你的吗?点击这里加入频道
❤‍🔥3👍3