Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
IDM-VTON —— AI 换衣

👔 换衣 AI 不是什么新鲜事,但实际用起来还是很惊艳的,更重要的是它有着非常扎实的使用场景和可玩性

💃 IDM-VTON 是一个基于图像的虚拟试穿模型,它能够结合人像和服装图像,自动扣图、调整人像动作、模拟衣物变形,容错率高

🧐 尝试了几张背景比较复杂的图像,比如王菲的演唱会照,还有模有样的。除了最直接的电商用例,像是结婚照、证件照、广告海报也有比较契合的 Use Case

频道:@RollerRolling
5👌5
This media is not supported in your browser
VIEW IN TELEGRAM
苹果让你在车内不再「晕机」

📱 苹果在 iOS 18 中推出了一个新功能,叫做车辆运动提示(Vehicle Motion Cues),旨在帮助减少乘客在车辆移动中使用 iPhone 或 iPad 时的晕车现象

🚗 这个功能会在屏幕边缘显示动态的小点,这些点会随着车辆的运动朝着惯性方向移动:比如汽车向左转时,点会向右移动;加速时,点向下移动。这有助于将视觉感受与身体感觉对齐,从而减少引起晕车的感觉冲突

⚙️ 这个功能特别适合那些在行驶过程中「晕机」的人,后续更新后用户可以通过控制中心开启或关闭它。从另一个角度看,苹果又排除了一个让你放下手机的障碍

频道:@RollerRolling
👍19🤔71🔥1
看到一款后台自动截图应用「Snapseek」,当用户使用选中的应用时,Snapseek 会在后台自动截图并进行文本识别和索引,而后可以搜索关键字进行快速回顾,类似 APP 使用的行车记录仪。目前只有安卓可用,有兴趣的朋友可以一试,说说体验 😄
💯4
一个有关「手机屏幕」的收集计划

截止到 2023 年 5 月,全网 12 亿用户日均使用手机时长达 7.1 小时。作为一项技术产物,智能手机似乎重新组织了我们的生活。北京师范大学的媒介文化教授蒋原伦认为「手机成为人们亲密的异己者」。

而我想问的是,我们的身份和手机有着怎样的关系呢?作为人们每日注意力的「客厅」,我们能否透过手机屏幕的布置看到它与使用者之间的联系

这是便是一个收集「手机屏幕」的众筹计划,如果有兴趣就填表看看吧👉 https://tally.so/r/m6k8jJ
3👨‍💻3
我们每天在用的emoji默认都是一个大小,但是它们在真实世界中有多大呢?https://javier.xyz/emoji-to-scale
🆒8
看到了手机和电脑近十几年的市占率变化,分享给大家。不晓得下个二十年会不会有 Vision Pro 和 Oculus 的加入,还是说会有 Daylight 的加入呢?

频道:@RollerRolling
🗿32💯1
Spiral —— 来自 Every 的 AI 写作生成/模拟器

✍🏻 关注技术、生产力和 AI 的Newsletter 公司 Every 又出了一个新的写作类应用 Spiral,它可以定向生成文本内容,也可以将现有文本内容重新编排以用于不同的传播渠道,猜测更适用于英文内容

🤔 你可以选择想要输入和输出的内容格式,比如你想把播客转化成小红书段落,那就提供相应的示例,Spiral 会据此学习并模仿这些文档的风格和结构,训练出你的内容生成器,当然你也可以直接编辑它背后的 prompt. 这里有创始人 Dan 的演示视频

🌀 而就像 GPT 一样,你可以分享和使用 UGC 的 Spirals. 只是当前产品处于初级阶段,公共生成器的架构和使用模式还未演化成熟,使用起来有点模棱两可,期待他们不断迭代吧。Spiral 费用为20美元/月,目前可免费试用有10次生成机会

🌰 这是我用一天世界博客简易训练所得的短文生成器,结果如下:

原文:2023年4月份,史航的事情闹得沸沸扬扬,三联生活周刊对此发过一篇文章,叫《性骚扰界定,到底该以谁的感受为准?》,里面提到一个启发性视角:当发出骚扰讯息的人能决定被害人能不能毕业,能不能升职加薪,或者有巨大的资源差距时,被害人会因为这个不对等权力而作出违心的回答。因此作为权力上位者,应该注意言行的分寸,主动拒绝,主动防范这样的事情发生。「你要对自己说的话负责,但也要对别人听到你所说的话负责」,就是这个意思。

Spiral:「你要對自己說的話負責,但也要對別人聽到你所說的話負責。」這句話的潛台詞是,當你擁有權力時,你的一言一行都會被賦予額外的意義。因此身為權力的擁有者,你有義務主動拒絕、主動防範可能的傷害。就像三聯最近的文章所說,騷擾的界定,不能只看騷擾者一方的感受,更要看被騷擾者是否有能力拒絕。權力的不對等,會導致被害人違心地回應。

频道:@RollerRolling
9
OpenAI 推出了 MacOS 桌面端应用,按 Option + 空格可调出快捷 prompt 输入框,支持屏幕截图、上传多个本地文件(可 drop 上传)、选中本地文档内容进行提问,同时也支持语音输入。官网称 Windows 端会在今年晚些时候推出

频道:@RollerRolling
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VR、AR 工程师 Gabriel Enriquez 用 Stable Diffusion 和 ComfyUI 把谷歌街景转化为流动的漫画,这里是他分享的教程

频道:@RollerRolling
🤩9🥰3
How I Experience Web Today

开发者 Guangyi Li 抽象提炼了一下如今我们的互联网体验,而在他的帖子底下人们还在建议增加更多的「体验点」

频道:@RollerRolling
😁8👍3
Here’s Your Change —— 关于设计、科技和产品的湿货资讯

📨 Here’s Your Change 是一份围绕设计、科技、AI 和创新产品的Newsletter,特点是夹带私货和发散性评论,附带一些互联网猎奇。目前刚开启周更,已推出两期,感兴趣的朋友欢迎订阅

🖥 Newsletter 搭在开源平台 Quail 上,由开发者 Lyric 创立(开发者自己也是平台的深度用户),它支持多种推送渠道、界面简洁轻量并自带内容导航。像设计专栏 DEX 周刊、AI 专栏 AIGC Weekly橘子汽水铺都从其他平台迁移了过来。如果你也想轻启动自己的 Newsletter,不妨试一试

频道:@RollerRolling
🥰6👍3😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Calculating Empires —— 记录 5 个世纪技术与社会发展的巨型图谱

👁 Calculating Empires 是一个非常壮观的对于技术和社会演化的可视化图谱,记录了从 1500 年开始 5 个世纪以来殖民化、军事化、自动化和圈地运动的技术模式,展示了这些力量如何持续地进行支配,以及如何被化解

🔍 项目围绕四大主题展开:通信、计算、分类与控制,你可以观察到有哪些古老的技术被沿用至今,而它们又如何改变了社会结构。例如,在手机、个人电脑和互联网崛起的时代,信息传播为权力操控提供了新的契机(Communications as Spaces of Manipulation)

🧩 在项目介绍中,它引用了法国历史学家费尔南·布罗代尔的话,「如果一个人想要理解这个世界,就必须确定力量、潮流和个体运动的层次结构,然后将它们组合起来形成整体的格局」

频道:@RollerRolling
👍173
#AI #Web #Game

汤很热 —— AI 海龟汤

🐢 独立开发者碎瓜做了一个 AI 海龟汤游戏,他把海龟汤的汤面和汤底告诉 AI,让它去判定玩家的猜测。游戏里设置了多个故事,你可以随意择一开始,有 8 次猜测的机会,别忘了打开背景音乐!

🥣 而在游戏之外,碎瓜还用 2 万条真人 AI 海龟汤数据评估了不同大模型的推理能力,过程和答案一样有趣。正如 Ethan Mollick 所言「Always invite AI to the table」

频道:@RollerRolling
6👍1🔥1👻1
#AI #Product #iOS

Miley AI —— 日常记录 + AI分类

🤖 独立开发者 Baye 的新产品 Miley AI,一款主打「记录+智能体的个人记忆AI」

🗣 Miley 的主要功能是通过语音或文字快速记录你的每日信息,而后对录入的内容进行 AI 分析转化为不同类型的结构化数据,比如对花费信息进行记账、把做的事情转为 To-Do List、给心情配上对应的 Emoji 等等

💪 开发者最近还更新了对于身体症状的识别,可用于记录健康状况,也做了和 Apple Health 的同步。这样通过语言量化健康的方式可能比较适合老年或者非可穿戴人群,不过重要的是 Miley 可以像这样不断挖掘新的应用场景(比如装修、语言学习 etc.)

🔗 iOS 可以在 这里 下载,免费版支持 30 分钟语音识别和 30 次智能体次数,高级会员支持 300 分钟和 300次,开发者建议如需订阅请在国区购买

频道:@RollerRolling
👍8