Roller | AI AGENT 中文社区 – Telegram
Roller | AI AGENT 中文社区
9.07K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
频道推荐:House of Gen AI

👁️ 除了每日分享设计和科技类工具的内容以外,我也因工作关系常常使用各种视觉模型来生成图片,所以决定创建一个 AI 图片的频道,用来当作一本视觉日记

👁️‍🗨️ 对于这类内容感兴趣的朋友欢迎关注支持一下,如果你有特别喜欢或是想要看到的内容,也鼓励你分享,我会试着生成出来!

🚪 频道传送门:@genai9999
2👍2👾2
AI 随想:用 Cursor 来做自己的小工具

⌨️ 主编我本身几乎是一个编程小白,除了制作过一些小的网页以外没有怎么写过代码。但是,最近 Cursor(AI 文本编程软件)的到来改变了这个状况除了写过自己的六十四卦钟以及手搓了一个复习易经内容的假 Duolingo 以外,我决定和它协作,看看如何用它来分析 Telegram 频道的数据

🎢 我觉得 Cursor 非常的初学者友好的原因是,在我建立好文档后,我只用英文 prompt 说「我想要把一个 Telegram 频道的数据拉出来,这样我能分析一下这个频道的流量以及转评赞之间有没有什么规律」(其实你也可以用中文和它对话的)。在那之后,它便帮我写了一个相对应的爬虫,并且告知我我需要先登入 Telegram 去创建一个新 app,然后将 app 的 API key 复制给它

🔑 当 Cursor 获得了 API key 以后,它便自己帮我把爬虫运行起来然后把频道里的所有数据都拉下来了,这整段过程花了大概 30 分钟左右(因为中间有些运行 Python 的步骤花了我一些时间来理解)。严格意义来说,它的任务已经完成了,但是我还没罢休,直接让它帮我分析这些数据里的规律以及洞察,它也很负责任的写了后续的分析工具,并且返回给我了以上的分析结果

📝 同时,我也将爬虫返回的数据 .csv 文档给到了 ClaudeChatGPT,但是却发现 Claude 能给出更多有用的资讯以及建议,原因是因为它也会自己写分析工具,然后返回给我它分析出来的洞察

📒 以上的过程对一位有经验的程序员来说是一个简单到不能再简单的事情了,但是对于像我这样的编程小白来说它简直是打开了新世界大门。接下来,我会想要与 Cursor 一起分析一下我的聊天记录;继续写一些日常能帮我解决问题的小插件;等等

💬 最近,我在小红书上面看到有人说「Cursor 的到来导致了各种各样的垃圾 app 的泛滥」,但是我完完全全不这么认为。发明平板电脑概念的研究员 Alan Kay 一直希望能让所有凡人都在数码世界里面创作(俗称end-user programming),而电脑却变成了一个「消费工具」这件事情让他很难过。在有了最近与 Cursor 协作的体验后,我希望,甚至相信 Cursor 以及它们同类的产品可以改变这个现状,让大家看到代码不再畏惧,随时随地手搓一个自己需要的奇葩工具

📍作者 Twitter
👍6👀42
Genmoji —— 生成自己的 emoji

😬 Genmoji 是由 Apple 在 iOS 18 中推出的一项基于生成式 AI 的新功能,全称为 「生成式表情符号」。它允许用户通过输入文字描述,如「一只戴着墨镜的恐龙在跳舞」,由 AI 自动生成独一无二的表情符号或动画形象。这些表情可高度自定义细节,并直接用于 iMessage、邮件等场景

📝 看到有些人表示说这个设计不太有用甚至没有意义,我也相信大部分的 iPhone 用户这辈子都不会去使用这个功能,但是我相信它还是一个很有意义且好玩的功能 —— 给到更多人属于他们的抒发方式和语言本身是一个有意义的事情

📱 如果你也有国际版的 iPhone 15 Pro 以上的手机,不妨在 iMessage 中试试它的效果吧!

🤞🏽 听说四月开始国行的 iPhone 也有可能会开始支持 Genmoji
👍6🆒6🤓3
用 AI 工作流搭建的 Hacker News 每日播报

👀 或许很多人对 Hacker News 有所听闻,它是一个由孵化器 Y Combinator 维护的开发者论坛,许多开发者每天都会固定去上面看看有什么新项目或是新闻

🎧 频道面条实验室的作者做了个 AI 工作流,抓取 Hacker News 每日热门文章生成中文播客,这样你也可以每天在上班路上听业界里面的科技新闻了

🎙️ 播客地址

👩🏽‍💻 GitHub 代码
👍6
Scribe —— 99 种语言实时转录,超越 Whisper 的语音转文字模型

🎙️ ElevenLabs 推出 Scribe :一个超高准确性的语音转文字模型,能处理复杂真实场景的音频,支持99种语言转录,自动标记说话人切换和单词时间点,还能识别背景中的笑声等非语音事件,结构化数据输出方便开发者直接调用

📊 在多个国际测试中,Scribe 表现超越 Gemini、Whisper 等热门模型,尤其在意大利语、英语等97种小语种中错误率最低,让不同语言的语音识别更可靠。 开发者还可通过 API 接入获取带详细标记的JSON文本,普通用户也能在后台直接上传音视频生成格式化的文字稿 后续还会推出低延迟版本,适合实时场景使用

📝 在语音转文字的模型迭代下,我相信接下来会有更多的语音原生的产品出现
43👍3
🚀 Prompt 征集时间 🚀

在评论区分享一个你最喜欢、最出乎意料的有趣 prompt 吧!
🆒4👍2
无论你现在对什么感兴趣,我们都期待你发表你的作品。我们想要做的事情一开始或许都不会有太好的成绩(包含了这个频道的运维),但是坚持下去它必定会进化成很好很有力量的事情

把这当作宇宙发射的信号吧~周六愉快 :)
21
Meta 停止「事实核查」的制度

🎙️ Meta(Facebook)正在转变其内容管理策略,放弃自2016年以来实施的集中式事实核查机制。这个机制最初是因应川普当选和英国脱欧事件而设立的。Zuckerberg 认为 Twitter(现在的X)的「社区笔记」模式更有效,并计划采用类似的方案

📮 感觉维基百科式的社区笔记就是王道,社区笔记则能在普遍性话题上提供更快速和多元的反馈
2👀1
微软宣布 Skype 五月将永久下线,再会了
😢8👍3🕊2
One Court —— 视障人士看球神器,用指尖感受NBA全场

🏀 不晓得大家有没有想过视障人士是如何看球赛的

👁️ onecourt.io 所研发的触觉设备让视障人士正是一款可以通过指尖观看现场体育比赛的工具

👓 这款笔记本电脑大小的技术使用触觉或可追踪的振动。当球移动时,视障人士能在触觉设备上感受到振动,复制球在球场或竞技场中的位置和移动轨迹

📮 这篇文章是转发给你的吗?点击这里加入频道
👍75
Motiff 妙多 —— 让 AI 融入设计动线

🛠 传统设计工具如同手工作坊,图层整理、规范维护消耗大量精力。Figma 搭建了标准化工作台,而 Motiff 妙多正在探索人机协作的工业化路径,通过三个模块构建自动化设计动线:

⚙️ 标准化模块:AI 设计系统
- 快速识别过往设计稿,智能整理样式和组件
- 可回溯组件的使用场景和频次
- 支持对于文本、颜色、组件的检查

🗃 自动化产线:AI 工具箱
- AI 智能识别场景,并基于输入,生成相同结构的文本和图片
- 结合团队设计资源,智能填充文本、图片、图标,更符合实际需求
- 一键结构化,无需手动添加自动布局

🔮 创意试验场:AI 实验室
- 文生UI
- 根据框选位置推荐可填充内容

🤔Figma AI 相比,Motiff 的 AI 功能介入更深,而 Figma 则选择在不打破设计师工作模式的前提下,专注于优化高频用例。界面设计,作为实践与创意交织的工种,AI 接管重复性劳动或许提升了效率,但当设计师将“非创意”视作琐碎而外包,是否会逐渐失去对细节的感知,反而削弱真正创意的深度与独特性?

📮 这篇文章是转发给你的吗?点击这里加入频道
👍83👀3