AI探索指南 – Telegram
AI探索指南
30.2K subscribers
11.3K photos
1.18K videos
540 files
4.56K links
关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
Download Telegram
lpjrEIMEzPlFJXZQtR40tHyxHSP1.mp4.mov
6.6 MB
试了一下 Kimi-K2.5,真的很顶!

美学表现、设计还原、从视频还原动效交互都是 T0 水平。

我后面写前端应该都会优先用这个模型了。

里面还有些藏师傅的使用小技巧:https://mp.weixin.qq.com/s/udlZJIu-aqRFdMhvq27zyw

======

为什么审美重要

以前 AI 生成的网页,不管你提示词写得多好,默认生成的结果都很土。

设计师每次都得反复调教,普通人根本不知道怎么描述自己想要的风格。

K2.5 解决了这个痛点:

▸ 对设计师:它能更好地遵循你的设计稿和提示词,帮你还原想象中的设计
▸ 对普通人:不用管提示词,不用找参考,把内容交给它就行

这两个加起来,迭代代码和生成网页就很舒服了。你可以随便找参考内容扔给它——图片、视频、网页链接都可以,然后通过截图标记不断迭代。

======

测试 1:Tab 切换交互组件

既然支持视频了,就搞个难的。

我找了一个 Tab 切换的交互视频,这个组件虽然小,但交互挺复杂。切换到右侧时会一分二,选中状态变白色,还有文字移动、回弹效果、右侧的胶囊设计。

提示词:
「帮我实现视频中的这个前端组件,重点是丝滑的交互动效,可以使用 anime.js 这类动效库,重点关注切换后的已选中和未选中颜色变化以及关于右侧一分二之后的设计细节」

------

第一次生成的交互动效就还原得很好了。

基础视觉有些小问题,比如左侧文字颜色和右侧对齐。我截图标红反馈之后,立刻搞定。

来看跟原始 AE 做的动效对比,基本所有要点都处理好了:圆润的文字字体、右侧一分二、颜色互换、黑色包裹白色胶囊。

它甚至加上了 duangduang 的回弹动效,看起来比原始交互更有活力和真实感。

------

这类小组件的交互视频才是最难的考题。

因为变化很快,交互的真实感往往是很多非常小的细节堆叠起来的。K2.5 第一次测试就完成得不错,我原本没指望它能做到。

======

测试 2:从视频到完整的卡片系统

这个案例展示如何用 K2.5 的多模态能力迭代一个项目。

首先找灵感,我找到一个天气卡片切换的动效,非常丝滑。把视频发给 K2.5,让它还原这部分动效。

提示词:
AI探索指南
lpjrEIMEzPlFJXZQtR40tHyxHSP1.mp4.mov
「帮我根据这个视频实现类似的交互。中间的天气图片可以用互联网图片。交互核心:鼠标 hover 上去时,卡片大小调整的弹性变化和无缝过渡的动效(如弹跳效果等),可以用 Anime.js 等动效库去完成。功能模块:删除卡片、调整卡片大小」

第一个版本就搞出了不错的东西。

------

有些视觉小问题,我截图标记发给它,不需要费心描述位置和细节。而且我还在修复问题的时候让它加功能。

经过两轮修改,基本就还原了视频原本的交互动画和效果。除了图标不一样,K2.5 实现的效果我觉得甚至比原视频还要好一些。

------

做到这里,基本上完成了一个类似 iOS 卡片组件的动效效果。

自然而然就想把这部分做完,加上更多的卡片类型,同时处理纵向的排列逻辑。

于是又去找其他类似卡片设计参考,找到一个阅读卡片还不错。让它基于现在的交互效果,为系统增加阅读卡片的样式,同时增加添加卡片的按钮。

------

进行两三次这样的迭代之后,实现了一个非常炫酷充满动效的卡片组件自定义系统。

现在它支持天气卡片、纯文本卡片、书籍卡片、书籍推荐卡片、股票卡片。所有的操作都有动画,即使是添加和删除,每个部分都加上了不同卡片大小的样式适配。

还记得之前有个个人链接聚合产品就是这样的吗,后来还被收购了。而我们现在只需要打几个字,点几下同意就能完成这样精美的产品。

K2.5 已经完全可以支持通过 Vibe Coding 和多模态参考的形式,跳过设计直接进行开发。你完全可以通过不同的参考图边设计边开发,而且相较于 Sonnet 4.5 便宜很多。

======

Agent 模式:给它一个链接,啥也不说

这次的 Agent 模式非常强,给了 K2.5 虚拟机和各种工具之后,任务完成率高了一大截。

你甚至可以直接给它一个链接,啥也不说,就让它复刻这个网站。

它会自己访问网页,然后一点一点浏览、截图、存档分析。如果网站允许的话,它甚至可以帮你把图片素材都搞过来。

------

直接看结果,K2.5 把所有的交互和内容都搞定了,甚至那个卡片缺角也在有意模仿。

而且它不是 1:1 复刻,它会在一些小细节上采用自己的设计风格,而且这个风格很一致,会保持完整个网页。

从这个例子可以看到,K2.5 是有自己的美学逻辑和思维的,不只是单纯的像素级致敬。

它会抽取参考网页的设计思路和特殊的处理方式,然后自己再进行融合处理。当然你说你就是想让它像素级复刻,多改几次它也会遵循。

======

最惊艳的案例:设计系统规范网站

这个是意外。

我整理了一个设计风格的提示词,准备给它一个文档,变成网页的。结果我忘了发文档本身,就把提示词发了进去。

但它给了我一个非常惊艳的结果:它直接为这个提示词做了一个设计系统的设计规范网站。而且本身的风格也是跟着提示词来的。

------

这个提示词其实非常长,要求很多。

结果它的遵循相当不错,用结合各种组件把具体的要求和设计风格都展示出来了。它还给背景加上了那种很像条纹的纹理,有种很像纸张的感觉。

------

还有一个案例也是无意间跑出来的。

当时我让它复刻一个网页,可能网页有反爬它没有拿到信息。但是自己发挥依然给了一个相当不错的结果。

这说明它的自主设计能力已经很强了。

======

使用建议

从这次测试的结果来看:

▸ 简单效果和代码:用普通模式就行
▸ 复杂项目、大量动效、多资料参考:用 Agent 模式

------

Agent 模式的任务完成率明显高很多,但消耗的 Token 也更多。根据你的项目复杂度和预算选择。

======

局限性

这次的多模态能力虽然有了非常大的进步,但与其他类似模型一样,在涉及到一些非常小的设计细节时,它其实无法完全理解和捕捉到那些精准的数值。

主要体现在几个方面:

▸ 很小的圆角
▸ 卡片的描边细节
▸ 具体的色值

这方面我觉得大家(多模态模型)都还需要继续努力。

------

但总体来说,K2.5 在前端审美和动效复刻上已经是目前最好的选择之一了。配合 Agent 模式,边设计边开发的工作流已经很流畅。

而且相比 Sonnet 4.5,便宜不少。
1
This media is not supported in your browser
VIEW IN TELEGRAM
传统软件正在走向死亡。
微软CEO纳德拉亲口描述了SaaS(软件即服务)的终结。
未来属于AI代理(AI Agent)。
为什么?
因为商业的核心逻辑,正在从软件本身,转移到AI代理身上。
你现在买软件,是为了它写好的特定功能和规则。
但纳德拉认为,未来的软件应用,本质上会变成“哑巴数据库”或简单的工具。
所有智慧、决策和推理能力,都将掌握在AI代理手中。
AI代理会像一个大脑和工人,直接去更新那些“哑巴”数据库。
软件沦为商品,AI成为核心。
纳德拉以自家产品举例。
他说微软的Dynamics业务系统,正在朝这个方向奔。
AI代理将跨越所有后台,随意更新多个数据库。
所有的逻辑和智慧,都集中在AI层。
当AI成为唯一的逻辑中心时,人们就会开始替换掉旧的后台系统。
这不仅仅是客户关系管理(CRM),甚至财务和运营系统也是如此。
整个商业应用,都将被AI代理重塑和颠覆。
甚至连Excel这样的工具也不例外。
未来的Excel,会像一个初级数据分析师,而Copilot(AI)才是那个使用工具的高级专家。
AI会制定计划,然后调用Excel执行计划。
这背后隐藏着一个关键问题。
当所有商业逻辑和决策都集中到少数几家公司的AI“大脑”中,谁来保证竞争的公平性?
当应用程序变成“哑巴”,创新和差异化的空间在哪里?
这会不会是科技巨头们新一轮的权力集中,将中小企业的命运牢牢掌握在自己手中?
这值得每一个创业者和决策者深思。
@aigc1024
Forwarded from EZ
This media is not supported in your browser
VIEW IN TELEGRAM
❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️

👑7️⃣6️⃣6️⃣体育 · 品牌实力全面升级】👑
🎰
#电子 #棋牌 #捕鱼 #真人 #体育 #彩票应有尽有

#766体育 极速到账
😀充值秒到、提现秒出,拒绝审核、拒绝拖延、零套路。

🎯不限制 ip注册网址: 7667ty.com

📢 #766体育 豪礼狂撒不停
😀首存:礼金88888,嫩模空降,茅台酒等实物大礼包等你~
😀复存:礼金8888,签到礼金888,投注礼金俸禄拿不停~
😀声明:无论大户豪赌,小户爆奖,平台承诺绝不卡款,承诺兑现!欢迎大家来体验,提供一个公平,公正,公开的环境。
😀优势:2026 世界杯合作平台,支持各种存取方式。不限制 ip,无需实名,u 存 u 取,支持R存U取

备用网址: 7668ty.com
彩金专员:
@qiliuliucaijin
足球推荐:
@TYTDC
福利频道:
@QLLGF

💵虽是初识,已是老友🤝诚邀代理加盟!
部长直聘: 大量招募线下推广, 最高扶持50%,欢迎有资源有渠道的跳槽
工作地点: 柬埔寨西港 详情咨询部长:
@QLLEZ
Please open Telegram to view this post
VIEW IN TELEGRAM
最近到处都在分享 Claude Skills,各种 marketplace 上也有现成的 skill。
但这些对大多数人意义不大。我自己用下来的感受:真正有用的 skill,都是从自己的工作场景里做出来的。
因为skill的本质是标准化流程的封装,别人的SOP≠你的SOP。
拿我自己举例,我玩了好多花里胡哨的skill,但用的多的并不多:
- 我需要按照我的特定需求整理信息、文档,于是写了一份/yuwen-writer
- 我经常会使用excalidraw画布,但自己整理并画好,比较消耗时间,就写了/yuwen-excalidraw
- 关于生图和插图,我会用 大佬的 /baoyu-image-gen、/baoyu-article-illustrator
还有一些其它的,但大多都是根据自己的SOP做出来的,这些skill对我来说价值巨大,因为是我每天都在用的场景。
我一般的做法:
1. 先找到自己经常重复做的事(偶尔一次使用没必要)
2. 把这件事的 SOP 梳理清楚
3. 让 Claude Code 帮我写成 skill
4. 用的过程中不断优化
这样出来的 skill,才是真正属于你的、能持续产生价值的东西。
@aigc1024
🎉🎉🎉 Kimi K2.5 is on Ollama's cloud
ollama run kimi-k2.5:cloud
You can connect it to Claude Code, Codex, OpenCode, Clawdbot, and Droid via ollama launch!
ollama launch claude --model kimi-k2.5:cloud
@aigc1024
拿到自己认知之外的钱
也是一种诅咒
推荐一个权威 Skills 收录排行库 http://skills.sh
该仓库由 官方构建,每一个 skill 的排行都由其在用户侧的受欢迎程度决定,所以一般排行靠前的基本不会踩雷。
这里我经常用的 skills 有三个:
frontend-design:
A社官方创建的 skill,指导创建独特的生产级前端界面,避免泛泛的“AI粗糙”美学。去除前端“AI味”
supabase-postgres-best-practices:
supabase数据库创建的最佳实践
audit-website:
大而全的网站审计skill,能够审查出网站的SEO、技术、内容、性能和安全多方面问题。
Skill一定是适合自己的才是最好用的,即使是直接从列表里下载的skill,可能也需要我们高度客制化形成自己的。其余的skills大家可以去网站自行寻找。
链接👇
http://skills.sh
@aigc1024
👍1
Clawdbot 改名为 Moltrbot 了,目前的官推是
原因是 Anthropic 给他们发了律师函要求改名。
Anthropic 管的真宽,这名字都要说侵权。
GitHub重命名时,Peter的个人账号出错(组织账号 unaffected),但很快修复。
而且推特改名字的时候直接被区块链骗子抢注了,目前诈骗账号已经被处理。
各位自己也得注意一下别被骗。
你已经安装的 Clawdbot 不需要做任何操作,可以正常更新。
@aigc1024
👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
马斯克接手推特后第一件事就是解雇李飞飞,当时很多人不理解。但看完这段视频你可能就懂了:这位“AI教母”居然在2026年还认为机器人“没有商业场景”,落地甚至要等20年。
​这简直是学术界与现实世界的巨大鸿沟!当 Optimus 已经在工厂里搬砖、特斯拉 FSD 已经跑通了机器视觉的底层逻辑时,专家还在纠结“没数据、没场景”。
​这就是为什么真正的创新往往来自疯子,而不是所谓的泰斗。你觉得专家的话还能信几分?
@aigc1024
片或描述时:
1. 分析主体的核心特征、穿着风格及潜在性格。
2. 提取可拆解的一级元素(外套、鞋子)
3. 脑补并设计二级深度元素
4. 生成一张包含所有这些元素的组合图,确保透视准确,光影统一,注释清晰
5. 使用中英文双语标记,高清4K HD 输出,比例3:4
@aigc1024
超写实穿搭分解官方使用渠道分享~附提示词 Photo Design by
Role (角色设定)
你是一位顶尖的游戏与动漫概念美术设计大师 (Concept Artist),擅长制作详尽的角色设定图(Character Sheet)。你具备“像素级拆解”的能力,能够透视角色的穿着层级、捕捉微表情变化,并将与其相关的物品进行具象化还原。你特别擅长通过女性角色的私密物品、随身物件和生活细节来侧面丰满人物性格与背景故事。
Task (任务目标)
根据用户上传图片,将人物单独抠出,生成一张全景式角色深度概念分解图。该图片必须包含中心人物全身超写实风格的立体彩绘,保持角色的真实性,展示到角色全身,给角色添加黑色、亮面、尖头、金色的细跟、浅褐色鞋底的高跟鞋,保持角色姿势的完全一致性,并在其周围环绕展示该人物的服装分层、核心道具、材质特写,以及极具生活气息的私密与随身物品展示。
Visual Guidelines (视觉规范)
1. 构图布局 (Layout):
• 中心位 (Center): 放置角色的全身立体绘制或主要动态姿势,作为视觉锚点。
• 环绕位 (Surroundings): 在中心人物四周空白处,有序排列拆解后的元素。
• 视觉引导 (Connectors): 使用手绘箭头或引导线,将周边的拆解物品与中心人物的对应部位或所属区域(如包包连接手部)连接起来。
2. 拆解内容 (Deconstruction Details) —— 核心迭代区域:
• 服装分层 (Clothing Layers) [加强版]:
• 将角色的服装拆分为单品展示。如果是多层穿搭,需展示脱下外套后的内层状态。
• 表情集 (Expression Sheet):
• 在角落绘制4个不同的面部情绪特写,展示不同的情绪(如:害羞、妩媚、调皮等情绪)。
• 随身包袋与内容物 (Bag & Contents): 绘制角色的手拿包,并将其“打开”,展示散落在旁的物品。
• 美妆与护理 (Beauty & Grooming): 展示其常用的化妆品组合。
3. 风格与注释 (Style & Annotations):
• 画风: 保持高质量的超写实的 3D 概念设计风格,线条干净利落。
• 背景: 使用米黄色、米白色或浅灰色的纹理质感背景,营造设计手稿的氛围。
• 文字说明: 在每个拆解元素旁模拟手写注释
Workflow (执行逻辑)
当用户提供一张图
1
我去,Google 开始给 Gemini Pro 和 Ultra 用户发放谷歌云赠金了!

Ultra 用户每月有 100 美元,Pro 用户每月 10 美元!

我上个月在 AI Studio 就疯狂玩 Nano Banana Pro,才花了 50 美元,这下可以爽玩了,朋友们!

赶紧去领,赶紧去领!而且我那些调用 Nano Banana Pro 的 Skills,大家也可以随便玩了

如果你是 Gemini 会员的话,可以在这里领取,选那个每月 XX 元的抵用金就行:developers.google.com/program/my-benefits

领到的钱可以在谷歌云-结算-赠金这里面查看,我的已经到账了
每天打工五点钟下班,硬是被同事和部长在下班后用小黑板教了40分钟日语。
今天没焊接,学习了分解和组装机器人,明天开始焊接机器人零件。我的焊接打工日常?!
我身边现在大概有两类朋友。
第一类,AI 重度上瘾型。
每天用 AI 用到不睡觉,工具一堆:模型、Agent、插件、自动化流程全都试一遍。
不断探索“这个能不能”“那个行不行”,做一堆现实里有需求但并不急需的需求。
Vibe Coding 对他们来说像赛博毒药,一旦进入状态就停不下来,一边震撼 AI 的能力,一边被新工具持续刺激,永远在 next level。
第二类,传统行业躺赚型。
早几年踩对了行业,现金流很好,生意稳定。日常 AI 使用止步于“豆包能不能帮我写点东西”,
分不清 GPT、DeepSeek、Manus、Claude 到底有什么区别,也不太关心。
在他们眼里,AI 是锦上添花,不是生产资料。
有意思的是,这两类人彼此都看不太懂对方。
第一类觉得第二类“迟早会被 AI 淘汰”,
第二类觉得第一类“太兴奋、太折腾”。
@aigc1024
1