刚Vibe了一个多月,道阻且艰
2025年12月17日,我第一开始尝试Vibe Coding,在此之前都是古法编程,AI辅助,仅限于函数级的辅助。
2026年1月4日,我在第二个Vibe Coding项目上取得了小小的成功,于是开始加大了对Vibe的时间和精力投入。
。。。中间是短暂的快乐,因为需求复杂度不高,还不足以发现问题。。。
2026年1月15日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。失败原因:注册、启动、额度,步步踩雷,最终被模型太弱智打败
2026年1月18日,失败。。。工具 VsCode + Roo/Kilo,模型 GPT5.2/Claude opus 4.5。。。失败原因:免费渠道不稳定
2026年1月20日,失败。。。工具 Kiro,模型 Claude Sonnet 4.5。。。失败原因:模型太弱智,Bug生成器
2026年1月22日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:官方太草丹,不定时随机抽风
2026年1月24日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:同上
2026年1月26日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:降智、砍额度、官方抽风
总结了一下我失败的原因,抛开个人能力问题不谈,主要原因出在两方面:
1.工具:目前的工具主要有IDE和CLI两类,IDE的默认配置相对完善度较高,CLI则更依赖人工配置。但即使是完善度较高的IDE工具,同样很依赖人工配置。所以学习Vibe第一步就要学习工具调优,怎么设置Rules、怎么设置Agent、怎么设置Skills、怎么设置MCP,不会配置工具调优,就大概率像我这样,失败、失败、还是失败。
2.大模型:目前几乎所有渠道的大模型都是超售的,超售就意味着有无数的人在跟你抢夺有限的资源,而且越是完善的提示词设计(也包括工具调优),对资源的抢夺越是海量,所以你可能得到的不是一个抽风的大模型,就是一个降智的大模型。模型拉,就意味着要么降低需求复杂度,要么提高对人的要求。降低需求复杂度就只能一些简单的小任务;提高对人的要求,就是要么你有能力把复杂任务拆解成简单小任务组合,要么你有精力去反复测试修改BUG。两者皆非我愿。
另外还有一些别人用了成功,但我用了效果不是很好的东西:
1.需求细化:按理说需求细化一定是好事,但对于AI并不然,一个1000行的需求文档(远未达到上下文长度),足以暴漏它的记忆力缺陷,当然还是那句话,你有可能遇到了一个降智的模型。总之我遇到的情况就是,大模型一直拎不清楚需求,写设计文档漏需求,写工作计划漏需求,写任务清单漏需求。我上周末用了2天时间整理了一份需求(不带配置,大概19个文件),目前还在编码中(在等反重力的额度刷新。。。),磕磕巴巴的在做着,已经对结果不报期望了。
2.过程文档化:严格来说需求细分也是文档化的一部分,但这条我主要是针对工作计划、任务清单来说的。原本过程文档化应该也是好事,有利于切换会话或者切换模型甚至切换工具。但是像Antigravity这种工具,它喜欢把计划文档全藏在它自己的对话目录里,一旦对话长了的话,它其实也不清楚自己在这个目录里塞了多少东西了,记不住,根本记不住。完成的任务甚至都不记得去更新任务清单,任务清单跟工作计划不一致更是习以为常。解决办法可能是新开对话,但是Antigravity喜欢把文档拆的很散,即使开新对话,一样找不齐文档,如果你让它把分散的信息整理到一份文档里,不好意思,只要文档长度过千行,恭喜你,又收获了一个降智模型。
然后是别人没提,但我自己觉得有效的东西:
1.北京时间早上8点起来开始工作,这时候的大模型相对比较稳定,抽风和降智的可能性低一点。
2.北京时间晚上10点之后可以收手了阿祖,外面都是美国人。
目前的情况:
目前我正在尝试使用 Codex,配置什么的还是我的短板,只能在站里边学边用,但很多东西因为接触时间太短,还达不到能完全看懂的程度,用起来还比较吃力。
比如就这个自动审批,我到现在都还没搞定,网上看过好几个版本的自动审批功能配置。有在 config.toml 里直接加配置项的,有在 Codex 启动命令里加参数的,甚至还有教加环境变量的。我都试过了,但都不太好使,而且可能是因为 Codex 版本演进的原因,一些旧的教程已经完全对不上了,有些参数放进去甚至直接报错,这也是为什么学起来这么费劲的原因。
省流就是:
1.不直观。命令行 + 英文;
2.大佬的东西太高。基础不够,看不懂;
3.网上的教程太旧。不能直接用。
接下来先用 Codex 完成手上这个项目后,下一步会继续尝试一下 Claude Code Cli 。这里说一个笑话,其实好长时间里,我连 cc 和 ccs、ccr、ccg、ccc、ccxxxx。。。都分不清有什么联系和区别。。。还是那句话,基础不够,大佬发好东西都看不懂。
最后再求助一个问题:
我用最简单的几条基础配置项创建了 Codex 的 config.toml 文件,让它能用公益站的API了,但是如果我想换回官方的账号,不知道应该怎么改配置呀?
就因为不懂这个,我现在一直没敢去买GPT账号,怕买回来也用不起来 😂
网上也找不到教程,AI教的也不靠谱(AI好像不知道啥是Codex,又或者它知道的Codex不是现在的这个 Codex Cli,总之回答的驴头不对马嘴的)
感谢站里的各位大佬一直以来的无私分享和指导 🫡
109 posts - 36 participants
Read full topic
via LINUX DO - 热门话题 (author: demotoo)
2025年12月17日,我第一开始尝试Vibe Coding,在此之前都是古法编程,AI辅助,仅限于函数级的辅助。
2026年1月4日,我在第二个Vibe Coding项目上取得了小小的成功,于是开始加大了对Vibe的时间和精力投入。
。。。中间是短暂的快乐,因为需求复杂度不高,还不足以发现问题。。。
2026年1月15日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。失败原因:注册、启动、额度,步步踩雷,最终被模型太弱智打败
2026年1月18日,失败。。。工具 VsCode + Roo/Kilo,模型 GPT5.2/Claude opus 4.5。。。失败原因:免费渠道不稳定
2026年1月20日,失败。。。工具 Kiro,模型 Claude Sonnet 4.5。。。失败原因:模型太弱智,Bug生成器
2026年1月22日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:官方太草丹,不定时随机抽风
2026年1月24日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:同上
2026年1月26日,失败。。。工具 Antigravity,模型 Claude Opus 4.5。。。。失败原因:降智、砍额度、官方抽风
总结了一下我失败的原因,抛开个人能力问题不谈,主要原因出在两方面:
1.工具:目前的工具主要有IDE和CLI两类,IDE的默认配置相对完善度较高,CLI则更依赖人工配置。但即使是完善度较高的IDE工具,同样很依赖人工配置。所以学习Vibe第一步就要学习工具调优,怎么设置Rules、怎么设置Agent、怎么设置Skills、怎么设置MCP,不会配置工具调优,就大概率像我这样,失败、失败、还是失败。
2.大模型:目前几乎所有渠道的大模型都是超售的,超售就意味着有无数的人在跟你抢夺有限的资源,而且越是完善的提示词设计(也包括工具调优),对资源的抢夺越是海量,所以你可能得到的不是一个抽风的大模型,就是一个降智的大模型。模型拉,就意味着要么降低需求复杂度,要么提高对人的要求。降低需求复杂度就只能一些简单的小任务;提高对人的要求,就是要么你有能力把复杂任务拆解成简单小任务组合,要么你有精力去反复测试修改BUG。两者皆非我愿。
另外还有一些别人用了成功,但我用了效果不是很好的东西:
1.需求细化:按理说需求细化一定是好事,但对于AI并不然,一个1000行的需求文档(远未达到上下文长度),足以暴漏它的记忆力缺陷,当然还是那句话,你有可能遇到了一个降智的模型。总之我遇到的情况就是,大模型一直拎不清楚需求,写设计文档漏需求,写工作计划漏需求,写任务清单漏需求。我上周末用了2天时间整理了一份需求(不带配置,大概19个文件),目前还在编码中(在等反重力的额度刷新。。。),磕磕巴巴的在做着,已经对结果不报期望了。
2.过程文档化:严格来说需求细分也是文档化的一部分,但这条我主要是针对工作计划、任务清单来说的。原本过程文档化应该也是好事,有利于切换会话或者切换模型甚至切换工具。但是像Antigravity这种工具,它喜欢把计划文档全藏在它自己的对话目录里,一旦对话长了的话,它其实也不清楚自己在这个目录里塞了多少东西了,记不住,根本记不住。完成的任务甚至都不记得去更新任务清单,任务清单跟工作计划不一致更是习以为常。解决办法可能是新开对话,但是Antigravity喜欢把文档拆的很散,即使开新对话,一样找不齐文档,如果你让它把分散的信息整理到一份文档里,不好意思,只要文档长度过千行,恭喜你,又收获了一个降智模型。
然后是别人没提,但我自己觉得有效的东西:
1.北京时间早上8点起来开始工作,这时候的大模型相对比较稳定,抽风和降智的可能性低一点。
2.北京时间晚上10点之后可以收手了阿祖,外面都是美国人。
目前的情况:
目前我正在尝试使用 Codex,配置什么的还是我的短板,只能在站里边学边用,但很多东西因为接触时间太短,还达不到能完全看懂的程度,用起来还比较吃力。
比如就这个自动审批,我到现在都还没搞定,网上看过好几个版本的自动审批功能配置。有在 config.toml 里直接加配置项的,有在 Codex 启动命令里加参数的,甚至还有教加环境变量的。我都试过了,但都不太好使,而且可能是因为 Codex 版本演进的原因,一些旧的教程已经完全对不上了,有些参数放进去甚至直接报错,这也是为什么学起来这么费劲的原因。
省流就是:
1.不直观。命令行 + 英文;
2.大佬的东西太高。基础不够,看不懂;
3.网上的教程太旧。不能直接用。
接下来先用 Codex 完成手上这个项目后,下一步会继续尝试一下 Claude Code Cli 。这里说一个笑话,其实好长时间里,我连 cc 和 ccs、ccr、ccg、ccc、ccxxxx。。。都分不清有什么联系和区别。。。还是那句话,基础不够,大佬发好东西都看不懂。
最后再求助一个问题:
我用最简单的几条基础配置项创建了 Codex 的 config.toml 文件,让它能用公益站的API了,但是如果我想换回官方的账号,不知道应该怎么改配置呀?
就因为不懂这个,我现在一直没敢去买GPT账号,怕买回来也用不起来 😂
网上也找不到教程,AI教的也不靠谱(AI好像不知道啥是Codex,又或者它知道的Codex不是现在的这个 Codex Cli,总之回答的驴头不对马嘴的)
感谢站里的各位大佬一直以来的无私分享和指导 🫡
109 posts - 36 participants
Read full topic
via LINUX DO - 热门话题 (author: demotoo)
【AICodeMirror周一福利来啦!】
▍AlCodeMirror 周一福利日 ▍
🏆️ 奖品详情:
10 个 价值 20RMB 订阅激活码(支持使用 codex/GeminiCLI) (相当于 100 刀 codex/ 29 刀 GeminiCLI)
:three_o_clock: 活动时间:
开始时间:发帖时间
截止时间:2026 年 1 月 27 日 14:30
📝 参与方式:
在本帖下回复AICodeMirror使用体验或其他
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用 官方抽奖工具 随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 48 小时内在本帖公布,并通过私信通知领奖方式(抽中可以主动私聊我们,以防我方账号私聊上限,耽误您宝贵时间)。
该激活码可以转增,重复中奖,激活码仍然发放,但同一账号不能重复激活。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
▍AlCodeMirror ▍
国内第一批老牌 CC/CX/Gemini 编程工具中转站,始于2025年6月11日,至今已稳定运营200天
合规运营、稳定可靠、产品多元,一切尽在 : AICodeMirror
😼 我们的优势
● 1. 合规运营: 无手续费开票/对公转账/合同采购单齐全
● 2. 稳定可靠: 全球高保/国内直连多线路保障
● 3. 产品多元: 包月订阅/按量付费均有
🌟 我们的产品
● ClaudeCode:(折扣价:2元1刀)
● Codex:(折扣价:0.15元1刀)
● Gemini:(折扣价:0.5元1刀)
群内有每日AI资讯/技术交流/不定期抽奖,欢迎大家加入群聊玩耍
感谢您的参与,祝您生活愉快!
189 posts - 183 participants
Read full topic
via LINUX DO - 热门话题 (author: AICodeMirror)
Invalid media: image
▍AlCodeMirror 周一福利日 ▍
🏆️ 奖品详情:
10 个 价值 20RMB 订阅激活码(支持使用 codex/GeminiCLI) (相当于 100 刀 codex/ 29 刀 GeminiCLI)
:three_o_clock: 活动时间:
开始时间:发帖时间
截止时间:2026 年 1 月 27 日 14:30
📝 参与方式:
在本帖下回复AICodeMirror使用体验或其他
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用 官方抽奖工具 随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 48 小时内在本帖公布,并通过私信通知领奖方式(抽中可以主动私聊我们,以防我方账号私聊上限,耽误您宝贵时间)。
该激活码可以转增,重复中奖,激活码仍然发放,但同一账号不能重复激活。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
▍AlCodeMirror ▍
国内第一批老牌 CC/CX/Gemini 编程工具中转站,始于2025年6月11日,至今已稳定运营200天
合规运营、稳定可靠、产品多元,一切尽在 : AICodeMirror
😼 我们的优势
● 1. 合规运营: 无手续费开票/对公转账/合同采购单齐全
● 2. 稳定可靠: 全球高保/国内直连多线路保障
● 3. 产品多元: 包月订阅/按量付费均有
🌟 我们的产品
● ClaudeCode:(折扣价:2元1刀)
● Codex:(折扣价:0.15元1刀)
● Gemini:(折扣价:0.5元1刀)
群内有每日AI资讯/技术交流/不定期抽奖,欢迎大家加入群聊玩耍
感谢您的参与,祝您生活愉快!
189 posts - 183 participants
Read full topic
via LINUX DO - 热门话题 (author: AICodeMirror)
Invalid media: image
[抽奖]Google One Pro家庭组(美区) * 2
主题介绍:
是买的2年的美区号组的Google One Pro会员,无论你的账号在哪个区,应该是只要换美区IP就可以加入家庭组,无质保。
🏆️ 奖品详情:
奖品:Google One Pro家庭组(美区) * 2
:three_o_clock: 活动时间:
● 开始时间: Mon, Jan 26, 2026 7:12 PM CST
● 截止时间: Tue, Jan 27, 2026 12:00 PM CST
📝 参与方式:
在本帖下回复任意信息。
🔍️ 抽奖规则:
每位用户仅允许参与一次。 使用官方抽奖程序工具随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后1小时内在本帖公布,并通过论坛私信通知领奖方式。
中奖者请在开奖后七日内完成兑奖,逾期视为自动放弃。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
134 posts - 130 participants
Read full topic
via LINUX DO - 热门话题 (author: Biao.)
主题介绍:
是买的2年的美区号组的Google One Pro会员,无论你的账号在哪个区,应该是只要换美区IP就可以加入家庭组,无质保。
🏆️ 奖品详情:
奖品:Google One Pro家庭组(美区) * 2
:three_o_clock: 活动时间:
● 开始时间: Mon, Jan 26, 2026 7:12 PM CST
● 截止时间: Tue, Jan 27, 2026 12:00 PM CST
📝 参与方式:
在本帖下回复任意信息。
🔍️ 抽奖规则:
每位用户仅允许参与一次。 使用官方抽奖程序工具随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后1小时内在本帖公布,并通过论坛私信通知领奖方式。
中奖者请在开奖后七日内完成兑奖,逾期视为自动放弃。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
134 posts - 130 participants
Read full topic
via LINUX DO - 热门话题 (author: Biao.)
Clawdbot火了, 那就我不客气了:)AionUi Webui模式也可以当你“24h待命的小秘书”
----------------------
WebUi Remote模式 😈
1. WebUi Remote模式干啥的
一句话描述就是:开启后,服务会拉起一个“网页版”,支持你通过网页控制电脑里(或者部署在服务器里)的AionUi进行工作,手机、平板、另一个电脑,都可以访问哦!
当你有以下场景,就可以考虑开启Remote模式:
● 电脑在千里之外,工作资料电脑里,那你可以考虑远程指挥AionUi基于你的工作资料进行工作。
● 想在手机上执行一些需要调用MCP才能完成的工作,但是又不想给手机装MCP(权限、难度都是问题),那你可以考虑手机远程调用桌面端aionui来进行工作。
● 你是运维同学,你想监控服务器运行状态,但是你不想守在公司,你可以考虑在Linux上装无界面的AionUi并启动webui模式,在手机上使用网页版控制AionUi进行一些监控任务
// 以上三个场景都是AionUi用户提供,是他们360度无死角轰炸我的需求收集清单,才诞生了WebUi特性,如果大家有更多使用场景,欢迎回馈给我。
2. WebUi模式怎么开启?
方式一:界面直接开启:进设置 >> 选择WebUI Tab>> 启动WebUI >> 设置允许远程访问,这样你就可以获得一个“相同网络下可通信的网页版”。
方式二:通过下方教程用命令行启动(支持无界面部署远程)
GitHub
WebUI Configuration Guide
Free, local, open-source Cowork for Gemini CLI, Claude Code, Codex, Opencode, Qwen Code, Goose Cli, Auggie, and more | 🌟 Star if you like it! - iOfficeAI/AionUi
3 如何开启互联网服务?
但是如果你想要通过互联网(公网)通信,那你可以参考一下页面上挂的AionUi 远程外网连接教程(最简单的就是花10分钟选方案2,电脑上的aionui就可以被远端访问了)。
4. 爽用 - 账号密码安全登录
打开远端访问地址,直接启动Webui界面,爽用吧!做了自适应的,手机、电脑、平板都可食用。
V1.4就已经实现的一些小细节:
● 账号密码安全登录 :为了安全问题,做了一套完整的JWT验证,可防止XSS CORF DDOS 攻击;密码加密存储,防止解密。在开始启动WebUi时,需要创建一个登录帐户和密码才能访问 WebUI,确保只有授权用户才能使用。你的对话和数据也会受到用户身份验证的保护。
● 网络自动检测:做了一个本地ip和公网IP检测机制, 用于本地/外网访问。系统会自动检测适合连接的网络地址。在服务器上显示公共IP,在本地计算机上显示您的本地网络地址。
0 数据安全存储:这次为此了数据安全改了数据存储方案(更新版本会自动迁移),所有、配置都使用SQLite安全地存储在本地。目前数据存储3张表,user、message、conversations。
----------------------
好了,用得上的佬去试试最新包👇️ (或者下载V1.7.6版本的佬可以试试检查更新)
GitHub
Releases · iOfficeAI/AionUi
Free, local, open-source Cowork for Gemini CLI, Claude Code, Codex, Opencode, Qwen Code, Goose Cli, Auggie, and more | 🌟 Star if you like it! - iOfficeAI/AionUi
124 posts - 53 participants
Read full topic
via LINUX DO - 热门话题 (author: 瓦砾不是歪理)
Invalid media:
image
image
image
image
image
image
image
image
image
image
Clawdbot🔥爆了我的所有社交媒体(啊我指的是X),跟风去扒了一圈,我感觉自己不配…不过概念很好、能力也挺强,尤其是在tele中指挥远端的clawdbot干活儿,很安逸。大家可以去感受下:
X上的讲解
微信公众号文章
不过我建议想试试的话,找个干净点的环境哈(买个masos mini也行),不然你会感受到spoiler
关键是我看完后,感觉使用场景和AionUi的WebUi Remote模式有那么一点点像(不过它做得更极致哈),产生好奇心的我,去扒了Clawdbot的仓库,确实和AionUi的webui技术方案还挺像…
比如它IM通信的方式是WS,AionUi的WebUi也是WS通信👇️
再加上,最近也攒了一大波webui的issue和问题,之前大家问webui的问题我都只敢回:有bug,有段时间没更新了,等下个包修复下…
其实已经扛不住修了一波了…既然修复差不多了,那就把Webui开关放出来给大家溜一溜吧…
现诚挚的向大家介绍一个AionUi V1.4版本的新特性👇️(现在已经V1.7.7了)
----------------------
WebUi Remote模式 😈
1. WebUi Remote模式干啥的
一句话描述就是:开启后,服务会拉起一个“网页版”,支持你通过网页控制电脑里(或者部署在服务器里)的AionUi进行工作,手机、平板、另一个电脑,都可以访问哦!
当你有以下场景,就可以考虑开启Remote模式:
● 电脑在千里之外,工作资料电脑里,那你可以考虑远程指挥AionUi基于你的工作资料进行工作。
● 想在手机上执行一些需要调用MCP才能完成的工作,但是又不想给手机装MCP(权限、难度都是问题),那你可以考虑手机远程调用桌面端aionui来进行工作。
● 你是运维同学,你想监控服务器运行状态,但是你不想守在公司,你可以考虑在Linux上装无界面的AionUi并启动webui模式,在手机上使用网页版控制AionUi进行一些监控任务
// 以上三个场景都是AionUi用户提供,是他们360度无死角轰炸我的需求收集清单,才诞生了WebUi特性,如果大家有更多使用场景,欢迎回馈给我。
2. WebUi模式怎么开启?
方式一:界面直接开启:进设置 >> 选择WebUI Tab>> 启动WebUI >> 设置允许远程访问,这样你就可以获得一个“相同网络下可通信的网页版”。
方式二:通过下方教程用命令行启动(支持无界面部署远程)
GitHub
WebUI Configuration Guide
Free, local, open-source Cowork for Gemini CLI, Claude Code, Codex, Opencode, Qwen Code, Goose Cli, Auggie, and more | 🌟 Star if you like it! - iOfficeAI/AionUi
3 如何开启互联网服务?
但是如果你想要通过互联网(公网)通信,那你可以参考一下页面上挂的AionUi 远程外网连接教程(最简单的就是花10分钟选方案2,电脑上的aionui就可以被远端访问了)。
4. 爽用 - 账号密码安全登录
打开远端访问地址,直接启动Webui界面,爽用吧!做了自适应的,手机、电脑、平板都可食用。
V1.4就已经实现的一些小细节:
● 账号密码安全登录 :为了安全问题,做了一套完整的JWT验证,可防止XSS CORF DDOS 攻击;密码加密存储,防止解密。在开始启动WebUi时,需要创建一个登录帐户和密码才能访问 WebUI,确保只有授权用户才能使用。你的对话和数据也会受到用户身份验证的保护。
● 网络自动检测:做了一个本地ip和公网IP检测机制, 用于本地/外网访问。系统会自动检测适合连接的网络地址。在服务器上显示公共IP,在本地计算机上显示您的本地网络地址。
0 数据安全存储:这次为此了数据安全改了数据存储方案(更新版本会自动迁移),所有、配置都使用SQLite安全地存储在本地。目前数据存储3张表,user、message、conversations。
----------------------
好了,用得上的佬去试试最新包👇️ (或者下载V1.7.6版本的佬可以试试检查更新)
GitHub
Releases · iOfficeAI/AionUi
Free, local, open-source Cowork for Gemini CLI, Claude Code, Codex, Opencode, Qwen Code, Goose Cli, Auggie, and more | 🌟 Star if you like it! - iOfficeAI/AionUi
124 posts - 53 participants
Read full topic
via LINUX DO - 热门话题 (author: 瓦砾不是歪理)
Invalid media:
image
image
image
image
image
image
image
image
image
image
佬友们的战斗力太强了,再创新高
这是有史以来最高的一天,如果从0点到0点估计能超120亿tokens。
大家真有那么多用到AI敲代码的地方吗?说说看你们一般都用在哪吧~
120 posts - 113 participants
Read full topic
via LINUX DO - 热门话题 (author: Wong)
Invalid media: image
这是有史以来最高的一天,如果从0点到0点估计能超120亿tokens。
大家真有那么多用到AI敲代码的地方吗?说说看你们一般都用在哪吧~
120 posts - 113 participants
Read full topic
via LINUX DO - 热门话题 (author: Wong)
Invalid media: image
【注意避雷claw cloud,支付宝举报成立】推荐推荐项目,利用一下垃圾claw cloud给大家提供点服务
开局:先避雷 run.claw.cloud,一句话 服务拉胯,霸王条款拒不退款。
内容可能引起不适,请自行斟酌 (click for more details)
----------------------
正文:
欢迎各位推荐推荐,能部署来给各位佬友服务的,随便啥都行,别推黑灰产梯子啥的都行。不退款总得把这垃圾处理掉
----------------------
从下面评论拉上来的
内容可能引起不适,请自行斟酌 (click for more details)
----------------------
暂定1: 等我这两天搞点国模公益,感谢 【注意避雷claw cloud,支付宝举报成立】推荐推荐项目,利用一下垃圾claw cloud给大家提供点服务 - #3,来自 Cknight 、【注意避雷claw cloud,支付宝举报成立】推荐推荐项目,利用一下垃圾claw cloud给大家提供点服务 - #4,来自 guji0823
70 posts - 24 participants
Read full topic
via LINUX DO - 热门话题 (author: YougLin)
开局:先避雷 run.claw.cloud,一句话 服务拉胯,霸王条款拒不退款。
内容可能引起不适,请自行斟酌 (click for more details)
----------------------
正文:
欢迎各位推荐推荐,能部署来给各位佬友服务的,随便啥都行,别推黑灰产梯子啥的都行。不退款总得把这垃圾处理掉
----------------------
从下面评论拉上来的
内容可能引起不适,请自行斟酌 (click for more details)
----------------------
暂定1: 等我这两天搞点国模公益,感谢 【注意避雷claw cloud,支付宝举报成立】推荐推荐项目,利用一下垃圾claw cloud给大家提供点服务 - #3,来自 Cknight 、【注意避雷claw cloud,支付宝举报成立】推荐推荐项目,利用一下垃圾claw cloud给大家提供点服务 - #4,来自 guji0823
70 posts - 24 participants
Read full topic
via LINUX DO - 热门话题 (author: YougLin)
仓老师在推上跟人吵起来了
45 posts - 38 participants
Read full topic
via LINUX DO - 热门话题 (author: 倾风)
Invalid media: image
咱感觉站上了高位啊PS:话说最近佬们还珍藏苍老师吗?
45 posts - 38 participants
Read full topic
via LINUX DO - 热门话题 (author: 倾风)
Invalid media: image
真三级大佬(女装)绝不隐藏
转自推特@芙宁娜娜
66 posts - 56 participants
Read full topic
via LINUX DO - 热门话题 (author: loveless21)
Invalid media:
image
image
转自推特@芙宁娜娜
66 posts - 56 participants
Read full topic
via LINUX DO - 热门话题 (author: loveless21)
Invalid media:
image
image
【原创】从想法到工具:我把 AI 生成 PPT 的流程做成了一个 Skill
【原创】OpenCode + SVG:推荐一套省心可控的 AI PPT 生成方案 开发调优
上篇文章《OpenCode + SVG:一套省心可控的 AI PPT 生成方案》发出去后,收到不少反馈。
有人说照着做效果不错,但也有人问:“同样的 prompt,同样的操作,为啥我这边效果差那么多?”
这确实有点难搞。
复盘了一下,问题挺明显:
● 随机性大——同一段 prompt,换个模型或上下文,效果可能差很远
● 步骤多——分析内容、选风格、调参数、处理兼容性,新手容易卡住
● 隐性知识多——文章里没展开的细节,操作时容易踩坑
● 模型能力差距——免费模型经常断线、排版错位,建议直接用 Gemini 或 Claude 的主流模型
那篇文章更像是"授人以鱼",教的是一次操作;但没解决怎么让每次生成都稳定出效果的问题。
正好最近想研究 OpenCode 的 Skill 机制,就拿这个需求练手:把 AI 生成 PPT 的流程固化成一个可复用的 Skill。
这篇文章聊聊这个过程——成品长什么样、怎么用、做的时候踩了哪些坑。
----------------------
成果展示
先看效果。
这是用相同文稿内容跑出来的几个风格:
一行命令搞定:
/ppt-quick @report.md --style=品牌蓝
这份 Skill 内置了三种模式、五种预设风格。预设不够用的话,可以手动输入配色,或者让 AI 根据文稿内容联网查询后推荐。
对比一下:
----------------------
什么是 Skill?
Skill 就是给 AI 写的一份工作手册。
类比一下:你带实习生做 PPT 会怎么教?
1. 先讲整体流程:分析内容 → 选风格 → 出图
2. 给规范:字体用什么、间距多少、颜色怎么配
3. 给模板:封面页长这样、内容页长那样
4. 踩过的坑也交代一下:字号别太小,投屏看不清;内容主次要分明
Skill 做的是同样的事——把流程、规范、模板、注意事项写成文档,让 AI 按手册干活。
有了 Skill,AI 就不是"随机发挥",而是"按章办事"。
Skill 的结构
以这个 Skill 为例:
ppt-noscript-generator/
├── SKILL.md # 入口文件
├── commands/ # 命令定义
│ ├── quick.md # /ppt-quick 一键生成
│ ├── analyze.md # /ppt-analyze 文稿分析
│ ├── design.md # /ppt-design 风格设计
│ └── generate.md # /ppt-generate 批量生成
├── specs/ # 规范文档
│ ├── noscript-compatibility.md
│ └── design-system.md
└── styles/ # 风格定义
├── 01-minimalism.md
├── 02-consulting.md
└── …
核心是
怎么安装 Skill?
代码已上传 GitHub:
一是在 OpenCode 里直接粘贴 GitHub 链接,让 AI 自动安装。
二是手动下载后,把文件夹放到以下任一目录:
● 全局:
● 兼容 Claude:
● 项目级:
放好后就能在对话框里用
Mac 用户记得按
----------------------
使用流程
GitHub 文档写得很详细,这里提几个关键点。
两种模式:懒人模式一键生成,自定义模式逐步调整。
方式一:一键生成
适合需求明确、想快速验证效果的场景。
/ppt-quick @report.md --style=科技暗黑
AI 会自动完成:
1. 分析文稿,拆解成页面结构
2. 应用指定风格
3. 逐页生成 SVG
4. 输出到
方式二:分步执行
适合需要精细控制的场景,比如想调整页面拆解结果或自定义配色。
第一步:分析文稿
/ppt-analyze @report.md
→ 输出页面结构清单,可以修改
第二步:设计风格
/ppt-design
→ 选预设 / 自定义配色 / AI 推荐
第三步:批量生成
/ppt-generate
分步的好处是每一步都能介入。比如 AI 把内容拆成 3 页,你觉得太啰嗦,可以改成 2 页再继续。
考虑到大多数人对预设风格不满意,我做了三种风格输出模式:
模式一:预设风格库
5 种经典风格,开箱即用。
模式二:自定义风格
输入公司品牌色和风格偏好,生成定制规范。
需要提供:
● 主色(必填):如
● 配色方案(可选):次色、辅助色、背景色、文字色
● 风格关键词(可选):如 “简约”、“科技感”
● 参考案例(可选):喜欢的风格描述或链接
也可以只给主色,AI 会自动生成配套方案。
模式三:AI 智能推荐
分析文稿内容,联网查设计趋势,为每页推荐风格。
OpenCode 自带的 Agent 能力挺强,识别出主题后会自动联网查相关 PPT 风格,输出每页的配色方案和视觉隐喻建议。
我个人挺喜欢这个模式,有抽卡的乐趣。
生成完之后
SVG 导入 PPT 的步骤和上篇文章一样:
1. 把 SVG 拖进 PowerPoint
2. 右键 → 转换为形状
3. 现在可以编辑文字、调整颜色了
----------------------
怎么制作自己的 Skill
最后讲讲这个 Skill 怎么来的。制作过程没费多大功夫,关键在于定义清楚 Skill 要解决什么问题。
刚开始我想设计得很完美——支持更多风格、更灵活的配置、更智能的推荐……结果越想越复杂,迟迟动不了手。
后来换了思路:**先做最小可用版本,能跑通"分析 → 设计 → 生成"就行。**跑通后再根据实际问题迭代。
这个思路帮我快速落地了第一版,
就像做产品时的 MVP,不管前端效果,只看核心流程能不能跑通。
流程梳理清楚后,先拆解某个步骤手动验证。全部验证完,在项目对话里让大模型总结刚才的流程上下文,按 Claude Skills 的封装要求打包成 Skill 就行。
没什么难的,只要有点子都可以做成 Skill,方便自己也能分享给别人。
这只是我对 Skill 的初步体验。给自己挖个坑,多实践几次后再总结制作方法和踩过的坑。
----------------------
结语
从一篇方法论分享到一个可复用的 Skill,这个过程让我对"怎么把隐性知识显性化"有了更多体会。
换句话说,就是把脑子里的经验变成 AI 能理解的规则和可复用且批量执行的技能,这件事本身就很有成就感。
当然啦,现在这个 Skill 还是太粗糙了,后续想想办法直接导出为 PPTX 格式会更加好用。(再挖个坑…)
**试用后有问题或建议,欢迎留言。**❤️
30 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Vigorxu)
Invalid media:
image
image
image
image
image
image
image
image
image
image
image
【原创】OpenCode + SVG:推荐一套省心可控的 AI PPT 生成方案 开发调优
OpenCode + SVG:一套省心可控的 AI PPT 生成方案 [image] 前两天接到个活儿,要做个项目方案演示 PPT。 打开 PowerPoint 的那一刻,我盯着空白页面发了五分钟呆。slightly_frowning_face 说实话,作为一个产品,PPT 能力属实一般——内容我能写,但怎么让它好看 、有重点 、一眼能抓住人 ,这事儿我真不太行。 正好最近 Open…
上篇文章《OpenCode + SVG:一套省心可控的 AI PPT 生成方案》发出去后,收到不少反馈。
有人说照着做效果不错,但也有人问:“同样的 prompt,同样的操作,为啥我这边效果差那么多?”
这确实有点难搞。
复盘了一下,问题挺明显:
● 随机性大——同一段 prompt,换个模型或上下文,效果可能差很远
● 步骤多——分析内容、选风格、调参数、处理兼容性,新手容易卡住
● 隐性知识多——文章里没展开的细节,操作时容易踩坑
● 模型能力差距——免费模型经常断线、排版错位,建议直接用 Gemini 或 Claude 的主流模型
那篇文章更像是"授人以鱼",教的是一次操作;但没解决怎么让每次生成都稳定出效果的问题。
正好最近想研究 OpenCode 的 Skill 机制,就拿这个需求练手:把 AI 生成 PPT 的流程固化成一个可复用的 Skill。
这篇文章聊聊这个过程——成品长什么样、怎么用、做的时候踩了哪些坑。
如果你还不了解 OpenCode,或者没看过上一篇,建议先看这里 👉️ 【原创】OpenCode + SVG:推荐一套省心可控的 AI PPT 生成方案
----------------------
成果展示
先看效果。
这是用相同文稿内容跑出来的几个风格:
一行命令搞定:
/ppt-quick @report.md --style=品牌蓝
这份 Skill 内置了三种模式、五种预设风格。预设不够用的话,可以手动输入配色,或者让 AI 根据文稿内容联网查询后推荐。
对比一下:
----------------------
什么是 Skill?
Skill 就是给 AI 写的一份工作手册。
类比一下:你带实习生做 PPT 会怎么教?
1. 先讲整体流程:分析内容 → 选风格 → 出图
2. 给规范:字体用什么、间距多少、颜色怎么配
3. 给模板:封面页长这样、内容页长那样
4. 踩过的坑也交代一下:字号别太小,投屏看不清;内容主次要分明
Skill 做的是同样的事——把流程、规范、模板、注意事项写成文档,让 AI 按手册干活。
有了 Skill,AI 就不是"随机发挥",而是"按章办事"。
Skill 的结构
以这个 Skill 为例:
ppt-noscript-generator/
├── SKILL.md # 入口文件
├── commands/ # 命令定义
│ ├── quick.md # /ppt-quick 一键生成
│ ├── analyze.md # /ppt-analyze 文稿分析
│ ├── design.md # /ppt-design 风格设计
│ └── generate.md # /ppt-generate 批量生成
├── specs/ # 规范文档
│ ├── noscript-compatibility.md
│ └── design-system.md
└── styles/ # 风格定义
├── 01-minimalism.md
├── 02-consulting.md
└── …
核心是
SKILL.md 入口文件。AI 先读它,了解有哪些命令可用,再根据用户输入去读对应的命令文件和规范文档。怎么安装 Skill?
代码已上传 GitHub:
GitHub - vigorX777/ppt-noscript-generator: 是一个 Skill,帮助你将 Markdown 文稿快速转化为可导入 PowerPoint 的 SVG 文件,并支持多种预设风格选择,效果美观且可控。 使用流程参考公众号:懂点儿 AI 👇两种安装方式:
一是在 OpenCode 里直接粘贴 GitHub 链接,让 AI 自动安装。
二是手动下载后,把文件夹放到以下任一目录:
● 全局:
~/.config/opencode/skill/ppt-noscript-generator/● 兼容 Claude:
~/.claude/skills/ppt-noscript-generator/(注意:Claude 官方目录是 skills 复数,OpenCode 是 skill 单数,名字错了就调不起来)● 项目级:
.opencode/skill/ppt-noscript-generator/放好后就能在对话框里用
/ppt-quick 这些命令了。Mac 用户记得按
Command+Shift+. 显示隐藏文件夹。----------------------
使用流程
GitHub 文档写得很详细,这里提几个关键点。
两种模式:懒人模式一键生成,自定义模式逐步调整。
方式一:一键生成
适合需求明确、想快速验证效果的场景。
/ppt-quick @report.md --style=科技暗黑
AI 会自动完成:
1. 分析文稿,拆解成页面结构
2. 应用指定风格
3. 逐页生成 SVG
4. 输出到
./ppt-output/方式二:分步执行
适合需要精细控制的场景,比如想调整页面拆解结果或自定义配色。
第一步:分析文稿
/ppt-analyze @report.md
→ 输出页面结构清单,可以修改
第二步:设计风格
/ppt-design
→ 选预设 / 自定义配色 / AI 推荐
第三步:批量生成
/ppt-generate
分步的好处是每一步都能介入。比如 AI 把内容拆成 3 页,你觉得太啰嗦,可以改成 2 页再继续。
考虑到大多数人对预设风格不满意,我做了三种风格输出模式:
模式一:预设风格库
5 种经典风格,开箱即用。
模式二:自定义风格
输入公司品牌色和风格偏好,生成定制规范。
需要提供:
● 主色(必填):如
#FF6B00 或 “橙色”● 配色方案(可选):次色、辅助色、背景色、文字色
● 风格关键词(可选):如 “简约”、“科技感”
● 参考案例(可选):喜欢的风格描述或链接
也可以只给主色,AI 会自动生成配套方案。
模式三:AI 智能推荐
分析文稿内容,联网查设计趋势,为每页推荐风格。
OpenCode 自带的 Agent 能力挺强,识别出主题后会自动联网查相关 PPT 风格,输出每页的配色方案和视觉隐喻建议。
我个人挺喜欢这个模式,有抽卡的乐趣。
生成完之后
SVG 导入 PPT 的步骤和上篇文章一样:
1. 把 SVG 拖进 PowerPoint
2. 右键 → 转换为形状
3. 现在可以编辑文字、调整颜色了
----------------------
怎么制作自己的 Skill
最后讲讲这个 Skill 怎么来的。制作过程没费多大功夫,关键在于定义清楚 Skill 要解决什么问题。
刚开始我想设计得很完美——支持更多风格、更灵活的配置、更智能的推荐……结果越想越复杂,迟迟动不了手。
后来换了思路:**先做最小可用版本,能跑通"分析 → 设计 → 生成"就行。**跑通后再根据实际问题迭代。
这个思路帮我快速落地了第一版,
/ppt-quick 一键命令、AI 智能推荐都是后面加的。就像做产品时的 MVP,不管前端效果,只看核心流程能不能跑通。
流程梳理清楚后,先拆解某个步骤手动验证。全部验证完,在项目对话里让大模型总结刚才的流程上下文,按 Claude Skills 的封装要求打包成 Skill 就行。
没什么难的,只要有点子都可以做成 Skill,方便自己也能分享给别人。
这只是我对 Skill 的初步体验。给自己挖个坑,多实践几次后再总结制作方法和踩过的坑。
----------------------
结语
从一篇方法论分享到一个可复用的 Skill,这个过程让我对"怎么把隐性知识显性化"有了更多体会。
换句话说,就是把脑子里的经验变成 AI 能理解的规则和可复用且批量执行的技能,这件事本身就很有成就感。
当然啦,现在这个 Skill 还是太粗糙了,后续想想办法直接导出为 PPTX 格式会更加好用。(再挖个坑…)
**试用后有问题或建议,欢迎留言。**❤️
30 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Vigorxu)
Invalid media:
image
image
image
image
image
image
image
image
image
image
image
公司要求写周报,但是只要是下班前提交,就说你用工作时间写周报,你工作不饱和。 这到底是种什么体验 😂 部门三十个人,要求分三组,人人都要参与年会表演 😂不许搞大合唱,表演道具还要自费 🤓也不安排彩排时间
77 posts - 63 participants
Read full topic
via LINUX DO - 热门话题 (author: wlh9527)
77 posts - 63 participants
Read full topic
via LINUX DO - 热门话题 (author: wlh9527)
【文件夹分类】最简C盘/D盘/桌面文件夹分类管理推荐
1. C盘分类
不出意外的话,大家的电脑C盘都至少有这几个文件夹(当然我的C盘只有这些了):
● Program Files:默认存放64位应用程序
● Program Files (x86):默认存放32位应用程序
● ProgramData:存放软件的共享数据和设置文件
● Windows:包含操作系统的核心文件和驱动程序
● 用户:存放各个用户的个人文件、软件配置、缓存等
2. D盘分类
分为6部分或者3部分(我自己是分为3部分):
● APP:每次安装软件,主动更改安装位置到 D盘
● Desktop:桌面文件夹。
● Download:下载文件夹,也可以不要,我个人喜欢直接下载文件到桌面~
● Files:软件的配置、缓存文件存放处
● Photo:照片文件夹,也可以不要,我喜欢把壁纸照片归为个人personal~
● Profile:个人资料,即Personal File,单独一个文件夹,直接移动,方便备份呀!
PS:绿色的文件夹名字,新电脑默认都在C盘,需手动该位置!
2.1 应用程序分类
● APP_base 必备软件:WPS、QQ、微信、网易云、火绒、向日葵等
● APP_code 代码编辑:VScode、PyCharm、Sublime、MATLAB等
● APP_offic 办公软件:百度云、腾讯会议、PotPlayer、Bandicam等
● APP_study 学习软件:Zotero、Notion、VMware、Eudic、Steam等
● APP_tool 工具软件:Clash、Motrix、Sejda Pro、EmEditor、Typora等
2.2 桌面分类
我的常用软件在“开始菜单”和“ 任务栏”打开的还是更方便~
● Tool:工具类软件快捷方式
● Code_Study:代码项目
● CodeHelper:一个TXT快捷方式,记录常用的指令等
● Task:待办任务,过往项目
3. 文件夹图标
最后是一些好看的文件夹图标~
18 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: 耗不尽的先生)
Invalid media:
image
image
image
image
image
image
1. C盘分类
不出意外的话,大家的电脑C盘都至少有这几个文件夹(当然我的C盘只有这些了):
● Program Files:默认存放64位应用程序
● Program Files (x86):默认存放32位应用程序
● ProgramData:存放软件的共享数据和设置文件
● Windows:包含操作系统的核心文件和驱动程序
● 用户:存放各个用户的个人文件、软件配置、缓存等
2. D盘分类
分为6部分或者3部分(我自己是分为3部分):
● APP:每次安装软件,主动更改安装位置到 D盘
● Desktop:桌面文件夹。
● Download:下载文件夹,也可以不要,我个人喜欢直接下载文件到桌面~
● Files:软件的配置、缓存文件存放处
● Photo:照片文件夹,也可以不要,我喜欢把壁纸照片归为个人personal~
● Profile:个人资料,即Personal File,单独一个文件夹,直接移动,方便备份呀!
PS:绿色的文件夹名字,新电脑默认都在C盘,需手动该位置!
2.1 应用程序分类
● APP_base 必备软件:WPS、QQ、微信、网易云、火绒、向日葵等
● APP_code 代码编辑:VScode、PyCharm、Sublime、MATLAB等
● APP_offic 办公软件:百度云、腾讯会议、PotPlayer、Bandicam等
● APP_study 学习软件:Zotero、Notion、VMware、Eudic、Steam等
● APP_tool 工具软件:Clash、Motrix、Sejda Pro、EmEditor、Typora等
2.2 桌面分类
我的常用软件在“开始菜单”和“ 任务栏”打开的还是更方便~
● Tool:工具类软件快捷方式
● Code_Study:代码项目
● CodeHelper:一个TXT快捷方式,记录常用的指令等
● Task:待办任务,过往项目
3. 文件夹图标
最后是一些好看的文件夹图标~
https://pan.baidu.com/s/1KudsHqwhaOvSYKOKCvONfw?pwd=hbjd
18 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: 耗不尽的先生)
Invalid media:
image
image
image
image
image
image
对比 3 种 AI 浏览器扩展:Monica、Nanobrowser、我开源的 Tactus
秉持着不造轮子原则,我调研了市面上的 AI 浏览器扩展,大致如下:
● 聚焦对话场景:代表是 Monica;
● 聚焦自动化场景:代表是开源的 Nanobrowser;
● 实现 skills 规范:目前只看到我开源的 Tactus;
我也分别体验了我自己的一个场景:总结本站帖子。
Monica
原理应该是获取当前网页的链接,然后再请求一次解析网页响应。
无法配置特定网站的总结提示词和获取完整流式加载内容。
Nanobrowser
具备自动化能力,不过居然不直接提取网页内容,我一开始以为他要一直下滑到加载完整评论区,但选择了下滑到主帖的底部就开始总结了。而且体感挺慢,每一步下滑都要决策。
一样无法配置特定网站的总结提示词。因为有自动化能力,流式加载内容可以靠提示。
上传不了视频,看看几张截图吧 (click for more details)
我开源的 Tactus
解决了无法配置特定网站的总结提示词和获取完整流式加载内容的痛点。
魔法就是skills,我把获取主帖及完整评论区封装在了 skills 的脚本中,Agent 自行判断当前网页是 L站,用户的提问需要获取主帖及完整评论区,于是加载 skills。
SKILLS.md 中有总结帖子的提示词就能实现动态注入,特定工作流封装脚本就能执行。
感兴趣,可以查看完整的总结内容 (click for more details)
总结对比
----------------------
都看到这啦!想不想体验呢,马上来!
扩展安装包直接搬来了,关注下 github 仓库会有最新版,目前最新就是 1.0.2
tactus-1.0.2-chrome.zip (160.6 KB)
获取L站帖子的主帖及评论区的skills,在扩展的设置页中上传文件夹导入~
fetch-linuxdo-post.zip (7.3 KB)
----------------------
详细背景和使用说明请看上一个帖子:【开源】首个支持 Agent Skills 的浏览器扩展 Tactus | 取之社区、回馈社区,首个开源项目献给L站!
开源仓库如下,好用的话点个小星星,也是支持我前进迭代的最大动力!
github.com
GitHub - Castor6/tactus: The first browser AI Agent extension to support...
The first browser AI Agent extension to support Agent Skills, enabling AI to perform complex tasks through an expandable skill system. | 首个支持 Agent Skills 的浏览器 AI Agent 扩展,让 AI 通过可扩展技能系统执行复杂任务
26 posts - 21 participants
Read full topic
via LINUX DO - 热门话题 (author: 灿烂甜菜)
Invalid media:
image
image
秉持着不造轮子原则,我调研了市面上的 AI 浏览器扩展,大致如下:
● 聚焦对话场景:代表是 Monica;
● 聚焦自动化场景:代表是开源的 Nanobrowser;
● 实现 skills 规范:目前只看到我开源的 Tactus;
我也分别体验了我自己的一个场景:总结本站帖子。
Monica
原理应该是获取当前网页的链接,然后再请求一次解析网页响应。
无法配置特定网站的总结提示词和获取完整流式加载内容。
Nanobrowser
具备自动化能力,不过居然不直接提取网页内容,我一开始以为他要一直下滑到加载完整评论区,但选择了下滑到主帖的底部就开始总结了。而且体感挺慢,每一步下滑都要决策。
一样无法配置特定网站的总结提示词。因为有自动化能力,流式加载内容可以靠提示。
上传不了视频,看看几张截图吧 (click for more details)
我开源的 Tactus
解决了无法配置特定网站的总结提示词和获取完整流式加载内容的痛点。
魔法就是skills,我把获取主帖及完整评论区封装在了 skills 的脚本中,Agent 自行判断当前网页是 L站,用户的提问需要获取主帖及完整评论区,于是加载 skills。
SKILLS.md 中有总结帖子的提示词就能实现动态注入,特定工作流封装脚本就能执行。
感兴趣,可以查看完整的总结内容 (click for more details)
总结对比
----------------------
都看到这啦!想不想体验呢,马上来!
扩展安装包直接搬来了,关注下 github 仓库会有最新版,目前最新就是 1.0.2
tactus-1.0.2-chrome.zip (160.6 KB)
获取L站帖子的主帖及评论区的skills,在扩展的设置页中上传文件夹导入~
fetch-linuxdo-post.zip (7.3 KB)
----------------------
详细背景和使用说明请看上一个帖子:【开源】首个支持 Agent Skills 的浏览器扩展 Tactus | 取之社区、回馈社区,首个开源项目献给L站!
开源仓库如下,好用的话点个小星星,也是支持我前进迭代的最大动力!
github.com
GitHub - Castor6/tactus: The first browser AI Agent extension to support...
The first browser AI Agent extension to support Agent Skills, enabling AI to perform complex tasks through an expandable skill system. | 首个支持 Agent Skills 的浏览器 AI Agent 扩展,让 AI 通过可扩展技能系统执行复杂任务
26 posts - 21 participants
Read full topic
via LINUX DO - 热门话题 (author: 灿烂甜菜)
Invalid media:
image
image
抽3个gpt团队 赶个腊八节尾巴吧~
3个团队,不质保哦
截止时间:2026年 1 月 27 日 18:18
(第一次抽不太会整,反正到点就抽干就完了)
🏆️ 奖品详情:
1个月的ChatGPT Business车位*3
开始时间:发帖时间
截止时间:2026年 1 月27日21:00
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
不质保。
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后24小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
154 posts - 153 participants
Read full topic
via LINUX DO - 热门话题 (author: shm qin)
3个团队,不质保哦
截止时间:2026年 1 月 27 日 18:18
(第一次抽不太会整,反正到点就抽干就完了)
🏆️ 奖品详情:
1个月的ChatGPT Business车位*3
开始时间:发帖时间
截止时间:2026年 1 月27日21:00
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
不质保。
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后24小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
154 posts - 153 participants
Read full topic
via LINUX DO - 热门话题 (author: shm qin)
ClawdBot是有人炒作吗?
作为一个天天和AI打交道的人,最近这半年我已经麻木了,从Agent->mcp->skill->Cowork,前面的技术还没落地,后面的技术又杀到了.
周五突然刷到外网ClawdBot的帖子,我感觉就是Ai+RPA,没当回事. 结果周一上班,各个微信群都在流传一篇“硅谷刷屏的ClawdBot,让Mac mini卖爆了”的帖子.
被好几人@我,我也只能硬着头皮准备自己搭建一下.
登录到B站找部署教程,用ClawdBot作为关键词,搜索出一大堆视频,结果90%的视频全是来源于同一个国外视频,几乎没有啥国内原创. 就算有,也是口水视频,只是人云亦云的讲了用ClawdBot的好处.
我就奇怪了,这个玩意什么就突然之间爆火的?
68 posts - 66 participants
Read full topic
via LINUX DO - 热门话题 (author: 萨蛮)
作为一个天天和AI打交道的人,最近这半年我已经麻木了,从Agent->mcp->skill->Cowork,前面的技术还没落地,后面的技术又杀到了.
周五突然刷到外网ClawdBot的帖子,我感觉就是Ai+RPA,没当回事. 结果周一上班,各个微信群都在流传一篇“硅谷刷屏的ClawdBot,让Mac mini卖爆了”的帖子.
被好几人@我,我也只能硬着头皮准备自己搭建一下.
登录到B站找部署教程,用ClawdBot作为关键词,搜索出一大堆视频,结果90%的视频全是来源于同一个国外视频,几乎没有啥国内原创. 就算有,也是口水视频,只是人云亦云的讲了用ClawdBot的好处.
我就奇怪了,这个玩意什么就突然之间爆火的?
68 posts - 66 participants
Read full topic
via LINUX DO - 热门话题 (author: 萨蛮)
作为面试官成功面到L站佬友
之前想到万一遇到这个情况,是否需要放点水,
面完发现,多虑了,玩L站的,并且L站/github用二次元头像的佬友,不需要放水也能轻松过。😀
60 posts - 50 participants
Read full topic
via LINUX DO - 热门话题 (author: Imaxwel)
之前想到万一遇到这个情况,是否需要放点水,
面完发现,多虑了,玩L站的,并且L站/github用二次元头像的佬友,不需要放水也能轻松过。😀
60 posts - 50 participants
Read full topic
via LINUX DO - 热门话题 (author: Imaxwel)
抽个codex套餐
抽奖主题: 2周codex套餐 20刀/日 提供API、key
特别声明:
🏆️ 奖品详情:
[奖品]:2周codex套餐
:three_o_clock: 活动时间:
开始时间:Invalid date
截止时间:Invalid date
📝 参与方式:
并在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方抽奖工具随机抽取中奖者。
中奖后请及时私信我!
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 1 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
@paviber
139 posts - 137 participants
Read full topic
via LINUX DO - 热门话题 (author: 胡哥)
抽奖主题: 2周codex套餐 20刀/日 提供API、key
特别声明:
🏆️ 奖品详情:
[奖品]:2周codex套餐
:three_o_clock: 活动时间:
开始时间:Invalid date
截止时间:Invalid date
📝 参与方式:
并在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方抽奖工具随机抽取中奖者。
中奖后请及时私信我!
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 1 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
================================================================================
LINUX DO 抽奖结果 - 0.1.1
================================================================================
帖子链接: https://linux.do/t/topic/1518988
帖子标题: 抽个codex套餐
帖子作者: CHAI
发帖时间: 2026-01-27 09:25:05
--------------------------------------------------------------------------------
抽奖时间: 2026-01-27 12:03:41
参与楼层: 2 - 138 楼
有效楼层: 137 楼
中奖数量: 1 个
最终种子: 3a0818f840e73d552ce58544481c78ebd3177ab312bcff9d8b8f3bcacd0813a2
--------------------------------------------------------------------------------
恭喜以下楼层中奖:
--------------------------------------------------------------------------------
[ 1 ] 113 楼,楼层链接: https://linux.do/t/topic/1518988/113
================================================================================
注: 楼层顺序即为抽奖顺序
================================================================================
@paviber
139 posts - 137 participants
Read full topic
via LINUX DO - 热门话题 (author: 胡哥)
福利:可以免费下载无损音乐的站点,也可下载
1Music
亲测试了一下,mp3 和无损都可以下载!
35 posts - 29 participants
Read full topic
via LINUX DO - 热门话题 (author: 菜包哥)
Invalid media:
image
image
1Music
亲测试了一下,mp3 和无损都可以下载!
35 posts - 29 participants
Read full topic
via LINUX DO - 热门话题 (author: 菜包哥)
Invalid media:
image
image
急急急急!老妈被电信诈骗 2.6W,求佬们支招
刚刚老妈被诈骗了,被撸了2W网贷 + 退休工资卡6000 左右,求支招
过程:1、骗子打电话说抖音自动扣款每月900,问要不要关闭,然后就发了个远程控制的软件;
2、远程操作手机 贷款,购物;
3、警察说钱都用来 购物了,不是转账,一般追不回了,贷款要自己还上;
编辑一下,刚刚脑子有点懵,我理一理经过,再和佬们汇报一下,希望佬们都以此为鉴
1、老妈57了,不是很会使用智能手机,只会拼多多购物,刷刷抖音啥的,平时也和老妈说过接到任何电话不要信,先和我确认下,这次被骗了,以后要加强反诈教育。
2、被骗了后,我妈不知道为啥控制不了手机,整个人都懵了,只收到扣款短信,找的邻居后,邻居报警,警察说第一步断网+ 关机。
3、断网后直接去了公安局,发现被贷款2W + 工资卡里的钱7000被花了6000 购物,总计损失2.6W。
4、家里的钱老妈管,还好大多都是存单,银行卡里没有钱,如果有钱后果不堪设想(大概率是直接刷到封控,那种封控可能得十几,几十万才会处罚)
5、骗子该死!骗老人钱更该死
现在就是安抚老妈情绪,当买个教训,但是老妈想不开,难受,我暂时也回不了家,看看请个假,希望佬引以为鉴,给家里老人普及反诈
184 posts - 118 participants
Read full topic
via LINUX DO - 热门话题 (author: 提肛小助手)
Invalid media: image
刚刚老妈被诈骗了,被撸了2W网贷 + 退休工资卡6000 左右,求支招
过程:1、骗子打电话说抖音自动扣款每月900,问要不要关闭,然后就发了个远程控制的软件;
2、远程操作手机 贷款,购物;
3、警察说钱都用来 购物了,不是转账,一般追不回了,贷款要自己还上;
编辑一下,刚刚脑子有点懵,我理一理经过,再和佬们汇报一下,希望佬们都以此为鉴
1、老妈57了,不是很会使用智能手机,只会拼多多购物,刷刷抖音啥的,平时也和老妈说过接到任何电话不要信,先和我确认下,这次被骗了,以后要加强反诈教育。
2、被骗了后,我妈不知道为啥控制不了手机,整个人都懵了,只收到扣款短信,找的邻居后,邻居报警,警察说第一步断网+ 关机。
3、断网后直接去了公安局,发现被贷款2W + 工资卡里的钱7000被花了6000 购物,总计损失2.6W。
4、家里的钱老妈管,还好大多都是存单,银行卡里没有钱,如果有钱后果不堪设想(大概率是直接刷到封控,那种封控可能得十几,几十万才会处罚)
5、骗子该死!骗老人钱更该死
现在就是安抚老妈情绪,当买个教训,但是老妈想不开,难受,我暂时也回不了家,看看请个假,希望佬引以为鉴,给家里老人普及反诈
184 posts - 118 participants
Read full topic
via LINUX DO - 热门话题 (author: 提肛小助手)
Invalid media: image