openwebui 0.6.1
[0.6.1] - 2025-04-05
添加
🛠️ 全局工具服务器配置:管理员现在可以从“管理员设置”>“工具”集中配置全局外部工具服务器,从而允许在所有用户之间无缝共享工具集成,而无需为每个用户进行手动设置。
🔐 用户的直接工具使用权限:引入了新的用户级权限切换,可授予非管理员用户访问直接外部工具的权限,从而在保持控制的同时支持更广泛的团队协作。
🧠 Mistral OCR 内容提取支持:增加了对 Mistral OCR 作为高精度文档加载器的本机支持,大大改进了 RAG 工作流程中从扫描文档中提取的文本。
🖼️ 工具指示器 UI 重新设计:增强的消息输入现在通过统一的下拉列表智能地显示内置和外部工具,从而在对话期间更简单、更直观地激活工具。
📄 RAG 提示得到改进且更加连贯:默认 RAG 系统提示已修改,更加清晰且以引文为中心——管理员可以将模板字段留空以使用这个新的黄金标准提示。
🧰 性能和开发者改进:对几个工具相关的组件进行了重大的内部重组,简化了样式并合并了外部/内部处理逻辑,从而提高了可维护性和性能。
🌍️ 改进的翻译:更新了藏文、波兰语、中文(简体和繁体)、阿拉伯语、俄语、乌克兰语、荷兰语、芬兰语和法语的翻译,以提高界面的清晰度和一致性。
固定
🔑 外部工具服务器 API 关键错误已解决:修复了从外部 OpenAPI 工具服务器调用工具时未发送身份验证标头的关键问题,从而确保完全安全和平稳的工具作。
🚫 条件导出按钮可见性:当模型、提示、工具或函数中没有要导出的内容时,UI 现在可以正常隐藏导出按钮,从而提高视觉清晰度并减少混淆。
🧪 混合搜索失败恢复:解决了并行混合搜索中的边缘情况,即空或未编制索引的集合导致后端崩溃,现在可以完全跳过这些情况以确保系统稳定性。
📂 管理员文件夹删除修复:解决了无法删除在管理员工作区中创建的文件夹的问题,从而为管理员恢复了完整的组织灵活性。
🔐 改进了登录时的一般错误反馈:身份验证错误现在显示简化的、不暴露的消息,以保护隐私和改进的用户体验,尤其是在联合登录时。
📝 改进了带有图像的工具消息:增强了工具生成的带有图像输出的消息在聊天中的显示方式,使其更具可读性并与整体 UI 设计保持一致。
⚙️ 自动排除损坏的 RAG 集合:自动跳过无法获取数据或返回“无”的文档集合,防止出现静默错误并简化检索工作流程。
📝 文档文本文件处理修复:修复了文件解析不一致问题,该不一致会破坏某些纯文本文件的基于 docling 的 RAG 功能,从而确保更广泛的文件兼容性。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: chastlf)
[0.6.1] - 2025-04-05
添加
🛠️ 全局工具服务器配置:管理员现在可以从“管理员设置”>“工具”集中配置全局外部工具服务器,从而允许在所有用户之间无缝共享工具集成,而无需为每个用户进行手动设置。
🔐 用户的直接工具使用权限:引入了新的用户级权限切换,可授予非管理员用户访问直接外部工具的权限,从而在保持控制的同时支持更广泛的团队协作。
🧠 Mistral OCR 内容提取支持:增加了对 Mistral OCR 作为高精度文档加载器的本机支持,大大改进了 RAG 工作流程中从扫描文档中提取的文本。
🖼️ 工具指示器 UI 重新设计:增强的消息输入现在通过统一的下拉列表智能地显示内置和外部工具,从而在对话期间更简单、更直观地激活工具。
📄 RAG 提示得到改进且更加连贯:默认 RAG 系统提示已修改,更加清晰且以引文为中心——管理员可以将模板字段留空以使用这个新的黄金标准提示。
🧰 性能和开发者改进:对几个工具相关的组件进行了重大的内部重组,简化了样式并合并了外部/内部处理逻辑,从而提高了可维护性和性能。
🌍️ 改进的翻译:更新了藏文、波兰语、中文(简体和繁体)、阿拉伯语、俄语、乌克兰语、荷兰语、芬兰语和法语的翻译,以提高界面的清晰度和一致性。
固定
🔑 外部工具服务器 API 关键错误已解决:修复了从外部 OpenAPI 工具服务器调用工具时未发送身份验证标头的关键问题,从而确保完全安全和平稳的工具作。
🚫 条件导出按钮可见性:当模型、提示、工具或函数中没有要导出的内容时,UI 现在可以正常隐藏导出按钮,从而提高视觉清晰度并减少混淆。
🧪 混合搜索失败恢复:解决了并行混合搜索中的边缘情况,即空或未编制索引的集合导致后端崩溃,现在可以完全跳过这些情况以确保系统稳定性。
📂 管理员文件夹删除修复:解决了无法删除在管理员工作区中创建的文件夹的问题,从而为管理员恢复了完整的组织灵活性。
🔐 改进了登录时的一般错误反馈:身份验证错误现在显示简化的、不暴露的消息,以保护隐私和改进的用户体验,尤其是在联合登录时。
📝 改进了带有图像的工具消息:增强了工具生成的带有图像输出的消息在聊天中的显示方式,使其更具可读性并与整体 UI 设计保持一致。
⚙️ 自动排除损坏的 RAG 集合:自动跳过无法获取数据或返回“无”的文档集合,防止出现静默错误并简化检索工作流程。
📝 文档文本文件处理修复:修复了文件解析不一致问题,该不一致会破坏某些纯文本文件的基于 docling 的 RAG 功能,从而确保更广泛的文件兼容性。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: chastlf)
cursor+claude还是好用,对比 gemini2.5pro+roo code
背景
事情是这样的,最近 gemini2.5pro 限额,用不了 roocode。 站里发现 jay 佬有做一个轮询项目,但是 jay 佬的项目看不到 key 的用量,也不知道用了多少,于是我在 huggingface 上找到一个类似的项目,叫 gemini-api-balance。这个项目也做轮询,有前端,但是只支持 openai 格式,我有强迫症,就想用原生的,于是我就想着把两个项目融合。
过程
我先用的 roo code+gemini,还使用了先进的 boomerang task,做了一大堆修改后,融合失败,查询用量的页面始终读不到数据,后面换了各种模式,始终搞不定。于是只能 roll back 撤销所有更改(总共用了 120 次请求都没搞定,大部分请求用在修 bug 上了,gala 的 key 显示 50 美元,花掉了接近 5 人民币)。
然后我又换成 cursor+claude3.7 无思考,来融合,五句提示词全部搞定(实际上第二句就基本完成了,后面都是小修改)
结论和展望
虽然大家都在 cursor 社区喷 cursor ,但是确实还是最好用的。
对比不够严谨,没有控制变量(主要是没 claude api 太穷了),仅供娱乐参考。
等有时间试试 cursor +gemini 以及 roocode+中转 claude
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 任意)
背景
事情是这样的,最近 gemini2.5pro 限额,用不了 roocode。 站里发现 jay 佬有做一个轮询项目,但是 jay 佬的项目看不到 key 的用量,也不知道用了多少,于是我在 huggingface 上找到一个类似的项目,叫 gemini-api-balance。这个项目也做轮询,有前端,但是只支持 openai 格式,我有强迫症,就想用原生的,于是我就想着把两个项目融合。
过程
我先用的 roo code+gemini,还使用了先进的 boomerang task,做了一大堆修改后,融合失败,查询用量的页面始终读不到数据,后面换了各种模式,始终搞不定。于是只能 roll back 撤销所有更改(总共用了 120 次请求都没搞定,大部分请求用在修 bug 上了,gala 的 key 显示 50 美元,花掉了接近 5 人民币)。
然后我又换成 cursor+claude3.7 无思考,来融合,五句提示词全部搞定(实际上第二句就基本完成了,后面都是小修改)
结论和展望
虽然大家都在 cursor 社区喷 cursor ,但是确实还是最好用的。
对比不够严谨,没有控制变量(主要是没 claude api 太穷了),仅供娱乐参考。
等有时间试试 cursor +gemini 以及 roocode+中转 claude
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 任意)
知乎现在这么割裂了吗?这问题底下都是什么牛鬼蛇神
专业的问题底下回答可以很专业,有的问题底下都是些什么抽象玩意
知乎刷到这个问题:https://www.zhihu.com/question/15756058705?utm_psn=1892101333923911111
这底下回答都是啥啊,ds一没收你钱,二持续开源,三没有像oai那样天天在x上炒作所谓的agi,没出新模型之前热度下来不是很正常吗?gpt4o出图像生成之前难道热度很高吗?你以为所有公司都像某些大模型公司天天研究怎么投放广告引流买商单吗?ds连大更新一次v3也只挂个0324,甚至没在x上发过公告,就连模型每次都是先上再出公告的,不像某些人天天搞agi炒作。低调研究做事,到你这居然还要被骂?什么端起碗吃饭,放下碗骂娘?
大早上给我气笑了:
逆天,也是和国民性扯上关系了
31 个帖子 - 31 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Yuanhao)
专业的问题底下回答可以很专业,有的问题底下都是些什么抽象玩意
知乎刷到这个问题:https://www.zhihu.com/question/15756058705?utm_psn=1892101333923911111
这底下回答都是啥啊,ds一没收你钱,二持续开源,三没有像oai那样天天在x上炒作所谓的agi,没出新模型之前热度下来不是很正常吗?gpt4o出图像生成之前难道热度很高吗?你以为所有公司都像某些大模型公司天天研究怎么投放广告引流买商单吗?ds连大更新一次v3也只挂个0324,甚至没在x上发过公告,就连模型每次都是先上再出公告的,不像某些人天天搞agi炒作。低调研究做事,到你这居然还要被骂?什么端起碗吃饭,放下碗骂娘?
大早上给我气笑了:
逆天,也是和国民性扯上关系了
31 个帖子 - 31 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Yuanhao)
llama4发布!1000w上下文!
就在刚刚llama4发布了!
Llama 4:引领多模态智能
最新的模型套件,提供无与伦比的速度和效率
Llama 4 巨兽 (Behemoth)
2880亿活跃参数,16个专家
2万亿总参数
用于蒸馏的最智能教师模型
[预览]
Llama 4 Maverick
170亿活跃参数,128个专家
4000亿总参数
原生多模态,具备100万上下文长度
[可用]
Llama 4 Scout
170亿活跃参数,16个专家
1090亿总参数
行业领先的1000万上下文长度
优化推理
[可用]
33 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 繁歌)
就在刚刚llama4发布了!
Llama 4:引领多模态智能
最新的模型套件,提供无与伦比的速度和效率
Llama 4 巨兽 (Behemoth)
2880亿活跃参数,16个专家
2万亿总参数
用于蒸馏的最智能教师模型
[预览]
Llama 4 Maverick
170亿活跃参数,128个专家
4000亿总参数
原生多模态,具备100万上下文长度
[可用]
Llama 4 Scout
170亿活跃参数,16个专家
1090亿总参数
行业领先的1000万上下文长度
优化推理
[可用]
33 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 繁歌)
大陆支付宝灰度测试“Alipay+ 境外NFC支付”,开通免费获得一张万事达虚拟卡!
大陆支付宝正在小范围测试一项名为“Alipay+ 境外NFC支付”的新功能。
能获得什么?
开通后会得到一张 万事达 (Mastercard) 虚拟借记卡 (卡BIN: 5354009500,新加坡发行,SGD货币)。卡号需要用NFC读卡工具获取。
谁能开?
仅限 大陆身份证实名 的支付宝账户。
仅限 安卓手机 (需支持HCE,鸿蒙不行)。
支付宝 地区需切换到海外城市。
怎么开通?
支付宝首页,将城市切换到 海外。
在首页“收付款”里找到并开通 “Alipay+ 境外NFC支付”。
(如果找不到入口,可能需要尝试 虚拟定位 + 海外 IP 辅助)。
重要限制:
不能 在中国内地商户使用。
目前仅支持 余额、余额宝、花呗 作为付款方式。
简单来说: 这是一个给大陆支付宝用户在境外(或支持Alipay+的线上场景)使用NFC支付或获取一张万事达虚拟卡的新途径,但目前还在测试阶段,有较多限制。
更多详细信息 以及评论区成功开通的用户的手机型号 系统 支付宝版本号
35 个帖子 - 27 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Kyoma)
大陆支付宝正在小范围测试一项名为“Alipay+ 境外NFC支付”的新功能。
能获得什么?
开通后会得到一张 万事达 (Mastercard) 虚拟借记卡 (卡BIN: 5354009500,新加坡发行,SGD货币)。卡号需要用NFC读卡工具获取。
谁能开?
仅限 大陆身份证实名 的支付宝账户。
仅限 安卓手机 (需支持HCE,鸿蒙不行)。
支付宝 地区需切换到海外城市。
怎么开通?
支付宝首页,将城市切换到 海外。
在首页“收付款”里找到并开通 “Alipay+ 境外NFC支付”。
(如果找不到入口,可能需要尝试 虚拟定位 + 海外 IP 辅助)。
重要限制:
不能 在中国内地商户使用。
目前仅支持 余额、余额宝、花呗 作为付款方式。
简单来说: 这是一个给大陆支付宝用户在境外(或支持Alipay+的线上场景)使用NFC支付或获取一张万事达虚拟卡的新途径,但目前还在测试阶段,有较多限制。
更多详细信息 以及评论区成功开通的用户的手机型号 系统 支付宝版本号
35 个帖子 - 27 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Kyoma)
llama4发布,疑似竞技场和实际发布模型差距过大,货不对板?
请看以上两张图片,同样的提示词,同样的模型,竞技场的文风很好,但是放到or里面的这个模型就是天差地别。(还有天气卡测试题,or的天气卡完全是一团混乱不成样子,而竞技场的虽然算不上太好,但是起码正常表述了天气,请看图片)
而根据meta官方所发布的博客中写到
llama4拥有和deepseekv3一样强劲的代码能力。
可是deepseekv3的天气卡相比大家都看过了,不用我再重述了。
再补一句,reddit上有人测试竞技场的知识量和or发布的知识量似乎是不相同的,很多竞技场的是知道的,但是放到or渠道就不知道了(我没有实测,在此放上贴图,如果有老哥实测欢迎贴出来)
所以meta藏了一手?(或者说开源大模型的都要藏一手,可是这两个模型差距大到让我怀疑meta官方发错了代码,这发布了个什么玩意。)
----------------------
补充推特最新代码测试,官方博客说类似于deepseekv3(新)水平,这个测试指出大概相当于qwq32b的水平。
https://x.com/karminski3/status/1908726414960103818github.com
GitHub - KCORES/kcores-llm-arena: LLM Arena by KCORES team
LLM Arena by KCORES team
30 个帖子 - 14 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: shijinhui)
请看以上两张图片,同样的提示词,同样的模型,竞技场的文风很好,但是放到or里面的这个模型就是天差地别。(还有天气卡测试题,or的天气卡完全是一团混乱不成样子,而竞技场的虽然算不上太好,但是起码正常表述了天气,请看图片)
而根据meta官方所发布的博客中写到
llama4拥有和deepseekv3一样强劲的代码能力。
可是deepseekv3的天气卡相比大家都看过了,不用我再重述了。
再补一句,reddit上有人测试竞技场的知识量和or发布的知识量似乎是不相同的,很多竞技场的是知道的,但是放到or渠道就不知道了(我没有实测,在此放上贴图,如果有老哥实测欢迎贴出来)
所以meta藏了一手?(或者说开源大模型的都要藏一手,可是这两个模型差距大到让我怀疑meta官方发错了代码,这发布了个什么玩意。)
----------------------
补充推特最新代码测试,官方博客说类似于deepseekv3(新)水平,这个测试指出大概相当于qwq32b的水平。
https://x.com/karminski3/status/1908726414960103818github.com
GitHub - KCORES/kcores-llm-arena: LLM Arena by KCORES team
LLM Arena by KCORES team
30 个帖子 - 14 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: shijinhui)