自己部署deepseek r1 怎么转api?是不是得自己逆向成api啊?大佬们有什么经验吗?
24 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: TreyiMcGrady)
24 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: TreyiMcGrady)
X79平台用cpu低成本跑deepseek r1 671b是否可行
如图,用洋垃圾硬件拼一个双路24大核,768G DDR3 ECC内存的平台,核心成本只需要两千RMB左右。如果不考虑性能,只要求跑起,这样是否可行?
补充,reddit上有老哥用类似平台跑的V3,据说输出性能0.3token/s
补充,发现nga上有老哥们已经在讨论了传送
18 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: ifdog)
如图,用洋垃圾硬件拼一个双路24大核,768G DDR3 ECC内存的平台,核心成本只需要两千RMB左右。如果不考虑性能,只要求跑起,这样是否可行?
补充,reddit上有老哥用类似平台跑的V3,据说输出性能0.3token/s
补充,发现nga上有老哥们已经在讨论了传送
18 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: ifdog)
测试发现纳米AI搜索的Deepseek-R1-360高速专线的能力比不上官方,还有重复思考的bug
【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力文档共建
----------------------
结论:数学能力不如蒸馏版的DeepSeek-R1-distill-llama-70b。
推荐使用 Lambda Chat的完整版本R1。lambda.chat
Lambda Chat
The first open source alternative to ChatGPT. 💪
----------------------
30 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mozi)
Invalid media: image
【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力文档共建
序号 题型 题目_________________________________ heavy_check_mark________________ x________________ 答案 1 解析几何 已知过点 $A(-1, 0)$ 、 $B(1, 0)$ 两点的动抛物线的准线始终与圆 $x^2 + y^2 = 9$ 相切,该抛物线焦点 $P$ 的轨迹是某圆锥曲线 $…
----------------------
结论:数学能力不如蒸馏版的DeepSeek-R1-distill-llama-70b。
推荐使用 Lambda Chat的完整版本R1。lambda.chat
Lambda Chat
The first open source alternative to ChatGPT. 💪
----------------------
30 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mozi)
Invalid media: image
一个完全开源开箱即用的 IP 工具箱:MyIP。
可轻松检查我们网络 IP 相关信息,包括 IP 地理位置,检查 DNS 泄露,速度测试,Ping 测试以及检查网站可用性等等。
GitHub:github.com
GitHub - jason5ng32/MyIP: The best IP Toolbox. Easy to check what's your...
The best IP Toolbox. Easy to check what's your IPs, IP geolocation, check for DNS leaks, examine WebRTC connections, speed test, ping test, MTR test, check website availability, whois search and more! || 🇨🇳 可能是最好用的IP工具箱。轻松检查你的 IP,IP 地理位置,检查DNS泄漏,检查 WebRTC 连接,速度测试,ping 测试,MTR测试,检查网站可用性,查询 Whois 信息等等。
同时还支持,暗黑模式、响应式界面、多语言、快捷键等功能。
15 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Schrödinger)
可轻松检查我们网络 IP 相关信息,包括 IP 地理位置,检查 DNS 泄露,速度测试,Ping 测试以及检查网站可用性等等。
GitHub:github.com
GitHub - jason5ng32/MyIP: The best IP Toolbox. Easy to check what's your...
The best IP Toolbox. Easy to check what's your IPs, IP geolocation, check for DNS leaks, examine WebRTC connections, speed test, ping test, MTR test, check website availability, whois search and more! || 🇨🇳 可能是最好用的IP工具箱。轻松检查你的 IP,IP 地理位置,检查DNS泄漏,检查 WebRTC 连接,速度测试,ping 测试,MTR测试,检查网站可用性,查询 Whois 信息等等。
同时还支持,暗黑模式、响应式界面、多语言、快捷键等功能。
15 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Schrödinger)
奥特曼:gpt-o3 明日上线
Sam Altman 表示,OpenAI 在 Azure 上成功部署了首台完整 8 机架 GB200 NVL72。
随后在回复网友评论时,Sam Altman 指出ho ho ho 模型(就是o3,sam之前玩的谐音梗)明天(美国时间1.31)上线。x.com
Sam Altman
@sama
@SpencerKSchiff @satyanadella yes, tomorrow! enjoy it.
5:20 AM - 31 Jan 2025 520 38
52 个帖子 - 24 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mastreina)
Sam Altman 表示,OpenAI 在 Azure 上成功部署了首台完整 8 机架 GB200 NVL72。
随后在回复网友评论时,Sam Altman 指出ho ho ho 模型(就是o3,sam之前玩的谐音梗)明天(美国时间1.31)上线。x.com
Sam Altman
@sama
@SpencerKSchiff @satyanadella yes, tomorrow! enjoy it.
5:20 AM - 31 Jan 2025 520 38
52 个帖子 - 24 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mastreina)
抽奖:emby服观看账号
🏆️ 奖品详情:
[奖品]:一个emby服的观看账号。请按emby规定使用账号,不得倒卖、宣传、多人共用。
🕒️ 活动时间:
开始时间:2025-01-31,发帖之日
截止时间:2025-02-02 上午12点
📝 参与方式:
在本帖下回复,并点赞。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方工具随机抽取中奖者。
⚠️ 注意事项:
中奖者将在活动结束后2小时内在本帖公布,并通过论坛私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
第一次创建抽奖,如果有什么没做好请见谅
44 个帖子 - 44 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 陈步堂)
🏆️ 奖品详情:
[奖品]:一个emby服的观看账号。请按emby规定使用账号,不得倒卖、宣传、多人共用。
🕒️ 活动时间:
开始时间:2025-01-31,发帖之日
截止时间:2025-02-02 上午12点
📝 参与方式:
在本帖下回复,并点赞。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方工具随机抽取中奖者。
⚠️ 注意事项:
中奖者将在活动结束后2小时内在本帖公布,并通过论坛私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
第一次创建抽奖,如果有什么没做好请见谅
44 个帖子 - 44 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 陈步堂)
看不完,根本看不完
又是一轮新的一天看不完的信息,回不完的私信,不知不觉就这样迎来了美丽的朝霞
啊,夜晚的太阳真是漂亮啊×_×
(以上评论来自回信息回到两眼蝌蚪状的樱某人)
要是我说我11月才来。。。估计没人信
79 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 樱悦)
又是一轮新的一天看不完的信息,回不完的私信,不知不觉就这样迎来了美丽的朝霞
啊,夜晚的太阳真是漂亮啊×_×
(以上评论来自回信息回到两眼蝌蚪状的樱某人)
要是我说我11月才来。。。估计没人信
79 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 樱悦)
悲 被cursor痛击,生成的一些脚本没了
前几天因为把cursor升级了最新版本,导致机器码插件无效,然后卸载了重新安装了旧版本,但是没想到他把我的一些脚本也给删除了(用listary搜索,然后没显示脚本,我看了下发现脚本无了)tieba_087
值得庆幸的是,重要脚本我另外保存来了一个地方tieba_087
24 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Elf)
前几天因为把cursor升级了最新版本,导致机器码插件无效,然后卸载了重新安装了旧版本,但是没想到他把我的一些脚本也给删除了(用listary搜索,然后没显示脚本,我看了下发现脚本无了)tieba_087
值得庆幸的是,重要脚本我另外保存来了一个地方tieba_087
24 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Elf)
硅基流动的Deepseek R1 / V3出来了
不能使用赠送余额
R1 价格:
输入:¥4/ M Tokens
输出:¥16/ M Tokens
上下文 64K
V3 价格
输入:¥1/ M Tokens
输出:¥2/ M Tokens
上下文 64K
26 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: mythdodo)
不能使用赠送余额
R1 价格:
输入:¥4/ M Tokens
输出:¥16/ M Tokens
上下文 64K
V3 价格
输入:¥1/ M Tokens
输出:¥2/ M Tokens
上下文 64K
26 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: mythdodo)
R1是真牛逼,真的不是吹出来的
不仅思考逻辑是真牛逼,对中文问题的理解深度也相当牛逼
o1在他面前真不够看的
30 个帖子 - 24 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: dabuliu)
不仅思考逻辑是真牛逼,对中文问题的理解深度也相当牛逼
o1在他面前真不够看的
30 个帖子 - 24 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: dabuliu)
API站坑爹姿势收录
混乱的倍率计算方式
newapi显示的模型价格计算公式为:
一般情况下可以简化为
例如,充值比例为0.1,说明充值 ¥1.00 CNY,到账余额 $10.00
那么最后API成本就来到了:
有些商家会利用计算倍率的复杂性,混淆视听,虚假宣传。
假如有个支持退款的商家宣称其API充值比例为0.1,但是其理由是充1元到账5美元(¥1 CNY = 1$),充值比例0.2,但是分组倍率0.5,合起来就是
好像很有道理,但是实际上在成本核算的时候,如果你不清楚这个计算规则,只是简单地把模型价格页面的价格乘0.1,那么就会得到错误的结果(你把分组倍率计算了2次)。
当然,他们家是支持退款的。
因此,无论商家如何宣传,一定要亲自搞清楚公式的每一个变量,亲自计算出实际的成本。
最低充值额度
虽然我们一直强调充值要少量多次,用多少充多少,但商家自有办法。他有各种理由,给你规定出一个最低充值额度。
譬如,你在某个支持退款的平台上充值,结果平台告诉你最低20元起充。你一合计,不对啊,我一天才用个1块不到,这20元得用到猴年马月?到时候商家一改价格,那不就关门打狗了吗?
当然,他们家是支持退款的。
暗改价格
暗改价格的方式五花八门,针对某一模型改分组还算好,至少原key不能用对应模型,用户很快能够发现问题并且处理。
而有些商家就不一样,直接改模型倍率,或者改分组倍率,这样key还能用,但是价格上涨好几倍,很多人直到核算成本时才发现问题。
对于这种商家,我的建议是直接祭天在每次启动之前,登录平台看看模型的价格是否正常,是否符合逾期,尽量不要等到使用过后才发现问题,这样交涉起来会很困难。
(刚才看了一眼,某个支持退款的平台又改价格了)
----------------------
总结一下:
● 少听宣传,自己动手计算成本
● 尽量不要充值太多,用多少充多少
● 多注意商家是否改倍率,尤其是工作启动之前
● 有问题及时大胆和商家交涉,不要纵容奸商
13 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 松坂砂糖)
混乱的倍率计算方式
newapi显示的模型价格计算公式为:
分组倍率 * 模型倍率 / 额度换算 * 1,000,000(输入tokens/$)分组倍率 * 模型倍率 * 补全倍率 / 额度换算 * 1,000,000(输出tokens/$)一般情况下可以简化为
分组倍率 * 模型倍率 * 2(百万输入tokens/$)分组倍率 * 模型倍率 * 补全倍率 * 2(百万输出tokens/$)额度换算一般为500000/$充值CNY与余额$的换算,暂且叫
充值比例充值比例 = 充值金额(¥) / 到账余额($)例如,充值比例为0.1,说明充值 ¥1.00 CNY,到账余额 $10.00
那么最后API成本就来到了:
充值比例 * 分组倍率 * 模型倍率 / 额度换算 * 1,000,000(百万输入tokens/CNY)充值比例 * 分组倍率 * 模型倍率 * 补全倍率 / 额度换算 * 1,000,000(百万输出tokens/CNY)有些商家会利用计算倍率的复杂性,混淆视听,虚假宣传。
假如有个支持退款的商家宣称其API充值比例为0.1,但是其理由是充1元到账5美元(¥1 CNY = 1$),充值比例0.2,但是分组倍率0.5,合起来就是
0.2*0.5=0.1好像很有道理,但是实际上在成本核算的时候,如果你不清楚这个计算规则,只是简单地把模型价格页面的价格乘0.1,那么就会得到错误的结果(你把分组倍率计算了2次)。
当然,他们家是支持退款的。
因此,无论商家如何宣传,一定要亲自搞清楚公式的每一个变量,亲自计算出实际的成本。
最低充值额度
虽然我们一直强调充值要少量多次,用多少充多少,但商家自有办法。他有各种理由,给你规定出一个最低充值额度。
譬如,你在某个支持退款的平台上充值,结果平台告诉你最低20元起充。你一合计,不对啊,我一天才用个1块不到,这20元得用到猴年马月?到时候商家一改价格,那不就关门打狗了吗?
当然,他们家是支持退款的。
暗改价格
暗改价格的方式五花八门,针对某一模型改分组还算好,至少原key不能用对应模型,用户很快能够发现问题并且处理。
而有些商家就不一样,直接改模型倍率,或者改分组倍率,这样key还能用,但是价格上涨好几倍,很多人直到核算成本时才发现问题。
对于这种商家,我的建议是直接祭天在每次启动之前,登录平台看看模型的价格是否正常,是否符合逾期,尽量不要等到使用过后才发现问题,这样交涉起来会很困难。
(刚才看了一眼,某个支持退款的平台又改价格了)
----------------------
总结一下:
● 少听宣传,自己动手计算成本
● 尽量不要充值太多,用多少充多少
● 多注意商家是否改倍率,尤其是工作启动之前
● 有问题及时大胆和商家交涉,不要纵容奸商
13 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 松坂砂糖)