大模型在人文社科中还是难堪大用
对于理科或工科的学生来说,大模型在写小论文时可能已经成为或不可缺的助手了。但是对于人文社科来说,我感觉还是难堪大用。以下是一个小论文作业的例子和评分表。
太长不看版本:术语定义的繁多和模糊,过大的广度,模糊的标准,使得大模型目前还无法胜任人文社科的任务。
从下面任选一个主题写一份1500字的论述
1. 批判性地分析计算机模拟增强我们对科学和工程学科的理解和预测能力的说法。
2. 研究与科学与工程中计算机模拟相关的认识挑战,重点关注结果的有效性和解释问题。
3. 在科学和工程环境中开发和使用计算机模拟时会产生哪些道德考虑?讨论这个问题,使用一个强调潜在社会影响的当代例子。
4. 批判性评估将人工智能整合到计算机模拟中的程度代表了科学和工程中的真正范式,或者只是现有方法的进化。
5. 计算机模拟在多大程度上成为应对复杂社会挑战的工具?使用与科学和工程相关的特定案例研究来分析他们的认识和实践贡献。
想拿到70-100主要对四个部分进行评估:
了解认识论和/或伦理学概念:对关键概念和挑战的出色理解和解释,表现出不同概念的复杂相互作用以及批判性地比较与模块相关的概念的能力。
与论文主题相关的论证:一个出色的论点,它提出了有价值的干预,合乎逻辑,并提出了一个清晰而令人信服的案例。确定明确的因果机制是一个优势。可能存在一种新颖的方法来研究该主题。
写作:出色的写作,没有或很少有语法错误或尴尬的措辞。
引用:完美无瑕或几乎完美无瑕的参考文献,引用作品的范围、数量和质量适当。
其中最难的地方在于“了解认识论和/或伦理学概念”和“与论文主题相关的论证”部分。首先是大模型写作时对术语和讲座时不同。理科里面,对于一个术语的解释基本大差不差,而文科里面可能一个术语不同的专业有不同的解释。而这个论证需要从非常多的角度去思考,很难去说到底怎么算一个完美的论证,而相关的资料相对来说是比较少的,永远有一个新的角度可以重新论证,不像理科某一个东西已经被研究烂了。评分是非常主观的,我基本没有看到有人能拿到80分以上的成绩。因为想要拿到出色的等级(80+),除非你刚好写到评分的人的痛点时才有可能(而且会进行控分)
总结,术语定义的繁多和模糊,过大的广度,模糊的标准,使得大模型目前还无法胜任人文社科的任务。
当然,我觉得如果大模型能做到这一点的话可能离真正的人工智能就差不多了。批判性思维应该是人类最大的优势了。
34 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: D_Reo)
对于理科或工科的学生来说,大模型在写小论文时可能已经成为或不可缺的助手了。但是对于人文社科来说,我感觉还是难堪大用。以下是一个小论文作业的例子和评分表。
太长不看版本:术语定义的繁多和模糊,过大的广度,模糊的标准,使得大模型目前还无法胜任人文社科的任务。
从下面任选一个主题写一份1500字的论述
1. 批判性地分析计算机模拟增强我们对科学和工程学科的理解和预测能力的说法。
2. 研究与科学与工程中计算机模拟相关的认识挑战,重点关注结果的有效性和解释问题。
3. 在科学和工程环境中开发和使用计算机模拟时会产生哪些道德考虑?讨论这个问题,使用一个强调潜在社会影响的当代例子。
4. 批判性评估将人工智能整合到计算机模拟中的程度代表了科学和工程中的真正范式,或者只是现有方法的进化。
5. 计算机模拟在多大程度上成为应对复杂社会挑战的工具?使用与科学和工程相关的特定案例研究来分析他们的认识和实践贡献。
想拿到70-100主要对四个部分进行评估:
了解认识论和/或伦理学概念:对关键概念和挑战的出色理解和解释,表现出不同概念的复杂相互作用以及批判性地比较与模块相关的概念的能力。
与论文主题相关的论证:一个出色的论点,它提出了有价值的干预,合乎逻辑,并提出了一个清晰而令人信服的案例。确定明确的因果机制是一个优势。可能存在一种新颖的方法来研究该主题。
写作:出色的写作,没有或很少有语法错误或尴尬的措辞。
引用:完美无瑕或几乎完美无瑕的参考文献,引用作品的范围、数量和质量适当。
其中最难的地方在于“了解认识论和/或伦理学概念”和“与论文主题相关的论证”部分。首先是大模型写作时对术语和讲座时不同。理科里面,对于一个术语的解释基本大差不差,而文科里面可能一个术语不同的专业有不同的解释。而这个论证需要从非常多的角度去思考,很难去说到底怎么算一个完美的论证,而相关的资料相对来说是比较少的,永远有一个新的角度可以重新论证,不像理科某一个东西已经被研究烂了。评分是非常主观的,我基本没有看到有人能拿到80分以上的成绩。因为想要拿到出色的等级(80+),除非你刚好写到评分的人的痛点时才有可能(而且会进行控分)
总结,术语定义的繁多和模糊,过大的广度,模糊的标准,使得大模型目前还无法胜任人文社科的任务。
当然,我觉得如果大模型能做到这一点的话可能离真正的人工智能就差不多了。批判性思维应该是人类最大的优势了。
34 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: D_Reo)
🎉 小说下载器 so-novel v1.7.8 已发布
下载页面:Release v1.7.8 · freeok/so-novel · GitHub) (打不开挂梯子)
下载加速:https://gh.idayer.com/
致捣蛋的某些人: “建议你更新一下大脑固件,当前版本似乎不支持完整阅读。” 🐛
19 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: pcdd)
下载页面:Release v1.7.8 · freeok/so-novel · GitHub) (打不开挂梯子)
下载加速:https://gh.idayer.com/
致捣蛋的某些人: “建议你更新一下大脑固件,当前版本似乎不支持完整阅读。” 🐛
19 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: pcdd)
百度網盤加速(3/9到期)
買了一個月的這東西
有需要的可以自行取用
不確定能不能多人同時用,有需要的再試試看吧
次數是無限的,連結內的只是參考
不會的可以先看裡面的教學再用
http://vip-bd.uicuo.com/svip?key=dkTS247CY6gBWXp
*更
好像有同時的上限,用完的佬友再順手清除自己的給下個人方便
34 个帖子 - 25 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: aa85192)
買了一個月的這東西
有需要的可以自行取用
不確定能不能多人同時用,有需要的再試試看吧
次數是無限的,連結內的只是參考
不會的可以先看裡面的教學再用
http://vip-bd.uicuo.com/svip?key=dkTS247CY6gBWXp
*更
好像有同時的上限,用完的佬友再順手清除自己的給下個人方便
34 个帖子 - 25 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: aa85192)
富可敌国 Gala api 赠送一千刀gemini-2.0-flash免费key
URL:gala.chataiapi.com
key:sk-8in3wPopSibHMB4yhArztrxauXBufUnAT7Vr1eanw2mYsTNH
使用模型:gemini-2.0-flash
使用openai格式
gala api 专业的gemini服务商
gemini1.5全模型0.2元一刀
gemini2.0全模型0.3元一刀(目前仅可使用gemini-2.0-flash)
22 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: gala1)
URL:gala.chataiapi.com
key:sk-8in3wPopSibHMB4yhArztrxauXBufUnAT7Vr1eanw2mYsTNH
使用模型:gemini-2.0-flash
使用openai格式
gala api 专业的gemini服务商
gemini1.5全模型0.2元一刀
gemini2.0全模型0.3元一刀(目前仅可使用gemini-2.0-flash)
22 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: gala1)
原研汇:原研药信息查询小程序上线,欢迎体验!
开发背景
近期,超低价集采的新闻将原研药与仿制药的争议推向了极点。作为一个纯编程小白,经过约 3 周的不懈努力,终于利用 cursor 成功开发出一款名为“原研汇”的原研药信息查询小程序,目的帮助大家区分和快速查找原研药信息。
一、开发过程中的困难
(一)数据来源
起初,我在 GitHub 上查找数据,发现了两个与原研药数据的项目。一个项目包含约 400 个药品数据,另一个有 900 多个。然而,深入研究后发现这些数据存在不少问题,考虑到医疗数据的严谨性,没有采用。最终,花了不少时间从国家药监局网站收集数据,获取了权威且可靠的数据。
(二)编程工具挑战
虽然 cursor 能通过聊天的方式写代码,但是在使用过程中状况频发。比如,它有时会反复修改代码,甚至在新路径下创建新文件,进而导致路径和名称引用出错,还有一次直接把文件删除了,兼职气炸了!好在也是学习的过程,不断地与它“斗智斗勇”,通过持续摸索和调试,逐渐掌握了许多使用技巧,才最终基本实现了小程序的各项功能。
二、产品介绍
简介
原研汇是一款专注于原研药信息查询的微信小程序,旨在为用户提供便捷、专业的原研药信息查询服务。
核心功能
● 药品搜索:支持通过药品名称、商品名、厂商等多维度搜索,轻松找到你需要的药品信息
● 分类浏览:提供感冒发烧、细菌感染、病毒感染等多种疾病分类,方便你快速定位药品类别
● 药品厂商:提供全世界顶级药品生产厂商的原研药,让你对药品来源一目了然
● 个人中心:支持收藏常用药品,浏览历史记录等,方便你随时查看常用药品和个人用药记录个人信息
产品体验入口
希望“原研汇”能为大家提供帮助,有需要的朋友们可以随时使用它查询原研药信息。如果您对小程序有任何建议或反馈,欢迎随时联系我。我会积极进行优化改进,努力为大家带来更好的体验。
三、产品截图
22 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: songweibiao)
开发背景
近期,超低价集采的新闻将原研药与仿制药的争议推向了极点。作为一个纯编程小白,经过约 3 周的不懈努力,终于利用 cursor 成功开发出一款名为“原研汇”的原研药信息查询小程序,目的帮助大家区分和快速查找原研药信息。
一、开发过程中的困难
(一)数据来源
起初,我在 GitHub 上查找数据,发现了两个与原研药数据的项目。一个项目包含约 400 个药品数据,另一个有 900 多个。然而,深入研究后发现这些数据存在不少问题,考虑到医疗数据的严谨性,没有采用。最终,花了不少时间从国家药监局网站收集数据,获取了权威且可靠的数据。
(二)编程工具挑战
虽然 cursor 能通过聊天的方式写代码,但是在使用过程中状况频发。比如,它有时会反复修改代码,甚至在新路径下创建新文件,进而导致路径和名称引用出错,还有一次直接把文件删除了,兼职气炸了!好在也是学习的过程,不断地与它“斗智斗勇”,通过持续摸索和调试,逐渐掌握了许多使用技巧,才最终基本实现了小程序的各项功能。
二、产品介绍
简介
原研汇是一款专注于原研药信息查询的微信小程序,旨在为用户提供便捷、专业的原研药信息查询服务。
核心功能
● 药品搜索:支持通过药品名称、商品名、厂商等多维度搜索,轻松找到你需要的药品信息
● 分类浏览:提供感冒发烧、细菌感染、病毒感染等多种疾病分类,方便你快速定位药品类别
● 药品厂商:提供全世界顶级药品生产厂商的原研药,让你对药品来源一目了然
● 个人中心:支持收藏常用药品,浏览历史记录等,方便你随时查看常用药品和个人用药记录个人信息
产品体验入口
希望“原研汇”能为大家提供帮助,有需要的朋友们可以随时使用它查询原研药信息。如果您对小程序有任何建议或反馈,欢迎随时联系我。我会积极进行优化改进,努力为大家带来更好的体验。
三、产品截图
22 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: songweibiao)
chagpt 跟风deepseek?
Summary (点击了解更多详细信息)
经佬友们分享,原来是chatgpt开放了免费的o3mini给广大用户了,我一直是免费用户所以不知道,感谢分享
23 个帖子 - 11 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mark Mark)
Summary (点击了解更多详细信息)
经佬友们分享,原来是chatgpt开放了免费的o3mini给广大用户了,我一直是免费用户所以不知道,感谢分享
23 个帖子 - 11 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Mark Mark)
在L站有人回复我,我能乐呵一天
唉,沉迷互联网了,每天盼着有人复我,我能乐呵一整天
孤独
48 个帖子 - 37 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: linjinpeng)
唉,沉迷互联网了,每天盼着有人复我,我能乐呵一整天
孤独
48 个帖子 - 37 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: linjinpeng)
Deepseek是否打破部署定式?摆脱GPU?
bilibili.com
完整版DeepSeek-R1 671b本地部署 速度瓶颈深度剖析_哔哩哔哩_bilibili
我在进行DeepSeek-R1的不同蒸馏量化版本,以及包含671b参数的Q4量化版本和1.58,2.22bit动态量化版本的本地部署的尝试,完全使用CPU而非GPU来进行不同参数数量的模型的本地推理。在此过程中发现,利用CPU进行LLM部署和推理的限速瓶颈在于系统内存带宽。即便使用了具有12通道内存的EPYC 9B14 CPU,也存在明显的内存带宽瓶颈,导致CPU线程数在32以上时,token输出, 视频播放量 164610、弹幕量 525、点赞数 6521、投硬币枚数 4346、收藏人数...
前几天看到这个视频,看到提到 tokens/s 其实取决于 内存带宽,与运算单元、内存容量关系都不大(没有达到数量级的提升效果)。
满血671B的模型在进行工作时调用的参数量也只是37B,所以它可以在相同的硬件平台上以较高的速度运行。
虽然看上去如果要部署满血 8比特量化的 671B参数的R1,仍然需要很大的内存容量,但似乎 顶级模型 的个人私有部署已经不再是遥不可及。
你会给你的个人私有的R1多少预算?
[译] 大模型推理的极限:理论分析、数学建模与 CPU/GPU 实测(2024)
52 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: RU_Sirius)
bilibili.com
完整版DeepSeek-R1 671b本地部署 速度瓶颈深度剖析_哔哩哔哩_bilibili
我在进行DeepSeek-R1的不同蒸馏量化版本,以及包含671b参数的Q4量化版本和1.58,2.22bit动态量化版本的本地部署的尝试,完全使用CPU而非GPU来进行不同参数数量的模型的本地推理。在此过程中发现,利用CPU进行LLM部署和推理的限速瓶颈在于系统内存带宽。即便使用了具有12通道内存的EPYC 9B14 CPU,也存在明显的内存带宽瓶颈,导致CPU线程数在32以上时,token输出, 视频播放量 164610、弹幕量 525、点赞数 6521、投硬币枚数 4346、收藏人数...
前几天看到这个视频,看到提到 tokens/s 其实取决于 内存带宽,与运算单元、内存容量关系都不大(没有达到数量级的提升效果)。
满血671B的模型在进行工作时调用的参数量也只是37B,所以它可以在相同的硬件平台上以较高的速度运行。
虽然看上去如果要部署满血 8比特量化的 671B参数的R1,仍然需要很大的内存容量,但似乎 顶级模型 的个人私有部署已经不再是遥不可及。
你会给你的个人私有的R1多少预算?
[译] 大模型推理的极限:理论分析、数学建模与 CPU/GPU 实测(2024)
52 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: RU_Sirius)
抑郁症测试(请佬友们帮测,十分感谢
26男,离职,有女朋友。家庭关系好。
1: 不常联系家人
2: 7x24h经常易怒不开心但不表现,或者说经常性心情不好(以前能听听音乐转移注意力解决,现在只想打人打沙包,以前把木门几拳锤破过,手指连掌的骨头皮肉肿鹌鹑蛋那么大。现在就是没发泄的地方)
3: 不喜欢透露内心,也就是喜欢自己扛吧(在这透露了….噗…
4: 没什么兴趣了
5: 没有自🔪念头
6: 喜欢熬夜,睡眠足
7: 抽烟比较严重,1天1包(2引起)
8: 疲惫感没有吧
9: 食欲有心情引起变化
10: 喜欢一个人(最好的几个朋友一起玩游戏出门啊也就暂时快乐,一起回去之后无聊就心情不好不差)
11: 可能有也可能没有反社会人格(但对自身不公平的情况我不会将就)
12: 其实笑点非常高,但是刷视频还是会莫名其妙“傻”笑
如想问其他的可以问,我会依次回答。我想看看我有没有抑郁症,严不严重。谢谢各位
PS: 经常和女朋友aiai,别说性啦各位,😳
58 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Deco)
26男,离职,有女朋友。家庭关系好。
1: 不常联系家人
2: 7x24h经常易怒不开心但不表现,或者说经常性心情不好(以前能听听音乐转移注意力解决,现在只想打人打沙包,以前把木门几拳锤破过,手指连掌的骨头皮肉肿鹌鹑蛋那么大。现在就是没发泄的地方)
3: 不喜欢透露内心,也就是喜欢自己扛吧(在这透露了….噗…
4: 没什么兴趣了
5: 没有自🔪念头
6: 喜欢熬夜,睡眠足
7: 抽烟比较严重,1天1包(2引起)
8: 疲惫感没有吧
9: 食欲有心情引起变化
10: 喜欢一个人(最好的几个朋友一起玩游戏出门啊也就暂时快乐,一起回去之后无聊就心情不好不差)
11: 可能有也可能没有反社会人格(但对自身不公平的情况我不会将就)
12: 其实笑点非常高,但是刷视频还是会莫名其妙“傻”笑
如想问其他的可以问,我会依次回答。我想看看我有没有抑郁症,严不严重。谢谢各位
PS: 经常和女朋友aiai,别说性啦各位,😳
58 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Deco)
这个DeepSeek服务商的榜单太全了
https://stateioc.cn/article-details/VjX
14 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: F-Droid)
https://stateioc.cn/article-details/VjX
14 个帖子 - 13 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: F-Droid)
社区稍后将进行一次紧急维护
社区将在 2025-02-10T15:00:00Z UTC 也就是 17 分钟后进行一次紧急维护。
预计将持续 3-5 分钟。
特此公告,敬请理解。
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Neo)
社区将在 2025-02-10T15:00:00Z UTC 也就是 17 分钟后进行一次紧急维护。
预计将持续 3-5 分钟。
特此公告,敬请理解。
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Neo)
deepseek-ai/DeepSeek-V3 2025210
sk-TN46eSPADHWDYZ3bzqcQK8iGXfYc43nkAkE2xHc5Wujultxi
New API
标题是使用的模型名称和发布时间
最上面的是KEY
和使用的URL
如果您有疑惑 可以看 这个URL合集里面
里面有很多小白向的解释
乐子神写的小白帖子合集文档共建
一般来讲都是好使的
如果您使用失败请去帖子合集寻找相应解决方案
完全公益发KEY 无任何售卖
喜欢的话给我点个赞和认可哦
认可点开头像可以点。。。本来我发点KEY 大家就用没啥
然后有人举报我说我没接入L站
问题是哥们根本不如允许注册
然后我想了一个妙招
我接入L站登录
但是我还不让你注册
你可以登录 但登录完了也注册不了完美
完美符合了接入 但我还不想让你登录的方法
26 个帖子 - 23 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 乐子神)
sk-TN46eSPADHWDYZ3bzqcQK8iGXfYc43nkAkE2xHc5Wujultxi
New API
标题是使用的模型名称和发布时间
最上面的是KEY
和使用的URL
如果您有疑惑 可以看 这个URL合集里面
里面有很多小白向的解释
乐子神写的小白帖子合集文档共建
想起来就更新一点 写在这里就是为了可以一直修改添加 2.写给小白的 如何使用API 3.DeepLX已切换至 LINUX DO Connect 认证 (这个是NEO写的 但我觉得很重要 就加进来了) 4.酒馆指南 如何优雅玩酒馆 5.推荐一个事业编查找网站 202486 6.优雅的网络文件柜 7.PC 微信 如何优雅双开 8.写个小白贴 小尾巴是什么 以及哪里改 9.RisuA…
一般来讲都是好使的
如果您使用失败请去帖子合集寻找相应解决方案
完全公益发KEY 无任何售卖
喜欢的话给我点个赞和认可哦
认可点开头像可以点。。。本来我发点KEY 大家就用没啥
然后有人举报我说我没接入L站
问题是哥们根本不如允许注册
然后我想了一个妙招
我接入L站登录
但是我还不让你注册
你可以登录 但登录完了也注册不了完美
完美符合了接入 但我还不想让你登录的方法
26 个帖子 - 23 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 乐子神)