Know Thyself – Telegram
Know Thyself
2.33K subscribers
913 photos
302 videos
196 files
650 links
免责声明:不要轻信反常识的观点,充分的调查研究后,选择你愿意相信的。

我未必赞同我昨天以前的发言,我对今天最新发表的言论也只有70%的信心,如果大家对我的思想充分的批判,我对明天的发言可能会有90%的信心。
Download Telegram
https://x.com/oran_ge/status/1815997989955240296

最近Meta又在搞大新闻,发布了Llama 3.1的8B、70B、405B三个版本的大模型,还有一篇论文。

昨天我把论文大略翻看了下,训练模型用了16000个80G显存的H100显卡。

训练成本那么高,居然完全免费!而且据说最小的那个模型,只要16G内存就能运行,我终于可以体验本地运行的大模型了。

我先是从官网下载8B版本的模型,大约15G,但是我不知道怎么在本地运行。在conda中安装好各种依赖,最后提示“Runtime Error: use_libuv was requested but PyTorch was build without libuv support”,我不知道哪个版本的torch有这个选项,通过pip安装也是相同的错误。

我知道通过Hugging Face应该也可以下载运行,而且不需要自己踩坑,但是我不想重复下载。

最后发现也可以使用ollama一键运行,这个软件跟docker有点像,但我试图导入本地模型时用了很长时间一直没有结束,因为相关文档比较少,我也不确定是否支持本地导入。最后我考虑重新下载一遍,但是在Windows中不论是否使用代理都因网络问题很难下载下来。

最后到Linux下用代理把模型下载到本地,发现只有4.34G,测试没问题后又复制到Windows系统中。

在Linux下没有使用独立显卡,CPU占用比较高,在Windows下使用8G独显运行最小的模型也没什么压力。
👍31
可汗学院的创办人今年出版了一本书《Brave New Worlds: How AI Will Revolutionize Education(and Why That's a Good Thing)》,在这本书的末尾,作者认为未来AI助手会帮助人们自动化完成招聘、求职、求偶的需求。

今天在推特上看到一个帖子,一位工程师申请Canonical的Ubuntu开发工作时,被要求回答几十个问题并整理成PDF格式。前些天在Hacker News上看到一篇博客Panic! at the Job Market,两个都是在讲职场的问题,供需不匹配正变得越来越严重。

在信息大爆炸时代,人们的大脑就像被DDoS攻击的服务器一样,对于环境的变化很难及时做出响应,变得越发麻木。我认为未来AI助手会帮助我们解决大多数人类社会已经解决了无数遍的问题,把我们从麻木的状态中拯救出来,让我们有可能专心解决人类祖先从来没有闲暇和资源思考的问题,让我们能够享受生活。

今天上午使用pip安装了Open WebUI,实现了在多个设备访问ollama本地Llama 3.1 8B的需求。我认为未来企业内部都会搭建一个本地大模型,这样既能保护隐私,又能极大的降低沟通成本。员工们通过与内部的大模型交互,来及时、准确的获取信息,完善本地的知识库。员工不需要写工作总结或者日报、周报,不需要加无数工作群,只要跟大模型闲聊几分钟,就能在自己权限之内了解公司的状态,也能让领导和同事随时了解自己的工作进度。

有一段时间,我对未来非常悲观,在看了Ray Kurzweil的《The Singularity is Nearer: When We Merge with AI》后,虽然谈不上乐观,但也能比较平静的看待很多问题了。AI和机器人技术的快速发展,可能会让摩尔定律适用于其它领域,造成物价的持续快速下跌,最终货币失去意义,因为每个人都可以各取所需。
👍10
前一段时间,我在研究LaTeX和数学时,恰好媒体在持续热炒“中专数学天才姜萍”。虽然我没有十足的证据证明造假,但是概率告诉我十有八九是假的。于是我做了这样一个表格,发到了小红书上。

今天测试了下阿里的通义千问qwen2:7B小模型,在我多次提示的情况下,它也很难正确计算假阳性的概率。

这让我想起,前一段时间在Slate Star CodeX上看到的一篇博客《Statistical Literacy Among Doctors Is Lower Than Chance》,说的是很多医生的统计学素养完全不及格。

文中提到42%的医生正确回答了下面这个判断题: “True or false: the p-value is the probability that the null hypothesis is correct“

第二道题是有5个选项的选择题,26%的医生回答正确: Ten out of every 1,000 women have breast cancer. Of these 10 women with breast cancer, 9 test positive. Of the 990 women without cancer, about 89 nevertheless test positive. A woman tests positive and wants to know whether she has breast cancer for sure, or at least what the chances are. What is the best answer?

两道都回答正确的医生只有12%
👍2
Know Thyself
前一段时间,我在研究LaTeX和数学时,恰好媒体在持续热炒“中专数学天才姜萍”。虽然我没有十足的证据证明造假,但是概率告诉我十有八九是假的。于是我做了这样一个表格,发到了小红书上。 今天测试了下阿里的通义千问qwen2:7B小模型,在我多次提示的情况下,它也很难正确计算假阳性的概率。 这让我想起,前一段时间在Slate Star CodeX上看到的一篇博客《Statistical Literacy Among Doctors Is Lower Than Chance》,说的是很多医生的统计学素养完全不及格。…
https://youtu.be/lG4VkPoG3ko

昨天在学习P-value和概率时,看到3blue1brown再次提到了博客中的案例。虽然描述略有不同,但都得出了类似的结论。

​在评论区中,一位医生说,现实更加复杂(糟糕),医生手头并没有准确的统计数据,检测设备的准确率也没那么高。可能会出现给疑似患胰腺癌的病人做手术后,发现并不是癌症。对于一些特定的患者,可能会出现检测结果100%是假阳性的情况,因为他们有一些奇怪的突变蛋白。太难了!
今天早上出去锻炼,听到几个老人闲聊,了解到其中一位老人感觉难受,但也说不出怎么难受,只是心里不好受,头偶尔有点晕,但是血压不高。去医院检查也没啥大毛病,只是心肌缺血、脑供血不足。

​她认为根本原因可能是牙齿不好,导致啥也不敢吃,从来不吃菜,甚至连西瓜也不能吃。

​她的女儿说给她报销看牙的所有费用,让她儿子带着去看,但她儿子好不容易才开始上班,只能再等等。

​民以食为天,未来人们应该会特别愿意在健康、有营养的食品上花钱,可以考虑向这个方向努力,争取研究出不黏牙、不伤害牙齿、口感好、有营养的食物。
👍1
Know Thyself
前一段时间,我在研究LaTeX和数学时,恰好媒体在持续热炒“中专数学天才姜萍”。虽然我没有十足的证据证明造假,但是概率告诉我十有八九是假的。于是我做了这样一个表格,发到了小红书上。 今天测试了下阿里的通义千问qwen2:7B小模型,在我多次提示的情况下,它也很难正确计算假阳性的概率。 这让我想起,前一段时间在Slate Star CodeX上看到的一篇博客《Statistical Literacy Among Doctors Is Lower Than Chance》,说的是很多医生的统计学素养完全不及格。…
看了点历史书,我感觉在大多数人的认知水平跟不上时代发展、信息严重不对称(难以快速分清是非对错)的社会中,残酷的政治斗争几乎是不可避免的,引导舆论非黑即白的打击反对派的人胜率要远高于花更多时间明辨是非的人。

郭循投降蜀汉,与大将军费祎同席饮酒,费祎喝醉后被刺杀。像曹操这种猜疑心重的人,或者像司马懿韬光养晦,反而能够长久。

大家常常骂资本家,企业家跟政治家很像,需要在信息不对称的情况下快速决策,出现假阳性的可能性非常高,但是只有这种惊弓之鸟才能在商战中适应并生存下来。

人们说“勿谈政治、勿谈国事”,也是有一定道理的。在需要快速决策的问题上明辨是非是要付出很大代价的,非要这么做几乎不可能把握住机会并且很容易让自己处在危险的境地。

未来的AI时代,政治斗争注定会空前的激烈。

不论是苏格拉底被民主投票处死,还是文明的希腊被蛮族吞并,或者蒙古人征服欧亚,都能给我们启发。
👍51
https://x.com/KobeissiLetter/status/1820438281844039760

之前日元负利率,美元长期高利率,人们通过两个货币的利差套利。

但是在日元利率上升,美元有降息预期的前提下,日元对美元汇率上涨一点,这些人就都爆仓了。
👍1
从昨晚开始,我看了YouTube频道上的一个“一口气看完《大明王朝1566》”,共五个多小时。过去对电视剧不太感兴趣,试着看过几次这部剧,都看不下去,但是看视频解说的话感觉节奏刚刚好。

我今天又翻看《明朝那些事儿》,把嘉靖皇帝继位到徐阶发迹的一段看了下,很有意思。

我还了解到《三国演义》电视剧的主题曲是明朝学问最渊博的杨慎写的:

滚滚长江东逝水,浪花淘尽英雄,是非成败转头空,青山依旧在,几度夕阳红。
白发渔樵江渚上,惯看秋月春风,一壶浊酒喜相逢,古今多少事,都付笑谈中!
👍1
https://m-mono.github.io/

这位网友使用LaTeX排版了好几本中文书。
👍1
《明朝那些事儿》中有句话:清朝名臣鄂尔泰曾经说过一句话:大事不糊涂,小事必然糊涂。

​人的精力是有限的,人们必须做出选择。选择在大事上糊涂还是小事上糊涂,会造成完全不同的结果。

明清政府都知道自己的管理能力有限,所以才会严格约束下面的百姓,禁止通商、出海,鼓励臣子内斗,试图让所有人来适应自己的制度。

但是邻居蒙古、日本的资源有限。大国不通商,小国也不会坐以待毙。只能通过抢来谋求一条生路。

后来的鸦片战争以及最近的贸易战,则是英美与中国持续的贸易逆差让其无法承受。中国管理者不去体谅他们的难处,他们只好向国外输出鸦片或者通过操纵汇率努力引爆别国的泡沫以转移代价。

作者在书中还说:在中国历史上,共同创业的人大都逃不过“四同”的结局:同舟共济——同床异梦——同室操戈——同归于尽。
😢51👍1
这种“城市从制度聚集区转变成失业聚集区”的问题,现在在欧美很严重,将来在中国也是很大的问题。

只有让每个人都能比较体面的生活下去,才可能缓解这类问题。

或者通过战争消耗掉多余的人,让剩余的人都有相对稳定的工作。

上个世纪之所以会爆发一战、二战,我认为根本原因也是类似的。德国、日本的工业很发达,当时他们的失业率应该也非常严重。

未来发生三战的可能性很大,人们应该认真思考如何避免,或者如何苟且。
👍5💩4
今天认真看了一章 Introduction to Robotics,然后又快速浏览几章,感觉其中的运算过于复杂了。

矩阵运算、逆运动学、雅可比……​自然界的生物控制系统似乎没有这些计算。

生物在视觉、触觉、听觉的辅助下,在先天继承的模型下根据自己特定的条件和场景迁移学习一段时间后,就能获得比较好的表现。

​未来的机器人如果标准化了,可能也会通过深度学习训练来提高它的运动表现,而不是经过复杂的让人头大的运算来获得精确解。

https://youtu.be/ET-MmoeSvXk

Deep Learning and Transfer Learning. This is the way!
Know Thyself
前一段时间,我在研究LaTeX和数学时,恰好媒体在持续热炒“中专数学天才姜萍”。虽然我没有十足的证据证明造假,但是概率告诉我十有八九是假的。于是我做了这样一个表格,发到了小红书上。 今天测试了下阿里的通义千问qwen2:7B小模型,在我多次提示的情况下,它也很难正确计算假阳性的概率。 这让我想起,前一段时间在Slate Star CodeX上看到的一篇博客《Statistical Literacy Among Doctors Is Lower Than Chance》,说的是很多医生的统计学素养完全不及格。…
昨晚睡觉时我在思考,为什么过于干净的环境反而会增加过敏、免疫排斥反应的几率?

假设人吃进去的食物99.9%都是无害的,而人体免疫系统正确分辨有害食物和无害食物的概率均为95%,那么免疫系统检测到的“有害物质”中有98%实际上是无害的。

如果吃进去的食物90%是无害的,那么假阳性的概率就会从98%下降到32%。

控制免疫系统的应该也是一个神经网络模型,这个大模型是在不干不净的环境下训练的,所以在特别干净的环境下泛化效果不够好。

我们需要适应快速变化的环境,但是我们大脑中的很多核心控制模型都在是过去的环境下训练的,难以在快速变化的新环境中获得较好的表现。这个问题将来应该如何解决,我也不清楚。
👍21
https://www.dxy.cn/bbs/newweb/pc/post/50774856

丁香园一个帖子怀疑最新的人民卫生出版社《内科学》教材有错误,截图中的内容分别在第三篇的第四章和第三章。

一本教材是由很多人写的,章末署名的每个人可能只负责那一个章节,所有内容写完后审查的少数几个人即使仔细看,也不会发现其中大多数矛盾的问题,因为每个人都有自己的专长和兴趣点。

这就是医学教材有必要以非营利的方式开源、滚动更新的缘故,那样才能及时纠正其中的大多数问题。

我感觉医学教材应该非营利的发布电子版,网页版像维基百科一样随时更新,少数专家把关自己领域的内容,每年出一个比较权威的PDF版本,每隔5年出一个N审N校的权威纸质版。

https://www.dxy.cn/bbs/newweb/pc/post/50668107

这个是老版本医学教材错误的讨论贴
今年最近几个月,我们公司经营的很困难,行业内卷的太厉害了。这种情况下,我也不能一门深入的学习、实践自己感兴趣的技术,只能被客户牵着走。客户就是上帝!

客户的需求一般都比较小众,大众的需求被卷的毫无利润,不值得做了。

我们公司不能为随机小客户的需求而承担整个测试成本,只能去找更专业的公司来解决问题。

其它同事把客户的需求讲给我,我再把自己领域的关键问题提取出来讲给更专业公司的技术客服,他们再跟技术销售沟通,帮助制定解决方案。

我今年写的代码基本只是在帮助自己、公司更好的决策,而很少运行在客户现场。

未来的企业经营会越来越困难,公司的管理水平必须不断提高,才可能生存下去。
🥰1😢1
https://x.com/tsarnick/status/1820933087829565939

Superintelligence的作者Nick Bostrom认为,为了学历而去读大学、读博都是不划算的,因为AI革命就在眼前,学历会持续快速贬值。

我认为即使AI在未来十年憋不出大招来,只要大模型、机器视觉……能持续不断降本增效并向各行业推广,也会让学历持续快速贬值。

在人力资源投资越多的高新技术企业,未来几年生存越艰难。因为技术的快速进步会让产能过剩、失业率更加严重,最终将没有足够的消费者买单。解决方案也很简单,每人每月无条件发几千块,这样既能打击人们工作的积极性又能促进消费。

只要制造产品的速度比印钞的速度快,即使全民发钱,也不会有普遍的通胀。
👍1
美国通胀的主要原因有:

❶打贸易战、加关税,虽然利好就业,但美国消费者要承受代价。
❷疫情期间大规模的发钱。如果只是政府印钱,需要足够多的时间,这些钱才能流向消费市场。但是发钱的话,通胀马上就起来了。
❸认可美元的人变少了,美元却更多了,美元的信用正在被严重透支。不仅国际上在减少对美元的依赖,很多美国人也选择投资加密货币来分散风险。

可能是因为利益相关,他们两个人都没把关键问题讲出来。

中国通缩的原因也是类似的:

①打贸易战以后,中国的很多产品卖不出去,只能打价格战。
②政府虽然印了不少钱,但是债务链条很长,需要很长时间才能产生效果。发钱的话,则会立竿见影。
③中国在严格控制资产外逃,控制数字货币,甚至控制人民币大额交易。这导致很难有人可以操纵市场,政府是最大的庄家。

不过今年的水灾,已经让蔬菜、水果涨价了,未来中国普通人可能也要面临长期通胀的压力。

年轻人的普遍躺平、逆全球化、央行印钱、自然灾难、战争……都会推高通胀。只有AI和机器人产业在抑制通胀,甚至制造通缩。相对通胀,背负债务的人们更加难以忍受通缩。
😢1
不想骑车、轮滑、打球,美食对自己也没什么吸引力,不知道这算是什么状态。

可能是这些年食品安全的问题太多了,吃东西禁忌越来越多,营养跟不上,所以体力不够好也就不那么想动了。也有可能是过去几年骑车、轮滑太多了,激情已经退去了。

还有一个可能的原因是,我过去规划骑行、轮滑路线时,常常刻意找沿途有单杠并且人少的地方,去年底一个我常玩的单杠被拆了。这导致自己每次玩的都不够尽兴。
👍1😇1
Know Thyself
https://www.dxy.cn/bbs/newweb/pc/post/50774856 丁香园一个帖子怀疑最新的人民卫生出版社《内科学》教材有错误,截图中的内容分别在第三篇的第四章和第三章。 一本教材是由很多人写的,章末署名的每个人可能只负责那一个章节,所有内容写完后审查的少数几个人即使仔细看,也不会发现其中大多数矛盾的问题,因为每个人都有自己的专长和兴趣点。 这就是医学教材有必要以非营利的方式开源、滚动更新的缘故,那样才能及时纠正其中的大多数问题。 我感觉医学教材应该非营利的发布电子版,网…
“忧思伤脾”,胃口不好、状态不好,跟脾胃不好也有一定关系。

在疫情期之前,我每天都面对着一个所有年轻人都在面对的死局。所以碰到2020年3月的机会后,我期望通过炒币暴富以打破死局,但我频繁的加杠杠合约交易让我在一年之内亏掉了近三个月的工资,虽然币价涨了近20倍。

之后家人生病,我也不再奢望暴富了,直接辞职回家摆烂了,顺便磨练投资者需要的耐心。

我的脾胃受到伤害的过程大概就在2019年到2021年之间。之后我开始规律的打坐,像个苦行僧每天吃一顿饭,有时候辟谷隔几天吃一顿。

去年入职体检时显示“脾大”,但医生看我的样子以及报告单,又不像肝有毛病,建议我到消化科检查。我说是不是因为头一天喝了点啤酒,医生说短期行为应该不会有太大影响。

想到要做胃镜之类的,就让我恐惧,我决定自己慢慢的调理,并改变生活习惯,减少思虑。

去年状态还是挺不错的,不过可能冬天运动量比较大,对气血的消耗比较严重,今年夏天状态就不太好。

我把人卫版五年临床第八、九版的全部教材,还有第十版的部分教材都下载下来了。如果西医对此有比较好的解释,我也愿意学习一下。我也买了本二手的人卫版《中医学》第九版教材,希望通过中医整体的思路,来诊断一下自己的问题。

之所以愿意保持开放的心态,一方面是感觉专科的西医有点水,一方面是看到我们认为是糟粕的“中医”又被西医当宝贝翻译过去了。

有一个华夏中医论坛,上面号称有2万本医书,如果用这些医书训练一个大模型,让病人们用实践来验证他们愿意相信的理论,通过统计学分析哪些理论更加有效,才是更科学的态度。