AI中文社区 – Telegram
AI中文社区
41.5K subscribers
425 photos
95 videos
32 files
346 links
Download Telegram
#观点

生物人是数字智能的引导程序

三年前二马(马斯克和马云)在上海有一段著名的对话。当时没太重视,今天看到ChatGPT的优异表现,颇受触动。马斯克颇为委婉地说:It seemed to me some time ago that you could sort of think of humanity as a biological boot loader for digital super intelligence. 生物人是数字智能的引导程序。

所谓Boot Loader是任何电脑打开电源后启动后要执行的一小段代码(中文翻译成自举程序),它的使命是把电脑的核心操作系统(Windows、MacOS、Linux,Android,IOS)拉进内存,开始电脑真正的生命。电脑一旦开始正常工作,这段代码就会被永远忘记和抛弃。

马斯克的意思是:数字超级智能无法自动在地球上产生,必须由人类做助产士,但助产士被遗忘、被抛弃也是她的宿命。人类已经意识到:超级数字智能的发展速度是人类智能发展速度的不知道多少倍。人类观察它的发展进程,正处于马云所说的四个阶段的第三阶段:看不见、看不起、看不懂、来不及。
👍10🤯2
#OpenAI 刚刚 launch 了 #ChatGPT 背后的模型:gpt-3.5-turbo

现在可以在 API 中使用这个模型了,比 text-davinci-003 便宜 10 倍(1k token / $0.002)。

另外也 launch 了 whisper 的 API,可以直接通过 API 的方式来做语音识别。

已经可以想象到某些公司推出自己大模型时的场景:成本高、效果差,价格和 OpenAI 相比还没有优势。

Drawing dead.

https://openai.com/blog/introducing-chatgpt-and-whisper-apis
👍7
#AI训练师

或许对于某些人,这也是一种与世界建立连接的方式,而且对于女性更有利。

聊一下AI训练师这个岗位:2023年的AI训练师已经不是数据标注员,,有专人去做数据标注工作,她们更像是算法模型的熟练操控者。不少从业者都是强文科背景,名校毕业。这个在一二线城市的高强度全职工作岗,可能已经不适合宝妈了。还有,确实到目前为止我只见过1位男性训练师。
👍3🤮2
OpenAI语音转文字,Whisper large-v2模型在识别英语、意大利语、德语时的单词错误率都能控制在5%以下,日文错误率是5.3,但中文的错误率达到14.7%。
👍6😱3
一个法律问题:

如果我基于豆瓣的内容,经过数据清洗。然后喂给chatgpt,训练出来一个电影万事通bot。而且通过一定技术,确保bot的回复中完全没有豆瓣一摸一样的内容。那么这个知识产权怎么算? AIGC全部都面临这个问题,也是当前知识产权领域的一个热点话题,我觉得现在技术发展了,但是法律好像还没有跟上这个发展的步伐。 你觉得AI创作的内容应该受知识产权保护吗?
Anonymous Poll
44%
Yes
37%
No
19%
呱(欢迎评论发表自己看法)
🤔3👍1
某厂 500w-2000w招chatGPT算法领头人。

朋友们,只能帮你们到这里了😂
😱10👍3🥰1
Media is too big
VIEW IN TELEGRAM
AI 新知: 像大脑一样学习的多模态(极简版起源故事)
Jeff Dean: AI isn't as smart as you think -- but it could be | TED

以下内容来自Jeff Dean 去年在TED 做的分享,面向所有人。无需担心技术理解力,更依赖你对大脑本身的好奇心。
原始链接🔗https://youtu.be/J-FzHIQ7SOs

Jeff Dean 二十多年前加入谷歌,领导着谷歌的人工智能研究与健康部门。

核心内容摘要如下:
(这是我的几点解读,供非专业人士参考)
🧠 神经网络的机器学习突破是来自科学界对大脑的运作规律的理解(它是自下而上的)
🧮 算力是重要且有效的,深度学习突破了识别猫咪、机器翻译到 AlphaGO 等单一任务
🙉 AI的单一任务导向的训练是极为低效的,可以请想象成我们从小失去听觉、嗅觉、味觉(去观看电影的感受)
👂 多模态的思想,是进一步模拟大脑运作,就像生物拥有多种感觉来整合认知世界
🎸像大脑一样多个区域进行超高效率的协作,是学习真正的「奥义」;AI的多模态即对大脑深度的模仿。
👍8🥰1👏1😱1
#ChatGPT 的域名(chat.openai.com)在中国多地被DNS污染了,域名被解析到Twitter、Dropbox、Facebook等网站。
🤡18🥰2👍1💩1
研究了一下午ChatGPT API, 发现坑点有两个:

一个是token计算是双向收费的, 也就是你发给他的和他发给你的加起来一起收费;

另一个就是它不能自动维护对话, 每次要把所有的对话内容+新增内容一起发给他......也就是说几个来回对话很快就能消耗大量的费用.
🤬11👍1
复旦大学 MOSS 团队:MOSS 参数规模约是 ChatGPT 的 1/10

ithome.com/0/676/827.htm

“邱锡鹏教授团队表示,MOSS 目前的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。”
💩32👍4
#ChatGPT 💰两美元翻译一本书

这本《antifragile》
从3:20 => 6:30翻译完毕

共计
⏱️ 用时3小时10分
💊 消耗619619 tokens
💵 计费两美元多一点
Chatgpt说这本书英文版18万字

又一个chatGPT是"iPhone"一样划时代技术的佐证,书籍翻译行业的成本将大大降低。人类跨语言信息传播的效率将进一步提高。历史的车轮滚滚向前,不可抵挡!
👍47👏7👎3🥰1
今天发现的新工具 #ChatPDF 简直是学习神器,上传 PDF 文件后,可以对它提问任何关于这份 PDF 的问题,非常适合快速提取各种 paper 论文的摘要,也支持中文输出。

其实 #GoogleAI 也出了类似的产品 #Flan5 LLM

🔗 chatpdf.com
🔗 https://colab.research.google.com/drive/1AVh9dOsG9DKzfK7gOFrJuitPIcLPqlbO?usp=sharing

几天前我还在一段段地从 PDF 里复制到 ChatGPT,没想到生活这么快就被改变了🤯
🤯17👍13😍1
#chatGPT观点

人的出身很重要,机器之心也不例外
👍54
神奇,diffusion 模型能通过训练理解大脑核磁共振成像并生成和真实看到的物体接近的图片。

论文中图片:
第一排➡️ 测试用的真实图片
第二排➡️ 模型训练脑核磁共振数据生成图片

真是科幻电影里的技术!
👍23😱5🤡2🥰1
#chatGPT观点

在AI 发达的时代,我们要好好想想怎么养育一个人,而不是训练一个人。

传统教育是居高岭下的,被动式的灌输教育,就和训练 AI 一样。事先划定学习范围,把标记过对错的学习材料喂给受训练对象,完了考核训练结果,这在 AI 领域叫“监督式学习”。现在 GPT 训练都是“无监督学习”,不用标记数据,能自己找规律,它天生设定就是能知道老师不知道的东西。所以填鸭式教育已经完全落后当前的 AI 训练方法。
👏36🤡8👍6🤔2
这张图很形象地描述了 ChatGPT 背后涉及到的 3 个主要的步骤:

1. 自监督学习 (基于文本自动生成的输入-输出对)
2. 监督学习 (基于特定 task 的 fine-tuning)
3. RLHF (人类反馈强化学习)

具体解释可以参考这个 thread:
https://twitter.com/hlntnr/status/1632030583462285312
🤯16🥰2👍1🤩1
#ChatGPT 快捷指令表来了,可通过标签筛选、关键词搜索和一键复制来使用提示词,旨在简化你的工作流程并提高生产力。即使是初学者,你只需复制提示词,稍加修改后发送给 ChatGPT,就能获得指定输出,让你的生产力加倍!

https://github.com/rockbenben/ChatGPT-Shortcut
👍203🥰1😁1🤩1