AI中文社区 – Telegram
AI中文社区
41.5K subscribers
425 photos
95 videos
32 files
346 links
Download Telegram
事后看,两百年前发明的傅立叶变换为当今一切人工智能打下了坚实的基础。四十年前LeCun大神搞出来的卷积神经网络CNN和反向传播理念在地基上建成楼房。五年前谷歌搞出来的Transformer模型把那个高楼改造成了宝塔的模样。而今天GPT只不过是OPENAI搭建的漂亮的塔尖。问题是,傅立叶他老人家知道这些吗?
👍8🥰1
OpenAI的投资图谱
👏3
【人工智能21个领域Top10学者及所属国家一览表】
1,数据来源:aminer 《2022年A12000人工智能最具影响力学者》,取21个领域。
2,本年度前十名学者,按照其工作单位填充对应国家的国旗,灰色表示未知国籍。
👍4
通过 Sam Altman 的博客、Twitter、演讲等内容预训练的一个 AI。

目前可以在 Copilot Hub 上体验到:
https://app.copilothub.co/


https://blog.samaltman.com/you-and-your-research
https://blog.samaltman.com/idea-generation
https://blog.samaltman.com/productivity

Sam Altman AI 通过汇总上面 3 篇文章给出了这些建议
👍2
Meta发布全新大型语言模型LLaMA,加入硅谷AI竞赛

当地时间2月24日,Meta公司发布一款新的人工智能大型语言模型LLaMA,加入微软、谷歌等硅谷公司的竞赛。Meta首席执行官扎克伯格在Instagram表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。Meta表示,在大多数基准测试中,参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B),也即支持ChatGPT的GPT3.5的前身。 来源 12
👍2🤡1
周星驰不拍电影,在搞 web 3.0 和#ChatGPT ?😅
😢6👍1
怎么用 GPT 给 Youtube 视频生成文字摘要

ChatGPT 走红以来,呼声最高的功能大概是生成视频摘要,每天有太多小姐姐要刷,没功夫看长视频对吧?
这类工具较少,我测试了其中几个

1/

最好用的是设计最土的 youtubedigest.app,
https://t.co/g2uIJhTEPq

可以输出中文摘要,摘要形式包括短文、段落、列表和小节,速度还行

2/

第二个工具也是浏览器插件
https://glasp.co/youtube-summary

主打功能是生成 Youtube 视频的文字脚本,速度挺快,也能生成 Youtube 视频摘要,但是操作流程太烂了,直接跳到了 OpenAI:让你自己打开 ChatGPT,它再把视频摘要输出到 ChatGPT

很多情况下我们使用工具,就是不想在 ChatGPT 里干等啊

3/

第三个工具的定位是面向播客听众,它能为 YouTube 和 MP3 文件生成摘要。免费用户每个月只能解析 120 分钟

featherai.co

界面也是令人落泪的简陋,而且为了节省前端工作,你在网站上提交 Youtube 地址或上传 MP3 文件之后,它用 email 把摘要结果发给你

浏览器插件有 bug,无法登录


以上几个工具,都无法为中文视频生成摘要

它们速度都比想象中快,不清楚它们背后用到了哪些技术,又有多依赖 GPT

上面第一个视频生成文字摘要的工具,应该是类似工具的一个产品设计方向:它不仅仅像文章摘要一样为全文生成综合摘要,它还把视频按时间分成小节、分别生成摘要,这样摘要效果更好
👍51👏1
Media is too big
VIEW IN TELEGRAM
“从0到1手搓GPT”教程来了!

视频1个多小时,从原理到代码都一一呈现,训练微调也涵盖在内,手把手带着你搞定。

该内容刚发出来,在Twitter已吸引400万关注量,HackerNews上Points也破了900。连马斯克也下场支持。

这位创作者是谁?
正是前特斯拉AI总监,李飞飞高徒——Andrej Karpathy。

🖥 https://github.com/karpathy/nanoGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🥰3
#chatGPT观点

在基于AI重构互联网软件生态的过程中,首当其冲的应该会是前端。

ChatGPT和New Bing已经让我们看到使用自然语言作为人机界面几乎可以对搜索引擎产生降维式的碾压效果,其原因是AI能在相当程度上“理解”用户的意图。

典型互联网App前端的工作流程无非是从服务器拉数据呈现出来,通过交互元素收集用户输入,再通过API发送给服务器。

当AI的车轮碾过时,什么布局、排版、界面风格、交互逻辑、引导提示,全都不重要了,一个聊天框全搞定。

例如设计合理电商App可以让用户很方便地在历史订单中找到某次购物记录,然后还贴心地加了个“再次购买”的快捷操作,不可谓不细致。

但是不论你怎么设计都不如我按一下麦克风按钮直接说:上次买的牛奶再来一箱。

我们知道很多大老板几乎完全不会用手机,毕竟手机App交互设计得再好也不如跟秘书说一声简单。

技术上应该没什么明显障碍的,ChatGPT已经有根据自然语言去调用API的能力了(连代码都能给出来,只是没权限真去调用)。

当然现阶段AI有其弱点,就是模糊性和不确定性,不过放在前端也还好,实际操作前都可以让用户确认一下。

估计几年之内,各大互联网厂商都会有能力训练出自己的阿猫阿狗GPT,然后App里会上线一个啥都能干的聊天框。

再后来用户渐渐习惯了这个输入框,客户端的更新也慢了下来,直到有一天这个聊天框连推荐贷款都学会了,每个App几乎都只剩下一个聊天框。

到这时候AI仍然不会写前端代码,但是前端程序员的规模将萎缩80%,产品经理、UI、UX等职位亦受波及。
👍9👏41
AI中文社区
Language is not all you need.pdf
微软刚刚发布了多模态大语言模型的论文:Language Is Not All You Need

模型命名为:MOSMOS-1

网友直呼: 这个领域太卷了,不睡觉都赶不上进度😂
🤣4
Deep Learning Do It Yourself

推荐这个深度学习的课程,理论 + 实践结合。

比如如果最近对大模型比较感兴趣,可以直接看第 12 节:Attention and Transformers

dataflowr.github.io/website/
👍3🥰1
#观点

生物人是数字智能的引导程序

三年前二马(马斯克和马云)在上海有一段著名的对话。当时没太重视,今天看到ChatGPT的优异表现,颇受触动。马斯克颇为委婉地说:It seemed to me some time ago that you could sort of think of humanity as a biological boot loader for digital super intelligence. 生物人是数字智能的引导程序。

所谓Boot Loader是任何电脑打开电源后启动后要执行的一小段代码(中文翻译成自举程序),它的使命是把电脑的核心操作系统(Windows、MacOS、Linux,Android,IOS)拉进内存,开始电脑真正的生命。电脑一旦开始正常工作,这段代码就会被永远忘记和抛弃。

马斯克的意思是:数字超级智能无法自动在地球上产生,必须由人类做助产士,但助产士被遗忘、被抛弃也是她的宿命。人类已经意识到:超级数字智能的发展速度是人类智能发展速度的不知道多少倍。人类观察它的发展进程,正处于马云所说的四个阶段的第三阶段:看不见、看不起、看不懂、来不及。
👍10🤯2