Forwarded from AI探索指南
震撼🫨!牛逼!OpenAI 发布了 Sora,一种文字生成视频的技术,从演示看,效果还是相当不错的。
Sora 的强大之处在于其能够根据文本描述,生成长达 60 秒的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。
目前,Sora已对网络安全的红队成员开放,以评估其可能存在的风险或潜在伤害。同时,OpenAI 也邀请了视觉艺术家、设计师和电影制作人使用Sora,收集他们的反馈,以使模型更好地服务于创意行业。
Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令,还能洞察这些元素在现实世界中的表现。
Sora对语言有着深刻的理解,能够精准地捕捉到用户的需求,并创造出充满生命力、情感丰富的角色。此外,Sora还能在同一视频中创造出多个画面,同时保持角色和视觉风格的一致性。
当然,Sora还不是完美的。比如在模拟复杂场景的物理效应,以及理解某些特定因果关系时,它可能会遇到难题。举个例子,视频中的人物可能会咬一口饼干,但饼干上可能看不到明显的咬痕。
在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;在精确描述一段时间内发生的事件,如特定的摄影机移动轨迹时,也可能显得力不从心。
—-
视频二提示词:一位时髦的女士穿行在东京的街头,街道充满了温暖的霓虹灯光和动感的城市标志。她穿着一件黑色皮夹克,一条长红裙和黑色靴子,手拿一个黑色手提包。她戴着太阳镜和红色口红。她走路既自信又随意。街道潮湿且能反射,创造出彩色灯光的镜面效果。许多行人来来往往。
产品地址: openai.com/sora
Sora 的强大之处在于其能够根据文本描述,生成长达 60 秒的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。
目前,Sora已对网络安全的红队成员开放,以评估其可能存在的风险或潜在伤害。同时,OpenAI 也邀请了视觉艺术家、设计师和电影制作人使用Sora,收集他们的反馈,以使模型更好地服务于创意行业。
Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令,还能洞察这些元素在现实世界中的表现。
Sora对语言有着深刻的理解,能够精准地捕捉到用户的需求,并创造出充满生命力、情感丰富的角色。此外,Sora还能在同一视频中创造出多个画面,同时保持角色和视觉风格的一致性。
当然,Sora还不是完美的。比如在模拟复杂场景的物理效应,以及理解某些特定因果关系时,它可能会遇到难题。举个例子,视频中的人物可能会咬一口饼干,但饼干上可能看不到明显的咬痕。
在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;在精确描述一段时间内发生的事件,如特定的摄影机移动轨迹时,也可能显得力不从心。
—-
视频二提示词:一位时髦的女士穿行在东京的街头,街道充满了温暖的霓虹灯光和动感的城市标志。她穿着一件黑色皮夹克,一条长红裙和黑色靴子,手拿一个黑色手提包。她戴着太阳镜和红色口红。她走路既自信又随意。街道潮湿且能反射,创造出彩色灯光的镜面效果。许多行人来来往往。
产品地址: openai.com/sora
👍1🤔1
Forwarded from Solidot
拼多多:滥用竞业协议,让员工白打工
2024-02-12 14:29 by 风之影
长期以来,科技企业滥用竞业协议限制员工跳槽,受此限制,员工离职就只能离开这个行业。而在拼多多、字节跳动、MiniMax等企业,竞业协议已经成了让员工白打工的手段。因为拼多多在上海市起诉总会获胜,诉讼成本远低于获利,在拼多多的一些部门和岗位,甚至所有离职员工都会被起诉竞业,要求赔偿在拼多多工作的全部收入,连雇佣侦探公司调查员工的费用也需要赔付。然而,拼多多给的竞业金却往往低于30%的法定最低标准。春节前夕,多位拼多多离职员工在微博上表示,离职时被威胁不签竞业协议不给离职证明,离职后被拼多多以竞业为名起诉赔偿。几年工作期间每日工作至凌晨,身体健康受到严重损害,法定的加班费却没拿到,还被要求返还全部收入。微博名为“码代码的喵2018”的拼多多前员工称,在拼多多工作4年零5个月,离职后被起诉竞业索赔高达450万元人民币。同时,他还实名举报称,国家市场监督管理总局广告司副司长文学违反《公务员法》在拼多多担任副总裁,上海市市场监督管理局政策法规处副处长徐敏韬同样违法在拼多多担任公共事务总裁。2022年,拼多多被投诉举报82782件,被处罚0件。
https://web.archive.org/web/20240204172011/https://www.163.com/dy/article/IQ4TLP560534B9EY.html
https://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20240206110556816fc7d1
https://mp.weixin.qq.com/s?__biz=MjM5NzE3NjM2OQ==&mid=2247493580&idx=2&sn=0c3d229c0662525a32f35b936847eef5
https://www.huxiu.com/article/449066.html
#商业
2024-02-12 14:29 by 风之影
长期以来,科技企业滥用竞业协议限制员工跳槽,受此限制,员工离职就只能离开这个行业。而在拼多多、字节跳动、MiniMax等企业,竞业协议已经成了让员工白打工的手段。因为拼多多在上海市起诉总会获胜,诉讼成本远低于获利,在拼多多的一些部门和岗位,甚至所有离职员工都会被起诉竞业,要求赔偿在拼多多工作的全部收入,连雇佣侦探公司调查员工的费用也需要赔付。然而,拼多多给的竞业金却往往低于30%的法定最低标准。春节前夕,多位拼多多离职员工在微博上表示,离职时被威胁不签竞业协议不给离职证明,离职后被拼多多以竞业为名起诉赔偿。几年工作期间每日工作至凌晨,身体健康受到严重损害,法定的加班费却没拿到,还被要求返还全部收入。微博名为“码代码的喵2018”的拼多多前员工称,在拼多多工作4年零5个月,离职后被起诉竞业索赔高达450万元人民币。同时,他还实名举报称,国家市场监督管理总局广告司副司长文学违反《公务员法》在拼多多担任副总裁,上海市市场监督管理局政策法规处副处长徐敏韬同样违法在拼多多担任公共事务总裁。2022年,拼多多被投诉举报82782件,被处罚0件。
https://web.archive.org/web/20240204172011/https://www.163.com/dy/article/IQ4TLP560534B9EY.html
https://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN20240206110556816fc7d1
https://mp.weixin.qq.com/s?__biz=MjM5NzE3NjM2OQ==&mid=2247493580&idx=2&sn=0c3d229c0662525a32f35b936847eef5
https://www.huxiu.com/article/449066.html
#商业
Forwarded from AI探索指南
This media is not supported in your browser
VIEW IN TELEGRAM
Jim Fan 详细介绍了一下 Sora 的实现原理,这不仅仅是一个视频生成模型这么简单,还是一个基于数据驱动的虚幻 5 引擎。#ai视频#
如果你以为OpenAI Sora只是一个像DALLE这样的创意小玩具,那你可要重新认识一下了。Sora实际上是一个基于数据驱动的物理引擎,能够模拟各种真实或奇幻的世界。这款模拟器能学会复杂的渲染技术、直观的物理规律、长期的逻辑推理以及语义理解,而这一切都是通过先进的去噪技术和梯度计算实现的。
我甚至猜测,Sora可能是通过使用Unreal Engine 5生成的大量合成数据来进行训练的。这听起来非常有可能!
下面我们来详细分析一段视频。这段视频的提示是:“一杯咖啡里,两艘海盗船相互战斗的逼真特写视频。”
•视频中,模拟器创建了两艘装饰各异的精美海盗船的3D模型。Sora需要在其庞大的数据空间中隐式地完成从文本到3D模型的转换。
•这些3D模型的海盗船在航行中能够自然地动起来,它们在避开对方的同时,动作流畅协调。
•还有咖啡的流体动力学表现,包括船只周围形成的泡沫。流体模拟本身就是计算机图形学中一个复杂的分支,通常需要复杂的算法和方程式来实现。
•视频的光影效果逼真,几乎可以媲美光线追踪技术的渲染效果。
•模拟器还考虑到了杯子与海洋相比较小的尺寸,并运用了移轴摄影技术(Tilt-shift photography),为整个场景增添了一种微观世界的感觉。
•虽然视频中的场景在现实世界里找不到对应,但模拟器还是根据我们的期望,准确实现了物理规则。
接下来的步骤是:引入更多的模态和条件变量,我们就可以得到一个全面的、基于数据驱动的Unreal Engine。它将有望替代所有现有的手工设计图形处理流程。 歸藏的AI工具箱的微博视频
如果你以为OpenAI Sora只是一个像DALLE这样的创意小玩具,那你可要重新认识一下了。Sora实际上是一个基于数据驱动的物理引擎,能够模拟各种真实或奇幻的世界。这款模拟器能学会复杂的渲染技术、直观的物理规律、长期的逻辑推理以及语义理解,而这一切都是通过先进的去噪技术和梯度计算实现的。
我甚至猜测,Sora可能是通过使用Unreal Engine 5生成的大量合成数据来进行训练的。这听起来非常有可能!
下面我们来详细分析一段视频。这段视频的提示是:“一杯咖啡里,两艘海盗船相互战斗的逼真特写视频。”
•视频中,模拟器创建了两艘装饰各异的精美海盗船的3D模型。Sora需要在其庞大的数据空间中隐式地完成从文本到3D模型的转换。
•这些3D模型的海盗船在航行中能够自然地动起来,它们在避开对方的同时,动作流畅协调。
•还有咖啡的流体动力学表现,包括船只周围形成的泡沫。流体模拟本身就是计算机图形学中一个复杂的分支,通常需要复杂的算法和方程式来实现。
•视频的光影效果逼真,几乎可以媲美光线追踪技术的渲染效果。
•模拟器还考虑到了杯子与海洋相比较小的尺寸,并运用了移轴摄影技术(Tilt-shift photography),为整个场景增添了一种微观世界的感觉。
•虽然视频中的场景在现实世界里找不到对应,但模拟器还是根据我们的期望,准确实现了物理规则。
接下来的步骤是:引入更多的模态和条件变量,我们就可以得到一个全面的、基于数据驱动的Unreal Engine。它将有望替代所有现有的手工设计图形处理流程。 歸藏的AI工具箱的微博视频
Forwarded from AI探索指南
This media is not supported in your browser
VIEW IN TELEGRAM
卧槽,Open AI的大招终于来了,发布视频生成模型 Sora,从演示来看视频生成时长、运动幅度以及稳定性均碾压现在的所有视频生成模型。#ai视频#
Sora能够创作出长达一分钟的视频,不仅保证了视频的视觉质量,还能准确响应用户的指令。将在今天想有限的访问者开放。
模型优势:
Sora能够创造出包括多个角色、特定动作类型以及对主题和背景的精确细节描述的复杂场景。这款模型不仅能理解用户在指令中提出的需求,还能洞察这些元素在现实世界中是如何存在和表现的。
这款模型对语言的理解非常深刻,使其能够精准地识别用户的指令,并创造出表情丰富、情感生动的角色。此外,Sora还能在同一视频内制作多个镜头,同时确保角色的形象和整体的视觉风格保持一致。
工作原理:
Sora是一种扩散模型(diffusion model),它通过从类似静态噪声的视频出发,逐步去除噪声,从而在多个步骤中生成视频。
Sora不仅能一次生成整个视频,还能延长已有视频的长度。我们通过使模型能够预见多个画面帧,解决了确保视频中主题即使暂时离开画面也能保持一致的难题。
Sora采用了类似于GPT模型的变压器架构(transformer architecture),这为其带来了优异的扩展性能。
在Sora中,视频和图像被表示为一系列小块数据,称为“补丁”(patches),每个补丁都类似于GPT中的“令牌”(token)。通过统一数据表示方式,我们能够在之前不可能的更广泛视觉数据范围内训练扩散变压器,包括不同的时长、分辨率和长宽比。
Sora基于DALL·E和GPT模型的研究成果。它采用了DALL·E 3中的重标记技术(recaptioning technique),为视觉训练数据生成详细描述的标题。因此,模型能更准确地遵循用户在生成视频中的文字指令。
除了能从文字指令生成视频外,Sora还能将现有静止图像转化为视频,准确地动态展现图像内容并关注细节。此外,它还能扩展现有视频或填补视频中缺失的画面。
了解更多:网页链接歸藏的AI工具箱的微博视频
Sora能够创作出长达一分钟的视频,不仅保证了视频的视觉质量,还能准确响应用户的指令。将在今天想有限的访问者开放。
模型优势:
Sora能够创造出包括多个角色、特定动作类型以及对主题和背景的精确细节描述的复杂场景。这款模型不仅能理解用户在指令中提出的需求,还能洞察这些元素在现实世界中是如何存在和表现的。
这款模型对语言的理解非常深刻,使其能够精准地识别用户的指令,并创造出表情丰富、情感生动的角色。此外,Sora还能在同一视频内制作多个镜头,同时确保角色的形象和整体的视觉风格保持一致。
工作原理:
Sora是一种扩散模型(diffusion model),它通过从类似静态噪声的视频出发,逐步去除噪声,从而在多个步骤中生成视频。
Sora不仅能一次生成整个视频,还能延长已有视频的长度。我们通过使模型能够预见多个画面帧,解决了确保视频中主题即使暂时离开画面也能保持一致的难题。
Sora采用了类似于GPT模型的变压器架构(transformer architecture),这为其带来了优异的扩展性能。
在Sora中,视频和图像被表示为一系列小块数据,称为“补丁”(patches),每个补丁都类似于GPT中的“令牌”(token)。通过统一数据表示方式,我们能够在之前不可能的更广泛视觉数据范围内训练扩散变压器,包括不同的时长、分辨率和长宽比。
Sora基于DALL·E和GPT模型的研究成果。它采用了DALL·E 3中的重标记技术(recaptioning technique),为视觉训练数据生成详细描述的标题。因此,模型能更准确地遵循用户在生成视频中的文字指令。
除了能从文字指令生成视频外,Sora还能将现有静止图像转化为视频,准确地动态展现图像内容并关注细节。此外,它还能扩展现有视频或填补视频中缺失的画面。
了解更多:网页链接歸藏的AI工具箱的微博视频
Forwarded from 2.5次元日常 (葱在燃烧 | #Pigeon Pt.39)
Image_1708050325521.jpg
718.8 KB
Forwarded from 2.5次元日常 (葱在燃烧 | #Pigeon Pt.39)
你还真别说 波兰蠢驴真做到了
Forwarded from 科技圈🎗在花频道📮
福岛核电站污水外泄原因 东电:忘关手动闸门
日本东京电力公司说,福岛第一核电厂日前发生含放射性物质水外泄事件,是因为作业人员忘记关手动闸门,据信污水外泄约40分钟。
根据东电星期四(2月15日)公布的报告,2月7日上午,作业人员在福岛第一核电站高温焚烧炉厂房东侧外墙,距离地面约5公尺的第二铯吸附装置排气口处,发现有水从大楼内部外泄。
根据报告,事故当时,外包企业的作业员两人一组,依照操作手册检查手动闸门是否关闭。但他们只检查了闸门编号,并未确认闸门的状态。
报告指出,作业员执行确认工作的操作手册是由东电制作,但这次运作与维修部门之间资讯共享不足,导致实际状况与手册上记载的不同。东电表示将严正看待,采取措施,以防相同事件再次发生。
zaobao
投稿:@TNSubmbot
频道:@TestFlightCN
日本东京电力公司说,福岛第一核电厂日前发生含放射性物质水外泄事件,是因为作业人员忘记关手动闸门,据信污水外泄约40分钟。
根据东电星期四(2月15日)公布的报告,2月7日上午,作业人员在福岛第一核电站高温焚烧炉厂房东侧外墙,距离地面约5公尺的第二铯吸附装置排气口处,发现有水从大楼内部外泄。
根据报告,事故当时,外包企业的作业员两人一组,依照操作手册检查手动闸门是否关闭。但他们只检查了闸门编号,并未确认闸门的状态。
报告指出,作业员执行确认工作的操作手册是由东电制作,但这次运作与维修部门之间资讯共享不足,导致实际状况与手册上记载的不同。东电表示将严正看待,采取措施,以防相同事件再次发生。
zaobao
投稿:@TNSubmbot
频道:@TestFlightCN