Forwarded from LoopDNS资讯播报
秦刚辞去中国全国人民代表大会代表职务
全国人民代表大会常务委员会2月27日公告,天津市人大常委会决定接受秦刚辞去第十四届全国人民代表大会代表职务。依照《中华人民共和国全国人民代表大会和地方各级人民代表大会代表法》的有关规定,秦刚的代表资格终止。
—— 新华社
全国人民代表大会常务委员会2月27日公告,天津市人大常委会决定接受秦刚辞去第十四届全国人民代表大会代表职务。依照《中华人民共和国全国人民代表大会和地方各级人民代表大会代表法》的有关规定,秦刚的代表资格终止。
—— 新华社
Forwarded from LoopDNS资讯播报
在以色列驻华盛顿使馆外自焚的美国空军现役飞行员已经死亡。
25岁的美国空军飞行员艾伦·布什奈尔(Aaron Bushnell)在以色列使馆外自焚后,于星期一(26日)晚些时候伤重不治。
消息来源: 法新社/BBC News/联合早报
25岁的美国空军飞行员艾伦·布什奈尔(Aaron Bushnell)在以色列使馆外自焚后,于星期一(26日)晚些时候伤重不治。
消息来源: 法新社/BBC News/联合早报
😢1🤡1
Forwarded from LoopDNS资讯播报
日本东电宣布将于28日开始第四轮核污染水排放
当地时间2月26日,日本东京电力公司宣布,将于28日开始对福岛第一核电站的核污染水进行第四次排放。
消息来源: 央视新闻
当地时间2月26日,日本东京电力公司宣布,将于28日开始对福岛第一核电站的核污染水进行第四次排放。
消息来源: 央视新闻
Forwarded from LoopDNS资讯播报
截瘫患者通过脑机接口实现控制光标
近日,中国首都医科大学附属北京天坛医院神经外科贾旺教授团队联合清华大学洪波教授团队,利用微创脑机接口技术首次成功帮助高位截瘫患者实现意念控制光标移动。洪波介绍,目前团队正不断优化脑机接口解码算法,计划帮助患者实现通过意念活动控制电子书翻页、光标点击确认等,增强患者与电子设备的交互能力。
—— 央视新闻
近日,中国首都医科大学附属北京天坛医院神经外科贾旺教授团队联合清华大学洪波教授团队,利用微创脑机接口技术首次成功帮助高位截瘫患者实现意念控制光标移动。洪波介绍,目前团队正不断优化脑机接口解码算法,计划帮助患者实现通过意念活动控制电子书翻页、光标点击确认等,增强患者与电子设备的交互能力。
—— 央视新闻
Forwarded from AI探索指南
This media is not supported in your browser
VIEW IN TELEGRAM
微软这个研究相当强啊,可以不经过训练直接融合多个 Lora 不损失效果,而且他们提出的通过 GPT-4V 评价图像质量的方法也很有参考性。#ai画图#
项目介绍:
本项目旨在通过新的文本至图像生成方法,着重采用多重低秩适应(Low-Rank Adaptations, LoRAs)技术,创造高度个性化且细节丰富的图像。我们介绍了LoRA开关(LoRA Switch)与LoRA组合(LoRA Composite),这两种方式的目标是在精确度和图像质量上超越传统技术,特别是在处理复杂图像组合时。
项目特色:
🚀 免训练方法
LoRA开关和LoRA组合支持动态精确地整合多个LoRA,无需进行微调。
我们的方法不同于那些融合LoRA权重的做法,而是专注于解码过程,并保持所有LoRA权重不变。
📊 ComposLoRA测试平台
这是一个全新的综合性测试平台,包含480套组合和22个在六大类别中预训练好的LoRA。
ComposLoRA专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。
📝 基于GPT-4V的评估工具
我们提出采用GPT-4V作为评估工具,用以判定组合效果及图像质量。
该评估工具已证实在与人类评价的相关性上有更好的表现。
🏆 卓越性能
无论是自动化还是人类评价,我们的方法都显著优于现有的LoRA合并技术。
在生成复杂图像组合的场景中,我们的方法表现出更加突出的优势。
🕵️♂️ 详尽分析
我们对每种方法在不同场景下的优势进行了深入的分析。
同时,我们还探讨了采用GPT-4V作为评估工具可能存在的偏差。
项目地址:网页链接歸藏的AI工具箱的微博视频
项目介绍:
本项目旨在通过新的文本至图像生成方法,着重采用多重低秩适应(Low-Rank Adaptations, LoRAs)技术,创造高度个性化且细节丰富的图像。我们介绍了LoRA开关(LoRA Switch)与LoRA组合(LoRA Composite),这两种方式的目标是在精确度和图像质量上超越传统技术,特别是在处理复杂图像组合时。
项目特色:
🚀 免训练方法
LoRA开关和LoRA组合支持动态精确地整合多个LoRA,无需进行微调。
我们的方法不同于那些融合LoRA权重的做法,而是专注于解码过程,并保持所有LoRA权重不变。
📊 ComposLoRA测试平台
这是一个全新的综合性测试平台,包含480套组合和22个在六大类别中预训练好的LoRA。
ComposLoRA专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。
📝 基于GPT-4V的评估工具
我们提出采用GPT-4V作为评估工具,用以判定组合效果及图像质量。
该评估工具已证实在与人类评价的相关性上有更好的表现。
🏆 卓越性能
无论是自动化还是人类评价,我们的方法都显著优于现有的LoRA合并技术。
在生成复杂图像组合的场景中,我们的方法表现出更加突出的优势。
🕵️♂️ 详尽分析
我们对每种方法在不同场景下的优势进行了深入的分析。
同时,我们还探讨了采用GPT-4V作为评估工具可能存在的偏差。
项目地址:网页链接歸藏的AI工具箱的微博视频
Forwarded from 科技圈🎗在花频道📮
美国司法部将对苹果反垄断诉讼
美国司法部预计将在3月底之前对苹果提起反垄断诉讼。上周,苹果公司与美国司法部会晤,以期在避免被反垄断诉讼方面做最后一搏。(彭博)
美国司法部预计将在3月底之前对苹果提起反垄断诉讼。上周,苹果公司与美国司法部会晤,以期在避免被反垄断诉讼方面做最后一搏。(彭博)
Forwarded from 科技圈🎗在花频道📮
即将推出的 Android 更新将大幅提升 AV1 视频在廉价设备上的表现
与 h.264、h265 或 VP9 等旧编解码器相比,AV1 有卓越的压缩效率而获得相同的画质且AV1 还免收任何版税。
然而,因为许多设备缺乏用于播放以 AV1 编码的视频的硬件加速器,流媒体服务在其内容推广采用 AV1 的速度很慢,因为这意味着如果用户设备没有AV1硬件加速器,它们的设备需要使用在 CPU 上运行的软件解码器。
谷歌正计划向 Android 手机推送更新,以显着改善廉价设备上的 AV1 视频播放效果。 2024 年 3 月的 Play 系统更新可能会将 Google 的 libgav1 编解码器替换为 VideoLAN 的 libdav1d 编解码器。
但不确定该更新会推广到支持 Media Codecs 主线模块(Android 10 及更高版本)的所有设备,还是仅推广到运行Android 14的设备。
Android Authority
线索:@ZaiHuabot
投稿:@TNSubmbot
频道:@TestFlightCN
与 h.264、h265 或 VP9 等旧编解码器相比,AV1 有卓越的压缩效率而获得相同的画质且AV1 还免收任何版税。
然而,因为许多设备缺乏用于播放以 AV1 编码的视频的硬件加速器,流媒体服务在其内容推广采用 AV1 的速度很慢,因为这意味着如果用户设备没有AV1硬件加速器,它们的设备需要使用在 CPU 上运行的软件解码器。
谷歌正计划向 Android 手机推送更新,以显着改善廉价设备上的 AV1 视频播放效果。 2024 年 3 月的 Play 系统更新可能会将 Google 的 libgav1 编解码器替换为 VideoLAN 的 libdav1d 编解码器。
但不确定该更新会推广到支持 Media Codecs 主线模块(Android 10 及更高版本)的所有设备,还是仅推广到运行Android 14的设备。
Android Authority
线索:@ZaiHuabot
投稿:@TNSubmbot
频道:@TestFlightCN
Forwarded from AI探索指南
This media is not supported in your browser
VIEW IN TELEGRAM
阿里又tm 整了个大活,输入图片和音频就可以生成富有表现力的视频,并且嘴型是可以跟声音匹配的。#ai视频#
支持多语言、谈话、唱歌以及快语速的适配,这玩意又是一个造假利器,这下可能很多名人真要说“不是我说的,你别瞎说”了。
可以根据输入视频的长度生成任意持续时间的视频。
实现方式:
该方法主要分为两个阶段。第一阶段是“帧编码”阶段,在这个阶段,我们使用 ReferenceNet 来从参考图像和运动帧中提取特征。随后进入“扩散过程”阶段,在这一阶段,一个预先训练好的音频编码器用于处理音频数据的嵌入。此外,面部区域的掩码与多帧的噪声数据结合在一起,用于引导面部图像的生成过程。
紧接着,我们使用 Backbone Network 来执行去噪处理。在 Backbone Network 中,我们运用了两种关键的注意力机制:一种是基于参考图像的“参考注意力(Reference-Attention)”,另一种是基于音频的“音频注意力(Audio-Attention)”。
这两种机制对于确保角色的面部特征保持一致和调整角色的面部运动至关重要。最后,我们还利用了时间模块来调节图像的时间维度,使角色的运动速度得以调整。这些组合在一起构成了我们的整体框架。
项目地址:网页链接歸藏的AI工具箱的微博视频
支持多语言、谈话、唱歌以及快语速的适配,这玩意又是一个造假利器,这下可能很多名人真要说“不是我说的,你别瞎说”了。
可以根据输入视频的长度生成任意持续时间的视频。
实现方式:
该方法主要分为两个阶段。第一阶段是“帧编码”阶段,在这个阶段,我们使用 ReferenceNet 来从参考图像和运动帧中提取特征。随后进入“扩散过程”阶段,在这一阶段,一个预先训练好的音频编码器用于处理音频数据的嵌入。此外,面部区域的掩码与多帧的噪声数据结合在一起,用于引导面部图像的生成过程。
紧接着,我们使用 Backbone Network 来执行去噪处理。在 Backbone Network 中,我们运用了两种关键的注意力机制:一种是基于参考图像的“参考注意力(Reference-Attention)”,另一种是基于音频的“音频注意力(Audio-Attention)”。
这两种机制对于确保角色的面部特征保持一致和调整角色的面部运动至关重要。最后,我们还利用了时间模块来调节图像的时间维度,使角色的运动速度得以调整。这些组合在一起构成了我们的整体框架。
项目地址:网页链接歸藏的AI工具箱的微博视频
Forwarded from Solidot
Tumblr 母公司与 OpenAI 磋商出售用户帖子训练 AI
2024-02-28 17:48 by 机器岛
Tumblr 和 WordPress.com 母公司 Automattic 正与 OpenAI 和 Midjourney 磋商出售用户帖子训练 AI 模型。 Automattic 计划发布一个设置,允许用户退出与第三方的数据共享。它已经抓取了 Tumblr 上 2014-2023 年发布的所有公开帖子,其中错误包含了部分非公开帖子,目前还不清楚它如何处理这些数据,哪些数据会发送给 OpenAI 和 Midjourney 训练模型。在这之前,Reddit 与 Google 签订了每年 6000 万美元的协议,使用其平台上的用户数据训练 Google 的 AI 模型;Shutterstock 则与 OpenAI 签署了协议用其照片库训练模型。
https://www.theverge.com/2024/2/27/24084884/tumblr-midjourney-openai-training-data-deal-report
#人工智能
2024-02-28 17:48 by 机器岛
Tumblr 和 WordPress.com 母公司 Automattic 正与 OpenAI 和 Midjourney 磋商出售用户帖子训练 AI 模型。 Automattic 计划发布一个设置,允许用户退出与第三方的数据共享。它已经抓取了 Tumblr 上 2014-2023 年发布的所有公开帖子,其中错误包含了部分非公开帖子,目前还不清楚它如何处理这些数据,哪些数据会发送给 OpenAI 和 Midjourney 训练模型。在这之前,Reddit 与 Google 签订了每年 6000 万美元的协议,使用其平台上的用户数据训练 Google 的 AI 模型;Shutterstock 则与 OpenAI 签署了协议用其照片库训练模型。
https://www.theverge.com/2024/2/27/24084884/tumblr-midjourney-openai-training-data-deal-report
#人工智能