🐳 مجموعه DeepSeek سال جدید را با یک مقاله جدی شروع کرد
در روز اول سال، تیم DeepSeek روی یکی از دردناکترین مشکلات شبکههای عصبی مدرن دست گذاشت: ناپایداری آموزش در معماریهای پیچیده — و برایش راهحل آورد.
راهحل جدید آنها mHC (Manifold-Constrained Hyper-Connections) نام دارد.
🧠 ایدهی اصلی چیست؟
اینکه Hyper-Connections قدرتمندند، اما ناپایدار. mHC با اعمال محدودیتهای ریاضی روی این اتصالها، آنها را قابلکنترل میکند.
🔹 ۱) فرافکنی روی منیفلد (Manifold Projection)
بهجای اتصالهای آزاد، ارتباطات روی یک منیفلد خاص نگه داشته میشوند.
نتیجه: حفظ identity-mapping و عبور پایدار سیگنال حتی در دهها یا صدها لایه.
🔹 ۲) پایداری و مقیاسپذیری بالا
دیگر خبری از انفجار یا محو شدن سیگنال نیست.
مدلها در مقیاسهای بزرگ هم پایدار میمانند، بدون ترفندهای پیچیدهی آموزشی.
🔹 ۳) بهینهسازیهای زیرساختی
• Kernel Fusion
• کاهش سربار حافظه
• Mixed Precision
➡️ مناسب برای آموزشهای بزرگ در دنیای واقعی
📊 نتیجه نهایی:
✔️ آموزش پایدارتر
✔️ مقیاسپذیری بهتر
✔️ عملکرد بالاتر
✔️ مصرف حافظه کمتر
✔️ برتری نسبت به Hyper-Connections کلاسیک
✨ جمعبندی: آینده فقط «مدلهای بزرگتر» نیست؛
معماریهای پایدار از درون مسیر واقعی پیشرفتاند.
🔗 مقاله: https://arxiv.org/abs/2512.24880
#AI #DeepSeek #MachineLearning #NeuralNetworks #Research
@rss_ai_ir
در روز اول سال، تیم DeepSeek روی یکی از دردناکترین مشکلات شبکههای عصبی مدرن دست گذاشت: ناپایداری آموزش در معماریهای پیچیده — و برایش راهحل آورد.
راهحل جدید آنها mHC (Manifold-Constrained Hyper-Connections) نام دارد.
🧠 ایدهی اصلی چیست؟
اینکه Hyper-Connections قدرتمندند، اما ناپایدار. mHC با اعمال محدودیتهای ریاضی روی این اتصالها، آنها را قابلکنترل میکند.
🔹 ۱) فرافکنی روی منیفلد (Manifold Projection)
بهجای اتصالهای آزاد، ارتباطات روی یک منیفلد خاص نگه داشته میشوند.
نتیجه: حفظ identity-mapping و عبور پایدار سیگنال حتی در دهها یا صدها لایه.
🔹 ۲) پایداری و مقیاسپذیری بالا
دیگر خبری از انفجار یا محو شدن سیگنال نیست.
مدلها در مقیاسهای بزرگ هم پایدار میمانند، بدون ترفندهای پیچیدهی آموزشی.
🔹 ۳) بهینهسازیهای زیرساختی
• Kernel Fusion
• کاهش سربار حافظه
• Mixed Precision
➡️ مناسب برای آموزشهای بزرگ در دنیای واقعی
📊 نتیجه نهایی:
✔️ آموزش پایدارتر
✔️ مقیاسپذیری بهتر
✔️ عملکرد بالاتر
✔️ مصرف حافظه کمتر
✔️ برتری نسبت به Hyper-Connections کلاسیک
✨ جمعبندی: آینده فقط «مدلهای بزرگتر» نیست؛
معماریهای پایدار از درون مسیر واقعی پیشرفتاند.
🔗 مقاله: https://arxiv.org/abs/2512.24880
#AI #DeepSeek #MachineLearning #NeuralNetworks #Research
@rss_ai_ir
🔥1
silhouette of [SUBJECT], illuminated from behind with a soft [COLOR] glow, abstract background with hazy textures, depth of field blur, long exposure light trails, cinematic film look, color negative tones, subtle grain, atmospheric lighting
👍1🥰1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌾🤖 رباتها و هوش مصنوعی؛ آیندهی واقعی کشاورزی
هوش مصنوعی و رباتیک پتانسیل عظیمی برای متحولکردن کشاورزی دارند؛ نه در حد آزمایشگاه، بلکه در دنیای واقعی.
در این ویدیو، ربات خورشیدی Ladybird را میبینید که بهصورت کاملاً عملی در مزرعه کار میکند 👇
🔹 پایش دقیق ریزاقلیم (Microclimate)
🔹 اندازهگیری سرعت و جهت باد
🔹 ثبت میزان بارندگی
🔹 مدیریت رطوبت برگها با سنسورهای هوشمند
☀️ نکته مهم: این ربات با انرژی خورشیدی کار میکند، یعنی کمهزینه، پایدار و مناسب استفادهی طولانیمدت در مزارع.
کشاورزی آینده یعنی:
📉 مصرف کمتر منابع
📈 بازدهی بیشتر
🤖 تصمیمگیری مبتنی بر داده، نه حدس
هوش مصنوعی دارد آرام و بیسروصدا وارد خاک و زمین میشود 🌱
#AI #Robotics #SmartAgriculture #AgriTech #FutureFarming 🚜🌍
هوش مصنوعی و رباتیک پتانسیل عظیمی برای متحولکردن کشاورزی دارند؛ نه در حد آزمایشگاه، بلکه در دنیای واقعی.
در این ویدیو، ربات خورشیدی Ladybird را میبینید که بهصورت کاملاً عملی در مزرعه کار میکند 👇
🔹 پایش دقیق ریزاقلیم (Microclimate)
🔹 اندازهگیری سرعت و جهت باد
🔹 ثبت میزان بارندگی
🔹 مدیریت رطوبت برگها با سنسورهای هوشمند
☀️ نکته مهم: این ربات با انرژی خورشیدی کار میکند، یعنی کمهزینه، پایدار و مناسب استفادهی طولانیمدت در مزارع.
کشاورزی آینده یعنی:
📉 مصرف کمتر منابع
📈 بازدهی بیشتر
🤖 تصمیمگیری مبتنی بر داده، نه حدس
هوش مصنوعی دارد آرام و بیسروصدا وارد خاک و زمین میشود 🌱
#AI #Robotics #SmartAgriculture #AgriTech #FutureFarming 🚜🌍
❤1👍1🔥1
❗️ بیش از ۲۱٪ از ویدیوهای جدید یوتیوب حالا بهعنوان محتوای کمکیفیت موسوم به «AI slop» برچسب میخورند 🤖📉
طبق یک گزارش جدید، ابزارهای تولید محتوای ارزان و مشوقهای درآمدزایی که حجم را بهجای کیفیت پاداش میدهند، باعث رشد مزرعههای محتوای خودکار شدهاند.
🔻 پیامدها:
پیدا شدن محتوای باکیفیت برای مخاطب سختتر شده
اعتماد بینندهها در حال کاهش است
سیستمهای نظارت و مودریشن عقبتر از موج محتوا حرکت میکنند
🧠 جمعبندی: پایانی در کار نیست و احتمالاً اوضاع بدتر هم میشود. نظریهی «اینترنت مرده» کمکم دارد رنگ واقعیت میگیرد.
#AI #YouTube #Content #DeadInternet #Media
طبق یک گزارش جدید، ابزارهای تولید محتوای ارزان و مشوقهای درآمدزایی که حجم را بهجای کیفیت پاداش میدهند، باعث رشد مزرعههای محتوای خودکار شدهاند.
🔻 پیامدها:
پیدا شدن محتوای باکیفیت برای مخاطب سختتر شده
اعتماد بینندهها در حال کاهش است
سیستمهای نظارت و مودریشن عقبتر از موج محتوا حرکت میکنند
🧠 جمعبندی: پایانی در کار نیست و احتمالاً اوضاع بدتر هم میشود. نظریهی «اینترنت مرده» کمکم دارد رنگ واقعیت میگیرد.
#AI #YouTube #Content #DeadInternet #Media
❤2
⚠️ افزایش شدید قیمت GPUها در راه است
گزارشها میگویند انویدیا و AMD از ماه آینده افزایش قابلتوجهی در قیمت کارتهای گرافیک اعمال میکنند.
بر اساس این خبر، قیمت RTX 5090 ممکن است از حدود ۲۰۰۰ دلار تا ۵۰۰۰ دلار بالا برود 😬
🔍 نکات مهم:
گفته میشود افزایش قیمتها ماهبهماه ادامهدار خواهد بود
این گرانی فقط محدود به بازار مصرفی نیست
اینکه GPUهای دیتاسنتر و سرورهای AI هم شامل افزایش قیمت میشوند
فشار تقاضای هوش مصنوعی، عامل اصلی این جهش قیمتی است
💥 نتیجه؟
روی دیگر سکهی انقلاب AI: انفجار قیمتها در بازار مصرفکننده.
اگر منتظر ارزانی کارت گرافیک بودید، فعلاً خبر خوبی در راه نیست.
#AI #GPU #NVIDIA #AMD #TechNews #Hardware
گزارشها میگویند انویدیا و AMD از ماه آینده افزایش قابلتوجهی در قیمت کارتهای گرافیک اعمال میکنند.
بر اساس این خبر، قیمت RTX 5090 ممکن است از حدود ۲۰۰۰ دلار تا ۵۰۰۰ دلار بالا برود 😬
🔍 نکات مهم:
گفته میشود افزایش قیمتها ماهبهماه ادامهدار خواهد بود
این گرانی فقط محدود به بازار مصرفی نیست
اینکه GPUهای دیتاسنتر و سرورهای AI هم شامل افزایش قیمت میشوند
فشار تقاضای هوش مصنوعی، عامل اصلی این جهش قیمتی است
💥 نتیجه؟
روی دیگر سکهی انقلاب AI: انفجار قیمتها در بازار مصرفکننده.
اگر منتظر ارزانی کارت گرافیک بودید، فعلاً خبر خوبی در راه نیست.
#AI #GPU #NVIDIA #AMD #TechNews #Hardware
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 این تغییر واقعاً شروع شده است
رباتها بیسروصدا وارد فضاهای عمومی شدهاند و دارند کارهای روزمره را انجام میدهند.
✈️ فرودگاه هلسینکی حالا از رباتها برای کارهای خدماتی مثل نظافت و پشتیبانی استفاده میکند؛ بدون هیاهو، بدون نمایش تبلیغاتی.
🤖 آنچه میبینیم:
حضور تدریجی رباتها در محیطهای عمومی
واگذاری کارهای تکراری و خستهکننده
آزاد شدن نیروی انسانی برای وظایف مهمتر
این دیگر «آینده» نیست؛
📍 زیرساخت امروز است که دارد عوض میشود.
#رباتیک #هوش_مصنوعی #اتوماسیون #آینده_کار #AI #Robotics
رباتها بیسروصدا وارد فضاهای عمومی شدهاند و دارند کارهای روزمره را انجام میدهند.
✈️ فرودگاه هلسینکی حالا از رباتها برای کارهای خدماتی مثل نظافت و پشتیبانی استفاده میکند؛ بدون هیاهو، بدون نمایش تبلیغاتی.
🤖 آنچه میبینیم:
حضور تدریجی رباتها در محیطهای عمومی
واگذاری کارهای تکراری و خستهکننده
آزاد شدن نیروی انسانی برای وظایف مهمتر
این دیگر «آینده» نیست؛
📍 زیرساخت امروز است که دارد عوض میشود.
#رباتیک #هوش_مصنوعی #اتوماسیون #آینده_کار #AI #Robotics
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ابزار TrajectoryCrafter — کنترل هوشمند مسیر دوربین با Diffusion (Moving-Camera Diffusion)
ابزار جدید Tencent برای بازطراحی مسیر حرکت دوربین در ویدیوها، حتی با ورودیهای تکدوربینه (monocular). ایده اصلی: بهجای دستکاری فریمها، مسیر دوربین را بازسازی و بهینه میکند 🎥✨
🔧 چطور کار میکند؟
🔹 Initialization:
شروع از مسیر موجود یا حتی نویز خالص
🔹 Diffusion:
پالایش مرحلهبهمرحله نویز تا رسیدن به مسیر طبیعی و سازگار با صحنه
🔹 ورودیهای همزمان: ویدیو + ابرنقاط رندرشده (Point Clouds)
🔹 Double Reprojection:
ترکیب ویدیوهای تکدوربینه زیاد با چند-دید محدود اما باکیفیت برای آموزش بهتر
🔹 خروجی نهایی: مسیر دوربین جدید، نرم، پایدار و سازگار با دینامیک بصری
⚙️ نصب سریع
🔗 لینکها 🖥 GitHub
🟡 Article | Project | Demo | Video
#AI #Diffusion #ComputerVision #VideoEditing #Tencent #TrajectoryCrafter
ابزار جدید Tencent برای بازطراحی مسیر حرکت دوربین در ویدیوها، حتی با ورودیهای تکدوربینه (monocular). ایده اصلی: بهجای دستکاری فریمها، مسیر دوربین را بازسازی و بهینه میکند 🎥✨
🔧 چطور کار میکند؟
🔹 Initialization:
شروع از مسیر موجود یا حتی نویز خالص
🔹 Diffusion:
پالایش مرحلهبهمرحله نویز تا رسیدن به مسیر طبیعی و سازگار با صحنه
🔹 ورودیهای همزمان: ویدیو + ابرنقاط رندرشده (Point Clouds)
🔹 Double Reprojection:
ترکیب ویدیوهای تکدوربینه زیاد با چند-دید محدود اما باکیفیت برای آموزش بهتر
🔹 خروجی نهایی: مسیر دوربین جدید، نرم، پایدار و سازگار با دینامیک بصری
⚙️ نصب سریع
git clone --recursive https://github.com/TrajectoryCrafter/TrajectoryCrafter.git
cd TrajectoryCrafter
🔗 لینکها 🖥 GitHub
🟡 Article | Project | Demo | Video
#AI #Diffusion #ComputerVision #VideoEditing #Tencent #TrajectoryCrafter
This media is not supported in your browser
VIEW IN TELEGRAM
🧠⚡️ هوش مصنوعی در حال یادگیری چیزهایی است که هرگز بهطور مستقیم به آن آموزش داده نشدهاند
پژوهشها و مشاهدات جدید نشان میدهد مدلهای هوش مصنوعی گاهی به تواناییها و الگوهایی میرسند که صراحتاً در دادهها یا دستورالعملها وجود نداشته است. این پدیده که به آن Emergent Abilities (تواناییهای پدیدارشونده) میگویند، نتیجهی مقیاسپذیری مدلها، تعامل پیچیدهی لایهها و یادگیری الگوهای عمیق است.
🔍 چه اتفاقی در حال رخ دادن است؟
مدلها از ترکیب الگوها به مفاهیم جدید میرسند
برخی مهارتها تنها پس از رسیدن به آستانهی مقیاس ظاهر میشوند
رفتارها همیشه قابل پیشبینی یا قابل نسبتدادن به یک قانون ساده نیستند
⚠️ چرا مهم است؟
فرصتها: خلاقیت، حل مسئله، تعمیم بهتر
ریسکها: پیشبینیناپذیری، ایمنی، کنترلپذیری
هوش مصنوعی دیگر فقط «اجراکنندهی دستور» نیست؛ در حال تبدیل شدن به سیستمی است که یاد میگیرد چگونه یاد بگیرد.
📊 @rss_ai_ir
#AI #EmergentAbilities #MachineLearning #Safety
پژوهشها و مشاهدات جدید نشان میدهد مدلهای هوش مصنوعی گاهی به تواناییها و الگوهایی میرسند که صراحتاً در دادهها یا دستورالعملها وجود نداشته است. این پدیده که به آن Emergent Abilities (تواناییهای پدیدارشونده) میگویند، نتیجهی مقیاسپذیری مدلها، تعامل پیچیدهی لایهها و یادگیری الگوهای عمیق است.
🔍 چه اتفاقی در حال رخ دادن است؟
مدلها از ترکیب الگوها به مفاهیم جدید میرسند
برخی مهارتها تنها پس از رسیدن به آستانهی مقیاس ظاهر میشوند
رفتارها همیشه قابل پیشبینی یا قابل نسبتدادن به یک قانون ساده نیستند
⚠️ چرا مهم است؟
فرصتها: خلاقیت، حل مسئله، تعمیم بهتر
ریسکها: پیشبینیناپذیری، ایمنی، کنترلپذیری
هوش مصنوعی دیگر فقط «اجراکنندهی دستور» نیست؛ در حال تبدیل شدن به سیستمی است که یاد میگیرد چگونه یاد بگیرد.
📊 @rss_ai_ir
#AI #EmergentAbilities #MachineLearning #Safety
🥰1👏1
🤖🧩 سیمولاتور رباتهای هوشمند IR-SIM (Python)
اگر دنبال یک شبیهساز سبک و سریع برای ناوبری، کنترل و Reinforcement Learning هستید، IR-SIM گزینهی جذابیه؛ مخصوصاً برای آموزش و پروژههای پژوهشی که نیاز به راهاندازی پیچیده ندارن. 🚀
🛠️ ویژگیهای کلیدی ✨ مدلسازی انواع پلتفرمهای ربات و سنسورها
⚙️ سناریونویسی ساده با YAML
📉 بصریسازی و دیباگ راحت نتایج شبیهسازی
🧱 پشتیبانی از تشخیص برخورد (Collision Detection)
🤝 مناسب برای Multi-Agent RL و سیاستهای قابلتنظیم
🔗 گیتهاب
https://github.com/hanruihua/ir-sim
#Python #Robotics #Simulation #ReinforcementLearning #Navigation #AI
❤️ @rss_ai_ir
اگر دنبال یک شبیهساز سبک و سریع برای ناوبری، کنترل و Reinforcement Learning هستید، IR-SIM گزینهی جذابیه؛ مخصوصاً برای آموزش و پروژههای پژوهشی که نیاز به راهاندازی پیچیده ندارن. 🚀
🛠️ ویژگیهای کلیدی ✨ مدلسازی انواع پلتفرمهای ربات و سنسورها
⚙️ سناریونویسی ساده با YAML
📉 بصریسازی و دیباگ راحت نتایج شبیهسازی
🧱 پشتیبانی از تشخیص برخورد (Collision Detection)
🤝 مناسب برای Multi-Agent RL و سیاستهای قابلتنظیم
🔗 گیتهاب
https://github.com/hanruihua/ir-sim
#Python #Robotics #Simulation #ReinforcementLearning #Navigation #AI
❤️ @rss_ai_ir
🔥1👏1🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
🚒🚁 سیستم جدید پهپادهای آتشنشانی چین؛ واقعاً پیشرفته است
چین از نسل جدیدی از پهپادهای آتشنشانی رونمایی کرده که برای عملیاتهای سخت و پرخطر طراحی شدهاند.
🔥 قابلیتها:
پرواز در شرایط دود غلیظ و دمای بالا
شناسایی دقیق کانون آتش با سنسورهای حرارتی
پاشش هدفمند مواد خاموشکننده از هوا
انتقال زنده تصویر و داده به تیمهای زمینی
کاهش ریسک برای نیروهای انسانی در حوادث بزرگ
📡 این پهپادها مخصوص آتشسوزیهای شهری، صنعتی و حتی جنگلی هستند و میتوانند در دقایق اولیه حادثه وارد عمل شوند؛ جایی که زمان، همهچیز است.
🤖 آیندهی امداد و نجات هرچه بیشتر به رباتها و سیستمهای هوشمند گره میخورد، و چین با سرعت زیادی در حال جلو رفتن است.
#پهپاد #رباتیک #آتش_نشانی #AI #فناوری #China
چین از نسل جدیدی از پهپادهای آتشنشانی رونمایی کرده که برای عملیاتهای سخت و پرخطر طراحی شدهاند.
🔥 قابلیتها:
پرواز در شرایط دود غلیظ و دمای بالا
شناسایی دقیق کانون آتش با سنسورهای حرارتی
پاشش هدفمند مواد خاموشکننده از هوا
انتقال زنده تصویر و داده به تیمهای زمینی
کاهش ریسک برای نیروهای انسانی در حوادث بزرگ
📡 این پهپادها مخصوص آتشسوزیهای شهری، صنعتی و حتی جنگلی هستند و میتوانند در دقایق اولیه حادثه وارد عمل شوند؛ جایی که زمان، همهچیز است.
🤖 آیندهی امداد و نجات هرچه بیشتر به رباتها و سیستمهای هوشمند گره میخورد، و چین با سرعت زیادی در حال جلو رفتن است.
#پهپاد #رباتیک #آتش_نشانی #AI #فناوری #China
👍2
🔥 سال آینده خیلی هیجانانگیز خواهد بود؛ چون چین در ۲۰۲۶ وارد برنامه پنجساله جدیدش میشود — و محور اصلی آن هوش مصنوعی است. 🤖🇨🇳
برنامههای پنجساله چین اسناد راهبردی حزب کمونیست هستند که مسیر توسعه اقتصادی و اجتماعی کشور را مشخص میکنند.
برنامه فعلی (۱۴ام: ۲۰۲۱–۲۰۲۵) روی «گردش دوگانه» تمرکز داشت، اما برنامه بعدی (۱۵ام: ۲۰۲۶–۲۰۳۰) تمرکز را بهطور جدی روی استقلال فناورانه میگذارد؛ بهویژه در نیمهرساناها و هوش مصنوعی.
💡 مفهوم کلیدی جدید: AI+
هدف این است که از ۲۰۲۶، هوش مصنوعی به تمام فرآیندهای اقتصادی تزریق شود. حتی برنامهای با عنوان AI+ Energy برای مدیریت هوشمند شبکه برق در حال تدوین است.
📊 بهنقل از The Economist، نقشه راه چین سه مرحله دارد:
1️⃣ تا ۲۰۲۷: استفاده گسترده از AI در پژوهش، صنعت، محصولات مصرفی، سلامت و آموزش، دولت دیجیتال و صادرات فناوری
2️⃣ تا ۲۰۳۰: هوش مصنوعی به اندازه برق یا اینترنت فراگیر میشود و موتور اصلی رشد اقتصادی خواهد بود
3️⃣ تا ۲۰۳۵: شکلگیری یک «جامعه هوشمند» که در آن AI فرهنگ و تعاملات انسانی را دگرگون میکند
🚀 جمعبندی:
چین میخواهد هوش مصنوعی را در تمام روابط اجتماعی و ساختارهای سازمانی ادغام کند تا به رشد اقتصادی و رفاه برسد.
#AI #China #FiveYearPlan #Technology #Future
برنامههای پنجساله چین اسناد راهبردی حزب کمونیست هستند که مسیر توسعه اقتصادی و اجتماعی کشور را مشخص میکنند.
برنامه فعلی (۱۴ام: ۲۰۲۱–۲۰۲۵) روی «گردش دوگانه» تمرکز داشت، اما برنامه بعدی (۱۵ام: ۲۰۲۶–۲۰۳۰) تمرکز را بهطور جدی روی استقلال فناورانه میگذارد؛ بهویژه در نیمهرساناها و هوش مصنوعی.
💡 مفهوم کلیدی جدید: AI+
هدف این است که از ۲۰۲۶، هوش مصنوعی به تمام فرآیندهای اقتصادی تزریق شود. حتی برنامهای با عنوان AI+ Energy برای مدیریت هوشمند شبکه برق در حال تدوین است.
📊 بهنقل از The Economist، نقشه راه چین سه مرحله دارد:
1️⃣ تا ۲۰۲۷: استفاده گسترده از AI در پژوهش، صنعت، محصولات مصرفی، سلامت و آموزش، دولت دیجیتال و صادرات فناوری
2️⃣ تا ۲۰۳۰: هوش مصنوعی به اندازه برق یا اینترنت فراگیر میشود و موتور اصلی رشد اقتصادی خواهد بود
3️⃣ تا ۲۰۳۵: شکلگیری یک «جامعه هوشمند» که در آن AI فرهنگ و تعاملات انسانی را دگرگون میکند
🚀 جمعبندی:
چین میخواهد هوش مصنوعی را در تمام روابط اجتماعی و ساختارهای سازمانی ادغام کند تا به رشد اقتصادی و رفاه برسد.
#AI #China #FiveYearPlan #Technology #Future
🤯3👍1🔥1
✨ مدل JavisGPT: یک مدل زبانی چندوجهی یکپارچه برای درک و تولید همزمان صدا–ویدئو 🎬🔊
📝 خلاصه:
در این مقاله JavisGPT معرفی میشود؛ نخستین مدل زبانی بزرگ چندوجهی (MLLM) که بهصورت یکپارچه برای درک و تولید همزمان صوت و ویدئو (JAV) طراحی شده است.
این مدل از معماری جمعوجور Encoder → LLM → Decoder استفاده میکند و میتواند هم ویدئوهای دارای صدا را تحلیل کند و هم محتوای صوتی–ویدئویی جدید بسازد.
🔹 تاریخ انتشار: ۲۸ دسامبر ۲۰۲۵
🔗 لینکها:
• صفحه arXiv:
https://arxiv.org/abs/2503.23377
• فایل PDF:
https://arxiv.org/pdf/2512.22905
• صفحه پروژه:
https://javisverse.github.io/JavisGPT-page/
• گیتهاب:
https://github.com/JavisVerse/JavisGPT
🤖 مدلهای مرتبط:
• https://huggingface.co/JavisVerse/JavisGPT-v0.1-7B-Instruct
📊 دیتاستهای مورد استفاده:
• https://huggingface.co/datasets/JavisVerse/MM-PreTrain
• https://huggingface.co/datasets/JavisVerse/JavisUnd-Eval
• https://huggingface.co/datasets/JavisVerse/AV-FineTune
➖➖➖➖➖➖➖➖➖
برای منابع بیشتر در حوزه دیتا ساینس:
✓@rss_ai_ir
#AI #MachineLearning #MultimodalAI #VideoAI #AudioAI #Research
📝 خلاصه:
در این مقاله JavisGPT معرفی میشود؛ نخستین مدل زبانی بزرگ چندوجهی (MLLM) که بهصورت یکپارچه برای درک و تولید همزمان صوت و ویدئو (JAV) طراحی شده است.
این مدل از معماری جمعوجور Encoder → LLM → Decoder استفاده میکند و میتواند هم ویدئوهای دارای صدا را تحلیل کند و هم محتوای صوتی–ویدئویی جدید بسازد.
🔹 تاریخ انتشار: ۲۸ دسامبر ۲۰۲۵
🔗 لینکها:
• صفحه arXiv:
https://arxiv.org/abs/2503.23377
• فایل PDF:
https://arxiv.org/pdf/2512.22905
• صفحه پروژه:
https://javisverse.github.io/JavisGPT-page/
• گیتهاب:
https://github.com/JavisVerse/JavisGPT
🤖 مدلهای مرتبط:
• https://huggingface.co/JavisVerse/JavisGPT-v0.1-7B-Instruct
📊 دیتاستهای مورد استفاده:
• https://huggingface.co/datasets/JavisVerse/MM-PreTrain
• https://huggingface.co/datasets/JavisVerse/JavisUnd-Eval
• https://huggingface.co/datasets/JavisVerse/AV-FineTune
➖➖➖➖➖➖➖➖➖
برای منابع بیشتر در حوزه دیتا ساینس:
✓@rss_ai_ir
#AI #MachineLearning #MultimodalAI #VideoAI #AudioAI #Research
arXiv.org
JavisDiT: Joint Audio-Video Diffusion Transformer with...
This paper introduces JavisDiT, a novel Joint Audio-Video Diffusion Transformer designed for synchronized audio-video generation (JAVG). Built upon the powerful Diffusion Transformer (DiT)...
❤1👏1
Media is too big
VIEW IN TELEGRAM
♨️آیا ESP32 صنعتی نیست؟ | واقعاً میشه از ESP32 در صنعت استفاده کرد؟
🔥2❤1👍1👏1
[SUBJECT] emerging through a drifting snow haze, where soft flurries swirl around quiet forms. Emphasize contrast by blending cool ivory and pale blue, evoking the gentle balance of motion and stillness in a wintry expanse.