VIRSUN – Telegram
VIRSUN
6.35K subscribers
1.7K photos
982 videos
5 files
1.05K links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://news.1rj.ru/str/rss_ai_ir_group
Download Telegram
Media is too big
VIEW IN TELEGRAM
برنامه‌ نویسی تمام شد؟ 😱هوش مصنوعی گوگل Stitch با Gemini 3 همه را شوکه کرد!

📡 @rss_ai_ir
🔥21🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Name That Part: نام‌گذاری و بخش‌بندی قطعات سه‌بعدی 🧩🤖

مدلی جدید برای بخش‌بندی معنایی قطعات سه‌بعدی که می‌تواند اجزای یک شیء 3D را تشخیص دهد و به آن‌ها نام قابل‌فهم انسانی بدهد.
در این کار، روش ALIGN-Parts با هم‌ترازسازی نمایش‌های ضمنی سه‌بعدی و توضیحات متنیِ قطعات، درک دقیق‌تری از ساختار اشیاء ایجاد می‌کند.

🔍 نکات کلیدی پژوهش:
• بخش‌بندی قطعات سه‌بعدی با واژگان باز (Open-Vocabulary)
• ترکیب هوشمندانه‌ی سرنخ‌های هندسی، ظاهری و معنایی
• مناسب برای رباتیک، طراحی صنعتی، AR/VR و مدل‌سازی سه‌بعدی
• گامی مهم به‌سوی فهم ساختاری واقعی اشیاء توسط هوش مصنوعی

📅 تاریخ انتشار: ۱۹ دسامبر

📄 لینک‌ها:
• صفحه arXiv:
https://arxiv.org/abs/2512.18003
• فایل PDF:
https://arxiv.org/pdf/2512.18003
• صفحه پروژه:
https://name-that-part.github.io/

📢 دنبال کنید: @rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #سه_بعدی #ComputerVision #AI #3DSegmentation #Research
📈 جهش دوباره حاشیه سود محاسباتی OpenAI ⚡️

🔍 طبق گزارش‌ها، حاشیه سود محاسباتی OpenAI روی کاربران پولی در ماه اکتبر به حدود ۷۰٪ رسیده؛ در حالی که این عدد در پایان ۲۰۲۴ حدود ۵۲٪ و در ژانویه همان سال تنها ۳۵٪ بود.

🧠 عوامل اصلی این رشد:

استفاده از توان پردازشی اجاره‌ای ارزان‌تر

بهینه‌سازی‌های جدی در اینفرنس (Inference Efficiency)

معرفی پلن‌های اشتراکی گران‌تر با ارزش افزوده بالاتر


🚨 نکته جالب: پس از عرضه مدل‌های جدید از DeepSeek، وضعیت «Code Red» برای کنترل هزینه‌های سرور اعلام شد؛ تمرکزی شدید بر کاهش هزینه‌ها که حالا نتیجه‌اش مشخص شده است.

📊 مقایسه بازار: با وجود این رشد، پیش‌بینی می‌شود Anthropic در مجموع هزینه‌های محاسباتی، همچنان کارآمدتر از OpenAI عمل کند.

🔮 جمع‌بندی: بهینه‌سازی زیرساخت و اقتصاد اینفرنس، حالا به یکی از مهم‌ترین میدان‌های رقابت در بازار LLMها تبدیل شده است.

📡 @rss_ai_ir
#OpenAI #AI #LLM #Compute #Cloud #TechEconomy 🚀
1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🇨🇳 استقرار گسترده ربات‌ها در چین

در این ویدیو می‌بینیم که ربات‌های انسان‌نمای Unitree به‌همراه ربات‌سگ‌های چهارپا به‌صورت تیمی گشت‌زنی می‌کنند و وظایف امنیتی را بر عهده می‌گیرند.

🔹 ربات‌ها مسئول گشت و پایش محیط هستند
🔹 نیروهای انسانی روی قضاوت، تعامل و کاهش تنش تمرکز می‌کنند
🔹 همکاری انسان–ماشین در حال تبدیل شدن به مدل جدید امنیت شهری است

آینده‌ای که ربات‌ها در کنار انسان‌ها کار می‌کنند، دیگر دور از دسترس نیست. 🚀

@rss_ai_ir
#رباتیک #هوش_مصنوعی #Unitree #Robots #China #FutureTech
This media is not supported in your browser
VIEW IN TELEGRAM
🎓 نجات‌دهنده واقعی دانشجوها از راه رسید!

یک عامل هوش مصنوعی که می‌تونه همه‌چیز رو بنویسه؛
از انشا و مقاله گرفته تا پایان‌نامه کامل 📚🤖

🔍 چه کارهایی انجام می‌ده؟

جست‌وجوی مقالات علمی در هر موضوع

افزودن نقل‌قول‌ها با دستورهای /cite و /insert

فرمت‌بندی خودکار متن

خروجی گرفتن در Word، PDF یا LaTeX

استفاده از Deep Research برای تحلیل مقالات علمی در سراسر اینترنت و ساخت استدلال‌های قوی


📈 نتیجه؟
دیگه شب‌بیداری برای تحویل پروژه‌ها تموم شد؛
دوران آپگرید تحصیل شروع شده! 🚀

👉 همین حالا امتحانش کن 👇
(لینک در منبع)
https://chirpz.ai/

📢 @rss_ai_ir
#هوش_مصنوعی #دانشجو #تحقیق #پایان_نامه #AI #Education #DeepResearch
اینکه LongShOTBench و LongShOTAgent: معیار و فریم‌ورک عامل‌محور برای استدلال چندحالته روی ویدیوهای طولانی 🎥🤖

📝 خلاصه:
این پژوهش دو معرفی مهم دارد:

LongShOTBench:
یک بنچمارک تشخیصی برای درک ویدیوهای طولانی و چندحالته با پرسش‌های باز و استفاده عامل‌محور از ابزارها

LongShOTAgent:
یک سیستم agentic برای تحلیل ویدیو که می‌تواند ابزارها را به‌صورت مرحله‌ای به‌کار بگیرد


نتایج نشان می‌دهد حتی مدل‌های state-of-the-art فعلی هم در درک عمیق و استدلال روی ویدیوهای طولانی با چالش جدی روبه‌رو هستند. این یعنی هنوز فاصله‌ی معناداری بین توانایی انسان و AI در فهم ویدیوهای بلند وجود دارد.

📅 تاریخ انتشار:
۱۸ دسامبر

🔗 لینک‌ها:
• arXiv:
https://arxiv.org/abs/2512.16978
• PDF:
https://arxiv.org/pdf/2512.16978
• Project Page:
https://mbzuai-oryx.github.io/LongShOT/
• GitHub:
https://github.com/mbzuai-oryx/longshot

📦 Datasets:
• Hugging Face Dataset:
https://huggingface.co/datasets/MBZUAI/longshot-bench

💡 چرا مهم است؟
این کار نشان می‌دهد که برای ساخت عامل‌های واقعیِ ویدیو-محور، فقط مدل بزرگ کافی نیست؛ برنامه‌ریزی، استفاده از ابزار و استدلال چندمرحله‌ای نقش کلیدی دارند.

📡 برای منابع بیشتر در حوزه علم داده و هوش مصنوعی:
👉 @rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #ویدیو_AI #چندحالته #AgenticAI #بنچمارک #پژوهش
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 توقف رباتاکسی‌های Waymo در خاموشی سن‌فرانسیسکو 🤖⚡️

در جریان یک خاموشی گسترده، حدود ۱۳۰ هزار خانه در سن‌فرانسیسکو بدون برق ماندند و رباتاکسی‌های Waymo در سطح شهر متوقف شدند. ویدیوها نشان می‌دادند خودروهای سفید Waymo وسط خیابان‌ها گیر کرده‌اند.

🔍 چه اتفاقی افتاد؟

سامانه Waymo در شرایط غیرعادی به اپراتور از راه دور متکی است.

با قطع اینترنت پایدار و زیرساخت‌های ترافیکی، خودروها نتوانستند راهنمایی لازم را دریافت کنند.

اینکه Waymo برای حفظ ایمنی، سرویس‌ها را موقتاً تعلیق کرد.


⚖️ مقایسه جالب

در همان شرایط، خودروهای Tesla با FSD طبق گزارش‌ها به حرکت ادامه دادند و ویدیوهایی از عبور آن‌ها منتشر شد.


🧠 جمع‌بندی این رخداد نشان می‌دهد وابستگی شدید به شبکه می‌تواند نقطه‌ضعف خودران‌ها باشد و تفاوت رویکردهای تاب‌آوری (resilience) بین Waymo و Tesla را برجسته می‌کند.

📊
@rss_ai_ir 🏴

#Robotaxi #Waymo #Tesla #AutonomousDriving #AI #Resilience
🤖 انقلاب در ربات‌های انسان‌نما با SharpaWave

شرکت سنگاپوری Sharpa Robotics تولید انبوه پیشرفته‌ترین دست رباتیکی خود با نام SharpaWave را آغاز کرد؛ دستی هم‌اندازه دست انسان که می‌تواند نقطه عطفی در ربات‌های همه‌منظوره باشد.

🔧 ویژگی‌های کلیدی SharpaWave:

۲۲ درجه آزادی برای حرکات بسیار طبیعی

👁️ انگشتان فوق‌حساس با دوربین و سنسورهای لمسی (بیش از ۱۰۰۰ پیکسل لمسی در نوک انگشت!)

⚖️ تشخیص نیرو از ۰٫۰۰۵ نیوتن

🍷 گرفتن محکم اشیای بسیار ظریف بدون آسیب

🏥 مناسب برای کار در خانه‌ها، بیمارستان‌ها و فروشگاه‌ها


🚀 این دست رباتیکی راه را برای ربات‌هایی باز می‌کند که بتوانند مانند انسان‌ها در محیط‌های واقعی کار کنند.

🔗 منبع:
https://interestingengineering.com/ai-robotics/sharpas-advanced-robotic-hand-enters-mass-production

#رباتیک #هوش_مصنوعی #ربات_انسان‌نما #فناوری #AI #Robotics
This media is not supported in your browser
VIEW IN TELEGRAM
مدل 3D-RE-GEN: بازسازی صحنه‌های داخلی به‌صورت سه‌بعدی با چارچوب مولد 🧱🖼️

📝 خلاصه:
مدل 3D-RE-GEN می‌تواند تنها از یک تصویر، یک صحنه‌ی سه‌بعدی با مش بافت‌دار و قابل ویرایش بسازد؛ آن هم با پس‌زمینه‌ی کامل و چیدمان واقع‌گرایانه. این روش با یک چارچوب مولدِ ترکیبی و بهینه‌سازی جدید، خروجی‌هایی آماده‌ی استفاده برای هنرمندان و نزدیک به واقعیت فیزیکی تولید می‌کند و به نتایج SOTA می‌رسد.

🔹 تاریخ انتشار: 19 دسامبر
🔹 لینک‌ها:
• arXiv:
https://arxiv.org/abs/2512.17459
• PDF:
https://arxiv.org/pdf/2512.17459
• Project Page:
https://3dregen.jdihlmann.com/
• GitHub:
https://github.com/cgtuebingen/3D-RE-GEN

📌 کاربردها:
بازسازی سه‌بعدی فضاهای داخلی، طراحی صحنه، بازی‌سازی، معماری، و تولید محتوای واقع‌گرایانه.

@rss_ai_ir
#3D #GenerativeAI #ComputerVision #DeepLearning #ComputerGraphics #Reconstruction #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🔥 وقتی ربات‌ها مثل نیروهای ویژه حرکت می‌کنند!

یک ربات انسان‌نما را تصور کنید که غلت‌های تاکتیکی، افتادن کنترل‌شده و بازیابی سریع انجام می‌دهد؛ دقیق، پایدار و کاملاً هماهنگ با بدن خودش. این فقط نمایش نیست، بلکه تمرینی جدی برای ربات‌هایی است که باید در دنیای واقعی زنده بمانند.

🧠 چرا این مهم است؟

افزایش تعادل و پایداری در شرایط غیرقابل‌پیش‌بینی

آمادگی برای عملیات امداد، نظامی و صنعتی

کاهش آسیب در سقوط و بازگشت سریع به حالت عملیاتی


🤖 آینده رباتیک فقط راه رفتن نیست؛ بلند شدن بعد از زمین خوردن است.

@rss_ai_ir 🏴
#رباتیک #Humanoid #AI #Robotics #FutureTech #EmbodiedAI
🔮 پیش‌بینی a16z از آینده بازار هوش مصنوعی در سال ۲۰۲۶

به‌گزارش Andreessen Horowitz، سال ۲۰۲۶ نقطه‌ی چرخش بزرگ از ابزارهای عمومی به سیستم‌های عامل‌محور، شخصی‌سازی‌شده و چندعامله خواهد بود. خلاصه‌ی نکات کلیدی 👇

🎓 دانشگاه‌های AI-native
آموزش به‌صورت لحظه‌ای با هر دانشجو تطبیق می‌یابد؛ نقش معلم از ارائه‌دهنده محتوا به طراح سیستم و منتور تغییر می‌کند.

🏗️ زیرساخت‌های جدید برای ایجنت‌ها
بارهای کاری ایجنتی به هم‌زمانی بالا، وضعیت پایدار و هماهنگی میلی‌ثانیه‌ای نیاز دارند؛ پلتفرم‌های «agent-native» ظهور می‌کنند.

🤝 فرآیندهای کسب‌وکار چندعامله
در حوزه‌هایی مثل حقوق و املاک، ایجنت‌ها به‌طور خودکار مذاکره و حل اختلاف می‌کنند—بدون دخالت انسان.

🧠 محوشدن رابط‌ها
اینکه CRM و ERP به لایه‌های داده‌ی منفعل تبدیل می‌شوند؛ تعامل از مسیر ایجنت‌ها انجام می‌شود و معیار اصلی، «نتیجه» است نه زمان صفحه.

🩺 جهش پزشکی مبتنی بر AI
اشتراک‌های پایش زیست‌نشانگرها و مربی‌گری سلامت AI رشد می‌کنند و اقتصاد پیشگیرانه شکل می‌گیرد.

🧹 کیفیت داده گلوگاه اصلی
انبوه PDF و ویدئوها نیاز به لایه‌های داده‌ی تمیز، ساخت‌یافته و چندوجهی برای استدلال AI ایجاد می‌کند.

🧩 اهمیت کمتر دیتابیس، اهمیت بیشتر استدلال
ارزش به سمت ارکستراسیون، استدلال و اجرای خودکار می‌رود.

🌍 انفجار جهان‌های سه‌بعدی مولد
شبیه‌سازی‌های زنده برای آموزش ایجنت‌ها و خلق محیط‌ها در زمان واقعی فراگیر می‌شوند.

جمع‌بندی: سال ۲۰۲۶، گذار از AI همگانی به AI کاملاً شخصی با دستیارانی است که زمینه، اهداف و یادگیری مداوم هر فرد را درک می‌کنند.

📊
📣 @rss_ai_ir

#هوش_مصنوعی #AI #AgenticAI #a16z #فناوری #آینده #سلامت_دیجیتال #زیرساخت #داده
2
This media is not supported in your browser
VIEW IN TELEGRAM
🧠🤖 کنترل ربات‌ها با ذهن؛ یک جهش واقعی در رابط مغز–رایانه

برای اولین‌بار در چین، یک بیمار دچار فلج کامل نخاعی توانسته با استفاده از ایمپلنت مغزی (BCI) به‌صورت پایدار و در دنیای واقعی چند ربات را کنترل کند. این فرد که بیش از سه سال از گردن به پایین فلج بوده، حالا دوباره به زندگی فعال برگشته است.

چه کارهایی ممکن شده؟

سفارش آنلاین غذا 🛒🍔

ارسال سگ رباتیک برای تحویل گرفتن سفارش 🐕🤖

انجام کارهای دیجیتال و درآمدزایی 💻💰

جابه‌جایی و کمک‌حرکتی در محیط اطراف 🚶‍♂️⚙️


🔬 چرا این اتفاق مهم است؟ برخلاف آزمایش‌های قبلی که فقط در محیط‌های کنترل‌شده جواب می‌دادند، این سیستم در زندگی روزمره به‌طور قابل‌اعتماد کار می‌کند. این یعنی یک قدم بزرگ به‌سمت استقلال عملی بیماران فلج و حضور فعال‌تر آن‌ها در کار و اجتماع.

🚀 آینده‌ای که زمانی علمی–تخیلی بود، حالا واقعی‌تر از همیشه است.

📣 @rss_ai_ir

#هوش_مصنوعی #رباتیک #BCI #رابط_مغز_رایانه #فناوری_پزشکی #سلامت_دیجیتال #ربات #نوآوری
🚀 نقشه راه تسلط بر هوش مصنوعی تا ۲۰۲۶

اگر می‌خواهی از «کاربر ابزارهای AI» به «سازنده سیستم‌های هوشمند» تبدیل شوی، این مسیر قدم‌به‌قدم را از دست نده 👇

🧱 ۱) ساخت پایه‌های قوی
پایتون، NumPy، Pandas، آمار، احتمال، جبر خطی، ساختمان داده و Git

📊 ۲) کار عملی با داده
پاک‌سازی و پیش‌پردازش، مصورسازی (Matplotlib / Seaborn)، مهندسی ویژگی، پروژه‌های Kaggle

🤖 ۳) یادگیری ماشین (ML)
یادگیری نظارت‌شده و بدون‌نظارت، رگرسیون، درخت تصمیم، SVM

🧠 ۴) یادگیری عمیق (DL)
شبکه‌های عصبی، CNN، RNN، LSTM، Transformer با TensorFlow و PyTorch

🎯 ۵) انتخاب تخصص AI
بینایی ماشین، NLP، RL، رباتیک، فین‌تک، هلث‌تک یا بیزنس

🧩 ۶) مدل‌های زبانی بزرگ (LLM)
چت‌بات‌ها، دستیارها، سیستم‌های توصیه‌گر، تحلیل پیش‌بینی و تولید محتوا

⚙️ ۷) دیپلوی و MLOps
FastAPI/Flask، Docker، Kubernetes، پایپ‌لاین ML، مانیتورینگ مدل

🛠 ۸) پروژه‌های واقعی AI
ساخت اپلیکیشن‌های واقعی با اثرگذاری تجاری

🎓 ۹) ورود به بازار کار AI
پورتفولیو قوی، GitHub، آمادگی مصاحبه، شبکه‌سازی و اپلای هدفمند

جمع‌بندی: ابزارها سریع‌تر می‌شوند، اما مهارت ترکیب، ساخت و استقرار است که مزیت رقابتی می‌سازد.

📌 ذخیره کن، مرحله‌به‌مرحله جلو برو و هر بخش را با پروژه واقعی ببند.

@rss_ai_ir 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Kling 2.6 :
A high-speed urban action scene at dusk beginning with a low front-mounted camera on a muscle car racing through tight streets, the camera shaking with engine torque as the car drifts sharply around corners at 3 seconds, tires screaming and smoke filling the frame; police lights flash behind as the camera cuts to a side tracking shot showing sparks as the car scrapes a wall, then snaps back to a forward chase view; audio includes roaring engine, tire screeches, radio chatter muffled, helicopter blades overhead, and aggressive bass-driven music; visual style is modern action realism, fast cuts, dynamic motion blur.

❤️ @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🧺 ربات انسان‌نما لباس‌ها را کاملاً خودکار تا می‌کند!

برای اولین‌بار شاهد ربات انسان‌نمایی هستیم که بدون دخالت انسان، لباس‌ها را با دقت و مهارت تا می‌کند؛ درست مثل یک فرد حرفه‌ای 👕

این ربات با استفاده از بینایی ماشین، برنامه‌ریزی حرکتی پیشرفته و هوش مصنوعی می‌تواند:

لباس را تشخیص دهد

آن را بردارد

صاف کند

و به‌صورت منظم تا بزند


🔮 این فناوری یک قدم بزرگ به سمت ربات‌های خانگی واقعی است؛ ربات‌هایی که در آینده می‌توانند کارهای روزمره مثل شست‌وشو، مرتب‌سازی و حتی نگهداری از سالمندان را انجام دهند.

آینده‌ای که ربات‌ها در خانه کمک‌حال ما باشند، دیگر علمی‌–تخیلی نیست 🚀

❤️ @rss_ai_ir


#هوش_مصنوعی #رباتیک #ربات_انسان‌نما #AI #Robotics #FutureTech #SmartHome
🎥🧠 بنچمارک HERBench: بنچمارک جدید برای ادغام چندشاهدی در پرسش‌وپاسخ ویدیویی

اینکه HERBench یک بنچمارک تازه در حوزه VideoQA است که توانایی مدل‌های ویدیو-زبانی را در ترکیب چند شواهد بصری در طول زمان ارزیابی می‌کند. این بنچمارک نشان می‌دهد حتی قوی‌ترین Video-LLMها هنوز در ادغام شواهد پراکنده با چالش‌های جدی روبه‌رو هستند.

🔍 نکات کلیدی

الزام به ترکیب حداقل ۳ نشانه بصری از بخش‌های زمانی متفاوت ویدیو

آشکارسازی ضعف‌های فعلی در بازیابی شواهد و استدلال چندمرحله‌ای

فاصله محسوس عملکرد مدل‌ها نسبت به انتظار انسانی


📅 تاریخ انتشار: ۱۶ دسامبر

🔗 لینک‌ها

arXiv: https://arxiv.org/abs/2512.14870

PDF: https://arxiv.org/pdf/2512.14870

Project Page: https://herbench.github.io/

GitHub: https://github.com/DanBenAmi/HERBench

Dataset (HF): https://huggingface.co/datasets/DanBenAmi/HERBench


💡 اگر روی درک ویدیو، استدلال زمانی و Agentic Video AI کار می‌کنید، HERBench یک معیار ضروری برای سنجش واقعی توان مدل‌هاست.

@rss_ai_ir
#AI #VideoAI #VideoQA #MachineLearning #Benchmark #Research
🌟 مدل Z-Image Turbo صدرنشین Image Arena شد! 🎨🤖

🔹 محصول جدید Alibaba موفق شد رتبه اول را در Artificial Analysis Image Arena کسب کند؛ آن هم با اختلاف قابل‌توجه از رقبا.

⚙️ مشخصات فنی مهم:
• دارای ۶ میلیارد پارامتر
• اجرای نسخه کامل فقط با ۱۶ گیگابایت VRAM
• نسخه‌های کوانتایز شده حتی روی ۸ گیگابایت هم اجرا می‌شوند
• مناسب استفاده روی سخت‌افزار مصرفی

💰 قیمت‌گذاری بسیار رقابتی:
• فقط ۵ دلار برای ۱۰۰۰ تصویر روی Alibaba Cloud
• ارزان‌تر از:
– FLUX.2 [dev] → ۱۲$
– HiDream-I1-Dev → ۲۶$
– Qwen-Image → ۲۰$

📜 لایسنس Apache 2.0
یعنی استفاده کاملاً آزاد و تجاری بدون دردسر حقوقی.

🔥 یک مدل قدرتمند، ارزان و متن‌باز که واقعاً بازار تولید تصویر را تکان داده.
کسی هست Stable Diffusion رو بیدار کنه؟ 😅

@rss_ai_ir
🎧 مدل SAM Audio: جداسازی صداها با هوش مصنوعی، دقیق مثل Segment Anything

🔊 مدل SAM Audio یک مدل پایه (Foundation Model) برای جداسازی عمومی صدا است که می‌تواند اجزای مختلف یک فایل صوتی پیچیده را با دقت بالا از هم تفکیک کند؛ فقط با پرامپت متنی، نشانه‌ی بصری یا انتخاب بازه‌ی زمانی.

چه چیزی SAM Audio را خاص می‌کند؟

🧠 یکپارچه‌سازی پرامپت‌های متنی + بصری + زمانی

🎼 عملکرد State-of-the-Art روی انواع صداها (گفتار، موسیقی، افکت‌ها)

🧪 معرفی یک بنچمارک واقعی جدید برای جداسازی صدا

🔓 متن‌باز و مناسب پژوهش و پروداکشن


📄 لینک‌ها

📘 مقاله (arXiv): https://arxiv.org/abs/2512.18099

📄 PDF:
https://arxiv.org/pdf/2512.18099

🌐 صفحه پروژه:
https://ai.meta.com/samaudio/

💻 گیت‌هاب:
https://github.com/facebookresearch/sam-audio


🤗 مدل‌ها در Hugging Face

Large: https://huggingface.co/facebook/sam-audio-large

Base: https://huggingface.co/facebook/sam-audio-base

Small: https://huggingface.co/facebook/sam-audio-small


🧪 دموها

https://huggingface.co/spaces/lpeterl/sam-audio-webui

https://huggingface.co/spaces/Arrcttacsrks/SAM-Audio-Demo

https://huggingface.co/spaces/chippie1/SAM-Audio-Demo


🚀 کاربردها

ریمیکس و مسترینگ پیشرفته 🎶

طراحی صدای سینمایی 🎬

پاک‌سازی نویز و استخراج گفتار 🗣️

ابزارهای خلاقانه صوتی 🎨


@rss_ai_ir
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚇🤖 ربات‌ها در چین با مترو کالا تحویل می‌دهند!

برای اولین بار در جهان، ربات‌های تحویل‌دهنده به‌صورت خودران از حمل‌ونقل عمومی (مترو) استفاده می‌کنند.
این ربات‌ها در ساعات کم‌ترافیک سوار مترو می‌شوند تا بسته‌ها را جابه‌جا کنند—حرکتی هوشمندانه برای کاهش ترافیک و انتشار کربن.

🔹 استفاده بهینه از زیرساخت شهری
🔹 کاهش کامیون‌ها و موتورسیکلت‌های تحویل در خیابان‌ها
🔹 یک قدم واقعی به‌سوی شهرهای پایدار و لجستیک سبز

آینده‌ی لجستیک شهری رسماً وارد ایستگاه شد. 🌱🚉
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت NOETIX از ربات انسان‌نمای جدید خود با نام Hobbs W1 رونمایی کرد — ظاهری کمی سورئال دارد، اما همین حالا در دنیای واقعی مشغول به کار است.

ربات Hobbs W1 در حال حاضر به‌عنوان راهنما و ربات پذیرش در موزه‌ها، ساختمان‌های دولتی و دفاتر اداری استفاده می‌شود. این یک پروژه آزمایشی نیست، بلکه یک راهکار خدماتی عملی و قابل استفاده است.

طراحی آن به‌گونه‌ای انجام شده که دوستانه و «انسان‌گونه» به نظر برسد، اما تقلید کامل از انسان نداشته باشد؛ همین موضوع باعث کاهش اثر دره وهم‌آلود (Uncanny Valley) می‌شود.

از نظر قابلیت‌ها، Hobbs W1 توانایی‌های زیر را دارد:

♻️تشخیص احساسات از روی چهره

♻️برقراری گفت‌وگوی طبیعی با انسان

♻️همگام‌سازی اطلاعات به‌صورت بلادرنگ

♻️حرکت با سرعت و ریتم انسانی


ربات‌های خدماتی به‌تدریج از «ویترین آینده» فاصله می‌گیرند و به بخشی از زیرساخت روزمره زندگی ما تبدیل می‌شوند.
1
This media is not supported in your browser
VIEW IN TELEGRAM
روش WorldWarp: انتقال هندسه سه‌بعدی با انتشار ویدیویی ناهمگام

📝 خلاصه:
روش WorldWarp به مشکل تولید ویدیوهای بلند و سازگار می‌پردازد. این روش با ترکیب یک کش هندسه‌ی سه‌بعدی و یک مدل انتشار فضایی-زمانی، سازگاری ساختاری (Geometry) و بافتی (Texture) را در طول زمان حفظ می‌کند و به تولید ویدیوهای پایدار و منسجم کمک می‌کند.

🔹 تاریخ انتشار: 22 دسامبر

🔹 لینک‌ها:
• صفحه arXiv:
https://arxiv.org/abs/2512.19678
• فایل PDF:
https://arxiv.org/pdf/2512.19678
• صفحه پروژه:
https://hyokong.github.io/worldwarp-page/
• گیت‌هاب:
https://hyokong.github.io/worldwarp-page/

🔹 مدل‌های مرتبط:
https://huggingface.co/imsuperkong/worldwarp

==================================


#AI #DataScience #MachineLearning #HuggingFace #Research