VIRSUN – Telegram
VIRSUN
6.57K subscribers
1.56K photos
908 videos
5 files
982 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://news.1rj.ru/str/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🎓 نجات‌دهنده واقعی دانشجوها از راه رسید!

یک عامل هوش مصنوعی که می‌تونه همه‌چیز رو بنویسه؛
از انشا و مقاله گرفته تا پایان‌نامه کامل 📚🤖

🔍 چه کارهایی انجام می‌ده؟

جست‌وجوی مقالات علمی در هر موضوع

افزودن نقل‌قول‌ها با دستورهای /cite و /insert

فرمت‌بندی خودکار متن

خروجی گرفتن در Word، PDF یا LaTeX

استفاده از Deep Research برای تحلیل مقالات علمی در سراسر اینترنت و ساخت استدلال‌های قوی


📈 نتیجه؟
دیگه شب‌بیداری برای تحویل پروژه‌ها تموم شد؛
دوران آپگرید تحصیل شروع شده! 🚀

👉 همین حالا امتحانش کن 👇
(لینک در منبع)
https://chirpz.ai/

📢 @rss_ai_ir
#هوش_مصنوعی #دانشجو #تحقیق #پایان_نامه #AI #Education #DeepResearch
اینکه LongShOTBench و LongShOTAgent: معیار و فریم‌ورک عامل‌محور برای استدلال چندحالته روی ویدیوهای طولانی 🎥🤖

📝 خلاصه:
این پژوهش دو معرفی مهم دارد:

LongShOTBench:
یک بنچمارک تشخیصی برای درک ویدیوهای طولانی و چندحالته با پرسش‌های باز و استفاده عامل‌محور از ابزارها

LongShOTAgent:
یک سیستم agentic برای تحلیل ویدیو که می‌تواند ابزارها را به‌صورت مرحله‌ای به‌کار بگیرد


نتایج نشان می‌دهد حتی مدل‌های state-of-the-art فعلی هم در درک عمیق و استدلال روی ویدیوهای طولانی با چالش جدی روبه‌رو هستند. این یعنی هنوز فاصله‌ی معناداری بین توانایی انسان و AI در فهم ویدیوهای بلند وجود دارد.

📅 تاریخ انتشار:
۱۸ دسامبر

🔗 لینک‌ها:
• arXiv:
https://arxiv.org/abs/2512.16978
• PDF:
https://arxiv.org/pdf/2512.16978
• Project Page:
https://mbzuai-oryx.github.io/LongShOT/
• GitHub:
https://github.com/mbzuai-oryx/longshot

📦 Datasets:
• Hugging Face Dataset:
https://huggingface.co/datasets/MBZUAI/longshot-bench

💡 چرا مهم است؟
این کار نشان می‌دهد که برای ساخت عامل‌های واقعیِ ویدیو-محور، فقط مدل بزرگ کافی نیست؛ برنامه‌ریزی، استفاده از ابزار و استدلال چندمرحله‌ای نقش کلیدی دارند.

📡 برای منابع بیشتر در حوزه علم داده و هوش مصنوعی:
👉 @rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #ویدیو_AI #چندحالته #AgenticAI #بنچمارک #پژوهش
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 توقف رباتاکسی‌های Waymo در خاموشی سن‌فرانسیسکو 🤖⚡️

در جریان یک خاموشی گسترده، حدود ۱۳۰ هزار خانه در سن‌فرانسیسکو بدون برق ماندند و رباتاکسی‌های Waymo در سطح شهر متوقف شدند. ویدیوها نشان می‌دادند خودروهای سفید Waymo وسط خیابان‌ها گیر کرده‌اند.

🔍 چه اتفاقی افتاد؟

سامانه Waymo در شرایط غیرعادی به اپراتور از راه دور متکی است.

با قطع اینترنت پایدار و زیرساخت‌های ترافیکی، خودروها نتوانستند راهنمایی لازم را دریافت کنند.

اینکه Waymo برای حفظ ایمنی، سرویس‌ها را موقتاً تعلیق کرد.


⚖️ مقایسه جالب

در همان شرایط، خودروهای Tesla با FSD طبق گزارش‌ها به حرکت ادامه دادند و ویدیوهایی از عبور آن‌ها منتشر شد.


🧠 جمع‌بندی این رخداد نشان می‌دهد وابستگی شدید به شبکه می‌تواند نقطه‌ضعف خودران‌ها باشد و تفاوت رویکردهای تاب‌آوری (resilience) بین Waymo و Tesla را برجسته می‌کند.

📊
@rss_ai_ir 🏴

#Robotaxi #Waymo #Tesla #AutonomousDriving #AI #Resilience
🤖 انقلاب در ربات‌های انسان‌نما با SharpaWave

شرکت سنگاپوری Sharpa Robotics تولید انبوه پیشرفته‌ترین دست رباتیکی خود با نام SharpaWave را آغاز کرد؛ دستی هم‌اندازه دست انسان که می‌تواند نقطه عطفی در ربات‌های همه‌منظوره باشد.

🔧 ویژگی‌های کلیدی SharpaWave:

۲۲ درجه آزادی برای حرکات بسیار طبیعی

👁️ انگشتان فوق‌حساس با دوربین و سنسورهای لمسی (بیش از ۱۰۰۰ پیکسل لمسی در نوک انگشت!)

⚖️ تشخیص نیرو از ۰٫۰۰۵ نیوتن

🍷 گرفتن محکم اشیای بسیار ظریف بدون آسیب

🏥 مناسب برای کار در خانه‌ها، بیمارستان‌ها و فروشگاه‌ها


🚀 این دست رباتیکی راه را برای ربات‌هایی باز می‌کند که بتوانند مانند انسان‌ها در محیط‌های واقعی کار کنند.

🔗 منبع:
https://interestingengineering.com/ai-robotics/sharpas-advanced-robotic-hand-enters-mass-production

#رباتیک #هوش_مصنوعی #ربات_انسان‌نما #فناوری #AI #Robotics
This media is not supported in your browser
VIEW IN TELEGRAM
مدل 3D-RE-GEN: بازسازی صحنه‌های داخلی به‌صورت سه‌بعدی با چارچوب مولد 🧱🖼️

📝 خلاصه:
مدل 3D-RE-GEN می‌تواند تنها از یک تصویر، یک صحنه‌ی سه‌بعدی با مش بافت‌دار و قابل ویرایش بسازد؛ آن هم با پس‌زمینه‌ی کامل و چیدمان واقع‌گرایانه. این روش با یک چارچوب مولدِ ترکیبی و بهینه‌سازی جدید، خروجی‌هایی آماده‌ی استفاده برای هنرمندان و نزدیک به واقعیت فیزیکی تولید می‌کند و به نتایج SOTA می‌رسد.

🔹 تاریخ انتشار: 19 دسامبر
🔹 لینک‌ها:
• arXiv:
https://arxiv.org/abs/2512.17459
• PDF:
https://arxiv.org/pdf/2512.17459
• Project Page:
https://3dregen.jdihlmann.com/
• GitHub:
https://github.com/cgtuebingen/3D-RE-GEN

📌 کاربردها:
بازسازی سه‌بعدی فضاهای داخلی، طراحی صحنه، بازی‌سازی، معماری، و تولید محتوای واقع‌گرایانه.

@rss_ai_ir
#3D #GenerativeAI #ComputerVision #DeepLearning #ComputerGraphics #Reconstruction #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🔥 وقتی ربات‌ها مثل نیروهای ویژه حرکت می‌کنند!

یک ربات انسان‌نما را تصور کنید که غلت‌های تاکتیکی، افتادن کنترل‌شده و بازیابی سریع انجام می‌دهد؛ دقیق، پایدار و کاملاً هماهنگ با بدن خودش. این فقط نمایش نیست، بلکه تمرینی جدی برای ربات‌هایی است که باید در دنیای واقعی زنده بمانند.

🧠 چرا این مهم است؟

افزایش تعادل و پایداری در شرایط غیرقابل‌پیش‌بینی

آمادگی برای عملیات امداد، نظامی و صنعتی

کاهش آسیب در سقوط و بازگشت سریع به حالت عملیاتی


🤖 آینده رباتیک فقط راه رفتن نیست؛ بلند شدن بعد از زمین خوردن است.

@rss_ai_ir 🏴
#رباتیک #Humanoid #AI #Robotics #FutureTech #EmbodiedAI
🔮 پیش‌بینی a16z از آینده بازار هوش مصنوعی در سال ۲۰۲۶

به‌گزارش Andreessen Horowitz، سال ۲۰۲۶ نقطه‌ی چرخش بزرگ از ابزارهای عمومی به سیستم‌های عامل‌محور، شخصی‌سازی‌شده و چندعامله خواهد بود. خلاصه‌ی نکات کلیدی 👇

🎓 دانشگاه‌های AI-native
آموزش به‌صورت لحظه‌ای با هر دانشجو تطبیق می‌یابد؛ نقش معلم از ارائه‌دهنده محتوا به طراح سیستم و منتور تغییر می‌کند.

🏗️ زیرساخت‌های جدید برای ایجنت‌ها
بارهای کاری ایجنتی به هم‌زمانی بالا، وضعیت پایدار و هماهنگی میلی‌ثانیه‌ای نیاز دارند؛ پلتفرم‌های «agent-native» ظهور می‌کنند.

🤝 فرآیندهای کسب‌وکار چندعامله
در حوزه‌هایی مثل حقوق و املاک، ایجنت‌ها به‌طور خودکار مذاکره و حل اختلاف می‌کنند—بدون دخالت انسان.

🧠 محوشدن رابط‌ها
اینکه CRM و ERP به لایه‌های داده‌ی منفعل تبدیل می‌شوند؛ تعامل از مسیر ایجنت‌ها انجام می‌شود و معیار اصلی، «نتیجه» است نه زمان صفحه.

🩺 جهش پزشکی مبتنی بر AI
اشتراک‌های پایش زیست‌نشانگرها و مربی‌گری سلامت AI رشد می‌کنند و اقتصاد پیشگیرانه شکل می‌گیرد.

🧹 کیفیت داده گلوگاه اصلی
انبوه PDF و ویدئوها نیاز به لایه‌های داده‌ی تمیز، ساخت‌یافته و چندوجهی برای استدلال AI ایجاد می‌کند.

🧩 اهمیت کمتر دیتابیس، اهمیت بیشتر استدلال
ارزش به سمت ارکستراسیون، استدلال و اجرای خودکار می‌رود.

🌍 انفجار جهان‌های سه‌بعدی مولد
شبیه‌سازی‌های زنده برای آموزش ایجنت‌ها و خلق محیط‌ها در زمان واقعی فراگیر می‌شوند.

جمع‌بندی: سال ۲۰۲۶، گذار از AI همگانی به AI کاملاً شخصی با دستیارانی است که زمینه، اهداف و یادگیری مداوم هر فرد را درک می‌کنند.

📊
📣 @rss_ai_ir

#هوش_مصنوعی #AI #AgenticAI #a16z #فناوری #آینده #سلامت_دیجیتال #زیرساخت #داده
2
This media is not supported in your browser
VIEW IN TELEGRAM
🧠🤖 کنترل ربات‌ها با ذهن؛ یک جهش واقعی در رابط مغز–رایانه

برای اولین‌بار در چین، یک بیمار دچار فلج کامل نخاعی توانسته با استفاده از ایمپلنت مغزی (BCI) به‌صورت پایدار و در دنیای واقعی چند ربات را کنترل کند. این فرد که بیش از سه سال از گردن به پایین فلج بوده، حالا دوباره به زندگی فعال برگشته است.

چه کارهایی ممکن شده؟

سفارش آنلاین غذا 🛒🍔

ارسال سگ رباتیک برای تحویل گرفتن سفارش 🐕🤖

انجام کارهای دیجیتال و درآمدزایی 💻💰

جابه‌جایی و کمک‌حرکتی در محیط اطراف 🚶‍♂️⚙️


🔬 چرا این اتفاق مهم است؟ برخلاف آزمایش‌های قبلی که فقط در محیط‌های کنترل‌شده جواب می‌دادند، این سیستم در زندگی روزمره به‌طور قابل‌اعتماد کار می‌کند. این یعنی یک قدم بزرگ به‌سمت استقلال عملی بیماران فلج و حضور فعال‌تر آن‌ها در کار و اجتماع.

🚀 آینده‌ای که زمانی علمی–تخیلی بود، حالا واقعی‌تر از همیشه است.

📣 @rss_ai_ir

#هوش_مصنوعی #رباتیک #BCI #رابط_مغز_رایانه #فناوری_پزشکی #سلامت_دیجیتال #ربات #نوآوری
🚀 نقشه راه تسلط بر هوش مصنوعی تا ۲۰۲۶

اگر می‌خواهی از «کاربر ابزارهای AI» به «سازنده سیستم‌های هوشمند» تبدیل شوی، این مسیر قدم‌به‌قدم را از دست نده 👇

🧱 ۱) ساخت پایه‌های قوی
پایتون، NumPy، Pandas، آمار، احتمال، جبر خطی، ساختمان داده و Git

📊 ۲) کار عملی با داده
پاک‌سازی و پیش‌پردازش، مصورسازی (Matplotlib / Seaborn)، مهندسی ویژگی، پروژه‌های Kaggle

🤖 ۳) یادگیری ماشین (ML)
یادگیری نظارت‌شده و بدون‌نظارت، رگرسیون، درخت تصمیم، SVM

🧠 ۴) یادگیری عمیق (DL)
شبکه‌های عصبی، CNN، RNN، LSTM، Transformer با TensorFlow و PyTorch

🎯 ۵) انتخاب تخصص AI
بینایی ماشین، NLP، RL، رباتیک، فین‌تک، هلث‌تک یا بیزنس

🧩 ۶) مدل‌های زبانی بزرگ (LLM)
چت‌بات‌ها، دستیارها، سیستم‌های توصیه‌گر، تحلیل پیش‌بینی و تولید محتوا

⚙️ ۷) دیپلوی و MLOps
FastAPI/Flask، Docker، Kubernetes، پایپ‌لاین ML، مانیتورینگ مدل

🛠 ۸) پروژه‌های واقعی AI
ساخت اپلیکیشن‌های واقعی با اثرگذاری تجاری

🎓 ۹) ورود به بازار کار AI
پورتفولیو قوی، GitHub، آمادگی مصاحبه، شبکه‌سازی و اپلای هدفمند

جمع‌بندی: ابزارها سریع‌تر می‌شوند، اما مهارت ترکیب، ساخت و استقرار است که مزیت رقابتی می‌سازد.

📌 ذخیره کن، مرحله‌به‌مرحله جلو برو و هر بخش را با پروژه واقعی ببند.

@rss_ai_ir 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Kling 2.6 :
A high-speed urban action scene at dusk beginning with a low front-mounted camera on a muscle car racing through tight streets, the camera shaking with engine torque as the car drifts sharply around corners at 3 seconds, tires screaming and smoke filling the frame; police lights flash behind as the camera cuts to a side tracking shot showing sparks as the car scrapes a wall, then snaps back to a forward chase view; audio includes roaring engine, tire screeches, radio chatter muffled, helicopter blades overhead, and aggressive bass-driven music; visual style is modern action realism, fast cuts, dynamic motion blur.

❤️ @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🧺 ربات انسان‌نما لباس‌ها را کاملاً خودکار تا می‌کند!

برای اولین‌بار شاهد ربات انسان‌نمایی هستیم که بدون دخالت انسان، لباس‌ها را با دقت و مهارت تا می‌کند؛ درست مثل یک فرد حرفه‌ای 👕

این ربات با استفاده از بینایی ماشین، برنامه‌ریزی حرکتی پیشرفته و هوش مصنوعی می‌تواند:

لباس را تشخیص دهد

آن را بردارد

صاف کند

و به‌صورت منظم تا بزند


🔮 این فناوری یک قدم بزرگ به سمت ربات‌های خانگی واقعی است؛ ربات‌هایی که در آینده می‌توانند کارهای روزمره مثل شست‌وشو، مرتب‌سازی و حتی نگهداری از سالمندان را انجام دهند.

آینده‌ای که ربات‌ها در خانه کمک‌حال ما باشند، دیگر علمی‌–تخیلی نیست 🚀

❤️ @rss_ai_ir


#هوش_مصنوعی #رباتیک #ربات_انسان‌نما #AI #Robotics #FutureTech #SmartHome
🎥🧠 بنچمارک HERBench: بنچمارک جدید برای ادغام چندشاهدی در پرسش‌وپاسخ ویدیویی

اینکه HERBench یک بنچمارک تازه در حوزه VideoQA است که توانایی مدل‌های ویدیو-زبانی را در ترکیب چند شواهد بصری در طول زمان ارزیابی می‌کند. این بنچمارک نشان می‌دهد حتی قوی‌ترین Video-LLMها هنوز در ادغام شواهد پراکنده با چالش‌های جدی روبه‌رو هستند.

🔍 نکات کلیدی

الزام به ترکیب حداقل ۳ نشانه بصری از بخش‌های زمانی متفاوت ویدیو

آشکارسازی ضعف‌های فعلی در بازیابی شواهد و استدلال چندمرحله‌ای

فاصله محسوس عملکرد مدل‌ها نسبت به انتظار انسانی


📅 تاریخ انتشار: ۱۶ دسامبر

🔗 لینک‌ها

arXiv: https://arxiv.org/abs/2512.14870

PDF: https://arxiv.org/pdf/2512.14870

Project Page: https://herbench.github.io/

GitHub: https://github.com/DanBenAmi/HERBench

Dataset (HF): https://huggingface.co/datasets/DanBenAmi/HERBench


💡 اگر روی درک ویدیو، استدلال زمانی و Agentic Video AI کار می‌کنید، HERBench یک معیار ضروری برای سنجش واقعی توان مدل‌هاست.

@rss_ai_ir
#AI #VideoAI #VideoQA #MachineLearning #Benchmark #Research
🌟 مدل Z-Image Turbo صدرنشین Image Arena شد! 🎨🤖

🔹 محصول جدید Alibaba موفق شد رتبه اول را در Artificial Analysis Image Arena کسب کند؛ آن هم با اختلاف قابل‌توجه از رقبا.

⚙️ مشخصات فنی مهم:
• دارای ۶ میلیارد پارامتر
• اجرای نسخه کامل فقط با ۱۶ گیگابایت VRAM
• نسخه‌های کوانتایز شده حتی روی ۸ گیگابایت هم اجرا می‌شوند
• مناسب استفاده روی سخت‌افزار مصرفی

💰 قیمت‌گذاری بسیار رقابتی:
• فقط ۵ دلار برای ۱۰۰۰ تصویر روی Alibaba Cloud
• ارزان‌تر از:
– FLUX.2 [dev] → ۱۲$
– HiDream-I1-Dev → ۲۶$
– Qwen-Image → ۲۰$

📜 لایسنس Apache 2.0
یعنی استفاده کاملاً آزاد و تجاری بدون دردسر حقوقی.

🔥 یک مدل قدرتمند، ارزان و متن‌باز که واقعاً بازار تولید تصویر را تکان داده.
کسی هست Stable Diffusion رو بیدار کنه؟ 😅

@rss_ai_ir
🎧 مدل SAM Audio: جداسازی صداها با هوش مصنوعی، دقیق مثل Segment Anything

🔊 مدل SAM Audio یک مدل پایه (Foundation Model) برای جداسازی عمومی صدا است که می‌تواند اجزای مختلف یک فایل صوتی پیچیده را با دقت بالا از هم تفکیک کند؛ فقط با پرامپت متنی، نشانه‌ی بصری یا انتخاب بازه‌ی زمانی.

چه چیزی SAM Audio را خاص می‌کند؟

🧠 یکپارچه‌سازی پرامپت‌های متنی + بصری + زمانی

🎼 عملکرد State-of-the-Art روی انواع صداها (گفتار، موسیقی، افکت‌ها)

🧪 معرفی یک بنچمارک واقعی جدید برای جداسازی صدا

🔓 متن‌باز و مناسب پژوهش و پروداکشن


📄 لینک‌ها

📘 مقاله (arXiv): https://arxiv.org/abs/2512.18099

📄 PDF:
https://arxiv.org/pdf/2512.18099

🌐 صفحه پروژه:
https://ai.meta.com/samaudio/

💻 گیت‌هاب:
https://github.com/facebookresearch/sam-audio


🤗 مدل‌ها در Hugging Face

Large: https://huggingface.co/facebook/sam-audio-large

Base: https://huggingface.co/facebook/sam-audio-base

Small: https://huggingface.co/facebook/sam-audio-small


🧪 دموها

https://huggingface.co/spaces/lpeterl/sam-audio-webui

https://huggingface.co/spaces/Arrcttacsrks/SAM-Audio-Demo

https://huggingface.co/spaces/chippie1/SAM-Audio-Demo


🚀 کاربردها

ریمیکس و مسترینگ پیشرفته 🎶

طراحی صدای سینمایی 🎬

پاک‌سازی نویز و استخراج گفتار 🗣️

ابزارهای خلاقانه صوتی 🎨


@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🚇🤖 ربات‌ها در چین با مترو کالا تحویل می‌دهند!

برای اولین بار در جهان، ربات‌های تحویل‌دهنده به‌صورت خودران از حمل‌ونقل عمومی (مترو) استفاده می‌کنند.
این ربات‌ها در ساعات کم‌ترافیک سوار مترو می‌شوند تا بسته‌ها را جابه‌جا کنند—حرکتی هوشمندانه برای کاهش ترافیک و انتشار کربن.

🔹 استفاده بهینه از زیرساخت شهری
🔹 کاهش کامیون‌ها و موتورسیکلت‌های تحویل در خیابان‌ها
🔹 یک قدم واقعی به‌سوی شهرهای پایدار و لجستیک سبز

آینده‌ی لجستیک شهری رسماً وارد ایستگاه شد. 🌱🚉
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت NOETIX از ربات انسان‌نمای جدید خود با نام Hobbs W1 رونمایی کرد — ظاهری کمی سورئال دارد، اما همین حالا در دنیای واقعی مشغول به کار است.

ربات Hobbs W1 در حال حاضر به‌عنوان راهنما و ربات پذیرش در موزه‌ها، ساختمان‌های دولتی و دفاتر اداری استفاده می‌شود. این یک پروژه آزمایشی نیست، بلکه یک راهکار خدماتی عملی و قابل استفاده است.

طراحی آن به‌گونه‌ای انجام شده که دوستانه و «انسان‌گونه» به نظر برسد، اما تقلید کامل از انسان نداشته باشد؛ همین موضوع باعث کاهش اثر دره وهم‌آلود (Uncanny Valley) می‌شود.

از نظر قابلیت‌ها، Hobbs W1 توانایی‌های زیر را دارد:

♻️تشخیص احساسات از روی چهره

♻️برقراری گفت‌وگوی طبیعی با انسان

♻️همگام‌سازی اطلاعات به‌صورت بلادرنگ

♻️حرکت با سرعت و ریتم انسانی


ربات‌های خدماتی به‌تدریج از «ویترین آینده» فاصله می‌گیرند و به بخشی از زیرساخت روزمره زندگی ما تبدیل می‌شوند.
This media is not supported in your browser
VIEW IN TELEGRAM
روش WorldWarp: انتقال هندسه سه‌بعدی با انتشار ویدیویی ناهمگام

📝 خلاصه:
روش WorldWarp به مشکل تولید ویدیوهای بلند و سازگار می‌پردازد. این روش با ترکیب یک کش هندسه‌ی سه‌بعدی و یک مدل انتشار فضایی-زمانی، سازگاری ساختاری (Geometry) و بافتی (Texture) را در طول زمان حفظ می‌کند و به تولید ویدیوهای پایدار و منسجم کمک می‌کند.

🔹 تاریخ انتشار: 22 دسامبر

🔹 لینک‌ها:
• صفحه arXiv:
https://arxiv.org/abs/2512.19678
• فایل PDF:
https://arxiv.org/pdf/2512.19678
• صفحه پروژه:
https://hyokong.github.io/worldwarp-page/
• گیت‌هاب:
https://hyokong.github.io/worldwarp-page/

🔹 مدل‌های مرتبط:
https://huggingface.co/imsuperkong/worldwarp

==================================


#AI #DataScience #MachineLearning #HuggingFace #Research
This media is not supported in your browser
VIEW IN TELEGRAM
پاردایم ReCo: تولید درون‌متنی با قیود ناحیه‌ای برای ویرایش ویدئوهای آموزشی

📝 خلاصه:
اینکه ReCo یک پارادایم جدید برای ویرایش ویدئوهای آموزشی است که با افزودن مدل‌سازی قیود ناحیه‌ای و تکنیک‌های منظم‌سازی در فرآیند تولید درون‌متنی (In-Context Generation)، دقت را افزایش می‌دهد و تداخل توکن‌ها را کاهش می‌دهد. این رویکرد باعث می‌شود ویرایش‌ها دقیق‌تر، پایدارتر و قابل‌کنترل‌تر باشند؛ به‌ویژه در سناریوهای پیچیده‌ی دستورمحور.

🔹 تاریخ انتشار: ۱۹ دسامبر

🔹 لینک‌ها:
• صفحه arXiv:
https://arxiv.org/abs/2512.17650
• فایل PDF:
https://arxiv.org/pdf/2512.17650
• صفحه پروژه:
https://zhw-zhang.github.io/ReCo-page/
• گیت‌هاب:
https://github.com/HiDream-ai/ReCo

دیتاست‌های مرتبط:
https://huggingface.co/datasets/HiDream-ai/ReCo-Data

==================================
@rss_ai_ir

#AI #DataScience #MachineLearning #HuggingFace #Research
1
🚀 ۲۸ پروژه‌ی آماده‌ی هوش مصنوعی که واقعاً می‌توان در محصول نهایی (Production) یا برای پورتفولیو استفاده کرد

اگر دنبال پروژه‌های عملی هستید که فقط «کد تمرینی» نباشند، این مجموعه دقیقاً همان چیزی است که نیاز دارید.

🔹 پروژه‌های یادگیری ماشین (Machine Learning)

پیش‌بینی قیمت مسکن (Airbnb Price Prediction)

محاسبه‌گر قیمت بلیت هواپیما

سیستم پایش و تحلیل عملکرد تحصیلی دانشجویان


🏥و AI در حوزه سلامت

تشخیص بیماری‌های قفسه سینه از تصاویر پزشکی

پیش‌بینی بیماری‌های قلبی

تحلیل‌گر ریسک دیابت


🎨 اپلیکیشن‌های هوش مصنوعی مولد (Generative AI)

چت‌بات زنده مبتنی بر Gemini

دستیار پزشکی عملیاتی

ابزار تحلیل و پردازش اسناد


👁️ پروژه‌های بینایی ماشین (Computer Vision)

سیستم ردیابی دست

اپلیکیشن تشخیص دارو

پیاده‌سازی‌های کاربردی با OpenCV


📊 داشبوردهای تحلیل داده

تحلیل فروش فروشگاه‌های آنلاین

آنالیز داده‌های رستوران‌ها

سیستم تحلیل عملکرد بازیکنان کریکت


⚡️ ۱۰ پروژه پیشرفته که به‌زودی اضافه می‌شوند

تشخیص دیپ‌فیک

طبقه‌بندی تومورهای مغزی

سیستم هشدار خواب‌آلودگی راننده


📌 نکته مهم:
این‌ها فقط اسکریپت یا نوت‌بوک نیستند؛
همه پروژه‌ها End-to-End هستند، قابل اجرا، تست‌پذیر و مناسب استفاده واقعی یا ارائه در رزومه.

🔗 ریپازیتوری GitHub:
https://github.com/KalyanM45/AI-Project-Gallery
🌐 اوپن‌اِی‌آی به‌روزرسانی ChatGPT Atlas را در میان افزایش ریسک‌های مرورگرهای هوش مصنوعی منتشر کرد

اوپن‌اِی‌آی مجموعه‌ای از به‌روزرسانی‌ها را برای ChatGPT Atlas (مرورگر مبتنی بر عامل هوش مصنوعی) عرضه کرده است؛ اقدامی که پس از هشدار پژوهشگران درباره تداوم ریسک‌های امنیتی ناشی از حملات تزریق پرامپت (Prompt Injection) انجام شد. این شرکت می‌گوید در حال تقویت لایه‌های حفاظتی است، هرچند اذعان دارد که این مشکل شاید هرگز به‌طور کامل از بین نرود.

🔹 حالا Atlas چیست؟
اینکه Atlas مرور وب را با یک عامل هوش مصنوعی ترکیب می‌کند؛ می‌تواند صفحات را بخواند، خلاصه کند و حتی به‌جای کاربر اقدام انجام دهد—قابلیتی که دامنه توان مرورگرها را به‌طور چشمگیری گسترش می‌دهد.

🔹 ریسک کجاست؟
پژوهشگران نشان داده‌اند دستورهای پنهان داخل وب‌سایت‌ها می‌توانند مدل را دستکاری کنند؛ از افشای داده تا انجام اقدامات ناخواسته.

🔹 پاسخ اوپن‌اِی‌آی
اوپن‌اِی‌آی اعلام کرده از «مهاجمانِ هوش مصنوعی» خودکار برای شبیه‌سازی حملات تزریق پرامپت و تست فشار Atlas پیش از گسترش آسیب‌پذیری‌ها استفاده می‌کند.

🔹 واقعیت تلخ
با وجود این به‌روزرسانی‌ها، اوپن‌اِی‌آی پذیرفته که تزریق پرامپت یک ضعف ساختاری در سیستم‌های عامل‌محور هوش مصنوعی است، نه صرفاً باگی که به‌سادگی وصله شود.

🔹 هشدار کارشناسان
مرورگرهای مبتنی بر عامل هوش مصنوعی سطح حمله جدیدی ایجاد می‌کنند، چون مدل عملاً با مجوزهای کاربر در وب عمل می‌کند.

جمع‌بندی:
به‌روزرسانی Atlas نشانه‌ی یک تغییر عمیق‌تر است: با گذار هوش مصنوعی از دستیار منفعل به اپراتور فعال، امنیت دیگر فقط بستن رخنه‌ها نیست؛ بلکه بازتعریف «اعتماد» در وب است.