Minimalist paint-style outline of a [subject], flowing black lines, clean composition, simple yet dramatic pose, fluid movement captured with elegant negative space, expressive and graceful silhouette
🧩🧠 مدل DiffThinker: استدلال چندوجهی با مدلهای دیفیوژن (Diffusion Models)
ایدهی جالب اینجاست: بهجای اینکه مدل مثل VLMها متنی فکر کند و توضیح بدهد، مسئله را به یک کار تولید تصویر تبدیل میکند و راهحل را مستقیم روی تصویر میکِشد. 🎨⚡️
✅ کاربرد اصلی
🟦 استفاده از دیفیوژنژنراتورهای تصویر برای حل معماها و پازلهای بصری (visual riddles)
✅ چطور کار میکند؟
🟩 «استدلال چندوجهی» را به «ژنریشن» تبدیل میکند:
بهجای زنجیرهاستدلال متنی، خروجی نهایی را بهصورت تصویری ارائه میدهد (مثل اینکه مدل راهحل را طراحی کند).
✅ پایهی مدل
🟨 مبتنی بر Qwen-Image-Edit-2509
😂 ایدهی کاربردی:
من هم اگر یک پازل داشتم که نتونستم بچینم، وسوسه میشدم عکسش رو بدم به DiffThinker ببینم روی تصویر راهحل رو نشون میده یا نه! 🧩📸
🔗 GitHub: (لینک)
🤗 Hugging Face: (لینک)
https://diffthinker-project.github.io/
@rss_ai_ir
#VLM #Multimodal #DiffusionModels #ComputerVision #AI #Qwen 🧠✨
ایدهی جالب اینجاست: بهجای اینکه مدل مثل VLMها متنی فکر کند و توضیح بدهد، مسئله را به یک کار تولید تصویر تبدیل میکند و راهحل را مستقیم روی تصویر میکِشد. 🎨⚡️
✅ کاربرد اصلی
🟦 استفاده از دیفیوژنژنراتورهای تصویر برای حل معماها و پازلهای بصری (visual riddles)
✅ چطور کار میکند؟
🟩 «استدلال چندوجهی» را به «ژنریشن» تبدیل میکند:
بهجای زنجیرهاستدلال متنی، خروجی نهایی را بهصورت تصویری ارائه میدهد (مثل اینکه مدل راهحل را طراحی کند).
✅ پایهی مدل
🟨 مبتنی بر Qwen-Image-Edit-2509
😂 ایدهی کاربردی:
من هم اگر یک پازل داشتم که نتونستم بچینم، وسوسه میشدم عکسش رو بدم به DiffThinker ببینم روی تصویر راهحل رو نشون میده یا نه! 🧩📸
🔗 GitHub: (لینک)
🤗 Hugging Face: (لینک)
https://diffthinker-project.github.io/
@rss_ai_ir
#VLM #Multimodal #DiffusionModels #ComputerVision #AI #Qwen 🧠✨
This media is not supported in your browser
VIEW IN TELEGRAM
🎾🤖 ربات انساننمای Walker S2 از UBTECH تنیس بازی میکند
نمایش منتشرشده شاید «هایلایتمحور» باشد، اما همچنان قابل توجه است.
این ربات توپ را ردیابی میکند، جایگیری پاها را لحظهای تنظیم میکند و ضربهها را در زمان واقعی برمیگرداند — ترکیبی از بینایی، کنترل حرکتی و تصمیمگیری سریع.
📌 نکات مهم:
دنبالکردن دقیق توپ با بینایی ماشین
تطبیق سریع فوتورک و تعادل
واکنش آنی به ضربههای برگشتی
هدفگذاری برای تولید انبوه در سال جاری
این یعنی عبور تدریجی از دموهای نمایشی به سمت کارکردهای پایدار و قابل تولید در رباتهای انساننما.
@rss_ai_ir
#Robotics #Humanoid #AI #UBTECH #WalkerS2 🤖🎾
نمایش منتشرشده شاید «هایلایتمحور» باشد، اما همچنان قابل توجه است.
این ربات توپ را ردیابی میکند، جایگیری پاها را لحظهای تنظیم میکند و ضربهها را در زمان واقعی برمیگرداند — ترکیبی از بینایی، کنترل حرکتی و تصمیمگیری سریع.
📌 نکات مهم:
دنبالکردن دقیق توپ با بینایی ماشین
تطبیق سریع فوتورک و تعادل
واکنش آنی به ضربههای برگشتی
هدفگذاری برای تولید انبوه در سال جاری
این یعنی عبور تدریجی از دموهای نمایشی به سمت کارکردهای پایدار و قابل تولید در رباتهای انساننما.
@rss_ai_ir
#Robotics #Humanoid #AI #UBTECH #WalkerS2 🤖🎾
This media is not supported in your browser
VIEW IN TELEGRAM
✨ چارچوب CHORD: طراحی حرکات یک جهان از اشیای پویا
🧠 خلاصه فنی:
چارچوب CHORD یک چارچوب مولد عمومی برای ساخت صحنههای پویا است که میتواند از ویدئوهای معمولی (نمایش اویلری) اطلاعات حرکتی لاگرانژی استخراج کند. نتیجه؟ تولید صحنههای چهاربعدی (4D) متنوع و منسجم، بدون نیاز به قوانین یا تنظیمات مخصوص هر دسته از اشیا.
🔍 چه چیزی CHORD را خاص میکند؟
🎥 استخراج حرکتهای واقعی از ویدئوهای دوبعدی
🧩 تولید صحنههای 4D پویا با چندین شیء در حال تعامل
🚫 بدون وابستگی به دستهبندیهای خاص (Category-agnostic)
⚙️ مناسب برای شبیهسازی، گرافیک رایانهای و دوقلوهای دیجیتال
📅 تاریخ انتشار: ۷ ژانویه
🔗 لینکها:
arXiv: https://arxiv.org/abs/2601.04194
PDF: https://arxiv.org/pdf/2601.04194
صفحه پروژه:
https://yanzhelyu.github.io/chord/
@rss_ai_ir
#AI #MachineLearning #ComputerVision #GenerativeAI #Research 🎬🧠
🧠 خلاصه فنی:
چارچوب CHORD یک چارچوب مولد عمومی برای ساخت صحنههای پویا است که میتواند از ویدئوهای معمولی (نمایش اویلری) اطلاعات حرکتی لاگرانژی استخراج کند. نتیجه؟ تولید صحنههای چهاربعدی (4D) متنوع و منسجم، بدون نیاز به قوانین یا تنظیمات مخصوص هر دسته از اشیا.
🔍 چه چیزی CHORD را خاص میکند؟
🎥 استخراج حرکتهای واقعی از ویدئوهای دوبعدی
🧩 تولید صحنههای 4D پویا با چندین شیء در حال تعامل
🚫 بدون وابستگی به دستهبندیهای خاص (Category-agnostic)
⚙️ مناسب برای شبیهسازی، گرافیک رایانهای و دوقلوهای دیجیتال
📅 تاریخ انتشار: ۷ ژانویه
🔗 لینکها:
arXiv: https://arxiv.org/abs/2601.04194
PDF: https://arxiv.org/pdf/2601.04194
صفحه پروژه:
https://yanzhelyu.github.io/chord/
@rss_ai_ir
#AI #MachineLearning #ComputerVision #GenerativeAI #Research 🎬🧠
🔥 پژوهشگران هوش مصنوعی بیش از هر زمان دیگری گران شدهاند
بر اساس گزارش رسانهها، شرکت OpenAI در پاییز ۲۰۲۵ یک استخر سهامی ۵۰ میلیارد دلاری برای اعطای آپشن و RSU به کارکنان آینده کنار گذاشته است.
این عدد معادل حدود ۱۰٪ از کل شرکت با ارزشگذاری تقریبی ۵۰۰ میلیارد دلار است.
📊 نکته مهمتر اینجاست:
تا امروز حدود ۸۰ میلیارد دلار سهام به کارکنان اختصاص داده شده و با اضافه شدن این استخر جدید، مجموعاً نزدیک به ۲۶٪ از کل شرکت صرف جبران خدمات نیروی انسانی میشود.
🧠 جمعبندی:
بازار AI در حال بازطراحی کامل مدلهای جبران خدمت است.
رقابت اصلی دیگر فقط بر سر GPU و دیتاسنتر نیست؛
بلکه بر سر انسانهایی است که میتوانند مدلهای در مقیاس جهانی را آموزش دهند.
در اقتصاد جدید هوش مصنوعی، «مغزها» از «ماشینها» گرانتر شدهاند 🤖💰
🔗 منبع: Reuters
@rss_ai_ir
#AI #OpenAI #TechEconomy #TalentWars 🚀
بر اساس گزارش رسانهها، شرکت OpenAI در پاییز ۲۰۲۵ یک استخر سهامی ۵۰ میلیارد دلاری برای اعطای آپشن و RSU به کارکنان آینده کنار گذاشته است.
این عدد معادل حدود ۱۰٪ از کل شرکت با ارزشگذاری تقریبی ۵۰۰ میلیارد دلار است.
📊 نکته مهمتر اینجاست:
تا امروز حدود ۸۰ میلیارد دلار سهام به کارکنان اختصاص داده شده و با اضافه شدن این استخر جدید، مجموعاً نزدیک به ۲۶٪ از کل شرکت صرف جبران خدمات نیروی انسانی میشود.
🧠 جمعبندی:
بازار AI در حال بازطراحی کامل مدلهای جبران خدمت است.
رقابت اصلی دیگر فقط بر سر GPU و دیتاسنتر نیست؛
بلکه بر سر انسانهایی است که میتوانند مدلهای در مقیاس جهانی را آموزش دهند.
در اقتصاد جدید هوش مصنوعی، «مغزها» از «ماشینها» گرانتر شدهاند 🤖💰
🔗 منبع: Reuters
@rss_ai_ir
#AI #OpenAI #TechEconomy #TalentWars 🚀
🤖✨ در نمایشگاه CES 2026، رباتهای کوچک و جذاب معرفی شدند!
در جدیدترین نمایشگاه فناوری CES 2026، مجموعهای از رباتهای مینیاتوری رونمایی شدهاند که توجه زیادی را به خود جلب کردند — هم بهخاطر طراحی بامزه و هم بهخاطر کاربردهای نوآورانه.
🔹 رباتهای کوچک برای مصارف مختلف:
• سرگرمی و تعامل انسانی
• آموزش و پرورش
• کمکهای کاربردی در خانه
• سرگرمیهای هوشمند
🔹 نکات جالب نمایشگاه:
✔️ برخی از رباتها توانایی حرکتهای پیچیده دارند
✔️ بعضی میتوانند با صدای کاربر تعامل کنند
✔️ برخی مدلها قابلیت توسعه با افزونهها و سنسورها را دارند
این نسل جدید از رباتهای کوچک یک نگاه به آیندهی رباتیک شخصی و کاربردیتر ارائه میدهد — جایی که رباتها نه فقط ابزار صنعتی، بلکه همراههای روزمرهی ما خواهند بود.
#CES2026 #Robotics #MiniRobots #AI #TechNews 🤖📍
در جدیدترین نمایشگاه فناوری CES 2026، مجموعهای از رباتهای مینیاتوری رونمایی شدهاند که توجه زیادی را به خود جلب کردند — هم بهخاطر طراحی بامزه و هم بهخاطر کاربردهای نوآورانه.
🔹 رباتهای کوچک برای مصارف مختلف:
• سرگرمی و تعامل انسانی
• آموزش و پرورش
• کمکهای کاربردی در خانه
• سرگرمیهای هوشمند
🔹 نکات جالب نمایشگاه:
✔️ برخی از رباتها توانایی حرکتهای پیچیده دارند
✔️ بعضی میتوانند با صدای کاربر تعامل کنند
✔️ برخی مدلها قابلیت توسعه با افزونهها و سنسورها را دارند
این نسل جدید از رباتهای کوچک یک نگاه به آیندهی رباتیک شخصی و کاربردیتر ارائه میدهد — جایی که رباتها نه فقط ابزار صنعتی، بلکه همراههای روزمرهی ما خواهند بود.
#CES2026 #Robotics #MiniRobots #AI #TechNews 🤖📍
This media is not supported in your browser
VIEW IN TELEGRAM
🔁 ادامهی معرفی گجتهای خفن CES 2026
فعلاً هوش مصنوعی میتونه صبر کنه؛ جز LTX-2 چیز خیلی داغی نداشت.
اما این یکی از لنوو واقعاً وسوسهکنندهست 👀💻
🔥 یک لپتاپ که با فشردن فقط یک دکمه:
نمایشگر ۱۶ اینچی ➜ ۲۱ اینچ
و حتی تا ۲۴ اینچ باز میشود!
یعنی یک لپتاپ جمعوجور که در چند ثانیه تبدیل میشود به یک مانیتور کار درست برای: • برنامهنویسی
• طراحی
• تدوین
• مولتیتسکینگ واقعی
تنها سؤال مهمی که باقی میماند: ⚖️ این هیولا دقیقاً چند کیلو وزن دارد؟
اگر وزنش منطقی باشد…
✔️ من یکی قطعاً میگرفتم 😄
@rss_ai_ir
فعلاً هوش مصنوعی میتونه صبر کنه؛ جز LTX-2 چیز خیلی داغی نداشت.
اما این یکی از لنوو واقعاً وسوسهکنندهست 👀💻
🔥 یک لپتاپ که با فشردن فقط یک دکمه:
نمایشگر ۱۶ اینچی ➜ ۲۱ اینچ
و حتی تا ۲۴ اینچ باز میشود!
یعنی یک لپتاپ جمعوجور که در چند ثانیه تبدیل میشود به یک مانیتور کار درست برای: • برنامهنویسی
• طراحی
• تدوین
• مولتیتسکینگ واقعی
تنها سؤال مهمی که باقی میماند: ⚖️ این هیولا دقیقاً چند کیلو وزن دارد؟
اگر وزنش منطقی باشد…
✔️ من یکی قطعاً میگرفتم 😄
@rss_ai_ir
🔥1👏1😁1
✨مدل AceFF: پتانسیل یادگیری ماشین پیشرفته برای مولکولهای کوچک 🧪🤖
مدل AceFF یک مدل جدید Machine Learning Potential برای کشف داروهای مبتنی بر مولکولهای کوچک است که دقت در سطح DFT را با سرعت بسیار بالا ترکیب میکند. این مدل از عناصر کلیدی و حالتهای باردار پشتیبانی میکند و در ارزیابیها بهعنوان State-of-the-Art برای مولکولهای آلی شناخته شده است.
🔬 نکات کلیدی:
دقت همتراز با DFT، مناسب برای شبیهسازیهای سریع
پشتیبانی از حالتهای باردار و عناصر ضروری شیمی آلی
عملکرد برتر در اعتبارسنجیهای تجربی برای مولکولهای کوچک
📄 مقاله: https://arxiv.org/abs/2601.00581
📑 PDF:
https://arxiv.org/pdf/2601.00581
💻 GitHub:
https://github.com/torchmd/torchmd-net
🤗 مدلها:
https://huggingface.co/Acellera/AceFF-2.0
#MachineLearning #DrugDiscovery #ComputationalChemistry #AIforScience #SmallMolecules
@rss_ai_ir
مدل AceFF یک مدل جدید Machine Learning Potential برای کشف داروهای مبتنی بر مولکولهای کوچک است که دقت در سطح DFT را با سرعت بسیار بالا ترکیب میکند. این مدل از عناصر کلیدی و حالتهای باردار پشتیبانی میکند و در ارزیابیها بهعنوان State-of-the-Art برای مولکولهای آلی شناخته شده است.
🔬 نکات کلیدی:
دقت همتراز با DFT، مناسب برای شبیهسازیهای سریع
پشتیبانی از حالتهای باردار و عناصر ضروری شیمی آلی
عملکرد برتر در اعتبارسنجیهای تجربی برای مولکولهای کوچک
📄 مقاله: https://arxiv.org/abs/2601.00581
📑 PDF:
https://arxiv.org/pdf/2601.00581
💻 GitHub:
https://github.com/torchmd/torchmd-net
🤗 مدلها:
https://huggingface.co/Acellera/AceFF-2.0
#MachineLearning #DrugDiscovery #ComputationalChemistry #AIforScience #SmallMolecules
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
✨ روش DiffProxy: بازسازی مش سهبعدی انسان با کمک دیفیوشن و نماهای چندگانه 🧍♂️🧠
روش DiffProxy یک روش جدید برای Human Mesh Recovery است که با استفاده از مدلهای دیفیوشن، «پروکسیهای متراکم» و سازگار بین چند نما تولید میکند. این پروکسیها کمک میکنند فاصله بین دادههای مصنوعی آموزشی و دنیای واقعی پر شود و در نتیجه، تعمیمپذیری مدل بهطور چشمگیری افزایش یابد.
🔬 ایدهی اصلی چیست؟
بهجای تکیه صرف بر دادههای مصنوعی یا تخمین مستقیم مش، DiffProxy ابتدا نمایشهای میانیِ سازگار بین نماها را با دیفیوشن میسازد و سپس از آنها برای بازسازی دقیق مش انسان استفاده میکند.
🚀 نتیجه:
سازگاری بهتر بین نماهای مختلف
تعمیم قویتر به دادههای واقعی
دستیابی به State-of-the-Art روی بنچمارکهای واقعی
📄 مقاله (arXiv):
https://arxiv.org/abs/2601.02267
📑 PDF:
https://arxiv.org/pdf/2601.02267
🌐 Project Page:
https://wrk226.github.io/DiffProxy.html
💻 GitHub:
https://github.com/wrk226/DiffProxy
#AI #ComputerVision #DiffusionModels #HumanMeshRecovery #DeepLearning
@rss_ai_ir
روش DiffProxy یک روش جدید برای Human Mesh Recovery است که با استفاده از مدلهای دیفیوشن، «پروکسیهای متراکم» و سازگار بین چند نما تولید میکند. این پروکسیها کمک میکنند فاصله بین دادههای مصنوعی آموزشی و دنیای واقعی پر شود و در نتیجه، تعمیمپذیری مدل بهطور چشمگیری افزایش یابد.
🔬 ایدهی اصلی چیست؟
بهجای تکیه صرف بر دادههای مصنوعی یا تخمین مستقیم مش، DiffProxy ابتدا نمایشهای میانیِ سازگار بین نماها را با دیفیوشن میسازد و سپس از آنها برای بازسازی دقیق مش انسان استفاده میکند.
🚀 نتیجه:
سازگاری بهتر بین نماهای مختلف
تعمیم قویتر به دادههای واقعی
دستیابی به State-of-the-Art روی بنچمارکهای واقعی
📄 مقاله (arXiv):
https://arxiv.org/abs/2601.02267
📑 PDF:
https://arxiv.org/pdf/2601.02267
🌐 Project Page:
https://wrk226.github.io/DiffProxy.html
💻 GitHub:
https://github.com/wrk226/DiffProxy
#AI #ComputerVision #DiffusionModels #HumanMeshRecovery #DeepLearning
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
📺🔥
چند نسل از نمایشگرهای سهبعدی را از نزدیک دیدهایم،
اما چیزی که سامسونگ در CES 2026 نشان داد، واقعاً کوبنده بود.
اینبار فقط بحث افکت سهبعدی نیست؛
طراحی، کیفیت تصویر و مخصوصاً ضخامت بسیار کم تلویزیون حسابی جلب توجه میکند 👀
بهنظر میرسد سامسونگ بالاخره دارد 3D را از حالت «دموی نمایشی» خارج میکند و به یک محصول جدی و قابل استفاده نزدیک میشود.
باید جزئیات فنیاش را دقیقتر بررسی کرد،
اما در نگاه اول:
👉 بسیار آیندهدار و چشمگیر.
@rss_ai_ir 🎥✨
چند نسل از نمایشگرهای سهبعدی را از نزدیک دیدهایم،
اما چیزی که سامسونگ در CES 2026 نشان داد، واقعاً کوبنده بود.
اینبار فقط بحث افکت سهبعدی نیست؛
طراحی، کیفیت تصویر و مخصوصاً ضخامت بسیار کم تلویزیون حسابی جلب توجه میکند 👀
بهنظر میرسد سامسونگ بالاخره دارد 3D را از حالت «دموی نمایشی» خارج میکند و به یک محصول جدی و قابل استفاده نزدیک میشود.
باید جزئیات فنیاش را دقیقتر بررسی کرد،
اما در نگاه اول:
👉 بسیار آیندهدار و چشمگیر.
@rss_ai_ir 🎥✨
This media is not supported in your browser
VIEW IN TELEGRAM
🍭 بیمصرفترین گجت CES 2026؟ شاید!
یک آبنبات هوشمندِ مجهز به AI که وقتی داخل دهان میگذارید و میمکید، موسیقی را از طریق انتقال ارتعاش در استخوان و بافت نرم به گوش شما میرساند! 😅
در نگاه اول کاملاً عجیب و غیرکاربردی به نظر میرسد…
اما 🤔 شاید صنعت سرگرمی بزرگسالان بتواند برای چنین ایدهای یک کاربرد «خاص» پیدا کند.
گاهی CES فقط درباره آینده نیست؛
درباره این است که بفهمیم کجا دیگر زیادی خلاق شدهایم.
@rss_ai_ir
یک آبنبات هوشمندِ مجهز به AI که وقتی داخل دهان میگذارید و میمکید، موسیقی را از طریق انتقال ارتعاش در استخوان و بافت نرم به گوش شما میرساند! 😅
در نگاه اول کاملاً عجیب و غیرکاربردی به نظر میرسد…
اما 🤔 شاید صنعت سرگرمی بزرگسالان بتواند برای چنین ایدهای یک کاربرد «خاص» پیدا کند.
گاهی CES فقط درباره آینده نیست؛
درباره این است که بفهمیم کجا دیگر زیادی خلاق شدهایم.
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
LUMA RAY 3
Prompt :
Prompt :
Underworld fantasy throne room: A lava-lit throne chamber inside a cavernous underworld fortress. The demon king lounges lazily as his advisors kneel. Molten rivers flow between obsidian columns. The camera glides above the scene, framed like a Renaissance painting in hell.
This media is not supported in your browser
VIEW IN TELEGRAM
✨مدل ExposeAnyone: تشخیص دیپفیک چهره با دقت بالا و بدون نیاز به آموزش قبلی 🕵️♂️🎭
مدل ExposeAnyone یک روش نوآورانه برای تشخیص جعل چهره (Deepfake) است که بر پایهی مدلهای دیفیوژنی خودنظارتی ساخته شده و بدون نیاز به دیدن نمونههای قبلی، میتواند ویدیوهای جعلی را شناسایی کند.
🔍 ایدهی اصلی چگونه است؟ این مدل برای هر فرد بهصورت شخصیسازیشده عمل میکند و با بررسی خطای بازسازی حالات چهره از روی صدا، فاصلهی هویتی را اندازهگیری میکند. هرچه این فاصله بیشتر باشد، احتمال جعلی بودن محتوا بالاتر است.
🚀 چرا مهم است؟
• عملکرد بسیار بهتر نسبت به روشهای قبلی روی دستکاریهای جدید و دیدهنشده
• مقاوم در برابر نویزها و خرابیهای دنیای واقعی
• توانایی تشخیص ویدیوهای جعلی تولیدشده با مدلهای پیشرفته (حتی نسلهای جدید)
• بدون نیاز به دیتاستهای برچسبخوردهی گسترده
📅 تاریخ انتشار: ۵ ژانویه
📄 مقاله:
https://arxiv.org/abs/2601.02359
📄 PDF:
https://arxiv.org/pdf/2601.02359
💻 پروژه / کد:
https://mapooon.github.io/ExposeAnyonePage/
📦 دیتاست مرتبط:
https://huggingface.co/datasets/mapooon/S2CFP
🔐 با گسترش ویدیوهای جعلی، ابزارهایی مثل ExposeAnyone میتوانند ستون فقرات اعتماد دیجیتال در آینده باشند.
@rss_ai_ir
#AI #Deepfake #ComputerVision #DiffusionModels #CyberSecurity
مدل ExposeAnyone یک روش نوآورانه برای تشخیص جعل چهره (Deepfake) است که بر پایهی مدلهای دیفیوژنی خودنظارتی ساخته شده و بدون نیاز به دیدن نمونههای قبلی، میتواند ویدیوهای جعلی را شناسایی کند.
🔍 ایدهی اصلی چگونه است؟ این مدل برای هر فرد بهصورت شخصیسازیشده عمل میکند و با بررسی خطای بازسازی حالات چهره از روی صدا، فاصلهی هویتی را اندازهگیری میکند. هرچه این فاصله بیشتر باشد، احتمال جعلی بودن محتوا بالاتر است.
🚀 چرا مهم است؟
• عملکرد بسیار بهتر نسبت به روشهای قبلی روی دستکاریهای جدید و دیدهنشده
• مقاوم در برابر نویزها و خرابیهای دنیای واقعی
• توانایی تشخیص ویدیوهای جعلی تولیدشده با مدلهای پیشرفته (حتی نسلهای جدید)
• بدون نیاز به دیتاستهای برچسبخوردهی گسترده
📅 تاریخ انتشار: ۵ ژانویه
📄 مقاله:
https://arxiv.org/abs/2601.02359
📄 PDF:
https://arxiv.org/pdf/2601.02359
💻 پروژه / کد:
https://mapooon.github.io/ExposeAnyonePage/
📦 دیتاست مرتبط:
https://huggingface.co/datasets/mapooon/S2CFP
🔐 با گسترش ویدیوهای جعلی، ابزارهایی مثل ExposeAnyone میتوانند ستون فقرات اعتماد دیجیتال در آینده باشند.
@rss_ai_ir
#AI #Deepfake #ComputerVision #DiffusionModels #CyberSecurity
🚀 بیش از ۸۰ ابزار هوش مصنوعی برای انجام کارِ چندماهه در چند دقیقه 🤖⚡️
دیگه لازم نیست برای هر کار ساعتها زمان بذارید. با این ابزارهای AI میتونید سرعت، کیفیت و بهرهوری رو همزمان چند برابر کنید 👇
🔍 تحقیق و جستجو
ChatGPT، Copilot، Gemini، Abacus، Perplexity
🎨 تصویر و گرافیک
Fotor، DALL·E 3، Stability AI، Midjourney، Microsoft Designer
✍️ کپیرایتینگ و متن تبلیغاتی
Rytr، Copy AI، Writesonic، AdCreative AI
📝 نوشتن و ویرایش متن
Jasper، HIX AI، Jenny AI، TextBlaze، Quillbot
🌐 ساخت وبسایت
10Web، Durable، Framer، Style AI
🎬 ویدیو
Klap، Opus، Eightify، InVideo، HeyGen، Runway، ImgCreator AI، Morphstudio
🎧 جلسات و صورتجلسه
TL;DV، Otter، Noty AI، Fireflies
📈 سئو و رشد محتوا
VidIQ، Seona AI، BlogSEO، Keywords AI
💬 چتبات و پشتیبانی
Droxy، Chatbase، Mutual Info، Chatsimple
📊 پرزنتیشن
Decktopus، Slides AI، Gamma AI، Designs AI، Beautiful AI
⚙️ اتوماسیون
Make، Zapier، Xembly، Bardeen
🧠 پرومپت و مهندسی دستور
FlowGPT، Alicent AI، PromptBox، PromptBase، Snack Prompt
🎨 UI/UX و دیزاین
Figma، Uizard، UiMagic، Photoshop
🖌 طراحی عمومی
Canva، Flair AI، Designify، Clipdrop، AutoDraw، Magician
🏷 طراحی لوگو
Looka، Designs AI، Brandmark، Stockimg AI، Namecheap
🎙 صدا و صوت
Lovo AI، ElevenLabs، Songburst AI، Adobe Podcast
📅 بهرهوری و مدیریت کار
Merlin، TinyWow، Notion AI، Adobe Sensei، Personal AI
📱 مدیریت شبکههای اجتماعی
Taplio، Typefully، Hypefury، TweetHunter
✨ اگر هنوز با روشهای قدیمی کار میکنی، داری زمان و انرژی از دست میدی. آینده متعلق به کسیه که بلد باشه از ابزارهای AI درست استفاده کنه.
@rss_ai_ir
#AI #ابزار_هوش_مصنوعی #بهرهوری #اتوماسیون #دیجیتال
دیگه لازم نیست برای هر کار ساعتها زمان بذارید. با این ابزارهای AI میتونید سرعت، کیفیت و بهرهوری رو همزمان چند برابر کنید 👇
🔍 تحقیق و جستجو
ChatGPT، Copilot، Gemini، Abacus، Perplexity
🎨 تصویر و گرافیک
Fotor، DALL·E 3، Stability AI، Midjourney، Microsoft Designer
✍️ کپیرایتینگ و متن تبلیغاتی
Rytr، Copy AI، Writesonic، AdCreative AI
📝 نوشتن و ویرایش متن
Jasper، HIX AI، Jenny AI، TextBlaze، Quillbot
🌐 ساخت وبسایت
10Web، Durable، Framer، Style AI
🎬 ویدیو
Klap، Opus، Eightify، InVideo، HeyGen، Runway، ImgCreator AI، Morphstudio
🎧 جلسات و صورتجلسه
TL;DV، Otter، Noty AI، Fireflies
📈 سئو و رشد محتوا
VidIQ، Seona AI، BlogSEO، Keywords AI
💬 چتبات و پشتیبانی
Droxy، Chatbase، Mutual Info، Chatsimple
📊 پرزنتیشن
Decktopus، Slides AI، Gamma AI، Designs AI، Beautiful AI
⚙️ اتوماسیون
Make، Zapier، Xembly، Bardeen
🧠 پرومپت و مهندسی دستور
FlowGPT، Alicent AI، PromptBox، PromptBase، Snack Prompt
🎨 UI/UX و دیزاین
Figma، Uizard، UiMagic، Photoshop
🖌 طراحی عمومی
Canva، Flair AI، Designify، Clipdrop، AutoDraw، Magician
🏷 طراحی لوگو
Looka، Designs AI، Brandmark، Stockimg AI، Namecheap
🎙 صدا و صوت
Lovo AI، ElevenLabs، Songburst AI، Adobe Podcast
📅 بهرهوری و مدیریت کار
Merlin، TinyWow، Notion AI، Adobe Sensei، Personal AI
📱 مدیریت شبکههای اجتماعی
Taplio، Typefully، Hypefury، TweetHunter
✨ اگر هنوز با روشهای قدیمی کار میکنی، داری زمان و انرژی از دست میدی. آینده متعلق به کسیه که بلد باشه از ابزارهای AI درست استفاده کنه.
@rss_ai_ir
#AI #ابزار_هوش_مصنوعی #بهرهوری #اتوماسیون #دیجیتال
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 مجموعه ASUS از عینک گیمینگ ROG XREAL R1 رونمایی کرد 🔥👓
اولین عینک گیمینگ دنیا با نمایشگر micro-OLED و نرخ نوسازی 240Hz، ساختهشده با همکاری XREAL. مشخصاتش واقعاً دیوانهکنندهست 👇
🎮 ویژگیهای کلیدی:
🖥 نمایشگر مجازی 171 اینچ از فاصله 4 متری
🌐 میدان دید 57 درجه (FOV)
⚡️ پنلهای 1080p micro-OLED با نرخ 240Hz
🧭 حالتهای 3DoF Anchor Mode و Follow Mode
🪶 وزن فوقسبک: فقط 91 گرم
🔊 صدای تنظیمشده توسط Bose
🕶 لنزهای الکتروکرومیک (تنظیم هوشمند نور)
🎛و ROG Control Dock داخل جعبه:
2× HDMI 2.0
1× DisplayPort 1.4
🔌 سازگاری گسترده: PC، کنسولها، هندلدها، اندروید و iOS از طریق USB-C
📅 زمان عرضه: نیمه اول 2026
💰 قیمت: هنوز اعلام نشده
بهنظر میاد آیندهی گیمینگ شخصی، نه مانیتوره نه تلویزیون… بلکه روی صورتمونه 😎🔥
@rss_ai_ir
#ASUS #ROG #XREAL #AR #Gaming #MicroOLED #Tech
اولین عینک گیمینگ دنیا با نمایشگر micro-OLED و نرخ نوسازی 240Hz، ساختهشده با همکاری XREAL. مشخصاتش واقعاً دیوانهکنندهست 👇
🎮 ویژگیهای کلیدی:
🖥 نمایشگر مجازی 171 اینچ از فاصله 4 متری
🌐 میدان دید 57 درجه (FOV)
⚡️ پنلهای 1080p micro-OLED با نرخ 240Hz
🧭 حالتهای 3DoF Anchor Mode و Follow Mode
🪶 وزن فوقسبک: فقط 91 گرم
🔊 صدای تنظیمشده توسط Bose
🕶 لنزهای الکتروکرومیک (تنظیم هوشمند نور)
🎛و ROG Control Dock داخل جعبه:
2× HDMI 2.0
1× DisplayPort 1.4
🔌 سازگاری گسترده: PC، کنسولها، هندلدها، اندروید و iOS از طریق USB-C
📅 زمان عرضه: نیمه اول 2026
💰 قیمت: هنوز اعلام نشده
بهنظر میاد آیندهی گیمینگ شخصی، نه مانیتوره نه تلویزیون… بلکه روی صورتمونه 😎🔥
@rss_ai_ir
#ASUS #ROG #XREAL #AR #Gaming #MicroOLED #Tech
✨ مدل MOSS Transcribe Diarize: رونویسی دقیق همراه با تفکیک گوینده 🎙️🧠
مدل MOSS Transcribe Diarize یک مدل چندوجهی یکپارچه است که برای رونویسی انتهابهانتها با تشخیص گوینده (Speaker Diarization) طراحی شده؛ آن هم با برچسب زمانی دقیق و پنجرهی کانتکست بسیار بلند.
🔍 چه چیزی آن را متمایز میکند؟
🗣 تشخیص خودکار گویندهها در مکالمات چندنفره
⏱ تولید متن همراه با تایماستمپ دقیق
🧠 پنجرهی کانتکست طولانی برای مکالمات و جلسات طولانی
📊 تعمیمپذیری قوی روی بنچمارکهای مختلف
🔗 یک مدل واحد برای ASR + Diarization (بدون پایپلاینهای پیچیده)
این مدل برای کاربردهایی مثل: جلسات کاری، پادکستها، مصاحبهها، تماسهای تلفنی و آرشیو صوتی بسیار ایدهآل است.
📅 تاریخ انتشار: ۴ ژانویه
📄 مقاله:
arXiv: https://arxiv.org/abs/2601.01554
PDF: https://arxiv.org/pdf/2601.01554
🌐 صفحه پروژه:
https://mosi.cn/models/moss-transcribe-diarize
🤗 دمو در Hugging Face:
https://huggingface.co/spaces/OpenMOSS-Team/MOSS-transcribe-diarize
@rss_ai_ir
#AI #SpeechRecognition #Diarization #MachineLearning #ASR
مدل MOSS Transcribe Diarize یک مدل چندوجهی یکپارچه است که برای رونویسی انتهابهانتها با تشخیص گوینده (Speaker Diarization) طراحی شده؛ آن هم با برچسب زمانی دقیق و پنجرهی کانتکست بسیار بلند.
🔍 چه چیزی آن را متمایز میکند؟
🗣 تشخیص خودکار گویندهها در مکالمات چندنفره
⏱ تولید متن همراه با تایماستمپ دقیق
🧠 پنجرهی کانتکست طولانی برای مکالمات و جلسات طولانی
📊 تعمیمپذیری قوی روی بنچمارکهای مختلف
🔗 یک مدل واحد برای ASR + Diarization (بدون پایپلاینهای پیچیده)
این مدل برای کاربردهایی مثل: جلسات کاری، پادکستها، مصاحبهها، تماسهای تلفنی و آرشیو صوتی بسیار ایدهآل است.
📅 تاریخ انتشار: ۴ ژانویه
📄 مقاله:
arXiv: https://arxiv.org/abs/2601.01554
PDF: https://arxiv.org/pdf/2601.01554
🌐 صفحه پروژه:
https://mosi.cn/models/moss-transcribe-diarize
🤗 دمو در Hugging Face:
https://huggingface.co/spaces/OpenMOSS-Team/MOSS-transcribe-diarize
@rss_ai_ir
#AI #SpeechRecognition #Diarization #MachineLearning #ASR
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣5🔥1😁1
🔔شرکت OpenAI قابلیت جدید «Health» را معرفی کرد
این قابلیت به کاربران اجازه میدهد بهصورت امن سوابق پزشکی و اپهای سلامت خود را به ChatGPT متصل کنند تا راهنماییهای شخصیسازیشده و مبتنی بر زمینه واقعی دریافت کنند.
تمرکز اصلی این ویژگی:
📊 توضیح روندهای سلامتی و تغییرات بدن
🩺 آمادگی بهتر برای ویزیت پزشک
🏃♂️ برنامهریزی تناسباندام و تغذیه
💳 کمک در تصمیمگیریهای مرتبط با بیمه درمانی
این حرکت میتواند بسیار بزرگ باشد و یکی از مهمترین بازارها را برای OpenAI باز کند. همانطور که مشخص است، کاربران بیشتری از ChatGPT برای مسائل مرتبط با سلامت استفاده میکنند.
منبع
@rss_ai_ir 🏴
این قابلیت به کاربران اجازه میدهد بهصورت امن سوابق پزشکی و اپهای سلامت خود را به ChatGPT متصل کنند تا راهنماییهای شخصیسازیشده و مبتنی بر زمینه واقعی دریافت کنند.
تمرکز اصلی این ویژگی:
📊 توضیح روندهای سلامتی و تغییرات بدن
🩺 آمادگی بهتر برای ویزیت پزشک
🏃♂️ برنامهریزی تناسباندام و تغذیه
💳 کمک در تصمیمگیریهای مرتبط با بیمه درمانی
این حرکت میتواند بسیار بزرگ باشد و یکی از مهمترین بازارها را برای OpenAI باز کند. همانطور که مشخص است، کاربران بیشتری از ChatGPT برای مسائل مرتبط با سلامت استفاده میکنند.
منبع
@rss_ai_ir 🏴