This media is not supported in your browser
VIEW IN TELEGRAM
🧬 گوگل عامل هوشمند Gemini Agent را منتشر کرد
فعلاً:
فقط در آمریکا
فقط با اشتراک Ultra به قیمت ۲۵۰ دلار
Gemini Agent
بهصورت یک عامل هوشمند از طرف کاربر داخل مرورگر عمل میکند و میتواند:
اطلاعات جمعآوری کند
قیمتها را مقایسه کند
هتل، خودرو و خدمات مختلف را رزرو کند
این عامل بر پایه Gemini 3 ساخته شده و:
هم روی دسکتاپ
و هم در اپلیکیشنهای موبایل کار میکند
در عمل، گوگل یک قدم دیگر به سمت AI Agentهای واقعی برداشته؛ عاملهایی که فقط جواب نمیدهند، بلکه کار انجام میدهند و نقش دستیار اجرایی دیجیتال را میگیرند.
🧩
فعلاً:
فقط در آمریکا
فقط با اشتراک Ultra به قیمت ۲۵۰ دلار
Gemini Agent
بهصورت یک عامل هوشمند از طرف کاربر داخل مرورگر عمل میکند و میتواند:
اطلاعات جمعآوری کند
قیمتها را مقایسه کند
هتل، خودرو و خدمات مختلف را رزرو کند
این عامل بر پایه Gemini 3 ساخته شده و:
هم روی دسکتاپ
و هم در اپلیکیشنهای موبایل کار میکند
در عمل، گوگل یک قدم دیگر به سمت AI Agentهای واقعی برداشته؛ عاملهایی که فقط جواب نمیدهند، بلکه کار انجام میدهند و نقش دستیار اجرایی دیجیتال را میگیرند.
🧩
🥰1
🧬 В ChatGPT появился каталог приложений
Раньше Google Диск, Photoshop и остальные приложения прятали в разделе настроек «Connectors». Теперь их вынесли в раздел https://chatgpt.com/apps. Там приложения можно подключить и запускать в чате через @.
Разработчики могут отправлять заявки на добавление своих приложений. Есть SDK. Разрешена монетизация.
🧩 #AINews
Раньше Google Диск, Photoshop и остальные приложения прятали в разделе настроек «Connectors». Теперь их вынесли в раздел https://chatgpt.com/apps. Там приложения можно подключить и запускать в чате через @.
Разработчики могут отправлять заявки на добавление своих приложений. Есть SDK. Разрешена монетизация.
🧩 #AINews
🧬 کاتالوگ اپلیکیشنها به ChatGPT اضافه شد
قبلاً اتصال سرویسهایی مثل Google Drive و Photoshop داخل بخش تنظیمات و قسمت «Connectors» مخفی بود، اما حالا همه آنها به یک بخش جدا منتقل شدهاند: https://chatgpt.com/apps
در این بخش میتوانید اپلیکیشنها را وصل کنید و مستقیماً داخل چت با دستور @ اجراشان کنید.
توسعهدهندهها هم میتوانند برای اضافهکردن اپهای خود درخواست بدهند. SDK در دسترس است و امکان کسب درآمد (Monetization) هم فراهم شده است.
🧩 #AINews
قبلاً اتصال سرویسهایی مثل Google Drive و Photoshop داخل بخش تنظیمات و قسمت «Connectors» مخفی بود، اما حالا همه آنها به یک بخش جدا منتقل شدهاند: https://chatgpt.com/apps
در این بخش میتوانید اپلیکیشنها را وصل کنید و مستقیماً داخل چت با دستور @ اجراشان کنید.
توسعهدهندهها هم میتوانند برای اضافهکردن اپهای خود درخواست بدهند. SDK در دسترس است و امکان کسب درآمد (Monetization) هم فراهم شده است.
🧩 #AINews
ChatGPT
ChatGPT Apps | Browse and chat with your favorite apps in ChatGPT
Discover and connect powerful apps like Canva, Photoshop, and Zillow to create, learn, and do more right in your ChatGPT conversations.
🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
از حرکات نرم و هماهنگ تایچی تا جنبوجوش پرانرژی رقصهای خیابانی، ربات DR02 از شرکت DEEP Robotics انعطافپذیری خیرهکنندهای را به نمایش میگذارد.
این ربات با ترکیب دقت، قدرت و مهارت، بهراحتی از پس انواع حرکات مختلف برمیآید و چابکی و کنترل فوقالعادهاش را در عمل نشان میدهد.
#رباتها_در_اطراف
این ربات با ترکیب دقت، قدرت و مهارت، بهراحتی از پس انواع حرکات مختلف برمیآید و چابکی و کنترل فوقالعادهاش را در عمل نشان میدهد.
#رباتها_در_اطراف
❤1
Media is too big
VIEW IN TELEGRAM
✅ اوپنایآی به Nano Banana پاسخ داد: GPT Images
اوپنایآی مدل جدید تولید و ویرایش تصویر خود را معرفی کرد تا مستقیم با رقبای پرسرعتی مثل Nano Banana رقابت کند.
• خروجیهای فوتورئالیستیک با پیروی بهتر از دستورها، بهخصوص در پرامپتهای پیچیده
• تمرکز ویژه روی ویرایش چندمرحلهای تصاویر بدون تغییر چهره، هویت یا عناصر مشخص
• تولید تصویر تا ۴ برابر سریعتر شده، مناسب جریانهای خلاقانه و کارهای بلادرنگ
• در ChatGPT Images، مدل برای همه کاربران در دسترس است (محدودیت استفاده وجود دارد اما هنوز دقیق مشخص نشده)
• برای توسعهدهندگان، GPT Image 1.5 در API منتشر شده، یک مدل آماده تولید واقعی و نه فقط نسخه آزمایشی
اوپنایآی واضحاً تولید تصویر را بهعنوان زیرساخت اصلی، نه یک قابلیت فرعی، در نظر گرفته است.
اوپنایآی مدل جدید تولید و ویرایش تصویر خود را معرفی کرد تا مستقیم با رقبای پرسرعتی مثل Nano Banana رقابت کند.
• خروجیهای فوتورئالیستیک با پیروی بهتر از دستورها، بهخصوص در پرامپتهای پیچیده
• تمرکز ویژه روی ویرایش چندمرحلهای تصاویر بدون تغییر چهره، هویت یا عناصر مشخص
• تولید تصویر تا ۴ برابر سریعتر شده، مناسب جریانهای خلاقانه و کارهای بلادرنگ
• در ChatGPT Images، مدل برای همه کاربران در دسترس است (محدودیت استفاده وجود دارد اما هنوز دقیق مشخص نشده)
• برای توسعهدهندگان، GPT Image 1.5 در API منتشر شده، یک مدل آماده تولید واقعی و نه فقط نسخه آزمایشی
اوپنایآی واضحاً تولید تصویر را بهعنوان زیرساخت اصلی، نه یک قابلیت فرعی، در نظر گرفته است.
❤2
🧬 اوپنایآی GPT-5 را وارد یک آزمایشگاه زیستشناسی واقعی کرد و کلونینگ DNA را ۷۹ برابر کارآمدتر ساخت
اوپنایآی اولین آزمایش از نوع خود را با GPT-5 در یک آزمایشگاه واقعی انجام داد، جایی که مدل در یک حلقه بسته با دانشمندان Red Queen Bio کار میکرد تا فرآیند اصلی زیستشناسی مولکولی را بهینهسازی کند.
• این یک شبیهسازی نبود. GPT-5 فرضیهها و پروتکلها را پیشنهاد داد، انسانها و رباتهای آزمایشگاه آنها را اجرا کردند، نتایج واقعی زیستی اندازهگیری شد و به مدل برای تکرار بعدی داده شد.
• وظیفه: Gibson Assembly، یک تکنیک استاندارد کلونینگ DNA. معیار بهینهسازی ساده و عینی بود: تعداد کلونیهای موفق.
• معمولاً بهینهسازی Gibson Assembly سخت و زمانبر است و فقط ۲–۳ برابر بهبود ایجاد میکند.
• طی چند چرخه آزمایشی، GPT-5 کارایی را ۷۹ برابر افزایش داد، با نتایج پایدار و قابل تکرار.
اوپنایآی اولین آزمایش از نوع خود را با GPT-5 در یک آزمایشگاه واقعی انجام داد، جایی که مدل در یک حلقه بسته با دانشمندان Red Queen Bio کار میکرد تا فرآیند اصلی زیستشناسی مولکولی را بهینهسازی کند.
• این یک شبیهسازی نبود. GPT-5 فرضیهها و پروتکلها را پیشنهاد داد، انسانها و رباتهای آزمایشگاه آنها را اجرا کردند، نتایج واقعی زیستی اندازهگیری شد و به مدل برای تکرار بعدی داده شد.
• وظیفه: Gibson Assembly، یک تکنیک استاندارد کلونینگ DNA. معیار بهینهسازی ساده و عینی بود: تعداد کلونیهای موفق.
• معمولاً بهینهسازی Gibson Assembly سخت و زمانبر است و فقط ۲–۳ برابر بهبود ایجاد میکند.
• طی چند چرخه آزمایشی، GPT-5 کارایی را ۷۹ برابر افزایش داد، با نتایج پایدار و قابل تکرار.
❤2
🍏 اپل قصد دارد آیفون تاشو بدون خط وسط قابل مشاهده بسازد
بزرگترین ضعف گوشیهای تاشو فعلی، خطی است که در مرکز نمایشگر ایجاد میشود. حتی پس از چند نسل از Galaxy Z Fold سامسونگ، این خط هنوز کاملاً از بین نرفته است؛ کاربران ممکن است به آن عادت کنند، اما در نور خاص یا رنگهای صاف، همچنان واضح است.
🔸 طبق گزارش Digital Chat Station، هدف اپل این است که خط وسط کاملاً نامرئی شود، نه فقط کمتر قابل مشاهده.
🔸 برای رسیدن به این هدف، اپل با UFG (Ultra-thin Flexible Glass) آزمایش میکند، به جای فیلمهای پلیمری که در اکثر تاشوهای فعلی استفاده میشوند.
🔸 لایههای پلیمری نرم و انعطافپذیرند و با گذشت زمان در محل تا شدن فشرده میشوند، به همین دلیل خط تاشو شکل میگیرد و عمیق میشود. در مقابل، UFG شیشه واقعی با ضخامت ۳۰–۵۰ میکرون است که سختتر، مقاومتر در برابر خراش و نظریهً قادر به صاف ماندن طولانیمدت است.
🔸 چالش اصلی دوام است. شیشه با این ضخامت باید هزاران بار تا شود بدون ترک خوردن، که اپل را مجبور میکند بین ضخامت، انعطافپذیری و قابلیت اطمینان بلندمدت تعادل دقیقی برقرار کند..
بزرگترین ضعف گوشیهای تاشو فعلی، خطی است که در مرکز نمایشگر ایجاد میشود. حتی پس از چند نسل از Galaxy Z Fold سامسونگ، این خط هنوز کاملاً از بین نرفته است؛ کاربران ممکن است به آن عادت کنند، اما در نور خاص یا رنگهای صاف، همچنان واضح است.
🔸 طبق گزارش Digital Chat Station، هدف اپل این است که خط وسط کاملاً نامرئی شود، نه فقط کمتر قابل مشاهده.
🔸 برای رسیدن به این هدف، اپل با UFG (Ultra-thin Flexible Glass) آزمایش میکند، به جای فیلمهای پلیمری که در اکثر تاشوهای فعلی استفاده میشوند.
🔸 لایههای پلیمری نرم و انعطافپذیرند و با گذشت زمان در محل تا شدن فشرده میشوند، به همین دلیل خط تاشو شکل میگیرد و عمیق میشود. در مقابل، UFG شیشه واقعی با ضخامت ۳۰–۵۰ میکرون است که سختتر، مقاومتر در برابر خراش و نظریهً قادر به صاف ماندن طولانیمدت است.
🔸 چالش اصلی دوام است. شیشه با این ضخامت باید هزاران بار تا شود بدون ترک خوردن، که اپل را مجبور میکند بین ضخامت، انعطافپذیری و قابلیت اطمینان بلندمدت تعادل دقیقی برقرار کند..
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 یک «موتور جستجوی فوقالعاده» جدید برای ابزارهای هوش مصنوعی وعده میدهد که همهچیز را ساده کند
یک موتور جستجوی جدید مبتنی بر هوش مصنوعی ظاهر شده که هدفش حل یکی از بزرگترین مشکلات اکوسیستم AI است: پیدا کردن ابزار مناسب بین صدها مدل و سرویس.
🔸 از جستجوی برداری سریع استفاده میکند، بنابراین به جای کلیدواژهها، وظیفه خود را توصیف میکنید و سیستم شما را با مناسبترین ابزارهای هوش مصنوعی مطابقت میدهد.
🔸 پلتفرم از یک پایگاه داده بزرگ و بهطور مداوم بهروز شده از شبکههای عصبی و سرویسهای AI استفاده میکند و امکان کشف و اجرای سریع ابزار مناسب را با یک کلیک فراهم میکند.
🔸 در پشت صحنه، مدلهای زبان پیشرفتهای وجود دارند که از پرسوجوهای کاربران یاد میگیرند و با استفاده بیشتر سیستم، توصیهها دقیقتر میشوند.
🔸 رابط کاربری عمداً ساده و شهودی طراحی شده است تا اصطکاک را حذف کند و لایهای اضافی از پیچیدگی ایجاد نکند.
🔸 نیاز به نصب، افزونه یا محدودیت مصنوعی نیست؛ فقط جستجو کنید، ابزار را انتخاب کنید و کارتان را شروع کنید.
یک موتور جستجوی جدید مبتنی بر هوش مصنوعی ظاهر شده که هدفش حل یکی از بزرگترین مشکلات اکوسیستم AI است: پیدا کردن ابزار مناسب بین صدها مدل و سرویس.
🔸 از جستجوی برداری سریع استفاده میکند، بنابراین به جای کلیدواژهها، وظیفه خود را توصیف میکنید و سیستم شما را با مناسبترین ابزارهای هوش مصنوعی مطابقت میدهد.
🔸 پلتفرم از یک پایگاه داده بزرگ و بهطور مداوم بهروز شده از شبکههای عصبی و سرویسهای AI استفاده میکند و امکان کشف و اجرای سریع ابزار مناسب را با یک کلیک فراهم میکند.
🔸 در پشت صحنه، مدلهای زبان پیشرفتهای وجود دارند که از پرسوجوهای کاربران یاد میگیرند و با استفاده بیشتر سیستم، توصیهها دقیقتر میشوند.
🔸 رابط کاربری عمداً ساده و شهودی طراحی شده است تا اصطکاک را حذف کند و لایهای اضافی از پیچیدگی ایجاد نکند.
🔸 نیاز به نصب، افزونه یا محدودیت مصنوعی نیست؛ فقط جستجو کنید، ابزار را انتخاب کنید و کارتان را شروع کنید.
👍1🥰1
Hugging Face
یک مجموعه فوقالعاده از ۱۲
دوره رایگان در داغترین حوزههای AI منتشر کرده؛ محتوایی که اگر دست بعضیها بود، بابتش صدها میلیون تومان میگرفتند.
اینجا همهچیز هست: از ساخت ایجنتهای خودمختار تا آموزش رباتها 👇
🔹 AI Agents
مبانی داغترین موضوع سال: یاد میگیرید ایجنتهای خودمختار بسازید.
🔹 LLM Course
مغز چتباتهای مدرن چطور کار میکند؟ آموزش کامل مدلهای زبانی بزرگ و کتابخانههایی مثل Transformers.
🔹 Smol Course
وقت کم دارید؟ سریعترین مسیر برای فهم و انجام Fine-tuning مدلها.
🔹 MCP Course
دورهای جدید با همکاری Anthropic؛ یاد میگیرید هوش مصنوعی را به هر نوع دادهای وصل کنید.
🔹 Deep Reinforcement Learning
همهچیز درباره یادگیری تقویتی عمیق؛ همان چیزی که رباتها و مدلهایی مثل OpenAI o1 با آن آموزش میبینند.
🔹 Machine Learning for Games
چطور شبکههای عصبی را مستقیم وارد بازیسازی کنیم.
🔹 Robotics
مسیر کامل از رباتهای کلاسیک تا رباتهای مبتنی بر شبکههای عصبی.
🔹 Computer Vision
آموزش دید ماشین؛ اینکه AI چطور تصاویر را ببیند و بفهمد.
یک مجموعه فوقالعاده از ۱۲
دوره رایگان در داغترین حوزههای AI منتشر کرده؛ محتوایی که اگر دست بعضیها بود، بابتش صدها میلیون تومان میگرفتند.
اینجا همهچیز هست: از ساخت ایجنتهای خودمختار تا آموزش رباتها 👇
🔹 AI Agents
مبانی داغترین موضوع سال: یاد میگیرید ایجنتهای خودمختار بسازید.
🔹 LLM Course
مغز چتباتهای مدرن چطور کار میکند؟ آموزش کامل مدلهای زبانی بزرگ و کتابخانههایی مثل Transformers.
🔹 Smol Course
وقت کم دارید؟ سریعترین مسیر برای فهم و انجام Fine-tuning مدلها.
🔹 MCP Course
دورهای جدید با همکاری Anthropic؛ یاد میگیرید هوش مصنوعی را به هر نوع دادهای وصل کنید.
🔹 Deep Reinforcement Learning
همهچیز درباره یادگیری تقویتی عمیق؛ همان چیزی که رباتها و مدلهایی مثل OpenAI o1 با آن آموزش میبینند.
🔹 Machine Learning for Games
چطور شبکههای عصبی را مستقیم وارد بازیسازی کنیم.
🔹 Robotics
مسیر کامل از رباتهای کلاسیک تا رباتهای مبتنی بر شبکههای عصبی.
🔹 Computer Vision
آموزش دید ماشین؛ اینکه AI چطور تصاویر را ببیند و بفهمد.
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 وای! دیگر موشنکپچر لازم نیست — یک پلاگین خفن برای Blender منتشر شده که تصویر وبکم یا ویدئو را مستقیم به انیمیشن تبدیل میکند
این پلاگین بدون تجهیزات حرفهای موشنکپچر، فقط با وبکم یا فایل ویدئویی، حرکت بدن را استخراج کرده و به انیمیشن قابل استفاده در Blender تبدیل میکند.
🔹 پردازش کاملاً لوکال انجام میشود (بدون ارسال داده به سرور)
🔹 حداقل ۸ گیگابایت VRAM نیاز دارد
🔹 مناسب برای انیمیشن، گیمدولوپمنت، فیلم کوتاه و تولید محتوا
📌 ابزار ضبط حرکات: لینک برنامه
📌 پلاگین و راهنما برای Unreal Engine: موجود
📌 پلاگین و راهنما برای Unity: موجود
اگر با Blender، Unreal یا Unity کار میکنید، این ابزار میتواند هزینه و زمان موشنکپچر را عملاً به صفر برساند 🎥🕺
🧩 #کاتالوگ_نرواسکریپتها
این پلاگین بدون تجهیزات حرفهای موشنکپچر، فقط با وبکم یا فایل ویدئویی، حرکت بدن را استخراج کرده و به انیمیشن قابل استفاده در Blender تبدیل میکند.
🔹 پردازش کاملاً لوکال انجام میشود (بدون ارسال داده به سرور)
🔹 حداقل ۸ گیگابایت VRAM نیاز دارد
🔹 مناسب برای انیمیشن، گیمدولوپمنت، فیلم کوتاه و تولید محتوا
📌 ابزار ضبط حرکات: لینک برنامه
📌 پلاگین و راهنما برای Unreal Engine: موجود
📌 پلاگین و راهنما برای Unity: موجود
اگر با Blender، Unreal یا Unity کار میکنید، این ابزار میتواند هزینه و زمان موشنکپچر را عملاً به صفر برساند 🎥🕺
🧩 #کاتالوگ_نرواسکریپتها
🎬 Kandinsky 5.0 Video
وارد میدان text-to-video شد
نتایج مدلهای Kandinsky 5.0 Video Lite و Pro در آرنای مقایسهای منتشر شدهاند.
🔹 نسخه Pro در حال حاضر رتبه ۱ در میان مدلهای متنباز دنیا را دارد.
🔹 در مقایسه کلی، نسخه Pro هنوز از مدلهای SOTA شرکتهایی مثل Google، OpenAI، Alibaba و KlingAI عقبتر است،
اما عملاً به Luma Ray 3 و Minimax Hailuo 2.3 رسیده است
(اختلاف ELO حداکثر ۳ امتیاز، با بازه اطمینان ۹۵٪ حدود ±۲۱ امتیاز).
🔹 نسخه Lite با تنها ۲ میلیارد پارامتر حتی از نسخه اول Sora هم عملکرد بهتری نشان داده است.
📌 نکته مهم:
حضور یک مدل مولد ویدیویی روسی در عرصه بینالمللی و رقابت واقعی با بازیگران بزرگ، اتفاقی نادر و تا حدی غیرمنتظره محسوب میشود.
⚙️ مشخصات فنی:
معماری: DiT با ۱۹ میلیارد پارامتر و کراساتنشن روی متن
VAE مبتنی بر HunyuanVideo
خروجی: ویدیو ۵ یا ۱۰ ثانیهای
فریمریت: 24fps
رزولوشن: HD (1280×768)
وارد میدان text-to-video شد
نتایج مدلهای Kandinsky 5.0 Video Lite و Pro در آرنای مقایسهای منتشر شدهاند.
🔹 نسخه Pro در حال حاضر رتبه ۱ در میان مدلهای متنباز دنیا را دارد.
🔹 در مقایسه کلی، نسخه Pro هنوز از مدلهای SOTA شرکتهایی مثل Google، OpenAI، Alibaba و KlingAI عقبتر است،
اما عملاً به Luma Ray 3 و Minimax Hailuo 2.3 رسیده است
(اختلاف ELO حداکثر ۳ امتیاز، با بازه اطمینان ۹۵٪ حدود ±۲۱ امتیاز).
🔹 نسخه Lite با تنها ۲ میلیارد پارامتر حتی از نسخه اول Sora هم عملکرد بهتری نشان داده است.
📌 نکته مهم:
حضور یک مدل مولد ویدیویی روسی در عرصه بینالمللی و رقابت واقعی با بازیگران بزرگ، اتفاقی نادر و تا حدی غیرمنتظره محسوب میشود.
⚙️ مشخصات فنی:
معماری: DiT با ۱۹ میلیارد پارامتر و کراساتنشن روی متن
VAE مبتنی بر HunyuanVideo
خروجی: ویدیو ۵ یا ۱۰ ثانیهای
فریمریت: 24fps
رزولوشن: HD (1280×768)
Media is too big
VIEW IN TELEGRAM
🍌 Qwen-Image-Edit-2511:
نانو بنانای Qwen هم از راه رسید
حالا Qwen هم مدل ویرایش تصویر قدرتمند خودش را معرفی کرده؛ مدلی که از نظر قابلیتها همسطح نمونههای Google، OpenAI و Flux است. خبر خوبتر اینکه این ریلیز تحت لایسنس Apache 2.0 منتشر شده و کاملاً اوپنسورس است.
این نسخه در واقع یک بهروزرسانی از Qwen Image Edit قدیمی محسوب میشود؛ مدلی که الهامگرفته از Flux Kontext بوده است.
✨ نکتهی برجسته مدل
قابلیتهایی که معمولاً با LoRAهای محبوب به دست میآمدند (مثل بهبود نورپردازی، تغییر زاویه دید و پرسپکتیو) مستقیماً داخل خود مدل پایه ادغام شدهاند.
علاوه بر این، مدل بهطور خاص برای کاربردهای واقعی طراحی آموزش دیده، مثل:
تولید نمای ایزومتریک
تغییر متریال در تصاویر
در این زمینهها Nano Banana هم خوب عمل میکند، اما مزیت اصلی Qwen این است که لوکال و متنباز است.
⚡ عملکرد و سرعت
از روز اول با LightX2V سازگار است (حدود ۱.۴ برابر سریعتر)
در ترکیب با Distillation و FP8، وعدهی افزایش سرعت تا ۴۲ برابر داده شده است
نانو بنانای Qwen هم از راه رسید
حالا Qwen هم مدل ویرایش تصویر قدرتمند خودش را معرفی کرده؛ مدلی که از نظر قابلیتها همسطح نمونههای Google، OpenAI و Flux است. خبر خوبتر اینکه این ریلیز تحت لایسنس Apache 2.0 منتشر شده و کاملاً اوپنسورس است.
این نسخه در واقع یک بهروزرسانی از Qwen Image Edit قدیمی محسوب میشود؛ مدلی که الهامگرفته از Flux Kontext بوده است.
✨ نکتهی برجسته مدل
قابلیتهایی که معمولاً با LoRAهای محبوب به دست میآمدند (مثل بهبود نورپردازی، تغییر زاویه دید و پرسپکتیو) مستقیماً داخل خود مدل پایه ادغام شدهاند.
علاوه بر این، مدل بهطور خاص برای کاربردهای واقعی طراحی آموزش دیده، مثل:
تولید نمای ایزومتریک
تغییر متریال در تصاویر
در این زمینهها Nano Banana هم خوب عمل میکند، اما مزیت اصلی Qwen این است که لوکال و متنباز است.
⚡ عملکرد و سرعت
از روز اول با LightX2V سازگار است (حدود ۱.۴ برابر سریعتر)
در ترکیب با Distillation و FP8، وعدهی افزایش سرعت تا ۴۲ برابر داده شده است
Forwarded from نشریه فرامتن
در این مسیر از کمکهای همیشگی دکتر مینا امیری و همکاری نویسندههای فعال این حوزه یاری گرفتیم!
منتظر نسخه دوم از سری ویژهنامههای هوش مصنوعی باشید
مرسی از همراهی همیشگیتون
[
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from نشریه فرامتن
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
در چین بهطور گسترده «مدارس رباتها» در حال راهاندازی هستند؛ جایی که رباتهای انساننما را برای کار در کارخانهها و حتی بهعنوان دستیار خانگی آموزش میدهند.
به این رباتها یاد میدهند بستهها را آماده کنند، غذا بپزند، نظافت انجام دهند و کارهای روزمرهٔ خانه را انجام دهند.
برای هر ربات حداقل دو انسان ناظر حضور دارند که حرکاتش را اصلاح میکنند و به آن کمک میکنند سناریوهای درست انجام کارها را یاد بگیرد. هدف اصلی کاملاً مشخص است: جبران کمبود دادههای آموزشی برای هوش مصنوعی.
بهترین «فارغالتحصیلان» مستقیماً به کارخانههای واقعی فرستاده میشوند. دورهٔ کارآموزی تمام شده؛ حالا زندگی واقعیِ یک ربات آغاز میشود. 🤖
به این رباتها یاد میدهند بستهها را آماده کنند، غذا بپزند، نظافت انجام دهند و کارهای روزمرهٔ خانه را انجام دهند.
برای هر ربات حداقل دو انسان ناظر حضور دارند که حرکاتش را اصلاح میکنند و به آن کمک میکنند سناریوهای درست انجام کارها را یاد بگیرد. هدف اصلی کاملاً مشخص است: جبران کمبود دادههای آموزشی برای هوش مصنوعی.
بهترین «فارغالتحصیلان» مستقیماً به کارخانههای واقعی فرستاده میشوند. دورهٔ کارآموزی تمام شده؛ حالا زندگی واقعیِ یک ربات آغاز میشود. 🤖