👑 مدل جدید GPT-5.2 در تمام بنچمارکها از Gemini 3 پیشی گرفت
تنها چند روز پس از اعلام «وضعیت قرمز» در OpenAI، این شرکت مدل جدید GPT-5.2 را عرضه کرد که در تمام بنچمارکهای هوش و استدلال، رقیب خود Gemini 3 Pro گوگل را پشت سر گذاشته است.
✍🏻 نکات کلیدی این برتری:
🔹 ریاضی و کدنویسی: در بنچمارک AIME 2025 موفق به کسب امتیاز بینقص ۱۰۰.۰٪ شد و در SWE-Bench Pro (رفع باگ)، بهتر از Gemini 3 Pro عمل کرد.
🔸 کارهای حرفهای: در بنچمارک GDPval (سنجش عملکرد در ۴۴ شغل تخصصی)، امتیاز ۷۰.۹٪ را کسب کرد که آن را همرده یا بهتر از متخصصان انسانی قرار میدهد.
🔹 کاهش خطا: طبق ادعای OpenAI، این مدل تا ۳۰٪ کمتر از نسخه قبلی (GPT-5.1) دچار توهم و خطاهای واقعی میشود.
🧠 @NovinAIplus
تنها چند روز پس از اعلام «وضعیت قرمز» در OpenAI، این شرکت مدل جدید GPT-5.2 را عرضه کرد که در تمام بنچمارکهای هوش و استدلال، رقیب خود Gemini 3 Pro گوگل را پشت سر گذاشته است.
✍🏻 نکات کلیدی این برتری:
🔹 ریاضی و کدنویسی: در بنچمارک AIME 2025 موفق به کسب امتیاز بینقص ۱۰۰.۰٪ شد و در SWE-Bench Pro (رفع باگ)، بهتر از Gemini 3 Pro عمل کرد.
🔸 کارهای حرفهای: در بنچمارک GDPval (سنجش عملکرد در ۴۴ شغل تخصصی)، امتیاز ۷۰.۹٪ را کسب کرد که آن را همرده یا بهتر از متخصصان انسانی قرار میدهد.
🔹 کاهش خطا: طبق ادعای OpenAI، این مدل تا ۳۰٪ کمتر از نسخه قبلی (GPT-5.1) دچار توهم و خطاهای واقعی میشود.
🧠 @NovinAIplus
✨ معرفی بزرگترین سطح دسترسی به NotebookLM: پیوستن به Google AI Ultra
گوگل به صورت رسمی اعلام کرد که ابزار تحقیقاتی و یادداشتبرداری هوش مصنوعی NotebookLM به طرح اشتراک Google AI Ultra اضافه شده است. این طرح بالاترین سطح دسترسی را به کاربران حرفهای و پروژههای پیچیده میدهد.
✍🏻 مزایای اصلی برای مشترکین Ultra:
🔹 افزایش منابع: کاربران میتوانند تا ۶۰۰ سورس (منبع) را در هر نوتبوک خود آپلود کنند (در مقایسه با ۵۰ سورس در طرح استاندارد و ۳۰۰ سورس در طرح پرو).
🔸 بدون واترمارک: حذف واترمارک از خروجیهایی مانند اسلایدها (Slide Decks) و اینفوگرافیکها.
🔹 سقف استفاده بالا: بالاترین سقف تولید محتوا برای قابلیتهایی نظیر خلاصهسازیهای صوتی و ویدیویی (Audio & Video Overviews) و تولید گزارش (Reports).
🔸 قابلیتهای پیشرفته: دسترسی اولویتدار به ویژگیهای جدیدی مانند گزینه Long option برای اسلایدها.
🧠 @NovinAIplus
گوگل به صورت رسمی اعلام کرد که ابزار تحقیقاتی و یادداشتبرداری هوش مصنوعی NotebookLM به طرح اشتراک Google AI Ultra اضافه شده است. این طرح بالاترین سطح دسترسی را به کاربران حرفهای و پروژههای پیچیده میدهد.
✍🏻 مزایای اصلی برای مشترکین Ultra:
🔹 افزایش منابع: کاربران میتوانند تا ۶۰۰ سورس (منبع) را در هر نوتبوک خود آپلود کنند (در مقایسه با ۵۰ سورس در طرح استاندارد و ۳۰۰ سورس در طرح پرو).
🔸 بدون واترمارک: حذف واترمارک از خروجیهایی مانند اسلایدها (Slide Decks) و اینفوگرافیکها.
🔹 سقف استفاده بالا: بالاترین سقف تولید محتوا برای قابلیتهایی نظیر خلاصهسازیهای صوتی و ویدیویی (Audio & Video Overviews) و تولید گزارش (Reports).
🔸 قابلیتهای پیشرفته: دسترسی اولویتدار به ویژگیهای جدیدی مانند گزینه Long option برای اسلایدها.
🧠 @NovinAIplus
⭕️ توسعه وب آسانتر شد: عرضه ویرایشگر بصری Cursor در مرورگر
پلتفرم Cursor، که ابزارهای هوش مصنوعیمحور برای توسعهدهندگان ارائه میدهد، یک ویرایشگر بصری جدید را در مرورگر خود راهاندازی کرد که هدف آن سرعت بخشیدن به طراحی و ساخت اپلیکیشنهای وب مدرن است.
✍🏻 ویژگیهای این ویرایشگر:
🔹ویرایش زنده کد: این ابزار محیط کد و اپلیکیشن (rendered web app) را یکپارچه میکند و با انجام تغییرات بصری، کد اصلی به صورت خودکار بهروزرسانی میشود.
🔸پشتیبانی از React: این ویرایشگر بهویژه برای کسانی که با کدهای مبتنی بر React کار میکنند، بسیار کارآمد است.
🔹امکان درگ و دراپ (Drag-and-drop) برای چیدمان و استفاده از دستورات زبان طبیعی برای اعمال تغییرات در رابط کاربری..
🔸قدرت هوش مصنوعی: با بهرهگیری از ایجنتهای هوش مصنوعی، تغییرات با سرعت بالا و به صورت کارآمد روی کد اعمال میشوند.
🧠 @NovinAIplus
پلتفرم Cursor، که ابزارهای هوش مصنوعیمحور برای توسعهدهندگان ارائه میدهد، یک ویرایشگر بصری جدید را در مرورگر خود راهاندازی کرد که هدف آن سرعت بخشیدن به طراحی و ساخت اپلیکیشنهای وب مدرن است.
✍🏻 ویژگیهای این ویرایشگر:
🔹ویرایش زنده کد: این ابزار محیط کد و اپلیکیشن (rendered web app) را یکپارچه میکند و با انجام تغییرات بصری، کد اصلی به صورت خودکار بهروزرسانی میشود.
🔸پشتیبانی از React: این ویرایشگر بهویژه برای کسانی که با کدهای مبتنی بر React کار میکنند، بسیار کارآمد است.
🔹امکان درگ و دراپ (Drag-and-drop) برای چیدمان و استفاده از دستورات زبان طبیعی برای اعمال تغییرات در رابط کاربری..
🔸قدرت هوش مصنوعی: با بهرهگیری از ایجنتهای هوش مصنوعی، تغییرات با سرعت بالا و به صورت کارآمد روی کد اعمال میشوند.
🧠 @NovinAIplus
❤1
⭕️ دنیای دیزنی و مارول وارد Sora شد: سرمایهگذاری ۱ میلیارد دلاری دیزنی در OpenAI
شرکت والت دیزنی و OpenAI یک قرارداد سه ساله تاریخی امضا کردند. طبق این توافق، دیزنی اولین شریک بزرگ محتوایی Sora خواهد بود و یک سرمایهگذاری ۱ میلیارد دلاری در OpenAI انجام میدهد.
✍🏻 جزئیات مهم این شراکت:
🔹 مجوز محتوا: Sora و ChatGPT Images مجاز خواهند بود تا ویدیوها و تصاویر کوتاهی را بر اساس بیش از ۲۰۰ شخصیت، لباس و مکان از دیزنی، مارول، پیکسار و جنگ ستارگان (Star Wars) تولید کنند.
🔸 اولین ویژگیهای مصرفکننده در اوایل سال ۲۰۲۶ در دسترس کاربران اپلیکیشن Sora، ChatGPT و Disney+ قرار میگیرد.
🔹 دیزنی همچنین برای استفاده داخلی و ابزارهای Disney+، از APIهای ChatGPT و Sora استفاده خواهد کرد.
🧠 @NovinAIplus
شرکت والت دیزنی و OpenAI یک قرارداد سه ساله تاریخی امضا کردند. طبق این توافق، دیزنی اولین شریک بزرگ محتوایی Sora خواهد بود و یک سرمایهگذاری ۱ میلیارد دلاری در OpenAI انجام میدهد.
✍🏻 جزئیات مهم این شراکت:
🔹 مجوز محتوا: Sora و ChatGPT Images مجاز خواهند بود تا ویدیوها و تصاویر کوتاهی را بر اساس بیش از ۲۰۰ شخصیت، لباس و مکان از دیزنی، مارول، پیکسار و جنگ ستارگان (Star Wars) تولید کنند.
🔸 اولین ویژگیهای مصرفکننده در اوایل سال ۲۰۲۶ در دسترس کاربران اپلیکیشن Sora، ChatGPT و Disney+ قرار میگیرد.
🔹 دیزنی همچنین برای استفاده داخلی و ابزارهای Disney+، از APIهای ChatGPT و Sora استفاده خواهد کرد.
🧠 @NovinAIplus
🎙 گوگل Gemini TTS را با ۲۴ زبان و صداهای واقعگرایانه گسترش میدهد
گوگل بهروزرسانیهای جدیدی را برای مدلهای پیشنمایش تبدیل متن به گفتار (TTS) در Gemini 2.5 Flash و Gemini 2.5 Pro منتشر کرده است که هماکنون از طریق Gemini API در Google AI Studio برای توسعهدهندگان در دسترس هستند.
✍🏻 جزئیات و قابلیتهای جدید:
🔹 پشتیبانی از زبانها: این مدلها اکنون از ۲۴ زبان پشتیبانی میکنند.
🔸 سبک بیان و لحن: افزودن طیف گستردهای از سبکهای بیانی، سازگاری دقیقتر با دستورات سبکی (Stylistic Prompts) و کنترل دانهای (Granular Control) بر روی آهنگ و لحن صدا.
🔹 کاربردهای حرفهای: این مدلها برای تولید محتوایی مانند کتابهای صوتی، ماژولهای آموزش الکترونیکی، پادکستها، و صداگذاریهای چند شخصیتی مناسب هستند.
🧠 @NovinAIplus
گوگل بهروزرسانیهای جدیدی را برای مدلهای پیشنمایش تبدیل متن به گفتار (TTS) در Gemini 2.5 Flash و Gemini 2.5 Pro منتشر کرده است که هماکنون از طریق Gemini API در Google AI Studio برای توسعهدهندگان در دسترس هستند.
✍🏻 جزئیات و قابلیتهای جدید:
🔹 پشتیبانی از زبانها: این مدلها اکنون از ۲۴ زبان پشتیبانی میکنند.
🔸 سبک بیان و لحن: افزودن طیف گستردهای از سبکهای بیانی، سازگاری دقیقتر با دستورات سبکی (Stylistic Prompts) و کنترل دانهای (Granular Control) بر روی آهنگ و لحن صدا.
🔹 کاربردهای حرفهای: این مدلها برای تولید محتوایی مانند کتابهای صوتی، ماژولهای آموزش الکترونیکی، پادکستها، و صداگذاریهای چند شخصیتی مناسب هستند.
🧠 @NovinAIplus
👍1
⭕️ خلاصه مهمترین اخبار هوش مصنوعی (هفته سوم آذر)
🍌 مدل مقرونبهصرفه Nano Banana 2 Flash
این مدل جدیدترین AI کوچک و کارآمد گوگل است که برای اجرای سریع روی دستگاههای محلی (On-device) طراحی شده است.
🖥 قابلیت Gemini Live در دسکتاپ
این قابلیت اکنون به دسکتاپ راه یافته و امکان تعامل با محتوای روی صفحه و ترجمه همزمان را برای کاربران فراهم میکند.
⭕️ کدنویسی با Claude در Slack
کاربران با اشتراکهای خاص کلود میتوانند برای انجام کارهای کدنویسی و رفع باگ، مستقیماً از طریق دستورات در محیط Slack با Claude تعامل کنند.
👑 پیروزی GPT-5.2 در برابر Gemini 3
مدل GPT-5.2 شرکت OpenAI در تمام آزمونهای هوش و استدلال، از جمله AIME 2025، بر Gemini 3 Pro گوگل پیشی گرفت.
⭕️ ویرایشگر بصری Cursor برای توسعه وب
ا Cursor یک ویرایشگر بصری در مرورگر عرضه کرد که به کمک درگ و دراپ و هوش مصنوعی، کد React را به صورت زنده ویرایش و بهروزرسانی میکند.
🎙 گسترش Gemini TTS با ۲۴ زبان جدید
گوگل مدلهای Gemini 2.5 Flash و Pro TTS را با پشتیبانی از ۲۴ زبان و قابلیت کنترل دقیق لحن و سرعت بهروزرسانی کرد.
🧠 @NovinAIplus
🍌 مدل مقرونبهصرفه Nano Banana 2 Flash
این مدل جدیدترین AI کوچک و کارآمد گوگل است که برای اجرای سریع روی دستگاههای محلی (On-device) طراحی شده است.
🖥 قابلیت Gemini Live در دسکتاپ
این قابلیت اکنون به دسکتاپ راه یافته و امکان تعامل با محتوای روی صفحه و ترجمه همزمان را برای کاربران فراهم میکند.
⭕️ کدنویسی با Claude در Slack
کاربران با اشتراکهای خاص کلود میتوانند برای انجام کارهای کدنویسی و رفع باگ، مستقیماً از طریق دستورات در محیط Slack با Claude تعامل کنند.
👑 پیروزی GPT-5.2 در برابر Gemini 3
مدل GPT-5.2 شرکت OpenAI در تمام آزمونهای هوش و استدلال، از جمله AIME 2025، بر Gemini 3 Pro گوگل پیشی گرفت.
⭕️ ویرایشگر بصری Cursor برای توسعه وب
ا Cursor یک ویرایشگر بصری در مرورگر عرضه کرد که به کمک درگ و دراپ و هوش مصنوعی، کد React را به صورت زنده ویرایش و بهروزرسانی میکند.
🎙 گسترش Gemini TTS با ۲۴ زبان جدید
گوگل مدلهای Gemini 2.5 Flash و Pro TTS را با پشتیبانی از ۲۴ زبان و قابلیت کنترل دقیق لحن و سرعت بهروزرسانی کرد.
🧠 @NovinAIplus
👍2
📈 قدرت GPT-5.2: اولین بررسیها از مدل جدید OpenAI
اولین بازخوردها از GPT-5.2 نشان میدهد که این مدل یک ارتقای عظیم برای وظایف حرفهای و سازمانی است و هدفش تبدیل هوش مصنوعی به یک «تحلیلگر جدی» برای خلق ارزش اقتصادی است.
✍🏻 برتریهای کلیدی برای محیط کار:
🔸 در بنچمارک GDPval (سنجش وظایف کاری در ۴۴ شغل) در ۷۱٪ مقایسهها، عملکردی برابر یا بهتر از متخصصان انسانی داشته است.
🔹 قابلیت مدیریت بهتر کارهای پیچیده، چند مرحلهای، و تحلیل اسناد طولانی را دارد.
🔸 کاهش چشمگیر خطا: تا ۳۸٪ کمتر از GPT-5.1 دچار خطا و توهم میشود، که باعث افزایش پایداری در کارهای تحقیقاتی میشود.
🔹 توانایی کدنویسی: در کدنویسی (SWE-Bench Pro) با امتیاز ۵۵.۶٪، از Gemini 3 Pro پیشی گرفته است.
🔸 مدل Thinking میتواند فایلهای پیچیدهای مانند صفحات گسترده (Spreadsheets) را مستقیماً در محیط چت تولید، قالببندی و تجزیه و تحلیل کند.
🧠 @NovinAIplus
اولین بازخوردها از GPT-5.2 نشان میدهد که این مدل یک ارتقای عظیم برای وظایف حرفهای و سازمانی است و هدفش تبدیل هوش مصنوعی به یک «تحلیلگر جدی» برای خلق ارزش اقتصادی است.
✍🏻 برتریهای کلیدی برای محیط کار:
🔸 در بنچمارک GDPval (سنجش وظایف کاری در ۴۴ شغل) در ۷۱٪ مقایسهها، عملکردی برابر یا بهتر از متخصصان انسانی داشته است.
🔹 قابلیت مدیریت بهتر کارهای پیچیده، چند مرحلهای، و تحلیل اسناد طولانی را دارد.
🔸 کاهش چشمگیر خطا: تا ۳۸٪ کمتر از GPT-5.1 دچار خطا و توهم میشود، که باعث افزایش پایداری در کارهای تحقیقاتی میشود.
🔹 توانایی کدنویسی: در کدنویسی (SWE-Bench Pro) با امتیاز ۵۵.۶٪، از Gemini 3 Pro پیشی گرفته است.
🔸 مدل Thinking میتواند فایلهای پیچیدهای مانند صفحات گسترده (Spreadsheets) را مستقیماً در محیط چت تولید، قالببندی و تجزیه و تحلیل کند.
🧠 @NovinAIplus
⭕️ عرضه جهانی مرورگر پریمیوم Neon توسط Opera
مرورگر آزمایشی Opera Neon اکنون به صورت جهانی با یک مدل دسترسی زودهنگام پولی منتشر شده است. این مرورگر برای کاربران حرفهای هوش مصنوعی (AI Power Users) طراحی شده که به دنبال دسترسی فوری به جدیدترین مدلها و محیطهای کاری آزمایشی هستند.
✍🏻 ویژگیهای کلیدی Neon:
🔹 مدل دسترسی: این مرورگر با اشتراک ماهانه ۱۹.۹۰ دلار در دسترس است.
🔸 ویژگی اصلی: یک مرورگر ایجنتی (Agentic Browser) است که ایجنتهای هوش مصنوعی را برای انجام وظایفی مانند رزرو سفر یا تولید کد درون مرورگر اجرا میکند.
🔹 دسترسی به مدلهای پریمیوم: مشترکین به مدلهای برتر هوش مصنوعی از جمله Gemini 3 Pro، GPT 5.1، Veo 3.1 و Nano Banana Pro دسترسی پیدا میکنند.
🔸 توسعه: Neon به عنوان یک محیط آزمایشی برای ویژگیهای ایجنتی جدید Opera عمل میکند و به صورت هفتگی بهروزرسانی میشود.
🧠 @NovinAIplus
مرورگر آزمایشی Opera Neon اکنون به صورت جهانی با یک مدل دسترسی زودهنگام پولی منتشر شده است. این مرورگر برای کاربران حرفهای هوش مصنوعی (AI Power Users) طراحی شده که به دنبال دسترسی فوری به جدیدترین مدلها و محیطهای کاری آزمایشی هستند.
✍🏻 ویژگیهای کلیدی Neon:
🔹 مدل دسترسی: این مرورگر با اشتراک ماهانه ۱۹.۹۰ دلار در دسترس است.
🔸 ویژگی اصلی: یک مرورگر ایجنتی (Agentic Browser) است که ایجنتهای هوش مصنوعی را برای انجام وظایفی مانند رزرو سفر یا تولید کد درون مرورگر اجرا میکند.
🔹 دسترسی به مدلهای پریمیوم: مشترکین به مدلهای برتر هوش مصنوعی از جمله Gemini 3 Pro، GPT 5.1، Veo 3.1 و Nano Banana Pro دسترسی پیدا میکنند.
🔸 توسعه: Neon به عنوان یک محیط آزمایشی برای ویژگیهای ایجنتی جدید Opera عمل میکند و به صورت هفتگی بهروزرسانی میشود.
🧠 @NovinAIplus
⭕️ تبدیل عکس خودت به هزاران استایل جذاب (بدون دانش پرامپتنویسی)
🔹حتماً دیدید که بعضیها عکسهای هوش مصنوعی جذابی میسازن ولی پرامپتش رو به کسی نمیگن، یا خودتون دنبال یه سبک خاص بودید و نمیدونستید چه پرامپتی بنویسید. 😒
🔸توی این ویدیو میخوام «معدن اصلی» تمام این پرامپتها رو بهتون معرفی کنم! فقط کافیه استایلی که دوست دارید رو ببینید، پرامپتش رو کپی کنید و تمام! دیگه لازم نیست ساعتها با کلمات کلنجار برید تا یه عکس خوب بگیرید.
#هوش_مصنوعی #پرامت #عکس #جمنای #gemini
🧠 @NovinAIplus
🔹حتماً دیدید که بعضیها عکسهای هوش مصنوعی جذابی میسازن ولی پرامپتش رو به کسی نمیگن، یا خودتون دنبال یه سبک خاص بودید و نمیدونستید چه پرامپتی بنویسید. 😒
🔸توی این ویدیو میخوام «معدن اصلی» تمام این پرامپتها رو بهتون معرفی کنم! فقط کافیه استایلی که دوست دارید رو ببینید، پرامپتش رو کپی کنید و تمام! دیگه لازم نیست ساعتها با کلمات کلنجار برید تا یه عکس خوب بگیرید.
🔗 لینک ویدیو در یوتیوب
#هوش_مصنوعی #پرامت #عکس #جمنای #gemini
🧠 @NovinAIplus
👍2
🚀 خانواده مدلهای Nemotron 3 انویدیا: رقیبی جدید برای مدلهای بزرگ
انویدیا مدلهای متنباز جدید خود را برای سیستمهای ایجنتی (هوش مصنوعی که وظایف را به صورت خودکار انجام میدهد) معرفی کرد.
✍🏻 ویژگیهای این خانواده:
🔸 مدل Nano: هماکنون در دسترس است و با ۳۰ میلیارد پارامتر، برای کارهای سریع و کمهزینه مثل دیباگ کردن بهینه شده است.
🔹 مدلهای Super و Ultra: با ۱۰۰ و ۵۰۰ میلیارد پارامتر برای کارهای پیچیده سازمانی در سال ۲۰۲۶ عرضه میشوند.
🔸 قدرت پردازش بالا: مدل Nano دارای پنجره متنی ۱ میلیون توکنی است که اجازه میدهد حجم عظیمی از دادهها را یکجا تحلیل کند.
🔹 معماری هوشمند: استفاده از ساختار MoE باعث شده تا مدل Nano با وجود حجم بالا، در هر تسک فقط از ۳ میلیارد پارامتر استفاده کند که کارایی را به شدت بالا میبرد.
🔸 متنباز و صنعتی: انویدیا برخلاف گوگل، این مدلها را به همراه دیتاستهای آموزشی به صورت باز ارائه داده تا توسعهدهندگان بتوانند ایجنتهای تخصصی خود را بسازند.
🧠 @NovinAIplus
انویدیا مدلهای متنباز جدید خود را برای سیستمهای ایجنتی (هوش مصنوعی که وظایف را به صورت خودکار انجام میدهد) معرفی کرد.
✍🏻 ویژگیهای این خانواده:
🔸 مدل Nano: هماکنون در دسترس است و با ۳۰ میلیارد پارامتر، برای کارهای سریع و کمهزینه مثل دیباگ کردن بهینه شده است.
🔹 مدلهای Super و Ultra: با ۱۰۰ و ۵۰۰ میلیارد پارامتر برای کارهای پیچیده سازمانی در سال ۲۰۲۶ عرضه میشوند.
🔸 قدرت پردازش بالا: مدل Nano دارای پنجره متنی ۱ میلیون توکنی است که اجازه میدهد حجم عظیمی از دادهها را یکجا تحلیل کند.
🔹 معماری هوشمند: استفاده از ساختار MoE باعث شده تا مدل Nano با وجود حجم بالا، در هر تسک فقط از ۳ میلیارد پارامتر استفاده کند که کارایی را به شدت بالا میبرد.
🔸 متنباز و صنعتی: انویدیا برخلاف گوگل، این مدلها را به همراه دیتاستهای آموزشی به صورت باز ارائه داده تا توسعهدهندگان بتوانند ایجنتهای تخصصی خود را بسازند.
🧠 @NovinAIplus
👍1
⭕️ رونمایی متا از SAM Audio: جداسازی پیشرفته صدا با هوش مصنوعی
متا از مدل جدید SAM Audio رونمایی کرد که امکان جداسازی یا حذف دقیق صداهای خاص را از محیطهای صوتی پیچیده فراهم میکند.
ویژگیهای کلیدی:
🔹 سه روش هدایت (Prompting):
🔸 متنی: توصیف صدای مورد نظر برای جداسازی.
🔸 بصری: کلیک روی اشیا یا افراد در ویدیو برای استخراج صدای مربوط به آنها.
🔸 زمانی (Span): مشخص کردن بازههای زمانی خاص برای هدف قرار دادن صدا.
🔹 کاربرد: ابزاری ایدهآل برای تولیدکنندگان محتوا، موزیسینها و ویرایشگران ویدیو جهت دستکاری دقیق فایلهای صوتی.
🔹 دسترسی: این مدل از طریق پلتفرم Segment Anything Playground در دسترس است.
🧠 @NovinAIplus
متا از مدل جدید SAM Audio رونمایی کرد که امکان جداسازی یا حذف دقیق صداهای خاص را از محیطهای صوتی پیچیده فراهم میکند.
ویژگیهای کلیدی:
🔹 سه روش هدایت (Prompting):
🔸 متنی: توصیف صدای مورد نظر برای جداسازی.
🔸 بصری: کلیک روی اشیا یا افراد در ویدیو برای استخراج صدای مربوط به آنها.
🔸 زمانی (Span): مشخص کردن بازههای زمانی خاص برای هدف قرار دادن صدا.
🔹 کاربرد: ابزاری ایدهآل برای تولیدکنندگان محتوا، موزیسینها و ویرایشگران ویدیو جهت دستکاری دقیق فایلهای صوتی.
🔹 دسترسی: این مدل از طریق پلتفرم Segment Anything Playground در دسترس است.
🧠 @NovinAIplus
❤1👍1
🎨 تحول در تولید تصویر: عرضه GPT Image 1.5 توسط OpenAI
کمپانی OpenAI نسل جدید قابلیتهای تصویری خود را با نام GPT Image 1.5 در ChatGPT و از طریق API معرفی کرد. این بهروزرسانی تجربه تولید، ویرایش و تحلیل تصویر را به صورت یکپارچه در محیط چت فراهم میکند.
ویژگیهای کلیدی:
🔸 ۴ برابر سریعتر از نسخههای قبلی.
🔸 وفاداری بالاتر به دستورات متنی (Prompt Adherence) و حفظ جزئیات.
🔹 بهبود رندر متن درون تصاویر و کنترل دقیقتر روی سبک و ترکیببندی.
🔹 امکان ویرایش بخشهای خاص (Inpainting)، تغییر پسزمینه یا جایگزینی اشیا بدون ترک محیط چت.
🔸 قابلیت تحلیل تصاویر آپلود شده یا اسکرینشاتها.
🔹 عرضه برای کاربران دارای اشتراک پولی آغاز شده و به تدریج برای کاربران رایگان نیز فعال میشود.
🔸 توسعهدهندگان میتوانند از طریق Images API به این مدل دسترسی داشته باشند.
🧠 @NovinAIplus
کمپانی OpenAI نسل جدید قابلیتهای تصویری خود را با نام GPT Image 1.5 در ChatGPT و از طریق API معرفی کرد. این بهروزرسانی تجربه تولید، ویرایش و تحلیل تصویر را به صورت یکپارچه در محیط چت فراهم میکند.
ویژگیهای کلیدی:
🔸 ۴ برابر سریعتر از نسخههای قبلی.
🔸 وفاداری بالاتر به دستورات متنی (Prompt Adherence) و حفظ جزئیات.
🔹 بهبود رندر متن درون تصاویر و کنترل دقیقتر روی سبک و ترکیببندی.
🔹 امکان ویرایش بخشهای خاص (Inpainting)، تغییر پسزمینه یا جایگزینی اشیا بدون ترک محیط چت.
🔸 قابلیت تحلیل تصاویر آپلود شده یا اسکرینشاتها.
🔹 عرضه برای کاربران دارای اشتراک پولی آغاز شده و به تدریج برای کاربران رایگان نیز فعال میشود.
🔸 توسعهدهندگان میتوانند از طریق Images API به این مدل دسترسی داشته باشند.
🧠 @NovinAIplus
⭕️ کاربیو (Caribou) در راه است: خیز بلند OpenAI برای تحول کدنویسی با GPT-5.2
🔹طبق گزارشهای جدید، شرکت OpenAI در حال آمادهسازی یک آپدیت بزرگ برای مدل Codex (مغز متفکر ابزارهایی مثل GitHub Copilot) است. این مدل جدید که با نام رمز Caribou شناخته میشود، احتمالاً بر پایه معماری قدرتمند GPT-5.2 ساخته شده است.
🔸بررسی تغییرات اخیر در مخازن گیتهاب نشان میدهد که برخلاف نسلهای قبل که نسخههای متفاوتی داشتند، Caribou احتمالاً به عنوان نسخه اصلی و بدون پسوند "Max" عرضه میشود تا سطح پایه تواناییهای کدنویسی هوش مصنوعی را ارتقا دهد. با توجه به قدرت GPT-5.2، انتظار میرود این مدل جدید رکوردهای بنچمارکهای مهندسی نرمافزار (مثل SWE Bench) را جابجا کند و قدرت استدلال چندمرحلهای را به توسعهدهندگان هدیه دهد.
🧠 @NovinAIplus
🔹طبق گزارشهای جدید، شرکت OpenAI در حال آمادهسازی یک آپدیت بزرگ برای مدل Codex (مغز متفکر ابزارهایی مثل GitHub Copilot) است. این مدل جدید که با نام رمز Caribou شناخته میشود، احتمالاً بر پایه معماری قدرتمند GPT-5.2 ساخته شده است.
🔸بررسی تغییرات اخیر در مخازن گیتهاب نشان میدهد که برخلاف نسلهای قبل که نسخههای متفاوتی داشتند، Caribou احتمالاً به عنوان نسخه اصلی و بدون پسوند "Max" عرضه میشود تا سطح پایه تواناییهای کدنویسی هوش مصنوعی را ارتقا دهد. با توجه به قدرت GPT-5.2، انتظار میرود این مدل جدید رکوردهای بنچمارکهای مهندسی نرمافزار (مثل SWE Bench) را جابجا کند و قدرت استدلال چندمرحلهای را به توسعهدهندگان هدیه دهد.
🧠 @NovinAIplus
👍2🆒1
🎮 ساخت ویدیوهای تعاملی و قابل بازی با هوش مصنوعی Beam
پلتفرم Beam با کمک هوش مصنوعی، امکان ساخت ویدیوهای کاملاً تعاملی و قابل بازی را بدون نیاز به کدنویسی فراهم میکند. این ابزار برای تولیدکنندگان محتوا، بازیسازان و کسبوکارها طراحی شده تا داستانگویی دیجیتال را متحول کند.
✍🏻 نکات کلیدی:
🔹 ساخت ویدیوهای تعاملی: کاربران میتوانند با آپلود کردن مدلهای سه بعدی، تصاویر و فایلهای صوتی، ویدیوهایی بسازند که مخاطب قادر به تعامل و تغییر مسیر داستان در آنها باشد.
🔸 ادغام هوش مصنوعی: ایجنتهای هوش مصنوعی Beam میتوانند به طور خودکار دیالوگها، موسیقی و محیطهای بازی را بر اساس سناریو تولید کنند.
🔹 کاربردها: ایدهآل برای ساخت بازیهای کوچک، کمپینهای تبلیغاتی تعاملی، آموزشهای پویا و داستانگوییهای شخصیسازی شده.
🔹 دسترسی: Beam به صورت رایگان برای استفاده شخصی و با مدل اشتراکی برای شرکتها و پروژههای تجاری عرضه شده است.
🧠 @NovinAIplus
پلتفرم Beam با کمک هوش مصنوعی، امکان ساخت ویدیوهای کاملاً تعاملی و قابل بازی را بدون نیاز به کدنویسی فراهم میکند. این ابزار برای تولیدکنندگان محتوا، بازیسازان و کسبوکارها طراحی شده تا داستانگویی دیجیتال را متحول کند.
✍🏻 نکات کلیدی:
🔹 ساخت ویدیوهای تعاملی: کاربران میتوانند با آپلود کردن مدلهای سه بعدی، تصاویر و فایلهای صوتی، ویدیوهایی بسازند که مخاطب قادر به تعامل و تغییر مسیر داستان در آنها باشد.
🔸 ادغام هوش مصنوعی: ایجنتهای هوش مصنوعی Beam میتوانند به طور خودکار دیالوگها، موسیقی و محیطهای بازی را بر اساس سناریو تولید کنند.
🔹 کاربردها: ایدهآل برای ساخت بازیهای کوچک، کمپینهای تبلیغاتی تعاملی، آموزشهای پویا و داستانگوییهای شخصیسازی شده.
🔹 دسترسی: Beam به صورت رایگان برای استفاده شخصی و با مدل اشتراکی برای شرکتها و پروژههای تجاری عرضه شده است.
🧠 @NovinAIplus
⭕️ خلاصه مهمترین اخبار هوش مصنوعی (هفته چهارم آذر)
🌐 عرضه جهانی مرورگر پریمیوم Neon توسط Opera
این مرورگر ایجنتی با اشتراک ماهانه 19.90 دلار، دسترسی مستقیم به مدلهای برتری مثل GPT-5.1 و Gemini 3 را برای انجام خودکار تسکهای وب فراهم میکند.
🚀 عرضه خانواده مدلهای Nemotron 3
انویدیا با معرفی مدلهای متنباز Nemotron 3 (از نسخه Nano تا Ultra)، روی ایجنتهای هوشمند صنعتی و پردازش متون بسیار طولانی با پنجره متنی 1 میلیون توکنی تمرکز کرده است.
🎧 جداسازی صدا با AI توسط SAM Audio
مدل جدید متا به کاربران اجازه میدهد با استفاده از متن یا اشاره روی اشیاء در ویدیو، صداهای خاص را از محیطهای صوتی پیچیده جدا یا حذف کنند.
🎨 تحول در تولید تصویر: عرضه GPT Image 1.5 توسط OpenAI
این بهروزرسانی بزرگ در ChatGPT، سرعت تولید تصویر را 4 برابر افزایش داده و امکان ویرایش دقیق بخشهای تصویر را مستقیماً از طریق چت فراهم کرده است.
🎮 ساخت ویدیوهای قابل بازی با هوش مصنوعی Beam
پلتفرم Beam به کاربران اجازه میدهد بدون دانش کدنویسی، ویدیوهای تعاملی بسازند که مخاطب میتواند در آنها با اشیاء تعامل داشته باشد.
🧠 @NovinAIplus
🌐 عرضه جهانی مرورگر پریمیوم Neon توسط Opera
این مرورگر ایجنتی با اشتراک ماهانه 19.90 دلار، دسترسی مستقیم به مدلهای برتری مثل GPT-5.1 و Gemini 3 را برای انجام خودکار تسکهای وب فراهم میکند.
🚀 عرضه خانواده مدلهای Nemotron 3
انویدیا با معرفی مدلهای متنباز Nemotron 3 (از نسخه Nano تا Ultra)، روی ایجنتهای هوشمند صنعتی و پردازش متون بسیار طولانی با پنجره متنی 1 میلیون توکنی تمرکز کرده است.
🎧 جداسازی صدا با AI توسط SAM Audio
مدل جدید متا به کاربران اجازه میدهد با استفاده از متن یا اشاره روی اشیاء در ویدیو، صداهای خاص را از محیطهای صوتی پیچیده جدا یا حذف کنند.
🎨 تحول در تولید تصویر: عرضه GPT Image 1.5 توسط OpenAI
این بهروزرسانی بزرگ در ChatGPT، سرعت تولید تصویر را 4 برابر افزایش داده و امکان ویرایش دقیق بخشهای تصویر را مستقیماً از طریق چت فراهم کرده است.
🎮 ساخت ویدیوهای قابل بازی با هوش مصنوعی Beam
پلتفرم Beam به کاربران اجازه میدهد بدون دانش کدنویسی، ویدیوهای تعاملی بسازند که مخاطب میتواند در آنها با اشیاء تعامل داشته باشد.
🧠 @NovinAIplus
Media is too big
VIEW IN TELEGRAM
⭕️ پایان دوران کپیپیست کردن ارورها: اتصال مستقیم Claude به کنسول کروم
آنتروپیک در یک بهروزرسانی مهم برای کاربران حرفهای، قابلیت اتصال مستقیم ابزار خط فرمان Claude Code به مرورگر کروم (و سایر مرورگرهای کرومیوم) را فعال کرد.
✍🏻 ویژگیهای کلیدی این آپدیت:
🔹دیباگ همزمان و خودکار: دیگر نیازی نیست وقتی در مرورگر با اروری مواجه میشوید، آن را کپی کرده و در چتبات پیست کنید. کلاد اکنون مستقیماً به Console Log مرورگر شما متصل میشود.
🔸چرخه اصلاح سریع:
اگر کدی که نوشتهاید ارور دهد، کلاد آن را میبیند، لاگها را میخواند، فایلهای پروژه را در ادیتور بررسی میکند و راه حل را مستقیماً در ترمینال به شما ارائه میدهد (یا حتی اگر اجازه دهید، خودش کد را اصلاح میکند).
🔹دسترسی و امنیت: این قابلیت فعلاً برای مشترکین پلنهای Pro، Team و Enterprise در دسترس است.
🔻این افزونه در مرحله بتا قرار دارد و با وجود لایههای امنیتی، به دلیل ماهیت دسترسی مستقیم به مرورگر و تزریق کد، بهتر است فعلاً با احتیاط و روی پروژههای غیرحساس تست شود.
🧠 @NovinAIplus
آنتروپیک در یک بهروزرسانی مهم برای کاربران حرفهای، قابلیت اتصال مستقیم ابزار خط فرمان Claude Code به مرورگر کروم (و سایر مرورگرهای کرومیوم) را فعال کرد.
✍🏻 ویژگیهای کلیدی این آپدیت:
🔹دیباگ همزمان و خودکار: دیگر نیازی نیست وقتی در مرورگر با اروری مواجه میشوید، آن را کپی کرده و در چتبات پیست کنید. کلاد اکنون مستقیماً به Console Log مرورگر شما متصل میشود.
🔸چرخه اصلاح سریع:
اگر کدی که نوشتهاید ارور دهد، کلاد آن را میبیند، لاگها را میخواند، فایلهای پروژه را در ادیتور بررسی میکند و راه حل را مستقیماً در ترمینال به شما ارائه میدهد (یا حتی اگر اجازه دهید، خودش کد را اصلاح میکند).
🔹دسترسی و امنیت: این قابلیت فعلاً برای مشترکین پلنهای Pro، Team و Enterprise در دسترس است.
🔻این افزونه در مرحله بتا قرار دارد و با وجود لایههای امنیتی، به دلیل ماهیت دسترسی مستقیم به مرورگر و تزریق کد، بهتر است فعلاً با احتیاط و روی پروژههای غیرحساس تست شود.
دانلود افزونه
🧠 @NovinAIplus
👍3
⭕️ هشدار جدی: این ۶ مورد را هرگز به هوش مصنوعی نگویید!
چتباتها حافظه دارند و بسیاری از آنها اطلاعات شما را برای آموزش مدلهای بعدی ذخیره میکنند. حتی با وجود ادعای ناشناسسازی، خطر نشت اطلاعات یا دیده شدن توسط ناظران انسانی همیشه وجود دارد.
۱. اطلاعات هویتی: کد ملی، آدرس، شماره پاسپورت و تلفن.
۲. اطلاعات پزشکی: بارگذاری جواب آزمایش یا شرح بیماری با ذکر نام و مشخصات.
۳. اسرار مالی: شماره کارت، موجودی حساب و جزئیات تراکنشها.
۴. اطلاعات محرمانه کاری: کپی کردن کدهای برنامهنویسی شرکت یا اسناد داخلی (اشتباهی که کارمندان سامسونگ انجام دادند).
۵. رمزهای عبور: چتباتها فضای امنی برای تایپ کردن پسوردها نیستند.
۶. کلیدهای خصوصی و توکنها (بسیار مهم): هرگز Private Key کیف پول دیجیتال یا API Key سرویسها را برای تست یا دیباگ وارد نکنید.
🔻راهکار امن ماندن:
همیشه فرض کنید یک غریبه چتهای شما را میخواند. برای امنیت بیشتر، از قابلیت Temporary Chat (چت موقت) استفاده کنید یا در تنظیمات اکانت، گزینه Data Training را غیرفعال کنید.
🧠 @NovinAIplus
چتباتها حافظه دارند و بسیاری از آنها اطلاعات شما را برای آموزش مدلهای بعدی ذخیره میکنند. حتی با وجود ادعای ناشناسسازی، خطر نشت اطلاعات یا دیده شدن توسط ناظران انسانی همیشه وجود دارد.
۱. اطلاعات هویتی: کد ملی، آدرس، شماره پاسپورت و تلفن.
۲. اطلاعات پزشکی: بارگذاری جواب آزمایش یا شرح بیماری با ذکر نام و مشخصات.
۳. اسرار مالی: شماره کارت، موجودی حساب و جزئیات تراکنشها.
۴. اطلاعات محرمانه کاری: کپی کردن کدهای برنامهنویسی شرکت یا اسناد داخلی (اشتباهی که کارمندان سامسونگ انجام دادند).
۵. رمزهای عبور: چتباتها فضای امنی برای تایپ کردن پسوردها نیستند.
۶. کلیدهای خصوصی و توکنها (بسیار مهم): هرگز Private Key کیف پول دیجیتال یا API Key سرویسها را برای تست یا دیباگ وارد نکنید.
🔻راهکار امن ماندن:
همیشه فرض کنید یک غریبه چتهای شما را میخواند. برای امنیت بیشتر، از قابلیت Temporary Chat (چت موقت) استفاده کنید یا در تنظیمات اکانت، گزینه Data Training را غیرفعال کنید.
🧠 @NovinAIplus
❤3
شاید هوش مصنوعی بتونه دقیقترین تصاویر یلدا را در چند ثانیه خلق کنه، اما هنوز هیچ الگوریتمی نتونسته "گرمای واقعی خونه مادربزرگ" و "شوقِ فال حافظ" را شبیهسازی کنه. 🥰
بیایید امشب غم ها را پاک کنیم و مدل زبانی قلبمان را فقط با "مهر" و "لبخند" آموزش دهیم. هوشمندترین شبکه جهان، شبکه دلهای ماست که امشب به هم متصلاند.💚
🍉 یلدایتان هوشمند و پر از حس خوب 🍉
🧠 @NovinAIplus
بیایید امشب غم ها را پاک کنیم و مدل زبانی قلبمان را فقط با "مهر" و "لبخند" آموزش دهیم. هوشمندترین شبکه جهان، شبکه دلهای ماست که امشب به هم متصلاند.💚
🍉 یلدایتان هوشمند و پر از حس خوب 🍉
🧠 @NovinAIplus
❤3👍1
⭕️ ساخت ویدیو بدون واترمارک و کاملا رایگان با SORA 2 با کیفیت (4K)
🔹شاید فکر کنید استفاده از Sora 2 هزینه داره یا خروجیهاش پر از واترمارک مزاحمه، اما توی این آموزش ترفندی رو بهتون یاد میدم که بتونید ویدیوهای سینمایی و فوقالعاده باکیفیت بسازید و بدون هیچ واترمارکی دانلودشون کنید.
#هوش_مصنوعی #ویدیو #sora2
🧠 @NovinAIplus
🔹شاید فکر کنید استفاده از Sora 2 هزینه داره یا خروجیهاش پر از واترمارک مزاحمه، اما توی این آموزش ترفندی رو بهتون یاد میدم که بتونید ویدیوهای سینمایی و فوقالعاده باکیفیت بسازید و بدون هیچ واترمارکی دانلودشون کنید.
🔗 لینک ویدیو در یوتیوب
#هوش_مصنوعی #ویدیو #sora2
🧠 @NovinAIplus
1❤1
💻 عرضه مدل GLM-4.7 توسط Z.AI: مدعی جدید کدنویسی متنباز
شرکت Zhipu AI (با نام تجاری Z.AI) مدل زبانی جدید خود به نام GLM-4.7 را منتشر کرد که تمرکز ویژهای بر کدنویسی، استدلال پیشرفته و پردازشهای چندرسانهای (Multimodal) دارد.
🔹 عملکرد درخشان در کدنویسی:
این مدل در بنچمارک HLE امتیاز ۴۲٪ را کسب کرده که ۳۸٪ بهبود نسبت به نسخه قبلی نشان میدهد و عملکرد آن نزدیک به GPT-5.1 است.
🔸 قابلیتهای ایجنتی و استدلال:
نسخه جدید برای جریانهای کاری ایجنتی (Agent-style) بهینه شده و توانایی بالایی در برنامهریزی، فراخوانی ابزارها و حل مسائل چندمرحلهای دارد.
🔹 دسترسی جهانی:
این مدل از طریق پلتفرم Z.ai و API برای توسعهدهندگان در دسترس است و از زبانهای برنامهنویسی پایتون و جاوا پشتیبانی کامل میکند.
🧠 @NovinAIplus
شرکت Zhipu AI (با نام تجاری Z.AI) مدل زبانی جدید خود به نام GLM-4.7 را منتشر کرد که تمرکز ویژهای بر کدنویسی، استدلال پیشرفته و پردازشهای چندرسانهای (Multimodal) دارد.
🔹 عملکرد درخشان در کدنویسی:
این مدل در بنچمارک HLE امتیاز ۴۲٪ را کسب کرده که ۳۸٪ بهبود نسبت به نسخه قبلی نشان میدهد و عملکرد آن نزدیک به GPT-5.1 است.
🔸 قابلیتهای ایجنتی و استدلال:
نسخه جدید برای جریانهای کاری ایجنتی (Agent-style) بهینه شده و توانایی بالایی در برنامهریزی، فراخوانی ابزارها و حل مسائل چندمرحلهای دارد.
🔹 دسترسی جهانی:
این مدل از طریق پلتفرم Z.ai و API برای توسعهدهندگان در دسترس است و از زبانهای برنامهنویسی پایتون و جاوا پشتیبانی کامل میکند.
🧠 @NovinAIplus
❤1
🌊 انتشار آپدیت Windsurf Wave 13: دسترسی رایگان به SWE-1.5 و ایجنتهای موازی
نسخه جدید ویرایشگر کد Windsurf با نام Wave 13 منتشر شد که قابلیتهای قدرتمندی مثل اجرای همزمان چند ایجنت و دسترسی رایگان به مدل پیشرفته SWE-1.5 را به همراه دارد.
نکات کلیدی:
🔹 مدل رایگان SWE-1.5: تمام کاربران به مدت ۳ ماه میتوانند از هوش مصنوعی قدرتمند SWE-1.5 (با همان عملکرد بنچمارک SWE-Bench-Pro) به صورت رایگان استفاده کنند و این مدل اکنون به گزینه پیشفرض تبدیل شده است.
🔸 ایجنتهای موازی واقعی: امکان اجرای همزمان چند ایجنت Cascade در تبها یا پنجرههای جداگانه فراهم شده است. هر ایجنت روی شاخه (Branch) جداگانه Git کار میکند (با استفاده از Git Worktrees) تا تداخلی در کدها ایجاد نشود.
🔹 ترمینال اختصاصی: معرفی Cascade Dedicated Terminal (بتا) که دستورات ایجنت را در یک محیط zsh ایزوله و پایدارتر اجرا میکند.
🧠 @NovinAIplus
نسخه جدید ویرایشگر کد Windsurf با نام Wave 13 منتشر شد که قابلیتهای قدرتمندی مثل اجرای همزمان چند ایجنت و دسترسی رایگان به مدل پیشرفته SWE-1.5 را به همراه دارد.
نکات کلیدی:
🔹 مدل رایگان SWE-1.5: تمام کاربران به مدت ۳ ماه میتوانند از هوش مصنوعی قدرتمند SWE-1.5 (با همان عملکرد بنچمارک SWE-Bench-Pro) به صورت رایگان استفاده کنند و این مدل اکنون به گزینه پیشفرض تبدیل شده است.
🔸 ایجنتهای موازی واقعی: امکان اجرای همزمان چند ایجنت Cascade در تبها یا پنجرههای جداگانه فراهم شده است. هر ایجنت روی شاخه (Branch) جداگانه Git کار میکند (با استفاده از Git Worktrees) تا تداخلی در کدها ایجاد نشود.
🔹 ترمینال اختصاصی: معرفی Cascade Dedicated Terminal (بتا) که دستورات ایجنت را در یک محیط zsh ایزوله و پایدارتر اجرا میکند.
🧠 @NovinAIplus
❤1👍1