چند هفتهای بود همه جا حرف از یه مدل ناشناس بود که توی رقابتهای LMArena (مرجع مقایسه مدلهای مختلف هوش مصنوعی) سر و صدا کرده بود:
— رتبه ۱ ویرایش تصویر
— رتبه ۱ تبدیل متن به تصویر
خروجیهای این مدل، اونقدر قوی و متفاوت بود که اسمش سر زبونها افتاد: Nano Banana.
حدس و گمانهایی بود که این مدل، آیا وابسته به یک شرکتِ بزرگ هست یا توسط یک تیم کوچک در حال توسعه هست؟
امروز معما حل شد؛ گوگل رسماً اعلام کرده این مدل در واقع همون Gemini 2.5 Flash Image هست که به اپلیکیشن جمنای و ابزارهای توسعهدهندهها اضافه شده.
یکی از دردسرهای مدلهای قبلی این بود که وقتی میخواستی عکسی رو ویرایش کنی، قیافهی شخصیت داخل تصویر عوض میشد یا حیوان خانگیت دیگه شبیه خودش نبود. نانو بانانا این مشکل رو تا حد زیادی حل کرده. مثلا میتونی ازش بخوای دوستت رو با مدل موی دهه ۶۰ یا لباس بالرین نشون بده، بدون اینکه چهرهش تغییر کنه.
فقط بحث تغییر ساده نیست. این مدل دستورات دقیق و عجیب رو هم میفهمه. مثلاً میگی «شخص سمت چپ رو به شوالیه قرون وسطایی تبدیل کن ولی پسزمینه دستنخورده بمونه»، یا حتی «این عکس سگ رو با این عکس آدم ترکیب کن»؛ و نتیجه دقیقاً همون میشه که خواستی.
میتونه المانهای یک تصویر رو به تصویر دیگه منتقل کنه. مثلا رنگ و بافت گلبرگهای یک گل رو بذاره روی یک جفت چکمه. این یعنی از طراحی محصول گرفته تا هنر دیجیتال، دست شما برای خلاقیت بازه.
تصاویر خروجی آنقدر طبیعی و دقیق هستن که انگار با دوربین گرفته شدن. همین باعث شده توی بنچمارکهای LMArena رتبهی اول رو بگیره و حتی از مدلهای Midjourney و OpenAI جلو بزنه (رتبهبندی داخل تصاویر بالا هستن).
هم برای کاربرهای عادی در اپلیکیشن جمنای باز شده (تا ۱۰۰ ویرایش رایگان در روز) و هم برای کاربرهای پولی (تا ۱۰۰۰ ویرایش). توسعهدهندهها هم میتونن از طریق API و AI Studio و Vertex AI بهش دسترسی داشته باشن.
نانو بنانا میتونه خیلی از کارهایی که با Photoshop ساعتها طول میکشه، در چند ثانیه انجام بده. یک پلتفرم فروش آنلاین حتی گزارش داده با این مدل تونسته هزینههای عکاسی رو بهشدت پایین بیاره و نرخ فروشش رو ۳۴٪ افزایش بده.
از ساخت تبلیغات آماده در کمتر از یک ساعت گرفته تا خلق کاراکتر برای بازیهای ویدیویی، این مدل به تیمهای خلاق سرعت و دقت تازهای داده.
مدلهای OpenAI با GPT-4o و Midjourney بازار رو تکون داده بودن. اما گوگل با نانو بنانا نشون داد عقب نیست. مخصوصاً وقتی بدونیم جمنای ماهانه ۴۵۰ میلیون کاربر داره، در برابر ۷۰۰ میلیون کاربر هفتگی ChatGPT.
گوگل برای جلوگیری از سوءاستفاده، همهی تصاویر رو با واترمارکهای SynthID (قابلدیدن و نامرئی) علامتگذاری میکنه. این یعنی جعل و فیکسازی سختتر میشه.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤11🔥6👍5👎1
شرکت xAI (شرکت هوش مصنوعی ایلان ماسک) از جدیدترین مدل خودش به نام Grok Code Fast 1 رونمایی کرده؛ مدلی که مخصوص کارهای کدنویسی ساخته شده و از ۲۸ آگوست ۲۰۲۵ بهطور عمومی در دسترسه.
منبع: وبسایت رسمی x.ai
🔻 پینوشت:
تا یک هفته امکان استفاه مجانی از این مدل در GitHub Copilot و Cursor و Cline و Roo Code و Kilo Code و opencode و Windsurf وجود داره.
#معرفی_هوش_مصنوعی
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤25👍6
🚀 انتشار جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
ظاهرا گوگل بیسروصدا از جدیدترین و قدرتمندترین مدل زبانی خودش به اسم Gemini 3 Pro، رونمایی کرده؛ مدلی که به گفته خود گوگل، هوشمندترین ساختهٔ اون تا به امروز هست و دارای پیشرفتهترین (لبه تکنولوژی) توانایی استدلال منطقی SOTA (State-of-the-Art).
ویژگیهای مدل زبانی جمنای ۳ پرو:
🧠 درک چندوجهی (Multimodal): درک و تحلیل انواع دادهها از جمله متن، تصویر، صدا، ویدیو و کد، بطور همزمان.
🤖 دستیار هوشمند خودکار (Agentic): مثل یک دستیار واقعی، وظایف پیچیده رو به صورت خودکار انجام بده؛ از کنترل مرورگر گرفته تا اجرای ابزارهای مختلف.
💻 وایب کدینگ: به کاربران اجازه میده تنها با توصیف ایدههای خود به زبان ساده، کدهای پیچیده، برنامهها، SVGهای حرفهای و ... تولید کنن!
📆 دانش بهروز: یکی از مهمترین ویژگیهای این مدل، تاریخ دانش اون هست که تا ژانویه ۲۰۲۵ گفته شده و اطلاعات بسیار جدیدتری نسبت به مدلهای قبلی داره.
🤔 چطور به این مدل دسترسی پیدا کنیم؟
اگر سری به Google AI Studio بزنید، «فعلا» کنار این مدل با برچسب "Confidential" یا "Preview" میبینید. این تگ به این معنا هست که مدل هنوز به صورت عمومی منتشر نشده و دسترسی به اون فقط برای کاربران خاص (مثل توسعهدهندگان منتخب، تستکنندهها یا بعضی مشترکین Gemini Advanced) فعال شده تا قبل از عرضه نهایی، بازخوردها جمعآوری بشه.
به همین علت، اگر جزو کاربران دارای دسترسی اولیه نباشید، موقع تلاش برای استفاده از این مدل احتمالاً با پیام زیر مواجه میشید:
وضعیت دسترسی برای عموم:
دسترسی فعلی: از نوامبر به صورت محدود (Preview) در AI Studio در دسترس قرار گرفته. عرضه عمومی احتمالاً در ماههای آینده (اواخر دسامبر، یا اوایل سال آینده میلادی) خواهد بود.
قیمتگذاری (برای توسعهدهندگان و کاربران API):
◀️ تا 200 هزار توکن: ورودی $2.00 / خروجی $12.00
◀️ بیش از 200 هزار توکن: ورودی $4.00 / خروجی $18.00
چطوری چک کنیم دسترسی داریم یا نه؟
1⃣ اکانت Gemini Advanced خود را چک کنید: بعضی کاربران بدون اطلاع قبلی، این آپدیت رو دریافت کردند.
2⃣ به Google AI Studio سر بزنید: شاید شما هم جزو کاربران خوششانس باشید! (aistudio.google.com)
3⃣ - صبور باشید: اگه هنوز دسترسی ندارید، فعلا از مدلهای قدیمیتر مثل Gemini 2.5 Pro استفاده کنید و منتظر عرضه عمومی بمونید.
🖥 @Explore_AI
ظاهرا گوگل بیسروصدا از جدیدترین و قدرتمندترین مدل زبانی خودش به اسم Gemini 3 Pro، رونمایی کرده؛ مدلی که به گفته خود گوگل، هوشمندترین ساختهٔ اون تا به امروز هست و دارای پیشرفتهترین (لبه تکنولوژی) توانایی استدلال منطقی SOTA (State-of-the-Art).
ویژگیهای مدل زبانی جمنای ۳ پرو:
اگر سری به Google AI Studio بزنید، «فعلا» کنار این مدل با برچسب "Confidential" یا "Preview" میبینید. این تگ به این معنا هست که مدل هنوز به صورت عمومی منتشر نشده و دسترسی به اون فقط برای کاربران خاص (مثل توسعهدهندگان منتخب، تستکنندهها یا بعضی مشترکین Gemini Advanced) فعال شده تا قبل از عرضه نهایی، بازخوردها جمعآوری بشه.
به همین علت، اگر جزو کاربران دارای دسترسی اولیه نباشید، موقع تلاش برای استفاده از این مدل احتمالاً با پیام زیر مواجه میشید:
You've reached your rate limit. Please try again later.
وضعیت دسترسی برای عموم:
دسترسی فعلی: از نوامبر به صورت محدود (Preview) در AI Studio در دسترس قرار گرفته. عرضه عمومی احتمالاً در ماههای آینده (اواخر دسامبر، یا اوایل سال آینده میلادی) خواهد بود.
قیمتگذاری (برای توسعهدهندگان و کاربران API):
چطوری چک کنیم دسترسی داریم یا نه؟
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤7
کاوش در دنیای هوش مصنوعی
جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
رشته توییت حساب کاربری جمنای در توییتر (X) در مورد معرفی جمنای ۳ گوگل:
توییت اول:
توییت دوم:
توییت سوم:
توییت چهارم:
[ویدئوی دوم همین پست]
توییت پنجم:
توییت ششم:
🖥 @Explore_AI
توییت اول:
مورد انتظارترین عرضه سال ما اینجاست.
- جمنای ۳ (Gemini 3)، هوشمندترین مدل ما
- رابطهای کاربری مولد، برای پاسخهایی با طراحی بینقص
- ایجنت جمنای، ساختهشده برای انجام کارهای پیچیده از طرف شما
ببینید جمنای ۳ چطور میتونه بهتون کمک کنه یاد بگیرید، بسازید و برای هر چیزی برنامهریزی کنید 🧵
توییت دوم:
غول هوش مصنوعی.
جمنای ۳ استاندارد جدیدی برای عملکرد مدلهای هوش مصنوعی تعیین میکنه تا بتونید بدون هیچ وقفهای خلق کنید، کد بزنید و بسازید.
◀️ درک چندوجهی، استدلال فوقپیشرفته و پنجره متنی ۱ میلیون توکنی برای ترکیب و تحلیل ویدیو، تصویر، متن و صدا.
◀️ بهترین مدل ایجنتی (عاملی) و کدنویسی حسی (Vibe Coding) ما تا به امروز.
◀️ پاسخهای کاربردیتر، با فرمتبندی بهتر و خلاصهتر.
توییت سوم:
ظاهر جدید.
با طراحی تازه و فرمتبندی بهتر پاسخها، شروع چت، پیدا کردن چیزهایی که ساختید و یادگیری به روش بصری راحتتر شده.◀️ اطلاعات در جمنای ۳، که واقعگرایانهترین (Factual) مدل ماست، خلاصهتر شده.◀️ دو قابلیت آزمایشی جدید، یعنی چیدمان بصری و نمای پویا، نتایج رو به شکلی جذابتر و بصریتر ارائه میدن.◀️ خرید کردن با لینک محصولات، لیستها، جداول مقایسه و موارد دیگه، از همیشه آسونتر شده.
توییت چهارم:
ایجنت جمنای.
با «ایجنت جمنای» که یک قابلیت آزمایشیه، جمنای میتونه کارهای چندمرحلهای رو براتون انجام بده—همه تحت هدایت خودتون.◀️ رزرو سفر، مرتبسازی اینباکس یا گرفتن وقت ملاقات.◀️ ازش بخواید قیمتها رو مقایسه کنه، با فروشندهها تماس بگیره یا زمانهای خالی رو هماهنگ کنه.◀️ کنترل دست شماست: ایجنت جمنای قبل از اقدامات حساس مثل خرید کردن یا ارسال پیام، تاییدیه میگیره.
فقط برای مشترکین طرح اولترا (Ultra) در آمریکا در دسترس است.
[ویدئوی دوم همین پست]
توییت پنجم:
رایگان برای دانشجوها.
دانشجوهای واجد شرایط در آمریکا، طرح پرو جمنای رو برای یک سال کامل رایگان دریافت میکنن که شامل دسترسی به جمنای ۳، آپلود نامحدود تصویر، NotebookLM@ و موارد دیگه میشه.
ثبتنام در http://gemini.google.com/students (شرایط و قوانین اعمال میشود)
توییت ششم:
عرضه جهانی جمنای ۳ از همین امروز شروع میشه.
با انتخاب گزینه “Thinking” از منوی انتخاب مدل در http://gemini.google امتحانش کنید.
بعد توی ریپلایها بهمون بگید که برای کدوم ویژگیها بیشتر از همه هیجاندارید.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤4
کاوش در دنیای هوش مصنوعی
جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
توییت lmarena.ai در رابطه با جمنای ۳:
(توضیح اینکه: سایت lmarena.ai، معتبرترین پلتفرم برای رتبهبندی مدلهای هوش مصنوعی هست. در این سایت، کاربران بهصورت ناشناس با دو مدل مختلف چت میکنن و برنده [پاسخ بهتر] رو انتخاب میکنن. رتبهبندیهای این سایت به عنوان «استاندارد طلایی» برای سنجش قدرت واقعی هوش مصنوعی در دنیا شناخته میشه.
ترجمه توییت:
🖥 @Explore_AI
(توضیح اینکه: سایت lmarena.ai، معتبرترین پلتفرم برای رتبهبندی مدلهای هوش مصنوعی هست. در این سایت، کاربران بهصورت ناشناس با دو مدل مختلف چت میکنن و برنده [پاسخ بهتر] رو انتخاب میکنن. رتبهبندیهای این سایت به عنوان «استاندارد طلایی» برای سنجش قدرت واقعی هوش مصنوعی در دنیا شناخته میشه.
ترجمه توییت:
مدل Gemini-3-Pro از تیم گوگلدیپمایند حالا در تمام لیدربوردهای (جداول ردهبندی) اصلی آرنا رتبه ۱# را کسب کرده است.
🥇رتبه ۱# در متن، بینایی (Vision) و توسعه وب - بالاتر از Grok-4.1، Claude-4.5 و GPT-5
🥇رتبه ۱# در کدنویسی، ریاضی، نویسندگی خلاق، درخواستهای طولانی و تقریباً تمام لیدربوردهای شغلی.
جهشهای عظیم نسبت به Gemini-2.5:
🔸توسعه وب در آرنای کد: ۱۴۸۷ (۲۸۰+ امتیاز در مقایسه با نسخه ۲٫۵)
🔸متن: ۱۵۰۱ (۵۰+ امتیاز)
🔸بینایی: ۱۳۲۸ (۷۰+ امتیاز)
🔸سطح کارشناس آرنا (Arena Expert): جزو ۳ تای برتر (تنها ۳ امتیاز فاصله با رتبه ۱)
تبریک فراوان به تیم گوگلدیپمایند برای این دستاورد بزرگ! 👏
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥2
در گزارش جدیدی که از OpenAI (سازنده ChatGPT) منتشر شده، نشون میده شکاف بزرگی بین کسانی که «بلدن» با هوش مصنوعی کار کنن و بقیه افراد (کارمندها) وجود داره.
ماجرا فقط کارکردن با هوش مصنوعی و تعداد سوال پرسیدن نیست.
دنیای کار داره به دو دسته تقسیم میشه: کسانی که فقط تماشاچی هستن و کسانی که با سرعت جلو میرن. وقتشه که از سطح «سوال و جواب ساده» بگذریم و «قلقهای حرفهای» رو یاد بگیریم.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍9👏1
Forwarded from Masoud's Sharings
اول دسامبر پارسال، هیچ مدل خوبی از جمنای وجود نداشت (روی نسخه ۱.۵ بودیم که میگفتیم افرین داره تلاشش رو میکنه!)، هیچ مدل تصویرسازی که بتواند متن را درست در تصویر درج کند وجود نداشت، هیچ مدل ویدیویی باکیفیتی نبود، خبری از Deepseek R1 نبود، مدل o1 تازه با قابلیت «استنتاج در زمان تست» عرضه شده بود، امتیاز FrontierMath دو درصد بود نه ۴۱ درصد، و هیچ مدلی در HLE به ۱۰ درصد نرسیده بود...
اینها را عرض کردم تا بتوانید برای سال ۲۰۲۶ برنامهریزی کنید.
@MasoudSharings
پینوشت ۰: #رشد_نمایی
پینوشت ۱: FrontierMath و HLE (بنچمارکها): اینها آزمونهای استاندارد و بسیار دشواری هستند که برای سنجش هوش مصنوعی طراحی شدهاند. و FrontierMath هم مجموعهای از مسائل ریاضی بسیار پیشرفته است که حل آنها حتی برای ریاضیدانان خبره هم زمانبر است. اشاره به رشد از ۲٪ به ۴۱٪ نشاندهنده جهش عظیم توانایی مدلها در حل ریاضیات پیچیده طی یک سال است.
پینوشت ۲: HLE (Humanity's Last Exam) آزمونهای سطح بالای استدلال است که بیش از 2500 سئوال استنتاجی بسیار سخت و سئوالات دیگری از ریاضی و مسائل اخلاقی هم دارد و توانایی مدل را در این حوزهها میسنجد.
پینوشت ۳: Test Time Inference (استنتاج در زمان تست) به قابلیتی اشاره دارد که مدل هوش مصنوعی بلافاصله پاسخ نمیدهد؛ بلکه مانند انسان زمانی را صرف «فکر کردن» و پردازش گامبهگام مسئله میکند تا به جواب دقیقتری برسد (مشابه کاری که مدلهای سری o1 انجام میدهند).
پینوشت ۴: این پست ترجمهای از این توییت است
https://x.com/i/status/2002034413866303918
اینها را عرض کردم تا بتوانید برای سال ۲۰۲۶ برنامهریزی کنید.
@MasoudSharings
پینوشت ۰: #رشد_نمایی
پینوشت ۱: FrontierMath و HLE (بنچمارکها): اینها آزمونهای استاندارد و بسیار دشواری هستند که برای سنجش هوش مصنوعی طراحی شدهاند. و FrontierMath هم مجموعهای از مسائل ریاضی بسیار پیشرفته است که حل آنها حتی برای ریاضیدانان خبره هم زمانبر است. اشاره به رشد از ۲٪ به ۴۱٪ نشاندهنده جهش عظیم توانایی مدلها در حل ریاضیات پیچیده طی یک سال است.
پینوشت ۲: HLE (Humanity's Last Exam) آزمونهای سطح بالای استدلال است که بیش از 2500 سئوال استنتاجی بسیار سخت و سئوالات دیگری از ریاضی و مسائل اخلاقی هم دارد و توانایی مدل را در این حوزهها میسنجد.
پینوشت ۳: Test Time Inference (استنتاج در زمان تست) به قابلیتی اشاره دارد که مدل هوش مصنوعی بلافاصله پاسخ نمیدهد؛ بلکه مانند انسان زمانی را صرف «فکر کردن» و پردازش گامبهگام مسئله میکند تا به جواب دقیقتری برسد (مشابه کاری که مدلهای سری o1 انجام میدهند).
پینوشت ۴: این پست ترجمهای از این توییت است
https://x.com/i/status/2002034413866303918
👍11❤6