NEW BOT Телеграм, страница

🍌

🤖

موزِ نانو! موز مرموز دنیای هوش مصنوعی

چند هفته‌ای بود همه جا حرف از یه مدل ناشناس بود که توی رقابت‌های LMArena (مرجع مقایسه مدل‌های مختلف هوش مصنوعی) سر و صدا کرده بود:
— رتبه ۱ ویرایش تصویر
— رتبه ۱ تبدیل متن به تصویر

خروجی‌های این مدل، اونقدر قوی و متفاوت بود که اسمش سر زبون‌ها افتاد: Nano Banana.

حدس و گمان‌هایی بود که این مدل، آیا وابسته به یک شرکتِ بزرگ هست یا توسط یک تیم کوچک در حال توسعه هست؟

امروز معما حل شد؛ گوگل رسماً اعلام کرده این مدل در واقع همون Gemini 2.5 Flash Image هست که به اپلیکیشن جمنای و ابزارهای توسعه‌دهنده‌ها اضافه شده.

🎯

چرا همه درباره این مدل قدرتمند حرف می‌زدن؟

✅

ثبات در شخصیت و صحنه
یکی از دردسرهای مدل‌های قبلی این بود که وقتی می‌خواستی عکسی رو ویرایش کنی، قیافه‌ی شخصیت داخل تصویر عوض می‌شد یا حیوان خانگی‌ت دیگه شبیه خودش نبود. نانو بانانا این مشکل رو تا حد زیادی حل کرده. مثلا می‌تونی ازش بخوای دوستت رو با مدل موی دهه ۶۰ یا لباس بالرین نشون بده، بدون اینکه چهره‌ش تغییر کنه.

✅

پیروی از دستورات پیچیده
فقط بحث تغییر ساده نیست. این مدل دستورات دقیق و عجیب رو هم می‌فهمه. مثلاً می‌گی «شخص سمت چپ رو به شوالیه قرون وسطایی تبدیل کن ولی پس‌زمینه دست‌نخورده بمونه»، یا حتی «این عکس سگ رو با این عکس آدم ترکیب کن»؛ و نتیجه دقیقاً همون می‌شه که خواستی.

✅

ترکیب تصاویر و خلاقیت
می‌تونه المان‌های یک تصویر رو به تصویر دیگه منتقل کنه. مثلا رنگ و بافت گلبرگ‌های یک گل رو بذاره روی یک جفت چکمه. این یعنی از طراحی محصول گرفته تا هنر دیجیتال، دست شما برای خلاقیت بازه.

✅

کیفیت بصری و واقع‌گرایی
تصاویر خروجی آنقدر طبیعی و دقیق هستن که انگار با دوربین گرفته شدن. همین باعث شده توی بنچمارک‌های LMArena رتبه‌ی اول رو بگیره و حتی از مدل‌های Midjourney و OpenAI جلو بزنه (رتبه‌بندی داخل تصاویر بالا هستن).

✅

دسترسی و ادغام راحت
هم برای کاربرهای عادی در اپلیکیشن جمنای باز شده (تا ۱۰۰ ویرایش رایگان در روز) و هم برای کاربرهای پولی (تا ۱۰۰۰ ویرایش). توسعه‌دهنده‌ها هم می‌تونن از طریق API و AI Studio و Vertex AI بهش دسترسی داشته باشن.

🎯

چرا این مدل مهمه؟

‼️

رقابت با فتوشاپ و ابزارهای سنتی
نانو بنانا می‌تونه خیلی از کارهایی که با Photoshop ساعت‌ها طول می‌کشه، در چند ثانیه انجام بده. یک پلتفرم فروش آنلاین حتی گزارش داده با این مدل تونسته هزینه‌های عکاسی رو به‌شدت پایین بیاره و نرخ فروشش رو ۳۴٪ افزایش بده.

‼️

کاربردهای تجاری و خلاقانه
از ساخت تبلیغات آماده در کمتر از یک ساعت گرفته تا خلق کاراکتر برای بازی‌های ویدیویی، این مدل به تیم‌های خلاق سرعت و دقت تازه‌ای داده.

‼️

رقابت داغ در دنیای هوش مصنوعی
مدل‌های OpenAI با GPT-4o و Midjourney بازار رو تکون داده بودن. اما گوگل با نانو بنانا نشون داد عقب نیست. مخصوصاً وقتی بدونیم جمنای ماهانه ۴۵۰ میلیون کاربر داره، در برابر ۷۰۰ میلیون کاربر هفتگی ChatGPT.

‼️

ایمنی و مسئولیت‌پذیری
گوگل برای جلوگیری از سوءاستفاده، همه‌ی تصاویر رو با واترمارک‌های SynthID (قابل‌دیدن و نامرئی) علامت‌گذاری می‌کنه. این یعنی جعل و فیک‌سازی سخت‌تر می‌شه.

🎯

چطور می‌تونید امتحانش کنید؟

🔻

وبسایت https://nanobanana.ai

🔻

اپلیکیشن جمنای (وب یا موبایل iOS/Android): کافیه عکس‌تون رو آپلود کنید و دستور بدید.
🔻 در Google AI Studio و Vertex AI: برای توسعه‌دهنده‌ها با چندین توکن رایگان روزانه و یا با هزینه حدود ۰.۰۳۹ دلار به‌ازای هر تصویر.
🔻 وبسایت LMArena: برای دیدن عملکردش در رقابت با مدل‌های دیگه.

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤11🔥6👍5👎1

4.26K views18:16

کاوش در دنیای هوش مصنوعی

👨‍💻

مدل Grok Code Fast 1؛ تازه‌ترین مدل xAI برای برنامه‌نویس‌ها

شرکت xAI (شرکت هوش مصنوعی ایلان ماسک) از جدیدترین مدل خودش به نام Grok Code Fast 1 رونمایی کرده؛ مدلی که مخصوص کارهای کدنویسی ساخته شده و از ۲۸ آگوست ۲۰۲۵ به‌طور عمومی در دسترسه.

💬

ویژگی‌های مدل Grok Code Fast 1
✔️ معماری سبک‌وزن و بهینه، آموزش‌دیده با دیتای غنی کدنویسی
✔️ سرعت خارق‌العاده: تا ۱۶۰ توکن در ثانیه!
✔️ قیمت اقتصادی (خیلی ارزون‌تر از رقبای جدی مثل Claude یا GPT)
✔️ پشتیبانی قوی از زبان‌هایی مثل TypeScript، Python، Java، Rust و …
✔️ امتیاز ۷۰.۸٪ در بنچمارک SWE-Bench-Verified و دقت بالا در تولید کد
✔️ یکپارچه با GitHub Copilot و ابزارهایی مثل Cursor، Cline و Roo Code

💬

نظرات کاربران در شبکه‌های اجتماعی:
◀️ خیلی‌ها سرعت و هزینه پایینش رو ستایش کردن؛ بعضی‌ها گفتن بهترین گزینه اقتصادیه.
◀️ بعضی‌ها هم انتقاد کردن که توی پروژه‌های پیچیده گاهی ناپایدار عمل می‌کنه یا دقتش پایین میاد.
◀️ در کل، برای کارهای روزمره و سریع عالیه، ولی برای پروژه‌های خیلی پیچیده شاید بهتر باشه سراغ مدل‌های قوی‌تر برید.

منبع: وبسایت رسمی x.ai

🔻 پی‌نوشت:
تا یک هفته امکان استفاه مجانی از این مدل در GitHub Copilot و Cursor و Cline و Roo Code و Kilo Code و opencode و Windsurf وجود داره.

#معرفی_هوش_مصنوعی

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤25👍6

5.52K views10:33

کاوش در دنیای هوش مصنوعی

🚀 انتشار جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو

ظاهرا گوگل بی‌سروصدا از جدیدترین و قدرتمندترین مدل زبانی خودش به اسم Gemini 3 Pro، رونمایی کرده؛ مدلی که به گفته خود گوگل، هوشمندترین ساختهٔ اون تا به امروز هست و دارای پیشرفته‌ترین (لبه تکنولوژی) توانایی استدلال منطقی SOTA (State-of-the-Art).

ویژگی‌های مدل زبانی جمنای ۳ پرو:
🧠 درک چندوجهی (Multimodal): درک و تحلیل انواع داده‌ها از جمله متن، تصویر، صدا، ویدیو و کد، بطور همزمان.
🤖 دستیار هوشمند خودکار (Agentic): مثل یک دستیار واقعی، وظایف پیچیده رو به صورت خودکار انجام بده؛ از کنترل مرورگر گرفته تا اجرای ابزارهای مختلف.
💻 وایب کدینگ: به کاربران اجازه می‌ده تنها با توصیف ایده‌های خود به زبان ساده، کدهای پیچیده، برنامه‌ها، SVGهای حرفه‌ای و ... تولید کنن!

📆

دانش به‌روز: یکی از مهم‌ترین ویژگی‌های این مدل، تاریخ دانش اون هست که تا ژانویه ۲۰۲۵ گفته شده و اطلاعات بسیار جدیدتری نسبت به مدل‌های قبلی داره.

🤔 چطور به این مدل دسترسی پیدا کنیم؟
اگر سری به Google AI Studio بزنید، «فعلا» کنار این مدل با برچسب "Confidential" یا "Preview" می‌بینید. این تگ به این معنا هست که مدل هنوز به صورت عمومی منتشر نشده و دسترسی به اون فقط برای کاربران خاص (مثل توسعه‌دهندگان منتخب، تست‌کننده‌ها یا بعضی مشترکین Gemini Advanced) فعال شده تا قبل از عرضه نهایی، بازخوردها جمع‌آوری بشه.

به همین علت، اگر جزو کاربران دارای دسترسی اولیه نباشید، موقع تلاش برای استفاده از این مدل احتمالاً با پیام زیر مواجه می‌شید:

You've reached your rate limit. Please try again later.

وضعیت دسترسی برای عموم:
دسترسی فعلی: از نوامبر به صورت محدود (Preview) در AI Studio در دسترس قرار گرفته. عرضه عمومی احتمالاً در ماه‌های آینده (اواخر دسامبر، یا اوایل سال آینده میلادی) خواهد بود.

قیمت‌گذاری (برای توسعه‌دهندگان و کاربران API):
◀️تا 200 هزار توکن: ورودی $2.00 / خروجی $12.00
◀️بیش از 200 هزار توکن: ورودی $4.00 / خروجی $18.00

چطوری چک کنیم دسترسی داریم یا نه؟
1⃣اکانت Gemini Advanced خود را چک کنید: بعضی کاربران بدون اطلاع قبلی، این آپدیت رو دریافت کردند.
2⃣به Google AI Studio سر بزنید: شاید شما هم جزو کاربران خوش‌شانس باشید! (aistudio.google.com)
3⃣- صبور باشید: اگه هنوز دسترسی ندارید، فعلا از مدل‌های قدیمی‌تر مثل Gemini 2.5 Pro استفاده کنید و منتظر عرضه عمومی بمونید.

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8❤7

1.63K views16:58

کاوش در دنیای هوش مصنوعی

جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

رشته توییت حساب کاربری جمنای در توییتر (X) در مورد معرفی جمنای ۳ گوگل:

توییت اول:

مورد انتظارترین عرضه سال ما اینجاست.
- جمنای ۳ (Gemini 3)، هوشمندترین مدل ما
- رابط‌های کاربری مولد، برای پاسخ‌هایی با طراحی بی‌نقص
- ایجنت جمنای، ساخته‌شده برای انجام کارهای پیچیده از طرف شما
ببینید جمنای ۳ چطور می‌تونه بهتون کمک کنه یاد بگیرید، بسازید و برای هر چیزی برنامه‌ریزی کنید 🧵

توییت دوم:

غول هوش مصنوعی.
جمنای ۳ استاندارد جدیدی برای عملکرد مدل‌های هوش مصنوعی تعیین می‌کنه تا بتونید بدون هیچ وقفه‌ای خلق کنید، کد بزنید و بسازید.
◀️ درک چندوجهی، استدلال فوق‌پیشرفته و پنجره متنی ۱ میلیون توکنی برای ترکیب و تحلیل ویدیو، تصویر، متن و صدا.
◀️ بهترین مدل ایجنتی (عاملی) و کدنویسی حسی (Vibe Coding) ما تا به امروز.
◀️ پاسخ‌های کاربردی‌تر، با فرمت‌بندی بهتر و خلاصه‌تر.

توییت سوم:

ظاهر جدید.
با طراحی تازه و فرمت‌بندی بهتر پاسخ‌ها، شروع چت، پیدا کردن چیزهایی که ساختید و یادگیری به روش بصری راحت‌تر شده.
◀️ اطلاعات در جمنای ۳، که واقع‌گرایانه‌ترین (Factual) مدل ماست، خلاصه‌تر شده.
◀️ دو قابلیت آزمایشی جدید، یعنی چیدمان بصری و نمای پویا، نتایج رو به شکلی جذاب‌تر و بصری‌تر ارائه می‌دن.
◀️ خرید کردن با لینک محصولات، لیست‌ها، جداول مقایسه و موارد دیگه، از همیشه آسون‌تر شده.

توییت چهارم:

ایجنت جمنای.
با «ایجنت جمنای» که یک قابلیت آزمایشیه، جمنای می‌تونه کارهای چندمرحله‌ای رو براتون انجام بده—همه تحت هدایت خودتون.
◀️ رزرو سفر، مرتب‌سازی اینباکس یا گرفتن وقت ملاقات.
◀️ ازش بخواید قیمت‌ها رو مقایسه کنه، با فروشنده‌ها تماس بگیره یا زمان‌های خالی رو هماهنگ کنه.
◀️ کنترل دست شماست: ایجنت جمنای قبل از اقدامات حساس مثل خرید کردن یا ارسال پیام، تاییدیه می‌گیره.
فقط برای مشترکین طرح اولترا (Ultra) در آمریکا در دسترس است.

[ویدئوی دوم همین پست]

توییت پنجم:

رایگان برای دانشجوها.
دانشجوهای واجد شرایط در آمریکا، طرح پرو جمنای رو برای یک سال کامل رایگان دریافت می‌کنن که شامل دسترسی به جمنای ۳، آپلود نامحدود تصویر، NotebookLM@ و موارد دیگه می‌شه.
ثبت‌نام در http://gemini.google.com/students (شرایط و قوانین اعمال می‌شود)

توییت ششم:

عرضه جهانی جمنای ۳ از همین امروز شروع می‌شه.
با انتخاب گزینه “Thinking” از منوی انتخاب مدل در http://gemini.google امتحانش کنید.
بعد توی ریپلای‌ها بهمون بگید که برای کدوم ویژگی‌ها بیشتر از همه هیجان‌دارید.

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7❤4

1.92K views17:41

کاوش در دنیای هوش مصنوعی

جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو

توییت lmarena.ai در رابطه با جمنای ۳:

(توضیح اینکه: سایت lmarena.ai، معتبرترین پلتفرم برای رتبه‌بندی مدل‌های هوش مصنوعی هست. در این سایت، کاربران به‌صورت ناشناس با دو مدل مختلف چت می‌کنن و برنده [پاسخ بهتر] رو انتخاب می‌کنن. رتبه‌بندی‌های این سایت به عنوان «استاندارد طلایی» برای سنجش قدرت واقعی هوش مصنوعی در دنیا شناخته می‌شه.

ترجمه توییت:

مدل Gemini-3-Pro از تیم گوگل‌دیپ‌مایند حالا در تمام لیدربوردهای (جداول رده‌بندی) اصلی آرنا رتبه ۱# را کسب کرده است.

🥇رتبه ۱# در متن، بینایی (Vision) و توسعه وب - بالاتر از Grok-4.1، Claude-4.5 و GPT-5
🥇رتبه ۱# در کدنویسی، ریاضی، نویسندگی خلاق، درخواست‌های طولانی و تقریباً تمام لیدربوردهای شغلی.

جهش‌های عظیم نسبت به Gemini-2.5:
🔸توسعه وب در آرنای کد: ۱۴۸۷ (۲۸۰+ امتیاز در مقایسه با نسخه ۲٫۵)
🔸متن: ۱۵۰۱ (۵۰+ امتیاز)
🔸بینایی: ۱۳۲۸ (۷۰+ امتیاز)
🔸سطح کارشناس آرنا (Arena Expert): جزو ۳ تای برتر (تنها ۳ امتیاز فاصله با رتبه ۱)

تبریک فراوان به تیم گوگل‌دیپ‌مایند برای این دستاورد بزرگ! 👏

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17🔥3

2.55K views18:01

کاوش در دنیای هوش مصنوعی

🔥 تفاوت ۶ تا ۱۷ برابری! راز بهره‌وری«کاربران حرفه‌ای» هوش مصنوعی!

در گزارش جدیدی که از OpenAI (سازنده ChatGPT) منتشر شده، نشون میده شکاف بزرگی بین کسانی که «بلدن» با هوش مصنوعی کار کنن و بقیه افراد (کارمندها) وجود داره.

📊 آمار و ارقام عجیب:

1⃣

فاصله ۶ برابری: کاربرهای حرفه‌ای (۵ درصد برتر) نسبت به کاربرهای معمولی، ۶ برابر بهره‌وری بیشتری دارن.

2⃣

فاصله ۱۷ برابری برای برنامه‌نویس‌ها: این اختلاف توی کارهای تخصصی مثل کدنویسی بسیار بیشتره! برنامه‌نویس‌های مسلط به AI تا ۱۷ برابر جلوتر از بقیه‌اند.

3⃣

صرفه‌جویی در زمان: کاربرهای معمولی روزانه حدود ۴۰ تا ۶۰ دقیقه وقت ذخیره می‌کنن، اما حرفه‌ای‌ها هفته‌ای بیش از ۱۰ ساعت (بیشتر از یک روز کاری کامل!) جلو میفتن.

🤔 تفاوت اصلی کجاست؟
ماجرا فقط کارکردن با هوش مصنوعی و تعداد سوال پرسیدن نیست.

✔️

مبتدی‌ها: از هوش مصنوعی برای کارهای ساده مثل «خلاصه‌سازی متن» یا «نوشتن ایمیل» استفاده می‌کنن.

✔️

حرفه‌ای‌ها: هوش مصنوعی رو وارد «مغز کارشون» کردن؛ یعنی برای برنامه‌ریزی استراتژیک، حل مسائل پیچیده و خودکار کردن کل فرآیندهای کاری ازش استفاده می‌کنن.

🚀 نکته کلیدی (خطر و فرصت):
🔻 گزارش میگه ۷۵٪ از کارمندها با کمک هوش مصنوعی تونستن کارهایی رو انجام بدن که قبلاً اصلاً بلد نبودن! این یعنی مرزهای شغلی داره از بین میره.
🔻 اگر یاد نگیریم چطور حرفه‌ای (Power User) باشیم، فقط یه ابزار ساده دستمونه؛ اما اگه یاد بگیریم، می‌تونیم کارهایی رو بکنیم که قبلاً یک تیم کامل لازم داشت.

💡

نتیجه این گزارش:
دنیای کار داره به دو دسته تقسیم میشه: کسانی که فقط تماشاچی هستن و کسانی که با سرعت جلو میرن. وقتشه که از سطح «سوال و جواب ساده» بگذریم و «قلق‌های حرفه‌ای» رو یاد بگیریم.

💧

منبع خبر

💧

گزارش اصلی

🖥

@Explore_AI

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥11👍9👏1

1.97K views10:07

کاوش در دنیای هوش مصنوعی

Forwarded from Masoud's Sharings

اول دسامبر پارسال، هیچ مدل خوبی از جمنای وجود نداشت (روی نسخه ۱.۵ بودیم که میگفتیم افرین داره تلاشش رو میکنه!)، هیچ مدل تصویرسازی که بتواند متن را درست در تصویر درج کند وجود نداشت، هیچ مدل ویدیویی باکیفیتی نبود، خبری از Deepseek R1 نبود، مدل o1 تازه با قابلیت «استنتاج در زمان تست» عرضه شده بود، امتیاز FrontierMath دو درصد بود نه ۴۱ درصد، و هیچ مدلی در HLE به ۱۰ درصد نرسیده بود...
این‌ها را عرض کردم تا بتوانید برای سال ۲۰۲۶ برنامه‌ریزی کنید.
@MasoudSharings

پینوشت ۰: #رشد_نمایی

پینوشت ۱: FrontierMath و HLE (بنچ‌مارک‌ها): این‌ها آزمون‌های استاندارد و بسیار دشواری هستند که برای سنجش هوش مصنوعی طراحی شده‌اند. و FrontierMath هم مجموعه‌ای از مسائل ریاضی بسیار پیشرفته است که حل آن‌ها حتی برای ریاضیدانان خبره هم زمان‌بر است. اشاره به رشد از ۲٪ به ۴۱٪ نشان‌دهنده جهش عظیم توانایی مدل‌ها در حل ریاضیات پیچیده طی یک سال است.

پینوشت ۲: HLE (Humanity's Last Exam) آزمون‌های سطح بالای استدلال است که بیش از 2500 سئوال استنتاجی بسیار سخت و سئوالات دیگری از ریاضی و مسائل اخلاقی هم دارد و توانایی مدل را در این حوزه‌ها می‌سنجد.

پینوشت ۳: Test Time Inference (استنتاج در زمان تست) به قابلیتی اشاره دارد که مدل هوش مصنوعی بلافاصله پاسخ نمی‌دهد؛ بلکه مانند انسان زمانی را صرف «فکر کردن» و پردازش گام‌به‌گام مسئله می‌کند تا به جواب دقیق‌تری برسد (مشابه کاری که مدل‌های سری o1 انجام می‌دهند).

پینوشت ۴: این ‌پست ترجمه‌ای از این توییت است
https://x.com/i/status/2002034413866303918

👍12❤6

1.2K views17:29

About

Blog

Apps

Platform