Media is too big
VIEW IN TELEGRAM
برای اینکه بشه از مدل های مختلف جواب های بهتری گرفت نیازه که بهشون context یا اطلاعات جانبی بیشتری بدیم
مثلا تفاوت توی این دو سبک پرامپت رو ببینید:
یه عالمه نکته دیگه هم هست که میشه به پرامپت اضافه کرد تا هرچه دقیق تر چیزی که میخوایم رو بنویسه
ولی گاهی این نکات حتی به ذهنمون هم نمیرسه
حالا سرویس promptimize میتونه توی این زمینه بهتون کمک کنه
کافیه پرامپت ساده خودتون رو بهش بدید و اون تمام جنبه هایی که نیازه تا پرامپت تون قوی و کاربردی تر بشه رو بهش اضافه میکنه یا از شما میخواد که جای خالی هارو پر کنید.
روزانه ۳ تا پرامپت میتونید بهش بدید توی پلن رایگانش و بیشتر اون ماهانه ۱۰ دلار هست.
البته از خود هوش مصنوعی ها هم میشه برای اینکار کمک گرفت ولی همیشه خوب عمل نمیکنن
خلاصه این ابزار یه جور ابزار تمرینی هست تا هرچه بیشتر پرامپت بهتر زدن رو یاد بگیرید
@aipulse24
مثلا تفاوت توی این دو سبک پرامپت رو ببینید:
یک پست وبلاگ در مورد فواید ورزش بنویس
یک پست وبلاگ با لحن [طنز آمیز] برای مخاطب سنین [۱۲ تا ۱۸ سال] بنویس که تمرکزش روی ورزش های [هوازی] باشه و تعداد لغاتش [۲۰۰۰] باشه مفاهیمی که نیازه کاور کنه [تاثیر در تاخیر انداختن پیری، بهبود سلامت روان، افزایش توان بدن] هست
یه عالمه نکته دیگه هم هست که میشه به پرامپت اضافه کرد تا هرچه دقیق تر چیزی که میخوایم رو بنویسه
ولی گاهی این نکات حتی به ذهنمون هم نمیرسه
حالا سرویس promptimize میتونه توی این زمینه بهتون کمک کنه
کافیه پرامپت ساده خودتون رو بهش بدید و اون تمام جنبه هایی که نیازه تا پرامپت تون قوی و کاربردی تر بشه رو بهش اضافه میکنه یا از شما میخواد که جای خالی هارو پر کنید.
روزانه ۳ تا پرامپت میتونید بهش بدید توی پلن رایگانش و بیشتر اون ماهانه ۱۰ دلار هست.
البته از خود هوش مصنوعی ها هم میشه برای اینکار کمک گرفت ولی همیشه خوب عمل نمیکنن
خلاصه این ابزار یه جور ابزار تمرینی هست تا هرچه بیشتر پرامپت بهتر زدن رو یاد بگیرید
@aipulse24
❤21👍9🔥4
شرکت OpenAI بهتازگی موفق به جذب سرمایهای ۴۰ میلیارد دلاری شده که ارزش این شرکت رو به ۳۰۰ میلیارد دلار رسونده. این دور از سرمایهگذاری به رهبری گروه سافتبانک انجام شده و سرمایهگذاران دیگهای مثل مایکروسافت، Coatue، Altimeter و Thrive هم توش مشارکت داشتن. OpenAI اعلام کرده که این سرمایه جدید قراره به توسعه تحقیقات تو حوزه هوش مصنوعی، گسترش زیرساختهای محاسباتی و ارائه ابزارهای قدرتمندتر برای کاربران کمک کنه.
بخشی از این سرمایه، حدود ۱۸ میلیارد دلار، به پروژهی بزرگ Stargate اختصاص پیدا کرده. این پروژه با هدف ایجاد شبکهای از مراکز داده هوش مصنوعی تو سراسر آمریکا طراحی شده. با این سرمایهگذاری، انتظار میره تواناییهای OpenAI تو ارائه خدمات مبتنی بر هوش مصنوعی بهطور قابلتوجهی بیشتر بشه.
@aipulse24
بخشی از این سرمایه، حدود ۱۸ میلیارد دلار، به پروژهی بزرگ Stargate اختصاص پیدا کرده. این پروژه با هدف ایجاد شبکهای از مراکز داده هوش مصنوعی تو سراسر آمریکا طراحی شده. با این سرمایهگذاری، انتظار میره تواناییهای OpenAI تو ارائه خدمات مبتنی بر هوش مصنوعی بهطور قابلتوجهی بیشتر بشه.
@aipulse24
🔥20👍5
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18👎1
AI Pulse
ساخته نشده با ai را کامنت کنید فردا جوابش رو میگم😭 😭 😭 @aipulse24
شماره 4 یه صحنه واقعی از یکی از انیمشن های گیبلی هست
بقیه همگی تولید هوش مصنوعی هستن
شماره 1 2 3 و 6 از صحنه انیمه هستن که استایلشون تغییر کرده
شماره 5 تولید اورجینال خود هوش مصنوعی هست
و شماره 7 هم عکس استایل rubber hose هست که مجدد توسط هوش مصنوعی ساخته شده
بقیه همگی تولید هوش مصنوعی هستن
شماره 1 2 3 و 6 از صحنه انیمه هستن که استایلشون تغییر کرده
شماره 5 تولید اورجینال خود هوش مصنوعی هست
و شماره 7 هم عکس استایل rubber hose هست که مجدد توسط هوش مصنوعی ساخته شده
😁13👍6
شرکت OpenAI اکادمی آموزشی خودش رو راه اندازی کرده.
این اکادمی 25 مارچ راه اندازی شده ولی اونقدر هیجان برای مدل تولید عکسش زیاد بوده که کسی بهش توجهی ننموده😭
این اکادمی هدفش افزایش سواد هوش مصنوعی هست و محتوای موجود روش از کلاس های ساده برای افراد مسن تا کلاس های پیشرفته برای مهندس هاست.
این موسسه همچنین کلاس های حضوری رو هم ارائه میده.
اینجا میتونید وارد این سایت بشید
محتوای موجود با همکاری دانشگاه های صنعتی تاپ از جمله Georgia Tech ساخته و تولید شده
ثبت نام رایگان هست ولی نیاز به ایمیل و صفحه لینکدین داره تا بتونید از کلاس ها استفاده کنید.
@aipulse24
این اکادمی 25 مارچ راه اندازی شده ولی اونقدر هیجان برای مدل تولید عکسش زیاد بوده که کسی بهش توجهی ننموده
این اکادمی هدفش افزایش سواد هوش مصنوعی هست و محتوای موجود روش از کلاس های ساده برای افراد مسن تا کلاس های پیشرفته برای مهندس هاست.
این موسسه همچنین کلاس های حضوری رو هم ارائه میده.
اینجا میتونید وارد این سایت بشید
محتوای موجود با همکاری دانشگاه های صنعتی تاپ از جمله Georgia Tech ساخته و تولید شده
ثبت نام رایگان هست ولی نیاز به ایمیل و صفحه لینکدین داره تا بتونید از کلاس ها استفاده کنید.
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍4
شرکت OpenAI صدای جدیدی به نام "Monday" رو به حالت صوتی چتجیپیتی اضافه کرده که برای همه کاربران، حتی اونایی که از نسخه رایگان استفاده میکنن، در دسترسه. این صدا لحن خاصی داره و قرار شده که پاسخهای طعنهآمیز و طنزآمیزتری ارائه بده.
Monday بهعنوان دهمین صدا به Voice Mode اضافه شده و لحنش کاملاً با اسمش جور درمیاد؛ ترکیبی از شوخی و کمی بدخلقی که خیلیا صبح روزهای دوشنبه (صبح شنبه خودمون) حسش میکنن. کاربرای نسخه پولی میتونن مستقیم از قسمت انتخاب صدا، Monday رو فعال کنن. اما برای کاربران رایگان، استفاده از این صدا فقط در حالت چت متنی ممکنه و باید از قسمت Explore در محیط کاربری چتجیپیتی پیداش کنن.
یه نکته جالب اینه که OpenAI این صدا رو دقیقاً در روز اول آوریل منتشر کرده که روز جهانی شوخی و دروغهای مصلحتی محسوب میشه. این موضوع باعث شده بعضیا فکر کنن Monday یه تغییر موقتیه و شاید بهزودی حذف بشه. اما اگه این ویژگی دائمی باشه، میتونه رقابت جدیای با حالت Grok Unhinged شرکت xAI داشته باشه، حالتی که بهخاطر پاسخهای جسورانه و گاهی نیشدارش حسابی سروصدا کرده.
این آپدیت درحالی منتشر شده که OpenAI با مشکلات فنی و کمبود ظرفیت پردازشی مواجهه. بهدلیل افزایش شدید استفاده از ویژگیهای جدید مثل تولید تصویر به سبک استودیو جیبلی، سم آلتمن، مدیرعامل OpenAI، هشدار داده که کاربران باید انتظار اختلال، کندی سرویس و تأخیر در انتشار قابلیتهای جدید رو داشته باشن. اون همچنین اعلام کرده که این شرکت با کمبود پردازندههای گرافیکی (GPU) روبهرو شده و در شبکه اجتماعی X از شرکتهای تأمینکننده درخواست کمک کرده.
@aipulse24
Monday بهعنوان دهمین صدا به Voice Mode اضافه شده و لحنش کاملاً با اسمش جور درمیاد؛ ترکیبی از شوخی و کمی بدخلقی که خیلیا صبح روزهای دوشنبه (صبح شنبه خودمون) حسش میکنن. کاربرای نسخه پولی میتونن مستقیم از قسمت انتخاب صدا، Monday رو فعال کنن. اما برای کاربران رایگان، استفاده از این صدا فقط در حالت چت متنی ممکنه و باید از قسمت Explore در محیط کاربری چتجیپیتی پیداش کنن.
یه نکته جالب اینه که OpenAI این صدا رو دقیقاً در روز اول آوریل منتشر کرده که روز جهانی شوخی و دروغهای مصلحتی محسوب میشه. این موضوع باعث شده بعضیا فکر کنن Monday یه تغییر موقتیه و شاید بهزودی حذف بشه. اما اگه این ویژگی دائمی باشه، میتونه رقابت جدیای با حالت Grok Unhinged شرکت xAI داشته باشه، حالتی که بهخاطر پاسخهای جسورانه و گاهی نیشدارش حسابی سروصدا کرده.
این آپدیت درحالی منتشر شده که OpenAI با مشکلات فنی و کمبود ظرفیت پردازشی مواجهه. بهدلیل افزایش شدید استفاده از ویژگیهای جدید مثل تولید تصویر به سبک استودیو جیبلی، سم آلتمن، مدیرعامل OpenAI، هشدار داده که کاربران باید انتظار اختلال، کندی سرویس و تأخیر در انتشار قابلیتهای جدید رو داشته باشن. اون همچنین اعلام کرده که این شرکت با کمبود پردازندههای گرافیکی (GPU) روبهرو شده و در شبکه اجتماعی X از شرکتهای تأمینکننده درخواست کمک کرده.
@aipulse24
🥰12👍7
This media is not supported in your browser
VIEW IN TELEGRAM
تصویری از رابط کاربری AI Mode گوگل که برای تعدادی از کاربران فعال شده.
این قابلیت مشابه قابلیت سرچ در ChatGPT هست.
@aipulse24
این قابلیت مشابه قابلیت سرچ در ChatGPT هست.
@aipulse24
🔥24👍7👎2😁1💯1
گوگل امروز قیمتگذاری مدل Gemini 2.5 Pro، مدل هوش مصنوعی جدیدش رو منتشر کرده. هزینهی این مدل برای درخواستهای تا ۲۰۰ هزار توکن، ۱.۲۵ دلار به ازای هر میلیون توکن ورودی و ۱۰ دلار برای خروجیه. برای درخواستهای بزرگتر، قیمت به ۲.۵۰ دلار برای ورودی و ۱۵ دلار برای خروجی افزایش پیدا میکنه.
این مدل از تمام نسخههای قبلی گوگل گرونتره و حتی از برخی رقبا مثل o3-mini از OpenAI و DeepSeek R1 قیمت بالاتری داره، اما از مدلهایی مثل Claude 3.7 Sonnet و GPT-4.5 ارزونتره.
در کل، قیمت مدلهای پرچمدار شرکتهایی مثل گوگل و OpenAI رو به افزایشه. یکی از دلایل این روند، تقاضای بالاست. به گفتهی ساندار پیچای، Gemini 2.5 Pro محبوبترین مدل گوگل بین توسعهدهندههاست و استفاده از API اون در این ماه ۸۰٪ رشد کرده.
دقت کنید که قیمتهای اعلام شده مربوط به API هست و کاربران عادی همچنان از AI Studio و اپ یا وبسایت جمنای میتونن از نسخه رایگان این مدل استفاده کنن.
@aipulse24
این مدل از تمام نسخههای قبلی گوگل گرونتره و حتی از برخی رقبا مثل o3-mini از OpenAI و DeepSeek R1 قیمت بالاتری داره، اما از مدلهایی مثل Claude 3.7 Sonnet و GPT-4.5 ارزونتره.
در کل، قیمت مدلهای پرچمدار شرکتهایی مثل گوگل و OpenAI رو به افزایشه. یکی از دلایل این روند، تقاضای بالاست. به گفتهی ساندار پیچای، Gemini 2.5 Pro محبوبترین مدل گوگل بین توسعهدهندههاست و استفاده از API اون در این ماه ۸۰٪ رشد کرده.
دقت کنید که قیمتهای اعلام شده مربوط به API هست و کاربران عادی همچنان از AI Studio و اپ یا وبسایت جمنای میتونن از نسخه رایگان این مدل استفاده کنن.
@aipulse24
❤12👍10
اگه دنبال کار میگردی یا میخوای رزومهتو یه سرو سامون بدی، این ابزارهای خفن که با هوش مصنوعی کار میکنن کلی میتونن کمکت کنن. هم وقتتو ذخیره میکنن، هم حرفهایتر جلوه میدی:
1. Rezi – ساخت رزومه اتومات با هوش مصنوعی
2. Teal – مدیریت پروسه اپلای کردن
3. Resumai – رزومهسازی با یه کلیک
4. Lazyapply – خودش برات میره اپلای میکنه
5. Careerflow – یه داشبورد برای دنبال کردن روند شغل پیدا کردن
6. Himalayas – مخصوص کارهای ریموت
7. Huru.ai – تمرین مصاحبه مثل واقعیها
8. Skillora.ai و Remasto.com – فقط برای گزینه های پولی داره
9. Interviewsby.ai – تمرین مصاحبه با تحلیل حرفهای
حالا جدا از رزومه و اپلای، برای آماده شدن واسه مصاحبه هم کلی ابزار هست که میتونی باهاشون تمرین کنی:
آمادگی عمومی برای مصاحبه:
Prep Invue AI – آنالیز رفتار و حرف زدنت با AI
Final Round AI – راهنمایی لحظهای تو مصاحبههای واقعی
مصاحبههای فنی و کدنویسی:
Acedit – تمرین کدنویسی تو مرورگر
Exponent Practice – تمرین با همسطحا
interviewing.io – مصاحبه ناشناس با فیدبک واقعی
LeetCode Interview – تمرین سوالات فنی و چالشدار
برای بهتر حرف زدن و ارتباط گرفتن:
Yoodli AI – تمرین حرف زدن، اعتماد به نفس و بیان
Big Interview – فیدبک واسه مصاحبههای رفتاری
Voomer – تمرین جواب دادن ویدیویی با فیدبک AI
برای کیس استادی و مصاحبههای مشاورهای:
CaseCoach – تمرین حرفهای واسه کیس استادی
RocketBlocks – تمرین برای نقشهای بیزینسی
IGotAnOffer – آموزش و تمرین برای مصاحبههای خاص
برای مدیریت محصول و UX:
PracticeInterview.ai – تمرین PM مصاحبه
آمادگی برای شرکت یا موقعیت خاص:
PrepInsta – تمرین واسه شرکتهای خاص
Pathrise – کوچینگ و راهنمایی شغلی کامل با AI
اگه اینا رو قبلاً امتحان کردی یا سوالی داری، خوشحال میشم گپ بزنیم!
@aipulse24
1. Rezi – ساخت رزومه اتومات با هوش مصنوعی
2. Teal – مدیریت پروسه اپلای کردن
3. Resumai – رزومهسازی با یه کلیک
4. Lazyapply – خودش برات میره اپلای میکنه
5. Careerflow – یه داشبورد برای دنبال کردن روند شغل پیدا کردن
6. Himalayas – مخصوص کارهای ریموت
7. Huru.ai – تمرین مصاحبه مثل واقعیها
8. Skillora.ai و Remasto.com – فقط برای گزینه های پولی داره
9. Interviewsby.ai – تمرین مصاحبه با تحلیل حرفهای
حالا جدا از رزومه و اپلای، برای آماده شدن واسه مصاحبه هم کلی ابزار هست که میتونی باهاشون تمرین کنی:
آمادگی عمومی برای مصاحبه:
Prep Invue AI – آنالیز رفتار و حرف زدنت با AI
Final Round AI – راهنمایی لحظهای تو مصاحبههای واقعی
مصاحبههای فنی و کدنویسی:
Acedit – تمرین کدنویسی تو مرورگر
Exponent Practice – تمرین با همسطحا
interviewing.io – مصاحبه ناشناس با فیدبک واقعی
LeetCode Interview – تمرین سوالات فنی و چالشدار
برای بهتر حرف زدن و ارتباط گرفتن:
Yoodli AI – تمرین حرف زدن، اعتماد به نفس و بیان
Big Interview – فیدبک واسه مصاحبههای رفتاری
Voomer – تمرین جواب دادن ویدیویی با فیدبک AI
برای کیس استادی و مصاحبههای مشاورهای:
CaseCoach – تمرین حرفهای واسه کیس استادی
RocketBlocks – تمرین برای نقشهای بیزینسی
IGotAnOffer – آموزش و تمرین برای مصاحبههای خاص
برای مدیریت محصول و UX:
PracticeInterview.ai – تمرین PM مصاحبه
آمادگی برای شرکت یا موقعیت خاص:
PrepInsta – تمرین واسه شرکتهای خاص
Pathrise – کوچینگ و راهنمایی شغلی کامل با AI
اگه اینا رو قبلاً امتحان کردی یا سوالی داری، خوشحال میشم گپ بزنیم!
@aipulse24
🔥12👍9❤8
AI Pulse
اگه دنبال کار میگردی یا میخوای رزومهتو یه سرو سامون بدی، این ابزارهای خفن که با هوش مصنوعی کار میکنن کلی میتونن کمکت کنن. هم وقتتو ذخیره میکنن، هم حرفهایتر جلوه میدی: 1. Rezi – ساخت رزومه اتومات با هوش مصنوعی 2. Teal – مدیریت پروسه اپلای کردن …
لیست سایت ها رو دادم به هوش مصنوعی گفتم یه پست تلگرام تولید کن
این فاجعه رو ساخت😭 😭
گفتم همینجوری بفرستم خیلی نگران نباشید از کار بیکار میشید😂
اون عکسم بهش گفتم از خودت بساز که داری این پست رو مینویسی اون رو زد🥺
✅✅ نکته مهم ✅✅
برید توی سایت Rezi ثبت نام کنید و بعد توی ساب ردیت Rezi اون بالا یک فرم هست پر کنید تا بهتون رایگان لایف تایم پرمیوم بده!!!!
این فاجعه رو ساخت
گفتم همینجوری بفرستم خیلی نگران نباشید از کار بیکار میشید
اون عکسم بهش گفتم از خودت بساز که داری این پست رو مینویسی اون رو زد
✅✅ نکته مهم ✅✅
برید توی سایت Rezi ثبت نام کنید و بعد توی ساب ردیت Rezi اون بالا یک فرم هست پر کنید تا بهتون رایگان لایف تایم پرمیوم بده!!!!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14😁10👍3
شرکت متا نسل چهارم از مدلهای زبانی Llama را معرفی کرده که با تواناییهای چندوجهی و پشتیبانی از کانتکست بسیار بلند، رقیب بسیار جدیای برای مدلهای اوپن سورس محسوب میشن.
در این مجموعه سه مدل معرفی شده: Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth. دو مدل اول به صورت Open Weight عرضه شدن و برای استفاده در پلتفرمهایی مثل WhatsApp، Messenger، Instagram Direct و نسخه وب Meta AI در دسترس قرار گرفتن.
مدل Scout با ۱۷ میلیارد پارامتر فعال و ۱۶ متخصص، قویترین مدل توی کلاس خودش بهشمار میاد و با وجود تواناییهای چشمگیر، روی یک GPU از نوع H100 اجرا میشه. این مدل با داشتن پنجره کانتکست ۱۰ میلیون توکنی، عملکردی بهتر از مدلهایی مثل Gemma 3 و Gemini 2.0 Flash-Lite ارائه میده.
مدل Maverick هم که از همون تعداد پارامتر فعال اما با ۱۲۸ متخصص بهره میبره، در تستهای گسترده از GPT-4o و Gemini 2.0 پیشی گرفته و با مدلهایی مثل DeepSeek v3 در زمینههای استدلال و کدنویسی رقابت میکنه؛ اون هم با نصف تعداد پارامتر فعال.
قدرت این مدلها تا حد زیادی مدیون مدل Behemoth هست؛ یک مدل بزرگ ۲ تریلیونی با ۲۸۸ میلیارد پارامتر فعال که نقش "معلم" رو در فرایند آموزش ایفا کرده. Behemoth در بنچمارکهای ریاضی، کدنویسی و زبانهای مختلف عملکردی بهتر از مدلهای شاخصی مثل GPT-4.5، Claude 3.7 و Gemini 2.0 Pro داشته. هرچند هنوز بهطور کامل عرضه نشده، اما متا وعده داده بهزودی اطلاعات بیشتری دربارهی اون منتشر کنه.
در طراحی این مدلها، معماری Mixture of Experts بهکار گرفته شده که با فعالسازی بخشی از پارامترها بهازای هر توکن، هم بازدهی محاسباتی رو افزایش داده و هم کیفیت مدل رو نسبت به مدلهای متراکم بهبود داده. Llama 4 همچنین بهصورت چندوجهی طراحی شده و میتونه همزمان ورودیهای متنی و تصویری رو پردازش کنه. در فاز آموزش، از دادههای متنی، تصویری و ویدیویی در مقیاس بالا استفاده شده و تکنیکهای جدیدی مثل MetaP برای بهینهسازی هایپرپارامترها بهکار رفته.
در مرحله پسآموزش، متا از روشهای جدیدی مثل یادگیری تقویتی آنلاین و بهینهسازی مستقیم ترجیحی برای بهبود مهارتهای مدل در استدلال، مکالمه و چندوجهیبودن استفاده کرده.
مدل Maverick با بهرهگیری از این روشها، عملکرد چشمگیری در درک تصویر، تولید متن، پاسخ به پرسشهای بصری و وظایف پیچیده نشون داده. مدل Scout هم با وجود حجم کمتر، در زمینههایی مثل کدنویسی، پردازش کانتکست بلند، و درک تصویری، نتایجی بهتر از تمام نسلهای قبلی Llama ارائه میده.
در نهایت، متا تأکید کرده که این مدلها با بالاترین استانداردهای ایمنی توسعه داده شدن. ابزارهایی مثل Llama Guard، Prompt Guard و سامانهی تست GOAT برای جلوگیری از خروجیهای نامناسب یا سؤاستفاده از مدلها ارائه شده و توسعهدهندگان میتونن این ابزارها رو متناسب با نیاز خودشون تنظیم کنن. همچنین تلاشهایی هم برای کاهش سوگیریهای سیاسی و اجتماعی در پاسخهای مدل صورت گرفته تا Llama 4 بتونه دیدگاههای مختلف رو بهدرستی درک و بیان کنه.
@aipulse24
در این مجموعه سه مدل معرفی شده: Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth. دو مدل اول به صورت Open Weight عرضه شدن و برای استفاده در پلتفرمهایی مثل WhatsApp، Messenger، Instagram Direct و نسخه وب Meta AI در دسترس قرار گرفتن.
مدل Scout با ۱۷ میلیارد پارامتر فعال و ۱۶ متخصص، قویترین مدل توی کلاس خودش بهشمار میاد و با وجود تواناییهای چشمگیر، روی یک GPU از نوع H100 اجرا میشه. این مدل با داشتن پنجره کانتکست ۱۰ میلیون توکنی، عملکردی بهتر از مدلهایی مثل Gemma 3 و Gemini 2.0 Flash-Lite ارائه میده.
مدل Maverick هم که از همون تعداد پارامتر فعال اما با ۱۲۸ متخصص بهره میبره، در تستهای گسترده از GPT-4o و Gemini 2.0 پیشی گرفته و با مدلهایی مثل DeepSeek v3 در زمینههای استدلال و کدنویسی رقابت میکنه؛ اون هم با نصف تعداد پارامتر فعال.
قدرت این مدلها تا حد زیادی مدیون مدل Behemoth هست؛ یک مدل بزرگ ۲ تریلیونی با ۲۸۸ میلیارد پارامتر فعال که نقش "معلم" رو در فرایند آموزش ایفا کرده. Behemoth در بنچمارکهای ریاضی، کدنویسی و زبانهای مختلف عملکردی بهتر از مدلهای شاخصی مثل GPT-4.5، Claude 3.7 و Gemini 2.0 Pro داشته. هرچند هنوز بهطور کامل عرضه نشده، اما متا وعده داده بهزودی اطلاعات بیشتری دربارهی اون منتشر کنه.
در طراحی این مدلها، معماری Mixture of Experts بهکار گرفته شده که با فعالسازی بخشی از پارامترها بهازای هر توکن، هم بازدهی محاسباتی رو افزایش داده و هم کیفیت مدل رو نسبت به مدلهای متراکم بهبود داده. Llama 4 همچنین بهصورت چندوجهی طراحی شده و میتونه همزمان ورودیهای متنی و تصویری رو پردازش کنه. در فاز آموزش، از دادههای متنی، تصویری و ویدیویی در مقیاس بالا استفاده شده و تکنیکهای جدیدی مثل MetaP برای بهینهسازی هایپرپارامترها بهکار رفته.
در مرحله پسآموزش، متا از روشهای جدیدی مثل یادگیری تقویتی آنلاین و بهینهسازی مستقیم ترجیحی برای بهبود مهارتهای مدل در استدلال، مکالمه و چندوجهیبودن استفاده کرده.
مدل Maverick با بهرهگیری از این روشها، عملکرد چشمگیری در درک تصویر، تولید متن، پاسخ به پرسشهای بصری و وظایف پیچیده نشون داده. مدل Scout هم با وجود حجم کمتر، در زمینههایی مثل کدنویسی، پردازش کانتکست بلند، و درک تصویری، نتایجی بهتر از تمام نسلهای قبلی Llama ارائه میده.
در نهایت، متا تأکید کرده که این مدلها با بالاترین استانداردهای ایمنی توسعه داده شدن. ابزارهایی مثل Llama Guard، Prompt Guard و سامانهی تست GOAT برای جلوگیری از خروجیهای نامناسب یا سؤاستفاده از مدلها ارائه شده و توسعهدهندگان میتونن این ابزارها رو متناسب با نیاز خودشون تنظیم کنن. همچنین تلاشهایی هم برای کاهش سوگیریهای سیاسی و اجتماعی در پاسخهای مدل صورت گرفته تا Llama 4 بتونه دیدگاههای مختلف رو بهدرستی درک و بیان کنه.
@aipulse24
🔥17❤4👍2❤🔥1