گوگل همچنین از رابط کاربری جدید AI Studio رونمایی کرده که مورد استقبال گسترده کاربران قرار گرفته و نسبت به قبل سهولت بیشتری در استفاده رو برای کاربران فراهم میکنه.
@aipulse24
@aipulse24
🔥26👍2❤1❤🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
و در ادامه! گوگل از نسخه پیشنمایش «Firebase Studio» رونمایی کرده؛ یک محیط توسعه ابری و هوشمند که طراحی شده تا ساخت، تست، استقرار و اجرای اپهای ساخته شده با هوش مصنوعی رو سریعتر و سادهتر کنه. این ابزار جدید در راستای هدف فایربیس برای سادهسازی توسعه فولاستک طراحی شده و بهگونهای ساخته شده که هم برای تازهکارها و هم برای توسعهدهندههای حرفهای کاربردی باشه. از پروتوتایپسازی با زبان طبیعی گرفته تا استفاده از ماشین مجازی قابل تنظیم، همه چیز توی یه پلتفرم یکپارچه جمع شده.
این ابزار که مشابه v0، bolt و cursor هست ترکیبیه از ابزارهایی مثل Project IDX، Genkit و Gemini in Firebase؛ و به توسعهدهندهها این امکان رو میده که در همون محیط، سریع نمونه اولیه بسازن، کد بزنن، پیشنمایش بگیرن، و در نهایت پروژه رو منتشر کنن. مثلاً با کمک «App Prototyping agent» میتونین با یه پرامپت ساده یا حتی یه عکس، خیلی سریع یه اپ Next.js تولید کنین.
یکی از قابلیتهای جذاب دیگه، تعامل مستقیم با Gemini داخل خود Firebase Studio هست. کاربر میتونه با نوشتن یه دستور ساده مثل «احراز هویت کاربر رو اضافه کن» یا «رنگ دکمهها رو تغییر بده»، تغییرات لازم رو توی اپش اعمال کنه، بدون اینکه خودش به کد دست بزنه. البته اگه کسی بخواد، میتونه مستقیماً وارد محیط کدنویسی بشه و مثل یه IDE کامل، از قابلیتهایی مثل تکمیل کد، دیباگ، ترمینال و... استفاده کنه.
برای تست پروژه هم نیازی به دانش فنی بالایی نیست. میتونین یه لینک عمومی یا QR code بسازین و روی هر دستگاهی پیشنمایش بگیرین. بعد از اطمینان از نتیجه، فقط کافیه روی «Publish» کلیک کنین تا پروژهتون با استفاده از Firebase App Hosting بهصورت کامل روی وب منتشر بشه.
در نهایت، Firebase Studio امکاناتی مثل همکاری همزمان روی پروژه، اشتراکگذاری محیط توسعه با لینک، دسترسی به ماشین مجازی ابری قابل تنظیم، و حتی استفاده از قالبهای آماده یا ایمپورت پروژههای قدیمی رو هم فراهم کرده.
برای شروع، فقط کافیه وارد این لینک بشین.
@aipulse24
این ابزار که مشابه v0، bolt و cursor هست ترکیبیه از ابزارهایی مثل Project IDX، Genkit و Gemini in Firebase؛ و به توسعهدهندهها این امکان رو میده که در همون محیط، سریع نمونه اولیه بسازن، کد بزنن، پیشنمایش بگیرن، و در نهایت پروژه رو منتشر کنن. مثلاً با کمک «App Prototyping agent» میتونین با یه پرامپت ساده یا حتی یه عکس، خیلی سریع یه اپ Next.js تولید کنین.
یکی از قابلیتهای جذاب دیگه، تعامل مستقیم با Gemini داخل خود Firebase Studio هست. کاربر میتونه با نوشتن یه دستور ساده مثل «احراز هویت کاربر رو اضافه کن» یا «رنگ دکمهها رو تغییر بده»، تغییرات لازم رو توی اپش اعمال کنه، بدون اینکه خودش به کد دست بزنه. البته اگه کسی بخواد، میتونه مستقیماً وارد محیط کدنویسی بشه و مثل یه IDE کامل، از قابلیتهایی مثل تکمیل کد، دیباگ، ترمینال و... استفاده کنه.
برای تست پروژه هم نیازی به دانش فنی بالایی نیست. میتونین یه لینک عمومی یا QR code بسازین و روی هر دستگاهی پیشنمایش بگیرین. بعد از اطمینان از نتیجه، فقط کافیه روی «Publish» کلیک کنین تا پروژهتون با استفاده از Firebase App Hosting بهصورت کامل روی وب منتشر بشه.
در نهایت، Firebase Studio امکاناتی مثل همکاری همزمان روی پروژه، اشتراکگذاری محیط توسعه با لینک، دسترسی به ماشین مجازی ابری قابل تنظیم، و حتی استفاده از قالبهای آماده یا ایمپورت پروژههای قدیمی رو هم فراهم کرده.
برای شروع، فقط کافیه وارد این لینک بشین.
@aipulse24
🔥22👍7🕊1
شرکت xAI بالاخره API مخصوص مدل پرچمدار خودش یعنی Grok 3 رو راهاندازی کرده. این مدل شامل چند نسخه مختلفه از جمله Grok 3 Mini، Grok 3 Reasoning و نسخه Mini اون با قابلیت «استدلال». کاربران میتونن به دو نسخه اصلی یعنی Grok 3 و Grok 3 Mini از طریق API دسترسی داشته باشن، و قیمتگذاری بسته به میزان توکنهای ورودی یا خروجی محاسبه میشه.
نسخه استاندارد Grok 3 با قیمت ۳ دلار برای هر میلیون توکن ورودی و ۱۵ دلار برای هر میلیون توکن خروجی عرضه شده، در حالی که Grok 3 Mini با نرخ پایینتر ۰.۳۰ دلار برای ورودی و ۰.۵۰ دلار برای خروجی در دسترسه. نسخههای سریعتر این مدلها هم با هزینه بیشتر ارائه میشن، بهطوری که استفاده از Grok 3 در حالت پرسرعت، ۵ دلار برای ورودی و ۲۵ دلار برای خروجی هزینه داره.
@aipulse24
نسخه استاندارد Grok 3 با قیمت ۳ دلار برای هر میلیون توکن ورودی و ۱۵ دلار برای هر میلیون توکن خروجی عرضه شده، در حالی که Grok 3 Mini با نرخ پایینتر ۰.۳۰ دلار برای ورودی و ۰.۵۰ دلار برای خروجی در دسترسه. نسخههای سریعتر این مدلها هم با هزینه بیشتر ارائه میشن، بهطوری که استفاده از Grok 3 در حالت پرسرعت، ۵ دلار برای ورودی و ۲۵ دلار برای خروجی هزینه داره.
@aipulse24
❤13👍9
This media is not supported in your browser
VIEW IN TELEGRAM
پرپلکسیتی هم از ربات رسمی تلگرام خودش رونمایی کرده. از این پس میتونید داخل تلگرام باهاش چت کنید یا حتی به گروههاتون اضافهش کنید و ازش استفاده کنید.
این ربات از طریق آیدی @askplexbot در دسترسه.
@aipulse24
این ربات از طریق آیدی @askplexbot در دسترسه.
@aipulse24
👍20❤8
یک مدل مرموز چند روزه به Openrouter اضافه شده با عنوان Quasar Alpha که احتمال میره برای openai باشه و درحال تست قابلیت هاش هست.
مدل context window یک میلیونی داره، ۴برابر سریع تر از sonnet 3.7 هست و قابلیت های کدینگش نزدیک به بهترین مدل هاست
علت اینکه احساس میشه برای OpenAi باشه اینه که هم استایل و هم متا دیتا مدل مشابه مدل های OpenAi هست و سم التمن هم توی جواب یک تویئت که توی عکس میینید این رو تایید کرده که مدل برای OpenAi هست.
اینم جهت سیگنچر کار:🍽
@aipulse24
مدل context window یک میلیونی داره، ۴برابر سریع تر از sonnet 3.7 هست و قابلیت های کدینگش نزدیک به بهترین مدل هاست
علت اینکه احساس میشه برای OpenAi باشه اینه که هم استایل و هم متا دیتا مدل مشابه مدل های OpenAi هست و سم التمن هم توی جواب یک تویئت که توی عکس میینید این رو تایید کرده که مدل برای OpenAi هست.
اینم جهت سیگنچر کار:
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15🔥8👍2
AI Pulse
شرکت Clone Robotics از جدیدترین ربات خودش با نام Clone رونمایی کرده. این ربات اولین ربات انسان نمای جهان با ساختار اسکلتی-عضلانی هست. بیش از ۲۰۰ درجه قدرت مانور حرکت، بیش از ۲۰۰۰ رشته عضلانی و ۵۰۰ سنسور داره و در حال حاضر از سیستم پنوماتیک استفاده میکنه…
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣21🔥4👍2❤1🤮1
AI Pulse
Video
This media is not supported in your browser
VIEW IN TELEGRAM
مدل OmniHuman ریلیز شد با اسم جدید Dreamina
به صورت فری تقریبا روزی یه دونه ویدیو میده که اونم من خرج شما عزیزان کردم😂 😂
هعی:)) همه اش فداکاری😭
ولی محدودیتش زیاده توی وویس اول هم کلمه احمق داشتم و هم نارنجک مجبور شدم هردو رو حذف کنم تا جنریت کنه
ولی کیفیتش خیلی خوبه
با اکانت capcut میتونین ازش استفاده کنید.
Dreamina.capcut.com
@aipulse
به صورت فری تقریبا روزی یه دونه ویدیو میده که اونم من خرج شما عزیزان کردم
هعی:)) همه اش فداکاری
ولی محدودیتش زیاده توی وویس اول هم کلمه احمق داشتم و هم نارنجک مجبور شدم هردو رو حذف کنم تا جنریت کنه
ولی کیفیتش خیلی خوبه
با اکانت capcut میتونین ازش استفاده کنید.
Dreamina.capcut.com
@aipulse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍8❤1❤🔥1
AI Pulse
اکی عزیزان فعلا تحقیقاتم تا همینجا قد داده
از اونجایی که این حوزه داره تازه شکل میگیره هنوز منابع زیادی براش نیست
که خوب خودش نشون میده زمینه ای هست که شاید بد نباشه یه نگاهی بهش داشته باشید و کلا دنبالش کنید
البته این مسیرها و اطلاعات بر این پایه هست که یک فرد برنامه نویس قصد داره وارد حوزه تخصصی AgentOps بشه پس یه سری اصول اولیه رو میدونه
چیزی که تو منابع مختلف اغلب تکرار شده
1. یادگیری مهندسی پرامپت هست نه پرامپت های معمولی بلکه چیزی که دولوپرها بهش نیاز دارن که Andrew Ng یک کورس توی همین زمینه داره
2. بعد از اون یادگرفتن فریمورک های مختلف ساخت ایجنت هست مثل LangChain
3. و بعد از اون فریم ورک هایی هست که به ایجنت ها امکان استفاده از ابزارها رو میده چیزهایی مثل MCP
4. قبل این ها هم انتظار میره نکات پایه ای تر مثل نحوه کار API ها، ساخت ایجنت های مبتنی بر RAG رو بلد باشید.
@aipluse24
از اونجایی که این حوزه داره تازه شکل میگیره هنوز منابع زیادی براش نیست
که خوب خودش نشون میده زمینه ای هست که شاید بد نباشه یه نگاهی بهش داشته باشید و کلا دنبالش کنید
البته این مسیرها و اطلاعات بر این پایه هست که یک فرد برنامه نویس قصد داره وارد حوزه تخصصی AgentOps بشه پس یه سری اصول اولیه رو میدونه
چیزی که تو منابع مختلف اغلب تکرار شده
1. یادگیری مهندسی پرامپت هست نه پرامپت های معمولی بلکه چیزی که دولوپرها بهش نیاز دارن که Andrew Ng یک کورس توی همین زمینه داره
2. بعد از اون یادگرفتن فریمورک های مختلف ساخت ایجنت هست مثل LangChain
3. و بعد از اون فریم ورک هایی هست که به ایجنت ها امکان استفاده از ابزارها رو میده چیزهایی مثل MCP
4. قبل این ها هم انتظار میره نکات پایه ای تر مثل نحوه کار API ها، ساخت ایجنت های مبتنی بر RAG رو بلد باشید.
@aipluse24
❤15👍9🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
خانم Sarah Friar مدیر ارشد مالی شرکت اوپنایآی (CFO) در مصاحبه اخیرش گفته OpenAI داره روی یک مهندس نرمافزار در قالب یک ایجنت هوش مصنوعی کار میکنه که برخلاف ابزارهای کنونی که صرفا سرعت توسعه نرم افزار رو افزایش میدن، این ایجنت میتونه علاوه بر ساخت اپلیکیشن، Pull Request هارو هندل کنه، پیرامون برنامه توسعه داده شده پرسش و پاسخ داشته باشه، باگ هارو فیکس کنه و حتی برای برنامه داکیومنت بنویسه.
@aipulse24
@aipulse24
🔥38❤2😁1🤯1🍌1
OpenAI امروز از خانوادهی جدیدی از مدلهای هوش مصنوعی به نام GPT-4.1 رونمایی کرد. این مدلها شامل GPT-4.1، GPT-4.1 mini و GPT-4.1 nano هستن که همگی بهگفتهی OpenAI توی برنامهنویسی و پیروی از دستورها عملکرد خیلی خوبی دارن. این مدلها فقط از طریق API قابل دسترس هستن و هنوز وارد نسخهی ChatGPT نشدن. یکی از ویژگیهای برجستهی GPT-4.1 داشتن کانتکست ویندوی ۱ میلیون توکنیه که تقریباً معادل ۷۵۰ هزار کلمهست؛ یعنی میتونه متونی بلندتر از رمان «جنگ و صلح» رو یکجا پردازش کنه.
عرضهی GPT-4.1 در شرایطی انجام شده که رقابت بین شرکتهای بزرگی مثل گوگل، Anthropic و DeepSeek برای ساخت مدلهای برنامهنویس قدرتمندتر بالا گرفته. گوگل مدل Gemini 2.5 Pro رو عرضه کرده که اونم کانتکست ویندوی ۱ میلیونی داره و توی بنچمارکهای برنامهنویسی رتبههای بالایی کسب کرده. مدل Claude 3.7 Sonnet از شرکت Anthropic و نسخهی جدید DeepSeek V3 هم عملکرد قابل توجهی داشتن. OpenAI هم هدف نهایی خودش رو ساختن یک «مهندس نرم افزار در قالب یک ایجنت هوش مصنوعی» اعلام کرده؛ مدلی که بتونه بهتنهایی کل فرایند توسعهی اپلیکیشن، از تست و رفع باگ تا نوشتن مستندات، رو انجام بده.
بهگفتهی OpenAI، مدل GPT-4.1 نسبت به نسخههای قبلی مثل GPT-4o و GPT-4o mini توی بنچمارکهایی مثل SWE-bench عملکرد بهتری داره و دقیقتر کدنویسی میکنه، تغییرات غیرضروری کمتری میده و بهتر به فرمتها و ترتیب پاسخ پایبنده. نسخهی nano سریعترین و ارزانترین مدل تا الان شناخته شده. قیمت استفاده از این مدلها هم بهترتیب برای هر یک میلیون توکن ورودی/خروجی: GPT-4.1، معادل ۲ و ۸ دلار؛ mini، معادل ۰.۴ و ۱.۶ دلار؛ و nano، معادل ۰.۱ و ۰.۴ دلاره.
OpenAI همچنین اعلام کرده که GPT-4.1 در تست Video-MME که برای ارزیابی توانایی درک محتوای ویدیویی طراحی شده، تونسته به دقت ۷۲٪ توی بخش «ویدیوهای بلند بدون زیرنویس» برسه. با اینکه این مدل اطلاعات بهروزتری نسبت به نسخههای قبلی داره (تا ژوئن ۲۰۲۴)، اما همچنان ممکنه در انجام بعضی کارها اشتباه کنه؛ بهخصوص وقتی با ورودیهای خیلی طولانی مواجه میشه. طبق یکی از تستهای داخلی OpenAI، دقت مدل از حدود ۸۴٪ با ۸۰۰۰ توکن، به ۵۰٪ با ۱ میلیون توکن کاهش پیدا کرده. همچنین، GPT-4.1 نسبت به GPT-4o گرایش بیشتری به تفسیر تحتاللفظی داره و گاهی نیاز به دستورهای دقیقتر داره.
@aipulse24
عرضهی GPT-4.1 در شرایطی انجام شده که رقابت بین شرکتهای بزرگی مثل گوگل، Anthropic و DeepSeek برای ساخت مدلهای برنامهنویس قدرتمندتر بالا گرفته. گوگل مدل Gemini 2.5 Pro رو عرضه کرده که اونم کانتکست ویندوی ۱ میلیونی داره و توی بنچمارکهای برنامهنویسی رتبههای بالایی کسب کرده. مدل Claude 3.7 Sonnet از شرکت Anthropic و نسخهی جدید DeepSeek V3 هم عملکرد قابل توجهی داشتن. OpenAI هم هدف نهایی خودش رو ساختن یک «مهندس نرم افزار در قالب یک ایجنت هوش مصنوعی» اعلام کرده؛ مدلی که بتونه بهتنهایی کل فرایند توسعهی اپلیکیشن، از تست و رفع باگ تا نوشتن مستندات، رو انجام بده.
بهگفتهی OpenAI، مدل GPT-4.1 نسبت به نسخههای قبلی مثل GPT-4o و GPT-4o mini توی بنچمارکهایی مثل SWE-bench عملکرد بهتری داره و دقیقتر کدنویسی میکنه، تغییرات غیرضروری کمتری میده و بهتر به فرمتها و ترتیب پاسخ پایبنده. نسخهی nano سریعترین و ارزانترین مدل تا الان شناخته شده. قیمت استفاده از این مدلها هم بهترتیب برای هر یک میلیون توکن ورودی/خروجی: GPT-4.1، معادل ۲ و ۸ دلار؛ mini، معادل ۰.۴ و ۱.۶ دلار؛ و nano، معادل ۰.۱ و ۰.۴ دلاره.
OpenAI همچنین اعلام کرده که GPT-4.1 در تست Video-MME که برای ارزیابی توانایی درک محتوای ویدیویی طراحی شده، تونسته به دقت ۷۲٪ توی بخش «ویدیوهای بلند بدون زیرنویس» برسه. با اینکه این مدل اطلاعات بهروزتری نسبت به نسخههای قبلی داره (تا ژوئن ۲۰۲۴)، اما همچنان ممکنه در انجام بعضی کارها اشتباه کنه؛ بهخصوص وقتی با ورودیهای خیلی طولانی مواجه میشه. طبق یکی از تستهای داخلی OpenAI، دقت مدل از حدود ۸۴٪ با ۸۰۰۰ توکن، به ۵۰٪ با ۱ میلیون توکن کاهش پیدا کرده. همچنین، GPT-4.1 نسبت به GPT-4o گرایش بیشتری به تفسیر تحتاللفظی داره و گاهی نیاز به دستورهای دقیقتر داره.
@aipulse24
🔥21❤3👍2❤🔥1🖕1
قابلیت ساخت ویدیو (Video Gen) با مدل Veo 2 حالا برای اکثر کاربران از طریق AI Studio در دسترس قرار گرفته.
@aipulse24
@aipulse24
🔥20❤2👍2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
توی دنیای هوش مصنوعی، یه شاخه خیلی مهم به اسم «یادگیری تقویتی» (Reinforcement Learning یا به اختصار RL) وجود داره. توی این روش، یه مدل یاد میگیره که چطور تصمیم بگیره تا به بهترین نتیجه برسه؛ درست مثل یه بازی که بازیکن با آزمون و خطا سعی میکنه امتیاز بیشتری بگیره. مدل با گرفتن پاداش یا جریمه از محیط، کمکم یاد میگیره چه کارهایی درسته و چه کارهایی نه.
حالا «دیوید سیلور» یکی از دانشمندان Google DeepMind یه نکته هیجانانگیز رو افشا کرده: «ما یه سیستمی ساختیم که با استفاده از یادگیری تقویتی، تونست خودش الگوریتمهای یادگیری تقویتی طراحی کنه.» به گفته سیلور، این سیستم که خودش با هوش مصنوعی ساخته شده، از تمام الگوریتمهای RL که طی سالها توسط انسانها طراحی شده بودن، عملکرد بهتری داشته.
@aipulse24
حالا «دیوید سیلور» یکی از دانشمندان Google DeepMind یه نکته هیجانانگیز رو افشا کرده: «ما یه سیستمی ساختیم که با استفاده از یادگیری تقویتی، تونست خودش الگوریتمهای یادگیری تقویتی طراحی کنه.» به گفته سیلور، این سیستم که خودش با هوش مصنوعی ساخته شده، از تمام الگوریتمهای RL که طی سالها توسط انسانها طراحی شده بودن، عملکرد بهتری داشته.
@aipulse24
👍35❤🔥8🔥7😁2❤1🌭1
دوستان خیاط در کوزه افتاد😃 😃
دیروز Cursor دچار یک باگ شده که اجازه نمیداده یوزر ها با یک اکانت روی دستگاه های مختلف وارد اکانتشون بشن.
وقتی این باگ اتفاق افتاده افراد از chatbot پیشتیبانی سوال کردن که چرا این اتفاق افتاده. اون بزرگوار هم توهم زده و گفته این سیاست جدید شرکته😭 😭
دلوپرهام شاکی شدن و یه تعداد خیلیییی زیادی اشتراک هاشون رو کنسل کردن.
بعد تازه افراد توی cursor فهمیدن چی شده:))
و عذرخواهی کردن (توی عکس اون ریپلای فاندر شرکت هست)
خلاصه وقتی human in the loop رو حذف میکنی این میشه:)))
@aipulse24
دیروز Cursor دچار یک باگ شده که اجازه نمیداده یوزر ها با یک اکانت روی دستگاه های مختلف وارد اکانتشون بشن.
وقتی این باگ اتفاق افتاده افراد از chatbot پیشتیبانی سوال کردن که چرا این اتفاق افتاده. اون بزرگوار هم توهم زده و گفته این سیاست جدید شرکته
دلوپرهام شاکی شدن و یه تعداد خیلیییی زیادی اشتراک هاشون رو کنسل کردن.
بعد تازه افراد توی cursor فهمیدن چی شده:))
و عذرخواهی کردن (توی عکس اون ریپلای فاندر شرکت هست)
خلاصه وقتی human in the loop رو حذف میکنی این میشه:)))
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣42👍3👀1
دِمیس هاسابیس، مدیرعامل گوگل دیپمایند، بهتازگی از طرف مجلهی تایم بهعنوان یکی از ۱۰۰ فرد تأثیرگذار سال ۲۰۲۵ معرفی شده و عکسش روی جلد این شماره قرار گرفته. هاسابیس که با توسعهی هوش مصنوعی آلفافولد تونسته نقش بزرگی در شتابدادن به کشفهای علمی در حوزههای زیستشناسی و پزشکی ایفا کنه، امسال موفق به دریافت نوبل شیمی هم شده.
ابزارهایی که تیم اون ساخته، الان توی آزمایشگاههای زیادی در سراسر دنیا، از جمله برای مقابله با بیماریهای ژنتیکی نادر، مقاومت آنتیبیوتیکی و حتی چالشهای اقلیمی در کشاورزی استفاده میشن. نگاه هاسابیس به زیستشناسی، نگاهی بینرشتهایه که از ترکیب علوم اعصاب، شناخت و محاسبات شکل گرفته؛ و این باعث شده نهتنها سیستمهای قدرتمند بسازه، بلکه فهم عمیقتری از حیات ارائه بده.
بهگفتهی تایم، آیندهی زیستشناسی مسیری مشترک، خلاقانه و میانرشتهای داره که هاسابیس با کارهاش سرعت رسیدن به اون رو بیشتر کرده.
@aipulse24
ابزارهایی که تیم اون ساخته، الان توی آزمایشگاههای زیادی در سراسر دنیا، از جمله برای مقابله با بیماریهای ژنتیکی نادر، مقاومت آنتیبیوتیکی و حتی چالشهای اقلیمی در کشاورزی استفاده میشن. نگاه هاسابیس به زیستشناسی، نگاهی بینرشتهایه که از ترکیب علوم اعصاب، شناخت و محاسبات شکل گرفته؛ و این باعث شده نهتنها سیستمهای قدرتمند بسازه، بلکه فهم عمیقتری از حیات ارائه بده.
بهگفتهی تایم، آیندهی زیستشناسی مسیری مشترک، خلاقانه و میانرشتهای داره که هاسابیس با کارهاش سرعت رسیدن به اون رو بیشتر کرده.
@aipulse24
🔥29👍8❤4
چجوری بفهمیم بهترین مدل برای استفاده ما چیه؟
۱. بنچ مارک ها. بنچ مارک کلا یعنی مقایسه عملکرد یه چیزی نسبت به یه مقیاس مشخصی
شرکت ها و موسسات خیلیی خیلی زیادی ایجاد شدن که کارشون همینه
روش های متنوع هم براش هست
یکی از معروف ترین هاش اینجا توضیح دادم
کارش اینه که دوتا مدل رو میزاره جلوی کاربر تا استفاده کنه بدون اینکه کاربر بدونه مدل ها کدومن بعد میگی بگو کدوم بهتر بودن و براساس تعداد ارایی که برای هر مدل میگیره عملکرد رو مشخص میکنه
روش دیگه یک سری تست و ازمون هست مثلا یه سری سوال برنامه نویسیه یا یه سری سوال ریاضیه یا اخیرا خود اوپن ai اومده و یک بنچ مارک درست کرده برای سطح ادراک مدل ها از مقالات علمی که راجع به مقالات ارایه شده توی ICML 2024 سوال کرده که یک کنفرانس خفن برنامه نویسی هست و سطح شون رو بررسی کرده و این یکی هم یه تست دیگه با عنوان humanity last exam هست.
هر کدوم از این بنچ مارک ها یه حوزه رو بررسی میکنن و هیچ کدوم جامع نیستن
یعنی یکی وضعیت ریاضی رو چک میکنه یکی مقالات علمی یکی کد نویسی یکی هم تولید محتوا
✅ پس روش اول بررسی این سایت بنچ مارک هاست تا به نتیجه برسی کدوم بهتره
این پست توضیح دادم که با این ابزار تو این سایته میتونی use case ات رو بگی و بهت بهترین مدل رو معرفی میکنه
البته که چون خیلی از مدل ها روی سوالات بنچ مارک ها ترین میشن گاهی این بنچ مارک ها کامل قابل اتکا نیستن
روش دوم راستش ازمون و خطاست و هیچ مدلی هیچ وقت بهترین نیست
✅ تئوری no free lunch theorem که اینجا میتونین راجع بهش بخونین میگه هیچ مدلی برای همه اشکال مسئله بهترین نیست
شما باید براساس نیازی که داری خودت سبک سنگین کنی
بهترین روش اینه یک سری پرامپت برای کاری که میخوای بکنی رو عیناااا بدی به همه مدل ها و ببینی کدوم بهتر عمل میکنن و با اون کار کنی
در نهایت هم همین برتری ممکنه باز ۳ ۴ ماه دیگه با توجه به سرعت تغییرات عوض بشه
@aipulse24
۱. بنچ مارک ها. بنچ مارک کلا یعنی مقایسه عملکرد یه چیزی نسبت به یه مقیاس مشخصی
شرکت ها و موسسات خیلیی خیلی زیادی ایجاد شدن که کارشون همینه
روش های متنوع هم براش هست
یکی از معروف ترین هاش اینجا توضیح دادم
کارش اینه که دوتا مدل رو میزاره جلوی کاربر تا استفاده کنه بدون اینکه کاربر بدونه مدل ها کدومن بعد میگی بگو کدوم بهتر بودن و براساس تعداد ارایی که برای هر مدل میگیره عملکرد رو مشخص میکنه
روش دیگه یک سری تست و ازمون هست مثلا یه سری سوال برنامه نویسیه یا یه سری سوال ریاضیه یا اخیرا خود اوپن ai اومده و یک بنچ مارک درست کرده برای سطح ادراک مدل ها از مقالات علمی که راجع به مقالات ارایه شده توی ICML 2024 سوال کرده که یک کنفرانس خفن برنامه نویسی هست و سطح شون رو بررسی کرده و این یکی هم یه تست دیگه با عنوان humanity last exam هست.
هر کدوم از این بنچ مارک ها یه حوزه رو بررسی میکنن و هیچ کدوم جامع نیستن
یعنی یکی وضعیت ریاضی رو چک میکنه یکی مقالات علمی یکی کد نویسی یکی هم تولید محتوا
✅ پس روش اول بررسی این سایت بنچ مارک هاست تا به نتیجه برسی کدوم بهتره
این پست توضیح دادم که با این ابزار تو این سایته میتونی use case ات رو بگی و بهت بهترین مدل رو معرفی میکنه
البته که چون خیلی از مدل ها روی سوالات بنچ مارک ها ترین میشن گاهی این بنچ مارک ها کامل قابل اتکا نیستن
روش دوم راستش ازمون و خطاست و هیچ مدلی هیچ وقت بهترین نیست
✅ تئوری no free lunch theorem که اینجا میتونین راجع بهش بخونین میگه هیچ مدلی برای همه اشکال مسئله بهترین نیست
شما باید براساس نیازی که داری خودت سبک سنگین کنی
بهترین روش اینه یک سری پرامپت برای کاری که میخوای بکنی رو عیناااا بدی به همه مدل ها و ببینی کدوم بهتر عمل میکنن و با اون کار کنی
در نهایت هم همین برتری ممکنه باز ۳ ۴ ماه دیگه با توجه به سرعت تغییرات عوض بشه
@aipulse24
❤16👍13