کاوش در دنیای هوش مصنوعی
چت جیپیتی با مشکل روبرو شده.
خب همونطوری که احتمالا متوجه شدید، مشکل OpenAI رفع شد. امروز حدود ساعت ۸:۱۵ صبح (به تایمزون ایران) خبر درست شدنش رو اعلام کردند:
🔻 پینوشت:
۲ ساعت بعد خبر بالا، مشکل Sora هم رفع شد!
🔗 متنها برداشته شده از صفحه وضعیت OpenAI:
https://status.openai.com/
#خبر_هوش_مصنوعی
@Explore_AI
از ساعت ۱۰:۴۰ صبح به وقت PST (منطقه زمانی اقیانوس آرام)، ما با نرخ خطای بالا در ChatGPT و Sora و بخشی از APIها مواجه شدیم. بهبودی برای Sora از حدود ساعت ۲:۵۸ بعد از ظهر به وقت PST، ترافیک API از حدود ساعت ۳:۰۵ بعد از ظهر به وقت PST و بهبودی کامل برای ChatGPT حدود ساعت ۸:۱۶ شب به وقت PST آغاز شد. ما در حال بررسی یک حادثه جداگانه مربوط به Sora هستیم و صفحه وضعیت را بهروزرسانی خواهیم کرد.
شرکت OpenAI یک تحلیل کامل ریشهای از این اختلال انجام خواهد داد و جزئیات را پس از تکمیل در این صفحه به اشتراک خواهد گذاشت.
🔻 پینوشت:
۲ ساعت بعد خبر بالا، مشکل Sora هم رفع شد!
🔗 متنها برداشته شده از صفحه وضعیت OpenAI:
https://status.openai.com/
#خبر_هوش_مصنوعی
@Explore_AI
11👍6
prompt_engineering.pdf
1.2 MB
⭕️ یکی از کلیدهای اصلی کار با انواع هوش مصنوعی، #پرامپت_نویسی هست.
اینکه بتونیم دقیقاً چیزی که از هوش مصنوعی میخوایم رو بهش بفهمونیم، و اون رو به سمت دادن پاسخهای بهینه و مطلوب هدایت کنیم، یه مهارته. کتاب «جادوی پرامپتنویسی» دقیقاً درباره همین مهارت، با توضیحات دقیق و کامل و چندین مثال صحبت میکنه.
🐋 مهندسی پرامپت (Prompt Engineering):
📖 مشخصات این کتاب:
⭕️ نویسنده: ChatGPT-4o
⭕️ گردآورنده: 🖥 مهناز آقائی
⭕️ با هدایت: 🖥 دکتر حسین کریمی
⭕️ تعداد صفحات: ۶۸ صفحه
📝 معرفی این کتاب از متن خودش:
این کتاب به بررسی اصول و تکنیکهای پرامپتنویسی میپردازد و هدف آن ارتقای مهارتهای کاربران در نوشتن پرامپتهای مؤثر و کارآمد است. در این کتاب، به انواع تکنیکهای پرامپتنویسی پرداخته میشود که به کاربر کمک میکند تا بسته به نیاز خود، پرامپتهایی دقیق و مناسب طراحی کند.
از تکنیکهای ساده تا پیشرفتهتر، هرکدام در قالب مثالهایی کاربردی و ملموس معرفی میشوند تا خوانندگان بتوانند با استفاده از آنها بهراحتی به نتایج دلخواه خود دست یابند. علاوه بر این، مشکلات و چالشهایی که ممکن است در فرآیند نوشتن پرامپت پیش آید نیز بررسی و راهکارهایی برای حل آنها ارائه میشود.
👤 مخاطبین اصلی این کتاب چه کسانی هستند؟
مخاطبان اصلی این کتاب افرادی هستند که با مدلهای هوش مصنوعی، بهویژه مدلهای زبان مانند GPT، آشنایی دارند و میخواهند تواناییهای خود را در پرامپتنویسی بهبود دهند.
💻 سرفصلهای کتاب:
🔖 فصل اول: اصول و مبانی پرامپتنویسی
🔖 فصل دوم: تکنیکهای اصلی در پرامپتنویسی
🔖 فصل سوم: چالشها و مشکلات رایج در پرامپتنویسی
🔖 فصل چهارم: پیشرفتهترین تکنیکها و راهنماییها
🔖 فصل پنجم: نتیجهگیری و آینده پرامپتنویسی
🏷 فهرست پرامپتهای کاربردی برای صنایع مختلف:
⭕️ صنعت پزشکی
⭕️ صنعت بازاریابی
⭕️ صنعت فناوری اطلاعات
⭕️ صنعت آموزش
درنهایت، این چند جمله از این کتاب هم بنظرم خیلی خوب اومد:
🔺 یک روش مؤثر برای بهینهسازی پرامپتها استفاده از تکنیکهای آزمون و خطا است.
🔺 پرامپتنویسی بهعنوان یک مهارت پویا و همزمان با رشد و تکامل مدلهای هوش مصنوعی، نیازمند توجه و یادگیری مستمر است.
🔺 یادگیری پرامپتنویسی بهصورت گامبهگام و با تمرینهای عملی انجام میشود.
🖥 کل خوندن این کتاب نهایتا ۲ ساعت زمان بگیره، ولی بخاطر منسجمبودن و رعایت ترتیب مباحث و همچنین مثالهای خوبش، اطلاعات زیادی رو در اختیار شما میذاره.
منبع:🖥 لینکدین خانم مهناز آقائی
@Explore_AI
اینکه بتونیم دقیقاً چیزی که از هوش مصنوعی میخوایم رو بهش بفهمونیم، و اون رو به سمت دادن پاسخهای بهینه و مطلوب هدایت کنیم، یه مهارته. کتاب «جادوی پرامپتنویسی» دقیقاً درباره همین مهارت، با توضیحات دقیق و کامل و چندین مثال صحبت میکنه.
به فرآیند طراحی، تنظیم و بهینهسازی درخواستها یا سوالاتی گفته میشود که به مدلهای هوش مصنوعی ارائه میکنید تا پاسخهای دقیقتر، مرتبطتر و کارآمدتری بگیرید.
این کتاب به بررسی اصول و تکنیکهای پرامپتنویسی میپردازد و هدف آن ارتقای مهارتهای کاربران در نوشتن پرامپتهای مؤثر و کارآمد است. در این کتاب، به انواع تکنیکهای پرامپتنویسی پرداخته میشود که به کاربر کمک میکند تا بسته به نیاز خود، پرامپتهایی دقیق و مناسب طراحی کند.
از تکنیکهای ساده تا پیشرفتهتر، هرکدام در قالب مثالهایی کاربردی و ملموس معرفی میشوند تا خوانندگان بتوانند با استفاده از آنها بهراحتی به نتایج دلخواه خود دست یابند. علاوه بر این، مشکلات و چالشهایی که ممکن است در فرآیند نوشتن پرامپت پیش آید نیز بررسی و راهکارهایی برای حل آنها ارائه میشود.
مخاطبان اصلی این کتاب افرادی هستند که با مدلهای هوش مصنوعی، بهویژه مدلهای زبان مانند GPT، آشنایی دارند و میخواهند تواناییهای خود را در پرامپتنویسی بهبود دهند.
فصل1️⃣ درباره اهمیت پرامپتنویسی و اصول طراحی یک پرامپت مؤثر صحبت میکنه و توضیح میده چطور میتونید پاسخهای دقیقتر و کاربردیتری از مدل دریافت کنید.
فصل2️⃣ ، تکنیکهایی مثل پرامپتهای شرطی، پرامپتهای مبتنی بر شخصیت و پرامپتهای سناریو بررسی شدهاند تا کمک کنه پرامپتهای هدفمند و دقیقتری طراحی کنید.
فصل3️⃣ به اشتباهات رایج در پرامپتنویسی (مثل ابهام یا عدم شفافیت) میپردازه و راهکارهایی ارائه میده که بتونید این مشکلات رو برطرف کنید.
تکنیکهای پیشرفته و روشهای بهینهسازی پرامپت برای استفادههای حرفهایتر در فصل4️⃣ معرفی شده. این بخش بیشتر به درد برنامهنویسها میخوره که از هوش مصنوعی استفاده میکنن، ولی آشنایی با مفاهیمی مثل temperature و token برای کاربران عادی هم میتونه جذاب باشه.
فصل5️⃣ هم روی اهمیت یادگیری مداوم پرامپتنویسی تمرکز میکنه، با ذکر نکات کلیدی، توصیهها و نگاهی به آینده این مهارت.
درنهایت، این چند جمله از این کتاب هم بنظرم خیلی خوب اومد:
منبع:
@Explore_AI
Please open Telegram to view this post
VIEW IN TELEGRAM
12❤2👍1😁1
TechTube 𝕏 تک توب
شرکت چینی Deepseek بزرگترین و قدرتمندین هوش مصنوعی متن باز جهان رو عرضه کرده
⭕️ اپلیکیشن رسمی DeepSeek در اپاستور اپل با قابلیتهای:
💭 تفکر عمیق (تفکر استدلالی)
🔍 جستجو در وب
منتشر شد:
🍏 https://apps.apple.com/us/app/deepseek/id6737597349
🔗 منبع: TestingCatalog News 🗞
🔻 پینوشت:
دیپسیک احتمالا بهترین جایگزین رایگان برای ChatGPT (بدون نیاز به فیلتر و تحریم شکن) هست.
#خبر_هوش_مصنوعی
🖥 @Explore_AI
منتشر شد:
🔻 پینوشت:
دیپسیک احتمالا بهترین جایگزین رایگان برای ChatGPT (بدون نیاز به فیلتر و تحریم شکن) هست.
#خبر_هوش_مصنوعی
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍6❤3👎1🔥1💯1
Forwarded from Reza Jafari
من از این پرامپت خیلی استفاده کردم و تونستم از مطالبی که قرار بود یاد بگیرم،سریع یه دید کلی و خوب پیدا کنم. برای مثال، همونطور که در تصویر بالا میبینید، یکی از کاربردهای این پرامپت به این صورت بود که ازش استفاده کردم.
Prompt Template:
@reza_jafari_ai
Prompt Template:
Teach me about {subject} in simple terms. What is it, where is it used, give me a lot of examples, and explain how a {profession} can use it to their advantage. @reza_jafari_ai
👍3❤2
Reza Jafari
Prompt Template
⭕️ بطور کلی، هوش مصنوعیها «انگلیسی» رو بهتر میفهمن و بهتر هم پاسخ میدن.
بنابراین شخصا [مخصوصا برای پرامپتهای اینچنینی که از اینترنت پیدا، کپی و استفاده میکنم] ترجیح میدم:
⭕️ یا «انگلیسی» استفاده کنم؛
⭕️ یا در انتهای پرامپت عبارت "
در مثال بالا:
🔻 پینوشت:
این دوستمون که از کانالش فورارد کردم، از دیپسیک مثال آورده، ولی طبیعتا برای هر هوش مصنوعی دیگه از جمله ChatGPT هم این پرامپت کاربرد داره.
#پرامپت_نویسی
@Explore_AI
بنابراین شخصا [مخصوصا برای پرامپتهای اینچنینی که از اینترنت پیدا، کپی و استفاده میکنم] ترجیح میدم:
(Explain in Persian)" رو بنویسم تا پرامپت رو «انگلیسی بفهمه» ولی بصورت «فارسی پاسخ بده» (که خوندنش راحتتر و سریعتره).در مثال بالا:
Teach me about {subject} in simple terms. What is it, where is it used, give me a lot of examples, and explain how a {profession} can use it to their advantage. (Explain in Persian) 🔻 پینوشت:
این دوستمون که از کانالش فورارد کردم، از دیپسیک مثال آورده، ولی طبیعتا برای هر هوش مصنوعی دیگه از جمله ChatGPT هم این پرامپت کاربرد داره.
#پرامپت_نویسی
@Explore_AI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🔥1🙏1💯1
⭕️ قابلیت وظایف زمانبندیشده (Scheduled Tasks) در چتجیپیتی
ویژگی جدید وظایف زمانبندیشده (Scheduled Tasks) در حالت بتا برای کاربران پلنهای Plus، Pro و Team فعال شده. البته بعدا این قابلیت برای گروههای بیشتری در دسترس قرار میگیره.
🚩 خلاصه مطلب:
⭕️ پشتیبانی از تسکها در نسخههای:
وب🌐 ، iOS📱 ، اندروید📱 و macOS💻
(نسخه ویندوز💻 تا پایان سهماهه اول امسال)
⭕️ امکان ایجاد وظایف با زمانبندی مشخص (یکبار یا تکرارشونده)
⭕️ اجرای وظایف حتی در زمانی که آنلاین نیستید
⭕️ ارسال نوتیفیکیشن🔔 یا ایمیل✉️ پس از تکمیل تسک
🗂 چند مثال کاربردی از تسکها:
🔻 دریافت روزانهٔ خلاصه اخبار مورد نظر شما (کریپتو، تکنولوژی، سیاسی و ...).
🔻 تمرین زبان خارجی بهصورت روزانه در ساعت مقرر.
🔻 یادآوری تاریخ تولد عزیزان.
🗃 راهاندازی تسکها:
1️⃣ روی آیکون پروفایل کلیک کنید و گزینه «Tasks» رو انتخاب کنید. (تصویر اول)
2️⃣ میتونید یکی از وظایف پیشنهادی رو انتخاب کنید یا گزینه «Try your own» رو برای تعریف تسک جدید انتخاب کنید. (تصویر دوم)
3️⃣ امکان ویرایش یا توقف تسکها از طریق صفحه تسکها در دسترس هست. (ویدئو دوم)
⚠️ محدودیتهای استفاده از تسکها:
- هر کاربر نهایتا ۱۰ میتونه ۱۰ تسک فعال همزمان داشته باشه.
- تسکها از مدل GPT-4o استفاده میکنن، بنابراین محدودیتهای پلن اشتراک ChatGPT برای این وظایف هم اعمال میشه.
- بعضی قابلیتها مثل آپلود فایل، چت صوتی و GPTهای تخصصی هنوز در این نسخه بتا پشتیبانی نمیشن.
🔗 لینکهای مفید:
◀️ صفحه تسکها در چتجیپیتی
◀️ توضیحات سایت OpenAI درباره تسکها
◀️ دسترسی مستقیم به صفحه چت برای ایجاد و ویرایش تسکها
◀️ صحفه دانلود اپلیکیشن چتجیپیتی برای پلتفرمهای مختلف
◀️ صفحه تنظیمات نوتیفیکیشنها (👤 ←⚙ ←🔔 ) (تصویر چهارم)
#خبر_هوش_مصنوعی
@Explore_AI
ویژگی جدید وظایف زمانبندیشده (Scheduled Tasks) در حالت بتا برای کاربران پلنهای Plus، Pro و Team فعال شده. البته بعدا این قابلیت برای گروههای بیشتری در دسترس قرار میگیره.
وب
(نسخه ویندوز
⬅️ در صفحه چت هم میتونید از قسمت انتخاب مدل چتجیپیتی، مدل ChatGPT with scheduled tasks رو انتخاب کنید (تصویر سوم) و ازش بخواید تا تسک مورد نظر شما رو ایجاد کنه! (ویدئو اول)
- هر کاربر نهایتا ۱۰ میتونه ۱۰ تسک فعال همزمان داشته باشه.
- تسکها از مدل GPT-4o استفاده میکنن، بنابراین محدودیتهای پلن اشتراک ChatGPT برای این وظایف هم اعمال میشه.
- بعضی قابلیتها مثل آپلود فایل، چت صوتی و GPTهای تخصصی هنوز در این نسخه بتا پشتیبانی نمیشن.
#خبر_هوش_مصنوعی
@Explore_AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍4❤1🔥1
کاوش در دنیای هوش مصنوعی
اپلیکیشن رسمی DeepSeek در اپاستور
⭕️ اپلیکیشن رسمی DeepSeek در پلیاستور گوگل هم با قابلیتهای:
💭 تفکر عمیق (تفکر استدلالی)
🔍 جستجو در وب
✨ و همچنین ویژگیهای:
🔓 لاگین ساده با ایمیل / اکانت گوگل / اپل آیدی
🔄 دسترسی به تاریخچه چت از همه پلتفرمها
📄 آپلود فایل و استخراج متن از فایل
✅ کاملا رایگان و بدون نیاز به تحریم و فیلتر شکن
منتشر شد:
🤖 https://play.google.com/store/apps/details?id=com.deepseek.chat
🔗 منبع: توییتر DeepSeek
🔻 پینوشت:
🤖 صفحه دانلود فایل apk در سایت DeepSeek (بعد از باز کردن صفحه، روی Alternative Download Methods کلیک کنید و Download APK File رو بزنید)
🍏 توضیحات + دانلود برای iOS
#خبر_هوش_مصنوعی
🖥 @Explore_AI
منتشر شد:
🔻 پینوشت:
#خبر_هوش_مصنوعی
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🤩1💯1
این مدل استدلالی (Reasoning Model) طبق بنچمارکهای مختلف (تصویر اول)، در ریاضی، کدنویسی، و کارهای استدلالی، عملکردی همسطح با مدل استدلالی o1 در ChatGPT داشته و همین الان از طریق وبسایت دیپسیک
📏 ۶ مدل کوچکِ کاملا اوپنسورس
(مدلهای 32B و 70B همسطح با OpenAI-o1-mini) (تصویر دوم)
🛠 خروجیهای API قابل استفاده برای فاینتیون کردن و ساخت مدلهای کوچک اختصاصی
🔻 پینوشت:
#معرفی_هوش_مصنوعی #خبر_هوش_مصنوعی
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3🔥3
کاوش در دنیای هوش مصنوعی
مدل استدلالی جدید DeepSeek به اسم R1
از مدل R1 دیپسیک خواستم یک عدد بین ۱ تا ۱۰٫۰۰۰ بصورت تصادفی انتخاب کنه.
زنجیره افکار (Chain of Thought - COT) رو ببینید چقدر خوددرگیری داره 😄 که در نهایت عدد رو میده، ببینید:
⚡ مشاهده زنجیره افکار دیپسیک R1
اگه حال انگلیسی خوندن ندارید، ترجمه COT به فارسی:
⚡ مشاهده ترجمه زنجیره افکار دیپسیک R1 (به فارسی)
منبع: ایده رو از توییت Flowers و توییت Mani گرفتم و تست کردم.
🔻پینوشت:
لینکها دارای نمایش سریع داخل تلگرام (Instant View) هستند. متن خیلی بلند بود، بیشتر از یک پیام میشد.
#شوخی
@Explore_AI
زنجیره افکار (Chain of Thought - COT) رو ببینید چقدر خوددرگیری داره 😄 که در نهایت عدد رو میده، ببینید:
اگه حال انگلیسی خوندن ندارید، ترجمه COT به فارسی:
منبع: ایده رو از توییت Flowers و توییت Mani گرفتم و تست کردم.
🔻پینوشت:
لینکها دارای نمایش سریع داخل تلگرام (Instant View) هستند. متن خیلی بلند بود، بیشتر از یک پیام میشد.
#شوخی
@Explore_AI
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤣12🔥4👍1
Forwarded from TechTube 𝕏 تک توب
مدل دیپ سیک به دلیل دقت بالا، رایگان بودن و هزینه پایین توسعه، طی روزهای گذشته بسیار وایرال شده و سرزبونها افتاده به طوری که از دایره کسایی که این حوزه رو دنبال میکنن هم خارج شده و اونقدر افراد عادی از اون استفاده میکنن که حالا اپ موبایل اون در اپ استور محبوبترین اپ مجانی در امریکا هست و حتی بالای ChatGPT قرار گرفته و 2.6 میلیون دانلود رو دو پلتفرم اندروید و iOS تجربه کرده!
🔎 techcrunch
📍 @TechTube
🔎 techcrunch
📍 @TechTube
👍3🔥3🤯3💯1
Forwarded from Alireza Rajaei | علیرضا رجایی
ثبتنام در دیپسیک متوقف شد
#DeepSeek
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤5🔥1
چرا نوآوریهای هوش مصنوعی DeepSeek همه رو شوکه کرده؟
(و شاید تهدیدی برای ارزش ۲ تریلیون دلاری انویدیا باشه)
اول یه مقدمه:
همین الان آموزش دادن مدلهای هوش مصنوعیِ درست حسابی، هزینهای وحشتناک داره. مثلا OpenAI یا Anthropic بیش از ۱۰۰ میلیون دلار فقط برای پردازش هزینه میکنن. کلی دیتاسنتر پر از کارت گرافیکهای ۴۰ هزار دلاری لازم دارن! انگار یه نیروگاه کامل فقط برای راه انداختن یه کارخانه لازمه!😅
حالا دیپسیک اومده گفته:
و نه تنها گفتن، بلکه واقعا انجام دادن!
مدلهایی ساختن که توی خیلی از کارها با GPT-4 و Claude رقابت میکنه یا حتی بهتره [نمودار مقایسه عملکرد]. دنیای هوش مصنوعی الان رسما (به قول جوونترها) ترکیده!🤯
چطور این کار رو کردن؟
از اول به همه چیز دوباره فکر کردن!
مدلهای سنتی هوش مصنوعی مثل اینه که بخوای هر عددی رو با ۳۲ رقم اعشار بنویسی. دیپسیک گفته:
نتیجه؟ ۷۵٪ کاهش حافظهی لازم!🤩
بعد نوبت سیستم «چندتوکنی / multi-token»شونه.
مدلهای معمولی مثل کلاس اولیها میخونن:
«گربه... روی... تخت... نشست...»
دیپسیک چی؟
۲ برابر سریعتر، ۹۰٪ همون دقت! (وقتی میلیاردها کلمه پردازش میکنی، این کلی فرق داره)
اما بخش شاهکارشون کجاست؟ ساختن یک «سیستم متخصص»!
مدلهای معمولی مثل یه آدمه که میخواد هم دکتر باشه، هم مهندس، هم وکیل.
دیپسیک گفته:
نتیجه؟
مدلهای سنتی: همهی ۱.۸ تریلیون پارامترشون همیشه فعاله.
دیپسیک: از ۶۷۱ میلیارد پارامتر، فقط ۳۷ میلیاردش همزمان فعاله.
مثل اینه که یه تیم بزرگ داشته باشی، ولی فقط متخصصهای لازم رو برای هر کار صدا بزنی.😎
نتایج این همه نوآوری چی بوده؟
[توضیح مورد آخر: کارتهای گرافیک اختصاصی برای آموزش مدلهای هوش مصنوعی (مثل A100 و H100 و ...) که بسیار پرمصرف و گرون هستن، پردازشهای سنگین رو با سرعت بالا انجام میدن. حالا دیپسیک قابلیتی ایجاد کرده که از کارت گرافیکهای مخصوص بازی (بسیار ارزونتر و کممصرفتر) هم بشه استفاده کرد!]
الان میگی: «حتما یه جای کار میلنگه!»
ولی نه، همه چیز اوپن سورسه. کدشون عمومیه. مقالاتشون توضیح میده.
هیچ جادویی توش نیست، فقط یه مهندسی فوقالعاده هوشمندانه!
چرا کار دیپسیک مهمه؟
چون معادلهی «فقط شرکتهای غولپیکر میتونن توی هوش مصنوعی کار کنن» رو بهم میزنه.
دیگه نیاز به دیتاسنترهای میلیارد دلاری نداری. چندین تا کارت گرافیک خوب کافیه.
طبیعتا برای انویدیا، این خبر وحشتناکه.
کل مدل کسبوکارشون اینه که کارتهای گرون بفروشن با حاشیه سود ۹۰٪.
اگه همه بتونن با کارتهای گرافیک معمولی گیمینگ کار کنن... مشکلش جدی برای NVIDIA رو میفهمید دیگه!
دیپسیک این کار رو با تیمی کمتر از ۲۰۰ نفر انجام داده!
در حالی که تیمهای متا (فیسبوک) فقط حقوقشون از کل بودجهی آموزش مدل دیپسیک بیشتره... و مدلهاشون اینقدری خوب نیست.😏
این داستان، یه داستان کلاسیک از «تحول»هست:
شرکتهای بزرگ روی بهینهسازی سیستمهای موجود تمرکز میکنن، ولی تازهواردها همه چیز رو از اول طراحی میکنن!
دیپسیک گفته:
و اما، پیامدهای عظیم این کار:
البته غولهایی مثل OpenAI و Anthropic ساکت نمیمونن.
احتمالا همین حالا دارن این نوآوریها رو پیاده میکنن.
ولی «جادوی کارایی» دیگه از چراغ بیرون اومده. دیگه نمیشه به روش «سختافزار بیشتر بریز» برگشت!
حرف آخر
این یکی از اون لحظههای تاریخی بنظر میرسه. مثل وقتی که کامپیوترهای شخصی، کامپیوترهای بزرگ سازمانی رو به چالش کشیدن، یا وقتی که محاسبات ابری همه چیز رو عوض کردن.
🎉 هوش مصنوعی داره خیلی دسترسپذیرتر و ارزونتر میشه✨
الان سوال این نیست که آیا غولها رو به چالش میکشه یا نه، سوال اینه که:
🔗 منبع: ترجمهٔ با کمی تغییرات و توضیحات اضافه از رشته توییت Morgan Brown (معاون بخش محصولات هوش مصنوعی شرکت Dropbox)
🖥 @Explore_AI
(و شاید تهدیدی برای ارزش ۲ تریلیون دلاری انویدیا باشه)
⚠️ این ترجمهٔ یک مطلب تخصصی (البته به زبان ساده) برای علاقمندان به شیوهٔ کارکرد هوشمصنوعیها هست. اگر کاربر عادی هستید احتمالا این مطلب به درد شما نخوره. ولی بهرحال خوندنش خالی از لطف نیست.
اول یه مقدمه:
همین الان آموزش دادن مدلهای هوش مصنوعیِ درست حسابی، هزینهای وحشتناک داره. مثلا OpenAI یا Anthropic بیش از ۱۰۰ میلیون دلار فقط برای پردازش هزینه میکنن. کلی دیتاسنتر پر از کارت گرافیکهای ۴۰ هزار دلاری لازم دارن! انگار یه نیروگاه کامل فقط برای راه انداختن یه کارخانه لازمه!
حالا دیپسیک اومده گفته:
«اوهوکی! چی میشه اگه همه اینا رو با ۵ میلیون دلار انجام بدیم؟»
و نه تنها گفتن، بلکه واقعا انجام دادن!
مدلهایی ساختن که توی خیلی از کارها با GPT-4 و Claude رقابت میکنه یا حتی بهتره [نمودار مقایسه عملکرد]. دنیای هوش مصنوعی الان رسما (به قول جوونترها) ترکیده!
چطور این کار رو کردن؟
از اول به همه چیز دوباره فکر کردن!
مدلهای سنتی هوش مصنوعی مثل اینه که بخوای هر عددی رو با ۳۲ رقم اعشار بنویسی. دیپسیک گفته:
«چرا ۸ رقم کافی نباشه؟»
نتیجه؟ ۷۵٪ کاهش حافظهی لازم!
بعد نوبت سیستم «چندتوکنی / multi-token»شونه.
مدلهای معمولی مثل کلاس اولیها میخونن:
«گربه... روی... تخت... نشست...»
دیپسیک چی؟
جملهها رو یکجا میخونه:
«گربه روی تخت نشست.»
۲ برابر سریعتر، ۹۰٪ همون دقت! (وقتی میلیاردها کلمه پردازش میکنی، این کلی فرق داره)
اما بخش شاهکارشون کجاست؟ ساختن یک «سیستم متخصص»!
مدلهای معمولی مثل یه آدمه که میخواد هم دکتر باشه، هم مهندس، هم وکیل.
دیپسیک گفته:
«متخصص میخوایم. هر کی فقط وقتی لازمه وارد عمل بشه.»
نتیجه؟
مدلهای سنتی: همهی ۱.۸ تریلیون پارامترشون همیشه فعاله.
دیپسیک: از ۶۷۱ میلیارد پارامتر، فقط ۳۷ میلیاردش همزمان فعاله.
مثل اینه که یه تیم بزرگ داشته باشی، ولی فقط متخصصهای لازم رو برای هر کار صدا بزنی.
نتایج این همه نوآوری چی بوده؟
• هزینهی آموزش: ۱۰۰ میلیون دلار ← ۵ میلیون دلار
• کارتهای گرافیک لازم: ۱۰۰٫۰۰۰ ← ۲٫۰۰۰ عدد
• هزینه API: تقریبا ۹۵٪ ارزونتر
• اجرا حتی روی کارت گرافیکهای گیمینگ!
[توضیح مورد آخر: کارتهای گرافیک اختصاصی برای آموزش مدلهای هوش مصنوعی (مثل A100 و H100 و ...) که بسیار پرمصرف و گرون هستن، پردازشهای سنگین رو با سرعت بالا انجام میدن. حالا دیپسیک قابلیتی ایجاد کرده که از کارت گرافیکهای مخصوص بازی (بسیار ارزونتر و کممصرفتر) هم بشه استفاده کرد!]
الان میگی: «حتما یه جای کار میلنگه!»
ولی نه، همه چیز اوپن سورسه. کدشون عمومیه. مقالاتشون توضیح میده.
هیچ جادویی توش نیست، فقط یه مهندسی فوقالعاده هوشمندانه!
چرا کار دیپسیک مهمه؟
چون معادلهی «فقط شرکتهای غولپیکر میتونن توی هوش مصنوعی کار کنن» رو بهم میزنه.
دیگه نیاز به دیتاسنترهای میلیارد دلاری نداری. چندین تا کارت گرافیک خوب کافیه.
طبیعتا برای انویدیا، این خبر وحشتناکه.
کل مدل کسبوکارشون اینه که کارتهای گرون بفروشن با حاشیه سود ۹۰٪.
اگه همه بتونن با کارتهای گرافیک معمولی گیمینگ کار کنن... مشکلش جدی برای NVIDIA رو میفهمید دیگه!
دیپسیک این کار رو با تیمی کمتر از ۲۰۰ نفر انجام داده!
در حالی که تیمهای متا (فیسبوک) فقط حقوقشون از کل بودجهی آموزش مدل دیپسیک بیشتره... و مدلهاشون اینقدری خوب نیست.
این داستان، یه داستان کلاسیک از «تحول»هست:
شرکتهای بزرگ روی بهینهسازی سیستمهای موجود تمرکز میکنن، ولی تازهواردها همه چیز رو از اول طراحی میکنن!
دیپسیک گفته:
«بهجای اینکه سختافزار بیشتری بریزیم، چی میشه اگه هوشمندانهتر این کارو کنیم؟»
و اما، پیامدهای عظیم این کار:
• توسعهی هوش مصنوعی دسترسپذیرتر میشه
• رقابت خیلی بیشتر میشه
• «خندقهای دفاعی» شرکتهای بزرگ بیشتر شبیه «چاله» میشن
• نیازهای سختافزاری (و هزینههاشون) به شدت کم میشه
البته غولهایی مثل OpenAI و Anthropic ساکت نمیمونن.
احتمالا همین حالا دارن این نوآوریها رو پیاده میکنن.
ولی «جادوی کارایی» دیگه از چراغ بیرون اومده. دیگه نمیشه به روش «سختافزار بیشتر بریز» برگشت!
حرف آخر
این یکی از اون لحظههای تاریخی بنظر میرسه. مثل وقتی که کامپیوترهای شخصی، کامپیوترهای بزرگ سازمانی رو به چالش کشیدن، یا وقتی که محاسبات ابری همه چیز رو عوض کردن.
الان سوال این نیست که آیا غولها رو به چالش میکشه یا نه، سوال اینه که:
چقدر سریع این کارو میکنه؟!
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍12❤2🔥2🤯1