❇️ فناوریهای چینی در جهت هوش مصنوعی دموکراتیک
خروج جهان از نظم تکقطبی و حرکت به سمت چندقطبیشدن، فرصتهای جدیدی برای رقابت فناورانه ایجاد کرده است. در این میان، چین با ترکیب نوآوری بومیسازی فناوری غربی و بهینهسازی هزینهها، جایگاه خودش را در فناوریهای نوظهور مثل هوش مصنوعی، انرژیهای پاک و خودروهای برقی به عنوان رقیبی جدی غرب تثبیت کرده است و شرکتهای فناوری غربی را شدیدا به چالش کشیده است. الگوی رقابت خاصی در فناوری تا کنون بین غرب و چین وجود داشته: «تکنولوژی در غرب ایجاد میشود و در چین با حفظ کیفیت نمونه غربی، ارزان میشود».
یکی از نمونههای بارز این پیشرفت، DeepSeek است. این شرکت با عرضه مدلهای متنباز هوش مصنوعی مانند DeepSeek v3، هزینه استنتاج را ۲۰ تا ۵۰ برابر ارزانتر از رقبای غربی کرده است. این دستاورد نهتنها رقابتپذیری چین را افزایش داده، بلکه دسترسی جهانی به فناوریهای پیشرفته را نیز تسهیل کرده است و به اصطلاح دموکراتیک شدن democratization دسترسی به فناوری را تسریع میکند. موفقیت DeepSeek نشان میدهد که چین با تولید انبوه و کاهش هزینهها، رقبای غربی را به چالش کشیده است.
این الگو در صنایعی مانند خودروهای برقی مشاهده قبلا مشاهده شده است که شرکتهایی مانند BYD با کاهش ۳۰ تا ۴۰ درصدی قیمتها، رقبای اروپایی را تحت فشار قرار دادهاند. بدون تعرفههای حمایتی اتحادیه اروپا، ادامه حیات بسیاری از خودروسازان غربی در خطر خواهد بود و انتظار میرود به زودی روندی که با ارائه Deepseek شروع شده آثار عمیقتری اقتصادی در حوزهی هوش مصنوعی بگذارد.
اما این موفقیتها بدون چالش نیست. هر زمان که یک مدل چینی با کیفیت ارائه میشود، برخی کاربران به جای تحلیل فنی، به مسائل ایدئولوژیک مانند حوادث میدان تیانآنمن میپردازند. این افراد، خود را شوالیههای لیبرال دموکراسی میدانند و با دستگاه «کمونیستسنج» خود، طرح سوالاتی مانند اختلافات مرزی با هند و حوادث میدان تیانآنمن که هیچ ربطی به فناوری ندارد وقتی مدل چینی به دلیل قوانین حزب کمونیست نمیتواند به این سوالات پاسخ دهد، این موضوع بهانهای برای انتقاد میشود و تلاش میکنند وجههی دستآوردهای فناورانهی چین را تخریب کنند. اما واقعیت این است که این سوالات به فناوری ربطی ندارد و بیشتر نشاندهنده یک نگاه ایدئولوژیک است. مگر آمریکا با وجود انتقال سرورهای تیکتاک به خاک خود، از ایجاد دردسر برای این شرکت دست برداشت؟! این نگاه ایدئولوژیک، مانع درک این واقعیت میشود که قدرت گرفتن چین در رقابت با غرب مستقل از ارزشهای تمدنی دو طرف با ایجاد رقابت سالم فناورانه میتواند به نفع همه باشد.
در حوزه سختافزار هوش مصنوعی که چین به شدت از طرف آمریکا تحت تحریم قرار گرفته بود اکنون گامهای بلندی برداشته است. شرکت SMIC با استفاده از فناوری DUV ساخت SMEE (یک شرکت چینی) توانسته به تولید تراشههای ۷ نانومتری دست یابد، هرچند هنوز به فناوری EUV شرکت ASML هلند دسترسی ندارد. هواوی نیز با توسعه نرمافزارهای طراحی تراشه (EDA) و تولید شتابدهندههای هوش مصنوعی مانند Ascend 910B/C، رقیبی برای انویدیا (A100/H100) ایجاد کرده است. اگرچه قیمت این تراشهها (حدود ۱۶,۸۰۰ دلار) هنوز با نمونههای غربی برابری میکند، شاهد ارزانسازی فناوری در این حوزه نیستی. اما کاهش شکاف فناوری در لیتوگرافی میتواند دسترسی به تراشههای ارزانتر را در آینده نزدیک ممکن سازد.
در نقطهی مقابل وابستگی جهانی به زنجیره تولید چین نیز میتواند مثل دوره کرونا باعث افزایش ریسک بحران اقتصادی جهانی در صورت رکود اقتصادی چین بشود و هژمونی فناورانه چین هم اگر صنعت غرب رو وارد رکود کند اتفاق بدی است. همانگونه که بحران کووید-۱۹ نشان داد، تمرکز بیش از حد بر تولید چینی میتواند سیستم اقتصادی جهانی را در برابر شوکهای خارجی آسیبپذیر کند. کاهش سهم چین از ۴۸% به ۴۲% در صادرات کالاهای واسطهای طی دو سال اخیر، نشانگر تلاش غرب برای متنوعسازی زنجیرههای تأمین است.
تحلیلگران پیشبینی میکنند در صورت تحقق این هدف تا سال ۲۰۳۰، قیمت تراشههای هوش مصنوعی ۴۰-۶۰% کاهش یابد. سهم چین از بازار جهانی نیمههادیها از ۱۰% فعلی به ۲۵% افزایش یابد
رقابت فناورانه چین و غرب به نفع مصرفکنندگان جهانی است. این رقابت نهتنها انحصارها را میشکند، بلکه با کاهش قیمتها و تسهیل دسترسی به فناوریهای پیشرفته، به تحقق عدالت جهانی کمک میکند.
خروج جهان از نظم تکقطبی و حرکت به سمت چندقطبیشدن، فرصتهای جدیدی برای رقابت فناورانه ایجاد کرده است. در این میان، چین با ترکیب نوآوری بومیسازی فناوری غربی و بهینهسازی هزینهها، جایگاه خودش را در فناوریهای نوظهور مثل هوش مصنوعی، انرژیهای پاک و خودروهای برقی به عنوان رقیبی جدی غرب تثبیت کرده است و شرکتهای فناوری غربی را شدیدا به چالش کشیده است. الگوی رقابت خاصی در فناوری تا کنون بین غرب و چین وجود داشته: «تکنولوژی در غرب ایجاد میشود و در چین با حفظ کیفیت نمونه غربی، ارزان میشود».
یکی از نمونههای بارز این پیشرفت، DeepSeek است. این شرکت با عرضه مدلهای متنباز هوش مصنوعی مانند DeepSeek v3، هزینه استنتاج را ۲۰ تا ۵۰ برابر ارزانتر از رقبای غربی کرده است. این دستاورد نهتنها رقابتپذیری چین را افزایش داده، بلکه دسترسی جهانی به فناوریهای پیشرفته را نیز تسهیل کرده است و به اصطلاح دموکراتیک شدن democratization دسترسی به فناوری را تسریع میکند. موفقیت DeepSeek نشان میدهد که چین با تولید انبوه و کاهش هزینهها، رقبای غربی را به چالش کشیده است.
این الگو در صنایعی مانند خودروهای برقی مشاهده قبلا مشاهده شده است که شرکتهایی مانند BYD با کاهش ۳۰ تا ۴۰ درصدی قیمتها، رقبای اروپایی را تحت فشار قرار دادهاند. بدون تعرفههای حمایتی اتحادیه اروپا، ادامه حیات بسیاری از خودروسازان غربی در خطر خواهد بود و انتظار میرود به زودی روندی که با ارائه Deepseek شروع شده آثار عمیقتری اقتصادی در حوزهی هوش مصنوعی بگذارد.
اما این موفقیتها بدون چالش نیست. هر زمان که یک مدل چینی با کیفیت ارائه میشود، برخی کاربران به جای تحلیل فنی، به مسائل ایدئولوژیک مانند حوادث میدان تیانآنمن میپردازند. این افراد، خود را شوالیههای لیبرال دموکراسی میدانند و با دستگاه «کمونیستسنج» خود، طرح سوالاتی مانند اختلافات مرزی با هند و حوادث میدان تیانآنمن که هیچ ربطی به فناوری ندارد وقتی مدل چینی به دلیل قوانین حزب کمونیست نمیتواند به این سوالات پاسخ دهد، این موضوع بهانهای برای انتقاد میشود و تلاش میکنند وجههی دستآوردهای فناورانهی چین را تخریب کنند. اما واقعیت این است که این سوالات به فناوری ربطی ندارد و بیشتر نشاندهنده یک نگاه ایدئولوژیک است. مگر آمریکا با وجود انتقال سرورهای تیکتاک به خاک خود، از ایجاد دردسر برای این شرکت دست برداشت؟! این نگاه ایدئولوژیک، مانع درک این واقعیت میشود که قدرت گرفتن چین در رقابت با غرب مستقل از ارزشهای تمدنی دو طرف با ایجاد رقابت سالم فناورانه میتواند به نفع همه باشد.
در حوزه سختافزار هوش مصنوعی که چین به شدت از طرف آمریکا تحت تحریم قرار گرفته بود اکنون گامهای بلندی برداشته است. شرکت SMIC با استفاده از فناوری DUV ساخت SMEE (یک شرکت چینی) توانسته به تولید تراشههای ۷ نانومتری دست یابد، هرچند هنوز به فناوری EUV شرکت ASML هلند دسترسی ندارد. هواوی نیز با توسعه نرمافزارهای طراحی تراشه (EDA) و تولید شتابدهندههای هوش مصنوعی مانند Ascend 910B/C، رقیبی برای انویدیا (A100/H100) ایجاد کرده است. اگرچه قیمت این تراشهها (حدود ۱۶,۸۰۰ دلار) هنوز با نمونههای غربی برابری میکند، شاهد ارزانسازی فناوری در این حوزه نیستی. اما کاهش شکاف فناوری در لیتوگرافی میتواند دسترسی به تراشههای ارزانتر را در آینده نزدیک ممکن سازد.
در نقطهی مقابل وابستگی جهانی به زنجیره تولید چین نیز میتواند مثل دوره کرونا باعث افزایش ریسک بحران اقتصادی جهانی در صورت رکود اقتصادی چین بشود و هژمونی فناورانه چین هم اگر صنعت غرب رو وارد رکود کند اتفاق بدی است. همانگونه که بحران کووید-۱۹ نشان داد، تمرکز بیش از حد بر تولید چینی میتواند سیستم اقتصادی جهانی را در برابر شوکهای خارجی آسیبپذیر کند. کاهش سهم چین از ۴۸% به ۴۲% در صادرات کالاهای واسطهای طی دو سال اخیر، نشانگر تلاش غرب برای متنوعسازی زنجیرههای تأمین است.
تحلیلگران پیشبینی میکنند در صورت تحقق این هدف تا سال ۲۰۳۰، قیمت تراشههای هوش مصنوعی ۴۰-۶۰% کاهش یابد. سهم چین از بازار جهانی نیمههادیها از ۱۰% فعلی به ۲۵% افزایش یابد
رقابت فناورانه چین و غرب به نفع مصرفکنندگان جهانی است. این رقابت نهتنها انحصارها را میشکند، بلکه با کاهش قیمتها و تسهیل دسترسی به فناوریهای پیشرفته، به تحقق عدالت جهانی کمک میکند.
👍1
Dev Tweet
❇️ فناوریهای چینی در جهت هوش مصنوعی دموکراتیک خروج جهان از نظم تکقطبی و حرکت به سمت چندقطبیشدن، فرصتهای جدیدی برای رقابت فناورانه ایجاد کرده است. در این میان، چین با ترکیب نوآوری بومیسازی فناوری غربی و بهینهسازی هزینهها، جایگاه خودش را در فناوریهای…
این متن را به بهانهی واکنشهای این چنینی به Deepseek نوشتم.
👍2
مطالب جالبی رو دکتر فرهاد قدوسی در کانال تلگرام خودشون در مورد Deepseek منتشر کردند که من اینجا ارجاع میدهم به کانالشون.
ایشون استاد علوم طبیعی دانشگاه فنی لارنس و محقق دانشگاه پزشکی واین استیت هستند.
اینکه به عنوان یک شخصیت علمی غیر کامپیوتری در کامیونیتی فارسی اینقدر به این موضوع توجه کردند برام جالبه.
https://news.1rj.ru/str/BetweenDichotomies/280
https://news.1rj.ru/str/BetweenDichotomies/279
https://news.1rj.ru/str/BetweenDichotomies/278
https://news.1rj.ru/str/BetweenDichotomies/271
ایشون استاد علوم طبیعی دانشگاه فنی لارنس و محقق دانشگاه پزشکی واین استیت هستند.
اینکه به عنوان یک شخصیت علمی غیر کامپیوتری در کامیونیتی فارسی اینقدر به این موضوع توجه کردند برام جالبه.
https://news.1rj.ru/str/BetweenDichotomies/280
https://news.1rj.ru/str/BetweenDichotomies/279
https://news.1rj.ru/str/BetweenDichotomies/278
https://news.1rj.ru/str/BetweenDichotomies/271
Telegram
بین دوگانگیها
آرنو برتران:
این لحظه موفقیت دیپسیک DeepSeek فقط درباره هوش مصنوعی نیست. همچنین درباره درک جهان از این واقعیت است که چین، علیرغم تلاشها برای جلوگیری از آن، به آمریکا در زمینه فناوری و نوآوری رسیده - و در برخی زمینهها از آن پیشی گرفته است.
این تغییری…
این لحظه موفقیت دیپسیک DeepSeek فقط درباره هوش مصنوعی نیست. همچنین درباره درک جهان از این واقعیت است که چین، علیرغم تلاشها برای جلوگیری از آن، به آمریکا در زمینه فناوری و نوآوری رسیده - و در برخی زمینهها از آن پیشی گرفته است.
این تغییری…
👎4👍2
بریدهها و برادهها
Unveiling_DeepSeek.pdf
اگر به بحث سیاستگذاری فناوری به طور عام و به پیشرفت اخیر deepseek به طور خاص علاقه دارید این مصاحبه رو یه نگاه بندازید.
این برش مقدمه مصاحبه هم خیلی جالب بود
این برش مقدمه مصاحبه هم خیلی جالب بود
https://news.1rj.ru/str/radiokalan/621
https://news.1rj.ru/str/radiokalan/623
https://news.1rj.ru/str/radiokalan/624
https://news.1rj.ru/str/radiokalan/629
https://news.1rj.ru/str/radiokalan/634
https://news.1rj.ru/str/radiokalan/636
https://news.1rj.ru/str/radiokalan/637
https://news.1rj.ru/str/radiokalan/638
مجموعه اخبار مربوط به تاثیر دیپ سیک در بازار سهام امروز آمریکا
با کمی رویکرد ضد چینی:)
https://news.1rj.ru/str/radiokalan/623
https://news.1rj.ru/str/radiokalan/624
https://news.1rj.ru/str/radiokalan/629
https://news.1rj.ru/str/radiokalan/634
https://news.1rj.ru/str/radiokalan/636
https://news.1rj.ru/str/radiokalan/637
https://news.1rj.ru/str/radiokalan/638
مجموعه اخبار مربوط به تاثیر دیپ سیک در بازار سهام امروز آمریکا
با کمی رویکرد ضد چینی:)
Telegram
رادیو کلان | کلان و فارکس
⛔ چرا DeepSeek چین، رهبری آمریکا در هوش مصنوعی را به خطر میاندازد !
🟡یک آزمایشگاه نسبتاً ناشناخته هوش مصنوعی در چین، با انتشار مدلهایی که با هزینه کمتر و تراشههای ضعیفتر، عملکردی بهتر از بهترینهای آمریکا دارند، موجی از نگرانی در سیلیکون ولی ایجاد کرده…
🟡یک آزمایشگاه نسبتاً ناشناخته هوش مصنوعی در چین، با انتشار مدلهایی که با هزینه کمتر و تراشههای ضعیفتر، عملکردی بهتر از بهترینهای آمریکا دارند، موجی از نگرانی در سیلیکون ولی ایجاد کرده…
This media is not supported in your browser
VIEW IN TELEGRAM
Chemputation
فضای رباتیک ساخت ترکیبهای شیمیایی بصورت یک حلقه بسته فول اتوماتیک😊
فضای رباتیک ساخت ترکیبهای شیمیایی بصورت یک حلقه بسته فول اتوماتیک😊
🤯1
Dev Tweet
مقایسه مصرف توکن ماهانه هر مدل در Openrouter
این همه سر و صدا سر این reasoning از o1-preview شروع شد تا به deepseek R1 رسید ولی اخرش همین Sonnet3.5 که ژانویهی پارسال یعنی بیش از یک سال پیش معرفی شد بدون thinking و این ادها همهشون رو میذاره تو جیبش. چرا؟
چون در عملکرد، سرعت و قیمت در نقطهی خوبی ایستاده!
مگر در موارد خاص حتی اگر مدل o1 بهترین جواب رو بعد از ۱۰۰ ثانیه فکر کردن بده یا اینکه یه سوال از o1 بهترین و سریعترین جواب رو بده ولی 0.5 دلار خرج برداره یا اینکه برای اشتراک ۲۰ دلاری فقط روزی سه بار بتونی از این ویژگی استفاده کنی اینها ارزش زیادی نداره یا اینکه اگر Deepseek R1 ارزونترین مدل با دقت مطلوبه ولی نصف زمانها سرورش busyئه ارزش اثر مطلوبش رو خنثی میکنه. یا مثلا گوگل طول contextش 2 میلیون توکنه ولی واقعا برد توجهش موثرش در context اصلا بیشتر از Sonnet و ChatGPT نیست بلکه کمتر هم هست مزیت خاصی نداره حتی اگر throughput خروجی توکنش خیلی بالا باشه. یا مثلا Mistral مدل جدیدش در نهایتا ضعف عملکرد 1200 توکن در ثانیه خروجی میده! خب چه فایده!
موفقیت آنتروپیک حداقل برای یوزر technical اینه که ترکیب سرعت، عملکرد، طول context، هزینه مدلش در یک نقطه بهینه قرار گرفته.
چون در عملکرد، سرعت و قیمت در نقطهی خوبی ایستاده!
مگر در موارد خاص حتی اگر مدل o1 بهترین جواب رو بعد از ۱۰۰ ثانیه فکر کردن بده یا اینکه یه سوال از o1 بهترین و سریعترین جواب رو بده ولی 0.5 دلار خرج برداره یا اینکه برای اشتراک ۲۰ دلاری فقط روزی سه بار بتونی از این ویژگی استفاده کنی اینها ارزش زیادی نداره یا اینکه اگر Deepseek R1 ارزونترین مدل با دقت مطلوبه ولی نصف زمانها سرورش busyئه ارزش اثر مطلوبش رو خنثی میکنه. یا مثلا گوگل طول contextش 2 میلیون توکنه ولی واقعا برد توجهش موثرش در context اصلا بیشتر از Sonnet و ChatGPT نیست بلکه کمتر هم هست مزیت خاصی نداره حتی اگر throughput خروجی توکنش خیلی بالا باشه. یا مثلا Mistral مدل جدیدش در نهایتا ضعف عملکرد 1200 توکن در ثانیه خروجی میده! خب چه فایده!
موفقیت آنتروپیک حداقل برای یوزر technical اینه که ترکیب سرعت، عملکرد، طول context، هزینه مدلش در یک نقطه بهینه قرار گرفته.
👍9👏1💯1
حتما توصیه میکنم این توئیت و کامنتاش و کوتهاش رو بخونید.
موضوع اینکه از ChatGPT هر کسی پرسیده که «با توجه به اطلاعاتی که از من داری من رو مسخره کن»!
خیلی جالبه.
از قدرت تخریب و تمسخرش!
و هم از اینکه میده اطلاعات conversationهای مختلف یک کاربر رو هم کنار هم میذاره و تحلیل میکنه و این خیلی ترسناکه.
به نظرم خیلیها خودشون چنین نگاه انتقادی به خودشون ندارن که ChatGPT داره میگه.
هر کدوم از اسکرینشاتها رو خوشتون اومد بذارید تو کامنت این پست.
موضوع اینکه از ChatGPT هر کسی پرسیده که «با توجه به اطلاعاتی که از من داری من رو مسخره کن»!
خیلی جالبه.
از قدرت تخریب و تمسخرش!
و هم از اینکه میده اطلاعات conversationهای مختلف یک کاربر رو هم کنار هم میذاره و تحلیل میکنه و این خیلی ترسناکه.
به نظرم خیلیها خودشون چنین نگاه انتقادی به خودشون ندارن که ChatGPT داره میگه.
هر کدوم از اسکرینشاتها رو خوشتون اومد بذارید تو کامنت این پست.
👏3👌1
چرا ممکنه دیگه نیازی به خرید GPU نداشته باشیم؟
یکی از دوستانم در مورد خرید لپتاپ با من مشورت میکرد و میگفت لپتاپی که میخواد بخره، قیمتش با GPU و بدون GPU(و البته با CPU نسل جدیدتر و بهتر) حدود ۲۰ میلیون تومن تفاوت داره. از من پرسید: «به نظرت میصرفه؟» من بهش گفتم: «واسه چه کاری میخوای؟» گفت: «اهل گیم و اینا نیستم، فقط میخوام یه موقعهایی که پروژه دیتایی دارم یا میخوام LLM ران کنم، ازش استفاده کنم.» من بهش گفتم که به نظرم نمیصرفه. (شما هم نظرتون رو بگید)
چرا به نظرم خرید GPU برای چنین کارائی صرفه نداره؟
من خودم خیلی وقتها حتی کارهای عادی و موقتیم رو روی Google Colab انجام میدم چه برسه به وقتی که به GPU نیاز پیدا کنم. حالا اینکه حقوق ما به هزار دلار هم نمیرسه یه طرف، ولی به نظرم خدمات ابری شرکتهای بزرگ مثل Google، Cloudflare، Azure و AWS حتی با درآمدهای ما هم بهصرفهست و نه تنها به صرفه است در بسیار موارد خیلی پروژهها رو ارزونتر از اون نمیشه تموم کرد!؟(خصوصا در مورد اپلیکیشنهای CRUD با انواع Database خیلی مواقع میشه حتی رایگان کار رو جمع کرد یه سری به Free Tier ورکرهای CloudFlare بزنید ولی فعلا بحث ما GPU است.)
مثلاً یه سرور GPU مثل L4 رو در نظر بگیرید:
حدود ۲۰ گیگ vRAM بهت میده (بسته به لود سرور Colab ممکنه فرق کنه).
ساعتی ۲.۵ یونیت پوینت مصرف میکنه.
هر ۱۰ یونیت پوینت تقریباً یه دلاره (توضیحش مفصله).
با قیمت دلار امروز، چهار ساعت استفاده از L4 میشه حدود ۹۴ هزار تومن!
تازه این فقط پول GPU نیست.
حدود ۵۰ گیگ رم و ۲۰۰ گیگ حافظه هم کنارش قرار میگیره.
سرعت اینترنت سرورها هم فوقالعادهست؛ من فایل یک گیگی رو از AWS روی Colab تو ده ثانیه دانلود میکردم!
اگر با vRAM کمتر هم کارت راه میافته، میتونی از T4 استفاده کنی که با همین قیمت، حدود ۷ ساعت اجاره میده.
و البته که شما دارید روی یک سرویس notebook خیلی با کیفیت به اسم Colab استفاده میکنید که به راحتی با Google Driveتون متصل و سینک میشه.
شاید بشه اینطوری مقایسه کرد: یه ساعت گیمنت(فک کنم الان ساعتی 40 هزار تومن به بالا باشه) با اون اینترنت داغونشون گرونتر از این خدمات ابری درمیاد، در حالی که اینجا هم قدرت پردازش بهتره، هم اینترنتش فوقالعادهست.
من خودم ترجیح میدم عوض اینکه بجای اینکه 700 دلار پول NVIDIA GeForce RTX 3090 (24GB) بدم 2800 ساعت از یک L4 کولب استفاده کنم با اینکه عمر مفید بدون افت عملکرد یک چنین gpu ای حدود 20هزار ساعته و در طول استفاده از این GPU دستکتاپی قطعا ورژن کلودش ارزونتر هم میشه و تازه قیمت بقیه سخت افزار دسکتاپ رو حساب نکردم.
برای LLM چی؟
اگر فکر میکنی برای کار با LLMها باید GPU بخری، یه نکته رو بدون: خیلی از مدلها مثل Llama، Qwen و Mistral بهصورت رایگان APIشون در دسترسه. مدلهای بزرگتر مثل Google Gemini Flash 1.5 هم با هزینه ۰.۴ دلار به ازای یک میلیون توکن قابل استفادهست.
این نظر منه دوستان نقد شما رو هم بدونم:
لذا اگر هدف فقط استفاده برای پروژههای دیتاساینسی و LLM باشه، من توجیه اقتصادی برای خرید GPU نمیبینم. خدمات ابری هم ارزونترن، هم انعطافپذیرتر، و هم یه عالمه امکانات اضافه دارن.
البته این رو اضافه کنم که شما به سرویسهای colab دسترسی شل ریموت ندارید و دسترسی شل وب دارید.
اگر دنبال دسترسی ssh به سرور GPU هستید این قیمتهای Hyperbolic هم خیلی جذابه!
یکی از دوستانم در مورد خرید لپتاپ با من مشورت میکرد و میگفت لپتاپی که میخواد بخره، قیمتش با GPU و بدون GPU(و البته با CPU نسل جدیدتر و بهتر) حدود ۲۰ میلیون تومن تفاوت داره. از من پرسید: «به نظرت میصرفه؟» من بهش گفتم: «واسه چه کاری میخوای؟» گفت: «اهل گیم و اینا نیستم، فقط میخوام یه موقعهایی که پروژه دیتایی دارم یا میخوام LLM ران کنم، ازش استفاده کنم.» من بهش گفتم که به نظرم نمیصرفه. (شما هم نظرتون رو بگید)
چرا به نظرم خرید GPU برای چنین کارائی صرفه نداره؟
من خودم خیلی وقتها حتی کارهای عادی و موقتیم رو روی Google Colab انجام میدم چه برسه به وقتی که به GPU نیاز پیدا کنم. حالا اینکه حقوق ما به هزار دلار هم نمیرسه یه طرف، ولی به نظرم خدمات ابری شرکتهای بزرگ مثل Google، Cloudflare، Azure و AWS حتی با درآمدهای ما هم بهصرفهست و نه تنها به صرفه است در بسیار موارد خیلی پروژهها رو ارزونتر از اون نمیشه تموم کرد!؟(خصوصا در مورد اپلیکیشنهای CRUD با انواع Database خیلی مواقع میشه حتی رایگان کار رو جمع کرد یه سری به Free Tier ورکرهای CloudFlare بزنید ولی فعلا بحث ما GPU است.)
مثلاً یه سرور GPU مثل L4 رو در نظر بگیرید:
حدود ۲۰ گیگ vRAM بهت میده (بسته به لود سرور Colab ممکنه فرق کنه).
ساعتی ۲.۵ یونیت پوینت مصرف میکنه.
هر ۱۰ یونیت پوینت تقریباً یه دلاره (توضیحش مفصله).
با قیمت دلار امروز، چهار ساعت استفاده از L4 میشه حدود ۹۴ هزار تومن!
تازه این فقط پول GPU نیست.
حدود ۵۰ گیگ رم و ۲۰۰ گیگ حافظه هم کنارش قرار میگیره.
سرعت اینترنت سرورها هم فوقالعادهست؛ من فایل یک گیگی رو از AWS روی Colab تو ده ثانیه دانلود میکردم!
اگر با vRAM کمتر هم کارت راه میافته، میتونی از T4 استفاده کنی که با همین قیمت، حدود ۷ ساعت اجاره میده.
و البته که شما دارید روی یک سرویس notebook خیلی با کیفیت به اسم Colab استفاده میکنید که به راحتی با Google Driveتون متصل و سینک میشه.
شاید بشه اینطوری مقایسه کرد: یه ساعت گیمنت(فک کنم الان ساعتی 40 هزار تومن به بالا باشه) با اون اینترنت داغونشون گرونتر از این خدمات ابری درمیاد، در حالی که اینجا هم قدرت پردازش بهتره، هم اینترنتش فوقالعادهست.
من خودم ترجیح میدم عوض اینکه بجای اینکه 700 دلار پول NVIDIA GeForce RTX 3090 (24GB) بدم 2800 ساعت از یک L4 کولب استفاده کنم با اینکه عمر مفید بدون افت عملکرد یک چنین gpu ای حدود 20هزار ساعته و در طول استفاده از این GPU دستکتاپی قطعا ورژن کلودش ارزونتر هم میشه و تازه قیمت بقیه سخت افزار دسکتاپ رو حساب نکردم.
برای LLM چی؟
اگر فکر میکنی برای کار با LLMها باید GPU بخری، یه نکته رو بدون: خیلی از مدلها مثل Llama، Qwen و Mistral بهصورت رایگان APIشون در دسترسه. مدلهای بزرگتر مثل Google Gemini Flash 1.5 هم با هزینه ۰.۴ دلار به ازای یک میلیون توکن قابل استفادهست.
این نظر منه دوستان نقد شما رو هم بدونم:
لذا اگر هدف فقط استفاده برای پروژههای دیتاساینسی و LLM باشه، من توجیه اقتصادی برای خرید GPU نمیبینم. خدمات ابری هم ارزونترن، هم انعطافپذیرتر، و هم یه عالمه امکانات اضافه دارن.
البته این رو اضافه کنم که شما به سرویسهای colab دسترسی شل ریموت ندارید و دسترسی شل وب دارید.
اگر دنبال دسترسی ssh به سرور GPU هستید این قیمتهای Hyperbolic هم خیلی جذابه!
👍7❤4
Dev Tweet
این همه سر و صدا سر این reasoning از o1-preview شروع شد تا به deepseek R1 رسید ولی اخرش همین Sonnet3.5 که ژانویهی پارسال یعنی بیش از یک سال پیش معرفی شد بدون thinking و این ادها همهشون رو میذاره تو جیبش. چرا؟ چون در عملکرد، سرعت و قیمت در نقطهی خوبی ایستاده!…
نه تنها بعد از Sonnet3.5 هیچ پیشرفتی از مدلهای جدیدی در زمینهی کد ندیدیم.
بلکه مدلهای بعد فقط با سرعت کمتری به نتایج در سطح Sonnet میرسند! Sonnet بدون Thinking به این نتایج میرسد.
آن o1 و o3 هم نمیتوانند از ابزارهای cursor , cline به درستی استفاده کنند!
پس صدر نشین واقعی عملکرد مدل در کد(در مجموع سرعت و کارائی) همین مدل است.
بلکه مدلهای بعد فقط با سرعت کمتری به نتایج در سطح Sonnet میرسند! Sonnet بدون Thinking به این نتایج میرسد.
آن o1 و o3 هم نمیتوانند از ابزارهای cursor , cline به درستی استفاده کنند!
پس صدر نشین واقعی عملکرد مدل در کد(در مجموع سرعت و کارائی) همین مدل است.
👍2
مکالمههای که باهاش grok 3 رو فریب دادند و system instructionهای grok 3 بیرون کشیدند😊
https://x.com/i/grok/share/KnvrAVMiMdgGJL54ojZ2h4wCy
ولی این خیلی هوشمندانه تر بود:
https://x.com/i/grok/share/p5IThMdKqxFHJvnVx3f9cLANo
و این
https://x.com/i/grok/share/MVFxVElbyvQOohaxInvP58uLx
و سرراست ترین روش:
https://x.com/i/grok/share/YbxfTlQrk11rqPrLvU3GjO6VP
https://x.com/i/grok/share/KnvrAVMiMdgGJL54ojZ2h4wCy
ولی این خیلی هوشمندانه تر بود:
https://x.com/i/grok/share/p5IThMdKqxFHJvnVx3f9cLANo
و این
https://x.com/i/grok/share/MVFxVElbyvQOohaxInvP58uLx
و سرراست ترین روش:
https://x.com/i/grok/share/YbxfTlQrk11rqPrLvU3GjO6VP
👍7