PyTorch Howsam – Telegram
PyTorch Howsam
3.28K subscribers
379 photos
48 videos
9 files
520 links
از هوش مصنوعی میگیم...

ارتباط با ادمین
@howsam_support
Download Telegram
بخشی از مصاحبه اخیر ایلیا سوتسکور (Ilya Sutskever) رو در ادامه بخونید:

دوران آزمون و خطا (۲۰۱۲ تا ۲۰۲۰): در گذشته، پیشرفت در یادگیری ماشین بیشتر بر پایه دستکاری و آزمایش‌های تجربی توسط محققان بود تا نتایج جالبی به دست آید.

عصر مقیاس‌پذیری (Scaling) (۲۰۲۰ تا ۲۰۲۵): با ظهور مدل‌هایی مثل GPT-3، محققان متوجه شدند که یک فرمول ساده وجود دارد: "افزایش داده‌ها و قدرت محاسباتی برابر است با نتایج بهتر." این دوران برای شرکت‌ها بسیار جذاب بود، زیرا سرمایه‌گذاری روی «بزرگ‌تر کردن مدل» ریسک کمتری نسبت به تحقیقات داشت و نتایج آن قابل پیش‌بینی بود.

پایان دوران مقیاس‌پذیری آسان: سوتسکور اشاره می‌کند که داده‌های موجود برای آموزش مدل‌ها (Pre-training) محدود هستند و روزی تمام می‌شوند. او معتقد است که صرفاً بزرگ‌تر کردن مدل‌ها تا ۱۰۰ برابر، دیگر باعث تحول چشمگیری نخواهد شد.

بازگشت به عصر پژوهش (اکنون): ما اکنون دوباره به دورانی بازگشته‌ایم که نیاز به "پژوهش" و کشف روش‌های جدید (فراتر از روش‌های فعلی) داریم، با این تفاوت که اکنون کامپیوترهای بسیار قدرتمندتری در اختیار داریم.


منبع
با دوستان داشتیم درباره مایندست صحبت می‌کردیم. نوید چیزی گفت که خیلی جالب بود و دوست داشتم اینجا هم باشه:
خانم کارل دوک (استاد روانشناسی استنفورد) توی کتاب طرز فکر (مایندست) میگه ما کلا دو نوع طرز فکر داریم، یکی ثابت و یکی رشد...
طرز فکر ثابت، مدام میخواد همه چیزو راحت بدست بیاره و ثبات فکری داره و در برابر یادگیری مقاومت میکنه
اما طرز فکر رشد، مدام دوست داره چیزهای جدید یاد بگیره و از به چالش کشیدن خودش لذت میبره...
در نهایت میگه ما کلی تحقیق کردیم، دیدیم مهم‌ترین تفاوت افراد موفق با افراد دیگه، اینکه اونا طرز فکرشون از نوع رشد بوده.
یک پست جالب در X درباره رزومه و دعوت به مصاحبه دیدم که در ادامه آوردم...

یک نفر گفته:
من نمیتونم دلیل رد شدن قبل از مصاحبه تو موقعیت کاراموزی رو درک کنم
دیگه چی باید بلد باشم که باهام مصاحبه کنن
ینی واقعا توقعشون بیشتره؟؟؟


یک نفر متخصص پیام بالا رو کوت کرده و گفته:
این نظر شخصی منه:
درصد بالایی از افراد توی همون ۳ثانیه اول دیده شدن رزومه‌اشون ریجکت می شن!


همچنین، یک نفر دیگه تصویر بالا رو منتشر کرده و گفته:
هیت‌مپ تمرکز recruiter‌ روی رزومه‌ی applicant. این رو من تو پرامپت و برنامه‌ای که واسه tailor کردن رزومه‌م ساخته بودم لحاظ کرده بودم.
جواب داد. یعنی تا مصاحبه گرفتن :))


خیلی مهمه‌ها!

لینک مرجع
This media is not supported in your browser
VIEW IN TELEGRAM
خبر جالب اینکه، حالا به راحتی می‌تونید VSCode سیستمتون رو باز کنید و وصل بشید به سخت‌افزارهای کولب و کد بزنید.

برای انجام این کار، کافی هست که به صفحه اصلی کولب برید و افزونه Colab برای VSCode رو نصب کنید. اطلاعات و نحوه فعال‌سازیش رو در لینک زیر گفته شده:
https://colab.research.google.com/

من این خبر رو اولین بار در لینکدین دیدم. می‌خواستم بهش ارجاع بدم، اما لینکدین رفرش شد و پرید! ☹️ بعدش خودم تست کردم و تونستم به راحتی به T4 کولب وصل بشم و چند خطی کد بزنم.
شورای صنفی شریف :
در هفته گذشته سامانه‌ CW به‌عنوان بستر اصلی ارائه‌ تمرین‌ها، پروژه‌ها، جزوات و سایر مطالب آموزشی، دچار اختلال جدی و قطعی‌های مکرر بوده است. این وضعیت، روند تحصیلی تعداد زیادی از دانشجویان را مختل کرده است.

طبق پیگیری‌های انجام‌شده، مشکل اصلی پر شدن فضای ذخیره‌سازی سامانه و نبود بودجه برای افزایش ظرفیت اعلام شده است.

داغانیم ...
The Modern Software Developer
.
من و جام مِی و معشوق
الباقی اضافات است
اگر هستی که بسم الله
در تأخیر آفات است
.
این دوره نشان می‌دهد که ابزارهای مدرن هوش مصنوعی نه تنها بهره‌وری توسعه‌دهندگان را افزایش می‌دهند، بلکه مهندسی نرم‌افزار را برای طیف گسترده‌تری از افراد دموکراتیزه می‌کنند.
ما نشان خواهیم داد که توسعه نرم‌افزار از مرحله‌ی «ایجاد کد از صفر» به یک جریان کاری تکرارشونده شامل برنامه‌ریزی، تولید با کمک هوش مصنوعی، اصلاح و تکرار تکامل یافته است.
دانشجویان هم نظریه‌ی چالش‌های سنتی مهندسی نرم‌افزار را خواهند آموخت و هم ابزارهای پیشرفته‌ی مبتنی بر هوش مصنوعی که امروز آن‌ها را حل می‌کنند.
.
CS146S: The Modern Software Developer
Stanford University - Fall 2025
NVIDIA Nemotron 3 Family of Models

کارآمدترین خانواده مدل‌های باز با دقت پیشرو برای کاربردهای هوش مصنوعی عامل‌محور (Agentic AI).
خانواده Nemotron 3 شامل سه مدل است: Nano، Super و Ultra.
این مدل‌ها توانایی‌های قدرتمند در استدلال، مکالمه و عملکرد عامل‌محور ارائه می‌دهند.

نانو Nano : کوچک‌ترین مدل است که نسبت به مدل‌های مشابه دقت بالاتری دارد و در عین حال هزینه‌ی استنتاج بسیار پایینی دارد.

سوپر Super : برای عوامل همکاری‌محور و بارهای کاری حجیم مانند اتوماسیون تیکت‌های IT بهینه شده است.

آلترا Ultra : بزرگ‌ترین مدل است که دقت و توانایی استدلال در سطح پیشرفته ارائه می‌دهد.

مدل و گزارش فنی Nemotron 3 Nano اکنون منتشر شده‌اند.
نسخه‌های Super و Ultra در ماه‌های آینده عرضه خواهند شد.
Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

در این ویدئو Laurence Moroney دربارهٔ بازار کار و توصیه‌های شغلی صحبت می‌کند.

لارنس :
بنابراین مهم‌ترین توصیهٔ من این است: بسازید!
درس بخوانید، اما حتماً پروژه بسازید و آن‌ها را به دیگران نشان دهید.

امروز تصمیم‌گیری دربارهٔ این است که چه چیزی باید ساخته شود.

مهندسانی که بتوانند هم کدنویسی کنند و هم با کاربران صحبت کنند و نیازها را بفهمند، سریع‌ترین افراد در سیلیکون‌ولی هستند.
The "AI is going to replace devs" hype is over .

👤 مهمان : جیسون لنگسترف
او بعد از ۲۲ سال تجربه، امروز سابقهٔ کار در IBM، Netlify، و حالا مدیریت CodeTV را دارد؛ جایی که برای توسعه‌دهندگان «Reality TV» می‌سازد.

☀️ موضوعات اصلی گفت‌وگو
- اشتباه بزرگ برخی مدیرعامل‌ها:
بسیاری تأثیر ابزارهای AI Coding را بیش‌ازحد تخمین زدند و تعداد زیادی توسعه‌دهنده را اخراج کردند و حالا دوباره دنبال استخدامشان هستند.

- بازگشت نسبی بازار کار توسعه‌دهندگان:
بازار کمی بهتر شده، اما «هرگز مثل قبل نخواهد بود».

- نکات مهم برای پیدا کردن شغل در عصر رزومه‌اسپم و LLMها

- بازسازی جامعهٔ توسعه‌دهندگان از طریق رویدادهای حضوری و ارتباطات واقعی
مدل جدید FunctionGemma یک مدل سبک و متن‌باز از گوگل است که بر پایه Gemma 3 با 270 میلیون پارامتر ساخته شده و از همان فناوری پژوهشی استفاده می‌کند که در مدل‌های Gemini به‌کار رفته است.

هدف اصلی FunctionGemma این است که توسعه‌دهندگان بتوانند آن را به‌عنوان پایه‌ای برای ساخت عامل‌های تخصصی استفاده کنند و جریان‌های کاری خاص را با دقت بالا مدیریت نمایند.

برای نمایش توانایی‌های این مدل، گوگل دو نمونه کاربرد
در اپلیکیشن Google AI Edge Gallery معرفی کرده است.
نخست، Tiny Garden که یک بازی تعاملی کنترل‌شده با صداست و دستورات کاربر مانند «بکار آفتابگردان در ردیف بالا» یا «گل‌ها را در قطعات ۱ و ۲ آبیاری کن» را به توابع برنامه تبدیل می‌کند.

دوم، Mobile Actions که ورودی‌های کاربر مثل «ایجاد رویداد ناهار در تقویم» یا «روشن کردن چراغ‌قوه» را به فراخوانی توابع سیستم‌عامل اندروید ترجمه می‌کند.

این دو نمونه نشان می‌دهند که FunctionGemma می‌تواند هم در بازی‌های تعاملی و هم در وظایف شخصی دستگاه‌ها به‌عنوان یک عامل آفلاین و خصوصی عمل کند.

HuggingFace FunctionGemma-270m-it
دوستان عزیز، امیدوارم یلداتون گرم، صمیمی و خاطرانگیز باشه.

روی دوره‌های هوسم تخفیف 45% گذاشتیم. آدرس سایت:
howsam.org

اگه با من و هوسم آشنا نیستید، این پستم رو بخونید: کلیک کنید!

پیشنهاد می‌کنم، دموهای ویدئویی دوره‌ها رو ببینید. فکر می‌کنم دوره‌های باکیفیت و باجزئیاتی رو تا الان منتشر کردیم.

دوره ساخت ChatGPT از صفر هم آخرین دوره ما هست که شما رو با نحوه ساخته‌شدن یک مدل زبانی از صفر با کدنویسی پایتورچ آشنا میکنه.