دستاوردهای یادگیری عمیق(InTec) – Telegram
دستاوردهای یادگیری عمیق(InTec)
9.46K subscribers
363 photos
40 videos
44 files
674 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
دستاوردهای یادگیری عمیق(InTec)
♥️ R.I.P CentOS ♥️
حدود ۲ ماه دیگه تمام پشتیبانی‌های رسمی برای آخرین بازمانده خوانده CentOS تموم خواهد شد.
CentOS 7 end of life: June 30, 2024.


با اینکه از حدود 2019 و شایعه‌های اولیه دیگه از این توزیع استفاده نکردم؛ اما بابت همه باری که تو روزهای ادمین سرور بودنم از روی دوشم برداشت از دولوپرهاش ممنونم.

هیچوقت یادم نمیره وقتی اولین بار روی CentOS شروع کردم به کار و تنظیمات و ...
وقتی برای آزمون رسمی RedHat آماده می‌شدم تازه اون موقع بود که فهمیدم اصلا لینوکس بلد نیستم و CentOS واقعا برای همه کسایی که اون آزمون‌هارو شرکت میکردند بسیار کاربردی و راحت بود.

به یاد گذشته 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
24👍6
برای ۳ تا شرکت
توی ۱ ماه گذشته، مشغول مصاحبه و تأیید و استخدام نیرو بودم
در زمینه هوش مصنوعی.

۱ نفر نتونست، از رزومه‌‌اش دفاع کنه
۱ نفر نتونست، جواب چندتا مسئله پروداکشن رو بده

به طرف میگم، با ترنسفرمر آشنایی داری ؟
یا مثلاً برای vision میگم با segmentation ها آشنایی داری ؟

بعضی‌ها، تک تک عملکردهای مدل رو می‌دونند
دقیقاً فرمول‌هارو می‌شناسند.

اومدم کد‌های اون بخش رو حذف می‌کنم، بهش میگم همینایی که گفتی رو این قسمتش رو پیاده سازی کن.
فرض بر این هست که توی کار تیمی یک ایده جدیدی اومده و شما قراره پیاده‌سازی کنید.
فقط ۱ نفر تونست اینکار رو بکنه، هرچند کدهاش هیچکدوم از اصول و قوانین رو رعایت نکرده بود.


رفتیم سراغ مباحث، design برای بیزینس پیاده‌سازی مهمه
میگم خب فرض کن ۳۰۰ تا کاربر داریم با این شرایط و ...، چطوری می‌تونیم مدل رو پیاده‌سازی کنیم و ...
حتی یک نفر هم نتونست یک راهکار واقعی و قابل پیاده‌سازی بده

فقط ۱ نفر اشاره کرد، که می‌تونیم همرو بذاریم توی صف event driven کنیم و ...

از مباحث هوش مصنوعی اومدم بیرون، گفتم اشکال نداره (هرکسی با من کار کرده می‌دونه هوش مصنوعی بلد بودن برای من اهمیت نداره توی بیزینس، مهم software engineer بودند هست)
اوضاع این افراد هم که خوب نبود گفتم میرم روی سواد پایتون نیرو می‌گیرم (فقط سنیور می‌خواستم)

خلاصه‌اش این بود :

۱- گروه زیادی dunder method نمی‌دونستند چی هست اصلا

۲- افراد زیادی تفاوت با مفاهیمی مثل logging, exception handle , ... آشنا بودند اما نه بصورت درست و برای software های بزرگتر از ۲۰ تا کاربر

۳- خیلی‌ها مسائلی مثل caching, queue , ... رو بلد نبودند یا اینکه نمی‌دونستند چطور میشه یک API هوش مصنوعی نوشت که همزمان که مدل درحال تولید خروجی هست برای کاربر هم ارسال بشه.

۴- مفاهیمی مثل Mixin, Monkey Patch, Duck typing , ... رو نشنیده بودند (با دیدن کد یا متدی که داخلش نوشته شده pass در تلاش برای حذف کد بودند)

۵- مفاهیم مهمی مثل Protocol, ABC, ... توی پایتون رو حتی نمی‌شناختند.

۶- بدتر از همه،
Async, threading, multi-process
توی پایتون و نحوه عملکردش رو نمی‌دونستند.

و این اوضاع Senior Python Developer های کشورمون هست، وقتی کسی بهم میگه کار نیست فقط ازش ۱ سوال می‌پرسم تا ارزیابی کنم سوادش رو.

با خیلی از دوستان Senior دیگه هم صحبت کردم (می‌خواستم ازشون نیروی پایتون بگیرم) همگی تأیید کردند که خودشون هم توی همین شرایط هستند.

توی کانال:
@pyhints
وقتی ۱۰۰۰ نفر شدیم، یک گروه آموزش+ کتاب‌خوانی راه‌انداختم ظرفیت ۲۵۰ نفر.
ازون افراد ۳۰ نفر آینده خوبی خواهند داشت قطعاً (تمامی جلسات و کل کتاب رو دنبال کردند، حدود ۱۷ نفر رو می‌دونم که یا Raise گرفتند یا به شرکت بهتری رفتند)

اینبار می‌خوام، بجای گروه، لایو بذاریم (گوگل میت) و بعد روی یوتیوب همون کانال آپلود بشه.

فردا، اولین جلسه هست.
راجب کتابی که قراره باهم بخونیم، نحوه خوندن کتاب و ...
از همش مهمتر اینکه، چی باعث شد من به این فکر بیوفتم که حتماً باید اینکار صورت بگیره.

حتماً توضیح میدم که چرا با کارکردن با آموزشگاه‌ها مخالف هستم و هیچ موقع قبول نکردم دوره‌های پولی راه‌اندازی کنم.

اولین بار هست که قراره دوره با مخاطب عمومی و آزاد داشته باشم که رایگان هم خواهد بود.

اما هدف فقط و فقط پیشرفت جامعه پایتون هست.
126👍53
#Quick

راجب مقاله Infini-attention صحبتی نکردم
همونطور که برخی از دوستان هم اشاره کردند (بله من هم تکنیک رو دیدم)

اما صادقانه یک مقدار به این روش مشکوک هستم؛
منتظرم ۱-۲ مدل LLM باهاش منتشر بشه و بتونیم کیفیت و سرعت و سایز مدل رو مورد بررسی قرار بدیم و بعد راجبش صحبت کنیم.

دوستان خیلی دقت کنید؛ دنیای امروز LLM ها شامل مجموعه‌ای از حواس پرتی و ابزارهایی هست که سر و ته نداره اگر به این مسیر کشیده بشید که دنبال همه این موارد برید قطعا تمومی نخواهد داشت و فقط burn out می‌شید.

سعی کنید concept یاد بگیرید فارق از ابزار.
👍237
دستاوردهای یادگیری عمیق(InTec)
آپدیت برای بخش ۷ : Deep learning چون خیلی از دوستان پیام دادند و دنبال دوره ویدئویی هستند برای شروع : Standford university: Prof. Manning, deep learning for nlp NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course این ۲ تا…
من قبلا این دوتا دوره رو معرفی کردم
خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند

همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه.

اما چون خیلی درمورد LLM, Agent, Transformer , ... سوال شده که دوره و کتاب معرفی کنم

این لینک رو هم اضافه می‌کنیم که نهایتا میشه :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Stanford University: Transformers United


Link

البته قبلا معرفی کرده بودم اما الان بنظرم باید به این لیست اضافه می‌شد دیگه.

الکی نرید پول دوره و .. بدید ما والا با همینا و چندتا کتاب یادگرفتیم باقی کسایی هم که می‌شناسیم هیمنطوری کار یاد گرفتند و توی شرکت‌های خوبی هم دارند کار ‌می‌کنند.
25👍8
دستاوردهای یادگیری عمیق(InTec) pinned «من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…»
#موقت

دوستان برای معرفی کتاب؛ اگر خواستید کانال
@pyhints
رو boost کنید تا کتاب‌های هوش مصنوعی که مناسب هستند رو هم اونجا استوری کنم ازین به بعد.

و اگر خواستید کتاب‌هایی که تا حالا معرفی شده رو ببینید؛ فقط کافیه روی
Channel Info
رو روی اون کانال باز کنید و توی بخش Posts تمامی کتاب‌ها رو ببینید (تا بحال پایتون بوده اما ازین به بعد هوش مصنوعی هم اضافه می‌کنم)
👍224
دستاوردهای یادگیری عمیق(InTec)
🫥 Phi-3 توسط ماکروسافت 🟥 معرفی شد؛ مدلی بسیار سبکتر با هدف اجرا روی گوشی اما دقتی بسیار نزدیک به Llama3 - ChatGpt 3.5 - Mixtral 8x7b. لینک مقاله: hugging face paper ✔️ نکات مهم که وجود داره : همه صحبت‌ها راجب نسخه mini هست فعلا که شامل این موارد میشه Phi…
https://huggingface.co/microsoft


یک نسخه با context length 128K هم داده که خب ابتدا اون رو تست خواهم کرد.

خوبی این مدل سبک و سریع بودنش هست.

۱- زبان پشتیبانی فقط انگلیسی هست؛ با کمی اذیت کردن زبان‌های دیگه رو هم جواب میده

۲- دیتاهاش از OpenAI اومده؛ Jailbreak ها رو روش تست کردم و خودش رو مدل تولید شده توسط OpenAI=CloseAI می‌دونه

۳- تیم ماکروسافت ادعا کرده توی بعضی از بنچمارک‌ها از Llama3 - Mixtral عملکرد بهتر یا نزدیکی داره (همچین چیزی رو نمی‌بینم حداقل نه توی کد)

۳-۱: تست بیشتر گرفتم؛ استدلال کردن رو خیلی خوب انجام میده و می‌فهمه به شرطی ازش سخت سوال نکنید (یک مقدار کوئری رو شاید لازم باشه براش ساده کنید) اما همچنان شدیدا با کد مشکل داره

۴- توانایی پاسخگویی به کدهای کمی پیچیده یا بحث‌های پیچیده رو نداره و کاملا گیج میشه (اما درک خوبی از مسائلی که خیلی سخت نباشند داره؛ سطح متوسط)

سرعت بسیار بالایی داره و برای code completion و کدهای ساده بسیار عملکرد خوبی داره
داکیومنت Django 5.0 , FastAPI رو بهش متصل می‌کنم ببینم عملکردش بهتر میشه یا نه؛ چون توی مقاله به این موضوع اشاره کردند.
👍142
نمیدونم چقدر با Agent ها توی دنیای Llm کار کردید یا آشنایی دارید؛ اما اگر سمت پروداکشن باهاش کار کرده باشید ضعف های زیادی داره Devin رو یادتون هست ؟
روزی که ویدئو اومد توی گروه گپ و گفت گفتم که دروغ هست (بخاطر تجربیاتی که توی کارهای شرکت بابتش داشتم) بعدم که متوجه شدیم واقعی هست.


اما امروز میخوام شمارو به یک تحقیق (مقاله؛ کد؛ دیتا و …) معرفی کنم که اجازه بنچمارک زدن روی Agent ها فارغ از سیستم عامل رو میده

OSWorld Github

وقتی سیستمی برای ارزیابی عملکرد Agent ها باشه؛ اتفاقات قشنگ بعد از اون شروع میشود.
ازین به بعد منتظر خبرای خوبی میشه بود.

حتما گیت و مقاله رو بخونید.
👍175
CloseAI (OpenAI)
خبر از دردسترس قرار گرفتن مدل gpt2-chatbot داده؛ من مسئول نامگذاری نبودم.

خارج از بحث عملکرد و ...
چندنفر چندین عکس از قدیم گذاشتند که توی اون‌ها CloseAI اعلام کرده مدل‌های سبکتر این نسخه 1.3B - 8B , ... نسخه‌های opensource, openweight خواهند داشت.

هرچند شدیدا شک دارم ولی خب.
👍131
دستاوردهای یادگیری عمیق(InTec)
من قبلا این دوتا دوره رو معرفی کردم خیلی از دوستانی هم که این دوتا رو خوندند و البته با پیاده سازی و دیتاست و ... روشون تمرین کردند الان توی پروژه‌ها و شرکت‌های بزرگی درحال کار هستند همین دوره‌ها هر ساله آپدیت میشه و مطالب جدید هم بهش اضافه میشه. اما چون…
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد.
واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست :

Stanford CS236: Deep Generative Models (2023)

پس با اضافه شدن این دوره محموع دوره‌ها شد :

1) Standford university: Prof. Manning, deep learning for nlp

2) NYU (new york university): Yan Lucan & Alfered canziani. Deep learning course

3) Standord university: Deep Generative Models

4) Stanford University: Transformers United
👍2617
دستاوردهای یادگیری عمیق(InTec)
بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…
تو مسیری که رفتید اون دوره رو چک کنید
به کانال یوتیوب خودمون هم سر بزنید :
http://youtube.com/@pyhints

ساده شروع کردیم و هدف اینه که بعد از دوره‌های اول از بچه‌هایی که توی صنعت کار می‌کنند (دوستان خودم) دعوت کنم دوره ضبط کنیم؛ کاملا ساده و بدون چیزی و رایگان قرار بگیره.

تنها مزیتی که نسبت به باقی دوره‌ها خواهد داشت.
برای هر دوره قبل از آپلود حداقل ۲ متخصص تایید مناسب بودن دوره برای بیزینس رو خواهند داد.

بازم میگم همه چیز هم توی کانال‌های تلگرام و هم یوتیوب (که ۱۰ روزه راه افتاده) کاملا رایگان خواهد بود و خواهد ماند.
64👍4
دنیای هوش مصنوعی واقعا عجیب شده؛ چندروز صبر کردم تا اطمینان حاصل کنم بعد این پست رو بذارم.
من اکانت شبکه‌های اجتماعی دیگه رو ندارم اما برای تست
meta.ai
البته بطور خاص image generation مجبور شدم اکانت facebook بسازم.

گفتم با یک ایمیل فیک میرم هروقت هم کارم تموم شد دیلیت می‌کنم.
همه چیز خوب پیشرفت تا اینکه بهم گفت یک تصویر تمام رخ بده (قدی بکارش نمیاد 😁)

منم چون اکانت فیک بود؛ روی سیستم یک مدل آوردم بالا و عکس تولید کردم بعد از چندتا پرامپت یک خروجی خیلی خوب گرفتم؛ یک مقدار یقه‌ی لباسش مشکل داشت که چون دوربین ۴۵ درجه بود و پس زمینه طبیعت blur شده بود چیزی معلوم نبود.
۲۴ ساعت طول کشید تایید شد.

کلا کاری که می‌خواستم رو فراموش کردم و گفتم بذار ببینم تا کجا میشه سیستم‌ها و یا افراد رو گول زد.
بله توی مرحله بعدی سعی کردم یک مدرک مثل پاسپورت یا ... براش درست کنم.
چندتا مدرک اصلی توی اینترنت پیدا کردم (تصویر خوب ولی بخش‌های دیتاهاشون رو سیاه کرده بودند هرکدوم یک بخشی رو)
و مقایسه کردم با مدارک ۳ سال اخیر اون کشور؛ و دیدم تصویرها آپدیت هستند.

از یک سیستم هوش مصنوعی دیگه (پرامپت میگیره و بخش‌هایی از تصویر رو درست می‌کنه؛ بیشتر برای ساخت پوستر هست و به خوبی می‌تونه اسم و اطلاعات بنویسه) خواستم تصویر مدرک رو برام درست کنه.
اول بکگراند عکس چهره و ... رو حذف کردم و بر اساس چهره قبلی عکس تمام رخ و رسمی درست کردم.
بعد با فونت دیفالت اسم و سن و اطلاعات دیگه‌ای که داده بودم رو درست کردم؛ با اینکه فونت دقیقا فونت رسمی مدارک نبود اما تایید شد.

همین تایید شد من رو نگران می‌کنه؛ من مجرم نیستم و فقط خواستم یک سیستم ارزیابی رو تست کنم و برای اینکار هزینه و ... هم نکردم
فرض کنید یک مجرم با هزینه و ترین کردن مدلی برای اینکار چه کارهایی که نمی‌تونه بکنه.

واقعا نیاز داریم که هرچه زودتر قانون گذاری درست برای هوش مصنوعی انجام بشه.
راستی من اون اکانت رو هم حذف کردم.
👍698
تصویر اون اکانت (چون برای یکی از دوستان فرستاده بودم هنوز روی سیستم بود)

https://news.1rj.ru/str/pytens/1447
👍131
یکی از دوستان اشاره کرده که تبلیغاتی از دوره‌های ایرانی کانال‌های دیگه پایین پست‌های کانال میاد.

همین اول بگم؛
هیچکدوم از دوره‌های فارسی پولی مورد تأیید ما نیست


و تقریباً هیچکدوم هم مناسب بیزینس نیست، دوره‌ای نیست که شمارو وارد بازار کار کنه.




اما تبلیغات تلگرام، دست ما نیست.
تلاش کردم خاموش کنم این موارد رو ولی تلگرام میگه باید 50 لول Boost داشته باشیم تا اجازه غیرفعال کردن بده بهمون

پس صرف اینکه تبلیغات تلگرام رو پایین هرکدوم از کانال های ما دید، فکر نکنید که ما تایید کردیم اون دوره رو

دوره‌های تایید شده :

https://news.1rj.ru/str/pytens/1444

این پست برای مدتی، بعنوان پست آخر دائماً ارسال خواهد شد. (تا کانال‌ها هدف تبلیغات نباشند)

پ.ن :
کانال یوتیوب با حمایت شما، به آموزش‌های رایگان و البته مناسب بیزینس در زمینه‌های مختلف ادامه خواهد داد قطعا.

http://youtube.com/@pyhints
👍3012
دستاوردهای یادگیری عمیق(InTec) pinned «بالاخره دوره Deep Generative Models های استنفورد هم آپدیت شد. واقعا نباید بهونه آورد بهترین منابع یادگیری دنیا در دسترس نسل جدید هست : Stanford CS236: Deep Generative Models (2023) پس با اضافه شدن این دوره محموع دوره‌ها شد : 1) Standford university: Prof.…»
مقاله جدید مایکروسافت منتشر شده این مقاله درمورد
The Mind's Eye
هست که چندی پیش yaan lecun توی یک مصاحبه که همراه با دیگر بزرگانی در این حوزه بود اعلام کرد که بعید می‌دونه LLM با natural language به تنهایی بتونند بهش برسند.

اما توی مقاله جدید ماکروسافت ادعا کرده که یک تیکنیک به اسم
Visual-of-Thought (VoT) prompting
رو ارائه میده و این اتفاق رو شدنی می‌کنه.

با اینکه کد یا سمپلی ارائه نداده انقدر این دستاورد مهم هست که جاهای متفاوتی ازش استفاده شده (غیر رسمی)

خلاصه که اگر دارید در این زمینه تحصیل و کار می‌کنید حتما باید این مقاله رو بخونید.

VoT Prompting

اهمیت این تکنیک توی ساخت agent ها هست.
اما برای اینکه متوجه تفاوت و عملکرد بشید به این گیت‌هاب می‌تونید سر بزنید؛ یکی از پیاده‌سازی‌های غیر رسمی که بعد از استفاده از این تکنیک داره معروف میشه.

Github
17👍5
تو دنیایی که RHEL 💻 میره سراغ Close-Source
و Nvidia 🟢 درایور میره سمت Open-Source (سری RTX2000 به بعد)
دیگه هیچی منو قافلگیرم نمی‌کنه.

واقعا عجیب شده؛ ولی توی دعوای Nvidia و Linus Torvalds معلوم شد کی برنده شد دیگه 😂

همون که گفت :
F..K you Nvidia ... 🐧🐧
Please open Telegram to view this post
VIEW IN TELEGRAM
👍313
حالا که همه دارند از
CloseAi GPT-4o

صحبت می‌کنند من چندتا از مدل‌های مهم که زیر این حجم مارکتینگ ممکنه از دست داده باشید رو نام ببرم که به تازگی release شده

Yi-1.5
بخصوص روی تسک‌های مربوط به کد زدن؛ بسیار عملکرد خوبی داره طبق بنچمارک‌ها عملکرد بهتری نسبت به llama3 داره که شخصا توی تست هم این موضوع رو دیدم.

Falcon2.0

هم مدل 11B اش رو منتشر کرد که خروجی خوبی داره و مثل متا درحالی که مدل اصلی رو داره توسعه می‌ده قرار هست مدل‌های کوچکتر رو release کنند.

IBM
هم مدل خودش رو منتشر کرده که تعداد پارامتر‌هاش زیاد بود و نتونستم تست کنم.
👍244
نکته بعدی
حتما نگاهی به
Kolmogorov-Arnold Networks
هم داشته باشیم.

پتانسیل خوبی داره (اگر لازم شد راجبش خواهم نوشت)
👍235
قابلیت سوال و جواب در مورد ویدئو توی
Gemini 1.5 pro
نسخه جدید واقعا فوق‌العاده هست؛ فرض کنید قابلیت 2m Token کانتکس رو به این اضافه کنید چه کارهایی که نمی‌شه کرد.


اضافه کنم دقتش بسیار بسیار بالاس
👍264