دیتاهاب – Telegram
دیتاهاب
2.13K subscribers
184 photos
35 videos
127 files
327 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
یه چیز عجیبی (و البته خیلی شایع) دیدم امروز یک دانشجوی سال آخر کارشناسی کامپیوتر داشت CV می‌نوشت نوشته بود:
"مسلط به 5 زبان برنامه‌نویسی"

پرسیدم: "یه پروژه با Go نوشتی؟" گفت: "نه ولی Hello World زدم!"

بازار کار الان شرایط عجیبیه HR یا تکنیکال اینتروری که مقابلت میشینه حرفه‌ای‌تر از قبله تو ۵ دقیقه می‌فهمه واقعا بلدی یا فقط اسم بلدی

بهتره بنویسی: "تخصص در پایتون - ۳ پروژه عملی انجام دادم
" تا اینکه بنویسی: مسلط به Python, Java, C++, JavaScript, Go, Rust, ...
حداقل از دید من مصاحبه کننده حس بهتری میگیرم تا یک لیست بالا بلند

میدونم کلیشه ای هست ولی یک مهارت عمیق بهتر از ۱۰ تا مهارت سطحی‌ه مخصوصا تو دورانی که همه چیز در دسترسه کیفیت مهمه، کمیت نه
👍192
داشتم با یک استارتاپ صحبت می‌کردم، گفت ما ۳ ماهه داریم ChatGPT Plus می‌خریم برای تیممون ولی نمی‌دونیم چرا هنوز نتایج کارمون بهتر نشده!
سوال کردم: "پرامپت‌هاتون چطوریه؟"
جواب: "سلام، لطفا این کد را بررسی کن"

فارغ از اینکه که از نسخه 5 استفاده می کرد که یکم خنگ تر شده ولی
بهش گفتم، هوش مصنوعی جادو نیست یک پرامپت خوب مثل یک دستور العمل آشپزیه وقتی به آشپز میگی "غذا درست کن" انتظار نداری شاهکار بسازه ولی وقتی میگی "برای ۴ نفر خورشت قیمه با گوشت چرخ کرده، نصف کیلو عدس، رب گوجه تند، زعفران..."
معلومه بهتر عمل کنه و غذای خوشمزه تری می پزه
یک پرامپت خوب ترجیحا یعنی:

زمینه مشخص (تو یک برنامه‌نویس سینیورهستی)
هدف روشن (میخوام این کد بهینه‌تر بشه و بهینه از چه نظر)
محدودیت‌ها (با زبان پایتون، حداکثر ۵۰ خط)
مثال (مثل این نمونه که میفرستم)



پند اخلاقی😉: ابزار خوبی داری؟ عالی. حالا یاد بگیر ازش حرفه‌ای استفاده کنی.
👍133
یکی از این robot های جدید Tesla رو نگاه می‌کردم
این بچه (ربات) می‌تونه ظرف بشوره، لباس تا کنه، حتی بچه نگهداری کنه
قیمتش چیزی حدود ۳۰ هزار دلاره ولی یک بار می‌خری، ۲۰ سال کار می‌کنه

درسته تقریباً همه مشاغل physical هم در خطرن
ولی آینده به شدت هیجان انگیزه (شایدم ترسناک)
خیلی از محدودیت های مهم صنعت از بین میره (آسیب نیروی کار، بد بودن شرایط روحی یا جسمی و بیماری، خسته شدن) در چنین شرایطی خط تولیدهای 24ساعته که دقیق و منظم دارن تولید می کنن
جهش بزرگی توی صنعت خواهیم داشت، کیفیت محصولات و تولیدات بالاتر میره و بار کاری انسان ها روی دوش ربات ها میره و تنبل تر میشیم😂

دارم خودم تصور می کنم یک مزرعه دارم و 4 تا کارگر رباتیک دارم و مشغول برده داری نوینم😎 واسم دارن کشاورزی می کنن
👍51
امروز یه کار عملی برای تون دارم می‌خواید ببینید دیتاتون چقدر کیفیت داره؟
کد زیر رو اجرا کنید (Python):

import pandas as pd

# فایل CSV خودتون رو بخونید
df = pd.read_csv('your_data.csv')

# گزارش سریع کیفیت داده
print(f"تعداد سطرها: {len(df)}")
print(f"تعداد ستون‌ها: {len(df.columns)}")
print(f"مقادیر خالی: {df.isnull().sum().sum()}")
print(f"سطرهای تکراری: {df.duplicated().sum()}")

# آماره سریع
print("\nخلاصه آماری:")
print(df.describe())

# مقادیر خالی به تفکیک ستون
print("\nمقادیر خالی هر ستون:")

۵ دقیقه وقت بذارید، اجراش کنید نتیجه رو ببینید شاید متوجه بشید چرا مدلتون خوب نتیجه نمیده
داده کثیف = نتیجه کثیف
این قانون طلایی علم دادس

پ.ن: می دونم کد خیلی ساده ای هست
ولی این نمونه هستش، و اینو میشه خیلی پیشرفته انجام دادش. واسم توی کامنت ها بنویسید که چه روش های بهتری سراغ دارین.
17👍1
یک پند به دوستان جونیور😅

یکی از بزرگترین اشتباهات فریلنسرها: نمونه کار نداشتن

با یک کارفرما صحبت می‌کردم، می گفت
"۵ نفر برام پیشنهاد دادن، ولی هیچکدوم نمونه کار نداشتن"

دوستان، GitHub خالی = فرصت از دست رفته

حداقل ۳ تا پروژه کوچیک بذارید:

۱. یک داشبورد ساده (Streamlit یا Dash)
۲. یک API بسیط (FastAPI)
۳. یک تحلیل داده با matplotlib/plotly

نمونه کار == اعتماد و اعتماد == کار => پول

برای شروع:
• GitHub Pages مجانیه: https://pages.github.com
• Streamlit Cloud رایگان: https://streamlit.io/cloud
• Heroku هم پلن مجانی داره

به قول ما اصفهانیا الان شروع کنید، فردا دیرس😂
12👍4
موضوع جدید این روزها: AI Agents
همه دارن راجع بهش حرف می‌زنن ولی کمتر کسی می‌دونه چیه

AI Agent
یعنی یک سیستم که:
• هدف داره
• برنامه‌ریزی می‌کنه
• تصمیم می‌گیره
• عمل می‌کنه
• نتیجه رو ارزیابی می‌کنه

مثلا به جای اینکه بگی: "این ایمیل رو جواب بده" می‌گی: "مشتری ناراضیه، مشکلش رو حل کن"
خود Agent:
• ایمیل رو تحلیل می‌کنه
• مشکل رو شناسایی می‌کنه
• راه حل پیشنهاد می‌ده
• ایمیل مؤدبانه می‌نویسه
• اگه لازم بود، follow up می‌کنه

ابزارهای عملی:
• AutoGen: https://github.com/microsoft/autogen
• LangGraph: https://langchain-ai.github.io/langgraph
• CrewAI: https://crewai.com

پیش بینی یکم خوشبینانه: احتمالا تا ۶ ماه آینده agent-ها جای assistant-ها رو می‌گیرن.
7👍3
تازگی داشتم با Anthropic Claude Computer Use کار می‌کردم
این چیز واقعاً ترسناکه!
می‌تونه خودش کامپیوتر رو کنترل کنه، روی دکمه‌ها کلیک کنه، فرم‌ها رو پر کنه
گفتم برام یک فاکتور توی اکسل درست کن
خودش فایل رو باز کرد، جدول کشید، فرمول نوشت، حتی رنگ‌بندی کرد
یعنی اون assistant اداری که شرکت‌ها استخدام می‌کنن برای این کارا الان چیکار کنه؟
فعلاً خیلی beta هست و گاهی خراب می‌کنه ولی آینده‌اش روشنه
تا 2 سال دیگه شاید بتونیم بگیم: "کل فروش امروز رو بررسی کن و گزارش بده"
و خودش انجام بده

پ.ن: به قول محمدرضا شعبانعلی به زودی شاهد نابودی وب خواهیم بود. شاید بگین چه ربطی داره؟ خب وقتی ایجینت خودش محتوا تصویر و متنی آماده کنه، خودش هم میره ویو فیک میزنه و همه چی خودکار و بدون دخالت انسان انجام میشه. پس وب دیگه چه ارزش افزوده ای خواهد داشت؟

لینک: https://docs.anthropic.com/en/docs/computer-use
👍7
چند وقت پیش یک دوستی از پیام داد:
"من با Python خیلی خوبم، حالا کدوم فریمورک یاد بگیرم؟ Django یا FastAPI؟"
گفتم: "کی آخرین بار برنامت کرش کرد؟"
گفت: "دیروز"
"چرا؟"
"نمی‌دونم، memory leak بود یا چیزی"
گفتم برو اول اینارو یاد بگیر:

چطور کدت رو debug کنی
چطور memory رو مدیریت کنی
چطور test بنویسی
چطور error handling کنی

بعدش بیا فریمورک یاد بگیر😄
پایه قوی نداشته باشی، هر فریمورکی یاد بگیری مشکلت همونه😉
6👍5
یک چیز باحال دیدم: Replit Agent
می‌گی: "یک فروشگاه آنلاین بساز"
خودش کد می‌نویسه، دیتابیس می‌سازه، UI طراحی می‌کنه، تست می‌کنه، deploy می‌کنه
10 دقیقه طول کشید

اگه ترسیدی و به درستی پیش خودت میگی: پس ما برنامه‌نویسا چیکار کنیم؟
جوابش اینه: بجای code monkey بودن، باید product manager و problem solver بشیم
ابزار کد می‌نویسه، ولی نمی‌دونه چه چیزی بسازه
ما باید بگیم چه مشکلی حل کنه
نقش ما داره تغییر می‌کنه، نابود نمیشه (عجب جلمه قصاری گفتم🥹)

همون نصیحت همیشگی من: مهندس نرم افزار باش تا 5 سال آینده توپ هم نمی تونه تکونت بده😎

لینک ابزار: https://replit.com/agent
7👍3🔥1
دوستان عزیز، سال ۲۰۲۵ هست
بهینه ساز SGD
برای اکثر کارهای deep learning دیگه گزینه اول نیست
ساده بگم:

SGD: قدیمی، کنده، نیاز به تنظیم زیاد
Adam: سریع، خودکار، برای اکثر کارها خوبه
AdamW: نسخه بهتر Adam با weight decay

یک قاعده ساده (که لزوما همه جا هم جواب نمیده):
اول Adam رو امتحان کنید
اگر overfitting دیدید، برید سراغ AdamW

کدش:
optimizer = torch.optim.AdamW(model.parameters(), lr=1e-4, weight_decay=0.01)
13👍1
یک تیم می شناسم که 6 ماهه دنبال ML engineer می‌گرده و پیدا نمی کنه
گفتم: "چه شرایطی می‌خواید؟"

لیست شرایط:

PhD در AI/ML
5+ سال تجربه
مسلط به PyTorch, Hugging Face
تجربه MLOps و Kubernetes
تجربه fine-tuning مدل‌های بزرگ

گفتم: "حقوق چقدر؟"
گفت: "22 میلیون تومان"
گفتم این حقوق برای یک junior developer خوبه!

کسی که این رزومه رو داره، حداقل 50 میلیون می‌ارزه
یا بره شرکت‌های بین‌المللی کار کنه

بازار کار خیلی غیرواقعی شده
انتظارات بالا، پول کم

پ.ن: خیلی وقت بود پست ناله محور نزاشته بودم😃
👍272😁1
image_2025-09-23_17-28-31.png
76.5 KB
Iranian developers are building amazing AI tools but nobody knows about them

لینک: https://devm.io/machine-learning/ai-tools-haghiri

بدون شرح
4🔥1
یکی از دوستام گفت: «من از AI هیچی استفاده نمی‌کنم، ترجیح میدم خودم کار کنم»

گفتم باشه، بیا یه تست کنیم
بهش گفتم یه ایمیل رسمی به انگلیسی بنویس برای درخواست مرخصی

۲۰ دقیقه نشست، ۳ بار نوشت و پاک کرد
آخرش یه متن ۴ خطی نوشت که گرامرش هم مشکل داشت

من همون متن رو ۳۰ ثانیه تو Claude دادم:
«این متن فارسی رو به انگلیسی ترجمه کن، لحن رسمی و مؤدب باشه»
یه ایمیل حرفه‌ای ۱۰ خطی برگردوند

دوستم گفت: «خب این که تقلبه!»

گفتم نه، این هوشمندیه😎
مثل اینکه بگی استفاده از ماشین حساب توی ریاضی تقلبه
کار AI اینه که کارهای تکراری رو برامون انجام بده تا وقت بیشتری برای فکر کردن و خلاقیت داشته باشیم
نه اینکه جایگزین مغزمون بشه

پ.ن: ولی ته ذهنم اینه که هوش مصنوعی مارا تنبل بار میارن و خلاقیتمون کم می کنن😄☺️
11👍6
فک کنم نزدیک به دو ساله پیام چاپ مقاله نزاشته بودم😢

ولی خب الان میگم که مقاله جدیدمون اکسپت شد😎
به زودی پابلیش میشه و DOIاش میزارم

از خانم زارعی هم تشکر می کنم
این دومین کار مشترکمون شد

فعلا لینک آرکایو داشته باشید☺️
https://arxiv.org/abs/2311.13925
7
دیتاهاب
فک کنم نزدیک به دو ساله پیام چاپ مقاله نزاشته بودم😢 ولی خب الان میگم که مقاله جدیدمون اکسپت شد😎 به زودی پابلیش میشه و DOIاش میزارم از خانم زارعی هم تشکر می کنم این دومین کار مشترکمون شد فعلا لینک آرکایو داشته باشید☺️ https://arxiv.org/abs/2311.13925
راستی یکی دو تا کار تحقیقاتی جدید شروع کردیم
با موضوعات هوش مصنوعی در پزشکی
و مدل های زبانی

از دوستان، کسی علاقه داشت چه توی بخش پیاده سازی چه نگارش مشارکت داشته باشه و اسمش درج بشه
رزومه خودش به این اکانت بفرسته (حداکثر تا 2 هفته آینده- چون به زودی تیم بسته میشه و کار سریعا شروع خواهد شد)

@data_hub
3
یه خبری می خوندم که: Meta داره Threads رو به یه پلتفرم برنامه‌نویسی تبدیل می‌کنه!
منظورم اینه که الان می‌تونی مستقیم توی Threads کد بنویسی و اجرا کنی
مثل Jupyter Notebook ولی توی یه شبکه اجتماعی!

هنوزم مطمئن نیستم و حدس میزنم ممکنه خبر فیک باشه

ولی اگه بهش فکر کنیم چقدر جالب میشه:
کدت رو می‌نویسی، بقیه لایک می‌کنن، کامنت می‌زارن، suggest می‌دن
یه جور GitHub + Twitter = Threads

و اگه موفق بشه، LinkedIn خیلی ناراحت می‌شه 😄
فکر کن بتونی portfolio کدت رو مثل پست اینستاگرام share کنی
👍11
داشتم با Claude Sonnet 4.5 کار می‌کردم
یهو متوجه شدم این مدل توی reasoning واقعا فرق کرده

یک مسئله پیچیده کدنویسی بهش دادم که GPT-4 گیر کرده بود
نه تنها جواب داد، بلکه مراحل فکریش رو هم توضیح داد

این نسل جدید مدل‌ها دارن یک چیز یاد می‌گیرن: فکر کردن
دیگه فقط pattern matching نیست، دارن می‌فهمن چرا یک راه حل کار می‌کنه

برای کسایی که می‌خوان کد بزنن:
مدل Claude رو امتحان کنید با پرامپت‌های طولانی‌تر

بهش بگید "قبل از جواب، مراحل فکریت رو بنویس"
تفاوت رو حس می‌کنید.

پ.ن: نه، این پست اسپانسر نیست😂 واقعا تجربه خودمه
👍162
یک اشتباه رایج که تازه متوجه شدم:
خیلی‌ها فکر می‌کنن fine-tuning همیشه جوابه

نه دوستان، خیلی وقت‌ها RAG بهتره

بذارید ساده بگم:
Fine-tuning = آموزش دوباره مدل

زمان‌بر، پرهزینه، نیاز به GPU قوی
وقتی داده‌تون تغییر کنه، باید دوباره تیون کنید

RAG = دادن اطلاعات در لحظه به مدل

سریع، ارزون، فقط یک vector database لازمه
داده تغییر کرد؟ فقط دیتابیس رو آپدیت کنید

قاعده ساده:
داده‌تون ثابته و می‌خواید سبک نوشتار تغییر کنه؟ → Fine-tune
داده‌تون مدام عوض میشه و می‌خواید مدل بهش دسترسی داشته باشه؟ → RAG

برای شروع یادگیری RAG
LangChain + ChromaDB + OpenAI API

یک آخر هفته کافیه برای یادگیریش
👍104
یک پند به دوستان جونیور:

دیروز یک نفر پرسید: "چطور می‌تونم سریع‌تر کد بزنم؟"
جوابم این بود: "کپی‌پیست کردن سریع نیست، تکرار کردنه"

توضیح می‌دم:
وقتی از ChatGPT یا Copilot استفاده می‌کنید، کد رو کپی نکنید
بخونید، بفهمید، خودتون دوباره بنویسید

چرا؟
چون مغز شما باید الگوها رو یاد بگیره
کپی‌پیست = حافظه کوتاه‌مدت
تایپ کردن = حافظه بلندمدت

یک تمرین ساده:
۱. کد AI رو بخونید
۲. پنجره رو ببندید
۳. خودتون از حفظ بنویسید
۴. مقایسه کنید

قطعا اول کاری سخته، ولی بعد از ۱۰ بار، دیگه نیاز به AI ندارید

این فرق یک junior که copy-paste می‌کنه با یک mid-level که واقعا بلده
28👍1
یک چیز عجیب دیدم توی LinkedIn:

یک نفر نوشته بود: "من 15تا مدل machine learning train کردم"

ولی هیچ کدوم deploy نکرده بود

رفقا، مدل train کردن ۲۰٪ کاره
دیپلوی کردن و نگهداری کردنش ۸۰٪ کاره

یک مدل که روی Jupyter Notebook کار می‌کنه، هنوز آماده محیط واقعی نیست

چیزایی که باید یاد بگیرید:
۱. Docker → از مدلتون کانتینر بسازید.
۲. FastAPI → یک ای پی آی ساده بسازید
۳. AWS/GCP → یاد بگیرید چطور دیپلوی کنید

یک پروژه عملی:
یک مدل ساده‌ بسازید، با FastAPI براش API بنویسید، با Docker یک کانتینر ازش بسازید، روی Heroku یا Railway اونو deploy کنید

این یک پروژه، ارزش ۱۰ تا notebook توی GitHub داره

برای شروع:
FastAPI: https://fastapi.tiangolo.com
Railway: https://railway.app
👍163
امروز می‌خوام یک مفهوم رو ساده کنم که خیلی‌ها ازش می‌ترسن:

Mixture of Experts (MoE)

بذارید با یک مثال توضیح بدم:

فرض کنید یک رستوران دارید
به جای اینکه یک آشپز همه غذاها رو بپزه
۱۰ تا آشپز دارید، هرکدوم متخصص یک نوع غذا
وقتی سفارش می‌گیرید، فقط آشپز مربوطه کار می‌کنه

نتیجه: سریع‌تر، بهتر، کارآمدتر

تکنیک MoE دقیقا همینه:
به جای یک مدل بزرگ، چندتا مدل کوچیک (experts) و
یک router تکه صمیم می‌گیره کدوم expert باید کار کنه

مثال واقعی: Mixtral 8x7B
۸ تا expert داره، ولی فقط ۲ تا برای هر input فعال میشن
نتیجه: سرعت بالا، مصرف واحد پردازشی کمتر

چرا مهمه؟
کم‌مصرف‌تر، سریع‌تر، مقیاس‌پذیرتر

اگر می‌خواید با MoE کار کنید:
مدل Mixtral رو از Hugging Face امتحان کنید

لینک: https://huggingface.co/mistralai/Mixtral-8x7B-v0.1
👍8