دیتاهاب – Telegram
دیتاهاب
2.14K subscribers
184 photos
35 videos
127 files
327 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
scikit-learn-Part4.pdf
33.2 KB
درود
❇️ در بخش چهارم معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین قرار داریم.
❇️ سایکیت لِرن یکی از کتابخانه های بسیار مؤثر برای یادگیری ماشین در پایتون است که شامل ابزارهای بسیار کارآمد و مدلسازی های آماری از جمله طبقه بندی، رگرسیون، خوشه بندی و کاهش ابعاد می باشد.
👈به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد.
در بخش چهارم داده های پرت و برخی الگوریتم های مورد استفاده برای شناسایی این داده ها و همین طور الگوریتم KNN توضیح داده می شود.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
scikit-learn-Part5.pdf
74.8 KB
درود
❇️ در بخش پنجم معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین قرار داریم.
❇️ سایکیت لِرن یکی از کتابخانه های بسیار مؤثر برای یادگیری ماشین در پایتون است که شامل ابزارهای بسیار کارآمد و مدلسازی های آماری از جمله طبقه بندی، رگرسیون، خوشه بندی و کاهش ابعاد می باشد.
👈به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد.
در این بخش به بررسی و استفاده از دو الگوریتم بسیار مفید Naive Bayes و ِDTree با استفاده از این کتابخانه پرداخته شده است.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
درود به همگی
بعضا دوستان لطف دارند و پروژه به بنده معرفی می‌کنند ولی متاسفانه به دلیل زمان محدود امکان انجام همه موارد ندارم الان سه تا پروژه هست که خوشحال میشم قبول زحمت کنید
موضوعات با محوریت تحلیل داده هست و شامل پردازش تصویر و متن و داده کاوی هست
دوستان علاقمند یک رزومه از خودشون ارسال کنند تا بشه یک همکاری خوبی شکل داد

پروژه اول پیش پردازش یک دیتای جدولی
پروژه دوم یک پروژه حرفه‌ای متن‌کاوی
و پروژه سوم سیستم توصیه‌گر( پروژه سوم حالت استخدام هم داره و یکی از شرکت‌های خوشنام تهرانه که دنبال نیروی ارشد داده هستش که طبیعتا اطلاعات دقیق‌تر خصوصی بهتون میگم)

@mohammad_dehghani

لطفا در حد امکان به اشتراک بگذارین
@data_hub_ir
scikit learn-Part6.pdf
91.4 KB
درود
❇️ در بخش ششم معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین قرار داریم.
❇️ سایکیت لِرن یکی از کتابخانه های بسیار مؤثر برای یادگیری ماشین در پایتون است که شامل ابزارهای بسیار کارآمد و مدلسازی های آماری از جمله طبقه بندی، رگرسیون، خوشه بندی و کاهش ابعاد می باشد.
👈به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد.
در بخش ششم روشهای Boosting, Clustering بررسی و همین طور روشهای خوشه بندی مقایسه شده اند.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
scikit-learn-LastPart.pdf
76.7 KB
درود
❇️ در بخش آخر از معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین قرار داریم.
❇️ سایکیت لِرن یکی از کتابخانه های بسیار مؤثر برای یادگیری ماشین در پایتون است که شامل ابزارهای بسیار کارآمد و مدلسازی های آماری از جمله طبقه بندی، رگرسیون، خوشه بندی و کاهش ابعاد می باشد.
👈به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد.
در بخش پایانی روشهای ارزیابی Clustering و کاهش ابعاد با استفاده از PCA توضیح داده می شود.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
Data Cleaning Project.pdf
471.4 KB
درود
❇️ شواهد نشان می دهد تحلیلگران داده بیشتر از ۷۰ درصد از زمان خود را صرف فرآیند پاکسازی داده می کنند.
❇️ پاکسازی داده ها جزو اصلی ترین و اولین مراحل در هر پروژه هوش مصنوعی و داده کاوی می باشد.
👈به همین منظور در این مقاله برخی از متدهای روش Data Cleaning با استفاده از زبان برنامه نویسی پایتون آورده شده است .
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
درود
قصد دارم به صورت کاملا رایگان به دونفر (یک نفر اصفهانی و یک نفر غیراصفهانی) به صورت فردی،
آموزش هایی در زمینه هوش مصنوعی و خصوصا علم داده ارائه بدم
شرایط اولیه:

❇️علاقه‌مندی به یادگیری علوم داده
❇️اشنایی اولیه و مقدماتی با علم داده
❇️دانشجوی مقطع لیسانس( از همه زیررشته‌های مهندسی کامیپوتر یا علوم کامیپوتر)

دوستان لطفا رزومه خودشون(حداکثر تا 16 فروردین) به ای دی زیر توی تلگرام بفرستن.
@datajm

لطفا در صورت امکان این پست را به اشتراک بگذارید.
@data_hub_ir
Movie_Recommendation_System.pdf
176.9 KB
درود
با آرزوی سالی سراسر سلامتی، شادی و آرامش(سال نو مبارک 🌹)
❇️سیستم های توصیه گر از محبوب ترین شاخه های علم داده هستند. از این سیستم ها برای پیش بینی “رتبه بندی” یا “ترجیحی” که کاربر به یک محصول می دهد استفاده می شود.
❇️سیستم های توصیه گر به طور کلی ، به سه دسته تقسیم می شوند:
👈 مبتنی بر محتوا
👈 پالایش مشارکتی
👈 روش های ترکیبی
❇️در این قسمت یک سیستم پیشنهاد دهنده فیلم بر اساس روش پالایش مشارکتی را به همراه کد ارائه می دهیم.

❇️@data_hub_ir
#یادگیری_ماشین
#پایتون
#تحلیل_داده
#هوش_مصنوعی
#سیستم_توصیه_گر
SqlServerCode.pdf
540.7 KB
درود
❇️ زمانی که اطلاعاتی را در کامپیوتر خود ذخیره می کنیم، در واقع به یک پایگاه داده در آن نیاز داریم. بدین ترتیب از این پس برای دسترسی به این اطلاعات لازم است فرایندها، عملگرها و دستورالعمل هایی مورد استفاده قرار گیرند تا ارتباط بین ما و این دیتابیس برقرار شود. در واقع به زبان مشترکی نیاز داریم تا اقدامات ما را برای کامپیوتر تعریف کند و بالعکس.
❇️ اس کیو ال سرور  یک پایگاه داده قدرتمند است که توسط شرکت مایکروسافت توسعه یافته و علاوه بر خدمت رسانی به عنوان یک دیتابیس رابطه ای و تجاری سازی شده، بر اطلاعات مدیریت هوشمند نیز انجام می دهد.
❇️ در این فایل دستورات مهم و کاربردی با استفاده از این پایگاه داده به طور خلاصه آورده شده است.
❇️ @data_hub_ir

#تحلیل_داده
#پایگاه_داده
#هوش_مصنوعی
#یادگیری_ماشین
درود

❇️در ادامه مباحث قبلی در مورد مدل‌های زبانی یک لینک خوب پیدا کردیم، اینجا تلاش داره با دمو و مثال قشنگ مفاهیم مربوط به GPT-۳ منتقل کنه از دستش ندین.

لینک مقاله 👇🏻
https://towardsdatascience.com/gpt-3-demos-use-cases-implications-77f86e540dc1

❇️@data_hub_ir

#مقاله
#مقاله_آموزشی
Pandas.pdf
1.6 MB
درود

❇️ در این قسمت به معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین می پردازیم.
❇️ پانداس یک کتابخانه قدرتمند برای تحلیل، پیش پردازش و بصری سازی داده ها است.
❇️ در ادامه نحوه کار کردن با داده ها از طریق این کتابخانه (مانند تغییر فرمت ساختار داده، پیدا کردن رکوردهای مورد نظر، کار با زمان و تاریخ، رسم نمودارها و ...) به همراه کدهای مربوطه قرار گرفته است.

❇️@data_hub_ir
#یادگیری_ماشین
#پایتون
#تحلیل_داده
#هوش_مصنوعی
PopularityRecommenderSystem.pdf
59.1 KB
درود
❇️ روند کار در سیستم های توصیه گر بر اساس محبوبیت به این صورت است که سیستم آیتمی را که در بین کاربران محبوبیت بیشتری داشته باشد را به کاربر معرفی می کند.
❇️ در این مقاله کوتاه با استفاده از روش سیستم های توصیه گر بر اساس محبوبیت بهترین رستوران ها بر اساس رضایتمندی و امتیازدهی مشتریان به همراه کد آورده شده است.
❇️@data_hub_ir
#یادگیری_ماشین
#پایتون
#تحلیل_داده
#هوش_مصنوعی
👍1
درود

❇️حتما خیلی هاتون دوست دارین نحوه فاین تیون کردن برت به صورت عملی یاد بگیرین. خب یک مقاله دو قسمتی به کمک پایتورچ اومده و به صورت عملی فاین تیونیگ یاد داده و خط به خط کدها توضیح داده …قسمت اول

لینک مقاله 👇🏻
https://blog.usejournal.com/part1-bert-for-advance-nlp-with-transformers-in-pytorch-357579d63512

❇️@data_hub_ir

#مقاله
#مقاله_آموزشی
درود

❇️حتما خیلی هاتون دوست دارین نحوه فاین تیون کردن برت به صورت عملی یاد بگیرین. خب یک مقاله دو قسمتی به کمک پایتورچ اومده و به صورت عملی فاین تیونیگ یاد داده و خط به خط کدها توضیح داده …قسمت دوم

لینک مقاله 👇🏻
https://medium.com/@aniruddha.choudhury94/part-2-bert-fine-tuning-tutorial-with-pytorch-for-text-classification-on-the-corpus-of-linguistic-18057ce330e1

❇️ @data_hub_ir

#مقاله
#مقاله_آموزشی
tensorflow_v_2.0.pdf
817.9 KB
درود
❇️ تنسورفلو، یک کتابخانه متن باز یادگیری ماشین است که به برنامه نویسان کمک می کند تا بتوانند طراحی و پیاده سازی شبکه های عصبی عمیق را به سادگی انجام دهند.
❇️ گوگل از این کتابخانه برای مواردی مانند بازشناسی گفتار، تصاویر و سرویس های جست و جو استفاده می کند.
❇️ در ادامه موارد پرکاربرد نسخه دوم این کتابخانه به همراه کدهای مربوطه قرار گرفته است.

❇️@data_hub_ir
#یادگیری_ماشین
#پایتون
#تحلیل_داده
#هوش_مصنوعی
Simple Approaches to Recommender Systems.pdf
250.8 KB
درود
❇️ از انواع سیستم های توصیه گر می توان به سیستم های توصیه گر مبتنی بر همبستگی اشاره کرد. در ساختار این الگوریتم از ضریب پیرسون جهت پیشنهاد آیتم جدید استفاده می شود.
❇️ در این مقاله نحوه استفاده از سیستم های توصیه گر مبتنی بر همبستگی به همراه کدهای مربوطه قرار داده شده است.
❇️ @data_hub_ir

#تحلیل_داده
#پایگاه_داده
#هوش_مصنوعی
#یادگیری_ماشین
#سیستم_توصیه_گر
درود
میخوایم که یک مقاله چهار قسمتی در مورد Conducting Sentiment Analysis رو با هم بررسی کنیم.

قسمت اول: جمع آوری دیتا با استفاده از bs4 و selenium

لینک مقاله 👇🏻
https://zzhu17.medium.com/web-scraping-yahoo-finance-news-a18f9b20ee8a

برای قسمت جمع آوری linkها با استفاده از selenium، از حلقه for و تعریف webdriver در حلقه استفاده شده. ما این بخش رو از یک راه دیگه ای پیاده سازی کردیم. آدرس👇🏻

https://github.com/datahub-ir/yahoo_finance_news_data_collection

بهترین راه حل نیست ولی اگر راه بهتری سراغ دارید، بهمون پیشنهاد بدید.

@data_hub_ir
#مقاله
#مقاله_آموزشی
If you are asked to predict a value as a problem statement what basic model should you use ?
Anonymous Quiz
23%
Deep learning
5%
Transfer learning
65%
Regression
7%
None of the above
keras.pdf
553.3 KB
درود
❇️ کرَس یک کتابخانه رایگان قدرتمند و با کاربرد بسیار آسان برای توسعه و ارزیابی مدل های یادگیری عمیق است. این کتابخانه برای آزمایش سریع و مدولار بسیار کاربردی می باشد.
❇️ در این قسمت خلاصه ای از کاربردی ترین موارد استفاده از این کتابخانه آورده شده است.
❇️ @data_hub_ir

#تحلیل_داده
#هوش_مصنوعی
#یادگیری_ماشین
#یادگیری_عمیق