مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
مرجع دیتاست فارسی pinned «در این مدت، تا الان دوستان زیادی لطف داشتند و دیتاست یا کتاب‌های خودشان را برای معرفی در کانال برای ما ارسال کردند. یکی از دوستانی که قبلاً به پیشنهاد خودشان دیتاستشان را در کانال معرفی کردیم، اخیراً پیام داده و تشکر کردند چون از یکی از دیتاست های دیگر کانال…»
Persian Book Template for Publication
یکی از بچه های دانشگاه علم صنعت، یک کار باحال انجام دادند و قالب مخصوص انتشار کتاب به اشتراک گذاشتن
فرمت قالب latex هست و به راحتی می تونین ازش استفاده کنید

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/alirezaqazavi/Persian_Book_Template_for_Nashr
یک کار جالب که کارمون خیلی راحت تر می کنه
اگر از این سایت به اون سایت، از این خونه به اون خونه
دنبال فرصت های دکترای فول فاند بودین، این خزشگر میخواد کارتون آسون تر کنه و نتایج جستجو در قالب فایل اکسل تحویلتون بده

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/Aghababaei/PhD-Seeker
👍2
Forwarded from دیتاهاب (محمد)
بهترین کتاب یادگیری ماشین 👨🏻‍💻👩🏻‍💻

فرض کنید شما با مجموعه‌ای همکاری می‌کنید و بعد از مدتی تصمیم به قطع همکاری می‌گیرید. اصولا بعد از همکاری محصولات شما باید از روی سایتشان برداشته شود. با اینکه هیچ مالکیت حقوقی و معنوی نداشته و صرفا واسطه فروش بودند، ولی متاسفانه چنین کاری انجام نمی‌شود😐. بارها قول داده ولی زیر قولشان می‌زنند و حتی بدون اجازه و رضایت شما، محصولاتی که تمام زحمتش با شماست به فروش گذاشته و صفر ریال نصیب شما می‌شود🤷🏻‍♂️.

بنابراین تصمیم گرفتیم کتاب یادگیری ماشین از طریق وب سایت دیتاهاب به فروش برسانیم 🥳. اگر تمایلی به خرید و حمایت از دیتاهاب دارید از طریق لینک زیر اقدام کنید:
https://data-hub.ir/?p=5405

به مناسبت برگزاری نمایشگاه کتاب و ترویج کتابخوانی، به مدت یک هفته براتون تخفیف ۱۰۰ درصدی در نظر گرفتیم.
کد تخفیف 😍: mlbookfree

در مورد کتاب:
این کتاب قطعا یکی از بهترین‌ کتاب ها با موضوع یادگیری ماشین است‌.
زمان انتخاب کتاب برای ترجمه، معیارهایی مثل سادگی و شیوایی کتاب اهمیت داشت. کتابی که حتی یک روزه میشه مطالعه کرد ولی مروری بر تمام مباحث ضروری یادگیری ماشین است.
👍3👎1
Forwarded from MohammadReza KarimiNejad
شماره هاي رند تهران كه در سايت rond.ir وجود داشتن رو به شكل يك ديتاست دراوردم. اين ديتاست خيلي ميتونه به اين كمك كنه كه شما چطور از يك شماره تلفن الگو استخراج كنيد و به كمك اون قيمت رو تخمين بزنيد. همينطور يك فيلد اضافه هست كه نحوه خواندن اين شماره تلفن توسط مردم رو اوردم. اگه براتون جالبه خودتونو امتحان كنيد و منو upvote كنيد.

https://www.kaggle.com/datasets/mokar2001/tehran-easytoremember-phone-number-price
Forwarded from MohammadReza KarimiNejad
پياده سازي موارد زير در پايتون كه به صورت فصل بندي شده در گيت هاب شير شده:

نظریه مجموعه‌ها
ترکیبیات و شمارش
مبانی احتمال
احتمال شرطی
داده و مقدمه‌ای بر آمار
متغیرهای تصادفی و توزیع‌ها
انواع نمودار
توزیع توأم
داده پرت و نرمال‌سازی
کوواریانس و همبستگی
تحليل رگرسیون
انواع تخمین آماری
تست‌های آمار
تست‌های توزیع


https://github.com/mokar2001/Statistics-Cheat-Sheet
👍3
لیست شرکت های پذیرای دورکاری
لیست شرکتهایی که به هر نحوی پذیرای دورکاری هستند. ممکن است شرکت اصلی در ایران باشد یا در خارج از ایران. اما نیروهای آن مقیم ایران هستند و امکان دورکاری چه به صورت کامل و چه موقت امکان پذیر است.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/iranremote/awesome-iran-remote
👍7👎1
مشکل رایجی که معمولا توی گروه های تلگرامی می بینیم. طرف می پرسه "کسی اینجا پایتون بلده؟" خب این مدل سوال کردن خیلی نتیجه بخش نیست.
چون سوال پرسیدن خودش یک هنره که باید یاد بگیریم. قبل از سوال پرسیدن داخل هر گروه و انجمنی یک مرتبه این صفحه گیتهاب بخونیم تا با اصول سوال پرسیدن آشنا بشیم و زودتر و بهتر به جواب سوال هامون بریم

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/erfanmola/DontAskToAsk
Forwarded from دیتاهاب (Zahra Yp)
این همه درباره یادگیری ماشین صحبت می کنیم، تا حالا به این فکر کردید اولین بار کی این حرفارو گفت و هدفش چی بود؟🤔 حتما نابغه ای بوده و کار خیلی مهمی داشته.

لینک زیر ببینید تا بفهمید همه چیز از کجا شروع شد...


لینک مقاله: https://data-hub.ir/?p=2866

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین💪

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_یادگیری_ماشین
👍2
حل بعضی از سوالات برنامه نویسی که در سطح اینترنت هست به همراه جواب
هدف کلی من از این ریپازیتوری درست کردن یه منبع کامل از سوالات به همراه جواب هست برای تقویت -حل مسئله- تا افراد تا با حل کردن روزانه از این سوالات خودشون رو عادت به حل -مسائل- جدید و روش های جدید کنند
سوالات بر اساس شماره بندی هستن و از سطح آسون به سخت پیش میرند

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/alisharifyy/Programming-Questions
2👍1
سلام وقت بخیر

من تازه شروع کردم و داده های دیووار رو اسکریپ می کنم
https://github.com/boagh/Scrape_Divar

مثلا یه دیتاست تقریبا 12هزارتایی از پرایدهای برای فروش در تهران رو گذاشتم (https://github.com/boagh/Scrape_Divar/blob/main/car%20price/PrideTehranAll.csv) و چند دیتای دیگه از تبریز.

اگه دوست داشتین ریپوی من رو هم معرفی کنین. به مرور تکمیلش هم میکنم. کد اسکریپ رو هم کامنت بزنم و مرتب کنم میذارمش و همچنین یه تعداد کار ماشین لرنینگی روی دیتاها انجام میدم و میذارم بعدا.

ممنون
👍3
گوگل ابزاری به نام "Interview Warmup" معرفی کرده که کاربران می‌تونن با استفاده از اون جلسه مصاحبه شبیه سازی کنن و با تیپ سوالات مصاحبه ها بیشتر آشنا بشن. (فقط با کروم کار می کنه 😂)
این ابزار با استفاده از هوش مصنوعی صدای کاربر رو آنالیز می‌کنه و سوالات بعدی رو می‌پرسه. در انتها هم متن پاسخ‌های ضبط‌‌ شده نمایش داده میشه

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://grow.google/certificates/interview-warmup
👍3
سلام دوستان
چون دریافت وقت سفارت هلند برای دریافت ویزای بیشتر از ۹۰ روز خیلی سخت هست من یه کد نوشتم برای دوستانی که میخوان از سفارت هلند وقت رزرو کنن.
میتونین این پروژه رو کلون کنید و بعد وصلش کنین به یه کران جاب تا براتون بصورت اتوماتیک
وقت رزرو کنه.

کد با سلنیوم ران میشه و تو کد شما باید برین اون بازه ای که میخواین وقت رزرو کنین رو وارد کنین. بعد اگه خوش شانس باشین و جایی خالی بشه براتون وقت رو رزرو میکنه.

https://github.com/HamidHeravi/appointment
👍6😢1
احتمالا با گرید سرچ (از کتابخانه sklearn) و بهینه سازی هایپرپارامترها آشنا هستید. شاید خیلی هاتون دنبال نمونه مشابه گرید سرچ برای شبکه های عصبی عمیق بودین که خب فریمورک KerasTuner کار راه اندازه.

لطفا به اشتراک بگذارید👈🏻 @persian_data
https://keras.io/keras_tuner
👍3
دیتاست عمومی فارسی برای پردازش زبان طبیعی

به نظرم حجم دیتای عمومی در فارسی برای آموزش دادن مدل های زبان طبیعی فارسی کم هست. در این راستا ویکی پدیای فارسی و سایت خبری عصرایران و تسنیم نیوز رو خزش کردم و دیتاست رو بصورت عموم در سایت کگل منتشر کردم.

ویکی پدیای فارسی شامل حدود ۸۵۰ هزار مقاله به همراه موضوع و متن‌ و لینک دائمی مطلب هست که تقریبا ۵ گیگابایت است و تقریبا در ۴ روز خزش شده است.

عصر ایران شامل ۳۳۰ هزار خبر از سال ۱۳۸۴ به همراه موضوع خبر، خلاصه خبر، متن خبر، دسته بندی، زمان، سرویس خبری است که تقریبا ۱ گیگابایت است و در یکی دو روز خزش شد.

تسنیم نیوز هم مثل عصرایران هست و ۶۰ هزار خبر داخلش هست. در این دیتاست اخبار بصورت بالانس انتخاب شده اند یعنی در هر کلاس خبر تعداد یکسان خبر داریم.

امیدوارم مفید باشه.
لطفا به اشتراک بگذارید👈🏻 @persian_data
لینک سورس پروژه در گیت هاب
https://github.com/pourmand1376/PersianCrawler

لینک دیتاست ها در کگل
https://www.kaggle.com/amirpourmand/datasets
👍5
تا نکتهٔ تجربی در مورد تهیه رزومه و جلسه مصاحبه:

1-رزومه حتما در یک یا نهایت دو صفحه تهیه بشه (معمولا افراد زمان و حوصله لازم برای بررسی رزومه های طولانی ندارن)
سوال: توی 2 صفحه نمیشه کامل همه چیز گفت؟
راه حل: پروژه ها را داخل گیتهاب بزارین و اونجا readme کامل و دقیق تهیه کنین و داخل رزومه فقط ادرس گیتهاب بزارین اینجوری هم رزومه خلوت شده و هم طرف اگر خوشش بیاد میره و تک تک پروژه هاتون بررسی می کنه

2-بهتره رزومه به صورت فایل pdf باشه و اسم فایل روزمتون حتما اسم خودتون و سمت شغلی باشه (ترجیحا انگلیسی باشه چون اسم فایل فارسی گاها موقع دانلود به هم میریزه و لطفا فایل ورد هم نفرستین که افتضاح به بار میاد)

3-حتما قبل مصاحبه، یک سر به سایت و شبکه های اجتماعی اون شرکت بزنین. هم با حوزه کاری و محصولاتشون آشنا میشین و تا حدودی هم میشه از روی سایت و شبکه های اجتماعی فهمید یک شرکت، ارزش کار کردن داره یا نه. (مصاحبه شونده وقتی ببینه شما هیچی از شرکت نمی دونین و همینطوری رزومه فرستادین یکم دیدش بهتون منفی میشه)

4-بهتره روز مصاحبه با خودتون سر رسید ببرین، شما اگر در یک هفته 3 تا مصاحبه برین و نکات کلیدی یادداشت کنین به راحتی قابل مقایسه میشه. البته وقتی شما خودکار به دست باشین و مصاحبه کننده حس کنه به حرفاش توجه می کنین، سعی می کنه دقت بیشتری کنه و یه جورایی به نفع شماست(آدما وقتی دوربین توی اتاق باشه بیشتر حواسشون به کارهاشون هست یا وقتی بدونن قراره حرفاشون ثبت بشه دقت بیشتری به خرج میدن). همچنین دیگه لازم نیست کل زمان مصاحبه به چشماش زل بزنین

5-معمولا بهتره بیش از یک شماره تماس داشته باشین (ترجیحا یک شماره همراه و یک ثابت) ، چون از شانس بد شما زنگ بزنن و در دسترس نباشین، به اون یکی شماره سریع زنگ بزنن

6-یک رزومه ای نباشین، بنا به حوزه کار شرکت ها و بزرگی و کوچیکی اون، رزومه متفاوت داشته باشین، مثلا بعضی شرکت ها اگر رزومه انگلیسی بفرستین بهتره و حتی دید مثبت ایجاد می کنه و واسه حقوق دستتون بازتره ولی ی سری جاها رزومه فارسی بهتر جواب میده. کلا رزومه نوشتن و رزومه فرستادن یک هنره، بفهمی طرف دنبال چیه، همون ها خوشگل بزاری جلوش و بعضی چیزارو نگی چون حساسیت زاست
👍4
اگر شمام موقع تهیه مستندات پروژه با markdown با جملات فارسی و راست چین بودن، مشکل دارین، با یک راه حل ساده و فقط با یک خط کد، این مشکل حل کنین.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/sobhe/moratab
👍1
The Art of Readable Code-Vazir.pdf
10.6 MB
✳️ترجمه کتاب هنر کدنویسی خوانا✳️

این کتاب هدیه بدین به برنامه نویس‌هایی که یک روزه کد می‌نویسن ولی 7 روز طول میکشه بفهمیم چی نوشتن! سلام شلخته ها؟!😕😐😕

لطفا به اشتراک بگذارید👈🏻 @persian_data

پ.ن: جا داره از تیمی که به صورت داوطلبانه این کتاب ترجمه کردن، تشکر ویژه بکنیم!
سلام باحالا!؟🌹😍🌹

https://github.com/Hossein52Hz/The-Art-Of-Readable-Code-Persian
👍1
اینم کتاب فارسی واسه پایتون که رایگانه و کلا 25 فصله و از مباحث مقدماتی تا پیشرفته پوشش داده
مثال های زیادی داره و سعی کرده اروم اروم مباحث توضیح بده
اگر فرصت داشتین روزنامه وار یک نگاه بهش بندازین

https://python.coderz.ir

پ.ن: البته بهتره که متن زبان اصلی بخونین


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍2