مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
Forwarded from MohammadReza KarimiNejad
شماره هاي رند تهران كه در سايت rond.ir وجود داشتن رو به شكل يك ديتاست دراوردم. اين ديتاست خيلي ميتونه به اين كمك كنه كه شما چطور از يك شماره تلفن الگو استخراج كنيد و به كمك اون قيمت رو تخمين بزنيد. همينطور يك فيلد اضافه هست كه نحوه خواندن اين شماره تلفن توسط مردم رو اوردم. اگه براتون جالبه خودتونو امتحان كنيد و منو upvote كنيد.

https://www.kaggle.com/datasets/mokar2001/tehran-easytoremember-phone-number-price
Forwarded from MohammadReza KarimiNejad
پياده سازي موارد زير در پايتون كه به صورت فصل بندي شده در گيت هاب شير شده:

نظریه مجموعه‌ها
ترکیبیات و شمارش
مبانی احتمال
احتمال شرطی
داده و مقدمه‌ای بر آمار
متغیرهای تصادفی و توزیع‌ها
انواع نمودار
توزیع توأم
داده پرت و نرمال‌سازی
کوواریانس و همبستگی
تحليل رگرسیون
انواع تخمین آماری
تست‌های آمار
تست‌های توزیع


https://github.com/mokar2001/Statistics-Cheat-Sheet
👍3
لیست شرکت های پذیرای دورکاری
لیست شرکتهایی که به هر نحوی پذیرای دورکاری هستند. ممکن است شرکت اصلی در ایران باشد یا در خارج از ایران. اما نیروهای آن مقیم ایران هستند و امکان دورکاری چه به صورت کامل و چه موقت امکان پذیر است.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/iranremote/awesome-iran-remote
👍7👎1
مشکل رایجی که معمولا توی گروه های تلگرامی می بینیم. طرف می پرسه "کسی اینجا پایتون بلده؟" خب این مدل سوال کردن خیلی نتیجه بخش نیست.
چون سوال پرسیدن خودش یک هنره که باید یاد بگیریم. قبل از سوال پرسیدن داخل هر گروه و انجمنی یک مرتبه این صفحه گیتهاب بخونیم تا با اصول سوال پرسیدن آشنا بشیم و زودتر و بهتر به جواب سوال هامون بریم

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/erfanmola/DontAskToAsk
Forwarded from دیتاهاب (Zahra Yp)
این همه درباره یادگیری ماشین صحبت می کنیم، تا حالا به این فکر کردید اولین بار کی این حرفارو گفت و هدفش چی بود؟🤔 حتما نابغه ای بوده و کار خیلی مهمی داشته.

لینک زیر ببینید تا بفهمید همه چیز از کجا شروع شد...


لینک مقاله: https://data-hub.ir/?p=2866

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین💪

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_یادگیری_ماشین
👍2
حل بعضی از سوالات برنامه نویسی که در سطح اینترنت هست به همراه جواب
هدف کلی من از این ریپازیتوری درست کردن یه منبع کامل از سوالات به همراه جواب هست برای تقویت -حل مسئله- تا افراد تا با حل کردن روزانه از این سوالات خودشون رو عادت به حل -مسائل- جدید و روش های جدید کنند
سوالات بر اساس شماره بندی هستن و از سطح آسون به سخت پیش میرند

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/alisharifyy/Programming-Questions
2👍1
سلام وقت بخیر

من تازه شروع کردم و داده های دیووار رو اسکریپ می کنم
https://github.com/boagh/Scrape_Divar

مثلا یه دیتاست تقریبا 12هزارتایی از پرایدهای برای فروش در تهران رو گذاشتم (https://github.com/boagh/Scrape_Divar/blob/main/car%20price/PrideTehranAll.csv) و چند دیتای دیگه از تبریز.

اگه دوست داشتین ریپوی من رو هم معرفی کنین. به مرور تکمیلش هم میکنم. کد اسکریپ رو هم کامنت بزنم و مرتب کنم میذارمش و همچنین یه تعداد کار ماشین لرنینگی روی دیتاها انجام میدم و میذارم بعدا.

ممنون
👍3
گوگل ابزاری به نام "Interview Warmup" معرفی کرده که کاربران می‌تونن با استفاده از اون جلسه مصاحبه شبیه سازی کنن و با تیپ سوالات مصاحبه ها بیشتر آشنا بشن. (فقط با کروم کار می کنه 😂)
این ابزار با استفاده از هوش مصنوعی صدای کاربر رو آنالیز می‌کنه و سوالات بعدی رو می‌پرسه. در انتها هم متن پاسخ‌های ضبط‌‌ شده نمایش داده میشه

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://grow.google/certificates/interview-warmup
👍3
سلام دوستان
چون دریافت وقت سفارت هلند برای دریافت ویزای بیشتر از ۹۰ روز خیلی سخت هست من یه کد نوشتم برای دوستانی که میخوان از سفارت هلند وقت رزرو کنن.
میتونین این پروژه رو کلون کنید و بعد وصلش کنین به یه کران جاب تا براتون بصورت اتوماتیک
وقت رزرو کنه.

کد با سلنیوم ران میشه و تو کد شما باید برین اون بازه ای که میخواین وقت رزرو کنین رو وارد کنین. بعد اگه خوش شانس باشین و جایی خالی بشه براتون وقت رو رزرو میکنه.

https://github.com/HamidHeravi/appointment
👍6😢1
احتمالا با گرید سرچ (از کتابخانه sklearn) و بهینه سازی هایپرپارامترها آشنا هستید. شاید خیلی هاتون دنبال نمونه مشابه گرید سرچ برای شبکه های عصبی عمیق بودین که خب فریمورک KerasTuner کار راه اندازه.

لطفا به اشتراک بگذارید👈🏻 @persian_data
https://keras.io/keras_tuner
👍3
دیتاست عمومی فارسی برای پردازش زبان طبیعی

به نظرم حجم دیتای عمومی در فارسی برای آموزش دادن مدل های زبان طبیعی فارسی کم هست. در این راستا ویکی پدیای فارسی و سایت خبری عصرایران و تسنیم نیوز رو خزش کردم و دیتاست رو بصورت عموم در سایت کگل منتشر کردم.

ویکی پدیای فارسی شامل حدود ۸۵۰ هزار مقاله به همراه موضوع و متن‌ و لینک دائمی مطلب هست که تقریبا ۵ گیگابایت است و تقریبا در ۴ روز خزش شده است.

عصر ایران شامل ۳۳۰ هزار خبر از سال ۱۳۸۴ به همراه موضوع خبر، خلاصه خبر، متن خبر، دسته بندی، زمان، سرویس خبری است که تقریبا ۱ گیگابایت است و در یکی دو روز خزش شد.

تسنیم نیوز هم مثل عصرایران هست و ۶۰ هزار خبر داخلش هست. در این دیتاست اخبار بصورت بالانس انتخاب شده اند یعنی در هر کلاس خبر تعداد یکسان خبر داریم.

امیدوارم مفید باشه.
لطفا به اشتراک بگذارید👈🏻 @persian_data
لینک سورس پروژه در گیت هاب
https://github.com/pourmand1376/PersianCrawler

لینک دیتاست ها در کگل
https://www.kaggle.com/amirpourmand/datasets
👍5
تا نکتهٔ تجربی در مورد تهیه رزومه و جلسه مصاحبه:

1-رزومه حتما در یک یا نهایت دو صفحه تهیه بشه (معمولا افراد زمان و حوصله لازم برای بررسی رزومه های طولانی ندارن)
سوال: توی 2 صفحه نمیشه کامل همه چیز گفت؟
راه حل: پروژه ها را داخل گیتهاب بزارین و اونجا readme کامل و دقیق تهیه کنین و داخل رزومه فقط ادرس گیتهاب بزارین اینجوری هم رزومه خلوت شده و هم طرف اگر خوشش بیاد میره و تک تک پروژه هاتون بررسی می کنه

2-بهتره رزومه به صورت فایل pdf باشه و اسم فایل روزمتون حتما اسم خودتون و سمت شغلی باشه (ترجیحا انگلیسی باشه چون اسم فایل فارسی گاها موقع دانلود به هم میریزه و لطفا فایل ورد هم نفرستین که افتضاح به بار میاد)

3-حتما قبل مصاحبه، یک سر به سایت و شبکه های اجتماعی اون شرکت بزنین. هم با حوزه کاری و محصولاتشون آشنا میشین و تا حدودی هم میشه از روی سایت و شبکه های اجتماعی فهمید یک شرکت، ارزش کار کردن داره یا نه. (مصاحبه شونده وقتی ببینه شما هیچی از شرکت نمی دونین و همینطوری رزومه فرستادین یکم دیدش بهتون منفی میشه)

4-بهتره روز مصاحبه با خودتون سر رسید ببرین، شما اگر در یک هفته 3 تا مصاحبه برین و نکات کلیدی یادداشت کنین به راحتی قابل مقایسه میشه. البته وقتی شما خودکار به دست باشین و مصاحبه کننده حس کنه به حرفاش توجه می کنین، سعی می کنه دقت بیشتری کنه و یه جورایی به نفع شماست(آدما وقتی دوربین توی اتاق باشه بیشتر حواسشون به کارهاشون هست یا وقتی بدونن قراره حرفاشون ثبت بشه دقت بیشتری به خرج میدن). همچنین دیگه لازم نیست کل زمان مصاحبه به چشماش زل بزنین

5-معمولا بهتره بیش از یک شماره تماس داشته باشین (ترجیحا یک شماره همراه و یک ثابت) ، چون از شانس بد شما زنگ بزنن و در دسترس نباشین، به اون یکی شماره سریع زنگ بزنن

6-یک رزومه ای نباشین، بنا به حوزه کار شرکت ها و بزرگی و کوچیکی اون، رزومه متفاوت داشته باشین، مثلا بعضی شرکت ها اگر رزومه انگلیسی بفرستین بهتره و حتی دید مثبت ایجاد می کنه و واسه حقوق دستتون بازتره ولی ی سری جاها رزومه فارسی بهتر جواب میده. کلا رزومه نوشتن و رزومه فرستادن یک هنره، بفهمی طرف دنبال چیه، همون ها خوشگل بزاری جلوش و بعضی چیزارو نگی چون حساسیت زاست
👍4
اگر شمام موقع تهیه مستندات پروژه با markdown با جملات فارسی و راست چین بودن، مشکل دارین، با یک راه حل ساده و فقط با یک خط کد، این مشکل حل کنین.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/sobhe/moratab
👍1
The Art of Readable Code-Vazir.pdf
10.6 MB
✳️ترجمه کتاب هنر کدنویسی خوانا✳️

این کتاب هدیه بدین به برنامه نویس‌هایی که یک روزه کد می‌نویسن ولی 7 روز طول میکشه بفهمیم چی نوشتن! سلام شلخته ها؟!😕😐😕

لطفا به اشتراک بگذارید👈🏻 @persian_data

پ.ن: جا داره از تیمی که به صورت داوطلبانه این کتاب ترجمه کردن، تشکر ویژه بکنیم!
سلام باحالا!؟🌹😍🌹

https://github.com/Hossein52Hz/The-Art-Of-Readable-Code-Persian
👍1
اینم کتاب فارسی واسه پایتون که رایگانه و کلا 25 فصله و از مباحث مقدماتی تا پیشرفته پوشش داده
مثال های زیادی داره و سعی کرده اروم اروم مباحث توضیح بده
اگر فرصت داشتین روزنامه وار یک نگاه بهش بندازین

https://python.coderz.ir

پ.ن: البته بهتره که متن زبان اصلی بخونین


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍2
سایت و خبرنامه موقعیت‌های شغلی خارج از ایران

کارِج یک خبرنامه ایمیلی هفتگی است که موقعیت‌های شغلی خارج از ایران که امکان Visa Sponsorship دارند را برای مشترکین ایمیل می‌کند. آرشیو موقعیت‌های شغلی داخل صفحه گیتهاب موجود است.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/Hameds/Karej
👍4
ابزار داریم چ ابزاری
قطعا بارها آرزو کردین کاش pdf های فارسی میشد ادیت کرد
خب تبریک میگم آرزتون برآورده شد
https://github.com/Pouyaexe/Farsi_PDF

کافیه این کد پایتونی اجرا کنید و pdf هاتون قابل ادیت کنید
تا آرزوی بعدی، بای


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍6👎1
ایران کشور زلزله خیزی هست. دوس دارین به صورت آنلاین روی نقشه چک کنید الان کجای ایران با چه شدتی داره زلزله میاد؟
شاید براتون جالب باشه ک همین الان که دارین پست می خونین احتمالا یک جایی داره زلزله میاد (حتی با شدت کم)
کافیه یه سر به این صفحه بزنید و پخش مستقیم مسابقات لیگ برتر زلزله ایران از دست ندین
https://earthquake-monitoring.amir4rab.com/fa

لطفا به اشتراک بگذارید👈🏻 @persian_data

البته سورس کد کار، داخل گیتهاب به آدرس زیر هست
https://github.com/amir4rab/earthquake-monitoring
👍3👎1
خب سلام به همگی✌🏻، مدتی هست که کانال هزارتایی شده ☺️
توی این مدت سعی کردیم کانال هدفمند باشه و مطالب مفید و کار راه انداز براتون پیدا کنیم و منتشر کنیم
البته گاهی دوستان لطف داشتن و کار یا ابزار خودشون معرفی کردن 💐(که ای کاش بیشتر میشد و بیشتر در تولید کارها عام المنفعه و به اشتراک گذاری اون تلاش می کردیم)
چند تا نکته
ما در برابر تبلیغات خیلی مقاومت کردیم و به تبلیغات های با پیشنهاد بالا هم نه گفتیم😌 (حتی تا شده تبلیغ کارهای خودمون هم نکردیم😐)
شاید بعضیا بگن با کانال های دیگه ادغام کن تا تعداد بیشتر بشه، ولی ما کیفیت برامون مهم تره😎
هدف ما کار تخصصی و عملیه، که گره از کارتون باز کنه
همین که پیام های ما گاهی بین گروه های دانشگاهی و تحصیلات تکمیلی و یا شرکت ها به چشم می خوره یعنی مسیر را درست رفتیم💪🏻

پ.ن: چرا بعضیا دیسلایک می کنن😂؟ دلیل اون کسی که دیسلایک می کنه چیه😄؟
❇️مطلب رایگان منتشر میشه
❇️سعی میشه هدفمند و مفید باشن
❇️پیام تبلیغاتی و اضافه هم که نمی زاریم
خب الان مشکلت چیه؟ حتما دلیلش بهمون بگو😺 @data_hub_ir
10👍6