مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
deepـlearning.pdf
5.6 MB
این کتاب برای افراد مبتدی که هیچ آشنایی با یادگیری عمیق ندارند در نظر گرفته شده است تا خوانندگان را با یک دوره‌یِ فوقِ سریع در یادگیری عمیق آماده کند. تنها انتظار ما از خوانندگان این است که از قبل مهارت‌های برنامه‌نویسی اولیه در زبان پایتون را داشته باشند. این راهنمایِ کوتاه، در نظر گرفته شده است تا شما را به عنوان یک مبتدی با درک درستی از موضوع، از جمله تجربه‌یِ عملیِ ملموس در توسعه مدل‌ها، مجهز کند. از این‌رو، اگر در حال حاضر بالاتر از سطح مبتدی هستید، این کتاب مناسب شما نیست!

لطفا به اشتراک بگذارید👈🏻 @persian_data

کتاب در۶ فصل تنظیم شده است که شامل فصل‌های زیر می‌باشد:
فصل اول: مقدمه‌ای بر یادگیری عمیق
فصل دوم: پیش‌نیازها
فصل سوم: شبکه‌های عصبی پیش‌خور
فصل چهارم: شبکه‌های عصبی کانولوشنی
فصل پنجم: شبکه‌های عصبی بازگشتی
فصل ششم: شبکه متخاصم مولد
چگونه به کمک گیت‌هاب، وب‌سایت شخصی یا شرکتی رایگان بسازیم؟
اگر برای معرفی خودتان، محصول یا شرکت خود، نیاز به ایجاد وب‌سایت دارید ولی سادگی و سرعت برایتان مهم باشد و بخواهید به‌صورت رایگان و بدون کدنویسی یک وب‌سایت ایجاد کنید، پیشنهاد ما استفاده از گیت‌هاب است که لازم نیست هزینه‌ای برای سرور و دامنه پرداخت شود.

ادامه مطلب در آدرس زیر
https://data-hub.ir/how-to-host-a-website-on-github/

لطفا به اشتراک بگذارید👈🏻 @persian_data
سلام خسته نباشید. امیدوارم حالتون خیلی خوب باشه.

من این دیتاست رو خودم خزش کردم و ممکنه برای بقیه هم مفید باشه. دیتاست حاوی ۳۴۰MB متن است.

دیتاست مجموعه اخبار تسنیم نیوز هست که اخبار label نوع خبر هم دارند. خود خزشگر رو داخل گیت هابم به آدرس زیر گذاشتم
https://github.com/pourmand1376/TasnimNewsCrawler
و دیتاست هم در kaggle اپلود شده است.
https://www.kaggle.com/datasets/amirpourmand/tasnimdataset

لطفا به اشتراک بگذارید👈🏻 @persian_data
در این مدت، تا الان دوستان زیادی لطف داشتند و دیتاست یا کتاب‌های خودشان را برای معرفی در کانال برای ما ارسال کردند. یکی از دوستانی که قبلاً به پیشنهاد خودشان دیتاستشان را در کانال معرفی کردیم، اخیراً پیام داده و تشکر کردند چون از یکی از دیتاست های دیگر کانال در پروژه کاری خودشان استفاده کرده بودند و کارشان راه افتاده بود. این مثال واقعی از اثربخشی به‌اشتراک‌گذاری است که مثل یک چرخه به همدیگر کمک می‌کنیم. اگر دیتاست خوبی ملاحظه کردید یا خودتان دیتا مناسبی تهیه کردید برای ما ارسال کنید در صورت مناسب بودن در کانال قرار خواهیم داد.
ای دی ادمین: @Data_hub
👍6
مرجع دیتاست فارسی pinned «در این مدت، تا الان دوستان زیادی لطف داشتند و دیتاست یا کتاب‌های خودشان را برای معرفی در کانال برای ما ارسال کردند. یکی از دوستانی که قبلاً به پیشنهاد خودشان دیتاستشان را در کانال معرفی کردیم، اخیراً پیام داده و تشکر کردند چون از یکی از دیتاست های دیگر کانال…»
Persian Book Template for Publication
یکی از بچه های دانشگاه علم صنعت، یک کار باحال انجام دادند و قالب مخصوص انتشار کتاب به اشتراک گذاشتن
فرمت قالب latex هست و به راحتی می تونین ازش استفاده کنید

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/alirezaqazavi/Persian_Book_Template_for_Nashr
یک کار جالب که کارمون خیلی راحت تر می کنه
اگر از این سایت به اون سایت، از این خونه به اون خونه
دنبال فرصت های دکترای فول فاند بودین، این خزشگر میخواد کارتون آسون تر کنه و نتایج جستجو در قالب فایل اکسل تحویلتون بده

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/Aghababaei/PhD-Seeker
👍2
Forwarded from دیتاهاب (محمد)
بهترین کتاب یادگیری ماشین 👨🏻‍💻👩🏻‍💻

فرض کنید شما با مجموعه‌ای همکاری می‌کنید و بعد از مدتی تصمیم به قطع همکاری می‌گیرید. اصولا بعد از همکاری محصولات شما باید از روی سایتشان برداشته شود. با اینکه هیچ مالکیت حقوقی و معنوی نداشته و صرفا واسطه فروش بودند، ولی متاسفانه چنین کاری انجام نمی‌شود😐. بارها قول داده ولی زیر قولشان می‌زنند و حتی بدون اجازه و رضایت شما، محصولاتی که تمام زحمتش با شماست به فروش گذاشته و صفر ریال نصیب شما می‌شود🤷🏻‍♂️.

بنابراین تصمیم گرفتیم کتاب یادگیری ماشین از طریق وب سایت دیتاهاب به فروش برسانیم 🥳. اگر تمایلی به خرید و حمایت از دیتاهاب دارید از طریق لینک زیر اقدام کنید:
https://data-hub.ir/?p=5405

به مناسبت برگزاری نمایشگاه کتاب و ترویج کتابخوانی، به مدت یک هفته براتون تخفیف ۱۰۰ درصدی در نظر گرفتیم.
کد تخفیف 😍: mlbookfree

در مورد کتاب:
این کتاب قطعا یکی از بهترین‌ کتاب ها با موضوع یادگیری ماشین است‌.
زمان انتخاب کتاب برای ترجمه، معیارهایی مثل سادگی و شیوایی کتاب اهمیت داشت. کتابی که حتی یک روزه میشه مطالعه کرد ولی مروری بر تمام مباحث ضروری یادگیری ماشین است.
👍3👎1
Forwarded from MohammadReza KarimiNejad
شماره هاي رند تهران كه در سايت rond.ir وجود داشتن رو به شكل يك ديتاست دراوردم. اين ديتاست خيلي ميتونه به اين كمك كنه كه شما چطور از يك شماره تلفن الگو استخراج كنيد و به كمك اون قيمت رو تخمين بزنيد. همينطور يك فيلد اضافه هست كه نحوه خواندن اين شماره تلفن توسط مردم رو اوردم. اگه براتون جالبه خودتونو امتحان كنيد و منو upvote كنيد.

https://www.kaggle.com/datasets/mokar2001/tehran-easytoremember-phone-number-price
Forwarded from MohammadReza KarimiNejad
پياده سازي موارد زير در پايتون كه به صورت فصل بندي شده در گيت هاب شير شده:

نظریه مجموعه‌ها
ترکیبیات و شمارش
مبانی احتمال
احتمال شرطی
داده و مقدمه‌ای بر آمار
متغیرهای تصادفی و توزیع‌ها
انواع نمودار
توزیع توأم
داده پرت و نرمال‌سازی
کوواریانس و همبستگی
تحليل رگرسیون
انواع تخمین آماری
تست‌های آمار
تست‌های توزیع


https://github.com/mokar2001/Statistics-Cheat-Sheet
👍3
لیست شرکت های پذیرای دورکاری
لیست شرکتهایی که به هر نحوی پذیرای دورکاری هستند. ممکن است شرکت اصلی در ایران باشد یا در خارج از ایران. اما نیروهای آن مقیم ایران هستند و امکان دورکاری چه به صورت کامل و چه موقت امکان پذیر است.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/iranremote/awesome-iran-remote
👍7👎1
مشکل رایجی که معمولا توی گروه های تلگرامی می بینیم. طرف می پرسه "کسی اینجا پایتون بلده؟" خب این مدل سوال کردن خیلی نتیجه بخش نیست.
چون سوال پرسیدن خودش یک هنره که باید یاد بگیریم. قبل از سوال پرسیدن داخل هر گروه و انجمنی یک مرتبه این صفحه گیتهاب بخونیم تا با اصول سوال پرسیدن آشنا بشیم و زودتر و بهتر به جواب سوال هامون بریم

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/erfanmola/DontAskToAsk
Forwarded from دیتاهاب (Zahra Yp)
این همه درباره یادگیری ماشین صحبت می کنیم، تا حالا به این فکر کردید اولین بار کی این حرفارو گفت و هدفش چی بود؟🤔 حتما نابغه ای بوده و کار خیلی مهمی داشته.

لینک زیر ببینید تا بفهمید همه چیز از کجا شروع شد...


لینک مقاله: https://data-hub.ir/?p=2866

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین💪

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_یادگیری_ماشین
👍2
حل بعضی از سوالات برنامه نویسی که در سطح اینترنت هست به همراه جواب
هدف کلی من از این ریپازیتوری درست کردن یه منبع کامل از سوالات به همراه جواب هست برای تقویت -حل مسئله- تا افراد تا با حل کردن روزانه از این سوالات خودشون رو عادت به حل -مسائل- جدید و روش های جدید کنند
سوالات بر اساس شماره بندی هستن و از سطح آسون به سخت پیش میرند

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/alisharifyy/Programming-Questions
2👍1
سلام وقت بخیر

من تازه شروع کردم و داده های دیووار رو اسکریپ می کنم
https://github.com/boagh/Scrape_Divar

مثلا یه دیتاست تقریبا 12هزارتایی از پرایدهای برای فروش در تهران رو گذاشتم (https://github.com/boagh/Scrape_Divar/blob/main/car%20price/PrideTehranAll.csv) و چند دیتای دیگه از تبریز.

اگه دوست داشتین ریپوی من رو هم معرفی کنین. به مرور تکمیلش هم میکنم. کد اسکریپ رو هم کامنت بزنم و مرتب کنم میذارمش و همچنین یه تعداد کار ماشین لرنینگی روی دیتاها انجام میدم و میذارم بعدا.

ممنون
👍3
گوگل ابزاری به نام "Interview Warmup" معرفی کرده که کاربران می‌تونن با استفاده از اون جلسه مصاحبه شبیه سازی کنن و با تیپ سوالات مصاحبه ها بیشتر آشنا بشن. (فقط با کروم کار می کنه 😂)
این ابزار با استفاده از هوش مصنوعی صدای کاربر رو آنالیز می‌کنه و سوالات بعدی رو می‌پرسه. در انتها هم متن پاسخ‌های ضبط‌‌ شده نمایش داده میشه

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://grow.google/certificates/interview-warmup
👍3
سلام دوستان
چون دریافت وقت سفارت هلند برای دریافت ویزای بیشتر از ۹۰ روز خیلی سخت هست من یه کد نوشتم برای دوستانی که میخوان از سفارت هلند وقت رزرو کنن.
میتونین این پروژه رو کلون کنید و بعد وصلش کنین به یه کران جاب تا براتون بصورت اتوماتیک
وقت رزرو کنه.

کد با سلنیوم ران میشه و تو کد شما باید برین اون بازه ای که میخواین وقت رزرو کنین رو وارد کنین. بعد اگه خوش شانس باشین و جایی خالی بشه براتون وقت رو رزرو میکنه.

https://github.com/HamidHeravi/appointment
👍6😢1
احتمالا با گرید سرچ (از کتابخانه sklearn) و بهینه سازی هایپرپارامترها آشنا هستید. شاید خیلی هاتون دنبال نمونه مشابه گرید سرچ برای شبکه های عصبی عمیق بودین که خب فریمورک KerasTuner کار راه اندازه.

لطفا به اشتراک بگذارید👈🏻 @persian_data
https://keras.io/keras_tuner
👍3
دیتاست عمومی فارسی برای پردازش زبان طبیعی

به نظرم حجم دیتای عمومی در فارسی برای آموزش دادن مدل های زبان طبیعی فارسی کم هست. در این راستا ویکی پدیای فارسی و سایت خبری عصرایران و تسنیم نیوز رو خزش کردم و دیتاست رو بصورت عموم در سایت کگل منتشر کردم.

ویکی پدیای فارسی شامل حدود ۸۵۰ هزار مقاله به همراه موضوع و متن‌ و لینک دائمی مطلب هست که تقریبا ۵ گیگابایت است و تقریبا در ۴ روز خزش شده است.

عصر ایران شامل ۳۳۰ هزار خبر از سال ۱۳۸۴ به همراه موضوع خبر، خلاصه خبر، متن خبر، دسته بندی، زمان، سرویس خبری است که تقریبا ۱ گیگابایت است و در یکی دو روز خزش شد.

تسنیم نیوز هم مثل عصرایران هست و ۶۰ هزار خبر داخلش هست. در این دیتاست اخبار بصورت بالانس انتخاب شده اند یعنی در هر کلاس خبر تعداد یکسان خبر داریم.

امیدوارم مفید باشه.
لطفا به اشتراک بگذارید👈🏻 @persian_data
لینک سورس پروژه در گیت هاب
https://github.com/pourmand1376/PersianCrawler

لینک دیتاست ها در کگل
https://www.kaggle.com/amirpourmand/datasets
👍5