مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.19K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
سلام دوستان روزتون بخیر.
من روی تسک کلاسیفیکیشن بر روی یک دیتاستی کار می کنم و احساس کردم کار به نقطه ای رسیده که نواقص کار به لطف شما برطرف بشه و اگر جای بهبود داره، بهبودش بدین.
https://github.com/mohsenMahmoodzadeh/Image-Caption-classification-with-tensorflow-Keras
لینک دیتاست در بخش readme ریپازیتوری قرار داده شده.
ممنون میشم اگر احساس کردین محتوای ریپازیتوری براتون مفید بوده، با star دادن ازش حمایت کنید و یا با ایجاد issue یا fork کردن، به تکمیل کار کنید تا بنده هم از تجربه و تخصص تون استفاده کنم.
پیشاپیش خیلی ممنونم.🙏

@persian_data
Sentiment analysis on telegram channels news for predicting bearish or bullish stocks
داستان از این قراره که خیلی وقته برای تشخیص و تحلیل قیمت دلار و طلا و ارز سعی می کنن از nlp استفاده کنند. این یک نمونه دست به نقدش روی زبان فارسیه
دیتاست هم موجود است

https://github.com/mirzanahal/Persian-Stock-Prediction

لطفا به اشتراک بگذارید👈🏻 @persian_data
دیتاست فارسی 30 هزارتایی توییتر برای تحلیل احساسات
برخلاف دیتاست های رایج 6 کلاسه هست و مناسب برای تست مدل های شما

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/nazaninsbr/Persian-Emotion-Detection
👍1
یادتون هست بچگی ازمون می خواستم فعل های فارسی صرف کنیم
این ریپ برامون این کار خودکار انجام میده
در پیش پردازش متن ها به خصوص خیلی به درد میخوره و باعث میشه pos بهتری داشته باشیم
https://github.com/asdoost/CPVI

لطفا به اشتراک بگذارید👈🏻 @persian_data
دانشگاه شریف یک کورس آمار و احتمالات گذاشته که کدهای مربوط به جلسات هم موجوده.
یک بخشی به به زبان r و بخشی با پایتون
ترکیب مفاهیم اماری و کدنویسی باعث یادگیری سریع تر و ماندگارتر میشه پس از دستش ندین.

https://github.com/asharifiz/Probability_Statistics
لطفا به اشتراک بگذارید👈🏻 @persian_data
Forwarded from دیتاهاب
درود، همینطور که در جریان هستین تازگی کورسرا سخت گیرتر شده و برای دریافت سرتیفیکت باید باهاشون مکاتبه بشه
یک متنی آماده کردم مخصوص وقتی هست که میخوایم به کورسرا درخواست کمک مالی بدیم
@data_hub_ir

Part 1:

It is my intention to inform you of my limitations with regard to money transfers. As you know, the US sanctions on Iran have caused our currency to fall by 1000 percent and the cost of the course is high for the Iranian people and we are not able to send or receive money. And while we don't have access to international payment systems like Paypal, MasterCard, and Visa Card, that's actually the main problem, because I believe the value of this training is far greater than they were intended. Of course, if there was a way to pay for that amount, I would definitely pay and start the period sooner.
Based on my study of the course syllabus, I came to the conclusion that this overview provides a comprehensive overview of the basic concepts of (مبحث یا مهارت مدنظر). Also, users' comments indicate that this is a practical and useful course that will enhance practical skills.
Let me join this course with your kind help if you would kindly assist me and I will pass this course with flying colors without a doubt.

Part 2:
My goal is to learn (اسم دوره یا مهارت مدنظر) in order to improve my general skills and then follow my academic tracks in order to gain admission to top universities in Europe or the United States.
As a student, I need you to know that I have paved the way for immigration and that learning (اسم مهارت مدنظر) is my first step.
Compared to the in-person courses available in my country, I think Coursera offers the best courses.
The choice of this course as well as other courses was not only obvious to me but it was also recommended to me by my academic adviser.
In the following weeks, I have several interviews ahead of me, so this course would help me be able to speak professionally.
Specifically, if you consider me a highly qualified pupil and a well-deserved one, I would appreciate your kindness.

Finally, I would like to say:
In the current situation, due to the heavy cost of the university and the dormitory, I cannot afford to pay.

@data_hub_ir
اگر شمام گاهی از هضم و پارسی ور شاکی بودین که کاش اپدیت می دادین پس همچنان حرص بخورین چون اپدیتی در کار نیست عوضش یک تیم دیگه یک ابزار دیگه معرفی کردند(دمشون گرم واقعا، تا باشه از این ابزارها)
نصبش که آسونه:
pip install dadmatools

ولی شاید در آینده کار باهاش تست کردیم فعلا خودتون یک تستی بزنین و نتیجشو به بقیه هم بگین.
https://github.com/Dadmatech/DadmaTools

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
یک دیتاست مناسب
اعداد دست نویس فارسی و انگلیسی، که نقطه قوتش اینه که حالت نرمال ندارن و به اصطلاح تمیز نیستن و خیلی به دنیای واقعی نزدیک ترن. هر چقدر دیتا کثیف تر باشه شانس اجرای موفق در دنیای واقعیش بیشتر میشه(رنه دکارت)

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/IzkSensei/HDDS
یک پروژه یکم عجیب
تا حالا شده به این فکر کنین هوش مصنوعی نژادپرستی یا جرم و جنایت یا ... تقویت کنه. البته در این زمینه کار زیاد شده و مقالات زیادی در این رابطه هست. (حتی یک وقتی اندیشمندان وطنی توی گوگل ترنسلیت تست می کردین که بین مرد و زن تفاوت قائل هستند یا نه) به هر حال این پروزه یک کار مشابه و ساده انجام داده و دیدنش خالی از لطف نیست. هدف تشخیص این بوده که آیا مدل های زبانی نژادپرستی ترویج می دهند یا خیر.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/TahaVahedi/Sociology_wordEmbedding_persian_lang
Text2Code for Jupyter notebook
تازگی بحث تولید خودکار کد خیلی ترند شده
شاید خیلی ها احساس خطر کنند که در آینده نزدیک یک بخشی از صنعت مهندسی نرم افزار خودکار بشه
اره حق داریم چون قضیه جدیه
خیلی هامون با Jupyter notebook آشنا هستیم
یک ابزار برای Jupyter notebook معرفی می کنیم که شما انگلیسی کوئری می نویسی و کد پایتونش برات تولید می کنه(یا اکثر امامزاده ها)
https://github.com/deepklarity/jupyter-text2code

لطفا به اشتراک بگذارید👈🏻 @persian_data
شیوه‌نامه نگارش پایتون
تا حالا شده یک کد پایتونی از همکارتون بگیرین و روی مختون بره و حالتون بد بشه از بس نامرتب نوشته
حتما این داکیومنت بهش معرفی کنین، رایگان و ترجمه شده هستش
تا با خوندنش، کیفیت کدهای نوشته خودمون با زبان پایتون، چندبرابر کنیم.

https://pep8.ir

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍1
تصحيح خودكار كلمه
به كمك يك الگوريتم چند مرحله اي ابتدا به توليد كلمه هاي مربوط به كلمه ورودي ميپردازيم و پس از آن كلمه هايي كه در ديتاست شكسپير وجود ندارند را حذف ميكنیم. سپس به كمك احتمال ظاهر شدن كلمه در ديتاست شكسپير و كلمه اي كه با كمترین تغییر (minimum edit distance) به كلمه ما تبديل ميشود بهترين كلمه را خروجي ميدهيم.
بياين كه به كمك هم اين الگوريتم رو توسعه بديم.

لطفا به اشتراک بگذارید👈🏻 @persian_data

https://github.com/mokar2001/AutoCorrectWord

#Python
#Data_Analysis
👍1
یکی از سوالات رایج همیشگی اینه که دیتاست نداریم و کارمون لنگه چطور از توییتر دیتا کرال کنیم. خب بعد از درخواست و دریافت اکانت دولوپری از توییتر، بیاین سراغ این کد پایتونی، فقط 30 خط هستش و به راحتی یک دیتاست خوب بهتون میده.
chatbotslife.com/crawl-twitter-data-using-30-lines-of-python-code-e3fece99450e

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍5
اینم منبع فارسی😌
تقریبا هر روز منبع فارسی درخواست میشه و این کتاب یهو به چشمم خورد☺️
دانلود رایگان کتاب یادگیری عمیق: اصول، مفاهیم و رویکردها به زبان فارسی

https://github.com/miladvazan/deep_learning_book_persian

لطفا به اشتراک بگذارید👈🏻 @persian_data
1
یادگیری ماشین و علم داده.pdf
11.5 MB
دانلود کتاب یادگیری ماشین و علم داده: مبانی، مفاهیم، الگوریتم‌ها و ابزارها به صورت رایگان

جا داره از نویسنده کتاب بابت معرفی کارشون تشکر کنیم.


لطفا به اشتراک بگذارید👈🏻 @persian_data
👍4
Forwarded from دیتاهاب
درود🤚
خیلی خوشحالم که بالاخره زمانش از راه رسید😊
قبل از هر چیز بفرمایین شیرینی اونم از نوع گز اصفهان🍰🧁


نزدیک دو ساله در کنار هم هستیم 😍 از آپارات تا ویرگول و تلگرام. توی این مسیر شناختمون از هم بیشتر شد به‌تدریج متوجه شدیم شما به چه چیزهایی بیشتر احتیاج دارین🤔. خودتون بهمون می گفتین فرصت شغلی نیست😡. چرا کارآموزی‌ها کم هستن😤. چرا آموزش‌ها این‌قدر گرونن 😭 و ... . وقتی با خواسته هاتون بیشتر آشنا شدیم به نظرمون رسید شاید بشه یک حرکتی زد و یک کمکی کرد😎.

ولی چون آدم‌های کمال‌گرایی بودیم نزدیک به 6 ماه طول کشید 😬 تا براتون وب سایت "دیتاهاب" آماده کنیم البته با کلی ایده و فکر جدید. قطعا جای بهترشدن داره که ما روی انتقادات و پیشنهادهای شما حسابی زیادی باز کردیم😌.

می دونیم و می دونین وب سایت زیاد هست چه به زبان انگلیسی چه فارسی. تلامشون این بوده و هست که متفاوت عمل کنیم. اینم بگم که محوریت دیتاهاب قطعا هوش مصنوعی خواهد بود. هدف اولیمون تولید محتوای مناسب تصویری و متنی فارسی از مقدماتی تا پیشرفته با رویکرد پروژه‌ای هست🧑‍💻👩‍💻. یعنی دلمون نمیخواد بعد از تماشای ویدیوها بگین کاش عملی‌تر بود😖.

باید اشاره کنم که یک بخش زیادی از آموزش‌ها رایگان خواهد بود (آموزش‌هایی که جاهای دیگه در حد چند میلیون می فروشن💸)

پس فعلا به کانال یوتیوبمون یک سر بزنین تا یک سوپرایز باحال در پست بعدی بهتون بگیم🤦🤦‍♀.

🎥Link: youtube.com/channel/UCrBcbQWcD0ortWqHAlP94ug

بی نهایت سپاسگزاریم از همراهی، حمایت و اعتماد شما تا الان و امیدواریم این حمایت کمتر نشه و روزبه‌روز بیشتر بشه❤️

✳️ @data_hub_ir
8👍1
سرویس جدید Amazon SageMaker محصول شرکت آمازون هست که روزی 4 ساعت اجازه کار با GPU میده. البته نیاز به ثبت نام اولیه داره که چیز خاصی هم نیست. امکاناتش هم از کولب بیشتره و به جز داخل نوتبوک مدل های دیگم میشه کد نوشت و اجرا کرد.
studiolab.sagemaker.aws

لطفا به اشتراک بگذارید👈🏻 @persian_data
👍51
per_swear.rar
1.1 MB
توی روز عشق، علاقمون بیشتر از قبل بهتون نشون میدیم (خرس نمیخام هدیه بدم)
یه دیتاست باحال داریم ولی نه برای سانسور
لطفا این دیتا علیه خودمون استفاده نکنین
این فقط واسه کارهای پژوهشیه

همچنین سایتمون فراموش نکنین
Data-hub.ir

@persian_data
👍5