آموزش نظر کاوی و تحلیل احساس به زبان فارسی
کلا تسک تحلیل احساسات (یا درست ترش تحلیل عواطف)چون ساده هست خیلی خواهان داره
https://github.com/ithabibi/Persian-Opinion-Mining-and-Sentiment-Analysis
کلا تسک تحلیل احساسات (یا درست ترش تحلیل عواطف)چون ساده هست خیلی خواهان داره
https://github.com/ithabibi/Persian-Opinion-Mining-and-Sentiment-Analysis
GitHub
GitHub - ithabibi/Persian-Opinion-Mining-and-Sentiment-Analysis: آموزش نظر کاوی و تحلیل احساس به زبان فارسی
آموزش نظر کاوی و تحلیل احساس به زبان فارسی. Contribute to ithabibi/Persian-Opinion-Mining-and-Sentiment-Analysis development by creating an account on GitHub.
👍6
یک کار خلاقانه
انتخاب اسم شرکت با تجزیه و تحلیل ابرکلمات کلمات کلیدی پرتکرار
https://github.com/bhx98/NameAnalysis/tree/main
انتخاب اسم شرکت با تجزیه و تحلیل ابرکلمات کلمات کلیدی پرتکرار
https://github.com/bhx98/NameAnalysis/tree/main
GitHub
GitHub - bhx98/NameAnalysis: Choosing a company name by analyzing the most used keywords in the field and visualize the output…
Choosing a company name by analyzing the most used keywords in the field and visualize the output with wordcloud - GitHub - bhx98/NameAnalysis: Choosing a company name by analyzing the most used ke...
👍3
نوتبوک های آموزش ساختمان داده و طراحی الگوریتم به زبان فارسی و همراه با مثال و کد
https://github.com/salinourian/Notebooks-for-Data-Structures/tree/master
https://github.com/salinourian/Notebooks-for-Data-Structures/tree/master
GitHub
GitHub - salinourian/Notebooks-for-Data-Structures: Jupyter Notebooks for Data Structures & Algorithms (Persian Language)
Jupyter Notebooks for Data Structures & Algorithms (Persian Language) - salinourian/Notebooks-for-Data-Structures
👍8
چ دیتاستی
این مجموعه داده به صورت تصادفی از پایگاه داده یک شرکت مخابراتی ایرانی در مدت 12 ماه جمع آوری شده است. در مجموع 3150 ردیف داده که هر کدام یک مشتری را نشان می دهد، حاوی اطلاعات 13 ستونی است. ویژگی هایی که در این مجموعه داده وجود دارد عبارتند از عدم موفقیت تماس، دفعات پیامک، تعداد شکایات، تعداد تماس های متمایز، طول اشتراک، گروه سنی، مبلغ شارژ، نوع سرویس، ثانیه استفاده، وضعیت، دفعات استفاده و مشتری. ارزش. همه ویژگی ها به جز ویژگی ریزش داده های جمع آوری شده 9 ماه اول است. برچسب های ریزش وضعیت مشتریان در پایان 12 ماه است.
https://github.com/Sabreen-Nazar/Iranian_Churn
این مجموعه داده به صورت تصادفی از پایگاه داده یک شرکت مخابراتی ایرانی در مدت 12 ماه جمع آوری شده است. در مجموع 3150 ردیف داده که هر کدام یک مشتری را نشان می دهد، حاوی اطلاعات 13 ستونی است. ویژگی هایی که در این مجموعه داده وجود دارد عبارتند از عدم موفقیت تماس، دفعات پیامک، تعداد شکایات، تعداد تماس های متمایز، طول اشتراک، گروه سنی، مبلغ شارژ، نوع سرویس، ثانیه استفاده، وضعیت، دفعات استفاده و مشتری. ارزش. همه ویژگی ها به جز ویژگی ریزش داده های جمع آوری شده 9 ماه اول است. برچسب های ریزش وضعیت مشتریان در پایان 12 ماه است.
https://github.com/Sabreen-Nazar/Iranian_Churn
GitHub
GitHub - Sabreen-Nazar/Iranian_Churn: Iranian_Churn_Prediction
Iranian_Churn_Prediction. Contribute to Sabreen-Nazar/Iranian_Churn development by creating an account on GitHub.
👍9
مجموعه ای از مخازن، مجموعه داده ها، مدل ها، ابزارها و موارد دیگر برای گفتار به متن (stt) و متن به گفتار (tts) برای زبان فارسی
https://github.com/karim23657/awesome-Persian-Speech
https://github.com/karim23657/awesome-Persian-Speech
GitHub
GitHub - karim23657/awesome-Persian-Speech: A collection of inspiring lists, repos, datasets, models, tools and more for Persian…
A collection of inspiring lists, repos, datasets, models, tools and more for Persian language speech to text(stt) and text to speech(tts) . - karim23657/awesome-Persian-Speech
👍2
مجموعه داده های رسمی علائم تجاری ایران
علائم تجاری، آرم، علائم و نمادهای شرکت های رسمی ایرانی. بیش از 30 هزار عکس از http://ipm.ssaa.ir/Search-Trademark
https://github.com/kargaranamir/Trademarks-from-Iranian-Companies
علائم تجاری، آرم، علائم و نمادهای شرکت های رسمی ایرانی. بیش از 30 هزار عکس از http://ipm.ssaa.ir/Search-Trademark
https://github.com/kargaranamir/Trademarks-from-Iranian-Companies
GitHub
GitHub - kargaranamir/Trademarks-from-Iranian-Companies: Iranian official trademarks dataset
Iranian official trademarks dataset. Contribute to kargaranamir/Trademarks-from-Iranian-Companies development by creating an account on GitHub.
👍6
A SQL database that includes a dictionary of 494,286 Persian words.
یکی از کاربرد این مدل دیکشنری ها واسه بحث املا و تشخیص غلط هاست
https://github.com/masterking32/persian-wordlist
یکی از کاربرد این مدل دیکشنری ها واسه بحث املا و تشخیص غلط هاست
https://github.com/masterking32/persian-wordlist
GitHub
GitHub - masterking32/persian-wordlist: A SQL database that includes a dictionary of 494,286 Persian words. دیکشنری 494,286 کلمه…
A SQL database that includes a dictionary of 494,286 Persian words. دیکشنری 494,286 کلمه فارسی به صورت دیتابیس - masterking32/persian-wordlist
👍4❤1
Forwarded from Data Jobs, دیتاجابز
🏷 عنوان شغلی: کارشناس پردازش زبان طبیعی
📅 تاریخ آگهی: 1402/07/30
🏦 شرکت: دیتاهاب
🏫 موقعیت مکانی: ریموت
⏰ نوع همکاری: #تمام_وقت یا #پاره_وقت
📂 حداقل سابقه: سه سال
💰حقوق: 15 تا 20
🛠 مهارتها: Python , NLP
❇️ اطلاعات بیشتر👇
jobvision.ir/jobs/604677
👉@data_jobs
📅 تاریخ آگهی: 1402/07/30
🏦 شرکت: دیتاهاب
🏫 موقعیت مکانی: ریموت
⏰ نوع همکاری: #تمام_وقت یا #پاره_وقت
📂 حداقل سابقه: سه سال
💰حقوق: 15 تا 20
🛠 مهارتها: Python , NLP
❇️ اطلاعات بیشتر👇
jobvision.ir/jobs/604677
👉@data_jobs
جاب ویژن
استخدام کارشناس پردازش زبان طبیعی در دیتاهاب
برای مشاهده آگهی استخدام کارشناس پردازش زبان طبیعی در دیتاهاب کلیک کنید و رزومه خود را به صورت رایگان ارسال کنید
👍6
سلام ارادت وقت بخیر
ما اخیرا یه دیتاست فارسی برای پرسش و پاسخ مکالمهای درست کردیم و مقاله اون رو آرکایو کردیم و همینطور دیتاست و مدل ها رو داخل گیتهاب گذاشتیم
دیتاست بصورت انسانی تهیه شده و همینطور بازبینی شده و عملکرد انسانی اون در کنار بنچمارک ها اومده
ممنون میشم داخل کانالتون معرفی کنید
لینک مقاله:
https://arxiv.org/abs/2312.04362
لینک گیت:
https://github.com/HamedHematian/PCoQA
ما اخیرا یه دیتاست فارسی برای پرسش و پاسخ مکالمهای درست کردیم و مقاله اون رو آرکایو کردیم و همینطور دیتاست و مدل ها رو داخل گیتهاب گذاشتیم
دیتاست بصورت انسانی تهیه شده و همینطور بازبینی شده و عملکرد انسانی اون در کنار بنچمارک ها اومده
ممنون میشم داخل کانالتون معرفی کنید
لینک مقاله:
https://arxiv.org/abs/2312.04362
لینک گیت:
https://github.com/HamedHematian/PCoQA
arXiv.org
PCoQA: Persian Conversational Question Answering Dataset
Humans seek information regarding a specific topic through performing a conversation containing a series of questions and answers. In the pursuit of conversational question answering research, we...
👍14
https://github.com/Persian-Twitter-Analysis/PersianTwitterDataset
This repository contains the dataset of Persian tweets, fully gathered by us. It contains more than 3300 tweets, and the sentiment of each tweet is labeled into 5 groups:
0: Happy - Joy - Agreement
1: Sad - Upset - Disagreement
2: Angry - Furious
3: Neutral - No Sentiment or emotion
4: Intense Emotions (Passion), encompassing Fear, Surprise, and Love
This repository contains the dataset of Persian tweets, fully gathered by us. It contains more than 3300 tweets, and the sentiment of each tweet is labeled into 5 groups:
0: Happy - Joy - Agreement
1: Sad - Upset - Disagreement
2: Angry - Furious
3: Neutral - No Sentiment or emotion
4: Intense Emotions (Passion), encompassing Fear, Surprise, and Love
GitHub
GitHub - Persian-Twitter-Analysis/PersianTwitterDataset
Contribute to Persian-Twitter-Analysis/PersianTwitterDataset development by creating an account on GitHub.
👍5
Forwarded from دیتاهاب
از طرف تیم دیتاهاب، سال جدید رو بهتون تبریک میگیم 🥳💐
امیدواریم سالی پر از شادی و موفقیت داشته باشین و به ویژه پر از پووول 😍
امیدواریم سالی پر از شادی و موفقیت داشته باشین و به ویژه پر از پووول 😍
👍18
DmyShapesDataset
🟢 این پروژه یه ابزار برای ساخت دیتاستهای اختصاصی برای شکلها ارائه میده و واقعا برای کسانی که میخوان پردازش تصویر و یادگیری ماشین رو شروع کنن به خصوص توی تسک Classification تصاویر و اشکال هندسی خیلی مفیده.
🟢 این امکان رو بهتون میده که تصاویری با شکلهای مختلف مثل دایره، مربع و مستطیل ایجاد کنید و حتی میتونید جزئیاتی مثل اندازه، رنگ پر کردن، و تعداد شکلها در هر تصویر رو سفارشی کنید.
🧑💻 GitHub Link
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - dmahdipour/DmyShapesDataset: Create a custom Datasets by choosing type of
Create a custom Datasets by choosing type of . Contribute to dmahdipour/DmyShapesDataset development by creating an account on GitHub.
👍3❤1
توی این ریپو یه مجموعه غنی و کامل از سوالاتی که موقع مصاحبه برای موقعیت شغلی Data Scientist مطرح شده به همراه جوابشون، جمعآوری شده.
و از زوایای زیر هم دسته بندی شدن:
🔢 یادگیری ماشین و یادگیری عمیق که موضوعاتی از قبیل جنگلهای تصادفی، رگراسیون خطی، Loss Function , Cost Function, SVM , Active Learning و ...
🔢 آمار و احتمال شامل سوالاتی درباره آزمون فرض، قضیه حد مرکزی و توزیع دادهها و ...
🔢 پایتون با مشکلات و چالشهای مرتبط با دادهها با استفاده از کتابخانههایی مانند Pandas معروف و ...
🔢 پایگاه داده و SQL با سوالات متمرکز بر بازیابی داده و تجزیه و تحلیل داده.
🔢 سوالات مبتنی بر رزومه
💡 در کل اگر برای مصاحبه با موقعیت Data Scientist آماده میشید، این مخزن میتونه منبع مفیدی باشد تا با سوالات رایج معمول و مهارتهای حل مسئله خود آشنا بشید.
🧑💻 GitHub Link
و از زوایای زیر هم دسته بندی شدن:
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - youssefHosni/Data-Science-Interview-Questions-Answers: Curated list of data science interview questions and answers
Curated list of data science interview questions and answers - youssefHosni/Data-Science-Interview-Questions-Answers
👍12
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
یک دموی نه چندان با کیفیت ۱۹ ثانیهای از عملکرد بات:
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - nicolomantini/LinkedIn-Easy-Apply-Bot: Automate the application process on LinkedIn
Automate the application process on LinkedIn. Contribute to nicolomantini/LinkedIn-Easy-Apply-Bot development by creating an account on GitHub.
👍5
یک دوست عزیزی اومدن و یکسری ویدیوهای آموزشی مربوط به مسیر مهاجرت کاری شامل رزومه نویسی، سایت های کاریابی، نحوه اپلای، آمادهسازی برای مصاحبه، بررسی تجربه زندگی در کشورهای مختلف و... که توی یوتیوب بوده رو یکجا تجمیع و دستهبندی کردن
🧑💻 GitHub Repo
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - salehhashemi1992/tech-migration-assistant: مخزن دسته بندی شده ویدیوهای فارسی مربوط به مسیر مهاجرت کاری و بررسی تجربه زندگی…
مخزن دسته بندی شده ویدیوهای فارسی مربوط به مسیر مهاجرت کاری و بررسی تجربه زندگی در کشورهای مختلف - salehhashemi1992/tech-migration-assistant
👍13
سلام وقتتون به خیر
من اولین بارمه یه دیتاست میسازم
شامل 5000 تا تصویر از ماشین های ایرانی و یه فایل csv که توش مشخصات فنی و نام ماشین قرار داره
https://huggingface.co/datasets/abbastafakory31/iran_car_dataset/discussions/1
من اولین بارمه یه دیتاست میسازم
شامل 5000 تا تصویر از ماشین های ایرانی و یه فایل csv که توش مشخصات فنی و نام ماشین قرار داره
https://huggingface.co/datasets/abbastafakory31/iran_car_dataset/discussions/1
👍13
یه دیتاست جدید شامل ۱۱۸۲ تصویر حاوی متون فارسی در زمینههای مختلف، برای اون دسته از عزیزانی که حوزه پردازش تصویر و OCR و پردازش متن کار میکنن میتونه مفید باشه:
🧑💻 GitHub Repo
📄 Paper
📱 Dataset
📱 Labels
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - alisalmasiii/FTS-Farsi-Text-in-Scene---Dataset
Contribute to alisalmasiii/FTS-Farsi-Text-in-Scene---Dataset development by creating an account on GitHub.
👍11
سلام
امیدوارم که حال دلتون خوب باشه
با توجه به داغ شدن اخبار LLMها و مدلهای جدیدی که هر هفته منتشر میشن، کم و بیش شده که دلمون بخواد که باهاشون چت کنیم و ارزیابی شون کنیم
یا بعضی وقتها برای خودم مثلا پیش میاد یه تسک خیلی خیلی مهم دارم و حتی اگه 1 پراپمت هم بتونم بفرستم به یک مدل خیلی خیلی خوب مثل GPT 4 Turbo که همین اخیر منتشر شده و آخرین مدل OpenAI هست واقعا برام ارزش داره برای همین خیلی گشتم و به این پلتفرم دانشگاه برکلی کالفرنیا رسیدم که در ادامه خدمتتون معرفی میکنم:
https://chat.lmsys.org/
+ از بزرگترین مزیتهاش اینه که ثبتنام و دردسر نداره و راحت میتونین وارد سایتش بشید
+ دسترسی به تمام LLMهای مطرح دنیا رو بهتون میده از غولهای کلوز سورسها مثل Claude , GPT بگیرید تا اوپن سورسهای جدید مثل Llama3 (البته کلوز سورسها محدودیت درخواست در هفته دارن بعضیاشون)
پ.ن: تحریم همیشگی (فیلترشکن فراموش نشه)
امیدوارم که حال دلتون خوب باشه
با توجه به داغ شدن اخبار LLMها و مدلهای جدیدی که هر هفته منتشر میشن، کم و بیش شده که دلمون بخواد که باهاشون چت کنیم و ارزیابی شون کنیم
یا بعضی وقتها برای خودم مثلا پیش میاد یه تسک خیلی خیلی مهم دارم و حتی اگه 1 پراپمت هم بتونم بفرستم به یک مدل خیلی خیلی خوب مثل GPT 4 Turbo که همین اخیر منتشر شده و آخرین مدل OpenAI هست واقعا برام ارزش داره برای همین خیلی گشتم و به این پلتفرم دانشگاه برکلی کالفرنیا رسیدم که در ادامه خدمتتون معرفی میکنم:
https://chat.lmsys.org/
+ از بزرگترین مزیتهاش اینه که ثبتنام و دردسر نداره و راحت میتونین وارد سایتش بشید
+ دسترسی به تمام LLMهای مطرح دنیا رو بهتون میده از غولهای کلوز سورسها مثل Claude , GPT بگیرید تا اوپن سورسهای جدید مثل Llama3 (البته کلوز سورسها محدودیت درخواست در هفته دارن بعضیاشون)
پ.ن: تحریم همیشگی (فیلترشکن فراموش نشه)
👍12