NEW BOT Телеграм, страница

مرجع دیتاست فارسی

🔍 تاحالا شده دنبال دیتاست خوب برای تحلیل احساسات متن فارسی بگردی و ناامید بشی؟

دیتاست Persian Sentiment and Emotion شامل ۱۲ هزار توییت فارسیه که با برچسب‌های احساساتی مثل شادی، غم و خشم علامت‌گذاری شده. این یعنی یه منبع خیلی خوب برای آموزش مدل‌های NLP فارسی.

📊 مشخصات:
– ۱۲,۰۰۰ نمونه
– فرمت CSV
– برچسب احساس و عاطفه
– منبع: توییتر فارسی

🔗 لینک دیتاست:
github.com/KianTohidi/Persian_Sentiment_and_Emotion

پیشنهاد می‌کنیم حتما یه نگاهی بندازی و نظرت رو بهمون بگی!

GitHub

GitHub - KianTohidi/Persian_Sentiment_and_Emotion: Codes and instructions for processing Persian texts for sentiment analysis and…

Codes and instructions for processing Persian texts for sentiment analysis and emotion detection. - GitHub - KianTohidi/Persian_Sentiment_and_Emotion: Codes and instructions for processing Persian...

👍11❤5🔥3

2.38K viewsپشتیبانی, 14:37

مرجع دیتاست فارسی

📡 WiFi Deauther — ابزاری برای تست امنیت وای‌فای

این ابزار کمک می‌کنه شبکه‌های وای‌فای اطراف رو اسکن کنی، دستگاه‌ها رو ببینی و مشکلات امنیتی رو پیدا کنی. فقط یادت باشه استفاده سالم و قانونی اهمیت داره و نه استفاده غیرمجاز.

⚙️ اجرا روی برد ESP8266
💡 کاربرد: تست نفوذ و آموزش امنیت شبکه

لینک پروژه:
github.com/lilithroseblack/wifi-deauther

👍4❤1

1.93K viewsپشتیبانی, 13:37

مرجع دیتاست فارسی

معرفی میزان (MIZAN)؛ جامع‌ترین لیدربورد ارزیابی مدل‌های زبانی بزرگ (LLM) در زبان فارسی

پس از عرضهٔ بنچمارک FaMTEB برای ارزیابی مدل‌های Text Embedding، این‌بار تیم MCINEXT با دستاورد تازه‌ای در پردازش زبان طبیعی فارسی گامی بلندتر برداشته است.

🔍 چرا میزان؟

✅ مقایسه جامع مدل‌های برتر دنیا — ارزیابی دقیق طیف گسترده‌ای از مدل‌های متن‌باز و بسته به‌روز، با هدف ایجاد یک مرجع معتبر برای فارسی‌زبانان.
✅ پوشش ۶ بنچمارک تخصصی — طراحی‌شده توسط تیم MCINEXT برای سنجش عملکرد مدل‌ها در چت، پیروی از دستورالعمل، NLU، NLG، استدلال منطقی و دانش عمومی.
✅ دسترسی به تحلیل دقیق عملکرد — هر بنچمارک در یک تب مجزا ارائه شده و شامل بررسی مدل‌ها در تسک‌ها، دیتاست‌ها و متریک‌های متنوع است (مثل تحلیل احساسات، طبقه‌بندی موضوعی، NLI، STS و... در بخش Persian NLU).
✅ تنوع کاربردی بالا — میزان مدل‌ها را در سناریوهای واقعی فارسی مانند گفت‌وگوی چندمرحله‌ای، سیستم‌های RAG، تولید محتوا و پاسخ‌گویی منطقی ارزیابی می‌کند و به پژوهشگران کمک می‌کند بهترین مدل را برای نیاز خود انتخاب کنند.

🏆 بنچمارک‌های کلیدی میزان:

Persian MT-Bench: ارزیابی چت چندمرحله‌ای و کاربرد در سیستم‌های RAG

Persian IFEval: بررسی توانایی مدل‌ها در پیروی از دستورالعمل‌ها

PerCoR: اولین بنچمارک استدلال منطقی در زبان فارسی

PerMMLU: سنجش دانش عمومی و تخصصی مدل‌ها در موضوعات متنوع در زبان فارسی

Persian NLU: ارزیابی درک زبان طبیعی فارسی

Persian NLG: ارزیابی تولید زبان طبیعی فارسی

🔗 لیدربورد میزان را مشاهده کنید:
👉 https://lnkd.in/gPWdYyYG

📖 مقاله معرفی میزان در ویرگول:
👉 https://lnkd.in/gfE9R63Q

🔗 بنچمارک FaMTEB را مشاهده کنید:
👉 https://lnkd.in/guH8e8RS

lnkd.in

This link will take you to a page that’s not on LinkedIn

👍10❤4

2.36K viewsمحمد, 06:52

مرجع دیتاست فارسی

رفقا، تشخیص محتوای توهین‌آمیز تو فارسی سخته و وقت‌گیره🫠. امروز می‌خوایم یه دیتاست فوق‌العاده برای تشخیص محتوای توهین‌آمیز در فارسی رو بهتون معرفی کنیم!

با این دیتاست، می‌تونید مدل‌های هوش مصنوعی رو برای شناسایی خودکار پیام‌های نامناسب آموزش بدید و یه فضای آنلاین سالم‌تر بسازید.🤩

مشخصات و کاربردها ✨
بیش از ۱۰ هزار توییت فارسی برچسب‌خورده.
شامل متن و برچسب‌های توهین‌آمیز (توهین/عادی) و دسته‌بندی‌های دقیق‌تر.
عالی برای تشخیص توهین و آزار کلامی و ساخت فیلترینگ خودکار.

🔗 لینک دیتاست:
github.com/golnaz76gh/pars-offensive-dataset

اگر روی پروژه‌های تشخیص محتوا کار می‌کنی، این دیتاست می‌تونه کمک بزرگی باشه. حتماً یه نگاهی بنداز!

GitHub

GitHub - golnaz76gh/pars-offensive-dataset: A labeled dataset of Persian comments for offensive language detection

A labeled dataset of Persian comments for offensive language detection - golnaz76gh/pars-offensive-dataset

❤17👍3🔥1

3.03K viewsپشتیبانی, 11:40

مرجع دیتاست فارسی

🎁 منابع رایگان برنامه‌نویسی برای همه!

بچه‌ها، اگه دنبال کلی منابع خفن و رایگان برای یادگیری برنامه‌نویسی هستید، این ریپوی گیت‌هاب یه گنج واقعی براتونه! 💎 از ای‌بوک‌ها و ویدیوهای آموزشی گرفته تا ابزارها و دوره‌های آنلاین... همه رایگان و مرتب و منظم دسته بندی شدن.

📚 مشخصات:
– شامل منابع رایگان برای زبان‌های مختلف برنامه‌نویسی
– دسته‌بندی شده برای یادگیری سریع‌تر
– لینک‌های مستقیم به منابع

💡 کاربردها:
– یادگیری از صفر تا پیشرفته
– تقویت مهارت‌های کدنویسی
– پیدا کردن ابزارهای رایگان و حرفه‌ای

🔗 لینک:
https://github.com/barnamenevisi/free-resources

📥 این پست رو برای هرکسی که فکر میکنی براش مفیده بفرست تا از محتوا رایگان استفاده کنند.😊✨

GitHub

GitHub - barnamenevisi/free-resources: آرشیو منابع رایگان آموزش برنامه نویسی به زبان فارسی ( هر کسی باید بتونه برنامه نویسی رو…

آرشیو منابع رایگان آموزش برنامه نویسی به زبان فارسی ( هر کسی باید بتونه برنامه نویسی رو یاد بگیره، مهم نیست پول داره یا نداره، به امید اینکه کسی به خاطر نداشتن پول از آموزش عقب نمونه ) - barnamenev...

👍3

2.35K viewsپشتیبانی, 05:10

مرجع دیتاست فارسی

Channel photo updated

07:57

مرجع دیتاست فارسی

🎯 دیتاست Iranis – دیتاست فارسی برای شناسایی پلاک خودرو! 🚗✨

رفقا، امروز یه دیتاست فوق‌العاده براتون داریم که شامل بیش از 83,000 تصویر از اعداد و حروف فارسی موجود روی پلاک خودروهاست. این دیتاست برای پروژه‌های تشخیص کاراکتر پلاک خودرو و سیستم‌های بینایی ماشین بسیار کاربردیه!

📊 ویژگی‌ها و مشخصات:
– شامل تصاویر واقعی از پلاک خودروهای فارسی.

– بیش از 83,000 نمونه تصویری از اعداد و حروف فارسی.

– دسته‌بندی شده بر اساس اعداد، حروف و نمادهای خاص (مانند نماد ویلچر برای افراد دارای معلولیت).

💡 کاربردها:
– تشخیص کاراکترهای پلاک خودرو.

– آموزش مدل‌های بینایی ماشین.

– ساخت سیستم‌های هوشمند شناسایی خودرو.

🔗 لینک دانلود دیتاست:

github.com/alitourani/Iranis-dataset

📥 این پست رو برای کسایی که تو حوزه بینایی ماشین کار می‌کنن بفرست تا از این منبع ارزشمند استفاده کنن! 😊

#دیتاست #بینایی_ماشین #پلاک_خودرو #پردازش_تصویر #هوش_مصنوعی #تشخیص_کاراکتر #MachineLearning

GitHub

GitHub - alitourani/Iranis-dataset: A Large-scale Dataset of Farsi License Plate Characters

A Large-scale Dataset of Farsi License Plate Characters - alitourani/Iranis-dataset

👍11❤1

2.36K viewsپشتیبانی, 18:33

مرجع دیتاست فارسی

🎯 ابزار مدل‌سازی موضوعات در متن‌های کوتاه فارسی! 📝

اگر با چالش تحلیل و استخراج موضوعات از متن‌های کوتاه فارسی (مثل توییت‌ها یا پیام‌های کوتاه) مواجه هستید، این ابزار می‌تواند نیاز شما را برطرف کند. با استفاده از تکنیک‌های پیشرفته مانند LDA و NMF، می‌توانید موضوعات کلیدی را از داده‌های متنی استخراج کرده و آن‌ها را در پروژه‌های خود به کار ببرید.

📊 ویژگی‌ها و مزایا:

– تمرکز بر متن‌های کوتاه: ابزار بهینه برای داده‌هایی که طول متن در آن‌ها محدود است.

– روش‌های متنوع: پشتیبانی از الگوریتم‌های مختلف مدل‌سازی موضوعات برای مقایسه عملکرد و انتخاب بهترین روش.

– قابلیت اجرا: امکان استفاده آسان در محیط‌هایی مثل Google Colab برای تست سریع و کارآمد.

💡 مناسب برای چه کسانی؟

– تحلیلگران داده و متخصصان NLP که به دنبال استخراج موضوعات از داده‌های فارسی هستند.

– کسانی که روی شبکه‌های اجتماعی، نظرسنجی‌ها یا پیام‌های کوتاه کار می‌کنند.

– پژوهشگران و توسعه‌دهندگانی که نیاز به سازماندهی داده‌های متنی دارند.

🔗 لینک ابزار و نحوه استفاده:

https://github.com/DSInCenter/topicmodel

📥 اگر نیاز به استخراج موضوعات از متن‌های کوتاه دارید، این ابزار را امتحان کنید!

#مدل_سازی_موضوعات #پردازش_زبان #NLP_فارسی #تحلیل_متن #هوش_مصنوعی #متن_کوتاه #MachineLearning

GitHub

GitHub - DSInCenter/pySTTM

Contribute to DSInCenter/pySTTM development by creating an account on GitHub.

👍4❤1

1.79K viewsپشتیبانی, 18:49

مرجع دیتاست فارسی

🎯 تشخیص منظور کاربر از جملات بلند و پیچیده! 🤖

اگر در حال توسعه چت‌بات یا سیستم‌های هوشمند پردازش زبان طبیعی هستید، احتمالاً با چالش تشخیص منظور اصلی کاربر از جملات طولانی و پیچیده روبرو شده‌اید. این پروژه به شما کمک می‌کند تا این چالش را مدیریت کنید و سیستم‌های هوشمندتر و دقیق‌تری طراحی کنید.

📊 ویژگی‌ها و مزایا:

– تمرکز بر تحلیل و استخراج مقصود اصلی از جملات طولانی و همراه با اطلاعات حاشیه‌ای.

– مناسب برای توسعه چت‌بات‌ها و سیستم‌های پاسخ‌گویی هوشمند.

– استفاده از داده‌های دسته‌بندی‌شده با مشخص بودن هدف اصلی کاربر.

💡 کاربردها:

– توسعه چت‌بات‌های پشتیبانی مشتری.

– سیستم‌های پاسخ‌گویی هوشمند برای خدمات تلفن همراه، بانکداری، و سایر سرویس‌ها.

– بهبود تجربه کاربری در اپلیکیشن‌های مبتنی بر مکالمه.

🔗 لینک پروژه و کدها:

https://github.com/MojtabaZarreh/Recognizing-the-user-s-intent-from-long-and-complex-sentences

📥 اگر به دنبال راه‌حلی برای تحلیل دقیق‌تر نیازهای کاربران هستید، این پروژه را بررسی کنید!

#تشخیص_مقصود #پردازش_زبان #NLP_فارسی #چت_بات #هوش_مصنوعی #تحلیل_متن #MachineLearning

GitHub

GitHub - MojtabaZarreh/Recognizing-the-user-s-intent-from-long-and-complex-sentences: This project was one of the challenges raised…

This project was one of the challenges raised by Iran Mobile Communications Company (MCI) in the 7th artificial intelligence competition of Amirkabir University of Technology. - MojtabaZarreh/Recog...

❤3👍2🔥1

1.85K viewsپشتیبانی, 14:55

مرجع دیتاست فارسی

🎯 دیتاست Persian Instruct – مجموعه داده‌ای برای تنظیم دستورات به زبان فارسی! 📝

اگر به دنبال یک دیتاست باکیفیت برای انجام تسک‌های مختلف پردازش زبان طبیعی (NLP) به زبان فارسی هستید، دیتاست Semi-Alpaca Instruction Tuning می‌تواند انتخاب بسیار خوبی باشد. این دیتاست برای پروژه‌هایی مثل ترجمه ماشینی، تولید متن، و سایر کاربردها طراحی شده است.

📊 ویژگی‌های دیتاست:

– حاوی مجموعه‌ای از دستورات به زبان فارسی برای تنظیم مدل‌ها.

– مناسب برای تسک‌های متنوع NLP در زبان فارسی.

– گردآوری شده با همکاری دانشجویان دانشگاه تهران.

🔗 لینک دیتاست:

https://github.com/mostafaamiri/Persian_instruct_dataset

💡 اگر در حوزه NLP فارسی فعالیت می‌کنید، این دیتاست را از دست ندهید!

#دیتاست #NLP_فارسی #پردازش_زبان #هوش_مصنوعی #تولید_متن #ترجمه_ماشینی #MachineLearning

GitHub

GitHub - mostafaamiri/Persian_instruct_dataset

Contribute to mostafaamiri/Persian_instruct_dataset development by creating an account on GitHub.

👍7❤1🔥1

1.65K viewsپشتیبانی, 16:58

مرجع دیتاست فارسی

📊 Senti-Persian – دیتاست تحلیل احساسات فارسی!

اگه دنبال یه دیتاست حرفه‌ای برای تحلیل احساسات به زبان فارسی هستی، Senti-Persian انتخاب مناسبیه! این دیتاست شامل 67,743 کامنت برچسب‌گذاری‌شده از سایت‌های ایرانی (نماوا، فیلیمو، آپارات) و شبکه‌های اجتماعی (یوتیوب، توییتر، اینستاگرام) هست که با برچسب‌های مثبت، منفی و خنثی دسته‌بندی شده.

✨ ویژگی‌ها:

– داده‌های واقعی + داده‌های مصنوعی تولیدشده با تکنیک GAN

– بهبود دقت تحلیل احساسات از 88.4% به 96%

– مناسب برای توسعه سیستم‌های NLP فارسی

💡 کاربردها:

– تحلیل احساسات کاربران

– بهبود سیستم‌های پیشنهاددهی

– ابزارهای هوشمند در حوزه داده

🔗 لینک پروژه:

https://github.com/engmahsa/Senti-Persian-Dataset

📥 امتحانش کن و نظرت رو برامون بنویس!

#تحلیل_احساسات #دیتاست #NLP_فارسی #هوش_مصنوعی #پردازش_زبان

GitHub

GitHub - engmahsa/Senti-Persian-Dataset

Contribute to engmahsa/Senti-Persian-Dataset development by creating an account on GitHub.

👍11❤2

1.79K viewsپشتیبانی, 16:02

مرجع دیتاست فارسی

📚 RAG – سیستم پرسش و پاسخ برای فایل‌های PDF فارسی!

اگه دنبال یه سیستم هوشمند برای پرسش و پاسخ از فایل‌های PDF فارسی هستی، پروژه RAG دقیقاً همون چیزی هست که نیاز داری! این پروژه، با استفاده از مدل‌های زبان بزرگ و تکنیک Retrieval-Augmented Generation، اطلاعات مربوطه رو از فایل‌های PDF استخراج می‌کنه و پاسخ‌های دقیق و مرتبط ارائه می‌ده.

✨ ویژگی‌ها:
– پشتیبانی از فایل‌های PDF فارسی
– استفاده از مدل قدرتمند orca-tau-4k-persian-alpaca-f32 برای جستجوی معنایی و تولید پاسخ
– استخراج اطلاعات مرتبط و دقیق با کمک کلاس PDFProcessor

💡 کاربردها:
– پرسش و پاسخ از اسناد فارسی
– جستجوی سریع و دقیق در فایل‌های PDF
– ابزارهای آموزشی و پژوهشی

🔗 لینک پروژه:
github.com/zaha2020/RAG

📥 امتحانش کن و نظرت رو با ما به اشتراک بذار! 😊

#پرسش_پاسخ #PDF_فارسی #هوش_مصنوعی #پردازش_زبان #NLP_فارسی

GitHub

GitHub - zaha2020/RAG

Contribute to zaha2020/RAG development by creating an account on GitHub.

❤6👍2

1.69K viewsپشتیبانی, 16:27

مرجع دیتاست فارسی

🎙 وبینار مسیر شغلی تحلیلگر داده - با بورسیه ۱۰۰٪ بدون قرعه‌کشی!

🌟 دنیای داده پر از فرصت‌های طلاییه، ولی پیدا کردن مسیر درست وسط این شلوغی کار آسونی نیست. اگه نمی‌دونی از کجا شروع کنی یا شرکت‌ها واقعاً دنبال چی هستن، این وبینار می‌تونه نقشه راه شفاف و واقعی تو باشه.

✨ تو این وبینار یاد می‌گیری:
– رازهای پیدا کردن نیاز واقعی شرکت‌ها و رمزگشایی آگهی‌های شغلی
– ابزارهای پولساز و مسیر خودآموزی هدفمندشون
– تشخیص منابع آموزشی خوب از محتوای زرد
– تکنیک‌های یادگیری سریع برای تبدیل شدن به یک تحلیلگر داده حرفه‌ای

🎓 حالا نوبت بورسیه ۱۰۰٪ دیتاهابه!
ما به آدم‌های اهل عمل و یادگیری باور داریم. این بورسیه بدون قرعه‌کشی و کاملاً رایگانه! فقط کافیه شرایط ساده‌اش رو ببینی و اقدام کنی.

⏰ زمان: سه‌شنبه ۳۱ تیر، ساعت ۲۰:۰۰ تا ۲۱:۳۰
💰 هزینه: ۲۳۸ هزار تومان (با بورسیه، رایگان!)
🔗 لینک ثبت‌نام و جزئیات بورسیه:
https://zaya.io/gxxr0

📥 همین حالا کلیک کن و داستان بورسیه ۱۰۰٪ رو ببین!

📊 پرشین دیتا، مرجع دیتاست‌های فارسی!
@persian_data

#تحلیل_داده #بورسیه_رایگان #یادگیری_ماشین #مسیر_شغلی

❤3

1.72K viewsپشتیبانی, 16:52

مرجع دیتاست فارسی

مرجع دیتاست فارسی pinned a photo

14:54

مرجع دیتاست فارسی

🗣 هوش مصنوعی پرسش و پاسخ صوتی فارسی!

پروژه Persian Question Answering Voice2Voice AI یه سیستم هوشمند حرفه‌ایه که به صورت صوتی با کاربر تعامل داره! یعنی شما سوالتون رو میپرسید و هوش مصنوعی به زبان فارسی جواب میده - هم به صورت صوتی و هم متنی.

✨ قابلیت‌های کلیدی:

مکالمه صوتی دوطرفه کاملاً به زبان فارسی

نسخه بومی شده و قابل اجرا بدون اینترنت

مدل آموزشی اختصاصی برای پردازش زبان طبیعی

جمع‌آوری داده‌ها با خزنده‌های اختصاصی

🔗 لینک پروژه:

https://github.com/M-Taghizadeh/Persian_Question_Answering_Voice2Voice_AI

امتحانش کن و نظراتت رو با ما به اشتراک بذار 👇

#هوش_مصنوعی_فارسی #پردازش_صوت #NLP #پرسش_و_پاسخ #پروژه_پایتون

GitHub

GitHub - M-Taghizadeh/Persian_Question_Answering_Voice2Voice_AI: This repository hosts BonyadAI, a Persian question answering AI…

This repository hosts BonyadAI, a Persian question answering AI Model. We developed an initial web crawler and scraper to gather the dataset. The second phase involved building a machine learning m...

❤5👍3

2.54K viewsپشتیبانی, 06:50

مرجع دیتاست فارسی

🎙 دیتاست گفتار غیررسمی فارسی برای ASR و TTS

اگه دنبال یه دیتاست کاربردی برای پروژه‌های تشخیص گفتار خودکار (ASR) یا تبدیل متن به گفتار (TTS) هستی، VirgoolInformal-Speech-Dataset دقیقاً همون چیزیه که لازم داری! این دیتاست شامل فایل‌های صوتی و متنی غیررسمی فارسیه که به‌طور کامل پردازش شده و آماده استفاده است.

✨ چی داره؟

🎧 فایل‌های صوتی و متنی خام جمع‌آوری‌شده از وبلاگ‌های فارسی

🛠 داده‌های پردازش‌شده برای هم‌ترازی صوت و متن

📒 دفترچه Jupyter برای پردازش خودکار داده‌ها

💡 به چه دردی می‌خوره؟

🚀 آموزش مدل‌های هوش مصنوعی فارسی

📊 تحلیل گفتار غیررسمی فارسی

✅ ارزیابی مدل‌های ASR با معیار CER

🔗 لینک پروژه:

https://github.com/MahtaFetrat/VirgoolInformal-Speech-Dataset

📥 امتحانش کن و اگه دیتاست جالبی پیدا کردی، برای ما هم بفرست! 😊

🎓 انجام پروژه | منتورشیپ | تدریس خصوصی

@Data_hub

📊 پرشین دیتا، مرجع دیتاست‌های فارسی!

@persian_data

#تشخیص_گفتار #TTS_فارسی #ASR_فارسی #پردازش_زبان #دیتاست #هوش_مصنوعی

GitHub

GitHub - MahtaFetrat/VirgoolInformal-Speech-Dataset: A dataset of informal Persian audio and text chunks, along with a fully open…

A dataset of informal Persian audio and text chunks, along with a fully open processing pipeline, suitable for ASR and TTS tasks. Created from crawled content on virgool.io. - MahtaFetrat/VirgoolIn...

👍6

2.9K viewsپشتیبانی, 16:11

🎥 معرفی وبینار مسیر شغلی تحلیلگر داده - از زبان مدرس!

🌟 می‌خوای مسیر شغلی تحلیلگر داده رو شروع کنی ولی نمی‌دونی از کجا باید شروع کنی؟ یا شاید کلی ابزار و دوره دیدی ولی همچنان سردرگمی؟ این وبینار طراحی شده تا تمام سوالاتت رو جواب بده و نقشه راه شفاف و عملی رو جلوی پات بذاره!

✨ چی قراره یاد بگیری؟
– شناخت نیاز واقعی شرکت‌ها از طریق رمزگشایی آگهی‌های شغلی
– معرفی ابزارهای پولساز و نقشه راه یادگیری‌شون
– تشخیص منابع آموزشی خوب از محتوای زرد
– تکنیک‌های یادگیری سریع برای تبدیل شدن به Fast Learner

🎓 شرایط بورسیه ۱۰۰٪ دیتاهاب:
ما برای آدم‌های عملگرا و اهل یادگیری، این وبینار رو کاملاً رایگان کردیم! شرایط ساده و بدون قرعه‌کشیه، جزئیات کامل بورسیه رو تو لینک زیر ببین:
🔗 لینک ثبت‌نام و اطلاعات بیشتر:
https://zaya.io/gxxr0
📊 پرشین دیتا، مرجع دیتاست‌های فارسی!
@persian_data

#تحلیل_داده #بورسیه_رایگان #یادگیری_ماشین #مسیر_شغلی

❤1

1.65K viewsپشتیبانی, 18:46

مرجع دیتاست فارسی

🎙 دیتاست متن تولیدشده توسط هوش مصنوعی فارسی

اگه دنبال دیتاستی برای شناسایی متن‌های تولیدشده توسط هوش مصنوعی به زبان فارسی هستی، پروژه Persian AI-Generated Text Detection به کارت میاد! این پروژه هدفش استخراج متن‌های فارسی تولیدشده توسط کتابخانه OpenAI GPT و ساخت دیتاستی ارزشمند برای آموزش مدل‌های شناساییه.

✨ چی داره؟
🗂 ایجاد یک دیتاست بزرگ از متن‌های فارسی تولیدشده توسط هوش مصنوعی
🛠 فراهم کردن داده‌های آموزشی برای مدل‌های شناسایی متن‌های AI

🔗 لینک پروژه:
https://github.com/E-Ghafour/Persian_AI_generated_text_detection

📥 امتحانش کن و اگر دیتاست جالبی پیدا کردی، برای ما هم بفرست! 😊

🎓 انجام پروژه | منتورشیپ | تدریس خصوصی
@Data_hub
📊 پرشین دیتا، مرجع دیتاست‌های فارسی!
@persian_data

#تشخیص_متن_AI #هوش_مصنوعی_فارسی #دیتاست #پردازش_زبان #تولید_متن

GitHub

GitHub - E-Ghafour/Persian_AI_generated_text_detection

Contribute to E-Ghafour/Persian_AI_generated_text_detection development by creating an account on GitHub.

❤3👍2

1.67K viewsپشتیبانی, 16:13

مرجع دیتاست فارسی

🤖 هوش مصنوعی داره شغل‌ها رو یکی یکی فتح می‌کنه - میدونی کی نوبت شغل تو میرسه؟

رفقا سلام!

یه الگوی جالب توی تاریخ فناوری وجود داره که نشون می‌ده هوش مصنوعی چطور یه حوزه رو کامل تسخیر می‌کنه. شطرنج بهترین مثالشه:

🏁 مرحله اول: کنترل کامل انسانی (قرن‌ها فقط انسان‌ها بازی می‌کردن)
⚙️ مرحله دوم: موتورهای ساده (Deep Blue و امثالهم با brute force)
🤝 مرحله سوم: فاز سانتور (انسان + ماشین = بهترین ترکیب)
🚀 مرحله چهارم: استقلال کامل AI (AlphaZero که حتی به انسان یاد می‌ده!)

حالا سوال مهم: مهندسی نرم‌افزار کجاست؟
الان دقیقاً توی فاز سانتوریم! GitHub Copilot، ChatGPT و ابزارهای مشابه ما رو به برنامه‌نویس‌هایی تبدیل کردن که بدون اینا نمی‌تونیم با همون کیفیت و سرعت کار کنیم.

⚠️ اما مرحله بعد چی؟
آیا هوش مصنوعی روزی می‌تونه کامل مستقل کد بنویسه، باگ رفع کنه، و حتی خودش رو بهبود بده؟

💡 راه حل؟ تحلیل داده!
توی این دنیای در حال تغییر، یکی از امن‌ترین و پولسازترین مسیرها، تبدیل شدن به تحلیلگر داده حرفه‌ایه. چون هوش مصنوعی بدون داده هیچیه!

🎯 وبینار "مسیر شغلی تحلیلگر داده"
اگه نمی‌دونی از کجا شروع کنی یا وسط این همه ابزار و دوره گم شدی، این وبینار نقشه راه شفاف و واقعی تو می‌شه.

✨ چی یاد می‌گیری؟
– رمزگشایی آگهی‌های شغلی و شناخت نیاز واقعی شرکت‌ها
– معرفی ابزارهای پولساز و مسیر یادگیری‌شون
– تشخیص منابع خوب از محتوای زرد
– تکنیک‌های یادگیری سریع برای Fast Learner شدن

🎓 بورسیه ۱۰۰٪ دیتاهاب:
فقط کافیه پوستر وبینار رو توی شبکه‌های اجتماعی حرفه‌ای خودت منتشر کنی و @DataHub_ir رو تگ کنی. کد تخفیف ۱۰۰٪ رو دریافت می‌کنی!

⏰ زمان: سه‌شنبه ۳۱ تیر، ساعت ۲۰:۰۰
🔗 ثبت‌نام: https://zaya.io/gxxr0

🤔 سوال برای شما: به نظرتون کدوم حوزه بعد از شطرنج، کاملاً به هوش مصنوعی واگذار می‌شه؟ پزشکی؟ حقوق؟ یا خود مهندسی نرم‌افزار؟

🎓 انجام پروژه | منتورشیپ | تدریس خصوصی @Data_hub
📊 پرشین دیتا، مرجع دیتاست‌های فارسی! @persian_data

#تحلیل_داده #هوش_مصنوعی #مسیر_شغلی #بورسیه

❤5👍4

1.88K viewsپشتیبانی, 05:24

مرجع دیتاست فارسی

🎯 Daanish Solution - راهکاری جامع برای داده‌کاوی و یادگیری ماشین

اگه دنبال یه فریم‌ورک قدرتمند و انعطاف‌پذیر برای ساده‌سازی پروژه‌های داده‌کاوی هستی، Daanish Solution بهترین گزینه است! این پروژه ابزارهایی برای تحلیل آماری، طبقه‌بندی، پیش‌بینی سری‌های زمانی و خوشه‌بندی ارائه می‌ده.

✨ ویژگی‌ها:

📊 تحلیل اکتشافی داده (EDA) با Sweetviz برای تولید گزارش‌های خودکار.

🤖 طبقه‌بندی با مدل‌هایی مثل Logistic Regression، XGBoost و LightGBM.

📈 پیش‌بینی سری‌های زمانی با ARIMA و LSTM.

⚙️ خوشه‌بندی داده‌ها با روش‌های K-Means و DBSCAN.

🛠 پیش‌پردازش داده‌ها شامل حذف پرت، مدیریت داده‌های گمشده و مهندسی ویژگی.

🔗 لینک پروژه:

https://github.com/soleimanihamed/Daanish

🎓 انجام پروژه | منتورشیپ | تدریس خصوصی

@Data_hub

📊 پرشین دیتا، مرجع دیتاست‌های فارسی!

@persian_data

#تحلیل_داده #یادگیری_ماشین #دیتاست #هوش_مصنوعی

GitHub

GitHub - soleimanihamed/Daanish: Daanish (Persian for 'knowledge') is a reusable data science core with prebuilt functions for…

Daanish (Persian for 'knowledge') is a reusable data science core with prebuilt functions for diverse analysis tasks. Quickly implement projects by calling the required tools, savin...

👍4

2.21K viewsپشتیبانی, 18:17

مرجع دیتاست فارسی

🎯 FarSSiM - دیتاست شباهت معنایی برای زبان غیررسمی فارسی

اگه دنبال یک دیتاست منحصر‌به‌فرد برای تحلیل شباهت معنایی در زبان غیررسمی فارسی هستی، FarSSiM اولین دیتاست STS فارسیه که شامل 1123 جفت متن کوتاه غیررسمیه. این دیتاست با شناسایی پارافریز‌ها بین توییت‌های فارسی جمع‌آوری شده و شامل امتیازدهی معنایی و ارتباط بین جملات است.

✨ ساختار فایل و ویژگی‌ها:

📂 فایل اکسل با داده‌های:

– متن اول و دوم

– امتیازدهی توسط 4 ارزیاب

– میانگین، انحراف معیار و واریانس امتیازها

📊 آمار دیتاست:

– تعداد کل جفت‌ها: 1123

🔗 لینک پروژه:

https://github.com/mojtabasajjadi/FarSSiM

🎓 انجام پروژه | منتورشیپ | تدریس خصوصی @Data_hub

📊 پرشین دیتا، مرجع دیتاست‌های فارسی! @persian_data

#پردازش_زبان #شباهت_معنایی #دیتاست_فارسی #هوش_مصنوعی

GitHub

GitHub - mojtabasajjadi/FarSSiM: A Farsi (Persian) Semantic Similarity Measurement Dataset (FarSSiM)

A Farsi (Persian) Semantic Similarity Measurement Dataset (FarSSiM) - mojtabasajjadi/FarSSiM

👍6❤1

2.43K viewsپشتیبانی, 20:19

About

Blog

Apps

Platform