مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.18K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
با یک وبلاگ فوق جذاب از Luke Salamone روبرو هستیم با کلی مطلب جدید و بروز که خیلی قابل فهم توضیح داده! در این لینک می‌توانید مطالب مفیدی درباره موضوعات مختلف از جمله برنامه‌نویسی، هوش مصنوعی و تحلیل داده‌ها را بیابید. هر پست به صورت کامل و دقیق با مثال‌های کاربردی توضیح داده شده و برای پژوهشگران، برنامه‌نویسان و علاقمندان به تکنولوژی بسیار کاربردی است. از این وبلاگ در پروژه‌های متفاوت و جهت افزایش دانش تخصصی خود استفاده کنید.

📱 GitHub Repo
👍5
یک دیتاست ارزشمند از پلاک‌های خودروهای ایرانی! این دیتاست شامل تصاویر و اطلاعات پلاک‌های مختلف ماشین‌های ایرانی است که به دقت جمع‌آوری و دسته‌بندی شده‌اند. این مجموعه برای توسعه سیستم‌های تشخیص پلاک خودرو، پروژه‌های دید کامپیوتری و الگوریتم‌های پردازش تصویر بسیار کاربردی و مفید خواهد بود. اگر به دنبال ابزارهای مناسبی برای پروژه‌های مرتبط با تشخیص پلاک خودرو و پردازش تصویر هستید، این دیتاست را از دست ندهید!

📱 GitHub Repo
👍8
آرشیو جامع منابع فارسی برای برنامه‌نویسان و توسعه‌دهندگان! 📚

این مخزن شامل مجموعه‌ای از منابع برجسته فارسی در زمینه‌های مختلف برنامه‌نویسی است. در این لینک، به مقالات، کتاب‌ها، دوره‌های آموزشی و ابزارهای مفید دسترسی پیدا خواهید کرد. این منابع، بهترین انتخاب برای هر کسی که به توسعه نرم‌افزار و یادگیری تکنولوژی‌های مختلف علاقه‌مند است.

از این آرشیو می‌توانید برای ارتقاء مهارت‌هایتان در حوزه‌های مختلف برنامه‌نویسی استفاده کنید.

📱 GitHub Repo
👍3
🔗 یک ابزار کارآمد برای تشخیص اخبار جعلی فارسی! با استفاده از این دیتاست، می‌توانید مدل‌های یادگیری ماشین‌تان را برای شناسایی اخبار جعلی در زبان فارسی آموزش دهید. این مجموعه شامل داده‌های خبرهای واقعی و جعلی است که به صورت دقیق و مناسب طبقه‌بندی شده‌اند. اگه به زمینه پردازش متن و شناخت الگوهای زبان طبیعی (NLP) علاقه دارید، این لینک به شما کمک خواهد کرد تا پروژه‌های تحقیقاتی و تجاری تان را به سطح بالاتری ببرید.

📱 GitHub Repo
👍2
وبسایت Math is Fun یک منبع بی‌نظیر برای یادگیری ریاضی از پایه تا پیشرفته است. این سایت با ارائه مثال‌ها، نمودارها، توضیحات ساده و آزمون‌های تعاملی، به تسهیل فرآیند یادگیری ریاضیات کمک می‌کند. از مفاهیم ابتدایی تا مباحث پیچیده‌تر مثل جبر و هندسه، همه چیز به شیوه‌ای واضح و ساده توضیح داده شده.

📱 GitHub Repo
👍6
یک مجموعه داده بزرگ و ارزشمند برای بازیابی اطلاعات متنی فارسی!
این دیتاست شامل متون مختلف به زبان فارسی است که به منظور ارزیابی و بهبود الگوریتم‌های بازیابی اطلاعات گردآوری شده است. این مجموعه می‌تواند به محققان و توسعه‌دهندگان در حوزه‌های زبان‌شناسی، یادگیری ماشین، و تحلیل متنی کمک کند تا الگوریتم‌های خود را تست و بهبود دهند. از این دیتاست می‌توان در پروژه‌های جستجوی متنی، تشخیص معنای کلمات، و تحلیل اعتبار محتوا استفاده کرد.

📱 GitHub Repo
👍6
چطوری از کورسرا دوره رایگان دریافت کنیم ؟

🎊توی این پست بهتون میگم که چطور با اولین درخواست ، بدون اینکه کورسرا بهتون ۷۵ ٪ تخفیف بده ، مستقیما دوره رو رایگان کنید .

ابتدا از همه دوستانی که نظرات و تجربیات خودشونو گفتن تشکر میکنم .

تو لینک زیر هم متنی که خودم نوشتم رو گذاشتم تا بتونید ازش ایده بگیرید 🔔
https://vrgl.ir/Lzcdc

🟡 از طریق اپلیکیشن موبایل کورسرا اقدام کنید .
🟡تا سقف ۱۱ تا درس رو میتونید درخواست کمک هزینه مالی بدید
🟡من با ایمیل دانشگاهیم درخواست دادم، سعی کنید از ساختن اکانت با جیمیل یا سرویس های رایگان بپرهیزید و با ایمیل دانشگاهی یا موسسه ای درخواست بدید .
🟡اشاره به اینکه ایرانی هستید مشکلی پیش نمیاره و بازم میتونید مدرک بگیرید ، مدارک فقط برای دروسی داده نمیشه که بالای ۱ سال طول میکشن و منجر به مدرک دانشگاهی میشن ، غیر از اون براتون مدرک با نام خودتون صادر میشه.

🟡من متن درخواست صدور رایگان رو خودم نوشتم و به chatgpt ندادم ، این مورد خیلی اثر گذاره .

🟡اشاره کنید به اینکه شغل ندارید ، دانشجو هستید و به جز مخارج ضروری زندگی نمیتونید خرج دیگری بکنید و با توجه به ارزش پایین ریال نسبت به یورو ، از پس هزینه های این کورس بر نمیایید و نمیتونید از خانوادتون هم درخواست کمک کنید و حتما بگید که گذروندن این دوره و گرفتن مدرکش میتونه به شما کمک کنه شغل های خیلی خوب پیدا کنید . من نوشتم اکثر شرکت های حوزه تک در ایران نیروهای با تجربه میخوان و از اونجایی که من سابقه کاری ندارم باید یه مدرکی ارائه کنم تا بتونم شانس پیدا کردن شغل رو افزایش بدم .

🎉با رعایت کردن این نکات من تونستم هر ۹ تا کورسی که درخواست داده بودم رو رایگان ثبت نام کنم و دیگه کورسرا پیشنهاد تخفیف ۷۵ درصدی بهم نکرد و فقط منو تو کورس ها به صورت رایگان ثبت نام کرد .

حتما حتما هم کورس هارو بگذرونید تا از نظر اخلاقی باعث نشه که دیدشون به ایرانی ها بد بشه ، البته اگه اشاره میکنید که ایرانی هستید 🫠

Fatemeh Mohseni
👍14
این دیتاست برای شناسایی متون تولید شده توسط هوش مصنوعی به زبان فارسی ایجاد شده است. شامل مجموعه‌ای از متن‌هاست که با الگوریتم‌های مختلف پردازشی تولید یا دستکاری شده‌اند، و می‌تواند در پروژه‌های تحقیقاتی و کاربردهای مختلف در حوزه پردازش زبان طبیعی (NLP) و تشخیص تقلب مورد استفاده قرار گیرد. این دیتاست می‌تواند به دانشجویان، محققان و توسعه‌دهندگان کمک کند تا مدل‌هایی جهت شناسایی و فیلتر متون تولید شده توسط هوش مصنوعی بسازند.

📱 GitHub Repo
👍3
Forwarded from دیتاهاب
سلام رفقا🥰

فردا قراره به کمک تیم خوب همخوان توی اصفهان یک رویداد برگزار کنیم با محوریت کتاب و کتاب خوانی و ترویج فرهنگ مطالعه.

توی این رویداد خودم کتاب "یادگیری ماشین برای مبتدیان" ارائه میدم ولی به زبان خیلی ساده و مثال محور از کاربردهاش توی صنعت. (به نوعی انتقال تجربیات هست)

❇️ رویداد رایگان هست و چون ظرفیتش محدود هست خواهشا فقط در صورتی که حتما تشریف میارید، ثبت نام کنید.

ایشاله فردا ساعت 18 می ببینمتون💌

مکان برگزاری: اصفهان - سپاهان‌شهر - میدان غدیر - مجتمع هفت‌نگین - طبقه ا

لینک ثبت نام:
https://evand.com/events/hamkhan143
👍3
این مخزن یکی از منابع خوب رایگان برای یادگیری برنامه‌نویسی است. تمامی منابع آموزشی از جمله کتاب‌ها و دوره‌ها به صورت رایگان در دسترس شماست و به تفکیک تکنولوژی‌ها و زبان‌های برنامه‌نویسی مرتب شده‌اند. برای شروع یادگیری و ارتقاء مهارت‌های برنامه‌نویسی خود، از این لینک استفاده کنید.

📱 GitHub Repo
👍41
این پروژه یک ابزار کاربردی برای استخراج کمیت‌ها به کمک عبارات منظم (Regex) است. با استفاده از این ابزار می‌توانید اعداد و واحدهای اندازه‌گیری (مثل متر، کیلوگرم، و سانتی‌متر) را به راحتی از متون استخراج کنید. این پروژه برای افرادی که در زمینه پردازش زبان طبیعی (NLP)، تحلیل داده‌ها و تبدیل واحدها کار می‌کنند بسیار مفید خواهد بود. کاربرد این ابزار در پروژه‌های مختلفی مثل تجزیه و تحلیل داده‌های متنی، مدیریت واحدهای اندازه‌گیری و حتی در ساخت بات‌های چت هوشمند قابل استفاده است.

📱 GitHub Repo
🔥5
یک دیتاست کاربردی برای تشخیص هرزنامه‌های پیامکی!

این مجموعه داده شامل پیام‌های اس‌ام‌اس (SMS) به زبان فارسی است که به دو دسته پیام‌های حاوی تبلیغات ناخواسته (هرزنامه) و پیام‌های معمولی تقسیم‌بندی شده‌اند. در مجموع شامل 3500 پیام است که هر پیام با ویژگی‌های متنی مختلف قابل تحلیل است. این دیتاست می‌تواند در توسعه و آموزش مدل‌های تشخیص هرزنامه، تحلیل متن و پردازش زبان طبیعی (NLP) بسیار مفید باشد. اگر در حوزه‌های هوش مصنوعی، یادگیری ماشین و پردازش زبان طبیعی کار می‌کنید، از این دیتاست برای بهبود الگوریتم‌های خود بهره ببرید.

📱 GitHub Repo
👍5
تازگی این مدل بحث ها مد شده و راحت میشه مقاله داد، خیلی مورد پسند دوستان چپ و دموکرات هستش...

این مخزن گیت‌هاب حاوی مجموعه‌ای از ابزارها و منابع برای مطالعه و شناسایی سوگیری‌ها در پردازش زبان طبیعی (NLP) است. این ابزارها به شما کمک می‌کنند تا مدل‌های یادگیری ماشین خود را از لحاظ وجود سوگیری‌های مختلف بررسی کرده و آن‌ها را بهبود بخشید. از این منابع می‌توانید در پروژه‌های تحقیقاتی، توسعه مدل‌های NLP و همچنین در جلوگیری از تبعیض و بی‌عدالتی در کاربردهای مختلف زبان‌شناسی رایانشی بهره ببرید. برای اطلاعات بیشتر و دسترسی به کدها، به لینک زیر مراجعه کنید:

📱 GitHub Repo
👍21👎1
مقاله AACL چاپ شده و نیاز به تعریف نداره و کدش هم موجوده، دید خوبی میده ک چ سطح کاری باید انجام داده بشه تا توی چنین جاهایی چاپ بشه.

📱 GitHub Repo
👍3
اگر به استخراج عبارات کلیدی از متون علاقه‌مند هستید، این پروژه برای شماست!
پروژه KeyPhrase_Extraction شامل الگوریتم‌های مختلف برای شناسایی و استخراج عبارات کلیدی از متون فارسی می‌باشد. این می‌تواند برای پژوهشگران و توسعه‌دهندگان که در حوزه پردازش زبان طبیعی (NLP) کار می‌کنند، بسیار مفید باشد.
از این پروژه می‌توانید در تحلیل متون، خلاصه‌سازی خودکار و بهبود موتورهای جستجو بهره ببرید.

📱 GitHub Repo
👍3
بختت ایرانی...ک مجبوری با چنین ابزارهایی آشنا بشی

یک ابزار کارآمد برای بررسی فیلترینگ اینترنت! 🎯 این مخزن شامل اسکریپت‌هایی است که به شما کمک می‌کنند تا فیلترینگ و مسدود شدن وب‌سایت‌ها را از طریق سرورهای مختلف بررسی کنید. 🤖 ابزار CheckFiltering می‌تواند به محققان، توسعه‌دهندگان وب و فعالان حوزه اینترنت یاری کند تا وضعیت دسترسی به وب‌سایت‌ها را در مناطق مختلف جهان بسنجند. 🌍📊

از این ابزار می‌توان در پروژه‌های مانیتورینگ اینترنت، تحلیل ترافیک و ارزیابی تاثیر فیلترینگ استفاده کرد. 🚀

📱 GitHub Repo
👍14👎4
پکیج کاربردی PersianUtils، مجموعه‌ای از ابزارها و کتابخانه‌های متنوع برای کار با متون و داده‌های فارسی (آچار فرانسه ای هست واسه خودش)

📱 GitHub Repo
👍13👎1
ابزار خفن وب‌اسکرپینگ برای جمع‌آوری داده‌های سایت جاباما! این ابزار به شما کمک می‌کند تا به صورت خودکار اطلاعات مربوط به اقامتگاه‌ها، قیمت‌ها، موقعیت‌ها و نظرات کاربران را از سایت جاباما استخراج کنید. این پروژه به‌ویژه برای توسعه‌دهندگان، محققان حوزه داده‌کاوی و تحلیل‌گران بازار مکانیابی مناسب است. از این ابزار می‌توانید در پروژه‌های تحلیل داده، مقایسه قیمت و حتی پیشنهادهای سفر استفاده کنید.

📱 GitHub Repo
👍5
راه اندازی ربات پاسخ گو به سوالات حقوقی فارسی

این ربات به کاربران امکان می‌دهد که سوالات حقوقی خود را به صورت مستقیم از طریق چت مطرح کنند و پاسخ‌های دقیق و متناسب با قوانین موجود دریافت کنند. این ابزار می‌تواند در وب‌سایت‌ها و اپلیکیشن‌های مشاوره حقوقی مورد استفاده قرار بگیرد تا تجربه‌ی کاربران بهبود یافته و به سوالات آنان به سرعت پاسخ داده شود.
از این ربات می‌توان در پروژه‌های مختلفی نظیر پلتفرم‌های مشاوره حقوقی آنلاین، اپلیکیشن‌های موبایل، و حتی سیستم‌های داخلی شرکت‌ها و سازمان‌ها بهره برد.

📱 GitHub Repo
👍8
Forwarded from دیتاهاب
🍻 دومین دورهمی هوش مصنوعی دیتاهاب (اصفهان)

📗موضوع: درآمد دلاری از طریق هوش مصنوعی (صفر تا صد Remote jobs)

قراره بهتون توی این جلسه یاد داده بشه چطور از کنج اتاقتون، با هر شرکتی توی هر کشوری کار کنید و دلاری دستمزد بگیرین.

لینک ثبت نام
کد تخفیف 80 درصدی: datahub

🗓 چهار شنبه، 2 آبان، ساعت 15 تا 17
🏦 اصفهان - دروازه شیراز - دانشگاه اصفهان - جنب رستوران یاس 1 - ساختمان مرکز رشد علوم انسانی

📛 توجه: برای شرکت در رویداد، ثبت نام ضروری هست.

❇️@data_hub_ir
❇️data-hub.ir
❇️Linkedin
❇️09938013176
👍2
ابزار شناسایی واژگان غیرقانونی

این پروژه از تکنیک‌های پردازش زبان طبیعی (NLP) برای شناسایی و تشخیص واژگان غیرقانونی در متن استفاده می‌کند. هدف از این ابزار، کمک به توسعه‌دهندگان، مدیران محتوا و محققان در شناسایی سریع و کارآمد محتوای غیرقانونی یا نامناسب است.
از این ابزار می‌توان در پروژه‌های مرتبط با نظارت بر محتوا، فیلترینگ خودکار و تحلیل داده‌ها استفاده کرد.
برای کسب اطلاعات بیشتر و دسترسی به کد منبع این ابزار به لینک زیر مراجعه کنید:

📱 GitHub Repo
👍4