مرجع دیتاست فارسی – Telegram
مرجع دیتاست فارسی
3.18K subscribers
24 photos
2 videos
22 files
350 links
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
Download Telegram
نرم‌افزاری ساده و کاربردی برای تولید کد ملی ایرانی با پایتون! این ابزار به شما امکان می‌دهد تا با استفاده از دستورات CMD و زبان برنامه‌نویسی پایتون، به‌راحتی کد ملی‌های معتبر و صحیح بسازید. این پروژه می‌تواند برای تست واحد (Unit Testing) و تولید داده‌های تصادفی در پروژه‌های مختلف مورد استفاده قرار گیرد. لینک گیتهاب را برای اطلاعات بیشتر مشاهده کنید.

📱 GitHub Repo
👍4
Danial Ebrat

سلام! امیدوارم حال دلتون خوب باشه 😊
بالاخره بعد از این همه مدت گفتم این رو براتون آمادش کنم!
یه نرم افزار ساده نوشتم که میتونه به صورت خودکار از لیست اساتید مورد نظر، متناسب با فیلد تحقیقاتی هر استاد، متن ایمیل و رزومه ی مربوط به اون فیلد رو انتخاب کنه، اسم استاد، دانشگاه و گروهش رو در متن ایمیل جایگذاری کنه، رزومه، و در صورت نیاز دانشنامه رو هم ضمیمه کنه و با عنوانی مشخص، ایمیل رو برای استاد ارسال کنه.
💥

برای دانیال های بعدی در مسیر مهاجرت تحصیلی، اینجوری دیگه تمرکزتون میتونه تنها روی پیدا کردن استاد مناسب با فیلدتون باشه به جای وقت گذاشتن برای ایمیل زدن.
.
من با استفاده از این نرم افزار حدود حدود 30-40 تا مصاحبه گرفتم که در نهایت منجر شد به ۶ پذیرش برای پوزیشن های دکترا.
.
، البته، از کیفیت ایمیل هم غافل نشید! مثل تکه های پازل، سعی کنید هر تکه رو به بهترین شکل ممکن در بیارید.
.
تمام اطلاعات رو میتونید از صفحه ی گیتهاب پروژه بخونید، و در این ویدیو میتونین طریقه ی استفاده از این نرم افزار رو ببینید
.
امیدوارم این نرم افزار مسیرتون رو هموار تر کنه.
اگر وقت کنم (که اصلا معلوم نیست کی) بهتون هم یاد میدم اصلا این ایمیل ها رو از کجا پیدا کنید. روش هایی که تجربی یاد گرفتم و احتمالا تا حالا نشنیدین.
کم و کاستی ها رو ببخشید، سعی کردم با کمال گرایی مبارزه کنم و در ویدیو یوتیوب
مشکلات مشخص هست. 😄

با تشکر از احسان برای ایده ی قشنگش که پایه گذار اصلی به وجود آمدن این پروژه بود ❤️
Ehsan Barkhordar

لینک ویدئو
👍13
سلام دوستان
من یه پکیج پایتون نوشتم برای تبدیل pdf به word فارسی
این پکیج کاملا از زبان فارسی پشتیبانی میکنه.
این پکیح رو تویpypi منتشر کردم
https://pypi.org/project/persian-pdf-converter/2.3.1

اگر براتون مقدوره به ریپازیتوری گیت هاب پکیج ستاره بدین

https://github.com/mahdiramezanii/persian_pdf_converter
👍29
این پروژه به خلاصه‌سازی خودکار گفتار پرداخته است. با استفاده از الگوریتم‌های پردازش زبان طبیعی و تکنیک‌های یادگیری ماشین، این سیستم قادر است گفتار را به متن تبدیل کرده و خلاصه‌ای از آن را ارائه دهد. این پروژه می‌تواند در برنامه‌های متنوعی مانند تولید محتوا، استنطاق خودکار جلسات و استخراج اطلاعات کلیدی از فایل‌های صوتی مفید باشد.

📱 GitHub Repo
👍4
این دیتاست پزشکی مناسب برای پروژه‌های پرسش و پاسخ (QA) با هدف بهبود سیستم‌های هوش مصنوعی در زمینه تشخیص و پاسخ به سوالات پزشکی تهیه شده است. این مجموعه شامل نمونه‌های سوال و جواب مرتبط با موضوعات پزشکی است که از منابع معتبر جمع‌آوری شده‌اند. از این دیتاست می‌توان در پروژه‌های پردازش زبان طبیعی (NLP) و سیستم‌های هوشمند پزشکی استفاده کرد.

📱 GitHub Repo
👍8
اگر شما هم مثل من مشکل دارید که وقتی میرید توی سایت medium.com و مقالات اکثرا پریمیوم هست و نمیتونید بخونید، باید بگم که خدا شما رو دوست داشته که این پست رو دیدید.😁
خب حالا راه حل چیه؟🤔
فقط کافیه لینک مقاله رو توی این سایت بزارید | readmedium.com | و تمام🪄.

Amirreza Heydari
👍31
we present a new, diverse, and publicly-available dataset of machine-generated text in Persian. By utilizing the OpenAI’s GPT-3.5 Turbo model, we’ve created a comprehensive collection of machine-generated content spanning various themes and levels of formality. We used all Digikala comments, COPER articles, and a subset of pn_summary as human-written text and generated their paraphrases using ChatGPT.

📱 GitHub Repo
👍6
این مخزن با ایده تسهیل دسترسی و آشنایی پژوهشگران و روزنامه‌نگاران به داده‌های باز با محوریت اختصاصی ایران ساخته شده‌است که شامل منابع دولتی، مراکز پژوهشی دولتی، مراکز بین‌المللی و موسسات مستقل اشتراک‌گذاری داده می‌باشد.
(با ستاره دادن به من و با انتشارش به کسانی که پژوهشگر یا روزنامه‌نگار هستند انرژی بدید.)
دسترسی سریع به منابع

داده‌های رسمی و دولتی
مراکز پژوهشی رسمی
منابع رسمی بین‌المللی
موسسات مستقل اشتراک‌گذاری داده
پلتفرم‌های اشتراک داده

https://github.com/alirezach/awesome-iran-opendata
👍8
یک پروژه جالب در مورد پارافریزینگ متون فارسی
با استفاده از مدل‌های یادگیری عمیق، این ابزار قابلیت تغییر و بازنویسی جملات به شکلی معنی‌دار و با حفظ مفهوم اصلی را فراهم می‌آورد. این مدل می‌تواند در پروژه‌های مختلف پردازش زبان طبیعی (NLP) مانند خلاصه‌سازی خودکار متون، تولید محتوا و بهبود موتورهای جستجوی ایرانی مورد استفاده قرار گیرد.

📱 GitHub Repo
👍5
با یک وبلاگ فوق جذاب از Luke Salamone روبرو هستیم با کلی مطلب جدید و بروز که خیلی قابل فهم توضیح داده! در این لینک می‌توانید مطالب مفیدی درباره موضوعات مختلف از جمله برنامه‌نویسی، هوش مصنوعی و تحلیل داده‌ها را بیابید. هر پست به صورت کامل و دقیق با مثال‌های کاربردی توضیح داده شده و برای پژوهشگران، برنامه‌نویسان و علاقمندان به تکنولوژی بسیار کاربردی است. از این وبلاگ در پروژه‌های متفاوت و جهت افزایش دانش تخصصی خود استفاده کنید.

📱 GitHub Repo
👍5
یک دیتاست ارزشمند از پلاک‌های خودروهای ایرانی! این دیتاست شامل تصاویر و اطلاعات پلاک‌های مختلف ماشین‌های ایرانی است که به دقت جمع‌آوری و دسته‌بندی شده‌اند. این مجموعه برای توسعه سیستم‌های تشخیص پلاک خودرو، پروژه‌های دید کامپیوتری و الگوریتم‌های پردازش تصویر بسیار کاربردی و مفید خواهد بود. اگر به دنبال ابزارهای مناسبی برای پروژه‌های مرتبط با تشخیص پلاک خودرو و پردازش تصویر هستید، این دیتاست را از دست ندهید!

📱 GitHub Repo
👍8
آرشیو جامع منابع فارسی برای برنامه‌نویسان و توسعه‌دهندگان! 📚

این مخزن شامل مجموعه‌ای از منابع برجسته فارسی در زمینه‌های مختلف برنامه‌نویسی است. در این لینک، به مقالات، کتاب‌ها، دوره‌های آموزشی و ابزارهای مفید دسترسی پیدا خواهید کرد. این منابع، بهترین انتخاب برای هر کسی که به توسعه نرم‌افزار و یادگیری تکنولوژی‌های مختلف علاقه‌مند است.

از این آرشیو می‌توانید برای ارتقاء مهارت‌هایتان در حوزه‌های مختلف برنامه‌نویسی استفاده کنید.

📱 GitHub Repo
👍3
🔗 یک ابزار کارآمد برای تشخیص اخبار جعلی فارسی! با استفاده از این دیتاست، می‌توانید مدل‌های یادگیری ماشین‌تان را برای شناسایی اخبار جعلی در زبان فارسی آموزش دهید. این مجموعه شامل داده‌های خبرهای واقعی و جعلی است که به صورت دقیق و مناسب طبقه‌بندی شده‌اند. اگه به زمینه پردازش متن و شناخت الگوهای زبان طبیعی (NLP) علاقه دارید، این لینک به شما کمک خواهد کرد تا پروژه‌های تحقیقاتی و تجاری تان را به سطح بالاتری ببرید.

📱 GitHub Repo
👍2
وبسایت Math is Fun یک منبع بی‌نظیر برای یادگیری ریاضی از پایه تا پیشرفته است. این سایت با ارائه مثال‌ها، نمودارها، توضیحات ساده و آزمون‌های تعاملی، به تسهیل فرآیند یادگیری ریاضیات کمک می‌کند. از مفاهیم ابتدایی تا مباحث پیچیده‌تر مثل جبر و هندسه، همه چیز به شیوه‌ای واضح و ساده توضیح داده شده.

📱 GitHub Repo
👍6
یک مجموعه داده بزرگ و ارزشمند برای بازیابی اطلاعات متنی فارسی!
این دیتاست شامل متون مختلف به زبان فارسی است که به منظور ارزیابی و بهبود الگوریتم‌های بازیابی اطلاعات گردآوری شده است. این مجموعه می‌تواند به محققان و توسعه‌دهندگان در حوزه‌های زبان‌شناسی، یادگیری ماشین، و تحلیل متنی کمک کند تا الگوریتم‌های خود را تست و بهبود دهند. از این دیتاست می‌توان در پروژه‌های جستجوی متنی، تشخیص معنای کلمات، و تحلیل اعتبار محتوا استفاده کرد.

📱 GitHub Repo
👍6
چطوری از کورسرا دوره رایگان دریافت کنیم ؟

🎊توی این پست بهتون میگم که چطور با اولین درخواست ، بدون اینکه کورسرا بهتون ۷۵ ٪ تخفیف بده ، مستقیما دوره رو رایگان کنید .

ابتدا از همه دوستانی که نظرات و تجربیات خودشونو گفتن تشکر میکنم .

تو لینک زیر هم متنی که خودم نوشتم رو گذاشتم تا بتونید ازش ایده بگیرید 🔔
https://vrgl.ir/Lzcdc

🟡 از طریق اپلیکیشن موبایل کورسرا اقدام کنید .
🟡تا سقف ۱۱ تا درس رو میتونید درخواست کمک هزینه مالی بدید
🟡من با ایمیل دانشگاهیم درخواست دادم، سعی کنید از ساختن اکانت با جیمیل یا سرویس های رایگان بپرهیزید و با ایمیل دانشگاهی یا موسسه ای درخواست بدید .
🟡اشاره به اینکه ایرانی هستید مشکلی پیش نمیاره و بازم میتونید مدرک بگیرید ، مدارک فقط برای دروسی داده نمیشه که بالای ۱ سال طول میکشن و منجر به مدرک دانشگاهی میشن ، غیر از اون براتون مدرک با نام خودتون صادر میشه.

🟡من متن درخواست صدور رایگان رو خودم نوشتم و به chatgpt ندادم ، این مورد خیلی اثر گذاره .

🟡اشاره کنید به اینکه شغل ندارید ، دانشجو هستید و به جز مخارج ضروری زندگی نمیتونید خرج دیگری بکنید و با توجه به ارزش پایین ریال نسبت به یورو ، از پس هزینه های این کورس بر نمیایید و نمیتونید از خانوادتون هم درخواست کمک کنید و حتما بگید که گذروندن این دوره و گرفتن مدرکش میتونه به شما کمک کنه شغل های خیلی خوب پیدا کنید . من نوشتم اکثر شرکت های حوزه تک در ایران نیروهای با تجربه میخوان و از اونجایی که من سابقه کاری ندارم باید یه مدرکی ارائه کنم تا بتونم شانس پیدا کردن شغل رو افزایش بدم .

🎉با رعایت کردن این نکات من تونستم هر ۹ تا کورسی که درخواست داده بودم رو رایگان ثبت نام کنم و دیگه کورسرا پیشنهاد تخفیف ۷۵ درصدی بهم نکرد و فقط منو تو کورس ها به صورت رایگان ثبت نام کرد .

حتما حتما هم کورس هارو بگذرونید تا از نظر اخلاقی باعث نشه که دیدشون به ایرانی ها بد بشه ، البته اگه اشاره میکنید که ایرانی هستید 🫠

Fatemeh Mohseni
👍14
این دیتاست برای شناسایی متون تولید شده توسط هوش مصنوعی به زبان فارسی ایجاد شده است. شامل مجموعه‌ای از متن‌هاست که با الگوریتم‌های مختلف پردازشی تولید یا دستکاری شده‌اند، و می‌تواند در پروژه‌های تحقیقاتی و کاربردهای مختلف در حوزه پردازش زبان طبیعی (NLP) و تشخیص تقلب مورد استفاده قرار گیرد. این دیتاست می‌تواند به دانشجویان، محققان و توسعه‌دهندگان کمک کند تا مدل‌هایی جهت شناسایی و فیلتر متون تولید شده توسط هوش مصنوعی بسازند.

📱 GitHub Repo
👍3
Forwarded from دیتاهاب
سلام رفقا🥰

فردا قراره به کمک تیم خوب همخوان توی اصفهان یک رویداد برگزار کنیم با محوریت کتاب و کتاب خوانی و ترویج فرهنگ مطالعه.

توی این رویداد خودم کتاب "یادگیری ماشین برای مبتدیان" ارائه میدم ولی به زبان خیلی ساده و مثال محور از کاربردهاش توی صنعت. (به نوعی انتقال تجربیات هست)

❇️ رویداد رایگان هست و چون ظرفیتش محدود هست خواهشا فقط در صورتی که حتما تشریف میارید، ثبت نام کنید.

ایشاله فردا ساعت 18 می ببینمتون💌

مکان برگزاری: اصفهان - سپاهان‌شهر - میدان غدیر - مجتمع هفت‌نگین - طبقه ا

لینک ثبت نام:
https://evand.com/events/hamkhan143
👍3
این مخزن یکی از منابع خوب رایگان برای یادگیری برنامه‌نویسی است. تمامی منابع آموزشی از جمله کتاب‌ها و دوره‌ها به صورت رایگان در دسترس شماست و به تفکیک تکنولوژی‌ها و زبان‌های برنامه‌نویسی مرتب شده‌اند. برای شروع یادگیری و ارتقاء مهارت‌های برنامه‌نویسی خود، از این لینک استفاده کنید.

📱 GitHub Repo
👍41
این پروژه یک ابزار کاربردی برای استخراج کمیت‌ها به کمک عبارات منظم (Regex) است. با استفاده از این ابزار می‌توانید اعداد و واحدهای اندازه‌گیری (مثل متر، کیلوگرم، و سانتی‌متر) را به راحتی از متون استخراج کنید. این پروژه برای افرادی که در زمینه پردازش زبان طبیعی (NLP)، تحلیل داده‌ها و تبدیل واحدها کار می‌کنند بسیار مفید خواهد بود. کاربرد این ابزار در پروژه‌های مختلفی مثل تجزیه و تحلیل داده‌های متنی، مدیریت واحدهای اندازه‌گیری و حتی در ساخت بات‌های چت هوشمند قابل استفاده است.

📱 GitHub Repo
🔥5