1608050858810.jpg
123 KB
💡 موضوع کارگاه
A brief history of word embeddings and implement the sentiment analysis project with bert
📆 زمان کارگاه: ۸ دی
📘 مخاطب: علاقمندان به مباحث پردازش زبانهای طبیعی
💻 اطلاعات بیشتر:
🔗 https://sharif-wss.ir/workshop/23
A brief history of word embeddings and implement the sentiment analysis project with bert
📆 زمان کارگاه: ۸ دی
📘 مخاطب: علاقمندان به مباحث پردازش زبانهای طبیعی
💻 اطلاعات بیشتر:
🔗 https://sharif-wss.ir/workshop/23
best website.pdf
20.3 MB
✋درود
اینم یک لیست از بهترین سایت هایی که داخلش میشه فرصت های شغلی مربوط به تحلیل داده پیدا کرد
❇️@data_hub_ir
اینم یک لیست از بهترین سایت هایی که داخلش میشه فرصت های شغلی مربوط به تحلیل داده پیدا کرد
❇️@data_hub_ir
درود به همگی، اینجا معمولا سعی می کنم محتوای با کیفیت بزارم و طبیعتا زمانبره، و تعدادش محدود میشه ولی بهم بگین مطلب بعدی یک دیتاست فارسی بزارم یا ی ویدیو اموزشی کوتاه؟
احسان عسکریان.pdf
114.5 KB
درود
❇️در پنجمین سری از مصاحبه های دیتاهاب، سراغ مهندس عسکریان رفته و یکمصاحبهای با ایشون حول مباحث تحلیل داده داشتیم
ایشان معتقد هستند:
"قطعاً دانستن ریاضیات و بخصوص آمار تاثیر بسزایی در علم داده داره ولی سطح این دانش بستگی به پیچیدگی پروژهای داره که قراره انجام بدین. چون خیلی از کارهای تحلیل داده نیاز به دانش کم آماری و ریاضیات دارند و بسیار روتین هستند و کتابخانههای زیادی برای انجام آنها وجود داره. ولی گاهی پیچیدگی مساله نیاز به راه حل جدید یا ابتکار در استفاده از متدهای مختلف، یا نیاز به تنظیم تخصصی پارامترهای الگوریتمها داره که درک تخصصی از یادگیری ماشین و ریاضیات خیلی حیاتی است."
❇️@data_hub_ir
#مصاحبه
#داده_کاوی
#هوش_مصنوعی
#تحلیل_داده
#یادگیری_ماشین
❇️در پنجمین سری از مصاحبه های دیتاهاب، سراغ مهندس عسکریان رفته و یکمصاحبهای با ایشون حول مباحث تحلیل داده داشتیم
ایشان معتقد هستند:
"قطعاً دانستن ریاضیات و بخصوص آمار تاثیر بسزایی در علم داده داره ولی سطح این دانش بستگی به پیچیدگی پروژهای داره که قراره انجام بدین. چون خیلی از کارهای تحلیل داده نیاز به دانش کم آماری و ریاضیات دارند و بسیار روتین هستند و کتابخانههای زیادی برای انجام آنها وجود داره. ولی گاهی پیچیدگی مساله نیاز به راه حل جدید یا ابتکار در استفاده از متدهای مختلف، یا نیاز به تنظیم تخصصی پارامترهای الگوریتمها داره که درک تخصصی از یادگیری ماشین و ریاضیات خیلی حیاتی است."
❇️@data_hub_ir
#مصاحبه
#داده_کاوی
#هوش_مصنوعی
#تحلیل_داده
#یادگیری_ماشین
ترسناک مثل GPT-3
اخیرا توی ارایه شریف مفصل در مورد transformer صحبت کردم و یه جا ی اشاره ریزی به مدل زبانی gpt کردم
الان می بینین که ب کمک gpt
چه کار جالبی انجام دادن و یک جمله دادن و ماشین به یه درک معنایی قوی از جمله دست پیدا کرده و به کمک یکسری تکنولوژی دیگه این تصاویر تولید کرده
از این دست مثالها در مورد gpt زیاده که اگر واقعی باشه نشون میده دنیا جای خطرناکی داره میشه و ماشینا به قدرت ادراک مجهز میشن
اخیرا توی ارایه شریف مفصل در مورد transformer صحبت کردم و یه جا ی اشاره ریزی به مدل زبانی gpt کردم
الان می بینین که ب کمک gpt
چه کار جالبی انجام دادن و یک جمله دادن و ماشین به یه درک معنایی قوی از جمله دست پیدا کرده و به کمک یکسری تکنولوژی دیگه این تصاویر تولید کرده
از این دست مثالها در مورد gpt زیاده که اگر واقعی باشه نشون میده دنیا جای خطرناکی داره میشه و ماشینا به قدرت ادراک مجهز میشن
درود
❇️بعضیا میگن BigBird یک انقلاب دیگه توی حوزه پردازش زبان طبیعی ایجاد میکنه. شرکت گوگل هنوز انقلاب قبلیش یعنی برت ته نشین نشده بود که BigBird معرفی کرده که هدف اصلیش مدیریت جملات خیلی طولانیه که اگه یادتون باشه برت هم خیلی خوب از پسشون برنمیاد. حالا باید منتظر موند و دید که واقعا انقلاب در راهه یا از این کودتاهای یک شبس …
لینک مقاله 👇🏻
https://towardsdatascience.com/understanding-bigbird-is-it-another-big-milestone-in-nlp-e7546b2c9643
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️بعضیا میگن BigBird یک انقلاب دیگه توی حوزه پردازش زبان طبیعی ایجاد میکنه. شرکت گوگل هنوز انقلاب قبلیش یعنی برت ته نشین نشده بود که BigBird معرفی کرده که هدف اصلیش مدیریت جملات خیلی طولانیه که اگه یادتون باشه برت هم خیلی خوب از پسشون برنمیاد. حالا باید منتظر موند و دید که واقعا انقلاب در راهه یا از این کودتاهای یک شبس …
لینک مقاله 👇🏻
https://towardsdatascience.com/understanding-bigbird-is-it-another-big-milestone-in-nlp-e7546b2c9643
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Towards Data Science
Understanding BigBird - Is It Another Big Milestone In NLP? | Towards Data Science
Google Researchers recently published a paper on arXiv noscriptd Big Bird: Transformers for Longer Sequences.
درود
❇️اگه میخواین با چندتا از ادمای نامبر وان حوزه پردازش زبان طبیعی اشنا بشین حداقل به عکسای توی این مقاله نگاه کنین.
لینک مقاله 👇🏻
https://medium.com/co-learning-lounge/natural-language-processing-nlp-heroes-3eaba1396867
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️اگه میخواین با چندتا از ادمای نامبر وان حوزه پردازش زبان طبیعی اشنا بشین حداقل به عکسای توی این مقاله نگاه کنین.
لینک مقاله 👇🏻
https://medium.com/co-learning-lounge/natural-language-processing-nlp-heroes-3eaba1396867
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Medium
Natural Language Processing(NLP) Heroes
List of Researchers and Innovators in the NLP who made a shift
درود
استارت یک کانال زدیم که تمرکز اصلیش معرفی انواع دیتاستهای فارسی هست که از منابع مختلف جمعاوری میشه
تلاش میشه که فقط دادههای مفید همراه با توضیحات درج بشند
خلاصه همراهی و حمایتتونو احتیاج داریم...
@persian_data
استارت یک کانال زدیم که تمرکز اصلیش معرفی انواع دیتاستهای فارسی هست که از منابع مختلف جمعاوری میشه
تلاش میشه که فقط دادههای مفید همراه با توضیحات درج بشند
خلاصه همراهی و حمایتتونو احتیاج داریم...
@persian_data
Forwarded from مرجع دیتاست فارسی
دیتاست برای تشخیص زبان متن
🗃 نوع: #متن
📮 اندازه: 12.39 MB
📖 توضیحات: این دیتاست شامل ۲۳۵۰۰۰ پاراگراف از ۲۳۵ زبان است که هر برای هر زبان هزار پاراگراف وجود دارد.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/zarajamshaid/language-identification-datasst
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📮 اندازه: 12.39 MB
📖 توضیحات: این دیتاست شامل ۲۳۵۰۰۰ پاراگراف از ۲۳۵ زبان است که هر برای هر زبان هزار پاراگراف وجود دارد.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/zarajamshaid/language-identification-datasst
لطفا به اشتراک بگذارید👈🏻@persian_data
Kaggle
Language Identification dataset
This data is extract from WiLi-2018 wikipedia dataset
Forwarded from مرجع دیتاست فارسی
غلط های املایی
🗃 نوع: #متن
📮 اندازه: 146.42 KB
📖 توضیحات:
این مجموعه داده شامل ۵۰۵۰ جفت کلمه فارسی است که ستون اول یک کلمه غلط املایی و ستون دوم شکل صحیح آن کلمه است. از این مجموعه داده در مباحث نرمالسازی میتوان استفاده کرد.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/rtatman/faspell
لطفا به اشتراک بگذارید👈🏻@persian_data
🗃 نوع: #متن
📮 اندازه: 146.42 KB
📖 توضیحات:
این مجموعه داده شامل ۵۰۵۰ جفت کلمه فارسی است که ستون اول یک کلمه غلط املایی و ستون دوم شکل صحیح آن کلمه است. از این مجموعه داده در مباحث نرمالسازی میتوان استفاده کرد.
📤 برای دریافت داده و کسب اطلاعات بیشتر به لینک زیر مراجعه کنید. 👇👇
https://www.kaggle.com/rtatman/faspell
لطفا به اشتراک بگذارید👈🏻@persian_data
Kaggle
FAspell
Naturally-occurring Persian (Farsi) spelling mistakes
درود
❇️حالا درسته الان بورس اوضاع خوبی نداره ولی دلیل نمیشه یک کار ترکیبی و جذاب از کاربرد پردازش زبان طبیعی واسه تحلیل بورس نخونیم.
لینک مقاله 👇🏻
https://towardsdatascience.com/nlp-in-the-stock-market-8760d062eb92
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️حالا درسته الان بورس اوضاع خوبی نداره ولی دلیل نمیشه یک کار ترکیبی و جذاب از کاربرد پردازش زبان طبیعی واسه تحلیل بورس نخونیم.
لینک مقاله 👇🏻
https://towardsdatascience.com/nlp-in-the-stock-market-8760d062eb92
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Medium
NLP in the Stock Market
Leveraging sentiment analysis on 10-k fillings as an edge
درود
❇️اگه دوست دارین با برت روی متون غیر انگیلیسی مثل فارسی کار کنین پس باید از نسخههای multilingual استفاده کنین که در ادامه یک مقاله معرفی میکنم که کامل این موارد اموزش میده.
لینک مقاله 👇🏻
https://towardsdatascience.com/why-is-training-data-the-bottleneck-for-nlp-a-multilingual-bert-example-44b86c11f5a
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️اگه دوست دارین با برت روی متون غیر انگیلیسی مثل فارسی کار کنین پس باید از نسخههای multilingual استفاده کنین که در ادامه یک مقاله معرفی میکنم که کامل این موارد اموزش میده.
لینک مقاله 👇🏻
https://towardsdatascience.com/why-is-training-data-the-bottleneck-for-nlp-a-multilingual-bert-example-44b86c11f5a
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Medium
Why is training data the bottleneck for NLP? A multilingual BERT example.
Transfer learning have been changing the paradigm in NLP field but its robustness in terms of wider range of applications is still limited.
درود
❇️اگه میخواین توی ده دقیقه یه چت بات پیاده سازی کنین این پستو از دست ندین.
لینک مقاله 👇🏻
https://towardsdatascience.com/making-a-simple-and-fast-chatbot-in-10-minutes-2d84a4ba35e
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️اگه میخواین توی ده دقیقه یه چت بات پیاده سازی کنین این پستو از دست ندین.
لینک مقاله 👇🏻
https://towardsdatascience.com/making-a-simple-and-fast-chatbot-in-10-minutes-2d84a4ba35e
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
درود
❇️یکی از حوزههای جذاب در پردازش زبان طبیعی تاپیک مدلینگ یا تشخیص موضوع متون است. روشهای مختلفی برای انجام این کار هست مثل استفاده از LSA ولی توی یک مقاله جذاب یک روش جدید و بهینه بررسی شده و از برت برای تاپیک مدلینگ استفاده شده است.
لینک مقاله 👇🏻
https://towardsdatascience.com/topic-modeling-with-bert-779f7db187e6
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️یکی از حوزههای جذاب در پردازش زبان طبیعی تاپیک مدلینگ یا تشخیص موضوع متون است. روشهای مختلفی برای انجام این کار هست مثل استفاده از LSA ولی توی یک مقاله جذاب یک روش جدید و بهینه بررسی شده و از برت برای تاپیک مدلینگ استفاده شده است.
لینک مقاله 👇🏻
https://towardsdatascience.com/topic-modeling-with-bert-779f7db187e6
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
درود
❇️الان قراره بهتون تقلب برسونم و چندتا از مهمترین سوالاتی که واسه مصاحبه شغلی مربوط به پردازش زبان طبیعی پرسیده میشه بهتون بگم البته من نه، منظورم نویسنده مقالس.
لینک مقاله 👇🏻
https://medium.com/modern-nlp/nlp-interview-questions-f062040f32f7
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️الان قراره بهتون تقلب برسونم و چندتا از مهمترین سوالاتی که واسه مصاحبه شغلی مربوط به پردازش زبان طبیعی پرسیده میشه بهتون بگم البته من نه، منظورم نویسنده مقالس.
لینک مقاله 👇🏻
https://medium.com/modern-nlp/nlp-interview-questions-f062040f32f7
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Medium
NLP Interview Questions 🚀
Questions asked for NLP roles
numpy-part1.pdf
204.6 KB
درود دوستان عزیز:
❇️در این بخش به معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین می پردازیم.
❇️نامپای یکی از کتابخانه های موجود در پایتون است که کاربرد اصلی آن برای مقاصد علمی و کار با اعداد است. این ماژول دارای توابع آرایه ای ریاضیات و آمار می باشد. به عبارتی می توان گفت نامپای برای کار با اعداد از راه ماتریس و آرایه های چندبعدی مورد استفاده قرار می گیرد. به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد. در بخش اول به نحوه نصب، ایجاد آرایه، انواع داده، متدهای مورد استفاده برای آرایه ها، indexing ،slicing ، Broadcasting، iterating پرداخته شده است.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
❇️در این بخش به معرفی یکی از پکیج های معروف در حوزه علم داده و یادگیری ماشین می پردازیم.
❇️نامپای یکی از کتابخانه های موجود در پایتون است که کاربرد اصلی آن برای مقاصد علمی و کار با اعداد است. این ماژول دارای توابع آرایه ای ریاضیات و آمار می باشد. به عبارتی می توان گفت نامپای برای کار با اعداد از راه ماتریس و آرایه های چندبعدی مورد استفاده قرار می گیرد. به همین منظور در این مقاله سعی شده است این پکیج در بخش های جداگانه مورد بررسی قرار بگیرد. در بخش اول به نحوه نصب، ایجاد آرایه، انواع داده، متدهای مورد استفاده برای آرایه ها، indexing ،slicing ، Broadcasting، iterating پرداخته شده است.
❇️@data_hub_ir
#یادگیری_ماشین
#تحلیل_داده #هوش_مصنوعی
#پایتون
منتشر شد...
❇️@data_hub_ir
🔹تعریف مهندسیداده
🔹بررسی تفاوت مهندس داده و دانشمند داده
🔹بررسی جامع نقشهراه یادگیری مهندسیداده
🔹نحوه پیدا کردن فرصتهای شغلی این حوزه
🔹چگونگی انجام یک مصاحبه خوب
🔹بررسی حقوق و درامد مهندس داده در ایران
🔹بررسی چگونگی انجام پروژههای خارجی
❇️@data_hub_ir
#مصاحبه
#مهندسی_داده
❇️@data_hub_ir
🔹تعریف مهندسیداده
🔹بررسی تفاوت مهندس داده و دانشمند داده
🔹بررسی جامع نقشهراه یادگیری مهندسیداده
🔹نحوه پیدا کردن فرصتهای شغلی این حوزه
🔹چگونگی انجام یک مصاحبه خوب
🔹بررسی حقوق و درامد مهندس داده در ایران
🔹بررسی چگونگی انجام پروژههای خارجی
❇️@data_hub_ir
#مصاحبه
#مهندسی_داده
@data_hub_ir
@data_jobs
مهندسداده_سلام
❇️یکی از حوزههای نسبتا جدید و پردرآمد فعلی، مهندسی داده است. این فیلد شغلی هنوز به خوبی معرفی نشده است. در این پادکست تلاش کردیم با استفاده از تجربیات مهندس بنائی عزیز موسس و مدیر سایت bigdata.ir یک گفتگوی سازنده حول موارد زیر داشته باشیم:
🔹تعریف مهندسیداده
🔹بررسی تفاوت مهندس داده و دانشمند داده
🔹بررسی جامع نقشهراه یادگیری مهندسیداده
🔹نحوه پیدا کردن فرصتهای شغلی این حوزه
🔹چگونگی انجام یک مصاحبه خوب
🔹بررسی حقوق و درامد مهندس داده در ایران
🔹بررسی چگونگی انجام پروژههای خارجی
❇️@data_hub_ir
#مصاحبه
#مهندسی_داده
❇️یکی از حوزههای نسبتا جدید و پردرآمد فعلی، مهندسی داده است. این فیلد شغلی هنوز به خوبی معرفی نشده است. در این پادکست تلاش کردیم با استفاده از تجربیات مهندس بنائی عزیز موسس و مدیر سایت bigdata.ir یک گفتگوی سازنده حول موارد زیر داشته باشیم:
🔹تعریف مهندسیداده
🔹بررسی تفاوت مهندس داده و دانشمند داده
🔹بررسی جامع نقشهراه یادگیری مهندسیداده
🔹نحوه پیدا کردن فرصتهای شغلی این حوزه
🔹چگونگی انجام یک مصاحبه خوب
🔹بررسی حقوق و درامد مهندس داده در ایران
🔹بررسی چگونگی انجام پروژههای خارجی
❇️@data_hub_ir
#مصاحبه
#مهندسی_داده
درود
❇️ده تا مفهوم کلیدی آماری که معمولا توی مصاحبهها سوال میشه در قالب یک پست به زبون ساده گفته شده که خوندنش حتما توصیه میشه.
لینک مقاله 👇🏻
https://towardsdatascience.com/10-statistical-concepts-you-should-know-for-data-science-interviews-373f417e7d11
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
❇️ده تا مفهوم کلیدی آماری که معمولا توی مصاحبهها سوال میشه در قالب یک پست به زبون ساده گفته شده که خوندنش حتما توصیه میشه.
لینک مقاله 👇🏻
https://towardsdatascience.com/10-statistical-concepts-you-should-know-for-data-science-interviews-373f417e7d11
❇️@data_hub_ir
#مقاله
#مقاله_آموزشی
Medium
10 Statistical Concepts You Should Know For Data Science Interviews
Study smart, not hard.