انجمن علم داده‌ها – Telegram
انجمن علم داده‌ها
199 subscribers
28 photos
2 videos
11 files
15 links
🔹️کانال ترویج، آموزش و اطلاع‌رسانی علم داده‌ها

🔹️ارتباط و ارائه پیشنهادات:
@Sajedeh_Lashgari
Download Telegram
فهم فرایند پروژه دیتاساینس با مدل CRISP-DM

CRISP-DM (The CRoss Industry Standard Process for Data Mining)

سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
👍9
توی این پست‌ و پست‌های قبلش، راجع‌به چیستی علم داده‌ها صحبت کردیم و گفتیم که هدف نهاییش "استخراج دانش از داده‌ها" است (پس حالا می‌تونیم تفاوت و شباهتش رو با علوم مختلفی مثل آمار، هوش‌مصنوعی و علوم کامپیوتر درک کنیم، در پست‌های آتی سعی می‌کنیم از این دید، این مسئله رو هم بررسی کنیم)!
به علاوه، توی این پست، pipeline و جریان کار end to end ِ یک پروژه دیتاساینس برامون مشخص شد که به طور خلاصه یعنی، "مشکل را شناسایی و با طرح و آزمایشِ راه‌حل مناسب، آن را حل کنید"!
 در واقع، این تعریف به زبان ساده، مفهومِ چگونگی انجام فعالیتِ دیتاساینس رو بهمون میگه، که تبدیلِ هر مولفه از این تعریف، به قسمت قابل اجرا برای انجام کار، به خودیِ خود به عنوان یه مبحث عمیق، قابل بررسی است..
حالا می‌خواهیم راجع‌به "علم داده‌ها در صنعت" صحبت کنیم.
به طور کلی میشه گفت، هدف علم داده‌ها اجرا نیست، بلکه یادگیری و توسعه قابلیت‌های تجاریِ جدید است. هیچ طرح و برنامه مشخصی وجود نداره و قابلیت‌های جدید با عدم قطعیت ذاتی همراه هستند، پس باید از طریق آزمون و خطا و تکرار آموخته شوند!
بنابراین بهتر است که نقش‌های یک پروژه علم داده، کلی‌تر در نظر گرفته شوند و کمتر روی مسئولیت‌های فنی متمرکز باشند. به جای آن، نقش‌ها برای یادگیری بهینه شوند. به طور خلاصه می‌تونیم بگیم که مهم‌ترین مهارت دانشمند داده، داشتن درک عمیق از مفهوم‌سازی، مدل‌سازی، پیاده‌سازی و اندازه‌گیری است.

در ادامه، به بررسی کامل‌تری از مهارت‌های یک دانشمند داده می‌پردازیم.

سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و #ترویج #دانش و #مهارت
#دانشمند_داده

@Data_Science_Association
👏9
شرکت آمارگستران نیکوپرداز الوند با همکاری دانشگاه
بوعلی سینا برگزار می‌کند:

«دومین رویداد بین‌المللی بازی با داده‌های واقعی»

❄️❄️ اسفند ماه ۱۴۰۱ ❄️❄️

📊📈 تجربه تحلیل داده‌ها در زمینه‌های:
🔵مصرف آب
🟢بیمه سلامت
🔴حمل و نقل

📆 زمانبندی رویداد:
مهلت ثبت نام تا ۹ اسفند
وبینار افتتاحیه ۱۰ اسفند
تشکیل تیم و دریافت داده‌ها ۱۰ و ۱۱ اسفند
انجام مسابقه و ارسال نتایج ۱۰ تا ۱۷ اسفند
اعلام نتایج مسابقه ۲۲ اسفند

🎁 جوایز برندگان:
تیم اول ۷۰ میلیون ریال
تیم دوم ۵۰ میلیون ریال
تیم سوم ۳۰ میلیون ریال

لینک ثبت نام:
https://agna-co.ir/playdata2/

برای دریافت راهنمایی‌ مراحل ثبت نام و سایر درخواست‌ها با ما در ارتباط باشید:

☎️ 08138257022
📧 agna_comp@agna-co.ir
🌐 agna-co.ir
اینستاگرام:
@agna_co_2022
تلگرام:
@agna_co
لینک گروه تلگرام آگنا:
https://news.1rj.ru/str/+w4HQFrf-s8ViMTE0
👍8
رشته‌های ارشد ۱۴۰۲.pdf
14.5 MB
دفترچه انتخاب رشته کارشناسی ارشد سال ۱۴۰۲

بیش از ۸۵ موقعیت پذیرش کارشناسی ارشد علم داده‌ها!

@Data_Science_Association
انجمن علم داده‌ها
رشته‌های ارشد ۱۴۰۲.pdf
مایه خوشحالی است یا تعجب یا حتی تاسف!؟

بگذارید علاوه بر اطلاع‌رسانی و آموزش، کمی هم از تاریخچه و چرایی بگوییم..
شاید در آگاهی و انتخابمان اثرگذار باشد و به این نحو، این کانال بتواند مفید باشد!

شروع رسمیِ ارائه رشته علم داده‌ها (به عنوان رشته‌ای بین‌رشته‌ای، حداقل در مرحله اول و پذیرش مسئله) سال ۹۸ بود،
به خاطر دارم که در آن زمان، تنها یک دانشگاه، آن را ارائه کرده بود..
حال حدود ۴ سال، از آن ماجرا گذشته و انتظار می‌رود که اکنون اکوسیستم دیتاساینس تا حد خوبی در ایران شکل گرفته باشد..
شکل‌گیری رشته علم داده‌ها با پذیرش ۴ دانشجو، همراه بود اما امسال تنها در بخش روزانه، حدود ۸۵ موقعیت تحصیلی در مجموعه آمار در دانشگاه‌های بسیار مختلفی تعریف شده است (البته سال گذشته هم، تقریبا شرایط مشابهی وجود داشت)!
به علاوه چند موقعیت در مجموعه‌های دیگر (به نظر می‌رسد این موضوع، تا حدی با بین‌رشته‌ای تعریف شدن رشته نیز در تناقض است! 🤔) ...

افزایش تعداد پذیرش دانشجو و دانشگاه هم به نوبه خود، یک پيشرفت قابل توجه است! :)
اما به نظرم کمی تمرکز روی اکوسیستم هم می‌تواند خوب و بسیار ضروری (حتی ضروری‌تر از مورد قبل) باشد..

با توجه به شرایط اکوسیستم فعلی در ایران، به نظرم سوالاتی در اینجا قابل تامل است:
- آیا به این تعداد نیروی متخصص، در این زمینه نیاز است؟
- به نیروهای متخصص دقیقا در کدام بخش‌ها نیاز است؟ و به چه تعداد؟
- دانشگاه، در حال تربیت دانشجویان در کدام بخش است؟ آموزش (!!!) پژوهش (!) یا صنعت (!!)؟
- آیا صنعت به چنین بلوغی رسیده که بتواند دیتاساینس را به کار گیرد؟
- آیا میزان آشناییِ تصمیم‌گیران، از دیتاساینس و فعالیت‌های داده‌محور، کافی است و نیاز واقعی به آن را احساس می‌کنند؟
- به کارگیری دیتاساینس در بخش‌های مختلف به چه زیرساخت‌ها و پیش‌نیازهایی نیاز دارد؟
- آیا روند طی‌شده برای تربیت دانشمندان داده، نیازی به بازبینی و اشکال‌زدایی ندارد؟
- آیا شرایط فعلی و زیرساخت‌های سه بخش بیان‌شده، برای تربیت متخصصان این رشته مناسب است؟
- آیا علم داده‌ها، رشته‌ای بین‌رشته‌ای است؟!

این سوالات در بسیاری از رشته‌ها، قابل توجه است اما در ابتدای کارِ چنین رشته‌ای که در آینده بسیااار موثر و ضروری خواهد بود، بسیار بیش از این، به بررسی و بازاندیشی و انتخاب استراتژی مناسب نیاز است.
به علاوه، به دلیل ابتدای مسیر بودن، تغییر جهت راحت‌تر و امید بیشتر است..! :)

قطعا استقبال و نحوه مواجهه ما با هر مسئله‌ای، در جهت‌دهی به آن تاثیرگذار است..

@Data_Science_Association
👍64
برای یادگیری
DSA (Data Structure and Algorithm)
چه جوری اقدام کنیم؟
مطالب مهم برای یادگیری ساختمان داده و الگوریتم

سلسله پست‌های #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
Data Visualization with ggplot2.pdf
1.6 MB
یکی از بخش‌های مهم و اصلیِ کار با داده‌ها، مصورسازیِ اون‌هاست!
کتابخونه ggplot2، یکی از ابزارهای خوب مصورسازیه، که در نرم‌افزار R قرار داره..
این فایل یه cheat sheet خوب (!:دی) و جامع، از کدهای متداولِ این ابزاره!

سلسله پست‌های #مطالب_آموزشی #مهارت #دانشمند_داده

@Data_Science_Association
8
به اهمیت مصورسازی داده‌ها که اشاره کرده بودیم. حالا می‌خواهیم دو تا از نرم‌افزارهای قدرتمند و معروف، توی این زمینه رو بهتون معرفی کنیم:
Tableau و Power BI!

این سوال، همیشه پیش میاد که کدوم یک از این‌ها بهتر هستند و باید کدوم رو برای یادگیری، انتخاب کنیم.
مسلما هر کدوم از این‌ها، معایب و مزایایی دارند که موقع انتخاب نرم‌افزارِ مناسب برای کار، باید بهشون توجه کنیم و متناسب با نیاز و هدفمون، دست به انتخاب بزنیم. توی این تصویر، به برخی از این نکات به خوبی اشاره شده است.

سلسله پست‌های #مطالب_آموزشی
#مهارت #دانشمند_داده

@Data_Science_Association
This media is not supported in your browser
VIEW IN TELEGRAM
بدون آمار، شفافیت، تحلیل و داده‌ چه پیشرفتی در انتظار است؟!

روح استاد گرامی ماه‌بانو تاتا در آرامش باد
@Data_Science_Association
13
مهارت‌های مهم دانشمند داده (بر اساس اطلاعات لینکدین) و تفاوت آن با تحلیلگر داده و مهندس داده

#مهارت
#دانشمند_داده

@Data_Science_Association
End-to-End Machine Learning Workflow

مشکل را شناسایی کنید،
راه‌حلی طراحی کنید،
آن را پیاده‌سازی کنید،
نتایج را بسنجید
و مشکل را حل کنید!


سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و ترویج #دانش
#دانشمند_داده

@Data_Science_Association
This media is not supported in your browser
VIEW IN TELEGRAM
تغییرات ابزارهای تحلیل داده، از سال 2000 تا 2019!
روند 2023 تا 2026 رو چه جوری پیش‌بینی می‌کنید؟

#مهارت
#دانشمند_داده

@Data_Science_Association
👍10
2012.00174v2.pdf
171.1 KB
"مهمترین ایده‌های آماری در 50 سال گذشته"!

میزان مشارکت علم آمار در حوزه علم داده‌ها، در این مقاله مورد بحث و بررسی قرار گرفته است.


لینک: https://arxiv.org/pdf/2012.00174v2.pdf



سلسله پست‌های #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
👍9
#باورهای_رایج_اشتباه
قسمت ۱

+ علم داده‌ها/دیتاساینس، همون هوش مصنوعیه!
+ علم داده‌ها، همون آماره!
+ علم داده‌ها!! بگو همون (علوم/مهندسی) کامپیوتر دیگه!!
+ آمار/کامپیوتر/هوش مصنوعی خوندی! پس علم داده‌ها بلدی!!!

برای رفع ابهام، شاید لازم باشه که عمیق‌تر راجع‌به تعریف علم داده‌ها و برخی از مولفه‌های اون فکر کنیم!

"علم داده‌ها، یک تخصص بین رشته‌ایه که ترکیبی از آمار، علوم کامپیوتر، ریاضی و دانش زمینه‌ای است!"

بیاید در ادامه، راجع‌به ارتباط این موارد و جایگاه هر کدوم در این زمینه صحبت کنیم!

- آمار: علمی مبتنی بر استنباط و تفسیر داده‌ها و نتایج،

- علوم کامپیوتر: علمی مبتنی بر توسعه الگوریتم، نرم‌افزار و سیستم‌های کامپیوتری،

- هوش مصنوعی: علمی مبتنی بر ساخت سیستم‌های دقیق و هوشمند مانند انسان، با استفاده از داده‌ها و مدل‌های پیش‌بینی‌کننده،

- علم‌داده‌ها: علمی مبتنی بر استخراج دانش و بینش‌های مفید از داده‌هاست.
این دانش بسته به مسئله مورد نظر، شامل استنباط و تفسیر یا پیش‌بینی یا هر دوی این‌هاست!

ادامه، در پست بعدی..!

سلسله پست‌های باورهای رایج اشتباه، #مطالب_آموزشی #دانشمند_داده

@Data_Science_Association
👍121