انجمن علم داده‌ها – Telegram
انجمن علم داده‌ها
199 subscribers
28 photos
2 videos
11 files
15 links
🔹️کانال ترویج، آموزش و اطلاع‌رسانی علم داده‌ها

🔹️ارتباط و ارائه پیشنهادات:
@Sajedeh_Lashgari
Download Telegram
یه تعریف کلی و ساده، از دیتاساینس و یه نقشه راه کلی، برای یادگیری #دانش اون!
تو این اینفوگرافی، مهم‌ترین مباحثی که باید تو این مسیر یاد بگیریم، اومده.
در ادامه تلاش می‌کنیم، بیشتر راجع‌بهشون صحبت کنیم.

سلسله پست‌های #مطالب_آموزشی
#دانش #دانشمند_داده

@Data_Science_Association
👍64
فهم فرایند پروژه دیتاساینس با مدل CRISP-DM

CRISP-DM (The CRoss Industry Standard Process for Data Mining)

سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
👍9
توی این پست‌ و پست‌های قبلش، راجع‌به چیستی علم داده‌ها صحبت کردیم و گفتیم که هدف نهاییش "استخراج دانش از داده‌ها" است (پس حالا می‌تونیم تفاوت و شباهتش رو با علوم مختلفی مثل آمار، هوش‌مصنوعی و علوم کامپیوتر درک کنیم، در پست‌های آتی سعی می‌کنیم از این دید، این مسئله رو هم بررسی کنیم)!
به علاوه، توی این پست، pipeline و جریان کار end to end ِ یک پروژه دیتاساینس برامون مشخص شد که به طور خلاصه یعنی، "مشکل را شناسایی و با طرح و آزمایشِ راه‌حل مناسب، آن را حل کنید"!
 در واقع، این تعریف به زبان ساده، مفهومِ چگونگی انجام فعالیتِ دیتاساینس رو بهمون میگه، که تبدیلِ هر مولفه از این تعریف، به قسمت قابل اجرا برای انجام کار، به خودیِ خود به عنوان یه مبحث عمیق، قابل بررسی است..
حالا می‌خواهیم راجع‌به "علم داده‌ها در صنعت" صحبت کنیم.
به طور کلی میشه گفت، هدف علم داده‌ها اجرا نیست، بلکه یادگیری و توسعه قابلیت‌های تجاریِ جدید است. هیچ طرح و برنامه مشخصی وجود نداره و قابلیت‌های جدید با عدم قطعیت ذاتی همراه هستند، پس باید از طریق آزمون و خطا و تکرار آموخته شوند!
بنابراین بهتر است که نقش‌های یک پروژه علم داده، کلی‌تر در نظر گرفته شوند و کمتر روی مسئولیت‌های فنی متمرکز باشند. به جای آن، نقش‌ها برای یادگیری بهینه شوند. به طور خلاصه می‌تونیم بگیم که مهم‌ترین مهارت دانشمند داده، داشتن درک عمیق از مفهوم‌سازی، مدل‌سازی، پیاده‌سازی و اندازه‌گیری است.

در ادامه، به بررسی کامل‌تری از مهارت‌های یک دانشمند داده می‌پردازیم.

سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و #ترویج #دانش و #مهارت
#دانشمند_داده

@Data_Science_Association
👏9
شرکت آمارگستران نیکوپرداز الوند با همکاری دانشگاه
بوعلی سینا برگزار می‌کند:

«دومین رویداد بین‌المللی بازی با داده‌های واقعی»

❄️❄️ اسفند ماه ۱۴۰۱ ❄️❄️

📊📈 تجربه تحلیل داده‌ها در زمینه‌های:
🔵مصرف آب
🟢بیمه سلامت
🔴حمل و نقل

📆 زمانبندی رویداد:
مهلت ثبت نام تا ۹ اسفند
وبینار افتتاحیه ۱۰ اسفند
تشکیل تیم و دریافت داده‌ها ۱۰ و ۱۱ اسفند
انجام مسابقه و ارسال نتایج ۱۰ تا ۱۷ اسفند
اعلام نتایج مسابقه ۲۲ اسفند

🎁 جوایز برندگان:
تیم اول ۷۰ میلیون ریال
تیم دوم ۵۰ میلیون ریال
تیم سوم ۳۰ میلیون ریال

لینک ثبت نام:
https://agna-co.ir/playdata2/

برای دریافت راهنمایی‌ مراحل ثبت نام و سایر درخواست‌ها با ما در ارتباط باشید:

☎️ 08138257022
📧 agna_comp@agna-co.ir
🌐 agna-co.ir
اینستاگرام:
@agna_co_2022
تلگرام:
@agna_co
لینک گروه تلگرام آگنا:
https://news.1rj.ru/str/+w4HQFrf-s8ViMTE0
👍8
رشته‌های ارشد ۱۴۰۲.pdf
14.5 MB
دفترچه انتخاب رشته کارشناسی ارشد سال ۱۴۰۲

بیش از ۸۵ موقعیت پذیرش کارشناسی ارشد علم داده‌ها!

@Data_Science_Association
انجمن علم داده‌ها
رشته‌های ارشد ۱۴۰۲.pdf
مایه خوشحالی است یا تعجب یا حتی تاسف!؟

بگذارید علاوه بر اطلاع‌رسانی و آموزش، کمی هم از تاریخچه و چرایی بگوییم..
شاید در آگاهی و انتخابمان اثرگذار باشد و به این نحو، این کانال بتواند مفید باشد!

شروع رسمیِ ارائه رشته علم داده‌ها (به عنوان رشته‌ای بین‌رشته‌ای، حداقل در مرحله اول و پذیرش مسئله) سال ۹۸ بود،
به خاطر دارم که در آن زمان، تنها یک دانشگاه، آن را ارائه کرده بود..
حال حدود ۴ سال، از آن ماجرا گذشته و انتظار می‌رود که اکنون اکوسیستم دیتاساینس تا حد خوبی در ایران شکل گرفته باشد..
شکل‌گیری رشته علم داده‌ها با پذیرش ۴ دانشجو، همراه بود اما امسال تنها در بخش روزانه، حدود ۸۵ موقعیت تحصیلی در مجموعه آمار در دانشگاه‌های بسیار مختلفی تعریف شده است (البته سال گذشته هم، تقریبا شرایط مشابهی وجود داشت)!
به علاوه چند موقعیت در مجموعه‌های دیگر (به نظر می‌رسد این موضوع، تا حدی با بین‌رشته‌ای تعریف شدن رشته نیز در تناقض است! 🤔) ...

افزایش تعداد پذیرش دانشجو و دانشگاه هم به نوبه خود، یک پيشرفت قابل توجه است! :)
اما به نظرم کمی تمرکز روی اکوسیستم هم می‌تواند خوب و بسیار ضروری (حتی ضروری‌تر از مورد قبل) باشد..

با توجه به شرایط اکوسیستم فعلی در ایران، به نظرم سوالاتی در اینجا قابل تامل است:
- آیا به این تعداد نیروی متخصص، در این زمینه نیاز است؟
- به نیروهای متخصص دقیقا در کدام بخش‌ها نیاز است؟ و به چه تعداد؟
- دانشگاه، در حال تربیت دانشجویان در کدام بخش است؟ آموزش (!!!) پژوهش (!) یا صنعت (!!)؟
- آیا صنعت به چنین بلوغی رسیده که بتواند دیتاساینس را به کار گیرد؟
- آیا میزان آشناییِ تصمیم‌گیران، از دیتاساینس و فعالیت‌های داده‌محور، کافی است و نیاز واقعی به آن را احساس می‌کنند؟
- به کارگیری دیتاساینس در بخش‌های مختلف به چه زیرساخت‌ها و پیش‌نیازهایی نیاز دارد؟
- آیا روند طی‌شده برای تربیت دانشمندان داده، نیازی به بازبینی و اشکال‌زدایی ندارد؟
- آیا شرایط فعلی و زیرساخت‌های سه بخش بیان‌شده، برای تربیت متخصصان این رشته مناسب است؟
- آیا علم داده‌ها، رشته‌ای بین‌رشته‌ای است؟!

این سوالات در بسیاری از رشته‌ها، قابل توجه است اما در ابتدای کارِ چنین رشته‌ای که در آینده بسیااار موثر و ضروری خواهد بود، بسیار بیش از این، به بررسی و بازاندیشی و انتخاب استراتژی مناسب نیاز است.
به علاوه، به دلیل ابتدای مسیر بودن، تغییر جهت راحت‌تر و امید بیشتر است..! :)

قطعا استقبال و نحوه مواجهه ما با هر مسئله‌ای، در جهت‌دهی به آن تاثیرگذار است..

@Data_Science_Association
👍64
برای یادگیری
DSA (Data Structure and Algorithm)
چه جوری اقدام کنیم؟
مطالب مهم برای یادگیری ساختمان داده و الگوریتم

سلسله پست‌های #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
Data Visualization with ggplot2.pdf
1.6 MB
یکی از بخش‌های مهم و اصلیِ کار با داده‌ها، مصورسازیِ اون‌هاست!
کتابخونه ggplot2، یکی از ابزارهای خوب مصورسازیه، که در نرم‌افزار R قرار داره..
این فایل یه cheat sheet خوب (!:دی) و جامع، از کدهای متداولِ این ابزاره!

سلسله پست‌های #مطالب_آموزشی #مهارت #دانشمند_داده

@Data_Science_Association
8
به اهمیت مصورسازی داده‌ها که اشاره کرده بودیم. حالا می‌خواهیم دو تا از نرم‌افزارهای قدرتمند و معروف، توی این زمینه رو بهتون معرفی کنیم:
Tableau و Power BI!

این سوال، همیشه پیش میاد که کدوم یک از این‌ها بهتر هستند و باید کدوم رو برای یادگیری، انتخاب کنیم.
مسلما هر کدوم از این‌ها، معایب و مزایایی دارند که موقع انتخاب نرم‌افزارِ مناسب برای کار، باید بهشون توجه کنیم و متناسب با نیاز و هدفمون، دست به انتخاب بزنیم. توی این تصویر، به برخی از این نکات به خوبی اشاره شده است.

سلسله پست‌های #مطالب_آموزشی
#مهارت #دانشمند_داده

@Data_Science_Association
This media is not supported in your browser
VIEW IN TELEGRAM
بدون آمار، شفافیت، تحلیل و داده‌ چه پیشرفتی در انتظار است؟!

روح استاد گرامی ماه‌بانو تاتا در آرامش باد
@Data_Science_Association
13
مهارت‌های مهم دانشمند داده (بر اساس اطلاعات لینکدین) و تفاوت آن با تحلیلگر داده و مهندس داده

#مهارت
#دانشمند_داده

@Data_Science_Association
End-to-End Machine Learning Workflow

مشکل را شناسایی کنید،
راه‌حلی طراحی کنید،
آن را پیاده‌سازی کنید،
نتایج را بسنجید
و مشکل را حل کنید!


سلسله پست‌های آشنایی با اصطلاحات رایج، #مطالب_آموزشی و ترویج #دانش
#دانشمند_داده

@Data_Science_Association
This media is not supported in your browser
VIEW IN TELEGRAM
تغییرات ابزارهای تحلیل داده، از سال 2000 تا 2019!
روند 2023 تا 2026 رو چه جوری پیش‌بینی می‌کنید؟

#مهارت
#دانشمند_داده

@Data_Science_Association
👍10
2012.00174v2.pdf
171.1 KB
"مهمترین ایده‌های آماری در 50 سال گذشته"!

میزان مشارکت علم آمار در حوزه علم داده‌ها، در این مقاله مورد بحث و بررسی قرار گرفته است.


لینک: https://arxiv.org/pdf/2012.00174v2.pdf



سلسله پست‌های #مطالب_آموزشی و #ترویج #دانش
#دانشمند_داده

@Data_Science_Association
👍9