Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
Data Skills for Digital Era.pdf
2.6 MB
ارائه مفید مهارت‌های داده‌ای در عصر دیجیتال!

در ارائه فوق که توسط استاد محمدرضا محتاط ارائه گردیده، مهارت‌های مورد نیاز جهت تبدیل شدن به متخصص‌‌ حوزه‌های زیر به تفکیک ذکر گردیده است.

1- علم‌داده
2- هوش تجاری
3- کلان‌داده
4- مهندس داده

@SyThinking | تفکرسیستمی
ولادت هشتمین اختر تابناک آسمان امامت و ولایت، حضرت امام رضا (علیه السلام) مبارک‌باد.
کتاب Data Science انتشارات MIT Press

در کتاب Data Science انتشارات MIT Press که در سال 2018 انتشاریافته، مفاهیم پایه و کلیدی حوزه علم‌داده با رویکرد مدیریتی فنی شرح داده شده است. سرفصل‌های این کتاب به شرح ذیل می‌باشد.

▪️What Is Data Science?

▪️What Are Data, and What Is a Data Set?

▪️A Data Science Ecosystem

▪️Machine Learning

▪️Standard Data Science Tasks

▪️Privacy and Ethics

▪️Future Trends and Principles of Success

مطالعه این کتاب ارزشمند رو به تمامی متخصصین علم‌داده پیشنهاد می‌نمایم.

@DataAnalysis
Data Science - MIT Press.pdf
1.9 MB
کتاب Data Science انتشارات MIT Press

@DataAnalysis
ایرانی که هوشمند نبود!

همایش "ایران هوشمند" با حضور رئیس‌جمهور محترم، وزیر ارتباطات و فناوری اطلاعات، وزیر اطلاعات، دبیر شورای عالی فضای مجازی، تنی چند از نمایندگان مجلس شورای اسلامی و با محوریت ایران دیجیتال در سالن همایش‌های اجلاس سران برگزار شد.

به نظر می‌رسید با توجه به‌عنوان همایش، نوآوری و هوشمندی یکی از پایه‌های این اجلاس باشد اما مشکلاتی از قبیل استفاده از روش‌های کاملاً سنتی جهت اخذ کارت ورود، صفوف طولانی، قطعی اینترنت، ممنوعیت ورود تلفن هوشمند به سالن کنفرانس، فایل‌های ارائه غیراستاندارد و... همگی نمونه‌های بارزی بود که حداقل این اجلاس را لایق نمایندگی #ایران_هوشمند نمی‌کرد.

امید است تا با حرکت اصولی به سمت ایران دیجیتال سبب حکمرانی هوشمند و خلق ثروت از طریق اقتصاد دیجیتال برای کشور عزیزمان باشیم.

ارادتمند
محمدرضا محتاط
@DataAnalysis
الکامپ 98؛ پیشتازی رمزارزها، عقب‌نشینی کلان‌داده!

http://tiny.cc/u0w09y

نمایشگاه الکامپ سال 1398 با شعار #آینده_بهتر از تاریخ 27 الی 30 تیر در محل دائمی نمایشگاه‌های بین‌المللی تهران برگزار گردید. در ادامه وضعیت نمایشگاه در مقایسه با سال‌های قبل نقد و بررسی خواهد شد.

1- حضور کم‌فروغ شرکت‌های فعال در حوزه‌های کلان‌داده، علم‌داده، هوش‌مصنوعی و... در نمایشگاه‌ امسال یکی از موارد بسیار مشهود بود. در سالن گذشته بیش از 10 شرکت و استارت‌آپ به صورت تخصصی در این حوزه‌ها محصول و خدمات متنوعی ارائه کرده بودند. این تعداد چه از لحاظ کمیت و کیفیت در نمایشگاه امسال بسیار کمتر از سال گذشته بود.

2- در مقابل، حضور استارت‌آپ‌ها / شرکت‌های فعال در حوزه بلاک‌چین (فناوری زنجیره بلوکی) بسیار بیش از حد انتظار بود. شرکت‌‌هایی که بعضا هر کدام از لقب "اولین" در بنر و تبلیغات خود استفاده کرده بودند. درصورت عدم رسیدگی و حل نشدن مشکلات قانونی و رگولاتوری که در مسیر توسعه این تکنولوژی قرار دارد، متاسفانه به نظر می رسد در رویدادهای آینده شاهد ریزش قابل توجه این دسته از شرکت‌های نوپا باشیم.

3- یکی از تفاوت‌های مثبت نمایشگاه امسال با سال‌های گذشته، بخش «الکامپ ترندز» نمایشگاه بود. در نمایشگاه امسال سالن شماره 6 به شرکت‌های فعال در حوزه فناوری‌های نوین اختصاص داده شده بود. اختصاص این سالن و متمرکز کردن شرکت‌های فعال در حوزه فناوری‌های تحول‌آفرین جز تحولات مثبت نمایشگاه امسال بود.

4- حضور مستمر و فعالانه وزیر و معاونین وزارت ارتباطات و فناوری اطلاعات، رئیس دفتر ریاست جمهوری، مدیران سازمان نظام صنفی رایانه‌ای و... در غرفه‌های شرکت‌ها و استارت‌آپ‌ها یکی دیگر از نکات مثبت نمایشگاه امسال بود. نکته‌ای که سبب تغییر رویکرد بخش دولتی به بخش خصوصی و به طبع توسعه اکوسیستم فناوری اطلاعات در کشور خواهد شد.

5- الکام‌تاکز و برگزاری پنل‌های تخصصی جهت آموزش آخرین روندها، تکنولوژی‌ها و مفاهیم تخصصی توسط صاحب‌نظران و متخصیین حوزه فناوری اطلاعات کشور یکی دیگر از نکاتی هست که در نمایشگاه امسال جای تقدیر داشت. البته مواردی همچون عدم اطلاع‌رسانی متمرکز، مشخص نبودن مکانیزم داوری جهت انتخاب ارائه‌ها، عدم اختصاص جایگاه‌های سخنرانی مناسب در سالن‌های نمایشگاه و... از مشکلاتی بود که انتظار می‌رود در سال بعد برطرف گردند.

امید است این اقدامات سبب افزایش هرچه بیشتر بلوغ فناوری اطلاعات در کشور گردد.

ارادتمند
محمدرضا محتاط

@DataAnalysis
This media is not supported in your browser
VIEW IN TELEGRAM
تحول دیجیتال در مدارس!

ویدیو فوق یک نمونه بسیار ملموس از کاربردهای فناوری‌های تحول‌آفرین در زندگی‌های روزمره است.

در یکی از مدارس کشور چین از تکنولوژی تشخیص چهره جهت حضور و غیاب دانش‌آموزان و اطلاع‌رسانی هوشمند به والدین استفاده میشود.

لزوم حرکت به سمت فناوری‌های تحول‌آفرین در کنار گسترش فرهنگ دیجیتال یکی از پایه‌های اساسی حرکت به سمت ایران هوشمند است.

@DataAnalysis
برترین تکنولوژی‌های مورد استفاده توسط شرکت‌های Unicorn

در شکل‌های فوق به ترتیب برترین زبان‌های برنامه‌نویسی، پایگاه‌های داده و فریم‌ورک‌های برنامه‌نویسی مورد استفاده توسط شرکت‌های Unicron (شرکت‌هایی با ارزش بیش از یک میلیارد دلار) به تفکیک بیان گردیده است.

▪️در زبان‌های برنامه‌نویسی به ترتیب زبان‌های برنامه‌نویسی پایتون، جاوا و Javanoscript بیشترین استفاده را داشته‌اند.

▪️در فریم‌ورک‌های برنامه‌نویسی نیز تکنولوژی‌های ReactJS, هدوپ و NodeJS بیش از سایر فریم‌ورک‌ها در پروژه‌های این شرکت‌ها استفاده گردیده است.

پایگاه‌داده‌های Redis, MySQL و PostgreSQL نیز بیش از سایر پایگاه‌ داده‌های رابطه‌ و غیررابطه‌ای مورد استفاده قرار گرفته‌اند.

پی‌نوشت:
تحقیق و توسعه مستمر به همراه تحلیل نمونه‌های موفق یکی از راهکارهای بهینه جهت کاهش ریسک پروژه‌های توسعه نرم‌افزار در مقیاس Enterprise خواهد بود.

@DataAnalysis
کتاب یادگیری عمیق با TensorFlow

در کتاب Deep Learning with TensorFlow انتشارات Packt که در سال 2017 انتشاریافته، مفاهیم پایه و کلیدی یادگیری عمیق به همراه پیاده‌سازی در زبان پایتون آموزش داده شده است. سرفصل‌های این کتاب به شرح ذیل می‌باشد.

▪️Getting Started with Deep Learning

▪️First Look at TensorFlow

▪️Using TensorFlow on a Feed-Forward Neural Network

▪️TensorFlow on a Convolutional Neural Network

▪️Optimizing TensorFlow Autoencoders

▪️Recurrent Neural Networks

▪️GPU Computing

▪️Advanced TensorFlow Programming

▪️Advanced Multimedia Programming with TensorFlow

▪️Reinforcement Learning

مطالعه این کتاب مفید را به متخصصین یادگیری عمیق و مهندسین یادگیری ماشین توصیه می‌نمایم.

ارادتمند
محمدرضا محتاط

@DataAnalysis
Deep Learning with TensorFlow.pdf
6.2 MB
کتاب یادگیری عمیق با TensorFlow انتشارات Packt

@DataAnalysis
مسیر آموزشی علم‌داده!

http://tiny.cc/ohnpaz

یکی از مهم‌ترین گام‌های تبدیل‌شدن به یک متخصص علم‌داده، انتخاب مسیر آموزشی بهینه جهت آموزش مفاهیم و ابزارهای کارآمد منطبق با بازار کار است. موضوعی که توسط مؤسسات و دوره‌های آموزشی که در کشور نیز در حال گسترش است کمتر به آن توجه می‌شود.

مسیر پیشنهادی زیر یکی از نمونه مسیرهای آموزشی مناسب جهت تبدیل‌شدن به یک متخصص علم‌داده و تحلیلگر کلان داده منطبق با بازار کار بین‌المللی و ایران هست.

🔵 بخش مقدماتی:

🔹پیش‌نیاز:
یکی از مهم‌ترین‌ پیش‌نیازهای ورود به حوزه علم‌داده فراگیری مفاهیم پایه حوزه‌های آمار، داده‌کاوی و... است. آموزش ساختار و قواعد زبان‌ برنامه‌نویسی پایتون، توانایی کار با پایگاه داده‌های رابطه‌ای و اجرای کوئری‌های SQL ای نیز از دیگر پیش‌نیاز کلیدی می‌باشد.

🔹علم‌داده با پایتون:
پس از آموزش ساختار و قواعد زبان برنامه‌نویسی پایتون، در گام بعدی فراگیری کتابخانه‌های تحلیل داده این زبان برنامه‌نویسی حائز اهمیت است. کتابخانه‌ Pandas بابت تحلیل داده‌های ساخت‌یافته، کتابخانه Numpy جهت پیاده‌سازی مفاهیم پایه ریاضی و آمار، کتابخانه Matplotlib جهت مصورسازی داده‌ها، کتابخانه IPython جهت اجرای Interctive پروژه‌های علم‌داده و... در این گام مفید خواهد بود.

🔹یادگیری ماشین:
در این گام هدف پیاده‌سازی و اجرای پروژه‌های یادگیری ماشین می‌باشد. کتابخانه Scikit learn از مطرح‌ترین کتابخانه‌های زبان پایتون است که به‌وسیله آن امکان پیاده‌سازی اکثر پروژه‌های یادگیری ماشین فراهم خواهد شد. آموزش تخصصی این کتابخانه در پروژه‌های موردی بسیار مفید است.

🔴 بخش پیشرفته:
در بخش پیشرفته تمرکز بر پلتفرم‌ها و ابزارهای نوظهور است که در صورت فراگیری آن امکان رشد بسیار سریع‌تر در این فیلد کاری میسر خواهد شد.

🔺یادگیری عمیق:
با توجه به قابلیت‌های یادگیری عمیق در مسائل پیچیده، یادگیری فریم‌ورک‌ها و کتابخانه‌های یادگیری عمیق نقش به سزایی در موفقیت شما به‌عنوان یک متخصص علم‌داده خواهد داشت. کتابخانه‌های Tensorflow و Keras دو کتابخانه مطرح یادگیری عمیق هستند که آموزش یکی از این دو بسیار مفید خواهد بود. تمامی این کتابخانه‌ها دارای واسط برای زبان برنامه‌نویسی پایتون هستند.

🔺کلان ‌داده:
با توجه به افزایش سرعت، حجم و تنوع اطلاعات، در حال حاضر دو جایگاه متخصص علم‌داده و تحلیلگر کلان داده به‌مراتب به یکدیگر نزدیک شده‌اند و بعضاً در فرصت‌های شغلی متخصصین علم‌داده توانایی‌های مرتبط با حوزه Big Data نیز از پیش‌نیازهای اصلی است. آشنایی با اکوسیستم Hadoop و زیر پروژه‌های آن همانند Pig, Sqoop, Hive و... در این بخش پیشنهاد می‌شود.

🔺آپاچی اسپارک:
آپاچی اسپارک یکی از برترین پلتفرم‌های پردازشی در حوزه کلان داده است. فراگیری کتابخانه‌های یادگیری ماشین این پلتفرم(MLlib)، اجرای کوئری‌های SQL در این پلتفرم پردازشی (Sprak SQL) و... جهت رشد سریع‌تر شما در این حوزه کاری بسیار موثر است.

پی‌نوشت:
1- جهت یادگیری اصولی و کاهش پیچیدگی‌های آموزشی در این مسیر توصیه می‌کنم حتما گام‌ها به ترتیب طی شود. بعضاً برخی از علاقه‌مندان بدون دانش مقدماتی یا در شروع فرایندهای آموزشی به دنبال یادگیری مفاهیم و ابزارهای تخصصی یادگیری عمیق یا کلان داده می‌شوند. امری که سبب بروز پیچیدگی و کسب دانش سطحی خواهد شد.
2- انتخاب موسسه و دوره آموزشی مناسب یکی از کاتالیزورهای موفقیت شما در این مسیر آموزشی دشوار اما جذاب است.

ارادتمند
محمدرضا محتاط

@DataAnalysis
معرفی فیلم Her

فیلم Her فیلمی در ژانر درام، عاشقانه و علمی-تخیلی به کارگردانی اسپایک جونز با موضوع ورود هوش مصنوعی به زندگی انسان است.

داستان فیلم در آینده‌ای نه‌چندان دور اتفاق می‌افتد؛ زمانی که سیستم‌عامل‌ها و دستیارهای هوشمند پیشرفت قابل‌توجهی داشته است. محوریت داستان در مورد مردی است که با یک سیستم‌عامل هوشمند رایانه‌ای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار می‌کند.

با دیدن این فیلم جذاب می‌توانید آینده‌ای نزدیک از پیشرفت تکنولوژی و دستیارهای هوشمند به همراه تهدیدهای ناشی از پیشرفت بی‌حدومرز فناوری را مشاهده نمایید.

@DataAnalysis
مقایسه مهارت‌های متخصص علم‌داده و تحلیلگر بازاریابی!

یکی از کارکردهای اصلی حوزه علم‌داده در سازمان‌ها، تحلیل‌ داده‌های مشتریان جهت بازاریابی هوشمند است. بازاریابی داده‌محور یکی از رویکردهای هست که سبب شناخت دقیق‌تر مشتریان بالقوه و بالفعل خواهد شد.

در شکل فوق مهارت‌های دو حوزه متخصص علم‌داده و تحلیلگر بازاریابی مقایسه شده است. توانمندی‌های مرتبط با هوش تجاری، داشبوردخوانی، داستان‌سرایی از داده‌ها و مهارت‌های تخصصی حوزه بازاریابی از پیش‌نیازهای کلیدی جهت موفقیت ذر جایگاه شغلی بازاریابی داده‌محور است.

@DataAnalysis
پارسا خائف؛ برنده نهایی عصر جدید!؟

یکی از کاربردهای جذاب حوزه علم‌داده پیش‌بینی انتخابات و نظرات مردمی در حوزه‌ها و موضوعات سیاسی، فرهنگی، ورزشی و... است.

یکی از داده‌های موثر در تحلیل نظرات مردم بررسی میزان جستجوهای کاربران در موتورهای جستجو است. امری که حتی در پیش‌بینی نتایج انتخابات نیز قابل اتکا می‌باشد.

با بررسی میزان جستجوهای کاربران در موتور جستجو گوگل پیرامون شرکت‌کنندگان فینال عصر جدید طی هفته گذشته نشان از میزان توجهات کاربران ایرانی موتور جستجوی گوگل به پارسا خائف است.

میزان توجهات به اجراهای خانم فاطمه عبادی، آقایان سعید فتحی روشن و محمد زارع بسیار به یکدیگر نزدیک هستند. گروه دختران نینجا هم با اختلاف در رتبه آخر میزان توجهات قرار دارد.

باید تا اعلام نتایج نهایی صبر کرد تا مشخص شود که میزان جستجوهای کاربران در موتور جستجوی گوگل چه میزان رابطه با میزان آرای این شرکت کنندگان دارد.

ارادتمند
محمدرضا محتاط

@DataAnalysis
دلایل خطا در پیش‌بینی‌های داده‌محور!

http://tiny.cc/873lbz

برنامه عصر جدید دیشب با پیروزی خانم فاطمه عبادی به اتمام رسید. امری که اگر چه دور از ذهن نبود اما پیش‌بینی‌های متعدد توسط منابع مختلف نشان از پیروزی پارسا خائف داشت. یکی دیگر از خطاهای اخیر در پیش‌بینی‌های داده‌محور شکست در پیش‌بینی قهرمان مسابقات جام جهانی فوتبال توسط یکی از مطرح‌ترین سیستم‌های هوش مصنوعی در جهان بود.

آیا پیش‌بینی‌های داده‌محور قابل اتکا نیستند!؟

در این نوشتار برخی علل بروز خطا در پیش‌بینی‌های داده‌محور ذکر خواهد شد.

1- عدم تقاطع منابع اطلاعاتی:
تقاطع منابع اطلاعاتی یکی از راهکارهای افزایش دقت و صحت مدل‌های پیش‌بینانه خواهد شد. در صورتی که تنها از یک منبع اطلاعاتی اقدام به پیش‌بینی شود خطا به مراتب افزایش خواهد یافت. منظور از تقاطع منابع اطلاعاتی افزایش دامنه جمع‌آوری اطلاعات در حوزه‌های مرتبط با موضوع پیش بینی است.

2- تمرکز بیش از حد به فضای مجازی:
یکی دیگر از خطاهای رایج در پیش‌بینی‌های داده‌محور تمرکز بیش از حد به داده‌ها و منابع اطلاعاتی موجود در شبکه‌های اجتماعی، منابع خبری، نظرسنجی‌های آنلاین و... است. این درحالی هست که طیف وسیعی از رای دهندگان که در انتخابات‌ها شرکت می‌کنند لزوما نظرات و علاقه‌مندی‌های حقیقی خود را در فضای مجازی منتشر نمیکنند. جهت افزایش دقت مدل‌های پیش‌بینانه میبایست این جامعه آماری مهم را نیز در نظر داشت.

3- عدم توجه به متغیرهای موضوعی:
یکی دیگر از دلایل شکست در پیش‌بینی دقیق نظرات آحاد جامعه در یک موضوع، عدم توجه به متغیرهایی موضوعی همانند قومیت، جنسیت، صنف و... است. برخی از رای دهندگان ممکن است صرفا به دلیل جنسیت یا قومیت یک شرکت کننده به آن رای دهند. در صورتی که این قبیل متغیرها در مدل‌های پیش‌بینی لحاظ نشود سبب افزایش خطا در پیش‌بینی‌ها میشود.

4- عدم دسترسی به منابع اطلاعاتی:
عدم دسترسی به منابع اطلاعاتی جامع یکی دیگر از مولفه‌های افزایش خطا در مدل‌های پیش‌بینانه است. هر چقدر منابع اطلاعاتی مورد بررسی دارای کمیت و کیفیت بهتری باشد به طبع دقت مدل‌های پیش‌بینی نیز افزایش پیدا خواهد کرد.


تمامی این موارد برخی از دلایل شکست در پیش‌بینی‌های موضوعی داده محور است. در انتها این نکته باید توجه شود که با توجه به افزایش حجم، تنوع و سرعت تولید اطلاعات، بهره‌گیری از تحلیل‌های داده‌محور یکی از موثرترین راهکارها در جهت کسب بینش خواهد بود. واقعیتی که در لایه‌های حاکمیتی، سازمانی و... باید به آن توجه ویژه شود.

ارادتمند
محمدرضا محتاط

@DataAnalysis
برترین مهارت‌های مورد نیاز یک دانشمند داده!

▪️براساس تحلیل بیش از 300 فرصت شغلی دانشمندان علم‌داده در سال 2019 به ترتیب زبان‌های برنامه‌نویسی پایتون، R و SQL همچنان در رتبه‌های اول قرار دارند.

▪️از نکات قابل توجه در فرصت‌های شغلی متخصصین علم‌داده، رشد مهارت‌ها و تخصص‌های مرتبط با Big Data و پلتفرم‌های هدوپ و اسپارک می‌باشد. این میزان از 17 درصد در سال 2015 به 59 درصد در سال 2018 رسیده است.

▪️در میان فریم‌ورک‌های یادگیری عمیق نیز فریم‌ورک‌های تنسورفلو، Keras و Pytorch دارای بیشترین فراخوانی در آگهی‌های متخصیین علم‌داده بوده‌اند.

▪️از میان کتابخانه‌های تحلیلی زبان برنامه‌نویسی پایتون به ترتیب کتابخانه‌های Scikit Learn, Pandas و Numpy بیشتر مورد توجه بوده‌ است.

پی‌نوشت:
پایش مستمر فرصت‌های شغلی مرتبط با حوزه فعالیت کاری یکی از مولفه‌های موثر در جهت یادگیری و توسعه هدفمند ابزارها و مفاهیم نوین است.

@DataAnalysis
جهت یادگیری مفاهیم و ابزارهای علم‌داده کدام یک از رویکرد‌های زیر را ترجیح می‌دهید؟
Anonymous Poll
34%
دوره‌های آموزشی بلند مدت(دوره‌های جامع)
18%
دوره‌های آموزشی کوتاه مدت
43%
دوره‌های آموزشی آنلاین
6%
سایر
با سلام و احترام

پیرو برگزاری دوره‌های َآموزشی هدفمند در حوزه‌های مرتبط با علم‌داده و تحلیل‌داده، در صورتی که علاقه‌مند به شرکت در دوره‌های تخصصی مرتبط هستید خواهشمنداست نسبت به پر کردن فرم نظرسنجی زیر اقدام نمایید.

https://forms.gle/z9Axy4nFyp1QVKdK7

@DataAnalysis
معرفی کتاب An Introduction to Statistical Learning

http://tiny.cc/xzs1bz

کتاب An Introduction to Statistical Learning یکی از بهترین کتاب‌های تخصصی در آموزش مفاهیم تحلیل‌های آماری و یادگیری ماشین است که توسط انتشارات Springer انتشار یافته است. آموزش طیف وسیعی از الگوریتم‌ها، متدهای آماری و مدل‌های خطی با ذکر مثال‌های متعدد از ویژگی‌های بارز این کتاب است.

سرفصل‌های ده‌گانه این کتاب به شرح زیر است. قابل ذکر است که پیاده‌سازی موجود در این کتاب به زبان برنامه‌نویسی R می‌باشد.

▪️Introduction

▪️Statistical Learning

▪️Linear Regression

▪️Classification

▪️Resampling Methods

▪️Linear Model Selection and Regularization

▪️Moving Beyond Linearity

▪️Tree-Based Methods

▪️Support Vector Machines

▪️Unsupervised Learning

مطالعه این کتاب ارزشمند را به تمامی علاقه‌مندان حوزه علم‌داده که قصد در تقویت پایه‌های علوم آماری خود را دارند توصیه میکنم.

ارادتمند
محمدرضا محتاط

@DataAnalysis