Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
برترین الگوریتم‌های یادگیری ماشین و علم‌داده در سال 2019

براساس نظرسنجی وبسایت Kdnuggets از متخصصین علم‌‌داده، به ترتیب متدها و الگوریتم‌های رگرسیون، درخت تصمیم‌، خوشه‌بندی و مصورسازی داده‌ها از رایج‌ترین متدهای استفاده شده در پروژه‌های علم‌داده در سال 2019 بوده‌اند.

افزایش توجهات به روش‌های مبتنی بر شبکه‌های عصبی، یادگیری عمیق و سری‌های زمانی از نکات قابل توجه در مقایسه با سال 2017 است.

قابل ذکر است که انتخاب الگوریتم بهینه براساس نیازمندی‌های تحلیلی پروژه، نوع دادگان و... انتخاب می‌شود. انتخابی که ممکن است سبب موفقیت یا شکست پروژه‌های علم‌داده شود.

@DataAnalysis
پیچیدگی‌های فعالیت در حوزه علم‌داده!

http://tiny.cc/oex85y

مقالات متعددی پیرامون مزایای حوزه علم‌داده منتشرشده است. ویژگی‌هایی از قبیل درآمد بالا، میزان تأثیرگذاری در سطوح سازمانی و ملی، میزان تقاضای بازار کار و... همگی نشان از این مزایا دارند.

در این مطلب هدف ارائه پیچیدگی‌های حوزه علم‌داده است تا اگر قصد دارید به‌صورت تخصصی در این فیلد فعالیت نمایید به آن‌ها آگاه باشید.

1- کسب تخصص:
با توجه وجود طیف وسیعی از مهارت‌ها، ابزارها و پلتفرم‌ها در حوزه علم‌داده، کسب تخصص جامع در این فیلد کاری امری بسیار دشوار و پیچیده می‌باشد. امری که نیازمند صرف زمان و یادگیری مستمر در حوزه‌های متنوع خواهد بود.

2- دانش بین‌رشته‌ای:
نوع نگاه علم‌داده به مسائل از منظرهای آمار، مهندسی کامپیوتر، کسب‌وکار و... قابل افراز می‌باشد. لذا اگر قصد فعالیت در پروژه‌های علم‌داده را دارید می‌بایست با دانش‌های پایه‌ای بخصوص در مفاهیم بین‌رشته‌ای آشنا باشید.

3- داده‌های کثیف:
یکی از پیچیدگی‌های پروژه‌های علم‌داده وجود داده‌های کثیف یا عدم دسترسی به داده‌های مناسب در پروژه‌ها است. وجود این قبیل مشکلات سبب هدر رفتن انرژی و زمان زیادی خواهد شد. مشکلاتی که در کشور ما با توجه به میزان بلوغ فناوری اطلاعات بسیار مشهودتر می‌باشد.

4- حریم خصوصی:
مدیریت حریم خصوصی یکی از چالش‌های مطرح پروژه‌های علم‌داده و سازمان‌های داده‌محور در سال‌های اخیر می‌باشد. افشای اطلاعات خصوصی و محرمانه یکی از چالش‌های عمده شرکت‌های فعال در حوزه ارائه خدمات تحلیل داده می‌باشد.

5- تیم سازی:
یکی از چالش‌های سازمان‌های فعال در حوزه علم‌داده، جذب متخصصین و تیم سازی می‌باشد. کمبود متخصصین علم‌داده واقعی، چالش‌های سازمانی و... از مشکلاتی هست که می‌توانند در موفقیت و شکست پروژه‌ها بسیار تأثیرگذار باشند.

ارادتمند
محمدرضا محتاط

@DataAnalysis
زبان‌های برنامه‌نویسی حوزه علم‌داده!

در حوزه علم‌داده زبان‌های برنامه‌نویسی مطرحی همچون پایتون، SAS, Scala, SQL, R و... وجود دارد که هر یک بنا به کارکردها و کاربردهای خود در پروژه‌های مختلفی قابلیت بهره‌برداری را دارند.

انتخاب زبان برنامه‌نویسی بهینه یکی از عوامل موفقیت در پروژه‌های تحلیل داده می‌باشد. بعنوان مثال در حوزه یادگیری عمیق، تحلیل کلان‌داده، توسعه دهنده کلان‌داده، تحلیل‌های آماری و... هر کدام از این زبان‌ها قابلیت‌های منحصر به فرد خود را دارا می‌باشند.

در شکل‌های فوق ویژگی‌های زبان‌های برنامه نویسی پایتون، R و Scala به تفکیک بیان شده است.

@DataAnalysis
This media is not supported in your browser
VIEW IN TELEGRAM
تاثیرات هوش مصنوعی بر اقتصاد جهان!

در این ویدیو کوتاه با تاثیرات هوش مصنوعی بر اقتصاد جهان تا سال 2030 آشنا خواهید شد.

◾️تاثیر 16 هزار میلیارد دلاری بر اقتصاد جهان
▪️تغییرات محسوس در زندگی شخصی و کاری
▪️افزایش تولید ناخالص داخلی کشورها(GDP)
▪️رشد صنایع خرده‌فروشی، مالی و سلامت
▪️رشد قابل توجه کشورهای آسیایی همچون چین و هند

موارد فوق تنها بخشی از تاثیرات هوش‌مصنوعی طی دهه آینده خواهد بود.

میزان بهره‌برداری کشور ما از این تغییر و تحولات چه میزان می‌باشد؟!

ارادتمند
محمدرضا محتاط

@DataAnalysis
معرفی فیلم Ex Machina

فیلم فراماشین یک فیلمی در ژانر علمی‌، درام و هیجانی است. در این فیلم با استفاده از یک ایده داستانی تامل‌برانگیز، داستانی هیجانی از زندگی یک ربات هوشمند به نمایش گذاشته می‌شود.

در این فیلم یک برنامه‌نویس جوان جهت ارزیابی خصوصیات انسانی یک ربات مؤنث انتخاب میشود. این ربات آوا نام دارد و آخرین نسخه از پیش‌الگوهای هوش مصنوعی ساخته ‌شده توسط یک دانشمند نابغه است.

پایه این فیلم براساس آزمون تورینگ تولید شده است. آلن تورینگ اعتقاد داشت که اگر ماشینی بتواند خود را از انسان غیرقابل تميز کند، بي‌شك می‌توان برچسب هوشمندبودن را بر آن زد.

مطالعه این فیلم جذاب را به همه علاقه‌مندان حوزه هوش مصنوعی پیشنهاد می‌کنم.

@DataAnalysis
متخصص علم‌داده؛ برترین شغل در سال 2019

براساس آخرین رتبه‌بندی مشاغل توسط وبسایت Careercast در مولفه‌های محیط کاری، میزان استرس کاری و میزان رشد پروژه‌های مرتبط، متخصصین علم‌داده با میانگین درآمد سالیانه 114 هزار دلار در جایگاه اول این لیست قرار داد.

10 شغل برتر ایالات متحده آمریکا در سال 2019 به شرح ذیل است:

1️⃣ متخصصین علم‌داده (Data Scientist)

2️⃣ متخصصین آمار( Statistician)

3️⃣ استاد دانشگاه (University Professor)

4️⃣ متخصص کاردرمانی (Occupational Therapist)

5️⃣ مشاور ژنتیک (Genetic Counselor)

6️⃣ مدیر خدمات پزشکی (Medical Services Manager)

7️⃣ تحلیلگر امنیت اطلاعات (Information Security Analyst)

8️⃣ متخصص ریاضی (Mathematician)

9️⃣ تحلیلگر تحقیق‌ در عملیات (Operations Research Analyst)

🔟 دبیر (Actuary)

@DataAnalysis
فرصت کارآموزی Big Data شرکت سحاب‌پرداز(نیمبو)

نیمبو یک دوره کارآموزی فشرده‌ است که تابستان امسال برای سومین بار توسط شرکت سحاب پرداز برگزار می‌شود. در این دوره یادگیری متنوعی برای شرکت‌کنندگان در حوزه‌های Big Data و Data Science مبتنی بر داده‌های واقعی فراهم خواهد شد.

دوره کارآموزی فوق در محورهای کلان‌داده، یادگیری ماشین، مهندسی داده، پایگاه‌داده‌های Nosql و توسعه نرم‌افزار در مدت 10 هفته با پرداخت حقوق برای کارآموزان برگزار می‌شود.

اگر علاقه‌مند به ثبت‌نام در این طرح کارآموزی هستید می‌توانید از طریق لینک زیر ثبت‌نام نمایید.

http://nimbo.in

@DataAnalysis
برترین الگوریتم‌های پروژه‌های علم‌داده!

انتخاب الگوریتم یادگیری ماشین بهینه یکی از مهمترین گام‌های پیاده‌سازی پروژه‌های علم‌داده است. در ادامه 9 الگوریتم مطرح این حوزه معرفی می‌شود.

1. Linear Regression

2. Logistic Regression

3- K-Means Clustering

4. Principal Component Analysis(PCA)

5. Support Vector Machines

6. Artificial Neural Networks

7. Decision Trees

8. Recurrent Neural Networks

9. Apriori

@DataAnalysis
الحمدلله الذي جعلنا من المتمسكين بولاية مولانا أميرالمؤمنين و اولاده المعصومين صلواة الله عليهم اجمعين

شهادت شفیع شیعیان و مولای متقیان، علی علیه السلام تسلیت باد!
فرصت شغلی متخصص علم‌داده در شرکت پردازش الکترونیک راشد سامانه (پارسا)

🔻🔻شرایط تخصصی

🔹تسلط بر زبان برنامه نویسی R یا Python (تسلط بر زبان R از اولویت بالاتری برخوردار است)

🔹تسلط بر مفاهیم نظری و ریاضی پیش‌بینی و سری‌های زمانی (داشتن تجربه عملی، مزیت محسوب می‌شود)

🔹تسلط بر مفاهیم نظری الگوریتم‌های یادگیری ماشین، پیش پردازش داده‌ها و تنظیم پارامترها

🔹آشنایی با نرم‌افزار هوش تجاری Tableau یا PowerBI

🔹آشنایی با پایگاه داده SQL Server و مفاهیم طراحی و توسعه پایگاه داده رابطه‌ای

🔹آشنا با مفاهیم نظری و عملی کلان داده‌ها (Big Data) و زیرساخت‌های مربوطه

🔹آشنا با شبیه‌سازی و مدل‌سازی جریان داده‌ها

🔻🔻شرایط عمومی

🔹امکان حضور حداقل 40 ساعت در هفته

🔹مسئولیت‌پذیر و برخوردار از انضباط کاری

🔹قابلیت بیان مفاهیم فنی به صورت ساده

🔹دارای توانمندی تجزیه و تحلیل مسائل پیچیده و توجه به جزئیات

🔹دارای روحیه جستجوگری

🔹دارای تفکر انتقادی و خلاقانه

🔹علاقه‌مند به یادگیری و توسعه مهارت‌های فردی

🔴در صورت احراز شرایط برای آقایانی که هنوز خدمت سربازی خود را نگذرانده‌اند، پس از 6 ماه از شروع همکاری اولیه، امکان ادامه همکاری در قالب سرباز فناور نیز وجود خواهد داشت.

علاقمندان می‌توانند رزومه خود را به ایمیل hr.DataScience@Parsa-cit.com یا آی‌دی تلگرام @ParsaFanap ارسال نمایند.

@DataAnalysis
برترین مهارت‌های مورد نیاز در فرصت‌های شغلی علم‌داده!

▪️براساس تحلیل فرصت‌های شغلی مرتبط با حوزه علم‌داده سایت Indeed در سال 2019 به ترتیب زبان‌های برنامه‌نویسی پایتون، SQL و جاوا بیشترین تقاضا را داشته‌ است.

▪️در میان ابزارهای داده‌کاوی، نرم‌افزارهای Matlab و SPSS بیشترین تقاضا را دارا می‌باشند.

▪️از میان پلتفرم‌ها و ابزارهای کلان‌داده نیز پلتفرم‌های آپاچی هدوپ، Spark و Hive دارای بیشترین تقاضا بوده است.

▪️از منظر بیشترین رشد تقاضا، پلتفرم یادگیری عمیق Tensorflow در مقایسه با سال 2017 بیشترین رشد را کسب کرده است. پلتفرم کلان‌داده Apche Flink نیز پس از تنسورفلو بیشترین رشد را در میان ابزارهای کلان‌داده مورد نیاز در آگهی‌های علم‌داده داشته است.

@DataAnalysis
This media is not supported in your browser
VIEW IN TELEGRAM
35 سال تکامل اقتصاد جهانی!

در ویدیوی کوتاه فوق میزان سهم کشورها در اقتصاد جهان طی 35 سال گذشته مورد بررسی قرار گرفته است.

افزایش سهم چین در GDP دنیا و کاهش سهم اروپا از نکات قابل تامل می‌باشد.

پی‌نوشت:
مصورسازی داده (Data Visualization) یکی از مهمترین گام‌های پروژه‌های تحلیل داده‌ می‌باشد. با مصورسازی اصولی امکان ارائه دقیق و کاربردی نتایج به مدیران یا ذی‌نفعان پروژه فراهم می‌شود.

@DataAnalysis
محبوب‌ترین شبکه‌های اجتماعی براساس تعداد کاربر فعال!

در شکل فوق فوق محبوب‌ترین شبکه‌های اجتماعی براساس تعداد کاربران فعال معرفی شده‌اند. در حال حاضر شبکه‌های اجتماعی فیس‌بوک،َ یوتیوب، واتس‌آپ، Facebook Messenger و اینستاگرام جز برترین شبکه‌های اجتماعی می‌باشند.

پایش و تحلیل نظرات و علاقه‌مندی کاربران در شبکه‌های اجتماعی یکی از مهمترین مولفه‌های تحلیلی جهت تبدیل‌شدن به یک سازمان داده‌محور می‌باشد.

بعنوان مثال با شناسایی دغدغه‌های کاربران شبکه‌های اجتماعی پیرامون یک خدمت یا محصول می‌توان در جهت شناخت، جذب، بقا و توسعه هدفمند مشتریان گام برداشت.

میزان بهره‌برداری سازمان شما از داده‌های مشتریان بالقوه و بالفعل خود در شبکه‌های اجتماعی چه میزان می‌باشد؟!

سوالی که در ارزیابی میزان بلوغ تحلیل‌داده سازمان‌ها بسیار حائز اهمیت خواهد بود.

ارادتمند
محمدرضا محتاط

@DataAnalysis
10 تکنولوژی تاثیرگذار در سال 2019

▪️کلان‌داده (Big Data)

▪️هوش مصنوعی (Artificial Intelligence)

▪️واقعیت‌ مجازی و افزوده (AR and VR)

▪️همانند دیجیتال (Digital Twins)

▪️بلاک‌چین (Blockchain)

▪️پردازش کوانتومی( Quantum Computing)

▪️اینترنت اشیا (Internet of Things)

▪️خودکارسازی فرایندها (Robotic Process Automation)

▪️فریم‌ورک‌های Angular and React

▪️نرم‌افزارهای هوشمند (Intelligent Apps)

پی‌نوشت:
یکی از مولفه‌های موفقیت در محیط‌های کسب‌وکار، شناسایی روندها و فرصت‌های ناشی از این قبیل تکنولوژی‌های نوظهور است. این فرصت‌ها در حوزه‌های سازمانی و توسعه فردی می‌توانند بسیار حائز اهمیت باشند.

@DataAnalysis
برترین فریم‌ورک‌های یادگیری عمیق در سال 2019

براساس پیمایش صورت گرفته به ترتیب فریم‌ورک‌های تنسورفلو، PyTorch و Keras به نسبت سایر فریم‌ورک‌های یادگیری عمیق در سال 2019 بیشترین رشد را داشته‌اند.

معیارهای ارزیابی فوق براساس تعداد مقالات چاپ‌شده با استفاده از فریم‌ورک‌های یادگیری عمیق، تعداد آگهی‌های شغلی در وبسایت Indeed و لینکدین، میزان جستجو کاربران در موتور جستجوی گوگل، فعالیت کاربران در GitHub و... بوده است.

@DataAnalysis
فعالترین صنایع در جذب متخصصین علم‌داده!

http://bit.do/DataIndustry

براساس تحلیل‌های صورت‌پذیرفته برروی بیش از 7 هزار فرصت‌ شغلی متخصص علم‌داده شرکت‌های بین‌المللی به ترتیب صنعت‌های بازاریابی، مالی و مشاوره بیشترین جذب متخصیص علم‌داده را داشته‌اند. به ترتیب سایر صنایع برتر در بهره‌گیری از متدهای تصمیم‌گیری داده‌محور طی پژوهش صورت گرفته به شرح زیر می‌باشد.

▪️صنعت بازاریابی (Marketing)

▪️صنعت مالی (Financial)

▪️صنعت مشاوره (Consulting)

▪️ صنعت سرمایه‌گذاری و دارایی (Finance)

▪️صنعت سلامت (Healthcare)

▪️صنعت رسانه‌ (Media)

▪️صنعت داروسازی (Pharmaceuticals)

▪️صنعت تبلیغات (Advertising)

▪️صنعت خرده‌فروشی (Retail)

پی‌نوشت:
در بازار تحلیل‌داده کشور جایگاه برخی صنایع بسیار بالاتر و جایگاه برخی با عدم توجه کافی به حوزه تحلیل‌داده دارای رتبه به مراتب پایین‌تری می‌باشند. بعنوان مثال طبق برخی تجربیات در پروژه‌های تحلیل‌داده در سازمان‌ها و شرکت‌های داخلی می‌توان صنایع فناوری و اطلاعات، بانکداری، سلامت و رسانه را جز فعالترین صنعت‌ها در اجرای پروژه‌های تحلیل‌داده معرفی کرد. در مقابل صنعت بازاریابی و رویکرد بازاریابی داده‌محور در کشور به توجه بسیار بیشتری نیاز خواهد داشت.

ارادتمند
محمدرضا محتاط

@DataAnalysis
جریان‌کاری پروژه‌های یادگیری ماشین!

http://tiny.cc/3rqo8y

یکی از مولفه‌های مهم جهت موفقیت در پروژه‌های یادگیری ماشین، بهره‌گیری از متدولوژی و جریان‌های کاری دقیق جهت مدیریت پروژه است. در ادامه گام‌های لازم جهت پیاده‌سازی مدل‌های تحلیلی مبتنی بر یادگیری ماشین ذکر شده‌اند.

1- شناخت نیازمندی‌های کسب‌وکار

2- شناخت و آماده‌سازی داده

3- مهندس ویژگی‌(استخراج و انتخاب ویژگی)

4- آموزش مدل یادگیری ماشین براساس داده‌های Train

5- بهینه‌سازی پارامترهای الگوریتم براساس داده‌های Validation

6- ارزیابی مدل براساس داده‌های Test

7- توسعه محصول

8- بهره‌برداری در پروژه‌های عملیاتی

9- ارزیابی نهایی مدل در محیط واقعی

10- کسب بینش ناشی از تحلیل‌های داده‌محور

پی‌نوشت:
1- مهمترین گام در جریان‌کاری فوق شناسایی نیازمندی‌های کسب و کار می‌باشد. عدم شناخت دقیق و کافی از نیازمندی‌های کسب‌وکار از رایج‌ترین دلایل شکست‌ پروژه‌های علم‌داده و یادگیری ماشین بوده است.
2- بیشترین زمان یک پروژه یادگیری ماشین مربوط با گام شناخت و آماده‌سازی داده می‌باشد. در صورت عدم وجود زیرساخت مناسب و چالش‌های مدیریت کیفیت داده این گام سبب صرف انرژی زمانی زیاد در پروژه‌های تحلیل‌داده می‌شود.

ارادتمند
محمدرضا محتاط

@DataAnalysis
1
مهارت‌های پایه یک متخصص علم‌داده!

http://tiny.cc/6o918y

جهت تبدیل شدن به یک متخصص علم‌داده نقشه‌راه و مقالات متعددی در منابع مختلف منتشر شده است که بعضا هر یک از دیدگاه‌های مختلف به این مهارت‌ها توجه داشته‌اند. در ادامه مهارت‌های کلیدی که جهت تبدیل شدن به عنوان یک دانشمند علم‌داده به آن نیاز است معرفی می‌گردند.

🔹مهارت برنامه‌نویسی:
جهت پیاده‌سازی مدل‌های هوشمند آشنایی با یک زبان برنامه‌نویسی مطرح در حوزه علم‌داده از پیش‌نیازهای ورود به این فیلد کاری است. زبان‌های برنامه‌نویسی پایتون، R و جاوا بنا به قابلیت‌های خود جز زبان‌هایی هستند که در پروژه‌های علم‌داده بیش از سایر زبان‌های برنامه‌نویسی استفاده می‌شوند.

🔹 آمار، ریاضی و یادگیری ماشین:
آشنایی با مفاهیم و الگوریتم‌های مطرح آمار، ریاضی و یادگیری ماشین از مهمترین پایه‌های حوزه‌های علم‌داده، داده‌کاوی و... هست. با توجه به گستردگی روش‌ها و متدها جهت یادگیری این مفاهیم و الگوریتم‌ها توصیه به یادگیری عملی در حین پروژه است.

🔹 کلان‌داده:
با توجه به افزایش حجم، تنوع و نرخ سرعت تولید داده‌ها در سازمان‌ها، دو جایگاه دانشمند علم‌داده و تحلیلگر کلان‌داده به یکدیگر به مراتب نزدیک‌تر شده‌اند. لذا حتی اگر در حال حاضر در پروژه‌هایی مشغول به فعالیت هستید که کلان‌داده در آن وجود ندارد، یادگیری پلتفرم‌های پردازشی مطرح کلان‌داده همانند آپاچی هدوپ و اسپارک جهت ادامه موفقیت شما حائز اهمیت است.

🔹 مهارت مصورسازی داده:
مصورسازی داده یکی از مهمترین گام‌های پروژه‌های علم‌داده است. گامی که در آن مدل‌ها و مفاهیم فنی به سادگی و زیبایی برای ذی‌نفعان پروژه نمایش داده می‌شود.

🔹 فنون ارتباطی و داستان‌سرایی از داده:
با توجه به ماهیت تعاملی پروژه‌های علم‌داده، آشنایی با مهارت‌های فنون مذاکره، ارائه گزارشات مدیریتی از مدل‌های داده‌محور و هنر اقناع مخاطب جز مهارت‌های نرم حائز اهمیت در این فیلدکاری است.

🔹 شناخت کسب‌وکار:
شناخت کسب‌وکار همانطور که در متدولوژی Crisp DM نیز بعنوان اولین گام پروژه‌های داده‌کاوی مطرح می‌شود جز مهارت‌های اساسی در پروژه‌های تحلیل داده است. آشنایی با نیازمندی‌های دقیق کسب‌وکار سبب پیاده‌سازی موفق مدل‌های مبتنی بر علم‌داده می‌گردد. قابل ذکر است که آشنایی با مفاهیم و فرایندهای تخصصی صنایع مختلف همانند صنایع بانکداری، بیمه، تلکام، سلامت و... در کنار یادگیری مفاهیم فوق سبب ارتقا شما در حوزه علم‌داده خواهد شد.


ارادتمند
محمدرضا محتاط
@DataAnalysis