Data Science – Telegram
Data Science
7.47K subscribers
754 photos
49 videos
85 files
451 links
ارتباط با ادمین:
@Datascience
Download Telegram
پایتون و R بهترین پلت فرمهای یادگیری ماشین در علم داده ها(در نظرسنجی شاپیرو) پیشی گرفتن پایتون از R در 2017. چیزی که پیش بینی می شد. https://news.1rj.ru/str/dataanalysis
روشهای برتر در بازار دیجیتال در سال 2017 https://news.1rj.ru/str/dataanalysis
معرفی کاربردهای یادگیری عمیق

https://goo.gl/EuyWcZ

پرسوناژ نرم‌افزاری است که با استفاده از الگوریتم‌های یادگیری عمیق در شناسایی چهره، نام بازیگرهای ایرانی را از روی چهره آن‌ها تشخیص می‌دهد و از آن‌ها اطلاعات کاملی ارایه می‌کند. این‌ استارتاپ از اولین کاربردهای شبکه‌های عصبی مصنوعی عمیق در اپلیکیشن‌های عمومی در ایران است و در حوزه سرگرمی و کاوش برنامه‌های تلویزیونی فعالیت می‌کند.

می‌توانید نرم‌افزار را از این لینک برای اندروید دریافت و امتحان کنید:
https://cafebazaar.ir/app/com.systemnegar.personage/?l=fa

@dataanalysis
Forwarded from کانال دانلود کتاب
Forwarded from کانال دانلود کتاب
Robert_Layton_Learning_Data_Mining.pdf
3.9 MB
الْحَمْدُ لِلَّهِ الَّذِی جَعَلَنَا مِنَ الْمُتَمَسِّکِینَ بِوِلاَیَةِ أَمِیرِ الْمُؤْمِنِینَ وَ الْأَئِمَّةِ عَلَیْهِمُ السَّلاَمُ
الْحَمْدُ لِلَّهِ الَّذِی جَعَلَ کَمَالَ دِینِهِ وَ تَمَامَ نِعْمَتِهِ بِوِلاَیَةِ أَمِیرِ الْمُؤْمِنِینَ عَلِیِّ بْنِ أَبِی طَالِبٍ عَلَیْهِ السَّلاَم‏.
الْحَمْدُ لِلَّهِ الَّذِی أَکْرَمَنَا بِهَذَا الْیَوْمِ وَ جَعَلَنَا مِنَ الْمُوفِینَ بِعَهْدِهِ إِلَیْنَا وَ مِیثَاقِهِ الَّذِی وَاثَقَنَا بِهِ مِنْ وِلاَیَةِ وُلاَةِ أَمْرِهِ وَ الْقُوَّامِ بِقِسْطِهِ‏ وَ لَمْ یَجْعَلْنَا مِنَ الْجَاحِدِینَ وَ الْمُکَذِّبِینَ بِیَوْمِ الدِّین‏.
مزایای کتابخانه یادگیری ماشین‌(MLlib) آپاچی اسپارک

@dataanalysis
💻پایتون مقدماتی: ۲۹و۳۰شهریور
📝تئوری داده‌کاوی: ۲۹و۳۰شهریور
داده‌کاوی با پایتون: ۶مهر ‌‌‌
🗂کلان‌داده‌ها: ۱۳مهر
🏦کلان‌داده‌های بانکی: ۱۶مهر
🌐اطلاعات بیشتر: autdmc.ir
🔍سؤال:@ceitssc
مقایسه بین استفاده از زبان‌های پایتون و R در پیاده‌سازی‌های صورت گرفته در مسابقات علم‌داده وبسایت Kaggle

@dataanalysis
مقایسه میان جستجوهای کاربران موتور جستجو گوگل پیرامون زبان پایتون و R

@dataanalysis
Types of Data!

@dataanalysis
معماری پروژه هوش تجاری مبتنی بر کلان داده:

جهت پیاده‌سازی یک پروژه هوش تجاری مبتنی بر کلان داده نیازمند برخی ابزارها و پلتفرم‌های مطرح Big Data می‌باشد که در ادامه برخی از این ابزارها به تفکیک گام‌های یک پروژه هوش تجاری معرفی خواهند شد:
http://bit.ly/2h7CCPI
1- فرایند ETL:
*این گام یکی از مراحل مهم در پیاده سازی یک پروژه هوش تجاری می‌باشد. در صورتی که از پایگاه داده‌های رابطه همانند Sql, MySQL و... استفاده می کنید جهت انتقال اطلاعات و پیاده سازی فرایند Extract به پلتفرم‌های کلان داده همچون آپاچی هدوپ می‌توانید از پروژه آپاچی Sqoop استفاده نمایید.

* جهت اعمال برخی فرایندهای پردازشی در گام Transform زبان اسکریپتی آپاچی Pig یا نرم افزار آپاچی Nifi جهت این فرایند کاربرد خواهد داشت.

+برخی از Message Broker های مطرح نیز همچون آپاچی Kafka, Flume و Nifi جهت انتقال بلادرنگ اطلاعات از پایگاه داده‌ها و منابع ورودی اطلاعات سازمان شما به انبار داده در گام Load می‌تواند کاربرد داشته باشد.

2- انبار داده:
جهت ایجاد انبارداده از پایگاه داده‌های Nosql یا فایل سیستم‌های مطرح در سطح کلان داده همچون فایل‌سیستم توزیعی هدوپ( HDFS), کاساندرا، HBASE و... بنا به معماری و ویژگی‌های پروژه خود می توانید انتخاب کنید.

3- پردازش تحلیلی آنلاین(OLAP):
جهت ساخت OLAP و مکعب‌های پردازشی در کلان داده ها از پروژه آپاچی Kylin استفاده می‌شود. این معماری از معماری Map Reduce و اتصال به پایگاه داده های رابطه‌ای مانند Hive, Impala و... جهت ساخت مدل تحلیلی پردازشی آنلاین استفاده می‌گردد. جهت تحلیل‌های پیشرفته مبتنی بر یادگیری ماشین و داده‌کاوی هم کتابخانه‌های تحلیلی آپاچی ماهوت در هدوپ و MLlib در اسپارک وجود دارد.
@dataanalysis

ارادتمند
محمدرضا محتاط
👍1
مقایسه کتابخانه‌های برتر یادگیری عمیق!

@dataanalysis
به جامعه متخصصین علم‌داده ایران با حضور اساتید و متخصصین برجسته کشور در حوزه‌های تحلیل‌های پیشرفته کسب‌وکار، داده‌کاوی، هوش‌تجاری، کلان‌داده و پردازش متن بپیوندید!

آدرس کانال:
@dataanalysis
فایل ارائه دانشگاه استنفورد پیرامون فریم‌ورک‌های یادگیری عمیق
https://goo.gl/CFu3jD

لینک دانلود:
http://stanford.io/2eVHV7U

@dataanalysis
معرفی دوره آموزشی Applied Data Science with Python:

https://goo.gl/a4NoKA

این دوره آموزشی توسط دانشگاه میشیگان آمریکا در حوزه علم‌داده و زبان پایتون به صورت آنلاین و در سطح مقدماتی و متوسط تدریس می‌گردد. این دوره آموزشی شامل 5 درس با عناوین زیر می‌باشد.

1-Introduction to Data Science in Python

2- Applied Plotting, Charting & Data Representation

3- Applied Machine Learning in Python

4- Applied Text Mining in Python

5- Applied Social Network Analysis in Python

لینک دوره:
https://www.coursera.org/specializations/data-science-python#courses

پی‌نوشت:
جهت ثبت‌نام پس از مراجعه به صفحه اصلی دوره با انتخاب درس مدنظر و رفتن به صفحه درس گزینه Enroll و سپس گزینه Audit را فعال نمایید. گفتنی است جهت‌ ثبت‌نام به دلیل تحریم بودن کشور ایران نیاز به فیلتر‌شکن خواهید داشت.

@dataanalysis
تعداد اتفاق در یک دقیقه در اینترنت سال 2017 https://news.1rj.ru/str/dataanalysis
مقایسه کامل الگوریتم‌های بانظارت یادگیری‌ماشین:

https://goo.gl/Fte7WZ

لینک کامل مطلب‌:
http://www.dataschool.io/comparing-supervised-learning-algorithms/

@dataanalysis
برترین کتابخانه‌های زبان برنامه‌نویسی پایتون در حوزه علم‌داده در سال 2017:
https://goo.gl/74UmP4

1. NumPy
2. SciPy
3. Pandas
4.Matplotlib
5. Seaborn
6. Bokeh
7. Plotly
8. SciKit-Learn
9.Theano
10. TensorFlow
11. Keras
12. NLTK
13. Gensim
14. Scrapy
15. Statsmodels

لینک کامل مقاله وب‌سایت kdnuggets:
http://www.kdnuggets.com/2017/06/top-15-python-libraries-data-science.html

@dataanalysis
مراحل اجرایی یک پروژه مبتنی بر علم داده:

https://goo.gl/ui6XdW

@dataanalysis
مقایسه میان ابزارهای مورد استفاده توسط مهندس داده و دانشمند علم‌داده

https://goo.gl/CkwBDp

ملاحظه:
بخش زرد: دانشمند علم‌داده
بخش آبی: مهندس داده

@dataanalysis