🏢 برترین دانشگاههای جهان که در حوزه #علم_داده میتوان اپلای تحصیلی کرد:
1️⃣ University of Washington – Seattle, Washington
🔸 Master of Science in Data Science
2️⃣ Stanford University – Stanford, California
🔸 M.S. in Statistics: Data Science
3️⃣ Georgetown University – Washington, District of Columbia
🔸 Master of Science in Analytics-Data Science
4️⃣ Southern Methodist University – Dallas, Texas
🔸 Applied MS in Statistics and Data Analytics Program (MASDA)
5️⃣ University of San Francisco – San Francisco, California
🔸 MS in Data Science
🌐 @datascienceedu | کانال آموزشی علم داده
1️⃣ University of Washington – Seattle, Washington
🔸 Master of Science in Data Science
2️⃣ Stanford University – Stanford, California
🔸 M.S. in Statistics: Data Science
3️⃣ Georgetown University – Washington, District of Columbia
🔸 Master of Science in Analytics-Data Science
4️⃣ Southern Methodist University – Dallas, Texas
🔸 Applied MS in Statistics and Data Analytics Program (MASDA)
5️⃣ University of San Francisco – San Francisco, California
🔸 MS in Data Science
🌐 @datascienceedu | کانال آموزشی علم داده
Forwarded from موسسه توسعه
⬇️ دانلود رایگان فیلم ضبط شده دیتا میتینگ 1 با عنوان "بررسی علم داده (Data Science) اکنون و آینده"
✅ این وبینار در تاریخ 8 اردیبهشت 98 برگزار شد و اکنون می توانید فیلم ضبط شده آن را رایگان دانلود کنید...
👥 دکتر ابوالفضل واقفی (پژوهشگر و مجری پروژه های #علم_داده در آمریکا)
👥 دکتر یاسر زره ساز (مشاور و مجری پروژه های #علم_داده در ایران و آمریکا)
🌟 جهت درخواست دانلود فیلم دیتا میتینگ 1 (بر روی لینک کلیک کنید): https://forms.gle/mh84rQao3qF9zZ597
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
✅ این وبینار در تاریخ 8 اردیبهشت 98 برگزار شد و اکنون می توانید فیلم ضبط شده آن را رایگان دانلود کنید...
👥 دکتر ابوالفضل واقفی (پژوهشگر و مجری پروژه های #علم_داده در آمریکا)
👥 دکتر یاسر زره ساز (مشاور و مجری پروژه های #علم_داده در ایران و آمریکا)
🌟 جهت درخواست دانلود فیلم دیتا میتینگ 1 (بر روی لینک کلیک کنید): https://forms.gle/mh84rQao3qF9zZ597
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
Google Docs
فرم درخواست فایل ویدیویی علم داده (Data Science)
فیلم جلسه دیتا میتینگ 1 (آنلاین) با موضوع "بررسی علم داده اکنون و آینده" با سخنرانی جناب آقای دکتر ابوالفضل واقفی، متخصص Data Science در آمریکا.
جهت دریافت فایل ویدیویی، لطفا فرم زیر را تکمیل نمایید.
جهت دریافت فایل ویدیویی، لطفا فرم زیر را تکمیل نمایید.
Forwarded from موسسه توسعه
⬇️ دانلود رایگان فیلم ضبط شده دیتا میتینگ 3 با عنوان "روش های اپلای و مهاجرت شغلی در حوزه Data Science"
✅ این وبینار در تاریخ 6 مرداد 98 برگزار شد و اکنون می توانید فیلم ضبط شده آن را رایگان دانلود کنید...
👤 شیدا وانویی (متخصص علم داده در آلمان)
🌟 جهت درخواست دانلود فیلم دیتا میتینگ 3 (بر روی لینک کلیک کنید): https://forms.gle/nZm7NEkJL98xRQNf8
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
✅ این وبینار در تاریخ 6 مرداد 98 برگزار شد و اکنون می توانید فیلم ضبط شده آن را رایگان دانلود کنید...
👤 شیدا وانویی (متخصص علم داده در آلمان)
🌟 جهت درخواست دانلود فیلم دیتا میتینگ 3 (بر روی لینک کلیک کنید): https://forms.gle/nZm7NEkJL98xRQNf8
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
Google Docs
فرم درخواست فایل ویدیویی علم داده (Data Science)
فیلم جلسه دیتا میتینگ 3 (آنلاین) با موضوع "روش های اپلای شغلی در حوزه Data Science" با سخنرانی سرکار خانم شیدا وانویی (متخصص علوم داده در آلمان).
جهت دریافت فایل ویدیویی، لطفا فرم زیر را تکمیل نمایید.
جهت دریافت فایل ویدیویی، لطفا فرم زیر را تکمیل نمایید.
🔆 #فرصت_شغلی #علم_داده در #آمریکا (نیوجرسی)
🌟 شرکتی با حوزه فعالیت انرژی
👁🗨 شرایط مورد نیاز:
✔️ رشته های مدیریت، کامپیوتر، آمار
✔️ مسلط به SQL، Python و R
✔️ داشتن دانش آماری و کار با نرم افزارهایی نظیر اکسل و SPSS
✔️ تجربه کار با Power BI
📬 برای ارسال رزومه می توانید از طریق لینک https://indeedhi.re/2mdyFPz اقدام نمایید.
🌐 @datascienceedu | کانال آموزشی علم داده
🌟 شرکتی با حوزه فعالیت انرژی
👁🗨 شرایط مورد نیاز:
✔️ رشته های مدیریت، کامپیوتر، آمار
✔️ مسلط به SQL، Python و R
✔️ داشتن دانش آماری و کار با نرم افزارهایی نظیر اکسل و SPSS
✔️ تجربه کار با Power BI
📬 برای ارسال رزومه می توانید از طریق لینک https://indeedhi.re/2mdyFPz اقدام نمایید.
🌐 @datascienceedu | کانال آموزشی علم داده
Indeed
Data Scientist Jobs, Employment | Indeed.com
9,373 Data Scientist jobs available on Indeed.com. Apply to Data Scientist, Entry Level Scientist, Junior Data Scientist and more!
Media is too big
VIEW IN TELEGRAM
🔸 3 نوع سوالی که در مصاحبه های مربوط به شغل های علوم داده از شما پرسیده میشود !
🎙زبان فیلم: انگلیسی
@datascienceedu | کانال آموزشی علم داده
🎙زبان فیلم: انگلیسی
@datascienceedu | کانال آموزشی علم داده
Python_for_Programmers_with_Big.pdf
26.9 MB
#دانلود_کتاب
کتاب Python for Programmers: with Big Data and Artificial Intelligence Case Studies را به عنوان مرجعی برای یادگیری پایتون به صورت کاربردی در حوزه #کلان_داده و #هوش_مصنوعی می توانید دانلود کنید.
🌐 @datascienceedu | کانال آموزشی علم داده
کتاب Python for Programmers: with Big Data and Artificial Intelligence Case Studies را به عنوان مرجعی برای یادگیری پایتون به صورت کاربردی در حوزه #کلان_داده و #هوش_مصنوعی می توانید دانلود کنید.
🌐 @datascienceedu | کانال آموزشی علم داده
Ostadkar has one open position. If you are a Senior Data Scientist, we'd be glad to have a chat.
You can also apply through jobinja:
https://lnkd.in/gbq8KVa
You can also apply through jobinja:
https://lnkd.in/gbq8KVa
Forwarded from موسسه توسعه
🏙 دوره #علم_داده در #تحلیل_کسب_و_کار (Business Analysis) با نرم افزار R
👤 با تدریس #دکتر_فرزاد_مینویی فارغ التحصیل دکتری مدیریت از دانشگاه کلورادو امریکا (مجری پروژههای علم داده در امریکا و ایران)
🔥 فارغ التحصیلی از این دوره برای افرادی که میخواهند به #اروپا، #آمریکا و #استرالیا مهاجرت شغلی یا تحصیلی داشته باشند، بسیار میتواند مفید باشد.
🔗 جزئیات و رزرو از طریق: https://bit.ly/2JqFMNk
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
👤 با تدریس #دکتر_فرزاد_مینویی فارغ التحصیل دکتری مدیریت از دانشگاه کلورادو امریکا (مجری پروژههای علم داده در امریکا و ایران)
🔥 فارغ التحصیلی از این دوره برای افرادی که میخواهند به #اروپا، #آمریکا و #استرالیا مهاجرت شغلی یا تحصیلی داشته باشند، بسیار میتواند مفید باشد.
🔗 جزئیات و رزرو از طریق: https://bit.ly/2JqFMNk
💬 @tiheac
🌐 tihe.ac.ir
📞 021-86741 (EXT: 120-125-127)
پایگاه دادهنمای شهرداری تهران برای محققین و پژوهشگران.
پژوهشگران #علوم_داده میتوانند با مراجعه به سامانه
http://data.tehran.ir/
و
https://api.tehran.ir/
از دیتاستهایی که شهرداری تهران در قالب فایل اکسل و دسترسی API منتشر کرده است استفاده کنند.
البته برخی از فایلها خیلی کم عمق هستند که امید میرود به تدریج کامل شوند.
🌐 @datascienceedu | کانال آموزشی علم داده
پژوهشگران #علوم_داده میتوانند با مراجعه به سامانه
http://data.tehran.ir/
و
https://api.tehran.ir/
از دیتاستهایی که شهرداری تهران در قالب فایل اکسل و دسترسی API منتشر کرده است استفاده کنند.
البته برخی از فایلها خیلی کم عمق هستند که امید میرود به تدریج کامل شوند.
🌐 @datascienceedu | کانال آموزشی علم داده
Forwarded from باشگاه مهندسان صنایع ایران
This media is not supported in your browser
VIEW IN TELEGRAM
🎞 Skills Needed For Data Scientist and Data Analyst
این ویدئو بعد از تعریف کوتاه تحلیلگر داده و دانشمند علمداده به مجموعه توانمندیهایی که هر یک باید داشته باشند میپردازد.
👇👇
https://news.1rj.ru/str/joinchat/AwSFtzwQWy1WFWwgCeTwbw
این ویدئو بعد از تعریف کوتاه تحلیلگر داده و دانشمند علمداده به مجموعه توانمندیهایی که هر یک باید داشته باشند میپردازد.
👇👇
https://news.1rj.ru/str/joinchat/AwSFtzwQWy1WFWwgCeTwbw
Forwarded from موسسه توسعه
🚀 #دیتا_میتینگ برگزار میکند...
🔥 دیتا میتینگ (4) با موضوع "تحلیل کسب و کار (Business Analytics) چیست؟"
📆 20 آذر 98 | چهارشنبه | 17 الی 19
👥 سخنرانان:
🔸 #دکتر_فرزاد_مینویی (دکتری مدیریت از دانشگاه کلورادو آمریکا - متخصص #علم_داده)
🔸 مهندس پوریا اولادزاد (مشاور Marketing Analytics)
🏛 با میزبانی:
🔸 دکتر مجید ایوزیان
🔗 رزرو حضور از طریق: https://bit.ly/2XIFd7q
🥇 @tiheac
🌐 tihe.ac.ir
☎️ 021-86741 (EXT: 120-125-127)
🔥 دیتا میتینگ (4) با موضوع "تحلیل کسب و کار (Business Analytics) چیست؟"
📆 20 آذر 98 | چهارشنبه | 17 الی 19
👥 سخنرانان:
🔸 #دکتر_فرزاد_مینویی (دکتری مدیریت از دانشگاه کلورادو آمریکا - متخصص #علم_داده)
🔸 مهندس پوریا اولادزاد (مشاور Marketing Analytics)
🏛 با میزبانی:
🔸 دکتر مجید ایوزیان
🔗 رزرو حضور از طریق: https://bit.ly/2XIFd7q
🥇 @tiheac
🌐 tihe.ac.ir
☎️ 021-86741 (EXT: 120-125-127)
موسسه توسعه
🚀 #دیتا_میتینگ برگزار میکند... 🔥 دیتا میتینگ (4) با موضوع "تحلیل کسب و کار (Business Analytics) چیست؟" 📆 20 آذر 98 | چهارشنبه | 17 الی 19 👥 سخنرانان: 🔸 #دکتر_فرزاد_مینویی (دکتری مدیریت از دانشگاه کلورادو آمریکا - متخصص #علم_داده) 🔸 مهندس پوریا اولادزاد…
🏛 محل همایش #دیتا_میتینگ: تهران، انتهای اتوبان نیایش غرب به شرق، نرسیده به خیابان ولیعصر (عج)، روبروی بیمارستان قلب شهید رجایی، دانشگاه شهید بهشتی، دانشکده پرستاری، طبقه 1، سالن آمفی تئاتر.
🚀 چهارشنبه 20 آذر ساعت 16:45 الی 19:00.
🔸 ورود برای عموم آزاد است...
🥇 @tiheac
🌐 tihe.ac.ir
☎️ 021-86741 (EXT: 120-125-127)
🚀 چهارشنبه 20 آذر ساعت 16:45 الی 19:00.
🔸 ورود برای عموم آزاد است...
🥇 @tiheac
🌐 tihe.ac.ir
☎️ 021-86741 (EXT: 120-125-127)
Digikala report 98-01.pdf
10.8 MB
گزارش واحد BI دیجی کالا در مورد برخی شاخصهای دیجی کالا.
یکی از ماموریتهای واحدهای BI در سازمانها تولید چنین گزارشهای برون سازمانی است.
این گزارشها به نوعی قطعهای از پازل برندسازی شرکتها نزد افکار متخصصین آن حوزه و افکار عمومی را دارند.
یکی از ماموریتهای واحدهای BI در سازمانها تولید چنین گزارشهای برون سازمانی است.
این گزارشها به نوعی قطعهای از پازل برندسازی شرکتها نزد افکار متخصصین آن حوزه و افکار عمومی را دارند.
#استخدام
✅ سربازی خود را در شرکت دانش بنیان دیتاک بگذرانید
#امریه_سربازی
#دانش_بنیان
🔶 مجموعه دانش بنیان دیتاک از متخصصان مشمول خدمت نظام وظیفه، در زمینههای #علوم_داده، #هوش_مصنوعی و #کلان_داده دعوت میکند با پیوستن به تیم دیتاک، از تسهیلات خدمت نظام وظیفه تخصصی بهره ببرند.
🔶 ارسال رزومه talent@dataak.com
🌐 @datascienceedu | کانال آموزشی علم داده
✅ سربازی خود را در شرکت دانش بنیان دیتاک بگذرانید
#امریه_سربازی
#دانش_بنیان
🔶 مجموعه دانش بنیان دیتاک از متخصصان مشمول خدمت نظام وظیفه، در زمینههای #علوم_داده، #هوش_مصنوعی و #کلان_داده دعوت میکند با پیوستن به تیم دیتاک، از تسهیلات خدمت نظام وظیفه تخصصی بهره ببرند.
🔶 ارسال رزومه talent@dataak.com
🌐 @datascienceedu | کانال آموزشی علم داده
Forwarded from باشگاه مهندسان صنایع ایران
Big Data for Dummies.pdf
7.7 MB
کتاب آموزشی " عظیمداده به زبان ساده"
این کتاب به ما میگوید که عظیمداده چیست و چگونه سازمانها میتوانند از عظیمداده بهعنوان اهرمی برای اتخاذ تصمیمات بزرگتر و کاراتر (نسبت به قبل) استفاده کنند.
https://news.1rj.ru/str/joinchat/AwSFtzwQWy1WFWwgCeTwbw
این کتاب به ما میگوید که عظیمداده چیست و چگونه سازمانها میتوانند از عظیمداده بهعنوان اهرمی برای اتخاذ تصمیمات بزرگتر و کاراتر (نسبت به قبل) استفاده کنند.
https://news.1rj.ru/str/joinchat/AwSFtzwQWy1WFWwgCeTwbw
به تازگی آقای جادی میرمیرانی یک مطلب تو سایت شون نوشتن (ترجمه کردن) بر پایه یک راهنمای خوبی انگلیسی برای تبدیل شدن به یک دانشمند داده.
این مطلب رو براتون اینجا نقل کردیم، در پایان هم لینک مطلب اصلی و لینک مطلب ایشون هست.
مسیر تبدیل شدن به یک دانشمند داده / دیتاساینتیست
این روزها دیتاساینس داره از پیک مد بودن میاد پایین و در نتیجه زمان خوبیه که تصمیم بگیرین دوستش دارین یا نه. از اونطرف دیتاساینس مسیر دیتاساینس شامل چیزهای زیادی است که هم خوبه هم بد. خوبه چون کلی مهارت متنوع توش یاد میگیرین که جاهای دیگه هم به درد میخوره و بده چون سخته و بزرگتر از چیزهایی مثل مثلا مدیرسیستمی. اما چیزهای سخت جالبن! پس اگر اهلش هستین، سعی کردم یه جمع بندی از چیزهایی که برای تبدیل شدن به یه دانشمند داده لازمه جمع آوری کنم. در واقع اینهای قدم های منطقی ای هستن برای وارد شدن به این حوزه؛ با یادآوری اینکه این حوزه بسیار وسیعه و شما در نهایت یه کناریش یه تخصص اصلی پیدا خواهید کرد. مثلا ممکنه شما فقط آمار بلد باشین و در یک تیم دانشمند داده حساب بشین یا فقط متخصص راه اندازی نودهای یک سیستم بیگ دیتا باشین و در تیمی کار کنین که بهش می گن گروه دیتا ساینتیست ها در حالی که شما شخصا اصلا کاری ندارین که این دیتاها چی هستن (: خلاصه… کلیت رو که بدونین، مسیر خودتون رو راحتتر پیدا می کنین. این مسیر احتمالا از اینجاها می گذره:
زبان برنامه نویسی مرتبط
دیتاساینتیستها، لازم دارن دادهها رو انگولک کنن و چه مهارتی مفیدتر از برنامه نویسی؟ توی این جامعه سوال همیشگی «آر یا پایتون» است (و البته رقبای دیگهای مثل جولیا) ولی انتظار میره شما [بدونین که هیچ زبانی بهتر از اون یکی نیست و هر چیزی کاربرد خودش رو داره]. اما در نهایت لازمه شما با یکی از زبانهای مرتبط که فعلا آر یا پایتون است، آشنایی قابل قبولی داشته باشین. من به هر دو علاقه دارم ولی الان به پایتون نزدیکتر هستم. خوبی یاد گرفتن پایتون هم اینه که شما با دونستنش، در حوزههایی بسیار وسیعتر از کار با دادهها، توانمند شدین.
لینوکس و ابزارهاش
خیلی وقتها دیتاهای شما در فایلهایی است که باید بتونین نگاهش کنین، تغییرش بدین، پایپش کنین، فیلترش کنین و کارهای مشابه. لازمه بتونین در سیستم عاملتون نسبتا راحت باشین بخصوص که فایلهاتون معمولا بزرگه و نامرتب و توانایی درست کار کردن باهاشون، بسیار حیاتی. یه دانشمند داده خیلی خوبه که به سیستم عاملش مسلط باشه.
اکسل
بله (: به شکل بامزهای اکسل به تنهایی ممکنه کلی کلی از کارهای شما رو راه بندازه. بلد بودن حرفه ای اکسل تقریبا بهترین توصیه ای است که می شه به هر کسی که با کامپیوتر کار می کنه کرد. نمونه آزاد و متن باز اکسل مایکروسافت، calc از مجموعه libreoffice است که بسیاری از قابلیت ها رو داره و در جاهایی حتی بهتره – و در جاهایی بدتر. اکسل رو خوب بلد باشین که گاهی کل کاری که دیتاساینتیستها میکنن، تو اکسل خلاصه میشه (: البته اکسلی هاشون!
ویژوالایزیشن
مهارت مهم دیگه، مهارت نمایش دادهها است. اینکار گاهی تو خود زبان برنامه نویسی و خیلی ساده و سرراست انجام میشه و گاهی بیسار هنرمندانه و با برنامههای گرافیکی و گاهی با ابزارهایی مثل تبلو. با هر چی که کار می کنین، باید بدونین این لایهای است که نتیجه کل کار شما رو به یک مدیر رده بالا نشون می ده یا باعث میشه عموم با محصول فکر شما ارتباط برقرار کنن. این مرحله مهمه و خوبه روش وقت بذارین. در دنیای پایتون شاید این کتاب خوب باشه ولی دونستن ابزارهایی مثل تبلو و ممکنه در شاخههای دیگه ای به شما کمک کنه.
پایگاههای داده
حواستون هست که دانشمند داده با دادهها کار می کنه دیگه؟ و خیلی وقتها این دادهها در انواع پایگاههای داده هستن. اگر شما مایاسکوئل، پستگره و مایکروسافت اسکوئل سرور رو بلد باشین کلی جلو هستین؛ چه برسه به آگاهی عمومی در مورد چیزهایی مثل مونگو و حتی سیستمهایی مثل اسپارک و مپ ریدوس. یادتونه گفتم برنامه نویسی هم مهمه؟ خیلی وقتها شما با اسکرپ کردن وب یا ای پی آی ها، دارین دیتاهای خودتون رو توی دیتابیسهاتون میریزین.
آمار و ریاضی
تا اینجا از بحث های فنی حرف زدیم ولی شما قراره دانشمند باشین نه تکنیسین! در دنیای ریاضی، لازمه مفاهیم اولیه و چیزهایی مثل نمونهگیری و توزیعها و میانگین و میانگین وزنی و مد و میانه و این چیزها رو بدونین. همچون احتمالات و توزیعهای احتمالی و مفاهیم پیشرفتهتری مثل آزمونهای آماری و اعتبار و خی اسکوئر و دوستانش. برای نمونه به این کتاب و این یکی کتاب مراجعه کنین.
این مطلب رو براتون اینجا نقل کردیم، در پایان هم لینک مطلب اصلی و لینک مطلب ایشون هست.
مسیر تبدیل شدن به یک دانشمند داده / دیتاساینتیست
این روزها دیتاساینس داره از پیک مد بودن میاد پایین و در نتیجه زمان خوبیه که تصمیم بگیرین دوستش دارین یا نه. از اونطرف دیتاساینس مسیر دیتاساینس شامل چیزهای زیادی است که هم خوبه هم بد. خوبه چون کلی مهارت متنوع توش یاد میگیرین که جاهای دیگه هم به درد میخوره و بده چون سخته و بزرگتر از چیزهایی مثل مثلا مدیرسیستمی. اما چیزهای سخت جالبن! پس اگر اهلش هستین، سعی کردم یه جمع بندی از چیزهایی که برای تبدیل شدن به یه دانشمند داده لازمه جمع آوری کنم. در واقع اینهای قدم های منطقی ای هستن برای وارد شدن به این حوزه؛ با یادآوری اینکه این حوزه بسیار وسیعه و شما در نهایت یه کناریش یه تخصص اصلی پیدا خواهید کرد. مثلا ممکنه شما فقط آمار بلد باشین و در یک تیم دانشمند داده حساب بشین یا فقط متخصص راه اندازی نودهای یک سیستم بیگ دیتا باشین و در تیمی کار کنین که بهش می گن گروه دیتا ساینتیست ها در حالی که شما شخصا اصلا کاری ندارین که این دیتاها چی هستن (: خلاصه… کلیت رو که بدونین، مسیر خودتون رو راحتتر پیدا می کنین. این مسیر احتمالا از اینجاها می گذره:
زبان برنامه نویسی مرتبط
دیتاساینتیستها، لازم دارن دادهها رو انگولک کنن و چه مهارتی مفیدتر از برنامه نویسی؟ توی این جامعه سوال همیشگی «آر یا پایتون» است (و البته رقبای دیگهای مثل جولیا) ولی انتظار میره شما [بدونین که هیچ زبانی بهتر از اون یکی نیست و هر چیزی کاربرد خودش رو داره]. اما در نهایت لازمه شما با یکی از زبانهای مرتبط که فعلا آر یا پایتون است، آشنایی قابل قبولی داشته باشین. من به هر دو علاقه دارم ولی الان به پایتون نزدیکتر هستم. خوبی یاد گرفتن پایتون هم اینه که شما با دونستنش، در حوزههایی بسیار وسیعتر از کار با دادهها، توانمند شدین.
لینوکس و ابزارهاش
خیلی وقتها دیتاهای شما در فایلهایی است که باید بتونین نگاهش کنین، تغییرش بدین، پایپش کنین، فیلترش کنین و کارهای مشابه. لازمه بتونین در سیستم عاملتون نسبتا راحت باشین بخصوص که فایلهاتون معمولا بزرگه و نامرتب و توانایی درست کار کردن باهاشون، بسیار حیاتی. یه دانشمند داده خیلی خوبه که به سیستم عاملش مسلط باشه.
اکسل
بله (: به شکل بامزهای اکسل به تنهایی ممکنه کلی کلی از کارهای شما رو راه بندازه. بلد بودن حرفه ای اکسل تقریبا بهترین توصیه ای است که می شه به هر کسی که با کامپیوتر کار می کنه کرد. نمونه آزاد و متن باز اکسل مایکروسافت، calc از مجموعه libreoffice است که بسیاری از قابلیت ها رو داره و در جاهایی حتی بهتره – و در جاهایی بدتر. اکسل رو خوب بلد باشین که گاهی کل کاری که دیتاساینتیستها میکنن، تو اکسل خلاصه میشه (: البته اکسلی هاشون!
ویژوالایزیشن
مهارت مهم دیگه، مهارت نمایش دادهها است. اینکار گاهی تو خود زبان برنامه نویسی و خیلی ساده و سرراست انجام میشه و گاهی بیسار هنرمندانه و با برنامههای گرافیکی و گاهی با ابزارهایی مثل تبلو. با هر چی که کار می کنین، باید بدونین این لایهای است که نتیجه کل کار شما رو به یک مدیر رده بالا نشون می ده یا باعث میشه عموم با محصول فکر شما ارتباط برقرار کنن. این مرحله مهمه و خوبه روش وقت بذارین. در دنیای پایتون شاید این کتاب خوب باشه ولی دونستن ابزارهایی مثل تبلو و ممکنه در شاخههای دیگه ای به شما کمک کنه.
پایگاههای داده
حواستون هست که دانشمند داده با دادهها کار می کنه دیگه؟ و خیلی وقتها این دادهها در انواع پایگاههای داده هستن. اگر شما مایاسکوئل، پستگره و مایکروسافت اسکوئل سرور رو بلد باشین کلی جلو هستین؛ چه برسه به آگاهی عمومی در مورد چیزهایی مثل مونگو و حتی سیستمهایی مثل اسپارک و مپ ریدوس. یادتونه گفتم برنامه نویسی هم مهمه؟ خیلی وقتها شما با اسکرپ کردن وب یا ای پی آی ها، دارین دیتاهای خودتون رو توی دیتابیسهاتون میریزین.
آمار و ریاضی
تا اینجا از بحث های فنی حرف زدیم ولی شما قراره دانشمند باشین نه تکنیسین! در دنیای ریاضی، لازمه مفاهیم اولیه و چیزهایی مثل نمونهگیری و توزیعها و میانگین و میانگین وزنی و مد و میانه و این چیزها رو بدونین. همچون احتمالات و توزیعهای احتمالی و مفاهیم پیشرفتهتری مثل آزمونهای آماری و اعتبار و خی اسکوئر و دوستانش. برای نمونه به این کتاب و این یکی کتاب مراجعه کنین.
یادگیری ماشین
موضوع داغ این روزها، یادگیری ماشین است. الگوریتمهایی که بعد از اجراشون حس میکنیم ماشینها به شکل جادویی چیزی رو یاد گرفتن که ما به خوبی ازش سردرنمیاریم. برای درک مساله، خوبه حداقل این ده الگوریتم رو بلد باشین: linear regression ،logistic regression ،SVM ،random forests ،Gradient Boosting ،PCA ،k-means ،collaborative filtering ،k-NN و ARIMA. در این بخش همچنین لازمه بفهمیم که چطوری باید پرفرمنس یه مدل رو سنجید، آپتییمایز کرد، کراس ولدیت کرد، توابع خطی و غیرخطی رو دونست و جبرخطی و حسابان رو بلد بود. البته لیست دونستیها اینجا زیاده مثلا overfitting و شبکههای عصبی و درخت تصمیم و … و البته چیزهای بزرگی مثل هوش مصنوعی و تفسیر زبان طبیعی و … اگر در دنیای پایتون هستین دونستن کتابخونههایی مثل میتونه خط شروع خیلی خوبی به شما بده.
اما…
اما اینها فقط دانش عمومی است. برای تبدیل شدن به یه متخصص خوب شما باید یک مهارت دقیقتر هم داشته باشین. مثلا اینها رو بدونین ولی روی مثلا پردازش زبان طبیعی بیشتر کار کرده باشین. یا روی بینایی ماشین یا اصولا اطلاعاتتون از مفاهیم مرتبط با تشخیص تقلب زیاد باشه و موارد مشابه یا سراغ چیزهای مد روزتر مثل یادگیری عمیق یا سیستمهایی که خودشون قواعد بازی رو کشف می کنن و اینها برین و ببینین چی دوست دارین و ادامه اش بدین.
درست کردن اعتبار
اما کسی با دانش صرف شناخته نمیشه. شروع کنین به کار عملی. پروژههای نمونه انجام بدین. دیتاهایی که بهش دسترسی دارین رو تفسیر و تحلیل کنین و نتایج و فرمول ها و پیش بینی های جالب بیرون بکشین. یا اصولا از سایت های پر داده ای مثل دیجیکالا و دیوار و شیپور و ایسام و بقیه دیتا در بیارین و یه کار جالب بکنین. اگر خودتون رو سطح بالاتر می بینین می تونین سراغ سایت هایی مثل کگل برین و اسم و رسمی به هم بزنین، حتی اون پایین مایینهاش – اونجاها هم به اندازه کافی مهمن!
حرف آخر
این رو هم بگم که این دنیا خیلی بزرگه. من هم متخصصش نیستم و جمع آوری کننده هستم. همونطور که اول بحث گفتم، این حوزه بسیار بزرگه و باز و جای کار زیادی هم داره. لازمه با جامعه اش پیوند بخورین و مقاله بخونین و ببینین بقیه چیکار می کنن و چه نیازهایی دارن. هم با ابزارهای متنوع ور برین و هم با دادههای مختلف کار کنین و سعی کنین مسائل رو حل کنین. بخشی مهمی از دنیای دیتاساینس، بهتر کردن چیزهایی است که وجود دارن. این رو هم بدونین که مثل بقیه کارها، بخش بزرگی از کار ماجرای علمی اش نیست بلکه ماجرای تکنیسینی است. خیلی وقت ها داده کثیفن و شما کد می نویسین که کمی تمیزشون کنین. خیلی وقت ها فرمت دیتا مناسب نیست و باید یکسانشون کنین. خیلی وقت ها دیتا اونقدر بزرگه که روی یک کامپیوتر جا نمی شه و باید یه فکری بکنین و غیره و غیره. حوصلهتون سر نره و با هیجان و لذت پیش برین و مساله طرح و حل کنین و چیز جدید یاد بگیرین و به زودی اسم خوبی برای خودتون درست خواهید کرد!
لینک 1
لینک2
موضوع داغ این روزها، یادگیری ماشین است. الگوریتمهایی که بعد از اجراشون حس میکنیم ماشینها به شکل جادویی چیزی رو یاد گرفتن که ما به خوبی ازش سردرنمیاریم. برای درک مساله، خوبه حداقل این ده الگوریتم رو بلد باشین: linear regression ،logistic regression ،SVM ،random forests ،Gradient Boosting ،PCA ،k-means ،collaborative filtering ،k-NN و ARIMA. در این بخش همچنین لازمه بفهمیم که چطوری باید پرفرمنس یه مدل رو سنجید، آپتییمایز کرد، کراس ولدیت کرد، توابع خطی و غیرخطی رو دونست و جبرخطی و حسابان رو بلد بود. البته لیست دونستیها اینجا زیاده مثلا overfitting و شبکههای عصبی و درخت تصمیم و … و البته چیزهای بزرگی مثل هوش مصنوعی و تفسیر زبان طبیعی و … اگر در دنیای پایتون هستین دونستن کتابخونههایی مثل میتونه خط شروع خیلی خوبی به شما بده.
اما…
اما اینها فقط دانش عمومی است. برای تبدیل شدن به یه متخصص خوب شما باید یک مهارت دقیقتر هم داشته باشین. مثلا اینها رو بدونین ولی روی مثلا پردازش زبان طبیعی بیشتر کار کرده باشین. یا روی بینایی ماشین یا اصولا اطلاعاتتون از مفاهیم مرتبط با تشخیص تقلب زیاد باشه و موارد مشابه یا سراغ چیزهای مد روزتر مثل یادگیری عمیق یا سیستمهایی که خودشون قواعد بازی رو کشف می کنن و اینها برین و ببینین چی دوست دارین و ادامه اش بدین.
درست کردن اعتبار
اما کسی با دانش صرف شناخته نمیشه. شروع کنین به کار عملی. پروژههای نمونه انجام بدین. دیتاهایی که بهش دسترسی دارین رو تفسیر و تحلیل کنین و نتایج و فرمول ها و پیش بینی های جالب بیرون بکشین. یا اصولا از سایت های پر داده ای مثل دیجیکالا و دیوار و شیپور و ایسام و بقیه دیتا در بیارین و یه کار جالب بکنین. اگر خودتون رو سطح بالاتر می بینین می تونین سراغ سایت هایی مثل کگل برین و اسم و رسمی به هم بزنین، حتی اون پایین مایینهاش – اونجاها هم به اندازه کافی مهمن!
حرف آخر
این رو هم بگم که این دنیا خیلی بزرگه. من هم متخصصش نیستم و جمع آوری کننده هستم. همونطور که اول بحث گفتم، این حوزه بسیار بزرگه و باز و جای کار زیادی هم داره. لازمه با جامعه اش پیوند بخورین و مقاله بخونین و ببینین بقیه چیکار می کنن و چه نیازهایی دارن. هم با ابزارهای متنوع ور برین و هم با دادههای مختلف کار کنین و سعی کنین مسائل رو حل کنین. بخشی مهمی از دنیای دیتاساینس، بهتر کردن چیزهایی است که وجود دارن. این رو هم بدونین که مثل بقیه کارها، بخش بزرگی از کار ماجرای علمی اش نیست بلکه ماجرای تکنیسینی است. خیلی وقت ها داده کثیفن و شما کد می نویسین که کمی تمیزشون کنین. خیلی وقت ها فرمت دیتا مناسب نیست و باید یکسانشون کنین. خیلی وقت ها دیتا اونقدر بزرگه که روی یک کامپیوتر جا نمی شه و باید یه فکری بکنین و غیره و غیره. حوصلهتون سر نره و با هیجان و لذت پیش برین و مساله طرح و حل کنین و چیز جدید یاد بگیرین و به زودی اسم خوبی برای خودتون درست خواهید کرد!
لینک 1
لینک2
Medium
A Road Map for Data Science
What is Data Science?
Forwarded from ElmYab - علمیاب
This media is not supported in your browser
VIEW IN TELEGRAM
رفتار پایتون با فریمورکها و ابزارهای مختلف حوزه علم داده (Data Science)
#علم_داده
#هوش_مصنوعی
#یادگیری_ماشین
#برنامه_نویسی
@elmyab — علمیاب
@FaraDarsMag — مجله فرادرس
رفتار پایتون با فریمورکها و ابزارهای مختلف حوزه علم داده (Data Science)
#علم_داده
#هوش_مصنوعی
#یادگیری_ماشین
#برنامه_نویسی
@elmyab — علمیاب
@FaraDarsMag — مجله فرادرس