✔️ #کوییز شماره نُه
💎 کدام یک از مراحل ذیل جزو گام های پیش #پردازش_متن در فیلد #پردازش_زبان_طبیعی نیست؟
💎 کدام یک از مراحل ذیل جزو گام های پیش #پردازش_متن در فیلد #پردازش_زبان_طبیعی نیست؟
Anonymous Quiz
19%
Tokenization
12%
Normalization
17%
Noise removal
14%
Convert number words to numeric form
14%
Lemmatization
7%
Convert accented characters to ASCII characters
16%
Word Embedding
📣 سخنرانی #داده_محور
🏛 دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف
📖 Design and Implementation of Privacy-Preserving Personalized Analytics Systems on the Edge
👨💻 By Professor Hamed Haddadi
🌐BigDataWorld.ir
🖥@BigDataSchool
🏛 دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف
📖 Design and Implementation of Privacy-Preserving Personalized Analytics Systems on the Edge
👨💻 By Professor Hamed Haddadi
🌐BigDataWorld.ir
🖥@BigDataSchool
https://digipostal.ir/rezacard
🌸ولادت امام رضا علیه السلام بر شما مبارک باد.🌸
🌐BigDataWorld.ir
🖥@BigDataSchool
🌸ولادت امام رضا علیه السلام بر شما مبارک باد.🌸
🌐BigDataWorld.ir
🖥@BigDataSchool
کارت پستال دیجیتال
کارت پستال ولادت امام رضا(ع)
کارت پستال ولادت با سعادت امام رضا(ع) بر شما و خانواده محترمتان مبارک, هشتمین ستاره - امین فیاض, کارت پستال ولادت امام رضا(ع) - کارت پستال دیجیتال
📑 مفهوم کلانداده
در مدلهای دادهای سنتی، بیشتر دادههایی که در سازمانها وجود داشتند شامل مواردی مثل نام محصولات، مشتریان، فروشندگان و مواردی مشابه بود که پيچيدگي خاصي نداشتند. امروزه با نوع دادهاي بسيار زياد، مختلف، و با پيچيدگي بسيار بيشتر سروکار داريم که مديريت، سازماندهي، و نگهداري آنها مساله مهمي است.
📘 طبق آمار، ۹۰ درصد دادههای موجود در جهان تنها در دو سال اخیر ایجاد شدهاند. رشد دادهها در سال ۲۰۰۹ چیزی در حدود ۰.۸ زتابایت (۰.۸ ZB) بوده است که پیشبینی ميشود اين مقدار در سال ۲۰۲۰ به ۳۲ ZB افزايش يابد.
☑️ رشد دادهها همچنان مانند گذشته وجود دارد ولی رشد آنها امروزه بسیار سریعتر شده است.
☑️ امروزه رشد دادهها به طور چشمگیری در زمینهی دادههای غیر ساخت یافته صورت میگیرد.
امروزه کلانداده توسط منابع مختلفی مانند دستگاههای موبایل، GPS، RFID، شبکههای اجتماعی، مشتریان و بسیاری از منابع دیگر توليد ميشود.
🔰 تعریف کلانداده
برای کلاندادهها تعاریف متعددی ارائه شده است که در زیر به چند مورد از آنها اشاره میشود:
☑️ به طور عمومی کلانداده عبارت است از مجموعه دادههایی که به روشهای سنتی موجود در فناوری اطلاعات، نرمافزارها و سختافزار و در یک زمان قابل قبول قادر به جمعآوری، درک، و مدیريت نباشند.
☑️ تعریف Apache Hadoop در سال ۲۰۱۰ برای کلانداده: کلانداده عبارت است از مجموعه دادههایی که باتوجه به کامپیوترهای موجود براحتی قابل جمعآوری، مدیريت، و پردازش نباشند.
برای کلاندادهها یکسری چالش و فرصت معرفی شده که به صورت مدل ۳V بیان میشود و شامل افزایش حجم، شتاب، و تنوع میباشد.
۱. حجم (Volume): با تولید و جمعآوری دادهها در نهایت به انبوهی از دادهها دست مییابیم که گسترهی آنها بسیار زياد است.
۲. شتاب (Velocity): دادهها با سرعت زیادی تولید میشوند و نیاز به تحلیل سریع و به موقع است.
۳. تنوع (Variety): به معنی وجود انواع مختلف دادهها است که خود شامل دادههای ساخت یافته، نیمه ساخت یافته و غیرساخت یافته است مانند ویدئو، صوت، متن، و صفحات وب.
📽 چرخهی حیات کلانداده
چرخهی حیات کلانداده را میتوان یک حلقه از چهار عملیات زیر در نظر گرفت:
۱. جمعآوری (Collection): شامل جمعآوری دادههای مناسب از مجموعهی دادهای مناسب است. برای مثال جمعآوری دادهها میتوانند از یک شبکهي اجتماعي يا شبکههاي حسگر بيسيم باشند.
۲. یکپارچهسازی (Integrate): دادههای جمعآوری شده با یکدیگر یکپارچه و سازماندهی (Organize) میشوند. گاهي ممکن است مجبور شويم آنها را با مجموعهي دادهاي خود منطبق کنيم.
۳. تحلیل (Analysis): در این بخش میتوان تحلیلهای ساده و یا تحلیلهای پیشرفتهي آماري بر روي دادهها انجام داد.
۴. تصمیمگیریها و اقدامات (Actions Decisions): بعد از جمعآوری، یکپارچهسازی، و تحلیل دادهها میتوان آنها را به مدیر تحويل داد و بر اساس اين دادهها مدير ميتواند اقدامات لازم و مفيد را اجرا کند. براي مثال اگر شما يک کتاب در زمينهي علوم کامپيوتر از آمازون خريداري کنيد، ممکن است به شما پيشنهاد خريد کتابي در زمينهي کلانداده نيز ارائه شود.
امکاناتی مثل تحلیل دادهها به تحلیلگران کمک میکنند تا با کلاندادهها براحتی کار کنند.
نوشته ای از دکتر مجید آراسته
🌐BigDataWorld.ir
🖥@BigDataSchool
در مدلهای دادهای سنتی، بیشتر دادههایی که در سازمانها وجود داشتند شامل مواردی مثل نام محصولات، مشتریان، فروشندگان و مواردی مشابه بود که پيچيدگي خاصي نداشتند. امروزه با نوع دادهاي بسيار زياد، مختلف، و با پيچيدگي بسيار بيشتر سروکار داريم که مديريت، سازماندهي، و نگهداري آنها مساله مهمي است.
📘 طبق آمار، ۹۰ درصد دادههای موجود در جهان تنها در دو سال اخیر ایجاد شدهاند. رشد دادهها در سال ۲۰۰۹ چیزی در حدود ۰.۸ زتابایت (۰.۸ ZB) بوده است که پیشبینی ميشود اين مقدار در سال ۲۰۲۰ به ۳۲ ZB افزايش يابد.
☑️ رشد دادهها همچنان مانند گذشته وجود دارد ولی رشد آنها امروزه بسیار سریعتر شده است.
☑️ امروزه رشد دادهها به طور چشمگیری در زمینهی دادههای غیر ساخت یافته صورت میگیرد.
امروزه کلانداده توسط منابع مختلفی مانند دستگاههای موبایل، GPS، RFID، شبکههای اجتماعی، مشتریان و بسیاری از منابع دیگر توليد ميشود.
🔰 تعریف کلانداده
برای کلاندادهها تعاریف متعددی ارائه شده است که در زیر به چند مورد از آنها اشاره میشود:
☑️ به طور عمومی کلانداده عبارت است از مجموعه دادههایی که به روشهای سنتی موجود در فناوری اطلاعات، نرمافزارها و سختافزار و در یک زمان قابل قبول قادر به جمعآوری، درک، و مدیريت نباشند.
☑️ تعریف Apache Hadoop در سال ۲۰۱۰ برای کلانداده: کلانداده عبارت است از مجموعه دادههایی که باتوجه به کامپیوترهای موجود براحتی قابل جمعآوری، مدیريت، و پردازش نباشند.
برای کلاندادهها یکسری چالش و فرصت معرفی شده که به صورت مدل ۳V بیان میشود و شامل افزایش حجم، شتاب، و تنوع میباشد.
۱. حجم (Volume): با تولید و جمعآوری دادهها در نهایت به انبوهی از دادهها دست مییابیم که گسترهی آنها بسیار زياد است.
۲. شتاب (Velocity): دادهها با سرعت زیادی تولید میشوند و نیاز به تحلیل سریع و به موقع است.
۳. تنوع (Variety): به معنی وجود انواع مختلف دادهها است که خود شامل دادههای ساخت یافته، نیمه ساخت یافته و غیرساخت یافته است مانند ویدئو، صوت، متن، و صفحات وب.
📽 چرخهی حیات کلانداده
چرخهی حیات کلانداده را میتوان یک حلقه از چهار عملیات زیر در نظر گرفت:
۱. جمعآوری (Collection): شامل جمعآوری دادههای مناسب از مجموعهی دادهای مناسب است. برای مثال جمعآوری دادهها میتوانند از یک شبکهي اجتماعي يا شبکههاي حسگر بيسيم باشند.
۲. یکپارچهسازی (Integrate): دادههای جمعآوری شده با یکدیگر یکپارچه و سازماندهی (Organize) میشوند. گاهي ممکن است مجبور شويم آنها را با مجموعهي دادهاي خود منطبق کنيم.
۳. تحلیل (Analysis): در این بخش میتوان تحلیلهای ساده و یا تحلیلهای پیشرفتهي آماري بر روي دادهها انجام داد.
۴. تصمیمگیریها و اقدامات (Actions Decisions): بعد از جمعآوری، یکپارچهسازی، و تحلیل دادهها میتوان آنها را به مدیر تحويل داد و بر اساس اين دادهها مدير ميتواند اقدامات لازم و مفيد را اجرا کند. براي مثال اگر شما يک کتاب در زمينهي علوم کامپيوتر از آمازون خريداري کنيد، ممکن است به شما پيشنهاد خريد کتابي در زمينهي کلانداده نيز ارائه شود.
امکاناتی مثل تحلیل دادهها به تحلیلگران کمک میکنند تا با کلاندادهها براحتی کار کنند.
نوشته ای از دکتر مجید آراسته
🌐BigDataWorld.ir
🖥@BigDataSchool
کوییز شماره ۹
کدام یک از موارد زیر در رابطه با Hadoop و Spark صحیح نیست؟
کدام یک از موارد زیر در رابطه با Hadoop و Spark صحیح نیست؟
Anonymous Quiz
16%
هر دو پلتفرم های پردازش داده هستند
14%
هر دو محیط های پردازش کلاسترینگ هستند
23%
هر دو از API های متن باز به منظور اتصال ابزارهای مختلف استفاده می کنند
47%
هر دو دارای فایل سیستم اختصاصی مجزی هستند
کوییز شماره 10
کدام یک از گزینه های ذیل، دلیل اصلی سرعت بیشتر Spark نسبت به Map Reduce Parallel Programming مدل است؟ #کوییز
کدام یک از گزینه های ذیل، دلیل اصلی سرعت بیشتر Spark نسبت به Map Reduce Parallel Programming مدل است؟ #کوییز
Anonymous Quiz
14%
داده ساختارهای RDD غیرقابل دستکاری هستند و از قابلیت تحمل خطا برخوردارند
25%
چارچوب پردازشی Spark دارای API های مجزی برای زبان های Scala, Java, Python, R می باشد
49%
موتور اجرایی گرافِ جهت دارِ غیر مُدَوَّر موسوم به DAG و مُقیم در حافظه بودن Spark
12%
هیچ کدام
#بورس #تحصیلی کشور مالزی جهت ادامه تحصیل در مقاطع کارشناسی ارشد و دکتری
🌐BigDataWorld.ir
🖥@BigDataSchool
🌐BigDataWorld.ir
🖥@BigDataSchool
کانال انگلیسیِ ویژه آموزش های پروژه محور در حوزه ماشین لرنینگ، دیپ لرنینگ، پردازش زبان طبیعی و بیگ دیتا افتتاح شد. در این کانال لینک مقالات آموزشی، پروژه های تکنیکال و اخبار تخصصی حوزه های مذکور قرار می گیرد. در صورت علاقه مندی، می تونید مطالب رو دنبال کنید.
لینک کانال
آیدی: @BigData_School
#ماشین_لرنینگ
#دیپ_لرنینگ
#پردازش_زبان_طبیعی
#بیگ_دیتا
🌐BigDataWorld.ir
🖥@BigDataSchool
لینک کانال
آیدی: @BigData_School
#ماشین_لرنینگ
#دیپ_لرنینگ
#پردازش_زبان_طبیعی
#بیگ_دیتا
🌐BigDataWorld.ir
🖥@BigDataSchool
Telegram
BigData Science School
Persian Channel
@BigDataSchool
Platfrom
BigDataworld.ir
Channel
linkedin.com/company/bigdataschool1
Group
https://www.linkedin.com/groups/8944834
LinkedIn
linkedin.com/in/mohammadheydari/
@BigDataSchool
Platfrom
BigDataworld.ir
Channel
linkedin.com/company/bigdataschool1
Group
https://www.linkedin.com/groups/8944834
linkedin.com/in/mohammadheydari/
💎 💎 💎 جشنواره تابستانه مدرسه بیگ دیتا
🎁🎁🎁 تخفیف ویژه دوره های آموزشی آنلاین
🌐BigDataWorld.ir
🖥@BigDataSchool
💻@BigData_School
🎁🎁🎁 تخفیف ویژه دوره های آموزشی آنلاین
🌐BigDataWorld.ir
🖥@BigDataSchool
💻@BigData_School
Forwarded from Dr. Amin Nezarat
BDVA_SMI_Whitepaper_2020.pdf
1.9 MB
گزارش سال 2020 از چالشهای صنایع تولیدی هوشمند در اتحادیه اروپا در زمینه بیگ دیتا
💎 آشنایی با پتلفرم هوش تجاری Power BI
📑 تو این مقاله با پلتفرم هوش تجاری Power BI بیشتر آشنا می شیم و امکانات کلیدی اش رو بهتر می شناسیم.
☑️ لینک مقاله در مدرسه بیگ دیتا
#powerbi
#businessIntelligence
#reporting
#Visualization
🌐BigDataWorld.ir
🖥BigDataSchool
💻BigData_School
📑 تو این مقاله با پلتفرم هوش تجاری Power BI بیشتر آشنا می شیم و امکانات کلیدی اش رو بهتر می شناسیم.
☑️ لینک مقاله در مدرسه بیگ دیتا
#powerbi
#businessIntelligence
#reporting
#Visualization
🌐BigDataWorld.ir
🖥BigDataSchool
💻BigData_School
👍1
Forwarded from Dr. Amin Nezarat
سلام
دوستانی که فرصت نکردند محتوای گردهمایی مجازی Spark Summit 2020 را مشاهده و دنبال کنند می توانند تمامی محتوای ارائه شده را در لینک زیر مشاهده کنند:
https://databricks.com/sparkaisummit/north-america-2020/agenda
دوستانی که فرصت نکردند محتوای گردهمایی مجازی Spark Summit 2020 را مشاهده و دنبال کنند می توانند تمامی محتوای ارائه شده را در لینک زیر مشاهده کنند:
https://databricks.com/sparkaisummit/north-america-2020/agenda
Databricks
Spark AI NA Summit 2020 Schedule - Databricks
Databricks Spark AI Summit is the world's largest data & machine learning conference in the world. Review the 2020 Schedule for this year's program info.
💎 دوره آموزشی آنلاین Big Data
☑️ با محوریت کار با کتابخانه های کلیدی و مطرح در حوزه Data Science بر اساس زبان Python نظیر Pandas, Matplotlib, Seaborn, Scikit-Learn, NLTK, NetworkX،
✔️ کار با ابزارهای کلیدی دنیای بیگ دیتا نظیر Hadoop Ecosystem و Apache Spark Stack
🕰 شروع دوره از یکم مرداد ماه تا یکم مهر ماه
🎁 یکصدهزار تومان، تخفیفِ ثبت نامِ زودهنگام تا قبل از بیست و پنجم تیرماه در سایت مدرسه بیگ دیتا در نظر گرفته شده است.
🔹پیش نیاز اصلی شرکت در دوره علاقه به فیلدهای Data Science و Big Data Analytic می باشد اما در صورتی که در تابستان زمان کافی برای شرکت در دوره، بررسی مقالات فنی، مطالعه کتاب های رفرنس، حل تمرین ها و انجام پروژه های دوره را ندارید این دوره برای شما سودمند نخواهد بود.
📑 لینک ثبت نام در دوره آموزشی آنلاین Big Data
🗄 به علت افزایش سطحی کیفی دوره، ظرفیت محدود در نظر گرفته شده است.
🎙 توجه: این دوره مجزی از دوره خصوصی مدرسه تابستانه بیگ دیتا می باشد که از یکم تیر ماه آغاز شده است و تکمیل ظرفیت شده است.
#BigData
#DataScience
🌐BigDataWorld.ir
🖥BigDataSchool
💻BigData_School
☑️ با محوریت کار با کتابخانه های کلیدی و مطرح در حوزه Data Science بر اساس زبان Python نظیر Pandas, Matplotlib, Seaborn, Scikit-Learn, NLTK, NetworkX،
✔️ کار با ابزارهای کلیدی دنیای بیگ دیتا نظیر Hadoop Ecosystem و Apache Spark Stack
🕰 شروع دوره از یکم مرداد ماه تا یکم مهر ماه
🎁 یکصدهزار تومان، تخفیفِ ثبت نامِ زودهنگام تا قبل از بیست و پنجم تیرماه در سایت مدرسه بیگ دیتا در نظر گرفته شده است.
🔹پیش نیاز اصلی شرکت در دوره علاقه به فیلدهای Data Science و Big Data Analytic می باشد اما در صورتی که در تابستان زمان کافی برای شرکت در دوره، بررسی مقالات فنی، مطالعه کتاب های رفرنس، حل تمرین ها و انجام پروژه های دوره را ندارید این دوره برای شما سودمند نخواهد بود.
📑 لینک ثبت نام در دوره آموزشی آنلاین Big Data
🗄 به علت افزایش سطحی کیفی دوره، ظرفیت محدود در نظر گرفته شده است.
🎙 توجه: این دوره مجزی از دوره خصوصی مدرسه تابستانه بیگ دیتا می باشد که از یکم تیر ماه آغاز شده است و تکمیل ظرفیت شده است.
#BigData
#DataScience
🌐BigDataWorld.ir
🖥BigDataSchool
💻BigData_School
مهندسی داده ها pinned «💎 دوره آموزشی آنلاین Big Data ☑️ با محوریت کار با کتابخانه های کلیدی و مطرح در حوزه Data Science بر اساس زبان Python نظیر Pandas, Matplotlib, Seaborn, Scikit-Learn, NLTK, NetworkX، ✔️ کار با ابزارهای کلیدی دنیای بیگ دیتا نظیر Hadoop Ecosystem و Apache…»