مفتا: آشنایی با الگوریتم Word2Vec گوگل
برای بسیاری از روشهای پردازش متن و NLP، نیاز به نمایش عددی کلمات و متون داریم تا بتوانیم از انواع روشهای عددی حوزه یادگیری ماشین مانند اکثر الگوریتم های دسته بندی روی لغات و اسناد استفاده کنیم. یکی از رهیافت هایی که در این حوزه بسیار رایج شده است ، نمایش برداری کلمات و جملات است . روشی که توسط گوگل در سال ۲۰۱۳ پیشنهاد شده است و روشی بسیار کارآمد و مناسب برای نمایش لغات و متون و پردازش آنها است روش Word2Vec است. در این روش به کمک شبکه عصبی یک بردار با اندازه کوچک و ثابت برای نمایش تمام لغات و متون در نظرگرفته شده و با اعداد مناسب در فاز آموزش مدل یا training برای هر لغت این بردار محاسبه می شود. بعد از ایجاد بردارهای مرتبط با هر لغت، برای نمایش برداری هر متن یا خبر ، می توان بردار تک تک کلمات به کار رفته در آنرا یافته و میانگین اعداد هر ستون را به دست آورد که نتیجه آن یک بردار برای هر متن یا سند خواهد بود. این روش که الگوریتم آن به صورت متن باز نیز منتشر شده است و کتابخانه های مختلفی برای زبانهای مختلف برای کار با آن تولید شده است، زمانی که توسط گوگل بر روی حجم بالای متون و اطلاعات به کار رفته است ، نتایج بسیار شگرفی را به همراه داشته است .
http://mfta.ir/data-science/id=10394
@mfta_ir
برای بسیاری از روشهای پردازش متن و NLP، نیاز به نمایش عددی کلمات و متون داریم تا بتوانیم از انواع روشهای عددی حوزه یادگیری ماشین مانند اکثر الگوریتم های دسته بندی روی لغات و اسناد استفاده کنیم. یکی از رهیافت هایی که در این حوزه بسیار رایج شده است ، نمایش برداری کلمات و جملات است . روشی که توسط گوگل در سال ۲۰۱۳ پیشنهاد شده است و روشی بسیار کارآمد و مناسب برای نمایش لغات و متون و پردازش آنها است روش Word2Vec است. در این روش به کمک شبکه عصبی یک بردار با اندازه کوچک و ثابت برای نمایش تمام لغات و متون در نظرگرفته شده و با اعداد مناسب در فاز آموزش مدل یا training برای هر لغت این بردار محاسبه می شود. بعد از ایجاد بردارهای مرتبط با هر لغت، برای نمایش برداری هر متن یا خبر ، می توان بردار تک تک کلمات به کار رفته در آنرا یافته و میانگین اعداد هر ستون را به دست آورد که نتیجه آن یک بردار برای هر متن یا سند خواهد بود. این روش که الگوریتم آن به صورت متن باز نیز منتشر شده است و کتابخانه های مختلفی برای زبانهای مختلف برای کار با آن تولید شده است، زمانی که توسط گوگل بر روی حجم بالای متون و اطلاعات به کار رفته است ، نتایج بسیار شگرفی را به همراه داشته است .
http://mfta.ir/data-science/id=10394
@mfta_ir
مفتا: علت موفقیت زنان در تبدیل شدن به دانشمند داده
مایکل والکر(دانشمند داده): علم داده میتواند به عنوان یک انتخاب خوب و حرفه ای برای زنان باشد تا بتوانند تبدیل به یک دانشمند داده شوند. زنان متفکران بزرگ متضاد هستند. یکی از مهارت های کلیدی دانشمندان بزرگ داده داشتن تفکرات معکوس و تحلیلی همراه با توانایی برقراری ارتباط دوطرفه با اعضای تیم و رهبران سازمان برای رسیدن به اهداف میباشد که تمام اینها در خصوصیات اخلاقی زنان دیده می شود.
http://mfta.ir/data-science/id=10459
@mfta_ir
مایکل والکر(دانشمند داده): علم داده میتواند به عنوان یک انتخاب خوب و حرفه ای برای زنان باشد تا بتوانند تبدیل به یک دانشمند داده شوند. زنان متفکران بزرگ متضاد هستند. یکی از مهارت های کلیدی دانشمندان بزرگ داده داشتن تفکرات معکوس و تحلیلی همراه با توانایی برقراری ارتباط دوطرفه با اعضای تیم و رهبران سازمان برای رسیدن به اهداف میباشد که تمام اینها در خصوصیات اخلاقی زنان دیده می شود.
http://mfta.ir/data-science/id=10459
@mfta_ir
مفتا: معرفی سایت CodeSchool برای آموزش زبان R
با انجام دادن یاد بگیرید.
این شعار زیبا مربوط به سایت آموزشی codeschool.com است. این سایت خود را جز مجموعه بزرگ Pluralsight معرفی می کند که به حق یکی از پیشروهای آموزش بر خط برای توسعه دهندگان نرم افزار، متخصصان فناوری اطلاعات و فناوران خلاق است. اما چیزی که تصمیم گرفتیم به شما معرفی کنیم محیط تعاملی و زیبای سایت codeschool.com برای آموزش زبان R است که از طریق لینک زیر قابل دسترسی است.
http://tryr.codeschool.com/
http://mfta.ir/data-science/id=10157
@mfta_ir
با انجام دادن یاد بگیرید.
این شعار زیبا مربوط به سایت آموزشی codeschool.com است. این سایت خود را جز مجموعه بزرگ Pluralsight معرفی می کند که به حق یکی از پیشروهای آموزش بر خط برای توسعه دهندگان نرم افزار، متخصصان فناوری اطلاعات و فناوران خلاق است. اما چیزی که تصمیم گرفتیم به شما معرفی کنیم محیط تعاملی و زیبای سایت codeschool.com برای آموزش زبان R است که از طریق لینک زیر قابل دسترسی است.
http://tryr.codeschool.com/
http://mfta.ir/data-science/id=10157
@mfta_ir
Pluralsight
Pluralsight IQ
Skill assessments to benchmark your team's development or find out where you stand. Get tailored learning recommendations to help you level up.
Forwarded from Neda Soltani
وب سایت های مجموعه داده:
http://aws.amazon.com/public-data-sets/
http://stackoverflow.com/questions/381806/large-public-datasets
http://archive.ics.uci.edu/ml/datasets.html
https://archive.org/details/stackexchange
http://snap.stanford.edu/data/
https://networkdata.ics.uci.edu/resources.php
https://www.kaggle.com/
http://www.data.gov/
http://www.kdnuggets.com/datasets/index.html
http://socialcomputing.asu.edu/pages/datasets
http://nodexlgraphgallery.org/Pages/Default.aspx
http://konect.uni-koblenz.de/networks/
http://aws.amazon.com/public-data-sets/
http://stackoverflow.com/questions/381806/large-public-datasets
http://archive.ics.uci.edu/ml/datasets.html
https://archive.org/details/stackexchange
http://snap.stanford.edu/data/
https://networkdata.ics.uci.edu/resources.php
https://www.kaggle.com/
http://www.data.gov/
http://www.kdnuggets.com/datasets/index.html
http://socialcomputing.asu.edu/pages/datasets
http://nodexlgraphgallery.org/Pages/Default.aspx
http://konect.uni-koblenz.de/networks/
مفتا: بیگ دیتا چالشی برای دانشمندان
در بررسی های اخیر انجام شده بوسیله Paradigm4(شرکت های پایگاه داده محاسباتی) مشخص شد بیگ دیتا به یک چالش برای دانشمندان داده تبدیل شده است اما نه به دلیل مقدار و یا حجم بلکه به خاطر تولید متنوع داده ها که این را حرفه ای ها بهتر درک می کنند. باوجود استفاده زیاد از پلتفرم Hadoop کمتر ازنیمی(۴۸%) از هدوپ یا اسپارک استفاده کرده اند و از این تعداد ۷۶% گفته اند بسیار کند است. همچنین ۳۹ درصد می گویند با رشد بیگ دیتا، استرس شغلی آنها هم بالا می رود.
http://mfta.ir/data-science/id=10160
@mfta_ir
در بررسی های اخیر انجام شده بوسیله Paradigm4(شرکت های پایگاه داده محاسباتی) مشخص شد بیگ دیتا به یک چالش برای دانشمندان داده تبدیل شده است اما نه به دلیل مقدار و یا حجم بلکه به خاطر تولید متنوع داده ها که این را حرفه ای ها بهتر درک می کنند. باوجود استفاده زیاد از پلتفرم Hadoop کمتر ازنیمی(۴۸%) از هدوپ یا اسپارک استفاده کرده اند و از این تعداد ۷۶% گفته اند بسیار کند است. همچنین ۳۹ درصد می گویند با رشد بیگ دیتا، استرس شغلی آنها هم بالا می رود.
http://mfta.ir/data-science/id=10160
@mfta_ir
نکاتی جالب در باره مصورسازی
http://ourworldindata.org/data/growth-and-distribution-of-prosperity/world-poverty/
http://ourworldindata.org/data/growth-and-distribution-of-prosperity/world-poverty/
Forwarded from Deleted Account
مصورسازی گراف در شبکه اجتماعی
http://blog.wolfram.com/2015/10/20/wolfram-community-is-turning-10000/
http://blog.wolfram.com/2015/10/20/wolfram-community-is-turning-10000/
Wolfram
Wolfram Community Is Turning 10,000—Wolfram Blog
Wolfram Community nears a milestone with new features and a chance for you to win prizes. Check out the email tools, groups, staff picks, jobs board.
Forwarded from فرزاد خندان
www.tabnak.ir
پای فناوری به پیشگویی باز میشود - سایت خبری تحلیلی تابناك|اخبار ایران و جهان|TABNAK
دکتر هورنگ میگوید که او و همکارانش به کمک ابررایانه میتوانند اطلاعات هر فرد را با موارد مشابهی که در مرکز داده سیستم ذخیره شده است قیاس کنند و از این طریق بدرستی پیشبینی کنند که هر فرد در آینده به چه بیماریهایی مبتلا میشود
مفتا: جدول تناوبی بسته های ماشین لرنینگ
پکیج ها و بسته های ماشین لرنینگ زیر برای پایتون، جاوا، بیگ دیتا، Lua/JS/Clojure، Scala، سی/سی ++ و R در تصویر زیر و با استعاره از جدول تناوبی عناصر طراحی و ارائه شده اند. این جدول تناوبی از MLN.io بدست آمده است که یک خبرنامه ماشین لرنینگ می باشد .
http://mfta.ir/data-science/id=9912
@mfta_ir
پکیج ها و بسته های ماشین لرنینگ زیر برای پایتون، جاوا، بیگ دیتا، Lua/JS/Clojure، Scala، سی/سی ++ و R در تصویر زیر و با استعاره از جدول تناوبی عناصر طراحی و ارائه شده اند. این جدول تناوبی از MLN.io بدست آمده است که یک خبرنامه ماشین لرنینگ می باشد .
http://mfta.ir/data-science/id=9912
@mfta_ir
Forwarded from Amirhossein Asgari
#استخدام #بازارکار
درخواست همکاری:
برنامه نویس php یا Java
تجربه برنامه نویسی پیشرفته
ترجیحا تجربه کار با کلان داده(BigData)
ترجیحا تسلط با حوزه دادهکاوی(DataMining)
دارای توان تحلیل و مهارت حل مسئله
شرایط: تهران،عباسآباد/ بیمه+ سنوات+ عیدی و پاداش/ شنبه تا چهارشنبه/
دوستانی که واجد شرایط هستن میتونن رزومه خودشون رو به ایمیل job@lifeweb.ir مربوط به شرکت لایفوب ارسال کنند.
لطفا این پیام رو برای گروهها یا دوستانی که مرتبط با فراخوان هستند بفرستین تا ...
درخواست همکاری:
برنامه نویس php یا Java
تجربه برنامه نویسی پیشرفته
ترجیحا تجربه کار با کلان داده(BigData)
ترجیحا تسلط با حوزه دادهکاوی(DataMining)
دارای توان تحلیل و مهارت حل مسئله
شرایط: تهران،عباسآباد/ بیمه+ سنوات+ عیدی و پاداش/ شنبه تا چهارشنبه/
دوستانی که واجد شرایط هستن میتونن رزومه خودشون رو به ایمیل job@lifeweb.ir مربوط به شرکت لایفوب ارسال کنند.
لطفا این پیام رو برای گروهها یا دوستانی که مرتبط با فراخوان هستند بفرستین تا ...
👆👆👆
مفتا: داده کاوی، این بار از خود داده کاوان! + گراف
در مقاله ای جالب که جدیدا توسط فردی به نام Ferris Jumah نوشته شده است در ابتکاری، به رسم گراف ( در سایت مفتا می توانید مشاهده کنید) از مهارت های داده کاوان پرداخته و عنوان شده است که دانشمندان داده عموما دارای خصوصیات زیر اند: نگاه به داده از پنجره ریاضیات - استفاده از یک زبان مشترک برای دسترسی، داده کاوی و مدل سازی داده ها -
توسعه علوم کامپیوتر و برنامه نویسی خود.
http://mfta.ir/data-science/id=10683
@mfta_ir
مفتا: داده کاوی، این بار از خود داده کاوان! + گراف
در مقاله ای جالب که جدیدا توسط فردی به نام Ferris Jumah نوشته شده است در ابتکاری، به رسم گراف ( در سایت مفتا می توانید مشاهده کنید) از مهارت های داده کاوان پرداخته و عنوان شده است که دانشمندان داده عموما دارای خصوصیات زیر اند: نگاه به داده از پنجره ریاضیات - استفاده از یک زبان مشترک برای دسترسی، داده کاوی و مدل سازی داده ها -
توسعه علوم کامپیوتر و برنامه نویسی خود.
http://mfta.ir/data-science/id=10683
@mfta_ir
Forwarded from Deleted Account
نگاهی کلی به ابزارهای مصور سازی پایتون
https://www.linkedin.com/pulse/overview-python-visualization-tools-diego-marinho-de-oliveira?trk=hp-feed-article-noscript-share
https://www.linkedin.com/pulse/overview-python-visualization-tools-diego-marinho-de-oliveira?trk=hp-feed-article-noscript-share
مفتا: 9 کتاب رایگان برای یادگیری داده کاوی و تجزیه و تحلیل داده
اگر شما برای اولین بار در حال یادگیری علم اطلاعات هستید، این کتاب های رایگان به شما برای یادگیری داده کاوی کمک خواهد کرد . با آموختن از این کتابها، شما به سرعت اسرار داده کاوی و تجزیه و تحلیل داده ها را کشف خواهید کرد.
Data Mining Algorithms In R
الگوریتم های داده کاوی در R
A Programmer’s Guide to Data Mining
راهنمای یک برنامه نویس برای داده کاوی
برای دیدن ادامه منابع، به سایت مفتا مراجعه کنید.
http://mfta.ir/data-science/id=9870/9
@mfta_ir
اگر شما برای اولین بار در حال یادگیری علم اطلاعات هستید، این کتاب های رایگان به شما برای یادگیری داده کاوی کمک خواهد کرد . با آموختن از این کتابها، شما به سرعت اسرار داده کاوی و تجزیه و تحلیل داده ها را کشف خواهید کرد.
Data Mining Algorithms In R
الگوریتم های داده کاوی در R
A Programmer’s Guide to Data Mining
راهنمای یک برنامه نویس برای داده کاوی
برای دیدن ادامه منابع، به سایت مفتا مراجعه کنید.
http://mfta.ir/data-science/id=9870/9
@mfta_ir