📸چهار نقش مختلف در علوم داده و تخصصهای اصلی آنها_شما در کدام نقش بازی می کنید؟
🪩https://news.1rj.ru/str/toobabigdatascience
🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
پروتکل رمزنگاری شده ی SSH چگونه داده های شما را بر شبکه با ماهیت ذاتی ناامن، منتقل می کند؟
#SSH
#DATATRANSMISSION
#DATA
#NETWORKSECURITY
🪩https://news.1rj.ru/str/toobabigdatascience
#SSH
#DATATRANSMISSION
#DATA
#NETWORKSECURITY
🪩https://news.1rj.ru/str/toobabigdatascience
💸Top 15 Highest Paying Jobs in the World 2024
پانزده شغل پردرآمد دنیا در سال ۲۰۲۴
🪩https://news.1rj.ru/str/toobabigdatascience
پانزده شغل پردرآمد دنیا در سال ۲۰۲۴
🪩https://news.1rj.ru/str/toobabigdatascience
Inference_and_Learning_from_Data,_Volume_1_I_Foundations_Cambridge.pdf
25.2 MB
🌹عیدی کانال #متخصصان_علم_داده به همراهان گرامی ،بمناسبت مبعث پیامبر اعظم ص ، دایره المعارف سه جلدی علم داده اثری از دانشگاه معظم کمبریج
🧠 استنتاج و یادگیری از داده ها: اصول
جلد اول
🧠 Inference and Learning from Data: Foundations
Volume 1
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
🧠 استنتاج و یادگیری از داده ها: اصول
جلد اول
🧠 Inference and Learning from Data: Foundations
Volume 1
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
Inference_and_Learning_from_Data_Volume_2_II_Inference_Cambridge.pdf
52 MB
#Learning #Data
استنتاج و یادگیری از دادهها: استنتاج
جلد دوم
Inference and Learning from Data: Inference
Volume 2
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
استنتاج و یادگیری از دادهها: استنتاج
جلد دوم
Inference and Learning from Data: Inference
Volume 2
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
python for AI.pdf
1.9 MB
کتاب کدهای پایتون برای یادگیری ماشین
مزایای پایتون
➡️یک اکوسیستم کتابخانه ای عالی
➡️یک مانع ورود کم
➡️انعطاف پذیری
➡️استقلال پلت فرم
➡️خوانایی
➡️گزینه های تجسم خوب
➡️حمایت جامعه
➡️محبوبیت روزافزون
https://news.1rj.ru/str/toobabigdatascience
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
مزایای پایتون
➡️یک اکوسیستم کتابخانه ای عالی
➡️یک مانع ورود کم
➡️انعطاف پذیری
➡️استقلال پلت فرم
➡️خوانایی
➡️گزینه های تجسم خوب
➡️حمایت جامعه
➡️محبوبیت روزافزون
https://news.1rj.ru/str/toobabigdatascience
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Inference_and_Learning_from_Data_Volume_3_III_Learning_Cambridge.pdf
77.3 MB
#Book
#Learning
#Data
استناج و یادگیری از دادهها: یادگیری
جلد سوم
Inference and Learning from Data: Learning
Volume 3
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
#Learning
#Data
استناج و یادگیری از دادهها: یادگیری
جلد سوم
Inference and Learning from Data: Learning
Volume 3
✏️ By Ali H. Sayed
انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
⭕️سم آلتمن، مدیرعامل OpenAI، در اجلاس جهانی دولتها که در دبی برگزار شد، حضور پیدا کرد و از توسعهی نسل جدید هوش مصنوعی این شرکت با نام GPT-5 خبر داد. او میگوید که GPT-5 بسیار باهوشتر از نسلهای پیشین خود خواهد بود. یکی از مدیران مایکروسافت پیشتر گفته بود که GPT-5 احتمالاً سنگنوشتهای سههزارساله را رمزگشایی میکند.
🟡آلتمن در اجلاس جهانی دولتها گفت: «چیزی که GPT-5 را هیجانانگیز میکند، این است که تنها یک قابلیت خاص این هوش مصنوعی پیشرفت نمیکند؛ بلکه در تمام کارکردها و قابلیتهایش بهتر، باهوشتر و پیشرفتهتر خواهد شد.»
🔴 هنوز تاریخ دقیق رونمایی از GPT-5 مشخص نیست اما شایعات میگویند که نسخهی بعدی ChatGPT یک مدل هوش مصنوعی چندوجهی با اسم رمز Gobi خواهد بود که احتمالاً در سال ۲۰۲۴ از راه میرسد.
🔵 نگرانی فعلی سم آلتمن این است که سوگیریهای اجتماعی بهصورت ناخواسته باعث انحراف سیستمهای هوش مصنوعی از مسیر اصلیشان شوند.
#GPT-5
#AI
#ChatGPT
🟡آلتمن در اجلاس جهانی دولتها گفت: «چیزی که GPT-5 را هیجانانگیز میکند، این است که تنها یک قابلیت خاص این هوش مصنوعی پیشرفت نمیکند؛ بلکه در تمام کارکردها و قابلیتهایش بهتر، باهوشتر و پیشرفتهتر خواهد شد.»
🔴 هنوز تاریخ دقیق رونمایی از GPT-5 مشخص نیست اما شایعات میگویند که نسخهی بعدی ChatGPT یک مدل هوش مصنوعی چندوجهی با اسم رمز Gobi خواهد بود که احتمالاً در سال ۲۰۲۴ از راه میرسد.
🔵 نگرانی فعلی سم آلتمن این است که سوگیریهای اجتماعی بهصورت ناخواسته باعث انحراف سیستمهای هوش مصنوعی از مسیر اصلیشان شوند.
#GPT-5
#AI
#ChatGPT
⚙تجربه کار با دیتا سِت های واقعی ! تجربه ی سخت و شیرینی ست.
و اساسا، قابل مقایسه با کار آزمایشگاهی یا آموزشی با داده ها ی حاضر و آماده نیست
مساله این است که شاید هیچ مهندس داده ای، با داده های گلخانه ای! و مصنوعی که بیش از حد تَر و تمیز اند، چالش های کار با داده را، تجربه نخواهد کرد.
👁🗨 مثلا اینکه وقتی در یک دیتاست حجم زیادی از missing values داریم چه کنیم؟
احتمالا اولین چیزی که به ذهن می رسد جایگزین کردن #missing_value ها با صفر و یا میانگین کل است.
اما صادقانه باید گفت که هر بار که از این روش استفاده می کنید ، دارید توزیع دیتا را بهم می ریزید!
نتیجه جایگزینی (imputing) مقادیر گمشده با میانگین یا صفر یا هر مقدار ثابت دیگر می دهد :
- تغییر در آمار خلاصه
- تغییر در توزیع
- افزایش یک مقدار خاص
⬅️ و در نتیجه منجر به مدل سازی نادرست و نتیجه گیری نادرست و در نهایت به تصمیم گیری های نادرست.
تجربه و یک راه حل عملی استفاده از از #KNN است
ویژگیهای مقدار گمشده با اجرای kNN بر روی مقادیر ویژگی غیرگمشده نسبت داده میشود. و کار را در می آورد
نتیجه اجرا با هریک از روش ها در تصویر فوق.
و اساسا، قابل مقایسه با کار آزمایشگاهی یا آموزشی با داده ها ی حاضر و آماده نیست
مساله این است که شاید هیچ مهندس داده ای، با داده های گلخانه ای! و مصنوعی که بیش از حد تَر و تمیز اند، چالش های کار با داده را، تجربه نخواهد کرد.
👁🗨 مثلا اینکه وقتی در یک دیتاست حجم زیادی از missing values داریم چه کنیم؟
احتمالا اولین چیزی که به ذهن می رسد جایگزین کردن #missing_value ها با صفر و یا میانگین کل است.
اما صادقانه باید گفت که هر بار که از این روش استفاده می کنید ، دارید توزیع دیتا را بهم می ریزید!
نتیجه جایگزینی (imputing) مقادیر گمشده با میانگین یا صفر یا هر مقدار ثابت دیگر می دهد :
- تغییر در آمار خلاصه
- تغییر در توزیع
- افزایش یک مقدار خاص
⬅️ و در نتیجه منجر به مدل سازی نادرست و نتیجه گیری نادرست و در نهایت به تصمیم گیری های نادرست.
تجربه و یک راه حل عملی استفاده از از #KNN است
ویژگیهای مقدار گمشده با اجرای kNN بر روی مقادیر ویژگی غیرگمشده نسبت داده میشود. و کار را در می آورد
نتیجه اجرا با هریک از روش ها در تصویر فوق.
🖇📈وضعیت دانشگاههای ایرانی در ردهبندیهای سال ۱۴۰۲ هشدارآمیز بوده است/ افت جایگاه ۴۱ دانشگاه در رتبهبندی ۲۰۲۳ ISC
📐📖 رتبهبندی جدیدپایگاه استنادی جهان اسلام ابتدای این هفته منتشر شد تا باردیگر عملکرد دانشگاههای داخلی در مقایسه با دنیا سنجیده شود. اتفاق تلخی که تنهابه این نظام رتبهبندی محدود نشده و چند سالی میشود روند حضور دانشگاههای ایران با عینک نظامهای رتبهبندی دیگر مانند لایدن، تایمز، QS و شانگهای، مسیر نزولی به خود گرفته است.
📉علیرغم اینکه از نظر ِ تعداد ،دانشگاههای کشور با افزایش شش موردی همراه و از ۶۳ به ۶۹ رسیده اما از لحاظ کیفیت، دانشگاههای مطرح کشور با شیب تند سقوط همراه بودهاند.
📈دانشگاه تهران با ۱۰۰ پله تنزل در زمره دانشگاههایی قرار گرفته که در رده ۵۰۱ تا ۶۰۰ دنیا تعریف میشوند.
علم و صنعت با ریزش ۱۰۰ پلهای همراه بوده؛
شهید بهشتی با افت ۳۰۰ پلهای جایگاه جهانی خود روبهرو شده؛ تربیت مدرس اما بدون تغییر روی همان نقطه ۶۱۰ الی ۷۰۰ باقی مانده و بعد از آن دانشگاه صنعتی امیرکبیر نیز امسال هم مانند دو سال گذشته در جایگاه ۷۰۱ الی ۸۰۰ باقی مانده است.
🪩https://news.1rj.ru/str/toobabigdatascience
📐📖 رتبهبندی جدیدپایگاه استنادی جهان اسلام ابتدای این هفته منتشر شد تا باردیگر عملکرد دانشگاههای داخلی در مقایسه با دنیا سنجیده شود. اتفاق تلخی که تنهابه این نظام رتبهبندی محدود نشده و چند سالی میشود روند حضور دانشگاههای ایران با عینک نظامهای رتبهبندی دیگر مانند لایدن، تایمز، QS و شانگهای، مسیر نزولی به خود گرفته است.
📉علیرغم اینکه از نظر ِ تعداد ،دانشگاههای کشور با افزایش شش موردی همراه و از ۶۳ به ۶۹ رسیده اما از لحاظ کیفیت، دانشگاههای مطرح کشور با شیب تند سقوط همراه بودهاند.
📈دانشگاه تهران با ۱۰۰ پله تنزل در زمره دانشگاههایی قرار گرفته که در رده ۵۰۱ تا ۶۰۰ دنیا تعریف میشوند.
علم و صنعت با ریزش ۱۰۰ پلهای همراه بوده؛
شهید بهشتی با افت ۳۰۰ پلهای جایگاه جهانی خود روبهرو شده؛ تربیت مدرس اما بدون تغییر روی همان نقطه ۶۱۰ الی ۷۰۰ باقی مانده و بعد از آن دانشگاه صنعتی امیرکبیر نیز امسال هم مانند دو سال گذشته در جایگاه ۷۰۱ الی ۸۰۰ باقی مانده است.
🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
_همه هست آرزویم که ببینم از تو رویی
چه زیان تو را که من هم، برسم به آرزویی...
نیمه شعبان🌹، ولادت حضرت حجت ابن الحسن عسگری عج، یگانه منجی بشریّت از ظلم و ستم و بدعت
بر شما همراهان عزیز کانال مبارک
🦚 https://news.1rj.ru/str/toobabigdatascience🦚
چه زیان تو را که من هم، برسم به آرزویی...
نیمه شعبان🌹، ولادت حضرت حجت ابن الحسن عسگری عج، یگانه منجی بشریّت از ظلم و ستم و بدعت
بر شما همراهان عزیز کانال مبارک
🦚 https://news.1rj.ru/str/toobabigdatascience🦚
هوش مصنوعی چگونه کار می کند؟
مرحله ی دوم (جمع آوری و آماده سازی داده ها) عموما طولانی ترین و دشوارترین مرحله در این روال است.
#AI
#DataCollection
#DataPreparation
🪩https://news.1rj.ru/str/toobabigdatascience
مرحله ی دوم (جمع آوری و آماده سازی داده ها) عموما طولانی ترین و دشوارترین مرحله در این روال است.
#AI
#DataCollection
#DataPreparation
🪩https://news.1rj.ru/str/toobabigdatascience
“As engineers, we were going to be in a position to change the world – not just study it.”
📱روز مهندس مبارک...
🪩https://news.1rj.ru/str/toobabigdatascience
📱روز مهندس مبارک...
🪩https://news.1rj.ru/str/toobabigdatascience
Road accidents .zip
42.6 MB
📦 Datasets name: Road accidents in the Czech Republic
💬 Detailed dataset of road accidents in the Czech Republic (2016-2022) , The police of Czech Republic regularly gathers and releases detailed data on traffic incidents throughout the nation, typically on an monthly basis. This dataset covers various aspects such as geographic locations, weather conditions, vehicle types, casualty counts, and vehicle maneuvers. The wealth of information makes it a compelling and extensive dataset for analysis and research purposes.
⚙️ Format: CSV file
🔒 From: Kaggle
🗄یکی از روش های کار روی داده ها، استفاده از دیتا ست های استاندارد است.
دیتا ست تصادفات جاده ای در جمهوری چک شامل داده های مربوط به سوانح جاده ای طی،سالهای ۲۰۱۶ تا ۲۰۲۲ است که توسط پلیس جمهوری چک جمع آوری شده است و شامل علل تصادفات، نوع خودروها، انواع مانورهای خودرو ها در جاده ها( لایی کشیدن، سبقت و سرعت غیر مجاز و...) که منجر به تصادفات شده، وضعیت آب و هوا و...در فرمت csv (,.) برگرفته از سایت کَگِل است.
🪩 https://news.1rj.ru/str/toobabigdatascience
💬 Detailed dataset of road accidents in the Czech Republic (2016-2022) , The police of Czech Republic regularly gathers and releases detailed data on traffic incidents throughout the nation, typically on an monthly basis. This dataset covers various aspects such as geographic locations, weather conditions, vehicle types, casualty counts, and vehicle maneuvers. The wealth of information makes it a compelling and extensive dataset for analysis and research purposes.
⚙️ Format: CSV file
🔒 From: Kaggle
🗄یکی از روش های کار روی داده ها، استفاده از دیتا ست های استاندارد است.
دیتا ست تصادفات جاده ای در جمهوری چک شامل داده های مربوط به سوانح جاده ای طی،سالهای ۲۰۱۶ تا ۲۰۲۲ است که توسط پلیس جمهوری چک جمع آوری شده است و شامل علل تصادفات، نوع خودروها، انواع مانورهای خودرو ها در جاده ها( لایی کشیدن، سبقت و سرعت غیر مجاز و...) که منجر به تصادفات شده، وضعیت آب و هوا و...در فرمت csv (,.) برگرفته از سایت کَگِل است.
🪩 https://news.1rj.ru/str/toobabigdatascience
⬅️ اکثر مشاهیر فناوری در دو دههی اخیر بارها اعلام کردن که کدنویسی برای همه بهخصوص کودکان ضروریه و آقای هوانگ، مدیرعامل انویدیا، در اجلاس اخیر دولتهای جهان که در دبی برگزار شد، اظهاراتی خلاف دیدگاه آنها را مطرح کرد
👨🏫 مدیرعامل انویدیا میگوید: «وظیفهی ما، ایجاد فناوریهای محاسباتی است که نیاز به یادگیری برنامهنویسی را از بین ببرد و زبان کدنویسی باید مشابه زبان گفتار معیار انسانها باشد. اکنون همه در جهان برنامهنویس هستند و این معجزهی هوش مصنوعی است.»
👑 این نخستین بار نیست که هوانگ چنین اظهاراتی درمورد هوش مصنوعی و برنامهنویسی مطرح میکند؛ او یک سال قبل هم در سخنرانی دانشگاه برکلی درمورد اینکه تواناییهای کدنویسی ChatGPT چگونه میتوانند چشمانداز حوزهی برنامهنویسی را تغییر بدهند، صحبت کرد و در سخنرانی خود گفت: «با هوش مصنوعی همه میتوانند بهمعنای واقعی کلمه برای کامپیوتر برنامه بنویسند.»
👀هوانگ معتقد است : «اینکه همهی مردم را با هوش مصنوعی مولد آشنا کنیم بسیار حیاتی است و من باور دارم فرایند ارتقای مهارت، لذتبخش و شگفتانگیز خواهد بود.»
#AI
#generativeai
🪩https://news.1rj.ru/str/toobabigdatascience
👨🏫 مدیرعامل انویدیا میگوید: «وظیفهی ما، ایجاد فناوریهای محاسباتی است که نیاز به یادگیری برنامهنویسی را از بین ببرد و زبان کدنویسی باید مشابه زبان گفتار معیار انسانها باشد. اکنون همه در جهان برنامهنویس هستند و این معجزهی هوش مصنوعی است.»
👑 این نخستین بار نیست که هوانگ چنین اظهاراتی درمورد هوش مصنوعی و برنامهنویسی مطرح میکند؛ او یک سال قبل هم در سخنرانی دانشگاه برکلی درمورد اینکه تواناییهای کدنویسی ChatGPT چگونه میتوانند چشمانداز حوزهی برنامهنویسی را تغییر بدهند، صحبت کرد و در سخنرانی خود گفت: «با هوش مصنوعی همه میتوانند بهمعنای واقعی کلمه برای کامپیوتر برنامه بنویسند.»
👀هوانگ معتقد است : «اینکه همهی مردم را با هوش مصنوعی مولد آشنا کنیم بسیار حیاتی است و من باور دارم فرایند ارتقای مهارت، لذتبخش و شگفتانگیز خواهد بود.»
#AI
#generativeai
🪩https://news.1rj.ru/str/toobabigdatascience
👽کاخ سفید خواستار دستکشیدن از زبانهای آسیبپذیر مانند C و C++
اداره ملی رهبری سایبری دفتر کاخ سفید، در یک گزارش منتشر شده گغت:
دولت باید توسعهدهندگان را به کاهش خطر حملات سایبری تشویق کند و از زبانهای برنامهنویسی استفاده کند که دارای آسیبپذیریهای امنیتی حافظه نیستند.
🚫این گزارش به توسعهدهندگان پیشنهاد میدهد که از زبانهای برنامهنویسی با حافظه امن استفاده کنند، مانند Rust که به عنوان یک مثال از زبانهای امن ذکر شده است.
♨️همچنین، از طرفی اداره امنیت سایبری NSA، زبانهای C#، Go، Java، Ruby و Swift را به عنوان زبانهای برنامهنویسی امن معرفی کرده است.
🪩https://news.1rj.ru/str/toobabigdatascience
اداره ملی رهبری سایبری دفتر کاخ سفید، در یک گزارش منتشر شده گغت:
دولت باید توسعهدهندگان را به کاهش خطر حملات سایبری تشویق کند و از زبانهای برنامهنویسی استفاده کند که دارای آسیبپذیریهای امنیتی حافظه نیستند.
🚫این گزارش به توسعهدهندگان پیشنهاد میدهد که از زبانهای برنامهنویسی با حافظه امن استفاده کنند، مانند Rust که به عنوان یک مثال از زبانهای امن ذکر شده است.
♨️همچنین، از طرفی اداره امنیت سایبری NSA، زبانهای C#، Go، Java، Ruby و Swift را به عنوان زبانهای برنامهنویسی امن معرفی کرده است.
🪩https://news.1rj.ru/str/toobabigdatascience
Telegram
متخصصان علم داده ها data scientists
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
🧬 شرکت مایکروسافت یک شبکهی عصبی گرافی به نام ViSNet برای مدلسازی و بازنمایی ساختارهای هندسی سهبعدی مانند مولکولها ارائه دادهست که قادرست ارتباطات پیچیده بین ساختار مولکولی و فعالیت بیولوژیکی (structure-activity relationships) را درک کرده و رفتار و ویژگیهای مولکولها را پیشبینی کند.
🔅 کیفیت سنجی مقالات در هنگام جستجو در گوگل اسکالر با این افزونه در مرورگر کروم:
آدرس وبسایت افزونه:
🔗 https://www.excitation.tech/
#افزونه
#Extension #Research #Tools #ResearchTools #Research_Tools #Chrome #Tool #Search #Free #Rankings #Check #Results #Result #Cited #CitedBy #Paper
🪩https://news.1rj.ru/str/toobabigdatascience
آدرس وبسایت افزونه:
🔗 https://www.excitation.tech/
#افزونه
#Extension #Research #Tools #ResearchTools #Research_Tools #Chrome #Tool #Search #Free #Rankings #Check #Results #Result #Cited #CitedBy #Paper
🪩https://news.1rj.ru/str/toobabigdatascience