متخصصان علم داده ها data scientists – Telegram
متخصصان علم داده ها data scientists
1.41K subscribers
957 photos
175 videos
169 files
389 links
ارتباط با ادمین @IDataScientist
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Download Telegram
📸چهار نقش مختلف در علوم داده و تخصص‌های اصلی آن‌ها_شما در کدام نقش بازی می کنید؟

🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
پروتکل رمزنگاری شده ی SSH چگونه داده های شما را بر شبکه با ماهیت ذاتی ناامن، منتقل می کند؟
#SSH
#DATATRANSMISSION
#DATA
#NETWORKSECURITY

🪩https://news.1rj.ru/str/toobabigdatascience
💸Top 15 Highest Paying Jobs in the World 2024

پانزده شغل پردرآمد دنیا در سال ۲۰۲۴
🪩https://news.1rj.ru/str/toobabigdatascience
Inference_and_Learning_from_Data,_Volume_1_I_Foundations_Cambridge.pdf
25.2 MB
🌹عیدی کانال #متخصصان_علم_داده به همراهان گرامی ،بمناسبت مبعث پیامبر اعظم ص ، دایره المعارف سه جلدی علم داده اثری از دانشگاه معظم کمبریج


🧠 استنتاج و یادگیری از داده ها: اصول
جلد اول

🧠 Inference and Learning from Data: Foundations
Volume 1
✏️ By Ali H. Sayed

انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
Inference_and_Learning_from_Data_Volume_2_II_Inference_Cambridge.pdf
52 MB
#Learning #Data

استنتاج و یادگیری از داده‌ها: استنتاج
جلد دوم

Inference and Learning from Data: Inference
Volume 2
✏️ By Ali H. Sayed

انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.

🪩https://news.1rj.ru/str/toobabigdatascience
python for AI.pdf
1.9 MB
کتاب کدهای پایتون برای یادگیری ماشین
مزایای پایتون
➡️یک اکوسیستم کتابخانه ای عالی

➡️یک مانع ورود کم

➡️انعطاف پذیری

➡️استقلال پلت فرم

➡️خوانایی

➡️گزینه های تجسم خوب

➡️حمایت جامعه

➡️محبوبیت روزافزون
https://news.1rj.ru/str/toobabigdatascience
صفحه لینکدین
https://www.linkedin.com/groups/6728779/
Inference_and_Learning_from_Data_Volume_3_III_Learning_Cambridge.pdf
77.3 MB
#Book
#Learning
#Data

استناج و یادگیری از داده‌ها: یادگیری
جلد سوم

Inference and Learning from Data: Learning
Volume 3
✏️ By Ali H. Sayed

انتشارات Cambridge University Press
سال 2023
زبان انگلیسی
فرمت PDF.
🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
⭕️سم آلتمن، مدیرعامل OpenAI، در اجلاس جهانی دولت‌ها که در دبی برگزار شد، حضور پیدا کرد و از توسعه‌ی نسل جدید هوش مصنوعی این شرکت با نام GPT-5 خبر داد. او می‌گوید که GPT-5 بسیار باهوش‌تر از نسل‌های پیشین خود خواهد بود. یکی از مدیران مایکروسافت پیش‌تر گفته بود که GPT-5 احتمالاً سنگ‌نوشته‌‌ای سه‌‌هزارساله را رمزگشایی می‌کند.

🟡آلتمن در اجلاس جهانی دولت‌ها گفت: «چیزی که GPT-5 را هیجان‌انگیز می‌کند، این است که تنها یک قابلیت خاص این هوش مصنوعی پیشرفت نمی‌کند؛ بلکه در تمام کارکردها و قابلیت‌هایش بهتر، باهوش‌تر و پیشرفته‌تر خواهد شد.»

🔴 هنوز تاریخ دقیق رونمایی از GPT-5 مشخص نیست اما شایعات می‌گویند که نسخه‌ی بعدی ChatGPT یک مدل هوش مصنوعی چندوجهی با اسم رمز Gobi خواهد بود که احتمالاً در سال ۲۰۲۴ از راه می‌رسد.

🔵 نگرانی فعلی سم آلتمن این است که سوگیری‌های اجتماعی به‌صورت ناخواسته باعث انحراف سیستم‌های هوش مصنوعی از مسیر اصلی‌شان شوند.
#GPT-5
#AI
#ChatGPT
تجربه کار با دیتا سِت های واقعی ! تجربه ی سخت و شیرینی ست.
و اساسا، قابل مقایسه با کار آزمایشگاهی یا آموزشی با داده ها ی حاضر و آماده نیست
مساله این است که شاید هیچ مهندس داده ای، با داده های گلخانه ای! و مصنوعی که بیش از حد تَر و تمیز اند، چالش های کار با داده را، تجربه نخواهد کرد.

👁‍🗨 مثلا اینکه وقتی در یک دیتاست حجم زیادی از missing values داریم چه کنیم؟

احتمالا اولین چیزی که به ذهن می رسد جایگزین کردن #missing_value ها با صفر و یا میانگین کل است.
اما صادقانه باید گفت که   هر بار که از این روش استفاده می کنید ، دارید توزیع دیتا را بهم می ریزید!

نتیجه جایگزینی (imputing) مقادیر گمشده با میانگین یا صفر یا هر مقدار ثابت دیگر می دهد :
- تغییر در آمار خلاصه
- تغییر در توزیع
- افزایش یک مقدار خاص

⬅️ و در نتیجه منجر به مدل سازی نادرست و نتیجه گیری نادرست و در نهایت به تصمیم گیری های نادرست.

تجربه و یک راه حل عملی استفاده از از #KNN است
ویژگی‌های مقدار گمشده با اجرای kNN بر روی مقادیر ویژگی غیرگمشده نسبت داده میشود. و کار را در می آورد
نتیجه اجرا با هریک از روش ها در تصویر فوق.
🖇📈وضعیت دانشگاه‌های ایرانی در رده‌بندی‌های سال ۱۴۰۲ هشدارآمیز بوده است/ افت جایگاه ۴۱ دانشگاه در رتبه‌بندی ۲۰۲۳ ISC

📐📖 رتبه‌بندی جدیدپایگاه استنادی جهان اسلام ابتدای این هفته منتشر شد تا باردیگر عملکرد دانشگاه‌های داخلی در مقایسه با دنیا سنجیده شود. اتفاق تلخی که تنهابه این نظام رتبه‌بندی محدود نشده و چند سالی می‌شود روند حضور دانشگاه‌های ایران با عینک نظام‌های رتبه‌بندی دیگر مانند لایدن، تایمز، QS و شانگهای، مسیر نزولی به خود گرفته است.

📉علی‌رغم اینکه از نظر ِ تعداد ،دانشگاه‌های کشور با افزایش شش موردی همراه و از ۶۳ به ۶۹ رسیده اما از لحاظ کیفیت، دانشگاه‌های مطرح کشور با شیب تند سقوط همراه بوده‌اند. 

📈دانشگاه تهران با ۱۰۰ پله تنزل در زمره دانشگاه‌هایی قرار گرفته که در رده ۵۰۱ تا ۶۰۰ دنیا تعریف می‌شوند.

علم و صنعت با ریزش ۱۰۰ پله‌ای همراه بوده؛
شهید بهشتی با افت ۳۰۰ پله‌ای جایگاه جهانی خود روبه‌رو شده؛ تربیت مدرس اما بدون تغییر روی همان نقطه ۶۱۰ الی ۷۰۰ باقی مانده و بعد از آن دانشگاه صنعتی امیرکبیر نیز امسال هم مانند دو سال گذشته در جایگاه ۷۰۱ الی ۸۰۰ باقی مانده است.


🪩https://news.1rj.ru/str/toobabigdatascience
This media is not supported in your browser
VIEW IN TELEGRAM
_همه هست آرزویم که ببینم از تو رویی
چه زیان تو را که من هم، برسم به آرزویی...
نیمه شعبان🌹، ولادت حضرت حجت ابن الحسن عسگری عج، یگانه منجی بشریّت از ظلم و ستم و بدعت
بر شما همراهان عزیز کانال مبارک

🦚 https://news.1rj.ru/str/toobabigdatascience🦚
هوش مصنوعی چگونه کار می کند؟
مرحله ی دوم (جمع آوری و آماده سازی داده ها) عموما طولانی ترین و دشوارترین مرحله در این روال است.
#AI
#DataCollection
#DataPreparation
🪩https://news.1rj.ru/str/toobabigdatascience
As engineers, we were going to be in a position to change the world – not just study it.”

📱روز مهندس مبارک...

🪩https://news.1rj.ru/str/toobabigdatascience
Road accidents .zip
42.6 MB
📦 Datasets name: Road accidents in the Czech Republic


💬 Detailed dataset of road accidents in the Czech Republic (2016-2022) , The police of Czech Republic regularly gathers and releases detailed data on traffic incidents throughout the nation, typically on an monthly basis. This dataset covers various aspects such as geographic locations, weather conditions, vehicle types, casualty counts, and vehicle maneuvers. The wealth of information makes it a compelling and extensive dataset for analysis and research purposes.


⚙️ Format: CSV file

🔒 From: Kaggle

🗄یکی از روش های کار روی داده ها، استفاده از دیتا ست های استاندارد است.
دیتا ست تصادفات جاده ای در جمهوری چک شامل داده های مربوط به سوانح جاده ای طی،سال‌های ۲۰۱۶ تا ۲۰۲۲ است که توسط پلیس جمهوری چک جمع آوری شده است و شامل علل تصادفات، نوع خودروها، انواع مانورهای خودرو ها در جاده ها( لایی کشیدن، سبقت و سرعت غیر مجاز و...) که منجر به تصادفات شده، وضعیت آب و هوا و...در فرمت csv (,.) برگرفته از سایت کَگِل است.
🪩 https://news.1rj.ru/str/toobabigdatascience
⬅️ اکثر مشاهیر فناوری در دو دهه‌ی اخیر بارها اعلام کردن که کدنویسی برای همه به‌خصوص کودکان ضروریه و آقای هوانگ، مدیرعامل انویدیا، در اجلاس اخیر دولت‌های جهان که در دبی برگزار شد، اظهاراتی خلاف دیدگاه آنها را مطرح کرد
👨‍🏫 مدیرعامل انویدیا می‌گوید: «وظیفه‌ی ما، ایجاد فناوری‌‌های محاسباتی است که نیاز به یادگیری برنامه‌نویسی را از بین ببرد و زبان کدنویسی باید مشابه زبان گفتار معیار انسان‌ها باشد. اکنون همه در جهان برنامه‌نویس هستند و این معجزه‌ی هوش مصنوعی است.»
👑 این نخستین بار نیست که هوانگ چنین اظهاراتی درمورد هوش مصنوعی و برنامه‌نویسی مطرح می‌کند؛ او یک‌ سال قبل هم در سخنرانی دانشگاه برکلی درمورد اینکه توانایی‌های کدنویسی ChatGPT چگونه می‌توانند چشم‌انداز حوزه‌ی برنامه‌نویسی را تغییر بدهند، صحبت کرد و در سخنرانی خود گفت: «با هوش مصنوعی همه می‌توانند به‌معنای واقعی کلمه برای کامپیوتر برنامه بنویسند.»
👀هوانگ معتقد است : «اینکه همه‌ی مردم را با هوش مصنوعی مولد آشنا کنیم بسیار حیاتی است و من باور دارم فرایند ارتقای مهارت، لذت‌بخش و شگفت‌انگیز خواهد بود.»

#AI
#generativeai

🪩https://news.1rj.ru/str/toobabigdatascience
👽کاخ سفید خواستار دست‌کشیدن از زبان‌های آسیب‌پذیر مانند C و C++

اداره ملی رهبری سایبری دفتر کاخ سفید، در یک گزارش منتشر شده گغت:

دولت باید توسعه‌دهندگان را به کاهش خطر حملات سایبری تشویق کند و از زبان‌های برنامه‌نویسی استفاده کند که دارای آسیب‌پذیری‌های امنیتی حافظه نیستند.

🚫این گزارش به توسعه‌دهندگان پیشنهاد می‌دهد که از زبان‌های برنامه‌نویسی با حافظه امن استفاده کنند، مانند Rust که به عنوان یک مثال از زبان‌های امن ذکر شده است.

♨️همچنین، از طرفی اداره امنیت سایبری NSA، زبان‌های C#، Go، Java، Ruby و Swift را به عنوان زبان‌های برنامه‌نویسی امن معرفی کرده است.

🪩https://news.1rj.ru/str/toobabigdatascience
🧬 شرکت مایکروسافت یک شبکه‌ی عصبی گرافی به نام ViSNet برای مدل‌سازی و بازنمایی ساختارهای هندسی سه‌بعدی مانند مولکول‌ها ارائه داده‌ست که قادر‌ست ارتباطات پیچیده بین ساختار مولکولی و فعالیت بیولوژیکی (structure-activity relationships) را درک کرده و رفتار و ویژگی‌های مولکول‌‌ها را پیش‌بینی کند.
🔅 کیفیت سنجی مقالات در هنگام جستجو در گوگل اسکالر با این افزونه در مرورگر کروم:
آدرس وبسایت افزونه:
🔗 https://www.excitation.tech/
#افزونه
#Extension #Research #Tools #ResearchTools #Research_Tools #Chrome #Tool #Search #Free #Rankings #Check #Results #Result #Cited #CitedBy #Paper

🪩https://news.1rj.ru/str/toobabigdatascience