The Misgeneralization Mind – Telegram
The Misgeneralization Mind
156 subscribers
208 photos
14 videos
40 files
109 links
اینجا چیزایی که برام جالب باشه رو میذارم.

ناشناس:
https://news.1rj.ru/str/BiChatBot?start=sc-6e66d9fc9f
Download Telegram
#پیشنهاد_کتاب
بشخصه یه گارد یا بایاس ذهنی نسبت به کتاب‌ها و رمان‌هایی که نویسنده‌شون ایرانی هست داشتم (می‌دونم این نگاه درست نیست و نویسنده‌های خیلی خوبی در ایران داشتیم و داریم) و به همین خاطر ترجیح می‌دادم خیلی سمت این کتاب‌ها نرم (البته بجز آثار صادق هدایت).

خلاصه می‌شه گفت برای اولین بار (اگه صادق هدایت رو فاکتور بگیریم) تصمیم گرفتم یه کتاب از نویسنده‌های ایرانی رو شروع به خوندن کنم و انتخاب‌ام هم ۵۳ نفر از بزرگ علوی بود.

شاید بشه گفت اتفاقاً انتخاب ریسکی‌ای هم بوده چون ۵۳ نفر روایت‌گر یک داستان که زاده‌ی ذهن نویسنده باشه نیست و می‌شه گفت بیشتر جنبه تاریخی داره و مربوط به تجربه‌های شخصی بزرگ علوی هست.

موضوع کتاب هم به دوران پهلوی اول بر می‌گرده و دستگیری ۵۳ نفر از روشنفکرهای اون دوره‌ست که بعد از آزادی از زندان تصمیم می‌گیرن اولین حزب سیاسی ایران یعنی حزب توده رو ایجاد کنن.

موضوع کتاب برای من جذابه و اگه به مباحث تاریخی علاقه دارید پیشنهاد می‌کنم بخونید. قلم بزرگ علوی هم خیلی گیرا و روون‌ئه و علاقه‌مند شدم که کتاب‌های بیشتری ازش بخونم.
🔥4
Introduction to Graph Theory (2nd Edition) Douglas B. West.pdf
61.1 MB
🕯کتاب ارزشمند "مقدمه‌ای بر نظریه گراف‌ها"

📚Introduction to Graph Theory

✍️یکی از بهترین منابع برای یادگیری نظریه گراف‌ها (Graph Theory) کتاب Introduction to Graph Theory نوشته Douglas B. West است. این کتاب به صورت جامع، دقیق و با زبانی ساده مفاهیم پایه‌ای و پیشرفته گراف‌ها را پوشش می‌دهد و می‌تواند به عنوان یک مرجع کامل در این زمینه مورد استفاده قرار گیرد.

🔎چرا این کتاب مهم است؟
ساختار آموزشی:
طراحی کتاب به گونه‌ای است که افراد می‌توانند با آن به صورت مستقل و بدون نیاز به کلاس یا استاد شروع به یادگیری کنند و پیشرفت قابل توجهی داشته باشند.

📝پوشش گسترده:
مباحث متنوعی از جمله گراف‌ها، مسیرها، دورها، رنگ‌آمیزی گراف‌ها، تطابق‌ها، درخت‌ها و ساختارهای شبکه‌ای به شکلی کاملاً آموزنده و با جزئیات عالی پوشش داده شده است.

📖مخاطبان کتاب:
دانشجویان رشته‌های علوم کامپیوتر و ریاضی
علاقه‌مندان به مباحث پیشرفته نظریه گراف‌ها
متخصصان حوزه داده‌کاوی، شبکه‌های اجتماعی و تئوری ساختارهای شبکه

#Graph_Theory #Douglas_West #Introduction_to_Graph_Theory #نظریه_گراف

👨‍💻در کانال انجمن علمی علوم کامپیوتر با ما همراه باشید…
|
@ComputerSci_Association |
Please open Telegram to view this post
VIEW IN TELEGRAM
صد مصر مملکت ز تعدی خراب شد
صد بحر سلطنت ز تطاول سراب شد
صد برج حرص و بخل به خندق دراوفتاد
صد بخت نیم خواب به کلی به خواب شد
آن شاهراه غیب بر آن قوم بسته بود
وان ماه زنگ ظلم به زیر حجاب شد
وان چشم کو چو برق همی‌سوخت خلق را
در نوحه اوفتاد و به گریه سحاب شد
وان دل که صد هزار دل از وی کباب بود
در آتش خدای کنون او کباب شد
ای شاد آن کسی که از این عبرتی گرفت
او را از این سیاست شه فتح باب شد
چون روز گشت و دید که او شب چه کرده بود
سودش نداشت سخره صد اضطراب شد
چون بخت روسپید شب اندر دعا گذار
زیرا دعای نوح به شب مستجاب شد

مولانا
❤‍🔥2
Forwarded from Mathematical Musings
مساله برای فکر کردن:
این مهره ها رو طوری در اون صفحه بذارید که هیچ کدوم همدیگر رو تهدید نکنند.
مساله ای از Martin Garnder
Forwarded from Anarchonomy
تقریبا غیرقابل باوره.
پیشرفت سخت‌افزار باعث شده پیشرفت نرم‌افزار به چشم نیاد، ولی اونجا هم انقلابی رخ داده. تصویر بالا یک فریم از فیلم به صورت خامه، که با رزولوشن فول‌اچ‌دی ۷۱۲ مگابیت در ثانیه حجم دیتاشه. تصویر پایین، همون فیلم ولی فشرده شده با کدک اچ.۲۶۷ که با همون رزولوشن فقط ۸۸ کیلوبیت در ثانیه‌ست! یعنی بیش از ۸۲۰۰ برابر فشرده‌سازی، در حالی که کیفیت تصویر با نسخه خام مو نمیزنه.
ریاضی زیباست.
داشتم یه تحقیقی برای دانشگاه آماده می‌کردم که در همین حین با پلتفرم Michelangelo اوبر آشنا شدم و بنظرم جالب اومد. میکل‌آنجلو یه پلتفرم ML-as-a-service هست که بستری رو برای تیم‌های اوبر فراهم می‌کنه تا بتونن دیتاها رو مدیریت کنن، مدل ترین کنن، مدل‌ها رو ارزیابی و تست کنن و بطور کلی روی اونها نظارت و مانیتورینگ داشته باشن. خودشون می‌گن که قبل طراحی و ساخت چنین پلتفرمی، توی ساخت و استقرار مدل‌های AI بخاطر لارج اسکیل بودن پروداکت‌هاشون چالش‌های زیادی داشتن. هیچ سیستمی هم وجود نداشته که بشه داخلش یه پایپلاینِ کانسیستنت (یکنواخت؟) و قابل اعتماد برای تولید و مدیریت دیتاهای آموزشی و پیش‌بینی‌شون داشته باشن. در نتیجه اومدن میکل‌آنجلو رو توسعه دادن تا بتونن یه سیستم end to end داشته باشن و بین تیم‌های مختلف‌شون ارتباط برقرار کنن و کارمندهای بخش‌های مختلف بتونن سیستم‌های ML توی مقیاس بزرگ بسازن و مدیریت‌ش کنن. استارت پروژه‌شون هم از ۲۰۱۵ خورده.
The Misgeneralization Mind
داشتم یه تحقیقی برای دانشگاه آماده می‌کردم که در همین حین با پلتفرم Michelangelo اوبر آشنا شدم و بنظرم جالب اومد. میکل‌آنجلو یه پلتفرم ML-as-a-service هست که بستری رو برای تیم‌های اوبر فراهم می‌کنه تا بتونن دیتاها رو مدیریت کنن، مدل ترین کنن، مدل‌ها رو ارزیابی…
برای توسعه‌ش هم از یسری ابزار اوپن‌سورس مثل HDFS, Spark, Samza, Cassandra, MLLib, XGBOOST و Tensorflow استفاده کردن و طبق گفته خودشون کلاً ترجیح بر این بوده که از ابزارهای اوپن‌سورس استفاده کنن و اگر جایی هم نیاز بوده اون‌ها رو فورک کنن و سفارشی‌سازی کنن و مجدد در اختیار جامعه اوپن‌سورس قرار بدن. جاهایی هم بوده که ابزارهای اوپن‌سورس جوابگوی نیازشون نبوده و مجبور شدن خودشون دست به کار بشن و سیستم جدیدی پیاده‌سازی کنن. پلتفرم میکل‌آنجلو هم روی زیرساخت‌های دیتا و پردازش اوبر بنا شده و اجزایی مثل Data Lake که تمامی داده‌های تراکنشی و لاگ شده‌ی اوبر رو ذخیره می‌کنه، بروکرهای kafka که پیام‌های لاگ شده رو از تمام سرویس‌های اوبر جمع‌آوری می‌کنه، استریمینگ کامپیوت انجین Samza و کلاسترهای مدیریت شده Cassandra رو شامل می‌شه.
در روز بزرگداشت خیام یادی هم از این متعصب مذهبی نجم الدین رازی کنیم که در زمان خود از "علما" حساب می شد. البته نسبت دادن صفت متعصب به این عالم روزگار به این خاطر نیست که از خیام بد یاد می کند. برای درستی این صفت نگاهی به پاسخ های او به شبهات در این کتاب بس است.

می توان تعصب او را با زمانه ی خودش توجیه کرد اما یادمان باشد عمر خیام هم در همین زمانه می زیست اما او کجا و این ها کجا.

قضاوت اين شخص ارزش مخصوصي در شناسانيدن فكر و فلسفة خيام دارد . مؤلف
صوفي مشرب از نيش زبان و فحش نسبت به خيام خود داري نكرده است . البته
بواسطة نزديك بودن زمان، از هر جهت مؤلف مزبور آشناتر به زندگي و افكار و
آثار خيام بوده، و عقيدة خود را دربارة او ابراز ميكند . آيا اين خود دليل كافي
نيست كه خيام نه تنها صوفي و مذهبي نبوده، بلكه برعكس يكي از دشمنان
ترسناك اين فرقه بشمار ميآمده.

صادق هدایت، ترانه های خیام
تصویر میم که قرار داده شده به سری رامانوجان اشاره داره که می‌شه گفت معروف‌ترین سری این ریاضی‌دان هندی بوده. از ویژگی‌های این سری اینه که خیلی سریع به عدد پی نزدیک می‌شه و همگرایی سریعی داره. تقریباً می‌شه گفت هر جمله (term) این سری حدودا هشت رقم اعشار عدد پی رو محاسبه می‌کنه و تنها با چهار جمله اول می‌شه تا سی رقم اعشار عدد پی رو بدست آورد. الگوریتم‌هایی مثل Chudnovski هم که بر پایه سری رامانوجان هست، از همین ایده بهره می‌گیره (بعداً شاید بیشتر در مورد این الگوریتم توضیح دادم).

نکته جالب اینجاست که رامانوجان بدون استفاده از روش‌های اثباتی و کلاسیک به این ایده‌ها می‌رسید و از بینش‌های شهودی استفاده می‌کرده. هاردی (ریاضی‌دان انگلیسی) در مورد رامانوجان می‌گه:
یک روز در نامه‌ای از رامانوجان فرمول‌هایی دیدم که اگر درست بودند، حتماً باید از یک ذهن نابغه سرچشمه گرفته باشند. و درست هم بودند!

نکته: نقل‌قول بالا از هاردی ممکنه رسمی و واقعی نباشه، ولی توی چندتا منبع دیدم که بهش اشاره کرده بودن.
👍2
The Misgeneralization Mind
Photo
تصویر دوم هم مربوط به نامه‌ای هست که رامانوجان در سال ۱۹۱۳ (در سن حدوداً ۲۵ سالگی) برای هاردی می‌فرسته و خودش رو به عنوان کارمند بخش حسابداری با حقوق ۲۰ پوند در سال معرفی می‌کنه. توی نامه می‌گه که تحصیلات دانشگاهی و آکادمیک نداره ولی علاقه و عطش زیادی برای ریاضیات داره. به تحقیقات خودش در زمینه سری‌های واگرا و متعارف هم اشاره می‌کنه و می‌گه که مورد تحسین ریاضی‌دان‌های محلی قرار گرفته و اون رو شگفت‌انگیز توصیف کردن.
👍2
The Misgeneralization Mind
Photo
اینا هم جالب بودن :) عملاً هیچ اعتقادی به اثبات نداشته و کلی فرمول عجیب و غریب که البته درست هم بودن رو ارائه داده.
👍2😁1
یکم در مورد الگوریتم Similar channels تلگرام خوندم و برام جالب بود که تلگرام بر چه اساسی میاد یه کانال مشابه رو پیدا می‌کنه و به اعضا معرفی می‌کنه. روشی که پیاده‌سازی کردن اینجوریه که هر کانال رو به عنوان یک مجموعه از اعضا در نظر گرفتن و اگه تعداد زیادی از اعضا توی دو تا کانال مشترک باشن، اون دوتا کانال احتمالاً محتوای مشابه و در یک موضوع خاص منتشر می‌کنن که طبیعتاً می‌تونه برای باقی اعضای یکی از اون کانال‌ها جذاب باشه و به اون کانال دوم هم جوین بشه. حالا Recommender system تلگرام میاد بُردار هر کانال رو بصورت یه Binary vector از اعضای کانال می‌سازه (اگه کاربر i عضو کانال j باشه، عنصر iام بردار j مقدار 1 داره) و با محاسبه اشتراک بین این بردارها (با کمک ضریب یاکارد Jaccard similarity) میزان overlap بین اعضای دو تا کانال رو بدست میارن. حالا هر چقدر نسبت اشتراک اعضای دو کانال بر اجتماع اعضای دو کانال بیشتر باشه، اون دو تا کانال بهم شبیه‌ترن و توی لیست در جایگاه بالاتری قرار می‌گیرن.
Jaccard(A, B) = |A∩B| / ∣A∪B∣
اگه این بردار بصورت Binary نباشه و وزن‌دار باشه، مثلاً تو شرایطی که وزن هر کاربر بر اساس فعالیت یا مدت زمان عضویت‌ش مشخص می‌شه، از شباهت کسینوسی هم استفاده می‌شه.
Cosine (A, B) = A.B / A B

حالا برای اینکه این محاسبات توی مقیاس بالا و چند میلیون کاربر و چندصد هزار کانال قابل انجام باشه، تلگرام از یسری روش تقریب تخمینی مثل MinHash با Locality Sensitive Hashing استفاده می‌کنه. توی این روش با اعمال کردن چندتا تابع هش تصادفی و کوچیک کردن بردارهای بلند به هش‌های کوتاه‌تر، شباهت یاکارد سریع‌تر انجام می‌شه و فضای ذخیره‌سازی کمتری هم نیاز داره. بعد هم با کمک LSH فقط اون دسته از زوج‌های کانال که شباهت بیشتری دارن انتخاب می‌شن و محاسبه دقیق‌تری روی اونها انجام می‌شه.

برای حفظ حریم خصوصی و پرایوسی هم این محاسبات فقط روی کانال‌های پابلیک انجام می‌شه و اگر اشتباه نکنم کانال باید حداقل هزار عضو داشته باشه تا قابلیت Similar channels براش باز بشه.
The Misgeneralization Mind
یکم در مورد الگوریتم Similar channels تلگرام خوندم و برام جالب بود که تلگرام بر چه اساسی میاد یه کانال مشابه رو پیدا می‌کنه و به اعضا معرفی می‌کنه. روشی که پیاده‌سازی کردن اینجوریه که هر کانال رو به عنوان یک مجموعه از اعضا در نظر گرفتن و اگه تعداد زیادی از…
بنظرم تلگرام یکی از بهترین و قوی‌ترین پلتفرم‌هاست و از لحاظ امنیت هم خیلی روش‌ها و تکنیک‌های خفنی پیاده‌سازی کردن که چون خیلی سر رشته ندارم واردش نمی‌شم.

تلگرام یه بخشی از تسک‌ها و آپدیت‌هایی که می‌ده رو در قالب مسابقات توی یه کانال تلگرام (Telegram contest) منتشر می‌کنه و یه جایزه‌ای هم براش در نظر می‌گیره و اینطوری تیم اصلی‌شون همیشه کوچیک باقی می‌مونه.

برای اعضای اصلی و کارمندهای تلگرام هم گویا یه قانونی تحت عنوان No Linkedin تعریف شده که اگر شخصی توی تلگرام مشغول به کار باشه اجازه نداره اون رو توی لینکدین یا سایر پلتفرم‌ها اعلام کنه.
The Misgeneralization Mind
یکم در مورد الگوریتم Similar channels تلگرام خوندم و برام جالب بود که تلگرام بر چه اساسی میاد یه کانال مشابه رو پیدا می‌کنه و به اعضا معرفی می‌کنه. روشی که پیاده‌سازی کردن اینجوریه که هر کانال رو به عنوان یک مجموعه از اعضا در نظر گرفتن و اگه تعداد زیادی از…
اینم اضافه کنم که علاوه بر کارایی و جذابیتی که این سیستم داره، انتقادهایی هم بهش وارده. یسری می‌گن الگوریتم Similar channels می‌تونه منجر به پدیده‌ی Echo Chamber (اتاق پژواک؟) بشه و کانال‌هایی محتویات تندرو و رادیکال منتشر می‌کنن، بتونن با هم ارتباط بگیرن و کاربرها به کانال‌های بیشتری از این دسته راه پیدا کنن و در نهایت طبعات ناخوشایندی به بار بیاره.
Forwarded from a pessimistic researcher (Kc)
یه مقاله‌ای دو سه روز پیش دیدم روی arxiv در مورد in-place sorting. یه دانشجوی کارشناسی دانشگاه UC Davis تنهایی یه الگوریتم جدید برای in-place sorting داده که تونسته مشکل الگوریتم quicksort که بخاطر suboptimal pivot selection توی worst case مرتبه زمانی O(n^2) داره رو حل کنه و توی worst case مرتبه زمانیش O(n*(logn)^2) بشه. الگوریتم wave-sort یه ایده‌ی جدید برای dynamic pivot selection مطرح میکنه که ماکسیمم سایز recursion stack اش O(logn) هستش( یعنی پیچیدگی لگاریتمیک داره، برخلاف merge sort که نیاز به فضای O(n) داره). این الگوریتم divide-and-conquer دو فاز up-wave و down-wave داره فاز اول میاد ساب لیست سورت شده رو با سابلیست سورت نشده ادغام میکنه و عمل partitioning و block swapping توی فاز دوم انجام میشه. با توجه به اینکه این الگوریتم comparison-based هستش یه نکته جالبش اینه که توی evaluation نشون میده که حدود ۲۴ درصد تعداد مقایسه‌هاش کمتر از quick sort عه و تعداد مقایسه‌هاش بسیار نزدیک به lower bound تئوری یعنی log2n! هستش. دقیق تر، به طور میانگین فقط ۱ درصد تعداد مقایسه‌هاش بیشتر از lower bound ایه که میتونه باشه!

خلاصه جالب بود ولی خسته کننده
اینم لینکش
https://arxiv.org/pdf/2505.13552
👍2🔥1💩1