The Misgeneralization Mind – Telegram
The Misgeneralization Mind
154 subscribers
208 photos
14 videos
40 files
109 links
اینجا چیزایی که برام جالب باشه رو میذارم.

ناشناس:
https://news.1rj.ru/str/BiChatBot?start=sc-6e66d9fc9f
Download Telegram
Forwarded from Dutchman Daily
Dutchman Daily
جک دورسی (توییتر رو داشت قبلا و بیرونش کردن) داره یه سوشال مدیا می‌سازه به اسم BitChat. بعد این شبکه‌ی اجتماعی از طریق اینترنت کار نمی‌کنه. به عبارتی اون شبکه‌ش یا به طور خاص‌تر مش‌اش (Mesh) رو با بلوتوث می‌سازه. به عبارتی نیاز نیست پیامی که میدین رو سرور…
این چیزهای decentralized و بعضا بی‌نیاز از اینترنت داره خیلی زیاد میشه و خب بنظر در آینده تحول خیلی عجیب و باحالی توی این حوزه باشه.

اگر رونمایی آیفون ۱۵ اپل رو هم دیده باشید (اگر ندیدید ببینید)، اپل یه تکنولوژی معرفی کرده بود روی گوشی ۱۵ پرو که اگر شما توی یک بیابونی جایی بودید که خلاصه صدای خر به خدا نمی‌رسید و هیچ دکل مخابراتی وجود نداشت و به عبارتی نه اینترنت داشتید و نه آنتن، منتهی همچنان بتونید از طریق یه سری ماهواره تماس بگیرید یا که پیامتون رو ارسال کنید.

در آینده احتمالا اینجوری بشه که یا دیگه هر دهاتی هم باشید اینترنت دارید. یا که اصلا دیگه نیازی به اینترنت برای برقراری ارتباط ندارید.
داشتم یکم در مورد راماکریشنان (نویسنده کتاب DBMS) می‌خوندم فهمیدم استاد راهنمای دوره دکتراش توی دانشگاه آستن تگزاس جناب سیلبرشاتس بوده. جالبه و کم اتفاق میفته که کسی تونسته رو دست استادش (اونم سیلبرشاتس کبیر) بلند بشه و کتابش به عنوان یکی از رفرنس‌های اصلی در دانشگاه‌ها تدریس شه :)
در مورد هندسه محاسباتی می‌خوندم که به یه مسئله جالب و تقریباً هم پر کاربرد توی دنیای واقعی رسیدم احتمالاً برای شما هم جذاب باشه. اول از همه هم بگم که هندسه محاسباتی جزو چارت گرایش الگوریتم و محاسبات مقطع ارشده و هر چی بیشتر در مورد این گرایش تحقیق می‌کنم بیشتر علاقه‌مند می‌شم بهش.
________________________________________
توی هندسه محاسباتی یه مبحثی داریم به اسم دیاگرام ورونوی (Voronoi diagram). ما میاییم صفحه (یا یه فضای n بعدی) رو بر اساس نزدیکی به یه مجموعه نقاط مشخص تقسیم می‌کنیم. به عنوان مثال فرض کنید یه مجموعه از نقاط (سایت هم گفته می‌شه) داریم به صورت زیر:
P = { p₁, p₂, …, pₙ } ⊂ ℝ²
حالا سلول یا منطقه ورونوی متناظر با هر سایت (نقطه) Pi به صورت زیر تعریف می‌شه:
V(p_i) = { x ∈ R² | d(x, p_i) ≤ d(x, p_j) for all j ≠ i }
که d(0,0) معمولاً فاصله اقلیدسی‌ئه. دیاگرام ورونوی، اجتماع V(pi) نقاط اون مجموعه‌ای هست که بالاتر گفتم که صفحه رو به سلول‌های بدون هم‌پوشی تقسیم می‌کنه.
The Misgeneralization Mind
در مورد هندسه محاسباتی می‌خوندم که به یه مسئله جالب و تقریباً هم پر کاربرد توی دنیای واقعی رسیدم احتمالاً برای شما هم جذاب باشه. اول از همه هم بگم که هندسه محاسباتی جزو چارت گرایش الگوریتم و محاسبات مقطع ارشده و هر چی بیشتر در مورد این گرایش تحقیق می‌کنم بیشتر…
اگه بخوام ساده‌تر بگم:
فرض کنید حوالی میدون انقلاب با دوستاتون دارید قدم می‌زنید و تصمیم گرفتید برید کافه. دیاگرام ورونوی توی نقشه‌ای که ترسیم می‌کنه مشخصاً بهت می‌گه توی نقطه‌ای که هستی نزدیک‌ترین کافه بهت کدومه. مثلاً جایی که هستید 5تا کافه وجود داره توی نواحی مختلف اون منطقه. حالا دیاگرام ورونوی میاد اون منطقه رو به 5 ناحیه تقسیم می‌کنه و هر ناحیه مربوط به یک کافه‌ست. حالا مرز بین ناحیه‌ها چطوری کشیده می‌شه؟ مرز بین دو ناحیه A و B رو خطی عمود وسط خط اتصال A به B می‌کشیم. مثلاً اگه A و B با هم دیگه 10 متر فاصله داشته باشن، مرز ناحیه‌شون دقیقاً تو 5 متری هر دو ناحیه کشیده می‌شه. چندتا از ویژگی‌های جالبش هم اینه که هر ناحیه یه چند ضلعی می‌شه. هر چقدر این کافه‌ها به هم دیگه نزدیک‌تر باشن منطقه‌شون کوچیک‌تر می‌شه. اون نقاطی هم که روی مرز هستن با دو یا چندتا کافه هم فاصله‌ان.
The Misgeneralization Mind
در مورد هندسه محاسباتی می‌خوندم که به یه مسئله جالب و تقریباً هم پر کاربرد توی دنیای واقعی رسیدم احتمالاً برای شما هم جذاب باشه. اول از همه هم بگم که هندسه محاسباتی جزو چارت گرایش الگوریتم و محاسبات مقطع ارشده و هر چی بیشتر در مورد این گرایش تحقیق می‌کنم بیشتر…
یکی از کاربردهاش هم طراحی شبکه‌های موبایله. میاییم هر آنتن رو یک نقطه در دیاگرام ورونوی در نظر می‌گیریم. مثلاً فکر کنید توی هر شهر/منطقه چندتا آنتن پایه (BTS) داریم که پخش‌کننده سیگنال موبایل هستن. هر کدوم از این آنتن‌ها منطقه به خصوصی رو سرویس می‌ده که در اون منطقه، آنتن بهترین سرویس رو به کاربرها ارائه می‌ده. با ساختن سلول‌های ورونوی حول هر نقطه، نواحی طبیعی تحت پوشش هر آنتن مشخص می‌شه. حالا از این طریق می‌تونیم در مکان‌یابی و جایگذاری یه آنتن جدید استفاده کنیم که به کاربرها خدمات ارائه بده.
a pessimistic researcher
"تئوری علوم کامپیوتر در ۳ تِرک A و B و C"
اینم خواستید بخونید توضیحات خوب و کاملی بود
این رو لازم دیدم بگم شاید بدردتون بخوره و خبر نداشته باشید :)

من اینجا رو وقتی ساختم پرایوت بود و صرفاً حالت یه دفترچه رو برام داشت و مباحثی که در مورد دیتا ساینس و ML توی کورس فناپ آموزش میدیدم رو می‌نوشتم. خلاصه به چندتا از دوست‌ها و هم‌گروهی‌هام توی همون دوره لینک اینجا رو دادم و چون استقبال شد دیگه پابلیک کردم و فعالیت در اینجا رو جدی‌تر ادامه دادم.

خلاصه اینکه اگه برید اوایل کانال یسری نکته و جزوه در مورد دیتا ساینس و ML هست که ممکنه بدردتون بخوره.

لینک اولین پست:
https://news.1rj.ru/str/supersonic_AI/4
5
Forwarded from Pavel Durov (Paul Du Rove)
If you’re a student choosing what to focus on, pick MATH. It will teach you to relentlessly rely on your own brain, think logically, break down problems, and solve them step by step in the right order. That’s the core skill you’ll need to build companies and manage projects. 🏢
Please open Telegram to view this post
VIEW IN TELEGRAM
👌2
باگ Y2K (Year 2000 Bug) که یکی از شناخته‌شده‌ترین مشکلات نرم‌افزاری هست چرا اتفاق افتاد؟

ریشه این باگ توی ساده‌سازی ذخیره‌ی سال‌ها بصورت دو رقمی بود. توی دهه‌های 60 و 70 میلادی بخاطر محدودیت حافظه کامپیوترها (در گذشته حافظه خیلی ارزشمند و محدود بوده و بخاطر همین قیمت بالایی داشت) و برای صرفه‌جویی در حافظه و فضای ذخیره‌سازی خیلی از سیستم‌ها اومدن تاریخ رو با دو رقم آخر سال نگه‌داری می‌کردن. مثلاً سال 1985 بصورت 85 ذخیره می‌شد یا سال 1978 بصورت 78. این روش برای سال‌های 1900 تا 1999 کار می‌کرد و همه‌چی اوکی و گل و بلبل بود تا اینکه رسیدن به یک ژانویه سال 2000 :) سیستم‌هایی که داشتن عدد 00 رو به عنوان سال 1900 تفسیر می‌کردن نه 2000، سر همین توی موارد مختلفی مثل محاسبه سن افراد، اختلافات زمانی، مرتب‌سازی تاریخ‌ها و خیلی فرایندهای دیگه‌ای که وابسته به تاریخ هست دچار خطا میشدن.
این مشکل می‌تونست سبب خرابی سیستم‌های مهم و حیاتی مثل بانکداری، حمل و نقل، و زیرساخت‌های حیاتی بشه. یسری تخمین هم هست که هزینه‌های جهانی برای بر طرف کردن این باگ ساده حدود 300 تا 600 میلیارد دلار بوده.
علاوه بر این هم برنامه‌ها و سیستم‌ها نمی‌تونستن سال 2000 رو به عنوان سال کبیسه (leap year) شناسایی کنن و می‌تونست یسری مشکلات اضافی به همراه داشته باشه.
برای جلوگیری از رخ دادن این فاجعه هم دولت‌ها، سازمان‌ها و... قبل از سال 2000 شروع به بررسی و به‌روزرسانی سیستم‌هاشون کردن. یسری راه‌حل‌ها که استفاده کردن اینا بود:

افزودن دو رقم به فیلدهای تاریخ: اومدن برای ذخیره‌سازی سال دوباره از 4 رقم استفاده کردن. طبیعتاً این روش هزینه‌بر بود و خطر از دست رفتن داده‌ها رو هم داشته.
پنجره‌بندی تاریخ (Date Windowing): توی این روش یه سال به عنوان pivot در نظر گرفته می‌شد (مثلاً 1920)، بعد سال‌های 00 تا 20 به عنوان 2000 تا 2020 و سال‌های 21 تا 29 به عنوان 1921 تا 1929 تفسیر می‌شدن. این روش هم کوتاه مدت بود و توی دهه‌های آینده دوباره مشکل‌ساز می‌شد.
فشرده‌سازی: اومدن از کدگذاری‌های 14 بیتی برای ذخیره تاریخ استفاده کردن که حافظه کمتری مصرف کنه.

یسری نتایج و حوادث مربوط به این باگ که گزارش شد:
دو تا نیروگاه هسته‌ای در ژاپن دچار اختلال موقت شدن ولی سریع برطرف شد.
در دانمارک، نوزاد متولد اول سال 2000 به اشتباه سنش 100 سال ثبت شد :)
در استرالیا، بلیت‌های اتوبوس تاریخ‌های نادرست چاپ کردن و اسکنرها اون‌ها رو رد کردن.
در مصر، آژانس خبری ملی به طور موقت آفلاین شد.
The Misgeneralization Mind
محدودیت حافظه کامپیوترها
خلاصه حافظه تقریباً یکی از مشکلات جدی برای بشر بوده و هست. قبلاً محدودیت وجود داشت بخاطر قیمت بالای فضاهای ذخیره‌سازی و البته ابعاد بزرگی که داشتن، الان که ابعادشون خیلی کاهش پیدا کرده و مسئله هزینه هم مطرح نیست، درگیر سرعت دسترسی به حافظه‌ها هستیم و سعی داریم سرعت دسترسی به حافظه رو با روش‌هایی که وجود داره کاهش بدیم و از Memory Wall اجتناب کنیم.
مسئله خوبیه برای فکر کردن
با کمک لایبرری automata-lib می‌تونید یه ماشین DFA یا NFA به همراه حالات (شروع، حالات میانی، نهایی، Trap) و حرکت‌ها تعریف کنید و بعد یسری رشته بهش بدید ببینید ماشین اون‌ها رو می‌پذیره یا نه. احتمالاً بشه باهاش کارهای جالب‌تری هم کرد که من زیاد روش وقت نذاشتم. برای نصب لایبرری از کامند زیر استفاده کنید:
pip install automata-lib

با graphviz هم اگر بخواید می‌تونید ماشین رو تعریف کنید به همراه حرکت‌ها و در نهایت یه خروجی تصویری مثل چیزی که گذاشتم بهتون بده. استایل و... هم می‌تونید روش اعمال کنید. کامند برای نصب graphviz:
pip install graphviz
🔥2
اگه این اکستنشن ExCITATION رو به گوگل کروم اضافه کنین، گوگل اسکالر خیلی زیبا می‌شه:
- توی بخش سرچ مشخص می‌شه که هر مقاله توی ژورنال با چه‌ Qای چاپ شده.
- توی پروفایل نویسنده‌ها مشخص می‌شه که چند درصد از مقالات‌شون Q1ـه، چند درصد Q2، و غیره.

لینک اکستنشن:
https://chromewebstore.google.com/detail/excitation-journal-rankin/aolbomhlimkdakklifkocohcgpmojdia


« Sadio »


@uttweet
👍2
195609-.pdf
1.5 MB
توی این مقاله قدیمی (سال 1956 منتشر شده) نوام چامسکی سه تا مدل کلی برای توصیف زبان طبیعی ارائه میده و اونها رو با همدیگه مقایسه میکنه. هدفش هم این بوده که بررسی کنه کدوم یکی از این مدل‌ها میتونن گرامر ساده و کامل برای زبان انگلیسی بسازن طوری که تمام جملات مجاز انگلیسی رو بپذیره و غیرمجازها رو ریجکت کنه.

چامسکی مقاله رو با تعریف گرامر به عنوان نظریه‌ای finite شروع میکنه که از تعداد محدودی مشاهدات زبانی (corpus) به قوانین کلی در قالب ساختار فرضی (واژه‌ها و عبارات) دست پیدا میکنه و میتونه بی نهایت جمله تولید یا تشخیص بده.

مسئله اصلی رو هم در دو بخش مطرح میکنه. اولی یافتن گرامرهای ساده و معرف زبان طبیعی؛ دوم تدوین یه نظریه کلی از ساختار زبان که بتونه گرامر هر زبانی رو از یک corpus محدود کشف کنه. طبق این هر نظریه زبانی باید قادر باشه نمونه‌های واضح از جملات درست و غلط رو به درستی بپذیره یا کنار بذاره. مثلاً:
Sandwich a ate John
John ate a sandwich
1
Mulan
1. گروتندیکیسم: ترجیح می‌دهم که نه! – گویا بزرگی 2. نام‌گذاری بر بی‌نهایت‌ها – لورن گراهام، ژان میشل کانتور 3. روح مهندس اعدام شده – لورن گراهام 4. آسیا – ایوان تورگنف 5. عمو پتروس و انگاره‎ی گلدباخ – آپوستولوس دوکسیادیس 6. وحشت، عشق و شست و شوی مغزی:…
اگه می‌خواستید کتابی بخونید توی اوقات فراغت می‌تونید از این لیست انتخاب کنید. توی پیام بعدی هم یه همچین لیستی که برای خودم رو داشتم می‌فرستم شاید بدردتون بخوره، حدود صد و خرده‌ای کتابه که یسری رو خوندم و بقیه رو هم تو لیسته که بخونم.

پ.ن: البته این کتاب‌هایی که روش رپلای زدم بیشتر علمی‌ان. برای من اینطور نیست.
The Misgeneralization Mind
اگه می‌خواستید کتابی بخونید توی اوقات فراغت می‌تونید از این لیست انتخاب کنید. توی پیام بعدی هم یه همچین لیستی که برای خودم رو داشتم می‌فرستم شاید بدردتون بخوره، حدود صد و خرده‌ای کتابه که یسری رو خوندم و بقیه رو هم تو لیسته که بخونم. پ.ن: البته این کتاب‌هایی…
پیشاپیش عذرخواهی می‌کنم اگه پیام طولانیه.

۱- موش ها و آدم ها
۲- آدم خواران
۳- مغازه‌ی خودکشی
۴- بیگانه
۵- سقوط
۶- مسخ
۷- کتابخانه‌ی نیمه شب
۸- بوف کور
۹- قمارباز
۱۰- ۱۹۸۴
۱۱- نان و شراب
۱۲- فونتامارا
۱۳- ماجرای یک پیشوای شهید
۱۴- دنیای قشنگ نو (آلدوس هاکسلی)
۱۵- مانیفست حزب کمونیست
۱۶- ۵۳ نفر (بزرگ علوی)
۱۷- چریک (خاطرات مهدی میرعبدالله یانی)
۱۸- ترس و لرز (غلامحسین ساعدی)
۱۹- عزاداران بَیَل (غلامحسین ساعدی)
۲۰- بی یاد تو هرگز (خاطرات افسران حزب توده)
۲۱- نفوس مرده (نیکولای گوگول)
۲۲- شنل (نیکولای گوگول)
۲۳- دختر سروان (الکساندر پوشکین)
۲۴- روانشناسی توده‌ها (گوستاو لوبن)
۲۵- در انتظار گودو (ساموئل بکت)
۲۶- شهریار (نیکولو ماکیاولی)
۲۷- جمهور (افلاطون)
۲۸- آرمان شهر (توماس مور)
۲۹- کمونیسم رفت، ما ماندیم و حتی خندیدیم
۳۰- جاده‌ای به اسکله‌ی ویگان (جورج اورول)
۳۱- شوالیه‌ی ناموجود (ایتالو کالوینو)
۳۲- سگ‌های سفید (رومن گاری)
۳۳- دانه زیر برف
۳۴- سوتفاهم
۳۵- مرگ خوش
۳۶- سلاخ‌خانه شماره پنج
۳۷- آدم اول
۳۸- هکات و سگ هایش (پل موران)
۳۹- جنگ و صلح
۴۰- برادران کارامازوف
۴۱- دختری که میشناختم (جی دی سلینجر)
۴۲- ملاقات با مرگ (آگاتا کریستی)
۴۳- گرسنه (گرسنگی)
۴۴- شاگرد قصاب (پاتریک مک کیب)
۴۵- طاعون
۴۶- در جستجوی زمان از دست رفته
۴۷- جنایت و مکافات
۴۸- آناکارنینا
۴۹- مرگ ایوان ایلیچ (لئو تولستوی)
۵۰- باغ آلبالو (آنتوان چخوف)
۵۱- کافکا در کرانه (هاروکی موراکامی)
۵۲- آلیس پای آتش (یون فوسه)
۵۳- ژرمینال
۵۴- بادها (ماریو وارگاس یوسا)
۵۵- دری در کار نیست (تامس ولف)
۵۶- کوه های بلند پرتغال (یان مارتل)
۵۷- هر دو در نهایت میمیرند
۵۸- دیزی دارکر
۵۹- دوزخ (ژان پل سارتر)
۶۰- پیرمرد و دریا (ارنست همینگوی)
۶۱- استونر
۶۲- خروج اضطراری
۶۳- فریب نهان
۶۴- چراغ گاز
۶۵- من طرف حقیقت می‌ایستم
۶۶- والدن
۶۷- یک ماه دور از شهر
۶۸- شب‌های روشن
۶۹- افسانه سیزیف
۷۰- نازنین (داستایوفسکی)
۷۱- شیطان (تولستوی)
۷۲- موبی دیک (نهنگ بحر)
۷۳- ناطور دشت
۷۴- یادداشت‌ها (آلبر کامو)
۷۵- تهوع (ژان پل سارتر)
۷۶- هستی و نیستی (ژان پل سارتر)
۷۷- اتاق قرمز (ادو گاوا رانپو)
۷۸- مغز اندرو (ای ال دکتروف)
۷۹- دیالکتیک هستی و اندیشه در منطق هگل
۸۰- دمیان (هرمان هسه، ترجمه رضا نجفی)
۸۱- بانوی میزبان
۸۲- همزاد
۸۳- قلب ضعیف و بوبوک
۸۴- مردم فقیر (داستایفسکی)
۸۵- جنگ داخلی آمریکا (جیمز آ. کوریک)
۸۶- در جبهه ی غرب خبری نیست
۸۷- آقای فوکت، گوشه هایی از تاریخ سیاسی اروپا در سده نوزدهم (کارل مارکس)
۸۸- کمدی الهی (برزخ، دوزخ، بهشت) از دانته آلیگیری
۸۹- قرب جوار (ایوان کلیما)
۹۰- قاضی (ایوان کلیما)
۹۱- روح پراگ (ایوان کلیما)
۹۲- انقلاب‌های 1989 سقوط امپراتوری شوروی در اروپا
۹۳- رگ و ریشه (جان فانته)
۹۴- کتاب انقلاب فرانسه و رژیم پیش از آن (الکسی دوتوکویل)
۹۵- محال ممکن (غلامحسین ساعدی)
۹۶- در سراچه دباغان (غلامحسین ساعدی)
۹۷- تاتار خندان (غلامحسین ساعدی)
۹۸- آشفته حالان بیدار بخت (غلامحسین ساعدی)
۹۹- گاو (غلامحسین ساعدی)
۱۰۰- مار در معبد (غلامحسین ساعدی)
۱۰۱- غریبه در شهر (غلامحسین ساعدی)
۱۰۲- چوب بدستهای ورزیل (غلامحسین ساعدی)
۱۰۳- آی با کلاه آی بی کلاه (غلامحسین ساعدی)
۱۰۴- گور و گهواره (غلامحسین ساعدی)
۱۰۵- همسایه‌ها (احمد محمود)
۱۰۶- تنگسیر (صادق چوبک)
۱۰۷- اشک تمساح (صادق هدایت)
۱۰۸- حاجی آقا (صادق هدایت)
۱۰۹- ماجراهای تن‌تن، فرار از شوروی
۱۱۰- ضرورت مبارزه‌ی مسلحانه و رد تئوری بقا (امیرپرویز پویان)
۱۱۱- مبارزه مسلحانه هم استراتژی، هم تاکتیک (مسعود احمد زاده)
۱۱۲- درخت انجیر معابد (احمد محمود)
۱۱۳- کلیدر (محمود دولت آبادی)
۱۱۴- زمین سوخته (احمد محمود)
۱۱۵- غریبه‌ها و پسرک بومی (احمد محمود)
۱۱۶- گودل، اشر، باخ بافته گرانسنگ ابدی
۱۱۷- Surrounded by Psychopaths