LabviewImageprocessing – Telegram
LabviewImageprocessing
1.49K subscribers
270 photos
35 videos
67 files
118 links
اموزش اصول بینایی ماشین و پردازش تصویر و لبویو
به همراه گروه پرسش و پاسخ لبویو
@UnHateful
Download Telegram
بررسی ویژگی های چشم انسان به عنوان یک سیستم پردازش تصویر
براساس کتب اولیه ای که در باره پردازش تصوی نوشته شده (مانند کتاب گونزالز برای پردازش تصویر در متلب)
چشم انسان به عنوان بهترین سیستم پردازش تصویر معرفی میشود از طرفی میتوان با اندکی گردش در فضای مجازی مطالبی درباره اینکه چشم انسان قوی ترین دوربین جهان از نظر رزولوشن میباشد پیدا کرد حال میخواهیم بررسی کنیم که یک سیستم بینایی ماشین در برابر چشم انسان چه ویژگی ها و معایبی را دارا میباشد این بحث را در چند قسمت و به ترتیب بررسی خواهیم کرد
با سلام مجدد
تصمیم به شروع مجدد برگزاری کلاس های عمومی اموزش لب ویو و اموزش پردازش تصویر و اموزش بینایی ماشین گرفته ام
ولی چون کلاس ها بعد از مدتها دوباره راه اندازی خواهند شد اولین دوره کلاس تا تکمیل ظرفیت حداقل برگزار نخواهد شد

حداقل تعداد برای شروع چهار نفر خواهد بود
دوستاینکه علاقه مند به ثبت نام هستند اطلاع دهند تا در صورت تکمیل ظرفیت استارت کلاس ها زده شود
هزینه کلاس اموزش لب ویوعمومی 320 هزار تومان

کلاس پردازش تصویردر لب ویو 360 هزار تومان
و کلاس بینایی ماشین با لب ویو 420 هزار تومان خواهد بود
لازم به ذکر است پیش نیاز کلاس بینایی ماشین گذراندن دوره پردازش تصویر در لب ویومیباشد

با تشکر
فولادی
قسمت دوم : بررسی چشم انسان
در قسمت قبل درباره سیستم بینایی انسان مواردی گفته شد در این قسمت قصد در بیان مواردی دارم که نشان دهنده نقاط ضعف سیستم بینایی انسان نسبت به یک دستگاه بینایی ماشین میباشد
قطعا اولین موردیکه میتوان اشاره کرد این است که چشم انسان به عنوان دستگاه بینایی زود خسته میشود در حالیکه یک سیستم بینایی ماشین میتواند بدون توقف کار کند وبرای مثال کنترل کیفیت یک خط تولید را برای ماه ها بدوت توقف ادامه دهد
از طرفی انچه سیستم بینای انسان را متمایز تر از بقیه سیستم ها میکند هوش و منطق تحلیل گر آن میباشد نه خود سیستم اپتیکی و تصویر برداری
مغز انسان به عنوان قوی ترین سیستم تشخیص و تحلیل وپردازش تصاویر به حساب میاید ولی با این وجود
این سیستم دارای اشکالاتی میباشد که میتواند در صنعت مشکل افرین باشد چند مورد به صورت زیر میباشد
سیستم بینایی انسان شدت را به صورت خطی درک نمیکند بلکه از شدت های دریافتی درکی لگاریتمی ایجاد میکند
به طوریکه انسان تفاوت تغییرات در شدت های پایین تر را بهتر از شدت های بالاتر درک میکند این مورد مشکلی را ایجاد میکند که در سیستم های نمایشی مانند موبایل و یا مانیتور کامپیوتر مفهومی به اسم گاما و اصلاح گاما به وجود امده تا این خصوصیت لگاریتمی را اصلاح کنند
از طرفی درک شدتی انسان از محیط بیرون به صورت تباینی میباشد به عبارتی انسان درک کیفی از شدت دارد نه کمی و شدت را در مقایسه با شدت های اطراف ان درک میکند همین مورد میتواند باعث اشتباه در تشخیص انسان شود برای مثال در تصویر زیر در صفحه شطرنج شدت هر دو خانه AوB به یک اندازه میباشد ولی شما شدت ها را متفاوت حس میکنید
برای بررسی کافیست عکس را در paint باز کنید و سپس دو خانه را بریده و در کنار هم قرار دهید
و یا در عکس بعدی تمام مربع های مرکزی شدت یکسان دارد در حالیکه همه دوستان این شدت ها را متفاوت میبینند
👍1
شدت A با B برابر است
شدت مربع های داخلی یکسان است
قسمت سوم: بررسی بینای انسان
در قسمت قبل همانطور که اشاره شد بینایی انسان به راحتی میتواند در تشخیص شدت دچار اشتباه شود و اکثر دوستان همکار در حوزه بینایی ماشین میدانند که بالای90 درصد دوربین های مورد استفاده در بینایی ماشین منوکروم بوده و پردازش ها در حوزه شدت میباشد لذا یک سیستم بینایی ماشین میتواند این قسمت از ضعف بینایی انسان را پوشش دهد و با دقتی برابر 255 قسمت نسبت به ماکزیمم شدت اشباع ccd برای دوربین های معمولی U8و با دقت 4294967296 برای دوربین هاSGL
U32 شدت های موجود را تحلیل کند
و اما سومین نقصی که به سیستم بینایی انسان وارد میباشد در قسمت دقت اندازه گیری میباشد که یکی از مهمترین موارد استفاده سیستم های بینایی ماشین میباشد . سیستم بینایی انسان برای مقایسه و یا اندازه گیری معمولا چند نقطه و خط مرجع را در نظر گرفته و مغز انسان عمل مقایسه و پردازش را جهت تعیین اندازه انجام میدهد ولی چون سیستم بینایی انسان در حالت
نیمه اگاهانه (حالت معولی و روزانه هر شخص ) توانایی تمرکز بر روی نکات مرجه را ندارد برای همین در این قسمت دچار مشکل میشود
برای مثال تصاویر زیر نشان دهنده این موارد میباشد
هر ساله مسابقاتی جهت چنین عکس هایی که انسان را به اشتباه میاندازد برگزار میشود که با انها illusion گفته میشود
هر دو خط یک اندازه است ولی در نگاه اول B بزرگتر دیده میشود
خطوط مورب موازی هستند ولی این طور دیده نمیشوند
این تصویر که توسط یک ایرانی ساخته شده برنده یکی از مسابقات Illusion شده هر دو تصویر یکی میباشد ولی در تصویر سمت راست برج کج تر دیده میشود
قسمت چهارم : بررسی بینای انسان
در قسمت های قبل به معایبی که بینایی انسان میتواند نسبت به یک سیستم بینایی ماشین داشته باشد به چند مورد اشاره شد
اکنون به مشکل اشباع تصویر در چشم انسان می پردازیم
همان طور که در مطالب قبلی گفته شد چشم انسان دارای دو سلول مخروطی و استوانه ای میباشد که اولی به فرکانس(رنگ) و دومی به شدت نور حساس میباشد این حساسیت در حقیقت گونه ای واکنش شیمایی میباشد که بر اساس تاثیر نور رخ میدهد
حال این سوال مطرح میباشد که سرعت بازیابی به حالت اولیه در این واکنش ها چقدر می باشد و در حقیقت چشم با چه سرعتی میتواند تصاویر پشت سر هم را ببیند و از طرفی اطلاعات دریافتی شدت که توسط مغز مکان انها پردازش و تشخیص داده میشود چقدر درست میباشد .
با اینکه گفته میشود مغز انسان قدرت پردازش تصاویر تا 100هرتز را دارا میباشد یعنی 100 تصویر بر ثاینه
ولی واقعیت این است که سیستم بینایی انسان تصاویری با سرعت بیشتر از 7 الی 15 فریم بر ثانیه را به صورت پیوسته میبیند و قادر به تشخیص کامل پدیده ها با سرعت سریع تر از ان را ندارد و صرفا ترکیبی از چند تصویر را میتواند تشخیص دهد. این همان موردی هست که باعث می شود ما تصاویر پشت سر هم را که با سرعتی بیش از 7 فریم بر ثانیه نمایش داده میشود به صورت فیلم و زنده ببینیم ولی گاهی برای کنترل یک خط ویا مشاهده یک پدیده جهت پردازش و یا تصمیم گیری ما به سرعتی بیش از این ها جهت تصویر برداری نیاز داریم
امروزه دوربین های صنعتی با سرعت های بسیار بالا تا حدود 400000 تصویر در ثانیه در صنعت مورد استفاده میشود
و در صنایع نظامی این عدد به نزدیک 2ملیون فریم بر ثاینه می رسد و از طرفی دانشمندان دوربینی با قدرت تصویر برداری یک ترلیون بر ثانیه را ساخته اند که حتی میتوان با ان نحوه انتشار نور با سرعت 300000 متر بر ثانیه در محیط میباشد را مشاهده کرد
از طرفی علاوه بر این مشکل وقتی دامنه شدت در تصویری در محدوده های انتهایی بیشینه و کمینه توانایی چشم انسان برای تشخیص شدت قرار گیرد به طوریکه بعضی از سلول های چشم انسان به صورت کامل اشباع شود و بقیه کمترین واکنشی را نداشته باشند انسان در تشخیص مکان و نوع شدت ها دچار اشتباه میشود وگاهی به اشتباه این تصاویر را نوعی حرکت در نظر می گیرد
همچنین چشم انسان در تشخیص مرز بین شدت ها ی مختلف نوعی اغراق در شدت را جهت سیستم منطقی خود تولید میکند
تمام موارد ذکر شده در بالا میتواند باعث تشخیص اشتباه حرکت در یک سیستم شود و این امر میتواند یک بحران در کنترل یک خط تولید یا سیستم کنترل کیفیت باشد تصاویر زیر گویای این نواقص چشم انسان هستند
به القای حرکت در این تصویر دقت کنید چیزی که واقعیت ندارد
به القای حرکت جریان در داخل این کانال ها دقت کنید
تشخیص نوسان سطح در حالیکه چنین نوسانی وجود ندارد
قسمت پنجم : بررسی بینایی انسان
تصمیم دارم دو مورد دیگر از معایب بینایی انسان را اشاره کنم و بعد به بینایی ماشین و معرفی روش ها و تجهیزات بپردازم لذا قسمت ششم اخرین قسمت برسی بینایی انسان خواهد بود .موردیکه در این قسمت به ان اشاره خواهد شد فازی بودن تشخیص رنگ برای انسان است. سوال اولیکه میتوان پرسید این است که انسان چند رنگ را میتواند تشخیص دهد ؟ برای این سوال میتوانید در اینترنت جواب های عجیبی مانند چند ده ملیون را پیدا کنید اما واقعیت این است از انجا که تشخیص رنگ توسط انسان کیفی میباشد
لذا عدد خاصی نمیتوان برای ان به صورت صحیح بیان کرد و از ان بدتر این است که انسان از میان همین تعداد رنگ که قادر به تشخیص میباشد قادر به نامگذرای بیش از 54 رنگ نیست. حتی خیلی از شما دوستان شاید توان نامگذاری بیش از 10 رنگ را نداشته باشیید حال انکه یک سیستم بینایی ماشین ساده قادر است 16581375 رنگ را از هم تفکیک کند
مورد حادتر این است که واکنش سلول های مخروطی چشم انسان های مختلف به رنگ به صورت کامل هم شبیه هم نیست و از ان بدتر سیستم پردازنده تصویر که مغز انسان میباشد هم دقیقا به صورت یکسان عمل نمی کند به طوریکه برای مثال رنگ لیزر ارگنن را بعضی از انسان ها ابی تیره وبعضی دیگر بنفش میبینند
بد نیست در این مورد به معمای رنگ پیراهن که بیش از 25 ملیون نفر در باره رنگ ان بحث و جدل کرده اند رجوع کنید
قسمت ششم بررسی بینایی انسان: قسمت اخر
در این قسمت به یک مشکل دیگر از بینایی انسان نیز اشاره خواهیم کرد و بعد از ان شروع به معرفی توانایی های لب یو در پردازش تصویر , بینایی ماشین ومعرفی تجهیزات بینایی ماشین مانند تجهیزات باسلر خواهم کرد
یکی از برجسته ترین مواردیکه سیستم پردازنده تصاویر مغز انسان به ان معروف است توانایی تشخیص الگو میباشد به طوریکه ما می توانیم به راحتی چهره هایی که جتی یک بار دیده باشیم را شناسایی کنیم خیلی راحت اجسام را از هم تشخیص میدهیم و قادر به تفکیک انها هستیم مواردیکه شاید برای یک سیستم بینایی ماشین امری سخت و یا حتی غیر ممکن می باشد
اما همین قسمت از بینایی انسان نیز دارای نواقص خاصی میباشد که میتواند برای حوزه صنعت دردسر ساز باشد
واقعیت این است که سیستم بینایی انسان نیز مانند بینایی ماشین برای تشخیص الگو باید توسط تصاویر نمونه اموزش داده شود
یعنی شما از زمان کودکی دائم در حال ضبط تحلیل و به خاطر سپاری تصاویر میباشید و هر دفعه که نیاز به تشخیص الگویی باشد از اطلاعات تحلیل کرده قبلی خود استفاده میکنید . ولی اعظم این تصاویری که انسان به خاطر سپرده وتحلیل کرده در راستای موازی افق هستند زیرا سیستم بینایی انسان که چشم ها میباشد در بیشتر زمان کاری خود افقی میباشند مگر زمانیکه انسان دراز کشیده باشد و یا گردن خود را برای دیدن چیزی کج کند و همین مورد میتواند باعث اشتباه در تشخیص الگویی شود که راستای ان با راستای پردازش انسان یکی نباشد برای مثال شما به راحتی میتوانید یک متن افقی را بخوانید ولی به محض انکه متنی را تحت زوایه بیشتر از زوایه 45 به شما نمایش دهند سیستم تشخیص الگویی شما دچار تاخیر زمانی بسیاری میشود و حتی شاید قادر به این کار نباشد و مجبور شوید گردن خود را کج کنید تا بتوانید متن را بخوانید
به عنوان مثال دیگر در تصویر زیراگر از شما درخواست شود موجودیکه در تصویر وجود دارد را شناسایی کنید بنا به همان عیب سیستم بینایی انسان اولین الگویی که تشخیص میدهید قورباغه خواهد بود در حالیکه اگر تمرکز کنین (که تاخیر در تشخیص الگوخواهد بود ) ویا تصویر را 90 درجه بچرخانید الگوی اسب را هم تشخیص خواهید داد
یک سیستم بینایی ماشین در تشخیص الگو تحت زوایه های مختلف میتواند موثر تر از چشم انسان عمل کند
حیوانیکه در تصویر میبینید هم اسب میباشد و هم قورباغه
برای شروع پردازش تصویر باید بدانید که تصویر در کامپیوتر در حقیقت یک ماتریس Nدر M میباشد که همان رزلوشن تصویر میباشد و از طرفی خانه های این ماتریس شامل سه عدد از 0 تا 255 میباشد که میزان شدت سه رنگ اصلی RGB قرمز سبز و ابی در هر خانه ماتریس را نشان میدهد
در حقیقت انچه در یک تصویر به عنوان رنگ شما میبنیند چیزی جز ترکیب این سه رنگ با شدت های مختلف نیست
برای مثال رنگ قرمز دارای مقدارا n.0.0