Intellimage ( intelligent image processing ) – Telegram
Intellimage ( intelligent image processing )
1.33K subscribers
396 photos
101 videos
37 files
640 links
پردازش تصویر هوشمندIntellimage

📚پژوهشگر و فناور در زمینه ی پردازش تصویر

طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین

📞 ارتباط با ما: @Intellimage_admin
Download Telegram
Intellimage ( intelligent image processing )
s41592-025-02595-5.pdf
🖇 توضیحات عملکردCellpose3 به عنوان یک نرم‌افزار و ابزار پیشرفته برای تقسیم‌بندی تصاویر میکروسکوپی

• این ابزار به کاربران کمک می‌کند تا به طور خودکار سلول‌ها و ساختارهای بیولوژیکی را در تصاویر شناسایی و تفکیک کنند. ویژگی‌های اصلی Cellpose3 عبارتند از:

۱. احیای تصویر: Cellpose3 قادر است تصاویر با کیفیت پایین، شامل تصاویری که دچار نویز، تاری یا کمبود نمونه‌برداری هستند، را بهبود بخشد.

۲. تقسیم‌بندی خودکار: این نرم‌افزار با استفاده از مدل‌های یادگیری عمیق (Deep Learning) می‌تواند سلول‌ها و ساختارهای مختلف را در تصاویر شناسایی کند و آنها را به طور دقیق تفکیک کند.

۳. رابط کاربری آسان: Cellpose3 دارای یک رابط کاربری گرافیکی است که به کاربران اجازه می‌دهد تا با یک کلیک به احیای تصویر و تقسیم‌بندی بپردازند. این ویژگی باعث می‌شود که حتی کاربرانی که تخصص فنی کمتری دارند نیز بتوانند از این ابزار بهره‌برداری کنند.

۴. عملکرد مناسب در شرایط چالش‌برانگیز: Cellpose3 به گونه‌ای طراحی شده است که در شرایطی که تصاویر دچار مشکلاتی مانند نویز یا تاری هستند، عملکرد خوبی داشته باشد و نتایج دقیقی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
📌 مروری بر پستهای اخیر کانال Intellimage

• آموزش نرم افزارهای کاربردی در پردازش تصاویر پزشکی :
https://news.1rj.ru/str/Intellimage/528

• آموزش مدل‌های استدلالی و نحوه ساخت آنها :

https://news.1rj.ru/str/Intellimage/529

• تشخیص چهره از ۱۰۰ کیلومتری؛ چین قوی‌ترین دوربین جاسوسی جهان را معرفی کرد:

https://news.1rj.ru/str/Intellimage/530

• معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!

https://news.1rj.ru/str/Intellimage/531

• معرفی کتاب "طراحی سیستم‌های یادگیری ماشین: یک فرآیند تکراری برای برنامه‌های آماده تولید" :
https://news.1rj.ru/str/Intellimage/533

• بررسی مقاله Cellpose3: one-click image restoration for improved cellular segmentation :

https://news.1rj.ru/str/Intellimage/536

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
🆕️ علی‌بابا مدل هوش مصنوعی جدیدش به نام QwQ-Max-Preview را معرفی کرد!

علی‌بابا با معرفی مدل هوش مصنوعی جدید خود، QwQ-Max-Preview، حسابی غوغا کرده است. این مدل قرار است با غول‌هایی مانند o1 از OpenAI و R1 از DeepSeek رقابت کند. جالب است بدانید علی‌بابا در سه سال آینده قصد دارد ۵۳ میلیارد دلار روی زیرساخت‌های ابری و هوش مصنوعی سرمایه‌گذاری کند. این یعنی چینی‌ها با سرعت بالایی در دنیای تکنولوژی پیش می‌روند!

مدل QwQ-Max-Preview بر پایه مدل Qwen 2.5-Max ساخته شده و قرار است در زمینه استدلال و حل مسائل پیچیده عملکرد بهتری داشته باشد.

لینک دسترسی به وبسایت QwQ :
🌐 https://chat.qwen.ai/

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
• گروه تخصصی پردازش تصویر هوشمند intellimage با مشارکت انجمن علمی مهندسی پزشکی دانشگاه آزاد اسلامی و انجمن اسلامی دانشجویان مستقل، با افتخار برگزار می‌کند:

🩺 ورکشاپ تخصصی پردازش تصویر با موضوع : بررسی نقش پردازش تصویر در حوزه سلامت با رویکرد ترموگرافی

• سخنران : مهندس شیما عابدیان
کارشناسی ارشد مهندسی پزشکی

• مخاطبان: دانشجویان ، پژوهشگران و متخصصان علوم پزشکی ، مهندسی پزشکی ، علوم کامپیوتر و علاقمندان حوزه فناوری های نوین در سلامت


📅 تاریخ: سه‌شنبه ۱۴۰۳/۱۲/۲۱ 
🕒 زمان: ساعت  ۱۲ - ۱۰

🔗جهت کسب اطلاعات بیشتر و ثبت‌نام به شناسه زیر مراجعه نمایید :
@hammasir_admin

🆔Intelllimage
📌 آیا بینایی کامپیوتری در سایه قرار گرفته است؟

📈 تقریباً یک سال است که نشریات بزرگ کمتر درباره بینایی کامپیوتری (CV) صحبت می‌کنند و تمام توجهات به Gen AI، DeepSeek و LLMها معطوف شده است. اما باید بگوییم که بینایی کامپیوتری هنوز زنده و پویاست!

🔹 مدل‌های بینایی-زبانی (VLMs) – ترکیب متن و تصویر برای درک بهتر هوش مصنوعی
🔹 تشخیص شیء با دقتی نزدیک به انسان – فراتر از روش‌های سنتی، با هوش استدلالی و بدون نیاز به آموزش سفارشی

📌 جدیدترین تحقیقات در NeurIPS: 
🔸 بدون داده نمایی نمایی، "Zero-Shot" وجود ندارد – ویشال اودانداراو، دانشگاه توبینگن 
🔸 درک سوگیری در مجموعه داده‌های بصری بزرگ‌مقیاس – بویا زنگ، دانشگاه پنسیلوانیا 
🔸 نقشه‌سازی در هر مکان: پیش‌بینی نقشه BEV – چری هو، عمر علامه و جیایه ژو، دانشگاه کارنگی ملون 

🔎TechnologicalIdeas
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
🆕️ کشف الگوهای بافت‌شناسی مرتبط با درمان سرطان روده بزرگ با استفاده از یادگیری خودنظارتی

محققان با استفاده از یک روش یادگیری ماشینSSL موفق به شناسایی الگوهای مهمی در تصاویر بافت‌شناسی سرطان روده بزرگ شده‌اند که می‌توانند به انتخاب روش‌های درمانی مناسب‌تر کمک کنند.

در این مطالعه، یک مدل SSL به نام Barlow Twins روی مجموعه بزرگی از تصاویر اسلاید کامل (WSI) از سرطان روده بزرگ آموزش داده شد. این مدل توانست ویژگی‌های مهمی را از تکه‌های کوچک تصاویر (tiles) استخراج کند و آن‌ها را بر اساس شباهت‌های بافت‌شناسی در گروه‌هایی به نام HPC (خوشه‌های فنوتیپی بافت‌شناسی) دسته‌بندی کند.

نتایج نشان داد که این HPCها قابل اعتماد هستند و می‌توانند بقای بیماران را پیش‌بینی کنند. با بررسی دقیق این HPCها، محققان توانستند 47 نوع مختلف از ویژگی‌های بافت‌شناسی را شناسایی کنند که هر کدام می‌توانند اطلاعات مهمی در مورد نوع بافت، میزان آن و ساختار آن، به ویژه در ارتباط با استرومای تومور، ارائه دهند.
🌐 paper link
📄nature communication

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
📸 لنزهای محبوب C-Mount!

استانداردسازی یک حس خوب است اما وقتی Bell  Howell دوربین "Filmo 70" را در سال 1923 معرفی کرد، چندین بار چند نوع پیچ با قطر تقریبی 1 اینچ را تعویض کردند تا اینکه بالاخره به ANSI 1-32 UN 2A رسیدند.

این استاندارد دارای یک رشته 25.4 میلی‌متری با گام 0.794 میلی‌متری و 32 رشته در هر اینچ است که در فاصله فلنج 17.526 میلی‌متری استاندارد شده است. از آنجایی که هیچ کس نمی‌توانست همه این‌ها را به خاطر بسپارد و این سومین نسخه از مفهوم 1 اینچی آن‌ها بود، تصمیم گرفتند آن را نوع C یا "C-Mount" بنامند.

محبوبیت Filmo 70 و سایر محصولات Bell  Howell البته موفقیت C-Mount را رقم زد و بعضی تولیدکنندگان که به C-Mount برای دوربین‌های 16 میلی‌متری خود روی آوردند، پتانسیل این پیچ کوچک و فوق‌العاده محکم را برای کاربردهای علمی دریافتند.

از میکروسکوپ‌ها تا دوربین‌های صنعتی ،همه اکنون از این گام استاندارد استفاده می‌کنند. هر دوربین CCTV یا دوربین بینایی ماشین در جهان از C-Mount یا CS-Mount کمی استفاده می‌کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
🆕️ حسگر تصویر می‌تواند یک ANN باشد !

فناوری بینایی ماشین در سال‌های اخیر پیشرفت‌های چشمگیری داشته و به بخشی جدایی‌ناپذیر از سیستم‌های هوشمند، از جمله وسایل نقلیه خودران و رباتیک تبدیل شده است.

معمولاً اطلاعات بصری که توسط دوربین‌های فریم‌دار ثبت می‌شود، به فرمت دیجیتال تبدیل شده و سپس با استفاده از الگوریتم‌های یادگیری ماشین مانند شبکه‌های عصبی مصنوعی (ANN) پردازش می‌شود.با این حال، حجم بالای داده (که عمدتاً تکراری است) در طول زنجیره سیگنال منجر به نرخ فریم پایین و مصرف انرژی بالا می‌شود.

به همین دلیل، تکنیک‌های مختلف پیش‌پردازش داده‌های بصری برای افزایش کارایی پردازش سیگنال بعدی در ANN توسعه یافته‌اند. یک حسگر تصویر می‌تواند خود یک ANN باشد که به طور همزمان تصاویر نوری را بدون تأخیر حس کرده و پردازش کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
Intellimage ( intelligent image processing )
🆕️ حسگر تصویر می‌تواند یک ANN باشد ! فناوری بینایی ماشین در سال‌های اخیر پیشرفت‌های چشمگیری داشته و به بخشی جدایی‌ناپذیر از سیستم‌های هوشمند، از جمله وسایل نقلیه خودران و رباتیک تبدیل شده است. معمولاً اطلاعات بصری که توسط دوربین‌های فریم‌دار ثبت می‌شود،…
🖇 نحوه ی عملکرد حسگر تصویر به عنوان یک ANN

دستگاه های مبتنی بر آرایه فوتودیود نیمه‌هادی دوبعدی قابل تنظیم و وزن‌های سیناپسی شبکه در یک ماتریس پاسخ‌دهی نوری به طور مداوم ذخیره می‌شوند.با یادگیری ماشین میتوان حسگر را برای طبقه‌بندی و کدگذاری تصاویری که به‌صورت نوری بر روی چیپ پروژکت می‌شوند، با نرخ ۲۰ میلیون بایت در ثانیه آموزش داد.
🌐 paper link
nature communication

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
💾معرفی Maixduino: برد توسعه RISC-V 64 برای AI و IoT

🔍 ویژگی‌های برجسته Maixduino:

• پارت CPU: پردازنده دو هسته‌ای RISC-V 64bit با FPU و پردازنده شبکه عصبی 400MHz

• تصویر برداری: شناسایی تصویر با کیفیت QVGA@60FPS و VGA@30FPS

• ماژول ESP32: پشتیبانی از Wi-Fi 2.4G 802.11 b/g/n و بلوتوث 4.2

• فرم فاکتور Arduino Uno: سازگاری کامل با رابط‌های Arduino

• میکروفون MEMS دیجیتال: خروجی دیجیتال omnidirectional I2S

• پورت‌های متنوع: شامل کانکتور FPC برای دوربین DVP و LCD

• کارت micro SD: پشتیبانی از holder خودکششی

• دکمه‌های ریست و بوت: به همراه خروجی صوتی DAC+PA 3W

• اتصال آسان: تنها کافیست کابل USB Type-C را وصل کنید!

• بصیرت ماشینی: مبتنی بر شبکه‌های عصبی کانولوشن

• پردازشگر میکروفون با عملکرد بالا: برای شنوایی ماشین

• پشتیبانی از IDEهای مختلف: شامل MaixPy IDE، Arduino IDE، OpenMV IDE و PlatformIO IDE

• پشتیبانی از مدل‌های یادگیری عمیق: مانند Tiny-Yolo، Mobilenet و TensorFlow Lite

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
🆕️ تصویربرداری پزشکی مبتنی بر گوشی‌های هوشمند

هدف اصلی این هسته ، طراحی و ساخت سیستم‌های تصویربرداری پزشکی قابل حمل است که با استفاده از گوشی‌های هوشمند، تصویربرداری ساده، سریع و ارزان از انسان را ممکن می‌سازد. در فاز اول، تمرکز روی سیستم‌های زیر است:

- سیستم تصویربرداری فاندوس
- سیستم تصویربرداری اسلیت لمپ
- تصویربرداری کولپوسکوپ

فناوری و دانش بدست آمده در این هسته، به طراحی و توسعه تجهیزات اپتیکی در حوزه‌های دیگر پزشکی مانند چشم، پوست، رحم و حلق نیز کمک خواهد کرد. همچنین، تحقیقات اخیر نشان داده‌اند که این سیستم‌ها می‌توانند برای تصویربرداری میکروسکوپی با بزرگنمایی بالا و تصویربرداری آندوسکوپیک نیز مورد استفاده قرار گیرند.

علاوه بر سخت‌افزار، مجموعه‌ای از نرم‌افزارهای پردازش تصویر نیز ارائه خواهد شد تا تصاویر ثبت شده توسط هر سیستم به راحتی پردازش شوند. این سیستم‌ها می‌توانند در بازارهای هدف مختلفی باشد مثلا پزشکان متخصص چشم می‌توانند از سیستم فاندوس یا اسلیت لمپ طراحی شده برای معاینات بالینی تخصصی شبکیه بهره‌برداری کنند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
🆕️ فناوری XPANCEO: آینده لنزهای هوشمند!

📈شرکتXPANCEO،یک شرکت فناوری عمیق مستقر در دبی که در سال 2021 توسط رومن اکسلرود و والنتین ولکوف تأسیس شده است،در حال توسعه لنزهای تماسی هوشمندی است که به طرز شگفت‌انگیزی واقعیت افزوده، نظارت بر سلامت و بینایی بهبود یافته را در یک قالب بسیار نازک ترکیب می‌کند.این لنزها کمتر از عرض یک مو هستند.ویژگی‌های کلیدی شامل :

• واقعیت افزوده: با استفاده از نمایشگرهای میکرو که تنها با 1 تا 3 میکرووات کار می‌کنند، این لنزها قابلیت‌هایی مانند ناوبری و بازی‌های AR را فراهم می‌کنند.

• نظارت بر سلامت: حسگرهای زیستی موجود در این لنزها می‌توانند گلوکز، سطح استرس و فشار چشم را ردیابی کنند و دقت تشخیص گلوکوم را تا 50 درصد بهبود بخشند.

• ویژگی‌های پیشرفته: با استفاده از نانوذرات و اپتیک، XPANCEO به دنبال ارائه ویژگی‌هایی مانند دید در شب و زوم است.

فناوری XPANCEO امیدوار است که با استفاده از هادی‌های طلایی بسیار نازک و یک قاب هوشمند برای شارژ و انتقال داده، تا اواخر سال 2026 این قابلیت‌ها را در یک لنز ترکیب کند.

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
📌 مروری بر تعدادی از پستهای کانال Intellimage

•معرفی هوش مصنوعی جدید علی بابا :

https://news.1rj.ru/str/Intellimage/540

• آیا بینایی کامپیوتری در سایه قرار گرفته است؟

https://news.1rj.ru/str/Intellimage/542

• کشف الگوهای بافت‌شناسی مرتبط با درمان سرطان روده بزرگ با استفاده از یادگیری خودنظارتی:
https://news.1rj.ru/str/Intellimage/544

• لنزهای محبوب C-Mount :

https://news.1rj.ru/str/Intellimage/546

• حسگر تصویر می‌تواند یک ANN باشد !

https://news.1rj.ru/str/Intellimage/547

• معرفی Maixduino: برد توسعه RISC-V 64 برای AI و IoT :

https://news.1rj.ru/str/Intellimage/549

• تصویربرداری پزشکی مبتنی بر گوشی‌های هوشمند :

https://news.1rj.ru/str/Intellimage/551

• فناوری XPANCEO: آینده لنزهای هوشمند!

https://news.1rj.ru/str/Intellimage/552

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
🆕️ مدل GBT-SAM: مدل کارآمد برای بخش‌بندی تومورهای مغزی در تصاویر mp-MRI

¤ تومورهای گلیومی از کشنده‌ترین نوع تومورهای مغزی هستند و نیاز به تشخیص دقیق دارند. بخش‌بندی تصاویر پزشکی در ارزیابی این تومورها نقش حیاتی دارد، اما روش‌های فعلی معمولاً محدودیت‌هایی دارند.

¤ در این مطالعه، GBT-SAM معرفی می‌شود؛ یک چارچوب نوآورانه که مدل Segment Anything (SAM) را برای بخش‌بندی تومورهای مغزی گسترش می‌دهد. این روش شامل یک پروتکل آموزشی دو مرحله‌ای است:

۱. آموزش لایه تعبیه پچ برای پردازش تمام مدالیته‌های mp-MRI.

۲. ادغام بلوک‌های LoRA و Depth-Condition در Vision Transformer (ViT) برای تحلیل همبستگی‌ها.

¤مدل GBT-SAM با امتیاز Dice 93.54 در دیتاست گلیومای بالغ عملکردی عالی دارد و به خوبی به دیتاست‌های دیگر نیز تعمیم می‌یابد. جالب است که این مدل کمتر از 6.5 میلیون پارامتر قابل آموزش دارد و راه‌حلی کارآمد برای بخش‌بندی تومورهای مغزی ارائه می‌دهد.

📄Article:https://arxiv.org/abs/2503.04325

🅿️Python Repo:https://github.com/vpulab/med-sam-brain

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
کشف خطاهای سیستماتیک مدل با Domino

🟢 مدل‌های یادگیری ماشینی، به ویژه شبکه‌های عمیق، در تسک‌ها و دیتاست‌های مختلف امتیازهای بالایی را ثبت می‌کنند. اما ممکن است هر مدلی بر روی قاچ‌های خاصی از داده دچار خطای سیستماتیک شود. به عنوان مثال، فرض کنید یک تسک دسته‌بندی تصویر دارید و مدل آموزش‌دیده شما یاد گرفته باشد که هر تصویری که حیوانی در آن با پس‌زمینه زمین شنی باشد، به عنوان شتر برچسب بزند. در این صورت، اگر با تصویری از گاو بر روی شن مواجه شود، ممکن است آن را به اشتباه شتر برچسب بزند. این داده‌ها که دارای خاصیت ویژه‌ای هستند و مدل به اشتباه آن‌ها را دسته‌بندی می‌کند، "قاچ بحرانی" (critical slice) نامیده می‌شوند.

🟢 اهمیت پیدا کردن این قاچ‌های بحرانی و اصلاح تصمیم مدل برای آن‌ها بسیار حیاتی است، به ویژه در کاربردهایی مانند تشخیص سرطان از روی تصاویر پزشکی. در این راستا، محققان استنفورد روشی اتوماتیک به نام Domino برای کشف قاچ‌های بحرانی هر مدل ارائه داده‌اند.

🟢 روش کار Domino شامل سه مرحله است:

۱. نگاشت به فضای مشترک: ابتدا داده‌های دیتاست ورودی با استفاده از مدل‌های cross-modal به یک فضای امبدینگی مشترک با متن منتقل می‌شوند (برای مثال، استفاده از مدل قدرتمند CLIP برای دیتاست‌های تصویری).

۲. خوشه‌بندی داده‌ها: سپس Domino با استفاده از یک مدلسازی mixture سعی در خوشه‌بندی داده‌های اشتباه برچسب‌گذاری‌شده می‌کند. این مدلسازی شامل چهار متغیر S (احتمال تعلق داده به قاچ)، Z (امبدینگ داده)، Y (برچسب واقعی داده) و Y_hat (توزیع برچسب حدس زده شده توسط مدل) است.

۳. توضیح متنی: در نهایت، برای هر slice با توجه به کاندیدای متنی مرحله اول، یک توضیح متنی آماده می‌شود.

🟢 مدل Domino بر روی ResNet آموزش‌دیده بر روی ImageNet تست شده و نشان داده که ResNet در قاچ‌های تصاویر داخل ماشین و تصاویر دور ماشین‌های مسابقه‌ای دچار مشکل سیستماتیک است. پس از کشف قاچ‌های بحرانی، می‌توان با تمرکز بر روی آن‌ها و استفاده از افزون‌سازی داده، مشکل را کاهش داد.
🔎nlp_stuff
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#deep_learning
📈🩺 تشخیص دیجیتالی پوسیدگی دندان با دوربین vistacam

🙏thanks to dencareclinic

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
Intellimage ( intelligent image processing )
Photo
🖇 توضیحات تشخیص پوسیدگی دیجیتال با دوربین vistacam

این دستگاه دارای سه سر یا سه نوع کاربرد است.اولین کاربرد آن به عنوان دوربین داخل دهانی با قدرت وضوح بسیار بالا است که کمک می کند تا دندانپزشک دندانهای فرد را با بزرگنمایی بسیار بالا ببیند . بزرگنمایی در دندانپزشکی بسیار مهم است . از بزرگنمایی علاوه بر تشخیص پوسیدگی صحیح بیشترین استفاده هنگام برداشتن پوسیدگی دندانها هنگام پرکردن دندان است . بدین وسیله کمک می شود تا هیچ پوسیدگی در زیر پرکردگی باقی نماند .

دومین کاربرد آن استفاده از هد تشخیص پوسیدکی بین دندانی است که به ما کمک می کند تا حجم و محل دقیق پوسیدگی را به صورت سه بعدی پیدا کنیم تا برای یافتن پوسیدگیها نیاز به برداشتن حجم زیادی از بافت دندانها نباشد و دقیق عمل شود . رادیوگرافی نمی تواند دقت زیادی داشته باشد و دو بعدی است . با دوربین vistacam  پوسیدگیهایی که در بین دندانها است و در رادیوگرافی دندانی قابل رویت نیستند به راحتی و به وضوح قابل تشخیص می باشد . این دید سه بعدی در پرکردن دندانها کمک می کند تا بافت سالم دندان به اشتباه برداشته نشود .

سومین کاربرد این دستگاه با بکار بردن هد تشخیص میزان و درجه پوسیدگی دندان بصورت دیجیتال است تا در صورتی که از میزانی کمتر باشد دندان پر نشود . این هد با استفاده از تابش نور فلورسنت و دریافت باز تابش متفاوتی که دندانهای سالم و پوسیده دارند و پردازش این اطلاعات در کامپیوتر میزان و درجه عمق پوسیدگی را به عدد به ما می دهد .

🙏thanks to dencareclinic

🆔️ Intellimage