🆕️ معرفی مدل جدید مولتی مدال در ورودی و خروجی از DeepSeek به نام Janus
https://github.com/deepseek-ai/Janus
https://github.com/deepseek-ai/Janus
GitHub
GitHub - deepseek-ai/Janus: Janus-Series: Unified Multimodal Understanding and Generation Models
Janus-Series: Unified Multimodal Understanding and Generation Models - deepseek-ai/Janus
👏2❤1🔥1
Intellimage ( intelligent image processing )
🆕️ معرفی مدل جدید مولتی مدال در ورودی و خروجی از DeepSeek به نام Janus https://github.com/deepseek-ai/Janus
🆕️ معرفی سری Janus از DeepSeek
📉 سری Janus نسل جدیدی از مدلهای هوش مصنوعی است که به منظور کار با دادههای متنوعی نظیر متن، تصویر و ترکیب این دو طراحی شده است. این مدلها به گونهای ساخته شدهاند که قادرند هر نوع ورودی (متن یا تصویر) را دریافت کرده و هر نوع خروجی (متن یا تصویر) تولید نمایند. به همین دلیل، به این مدلها اصطلاحاً مدلهای "any-to-any" اطلاق میشود که به معنای تبدیل هر چیزی به هر چیزی است.
📉 نسخه پیشرفتهی این سری: Janus-Pro
این نسخه با سه بهبود اصلی ارائه شده است:
۱. استراتژی آموزشی بهینهشده: فرآیند یادگیری مدل را دقیقتر کرده است.
۲. اضافه شدن دادههای بیشتر: توانایی مدل را افزایش داده است.
۳. بزرگتر شدن ابعاد مدل: عملکرد آن در درک و تولید تصویر از متن را به طور قابل توجهی تقویت کرده است.
📉 نتیجه این پیشرفتها، توانمندی بسیار بالای Janus-Pro در درک و تولید دادههای چندرسانهای (Multimodal) است و حتی در تولید تصویر از متن، پایداری بالایی را نشان میدهد.
📉 نسخه اصلی، یعنی Janus، دارای یک معماری جالب و هوشمندانه میباشد. این مدل پردازش تصویر را از سایر وظایف جدا کرده است، اما همچنان با یک معماری یکپارچهی ترانسفورمر تمامی جنبهها را مدیریت میکند. این طراحی باعث شده است که مدل در هر دو بخش درک و تولید، بسیار منعطف و کارآمد باشد و حتی از مدلهای تخصصی موجود در این زمینه پیشی بگیرد.
📉 مدل دیگری که در این سری وجود دارد، JanusFlow نام دارد که ایدهای نوآورانه را اجرایی کرده است: ترکیب مدلهای اتورگرسیو با روشی پیشرفته به نام Rectified Flow. این ترکیب به سادگی و به طور مؤثری انجام شده است و نیازی به پیچیدگی خاصی ندارد. نتیجه این تلاش، مدلی است که هم قادر به تولید تصویر میباشد و هم در زمینههای چندرسانهای عملکردی برتر از سایر مدلهای موجود را ارائه میدهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
📉 سری Janus نسل جدیدی از مدلهای هوش مصنوعی است که به منظور کار با دادههای متنوعی نظیر متن، تصویر و ترکیب این دو طراحی شده است. این مدلها به گونهای ساخته شدهاند که قادرند هر نوع ورودی (متن یا تصویر) را دریافت کرده و هر نوع خروجی (متن یا تصویر) تولید نمایند. به همین دلیل، به این مدلها اصطلاحاً مدلهای "any-to-any" اطلاق میشود که به معنای تبدیل هر چیزی به هر چیزی است.
📉 نسخه پیشرفتهی این سری: Janus-Pro
این نسخه با سه بهبود اصلی ارائه شده است:
۱. استراتژی آموزشی بهینهشده: فرآیند یادگیری مدل را دقیقتر کرده است.
۲. اضافه شدن دادههای بیشتر: توانایی مدل را افزایش داده است.
۳. بزرگتر شدن ابعاد مدل: عملکرد آن در درک و تولید تصویر از متن را به طور قابل توجهی تقویت کرده است.
📉 نتیجه این پیشرفتها، توانمندی بسیار بالای Janus-Pro در درک و تولید دادههای چندرسانهای (Multimodal) است و حتی در تولید تصویر از متن، پایداری بالایی را نشان میدهد.
📉 نسخه اصلی، یعنی Janus، دارای یک معماری جالب و هوشمندانه میباشد. این مدل پردازش تصویر را از سایر وظایف جدا کرده است، اما همچنان با یک معماری یکپارچهی ترانسفورمر تمامی جنبهها را مدیریت میکند. این طراحی باعث شده است که مدل در هر دو بخش درک و تولید، بسیار منعطف و کارآمد باشد و حتی از مدلهای تخصصی موجود در این زمینه پیشی بگیرد.
📉 مدل دیگری که در این سری وجود دارد، JanusFlow نام دارد که ایدهای نوآورانه را اجرایی کرده است: ترکیب مدلهای اتورگرسیو با روشی پیشرفته به نام Rectified Flow. این ترکیب به سادگی و به طور مؤثری انجام شده است و نیازی به پیچیدگی خاصی ندارد. نتیجه این تلاش، مدلی است که هم قادر به تولید تصویر میباشد و هم در زمینههای چندرسانهای عملکردی برتر از سایر مدلهای موجود را ارائه میدهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
Telegram
Intellimage ( intelligent image processing )
✅پردازش تصویر هوشمندIntellimage
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
👏3❤1🔥1👌1
🆕️ تحقیق فوقالعاده و هیجان انگیز متا: ارتباط مستقیم بین مغز و نوشتار!
✅ خبر هیجانانگیز از مرکز BCBL! متا به تازگی با همکاری این مرکز، قدم بزرگی در زمینه ارتباط بین مغز و نوشتار برداشته است. در این تحقیق، ۳۵ داوطلب در حین تایپ جملات، تحت نظر قرار گرفتند و فعالیتهای مغزی آنها با استفاده از دستگاههای MEG و EEG ضبط شد.
✅ پژوهشگران با بهرهگیری از هوش مصنوعی، تلاش کردند تا با تحلیل سیگنالهای مغزی این افراد، جملات را دوباره بسازند. نتایج شگفتانگیز بود! آنها موفق شدند تا ۸۰ درصد از حروف را به درستی تشخیص دهند که این عملکرد دو برابر سیستمهای EEG معمولی است!
✅ این دستاورد جدید، ادامهای بر کارهای قبلی متا در کشف راز ادراک تصاویر و صدا از مغز است و حالا به مرحله تولید جملات رسیده. موفقیت این پروژه میتواند دربهای تازهای را برای ایجاد واسطهای مغز و کامپیوتر باز کند و آیندهای نویدبخش برای ارتباطات انسانها رقم بزند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
✅ خبر هیجانانگیز از مرکز BCBL! متا به تازگی با همکاری این مرکز، قدم بزرگی در زمینه ارتباط بین مغز و نوشتار برداشته است. در این تحقیق، ۳۵ داوطلب در حین تایپ جملات، تحت نظر قرار گرفتند و فعالیتهای مغزی آنها با استفاده از دستگاههای MEG و EEG ضبط شد.
✅ پژوهشگران با بهرهگیری از هوش مصنوعی، تلاش کردند تا با تحلیل سیگنالهای مغزی این افراد، جملات را دوباره بسازند. نتایج شگفتانگیز بود! آنها موفق شدند تا ۸۰ درصد از حروف را به درستی تشخیص دهند که این عملکرد دو برابر سیستمهای EEG معمولی است!
✅ این دستاورد جدید، ادامهای بر کارهای قبلی متا در کشف راز ادراک تصاویر و صدا از مغز است و حالا به مرحله تولید جملات رسیده. موفقیت این پروژه میتواند دربهای تازهای را برای ایجاد واسطهای مغز و کامپیوتر باز کند و آیندهای نویدبخش برای ارتباطات انسانها رقم بزند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
👏3👌2❤1
🔍 نقش AI در تشخیصهای رادیولوژیک
✅ هوش مصنوعی (AI) پتانسیل حمایت از تشخیصها در رادیولوژی را دارد. با این حال، کمبود شفافیت در بسیاری از موارد، فهم توصیههای AI را دشوار کرده است. محققان بررسی کردهاند که آیا و چگونه نمایشهای بصری استفاده شده در تحلیل تصاویر AI ، که به آنها نقشههای برجستگی (saliency maps) گفته میشود ، میتوانند کمک کنند.
✅ فرآیند تصمیمگیری AI باید به اندازه کافی شفاف باشد تا پزشکان بتوانند بهترین ارزیابی را از اینکه چقدر میتوانند به توصیههای AI اعتماد کنند، داشته باشند. این مسئله تا کنون دشوار بوده است.
✅ میتوان نقشهای برای هر توصیهای که سیستم AI ارائه میدهد ایجاد کرد که نشان دهد کدام بخشهای تصویر در فرآیند تصمیمگیری لحاظ شدهاند. این نقشهها، که به آنها نقشههای برجستگی گفته میشود، مناطق داخل یک تصویر را نشان میدهند که شبکه عصبی بر اساس آنها پیشبینی کرده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
✅ هوش مصنوعی (AI) پتانسیل حمایت از تشخیصها در رادیولوژی را دارد. با این حال، کمبود شفافیت در بسیاری از موارد، فهم توصیههای AI را دشوار کرده است. محققان بررسی کردهاند که آیا و چگونه نمایشهای بصری استفاده شده در تحلیل تصاویر AI ، که به آنها نقشههای برجستگی (saliency maps) گفته میشود ، میتوانند کمک کنند.
✅ فرآیند تصمیمگیری AI باید به اندازه کافی شفاف باشد تا پزشکان بتوانند بهترین ارزیابی را از اینکه چقدر میتوانند به توصیههای AI اعتماد کنند، داشته باشند. این مسئله تا کنون دشوار بوده است.
✅ میتوان نقشهای برای هر توصیهای که سیستم AI ارائه میدهد ایجاد کرد که نشان دهد کدام بخشهای تصویر در فرآیند تصمیمگیری لحاظ شدهاند. این نقشهها، که به آنها نقشههای برجستگی گفته میشود، مناطق داخل یک تصویر را نشان میدهند که شبکه عصبی بر اساس آنها پیشبینی کرده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
👌3👏2❤1🔥1🥰1
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی
🩻 رادیولوژیستها از نرمافزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده میکنند. این نرمافزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکسهای X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شدهاند.
🩻 این نرمافزارها کمک میکنند تا رادیولوژیستها بتوانند به بهترین شکل ممکن به تحلیل تصاویر بپردازند و در تشخیص بیماریها دقیقتر عمل کنند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
🩻 رادیولوژیستها از نرمافزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده میکنند. این نرمافزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکسهای X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شدهاند.
🩻 این نرمافزارها کمک میکنند تا رادیولوژیستها بتوانند به بهترین شکل ممکن به تحلیل تصاویر بپردازند و در تشخیص بیماریها دقیقتر عمل کنند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
👏3👌3❤1🔥1
Intellimage ( intelligent image processing )
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی 🩻 رادیولوژیستها از نرمافزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده میکنند. این نرمافزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکسهای X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شدهاند.…
🖇 معرفی نرم افزار های کاربردی در پردازش تصاویر پزشکی
۱.نرم افزار OsiriX: یک نرمافزار محبوب برای مشاهده و پردازش تصاویر پزشکی، بهویژه برای تصاویر MRI و CT. این نرمافزار مخصوص macOS است و قابلیت تجزیه و تحلیل تصاویر سهبعدی را دارد.
۲.نرم افزار RadiAnt DICOM Viewer: نرمافزاری برای مشاهده تصاویر DICOM که به رادیولوژیستها کمک میکند تا به سرعت تصاویر را بارگذاری و تحلیل کنند.
۳.نرم افزار 3D Slicer: یک نرمافزار منبع باز برای تجزیه و تحلیل تصاویر پزشکی و پردازش دادههای سهبعدی. این نرمافزار امکانات پیشرفتهای برای تجزیه و تحلیل و ساخت تصاویر سهبعدی دارد.
۴.نرم افزار Philips IntelliSpace Portal: این نرمافزار یک پلتفرم جامع برای پردازش تصاویر پزشکی است که به رادیولوژیستها امکان میدهد تا تصاویر را تجزیه و تحلیل و نتایج را به راحتی به اشتراک بگذارند.
۵.نرم افزار Siemens syngo.plaza: نرمافزاری از شرکت زیمنس که ابزاری قوی برای پردازش و تحلیل تصاویر پزشکی ارائه میدهد و به رادیولوژیستها امکان مدیریت و تجزیه و تحلیل تصاویر را میدهد.
۶.نرم افزار GE Healthcare Centricity: یک نرمافزار که به رادیولوژیستها کمک میکند تا تصویربرداریهای پزشکی را مدیریت و تحلیل کنند و امکاناتی برای بهبود کارایی در جریان کار را فراهم میکند.
۷.نرم افزار MIM Software: یک نرمافزار تخصصی برای بخش بندی و تحلیل تصاویر پزشکی، که به خصوص در رادیوتراپی و اتوماسیون فرآیندهای بالینی کاربرد دارد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
۱.نرم افزار OsiriX: یک نرمافزار محبوب برای مشاهده و پردازش تصاویر پزشکی، بهویژه برای تصاویر MRI و CT. این نرمافزار مخصوص macOS است و قابلیت تجزیه و تحلیل تصاویر سهبعدی را دارد.
۲.نرم افزار RadiAnt DICOM Viewer: نرمافزاری برای مشاهده تصاویر DICOM که به رادیولوژیستها کمک میکند تا به سرعت تصاویر را بارگذاری و تحلیل کنند.
۳.نرم افزار 3D Slicer: یک نرمافزار منبع باز برای تجزیه و تحلیل تصاویر پزشکی و پردازش دادههای سهبعدی. این نرمافزار امکانات پیشرفتهای برای تجزیه و تحلیل و ساخت تصاویر سهبعدی دارد.
۴.نرم افزار Philips IntelliSpace Portal: این نرمافزار یک پلتفرم جامع برای پردازش تصاویر پزشکی است که به رادیولوژیستها امکان میدهد تا تصاویر را تجزیه و تحلیل و نتایج را به راحتی به اشتراک بگذارند.
۵.نرم افزار Siemens syngo.plaza: نرمافزاری از شرکت زیمنس که ابزاری قوی برای پردازش و تحلیل تصاویر پزشکی ارائه میدهد و به رادیولوژیستها امکان مدیریت و تجزیه و تحلیل تصاویر را میدهد.
۶.نرم افزار GE Healthcare Centricity: یک نرمافزار که به رادیولوژیستها کمک میکند تا تصویربرداریهای پزشکی را مدیریت و تحلیل کنند و امکاناتی برای بهبود کارایی در جریان کار را فراهم میکند.
۷.نرم افزار MIM Software: یک نرمافزار تخصصی برای بخش بندی و تحلیل تصاویر پزشکی، که به خصوص در رادیوتراپی و اتوماسیون فرآیندهای بالینی کاربرد دارد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
Telegram
Intellimage ( intelligent image processing )
✅پردازش تصویر هوشمندIntellimage
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
👌5👏2❤1🔥1🥰1
📚 مدلهای استدلالی (Reasoning Models) چیستند و چگونه ساخته میشوند؟
• این روزها نام مدلهای استدلالی مثل DeepSeek R1 را زیاد میشنوید. اگر هنوز با مفهوم و کاربرد این مدلها آشنا نیستید، با ما همراه باشید تا از insights آقای سباستین راشکا (نویسنده کتاب "Build a Large Language Model From Scratch") بهرهمند شوید. نظریه ایشان در بررسی مدلهای استدلالی قابل تامل است.
• تعریف مدل استدلالی: این مدلها برای حل سوالات پیچیده و چندمرحلهای طراحی شدهاند. به عنوان مثال، حل یک سوال فیزیک یا ریاضی نیاز به استدلال دارد، در حالی که سوالاتی ساده مانند "پایتخت فرانسه کجاست؟" به این مدلها نیازی ندارند.
• مواقع مناسب استفاده: این مدلها در مواردی که نیاز به سرعت و هزینه پایین داریم یا سوالات دانشی داریم، کارایی ندارند. همچنین، برای سوالات ساده نیز مناسب نیستند زیرا ممکن است بیش از حد فکر کنند!
• مدل DeepSeek R1 شامل سه بخش اصلی است: DeepSeek-R1-Zero ، DeepSeek-R1 و DeepSeek-R1-Distill.
• روشهای ساخت و بهبود مدلهای استدلالی: چهار روش اصلی برای تولید این مدلها معرفی شده است:
۱.روش Inference-time scaling
۲.روش RL خالص
۳.روش SFT + RL
۴.روش SFT خالص با Distillation
• نکات کلیدی درباره R1: R1 بهینهتر و ارزانتر از O1 است، زیرا دیپسیک بیشتر بر روی آموزش مدل وقت گذاشته است.
• توسعه مدلهای استدلالی با بودجه کم:معمولا اگر بودجه محدود باشد ، روش Distillation مدنظر قرار میگیرد . طبق اطلاعات ارائه شده، این روش میتواند با هزینهای بسیار کم، نتایج خوبی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
• این روزها نام مدلهای استدلالی مثل DeepSeek R1 را زیاد میشنوید. اگر هنوز با مفهوم و کاربرد این مدلها آشنا نیستید، با ما همراه باشید تا از insights آقای سباستین راشکا (نویسنده کتاب "Build a Large Language Model From Scratch") بهرهمند شوید. نظریه ایشان در بررسی مدلهای استدلالی قابل تامل است.
• تعریف مدل استدلالی: این مدلها برای حل سوالات پیچیده و چندمرحلهای طراحی شدهاند. به عنوان مثال، حل یک سوال فیزیک یا ریاضی نیاز به استدلال دارد، در حالی که سوالاتی ساده مانند "پایتخت فرانسه کجاست؟" به این مدلها نیازی ندارند.
• مواقع مناسب استفاده: این مدلها در مواردی که نیاز به سرعت و هزینه پایین داریم یا سوالات دانشی داریم، کارایی ندارند. همچنین، برای سوالات ساده نیز مناسب نیستند زیرا ممکن است بیش از حد فکر کنند!
• مدل DeepSeek R1 شامل سه بخش اصلی است: DeepSeek-R1-Zero ، DeepSeek-R1 و DeepSeek-R1-Distill.
• روشهای ساخت و بهبود مدلهای استدلالی: چهار روش اصلی برای تولید این مدلها معرفی شده است:
۱.روش Inference-time scaling
۲.روش RL خالص
۳.روش SFT + RL
۴.روش SFT خالص با Distillation
• نکات کلیدی درباره R1: R1 بهینهتر و ارزانتر از O1 است، زیرا دیپسیک بیشتر بر روی آموزش مدل وقت گذاشته است.
• توسعه مدلهای استدلالی با بودجه کم:معمولا اگر بودجه محدود باشد ، روش Distillation مدنظر قرار میگیرد . طبق اطلاعات ارائه شده، این روش میتواند با هزینهای بسیار کم، نتایج خوبی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👏3🔥2❤1🥰1👌1
🆕️تشخیص چهره از ۱۰۰ کیلومتری؛ چین قویترین دوربین جاسوسی جهان را معرفی کرد!
• دانشمندان چینی با استفاده از فناوری لیزر پیشرفته موفق به ساخت دوربینی شدند که میتواند جزئیات میلیمتری را از فاصله ۱۰۰ کیلومتری ثبت کند و ماهوارهها را در مدار شناسایی کند. این دستاورد قبلاً غیرممکن به نظر میرسید اما این سیستم جدید لایدار (LIDAR) میتواند برای شبیهسازی دقیق نقشهها و نیز نظارتهای نظامی استفاده شود.
• در این آزمایش، سیستم لایدار با دقت خارقالعادهای توانست جزئیات اجسام را تا اندازه ۱.۷ میلیمتر از فاصله ۱۰۱.۸ کیلومتری تشخیص دهد. این تکنولوژی که توانست دقت اندازهگیری فواصل را به ۱۵.۶ میلیمتر برساند، ۱۰۰ برابر بهتر از دوربینهای جاسوسی و تلسکوپهای مبتنیبر لنزهای معمولی عمل کرد.
• پیشرفتهای این سیستم نتیجه استفاده از یک لیزر ۱۰۳ وات، پردازش بیدرنگ دادهها، الگوریتمهای تطبیقی برای کاهش نویز نور لیزر و دهانه نوری بزرگ است. این فناوری به محققان اجازه میدهد نهفقط ماهواره را مشاهده کنند، بلکه بهوضوح شماره سریال آن را نیز بخوانند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
• دانشمندان چینی با استفاده از فناوری لیزر پیشرفته موفق به ساخت دوربینی شدند که میتواند جزئیات میلیمتری را از فاصله ۱۰۰ کیلومتری ثبت کند و ماهوارهها را در مدار شناسایی کند. این دستاورد قبلاً غیرممکن به نظر میرسید اما این سیستم جدید لایدار (LIDAR) میتواند برای شبیهسازی دقیق نقشهها و نیز نظارتهای نظامی استفاده شود.
• در این آزمایش، سیستم لایدار با دقت خارقالعادهای توانست جزئیات اجسام را تا اندازه ۱.۷ میلیمتر از فاصله ۱۰۱.۸ کیلومتری تشخیص دهد. این تکنولوژی که توانست دقت اندازهگیری فواصل را به ۱۵.۶ میلیمتر برساند، ۱۰۰ برابر بهتر از دوربینهای جاسوسی و تلسکوپهای مبتنیبر لنزهای معمولی عمل کرد.
• پیشرفتهای این سیستم نتیجه استفاده از یک لیزر ۱۰۳ وات، پردازش بیدرنگ دادهها، الگوریتمهای تطبیقی برای کاهش نویز نور لیزر و دهانه نوری بزرگ است. این فناوری به محققان اجازه میدهد نهفقط ماهواره را مشاهده کنند، بلکه بهوضوح شماره سریال آن را نیز بخوانند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
🔥6❤2👏2👌2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🆕️ معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!
• نکته جالب اینجاست که Mercury تمامی توکنها (کلمات یا بخشهای کلمات) را یکجا تولید و سپس بهینهسازی میکند، بر خلاف مدلهای مبتنی بر ترنسفورمر که هر توکن را یکی یکی تولید میکنند.
• این مدل به طور شگفتانگیزی تا ۱۰ برابر سریعتر از مدلهای پیشرفته و بهینهشده برای سرعت مانند "GPT-4o Mini" و "Claude 3.5 Haiku" اجرا میشود و عملکردی کاملاً مشابه آنها دارد. این یعنی شما میتوانید از همان سطح کیفیت و دقت، اما با سرعتی بسیار بالاتر بهرهمند شوید.
• علاوه بر این، Mercury به سرعتی بیش از ۱۰۰۰ توکن در ثانیه بر روی پردازندههای گرافیکی "NVIDIA H100" دست یافته است. این سرعت فوقالعاده، امکان تولید متنهای طولانی و پیچیده را در کمترین زمان ممکن فراهم میکند.
• نکته قابل توجه اینکه این سرعت بالا بدون نیاز به استفاده از تراشههای تخصصی به دست آمده است. به عبارت دیگر، شما میتوانید با استفاده از سختافزارهای استاندارد، از قدرت و سرعت بینظیر مدلهای "Mercury Coder" بهرهمند شوید.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
• نکته جالب اینجاست که Mercury تمامی توکنها (کلمات یا بخشهای کلمات) را یکجا تولید و سپس بهینهسازی میکند، بر خلاف مدلهای مبتنی بر ترنسفورمر که هر توکن را یکی یکی تولید میکنند.
• این مدل به طور شگفتانگیزی تا ۱۰ برابر سریعتر از مدلهای پیشرفته و بهینهشده برای سرعت مانند "GPT-4o Mini" و "Claude 3.5 Haiku" اجرا میشود و عملکردی کاملاً مشابه آنها دارد. این یعنی شما میتوانید از همان سطح کیفیت و دقت، اما با سرعتی بسیار بالاتر بهرهمند شوید.
• علاوه بر این، Mercury به سرعتی بیش از ۱۰۰۰ توکن در ثانیه بر روی پردازندههای گرافیکی "NVIDIA H100" دست یافته است. این سرعت فوقالعاده، امکان تولید متنهای طولانی و پیچیده را در کمترین زمان ممکن فراهم میکند.
• نکته قابل توجه اینکه این سرعت بالا بدون نیاز به استفاده از تراشههای تخصصی به دست آمده است. به عبارت دیگر، شما میتوانید با استفاده از سختافزارهای استاندارد، از قدرت و سرعت بینظیر مدلهای "Mercury Coder" بهرهمند شوید.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👌3❤1🔥1👏1
Intellimage ( intelligent image processing )
🆕️ معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری! • نکته جالب اینجاست که Mercury تمامی توکنها (کلمات یا بخشهای کلمات) را یکجا تولید و سپس بهینهسازی میکند، بر خلاف مدلهای مبتنی بر ترنسفورمر که هر توکن را یکی یکی تولید میکنند. •…
🖇 تغییرات بزرگ در دنیای مدلهای زبانی!
▪︎تا کنون بیشتر مدلهای زبانی بزرگ (LLMs) از روش مشابهی برای آموزش استفاده میکردند و به صورت Autoregression عمل میکردند، یعنی کلمات را از چپ به راست پیشبینی میکردند. اما حالا یک روش جدید به نام Diffusion به میدان آمده است!
▪︎ روش Diffusion کاملاً متفاوت است؛ این روش به جای حرکت از چپ به راست، همه چیز را یکجا تولید میکند. شما با نویز شروع کرده و به تدریج آن را حذف میکنید تا به یک جریان از کلمات برسید.
▪︎ جالب است بدانید که بسیاری از ابزارهای هوش مصنوعی تولید تصویر و ویدیو، مانند DALL-E، Stable Diffusion و Midjourney، نیز از همین روش Diffusion استفاده میکنند تا تصاویر واقعگرایانه و خلاقانه تولید کنند.
▪︎ قبلاً تلاشهایی برای استفاده از این متد در تولید متن انجام شده بود، اما هیچکدام به شکل تجاری موفق نبودهاند. حالا ما شاهد اولین استفاده تجاری از این روش هستیم که میتواند تأثیر بسزایی بر آینده مدلهای زبانی داشته باشد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
▪︎تا کنون بیشتر مدلهای زبانی بزرگ (LLMs) از روش مشابهی برای آموزش استفاده میکردند و به صورت Autoregression عمل میکردند، یعنی کلمات را از چپ به راست پیشبینی میکردند. اما حالا یک روش جدید به نام Diffusion به میدان آمده است!
▪︎ روش Diffusion کاملاً متفاوت است؛ این روش به جای حرکت از چپ به راست، همه چیز را یکجا تولید میکند. شما با نویز شروع کرده و به تدریج آن را حذف میکنید تا به یک جریان از کلمات برسید.
▪︎ جالب است بدانید که بسیاری از ابزارهای هوش مصنوعی تولید تصویر و ویدیو، مانند DALL-E، Stable Diffusion و Midjourney، نیز از همین روش Diffusion استفاده میکنند تا تصاویر واقعگرایانه و خلاقانه تولید کنند.
▪︎ قبلاً تلاشهایی برای استفاده از این متد در تولید متن انجام شده بود، اما هیچکدام به شکل تجاری موفق نبودهاند. حالا ما شاهد اولین استفاده تجاری از این روش هستیم که میتواند تأثیر بسزایی بر آینده مدلهای زبانی داشته باشد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
Telegram
Intellimage ( intelligent image processing )
✅پردازش تصویر هوشمندIntellimage
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
👌3❤1🔥1🥰1👏1
🆕️ معرفی #کتاب:
📚 Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications
✍ Chip Huyen
📖 کتاب "طراحی سیستمهای یادگیری ماشین: یک فرآیند تکراری برای برنامههای آماده تولید" نوشته Chip Huyen ، به بررسی چالشها و پیچیدگیهای طراحی سیستمهای یادگیری ماشین میپردازد. این کتاب برای افرادی که به دنبال ایجاد و مدیریت سیستمهای یادگیری ماشین قابل اعتماد، مقیاسپذیر و قابل نگهداری هستند، بسیار مفید است.
🌐 book website
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
📚 Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications
✍ Chip Huyen
📖 کتاب "طراحی سیستمهای یادگیری ماشین: یک فرآیند تکراری برای برنامههای آماده تولید" نوشته Chip Huyen ، به بررسی چالشها و پیچیدگیهای طراحی سیستمهای یادگیری ماشین میپردازد. این کتاب برای افرادی که به دنبال ایجاد و مدیریت سیستمهای یادگیری ماشین قابل اعتماد، مقیاسپذیر و قابل نگهداری هستند، بسیار مفید است.
🌐 book website
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
🔥3👏2❤1🥰1
Intellimage ( intelligent image processing )
🆕️ معرفی #کتاب: 📚 Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications ✍ Chip Huyen 📖 کتاب "طراحی سیستمهای یادگیری ماشین: یک فرآیند تکراری برای برنامههای آماده تولید" نوشته Chip Huyen ، به بررسی چالشها و پیچیدگیهای…
🖇 توضیح نکات کلیدی کتاب:
• رویکرد جامع: نویسنده با نگاهی کلی به طراحی سیستمها، هر تصمیم طراحی را در زمینه کمک به دستیابی به اهداف کلی سیستم بررسی میکند.
• فرآیند تکراری: این کتاب بر اساس مطالعات موردی واقعی و با ارجاعات کافی، یک چارچوب تکراری برای طراحی سیستمهای ML ارائه میدهد.
• حل مسائل واقعی: از انتخاب دادههای مناسب و معیارهای درست تا خودکارسازی فرآیند توسعه و ارزیابی مدلها، این کتاب به شما کمک میکند تا مشکلات کسبوکار را حل کنید.
• نظارت بر سیستم: یاد خواهید گرفت که چگونه یک سیستم نظارتی ایجاد کنید تا به سرعت مشکلات احتمالی مدلها را شناسایی و رفع کنید.
• توسعه سیستمهای مسئول: این کتاب بر اهمیت توسعه سیستمهای یادگیری ماشین مسئول و اخلاقی تأکید دارد.
+ اگر به دنبال درک عمیقتری از طراحی و پیادهسازی سیستمهای یادگیری ماشین هستید، این کتاب منبعی ارزشمند برای شما خواهد بود.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
• رویکرد جامع: نویسنده با نگاهی کلی به طراحی سیستمها، هر تصمیم طراحی را در زمینه کمک به دستیابی به اهداف کلی سیستم بررسی میکند.
• فرآیند تکراری: این کتاب بر اساس مطالعات موردی واقعی و با ارجاعات کافی، یک چارچوب تکراری برای طراحی سیستمهای ML ارائه میدهد.
• حل مسائل واقعی: از انتخاب دادههای مناسب و معیارهای درست تا خودکارسازی فرآیند توسعه و ارزیابی مدلها، این کتاب به شما کمک میکند تا مشکلات کسبوکار را حل کنید.
• نظارت بر سیستم: یاد خواهید گرفت که چگونه یک سیستم نظارتی ایجاد کنید تا به سرعت مشکلات احتمالی مدلها را شناسایی و رفع کنید.
• توسعه سیستمهای مسئول: این کتاب بر اهمیت توسعه سیستمهای یادگیری ماشین مسئول و اخلاقی تأکید دارد.
+ اگر به دنبال درک عمیقتری از طراحی و پیادهسازی سیستمهای یادگیری ماشین هستید، این کتاب منبعی ارزشمند برای شما خواهد بود.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
Telegram
Intellimage ( intelligent image processing )
✅پردازش تصویر هوشمندIntellimage
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
❤2👏2🔥1
s41592-025-02595-5.pdf
18.3 MB
☣نوآوری های پژوهشی دنیای تصویر
🔍 بررسی مقاله ؛
📄 Cellpose3: one-click image restoration for improved cellular segmentation
• در دنیای میکروسکوپی، تصاویر ممکن است به دلیل نویز، تاری یا کمبود نمونهبرداری دچار افت کیفیت شوند. این مشکلات معمولاً باعث میشود که روشهای تقسیمبندی سلولی نتوانند به درستی عمل کنند.محققان Carsen Stringer و Marius Pachitariu در مقالهای که در مجله Nature Methods منتشر شده، از نسخه جدیدی به نام Cellpose3 رونمایی کردهاند.
• نوآوری Cellpose3 با هدف حل این مشکلات توسعه یافته و توانسته است بهبودهای قابل توجهی در کیفیت تصویر و تقسیمبندی برای تصاویر نویزی، تاری و کمنمونه ارائه دهد. برخلاف روشهای قبلی که بر روی بازیابی مقادیر پیکسل تمرکز داشتند، Cellpose3 به گونهای آموزش دیده که تصاویری را تولید کند که به خوبی توسط مدلهای تقسیمبندی عمومی شناسایی شوند و در عین حال شباهت بصری با تصاویر هدف را حفظ کنند.
• این ابزارها به صورت «یک کلیک» در رابط گرافیکی Cellpose و همچنین در API آن در دسترس کاربران قرار گرفته است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
🔍 بررسی مقاله ؛
📄 Cellpose3: one-click image restoration for improved cellular segmentation
• در دنیای میکروسکوپی، تصاویر ممکن است به دلیل نویز، تاری یا کمبود نمونهبرداری دچار افت کیفیت شوند. این مشکلات معمولاً باعث میشود که روشهای تقسیمبندی سلولی نتوانند به درستی عمل کنند.محققان Carsen Stringer و Marius Pachitariu در مقالهای که در مجله Nature Methods منتشر شده، از نسخه جدیدی به نام Cellpose3 رونمایی کردهاند.
• نوآوری Cellpose3 با هدف حل این مشکلات توسعه یافته و توانسته است بهبودهای قابل توجهی در کیفیت تصویر و تقسیمبندی برای تصاویر نویزی، تاری و کمنمونه ارائه دهد. برخلاف روشهای قبلی که بر روی بازیابی مقادیر پیکسل تمرکز داشتند، Cellpose3 به گونهای آموزش دیده که تصاویری را تولید کند که به خوبی توسط مدلهای تقسیمبندی عمومی شناسایی شوند و در عین حال شباهت بصری با تصاویر هدف را حفظ کنند.
• این ابزارها به صورت «یک کلیک» در رابط گرافیکی Cellpose و همچنین در API آن در دسترس کاربران قرار گرفته است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
❤2👏2🔥1
Intellimage ( intelligent image processing )
s41592-025-02595-5.pdf
🖇 توضیحات عملکردCellpose3 به عنوان یک نرمافزار و ابزار پیشرفته برای تقسیمبندی تصاویر میکروسکوپی
• این ابزار به کاربران کمک میکند تا به طور خودکار سلولها و ساختارهای بیولوژیکی را در تصاویر شناسایی و تفکیک کنند. ویژگیهای اصلی Cellpose3 عبارتند از:
۱. احیای تصویر: Cellpose3 قادر است تصاویر با کیفیت پایین، شامل تصاویری که دچار نویز، تاری یا کمبود نمونهبرداری هستند، را بهبود بخشد.
۲. تقسیمبندی خودکار: این نرمافزار با استفاده از مدلهای یادگیری عمیق (Deep Learning) میتواند سلولها و ساختارهای مختلف را در تصاویر شناسایی کند و آنها را به طور دقیق تفکیک کند.
۳. رابط کاربری آسان: Cellpose3 دارای یک رابط کاربری گرافیکی است که به کاربران اجازه میدهد تا با یک کلیک به احیای تصویر و تقسیمبندی بپردازند. این ویژگی باعث میشود که حتی کاربرانی که تخصص فنی کمتری دارند نیز بتوانند از این ابزار بهرهبرداری کنند.
۴. عملکرد مناسب در شرایط چالشبرانگیز: Cellpose3 به گونهای طراحی شده است که در شرایطی که تصاویر دچار مشکلاتی مانند نویز یا تاری هستند، عملکرد خوبی داشته باشد و نتایج دقیقی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
• این ابزار به کاربران کمک میکند تا به طور خودکار سلولها و ساختارهای بیولوژیکی را در تصاویر شناسایی و تفکیک کنند. ویژگیهای اصلی Cellpose3 عبارتند از:
۱. احیای تصویر: Cellpose3 قادر است تصاویر با کیفیت پایین، شامل تصاویری که دچار نویز، تاری یا کمبود نمونهبرداری هستند، را بهبود بخشد.
۲. تقسیمبندی خودکار: این نرمافزار با استفاده از مدلهای یادگیری عمیق (Deep Learning) میتواند سلولها و ساختارهای مختلف را در تصاویر شناسایی کند و آنها را به طور دقیق تفکیک کند.
۳. رابط کاربری آسان: Cellpose3 دارای یک رابط کاربری گرافیکی است که به کاربران اجازه میدهد تا با یک کلیک به احیای تصویر و تقسیمبندی بپردازند. این ویژگی باعث میشود که حتی کاربرانی که تخصص فنی کمتری دارند نیز بتوانند از این ابزار بهرهبرداری کنند.
۴. عملکرد مناسب در شرایط چالشبرانگیز: Cellpose3 به گونهای طراحی شده است که در شرایطی که تصاویر دچار مشکلاتی مانند نویز یا تاری هستند، عملکرد خوبی داشته باشد و نتایج دقیقی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
Telegram
Intellimage ( intelligent image processing )
✅پردازش تصویر هوشمندIntellimage
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
📚پژوهشگر و فناور در زمینه ی پردازش تصویر
⚙ طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین
📞 ارتباط با ما: @Intellimage_admin
👏3❤1🔥1
📌 مروری بر پستهای اخیر کانال Intellimage
• آموزش نرم افزارهای کاربردی در پردازش تصاویر پزشکی :
https://news.1rj.ru/str/Intellimage/528
• آموزش مدلهای استدلالی و نحوه ساخت آنها :
https://news.1rj.ru/str/Intellimage/529
• تشخیص چهره از ۱۰۰ کیلومتری؛ چین قویترین دوربین جاسوسی جهان را معرفی کرد:
https://news.1rj.ru/str/Intellimage/530
• معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!
https://news.1rj.ru/str/Intellimage/531
• معرفی کتاب "طراحی سیستمهای یادگیری ماشین: یک فرآیند تکراری برای برنامههای آماده تولید" :
https://news.1rj.ru/str/Intellimage/533
• بررسی مقاله Cellpose3: one-click image restoration for improved cellular segmentation :
https://news.1rj.ru/str/Intellimage/536
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
• آموزش نرم افزارهای کاربردی در پردازش تصاویر پزشکی :
https://news.1rj.ru/str/Intellimage/528
• آموزش مدلهای استدلالی و نحوه ساخت آنها :
https://news.1rj.ru/str/Intellimage/529
• تشخیص چهره از ۱۰۰ کیلومتری؛ چین قویترین دوربین جاسوسی جهان را معرفی کرد:
https://news.1rj.ru/str/Intellimage/530
• معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!
https://news.1rj.ru/str/Intellimage/531
• معرفی کتاب "طراحی سیستمهای یادگیری ماشین: یک فرآیند تکراری برای برنامههای آماده تولید" :
https://news.1rj.ru/str/Intellimage/533
• بررسی مقاله Cellpose3: one-click image restoration for improved cellular segmentation :
https://news.1rj.ru/str/Intellimage/536
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👏2👌2❤1🔥1
🆕️ علیبابا مدل هوش مصنوعی جدیدش به نام QwQ-Max-Preview را معرفی کرد!
◽علیبابا با معرفی مدل هوش مصنوعی جدید خود، QwQ-Max-Preview، حسابی غوغا کرده است. این مدل قرار است با غولهایی مانند o1 از OpenAI و R1 از DeepSeek رقابت کند. جالب است بدانید علیبابا در سه سال آینده قصد دارد ۵۳ میلیارد دلار روی زیرساختهای ابری و هوش مصنوعی سرمایهگذاری کند. این یعنی چینیها با سرعت بالایی در دنیای تکنولوژی پیش میروند!
◽مدل QwQ-Max-Preview بر پایه مدل Qwen 2.5-Max ساخته شده و قرار است در زمینه استدلال و حل مسائل پیچیده عملکرد بهتری داشته باشد.
◽لینک دسترسی به وبسایت QwQ :
🌐 https://chat.qwen.ai/
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
◽علیبابا با معرفی مدل هوش مصنوعی جدید خود، QwQ-Max-Preview، حسابی غوغا کرده است. این مدل قرار است با غولهایی مانند o1 از OpenAI و R1 از DeepSeek رقابت کند. جالب است بدانید علیبابا در سه سال آینده قصد دارد ۵۳ میلیارد دلار روی زیرساختهای ابری و هوش مصنوعی سرمایهگذاری کند. این یعنی چینیها با سرعت بالایی در دنیای تکنولوژی پیش میروند!
◽مدل QwQ-Max-Preview بر پایه مدل Qwen 2.5-Max ساخته شده و قرار است در زمینه استدلال و حل مسائل پیچیده عملکرد بهتری داشته باشد.
◽لینک دسترسی به وبسایت QwQ :
🌐 https://chat.qwen.ai/
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
👏7❤2🔥1🥰1👌1
• گروه تخصصی پردازش تصویر هوشمند intellimage با مشارکت انجمن علمی مهندسی پزشکی دانشگاه آزاد اسلامی و انجمن اسلامی دانشجویان مستقل، با افتخار برگزار میکند:
🩺 ورکشاپ تخصصی پردازش تصویر با موضوع : بررسی نقش پردازش تصویر در حوزه سلامت با رویکرد ترموگرافی
• سخنران : مهندس شیما عابدیان
کارشناسی ارشد مهندسی پزشکی
• مخاطبان: دانشجویان ، پژوهشگران و متخصصان علوم پزشکی ، مهندسی پزشکی ، علوم کامپیوتر و علاقمندان حوزه فناوری های نوین در سلامت
📅 تاریخ: سهشنبه ۱۴۰۳/۱۲/۲۱
🕒 زمان: ساعت ۱۲ - ۱۰
🔗جهت کسب اطلاعات بیشتر و ثبتنام به شناسه زیر مراجعه نمایید :
@hammasir_admin
🆔Intelllimage
🩺 ورکشاپ تخصصی پردازش تصویر با موضوع : بررسی نقش پردازش تصویر در حوزه سلامت با رویکرد ترموگرافی
• سخنران : مهندس شیما عابدیان
کارشناسی ارشد مهندسی پزشکی
• مخاطبان: دانشجویان ، پژوهشگران و متخصصان علوم پزشکی ، مهندسی پزشکی ، علوم کامپیوتر و علاقمندان حوزه فناوری های نوین در سلامت
📅 تاریخ: سهشنبه ۱۴۰۳/۱۲/۲۱
🕒 زمان: ساعت ۱۲ - ۱۰
🔗جهت کسب اطلاعات بیشتر و ثبتنام به شناسه زیر مراجعه نمایید :
@hammasir_admin
🆔Intelllimage
❤4👏3🔥2👌1
📌 آیا بینایی کامپیوتری در سایه قرار گرفته است؟
📈 تقریباً یک سال است که نشریات بزرگ کمتر درباره بینایی کامپیوتری (CV) صحبت میکنند و تمام توجهات به Gen AI، DeepSeek و LLMها معطوف شده است. اما باید بگوییم که بینایی کامپیوتری هنوز زنده و پویاست!
🔹 مدلهای بینایی-زبانی (VLMs) – ترکیب متن و تصویر برای درک بهتر هوش مصنوعی
🔹 تشخیص شیء با دقتی نزدیک به انسان – فراتر از روشهای سنتی، با هوش استدلالی و بدون نیاز به آموزش سفارشی
📌 جدیدترین تحقیقات در NeurIPS:
🔸 بدون داده نمایی نمایی، "Zero-Shot" وجود ندارد – ویشال اودانداراو، دانشگاه توبینگن
🔸 درک سوگیری در مجموعه دادههای بصری بزرگمقیاس – بویا زنگ، دانشگاه پنسیلوانیا
🔸 نقشهسازی در هر مکان: پیشبینی نقشه BEV – چری هو، عمر علامه و جیایه ژو، دانشگاه کارنگی ملون
🔎TechnologicalIdeas
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
📈 تقریباً یک سال است که نشریات بزرگ کمتر درباره بینایی کامپیوتری (CV) صحبت میکنند و تمام توجهات به Gen AI، DeepSeek و LLMها معطوف شده است. اما باید بگوییم که بینایی کامپیوتری هنوز زنده و پویاست!
🔹 مدلهای بینایی-زبانی (VLMs) – ترکیب متن و تصویر برای درک بهتر هوش مصنوعی
🔹 تشخیص شیء با دقتی نزدیک به انسان – فراتر از روشهای سنتی، با هوش استدلالی و بدون نیاز به آموزش سفارشی
📌 جدیدترین تحقیقات در NeurIPS:
🔸 بدون داده نمایی نمایی، "Zero-Shot" وجود ندارد – ویشال اودانداراو، دانشگاه توبینگن
🔸 درک سوگیری در مجموعه دادههای بصری بزرگمقیاس – بویا زنگ، دانشگاه پنسیلوانیا
🔸 نقشهسازی در هر مکان: پیشبینی نقشه BEV – چری هو، عمر علامه و جیایه ژو، دانشگاه کارنگی ملون
🔎TechnologicalIdeas
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
❤2👌2🔥1🥰1👏1
🆕️ کشف الگوهای بافتشناسی مرتبط با درمان سرطان روده بزرگ با استفاده از یادگیری خودنظارتی
◽محققان با استفاده از یک روش یادگیری ماشینSSL موفق به شناسایی الگوهای مهمی در تصاویر بافتشناسی سرطان روده بزرگ شدهاند که میتوانند به انتخاب روشهای درمانی مناسبتر کمک کنند.
◽ در این مطالعه، یک مدل SSL به نام Barlow Twins روی مجموعه بزرگی از تصاویر اسلاید کامل (WSI) از سرطان روده بزرگ آموزش داده شد. این مدل توانست ویژگیهای مهمی را از تکههای کوچک تصاویر (tiles) استخراج کند و آنها را بر اساس شباهتهای بافتشناسی در گروههایی به نام HPC (خوشههای فنوتیپی بافتشناسی) دستهبندی کند.
◽ نتایج نشان داد که این HPCها قابل اعتماد هستند و میتوانند بقای بیماران را پیشبینی کنند. با بررسی دقیق این HPCها، محققان توانستند 47 نوع مختلف از ویژگیهای بافتشناسی را شناسایی کنند که هر کدام میتوانند اطلاعات مهمی در مورد نوع بافت، میزان آن و ساختار آن، به ویژه در ارتباط با استرومای تومور، ارائه دهند.
🌐 paper link
📄nature communication
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
◽محققان با استفاده از یک روش یادگیری ماشینSSL موفق به شناسایی الگوهای مهمی در تصاویر بافتشناسی سرطان روده بزرگ شدهاند که میتوانند به انتخاب روشهای درمانی مناسبتر کمک کنند.
◽ در این مطالعه، یک مدل SSL به نام Barlow Twins روی مجموعه بزرگی از تصاویر اسلاید کامل (WSI) از سرطان روده بزرگ آموزش داده شد. این مدل توانست ویژگیهای مهمی را از تکههای کوچک تصاویر (tiles) استخراج کند و آنها را بر اساس شباهتهای بافتشناسی در گروههایی به نام HPC (خوشههای فنوتیپی بافتشناسی) دستهبندی کند.
◽ نتایج نشان داد که این HPCها قابل اعتماد هستند و میتوانند بقای بیماران را پیشبینی کنند. با بررسی دقیق این HPCها، محققان توانستند 47 نوع مختلف از ویژگیهای بافتشناسی را شناسایی کنند که هر کدام میتوانند اطلاعات مهمی در مورد نوع بافت، میزان آن و ساختار آن، به ویژه در ارتباط با استرومای تومور، ارائه دهند.
🌐 paper link
📄nature communication
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
👏2👌2❤1🔥1🥰1
📸 لنزهای محبوب C-Mount!
◽استانداردسازی یک حس خوب است اما وقتی Bell Howell دوربین "Filmo 70" را در سال 1923 معرفی کرد، چندین بار چند نوع پیچ با قطر تقریبی 1 اینچ را تعویض کردند تا اینکه بالاخره به ANSI 1-32 UN 2A رسیدند.
◽این استاندارد دارای یک رشته 25.4 میلیمتری با گام 0.794 میلیمتری و 32 رشته در هر اینچ است که در فاصله فلنج 17.526 میلیمتری استاندارد شده است. از آنجایی که هیچ کس نمیتوانست همه اینها را به خاطر بسپارد و این سومین نسخه از مفهوم 1 اینچی آنها بود، تصمیم گرفتند آن را نوع C یا "C-Mount" بنامند.
◽محبوبیت Filmo 70 و سایر محصولات Bell Howell البته موفقیت C-Mount را رقم زد و بعضی تولیدکنندگان که به C-Mount برای دوربینهای 16 میلیمتری خود روی آوردند، پتانسیل این پیچ کوچک و فوقالعاده محکم را برای کاربردهای علمی دریافتند.
◽از میکروسکوپها تا دوربینهای صنعتی ،همه اکنون از این گام استاندارد استفاده میکنند. هر دوربین CCTV یا دوربین بینایی ماشین در جهان از C-Mount یا CS-Mount کمی استفاده میکند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
◽استانداردسازی یک حس خوب است اما وقتی Bell Howell دوربین "Filmo 70" را در سال 1923 معرفی کرد، چندین بار چند نوع پیچ با قطر تقریبی 1 اینچ را تعویض کردند تا اینکه بالاخره به ANSI 1-32 UN 2A رسیدند.
◽این استاندارد دارای یک رشته 25.4 میلیمتری با گام 0.794 میلیمتری و 32 رشته در هر اینچ است که در فاصله فلنج 17.526 میلیمتری استاندارد شده است. از آنجایی که هیچ کس نمیتوانست همه اینها را به خاطر بسپارد و این سومین نسخه از مفهوم 1 اینچی آنها بود، تصمیم گرفتند آن را نوع C یا "C-Mount" بنامند.
◽محبوبیت Filmo 70 و سایر محصولات Bell Howell البته موفقیت C-Mount را رقم زد و بعضی تولیدکنندگان که به C-Mount برای دوربینهای 16 میلیمتری خود روی آوردند، پتانسیل این پیچ کوچک و فوقالعاده محکم را برای کاربردهای علمی دریافتند.
◽از میکروسکوپها تا دوربینهای صنعتی ،همه اکنون از این گام استاندارد استفاده میکنند. هر دوربین CCTV یا دوربین بینایی ماشین در جهان از C-Mount یا CS-Mount کمی استفاده میکند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👌4❤1👏1
🆕️ حسگر تصویر میتواند یک ANN باشد !
◽فناوری بینایی ماشین در سالهای اخیر پیشرفتهای چشمگیری داشته و به بخشی جداییناپذیر از سیستمهای هوشمند، از جمله وسایل نقلیه خودران و رباتیک تبدیل شده است.
◽معمولاً اطلاعات بصری که توسط دوربینهای فریمدار ثبت میشود، به فرمت دیجیتال تبدیل شده و سپس با استفاده از الگوریتمهای یادگیری ماشین مانند شبکههای عصبی مصنوعی (ANN) پردازش میشود.با این حال، حجم بالای داده (که عمدتاً تکراری است) در طول زنجیره سیگنال منجر به نرخ فریم پایین و مصرف انرژی بالا میشود.
◽به همین دلیل، تکنیکهای مختلف پیشپردازش دادههای بصری برای افزایش کارایی پردازش سیگنال بعدی در ANN توسعه یافتهاند. یک حسگر تصویر میتواند خود یک ANN باشد که به طور همزمان تصاویر نوری را بدون تأخیر حس کرده و پردازش کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
◽فناوری بینایی ماشین در سالهای اخیر پیشرفتهای چشمگیری داشته و به بخشی جداییناپذیر از سیستمهای هوشمند، از جمله وسایل نقلیه خودران و رباتیک تبدیل شده است.
◽معمولاً اطلاعات بصری که توسط دوربینهای فریمدار ثبت میشود، به فرمت دیجیتال تبدیل شده و سپس با استفاده از الگوریتمهای یادگیری ماشین مانند شبکههای عصبی مصنوعی (ANN) پردازش میشود.با این حال، حجم بالای داده (که عمدتاً تکراری است) در طول زنجیره سیگنال منجر به نرخ فریم پایین و مصرف انرژی بالا میشود.
◽به همین دلیل، تکنیکهای مختلف پیشپردازش دادههای بصری برای افزایش کارایی پردازش سیگنال بعدی در ANN توسعه یافتهاند. یک حسگر تصویر میتواند خود یک ANN باشد که به طور همزمان تصاویر نوری را بدون تأخیر حس کرده و پردازش کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
🔥4👌2❤1👏1