Intellimage ( intelligent image processing ) – Telegram
Intellimage ( intelligent image processing )
1.33K subscribers
396 photos
101 videos
37 files
640 links
پردازش تصویر هوشمندIntellimage

📚پژوهشگر و فناور در زمینه ی پردازش تصویر

طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین

📞 ارتباط با ما: @Intellimage_admin
Download Telegram
Intellimage ( intelligent image processing )
🆕️ تصویربرداری اپتوآکوستیک: روشی نوین برای بررسی دیابت 🩺 تغییرات در رگ‌های خونی کوچک یکی از عوارض شایع دیابت است. محققان دانشگاه فنی مونیخ (TUM) و موسسه هلماولتز مونیخ، روشی را توسعه داده‌اند که می‌تواند این تغییرات میکروواسکولار را در پوست اندازه‌گیری…
🖇 پیشرفت های تصویربرداری اپتوآکوستیک

پروفسور واسیلیس نزیاتکریستوس، رئیس گروه تصویربرداری بیولوژیکی در TUM، می‌گوید: «با RSOM، اکنون می‌توانیم به‌طور کمی اثرات دیابت را توصیف کنیم.» این روش به‌تازگی امکان‌پذیر شده است که RSOM به‌صورت قابل حمل و مقرون به صرفه باشد. این یافته‌ها راه جدیدی را برای پایش مداوم وضعیت بیش از ۴۰۰ میلیون نفر مبتلا به دیابت در سراسر جهان فراهم می‌آورد. در آینده، با انجام معاینات سریع و بدون درد، تنها در چند دقیقه می‌توان تعیین کرد که آیا درمان‌ها مؤثر هستند یا خیر، حتی در خانه.

مطالعات نشان می‌دهد که با ترکیب ۳۲ ویژگی مختلف پوست، می‌توان به ارتباط بین وضعیت رگ‌های خونی کوچک و شدت دیابت پی برد. این پیشرفت می‌تواند انقلابی در روش‌های پایش و درمان دیابت ایجاد کند و به بهبود کیفیت زندگی بیماران کمک کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#Medical_AI
👏21🔥1👌1
🆕️ پیشرفت‌های اخیر AI

︎اخیر OpenAI ابزار جدیدی به نام Deep Research را راه‌اندازی کرد که به پژوهشگران کمک می‌کند تا سریع‌تر و عمیق‌تر تحقیقات خود را انجام دهند. این ابزار AI-powered بسیار underrated است و تاثیر زیادی بر روند پژوهش خواهد گذاشت.

︎سایر مدلها نیز پیشرفت هایی داشته اند از جمله؛

۱.مدل Hugging Face نسخه‌ای از Deep Research را بازتولید کرد و ثابت کرد که حرکت‌های متن‌باز با سرعت در حال پیشرفت هستند.

۲.مدل Deep Research به عنوان یک دستیار پژوهشی قوی عمل می‌کند.

۳.مدل GitHub Copilot حالت Agent Mode را اضافه کرد و برنامه‌نویسی هوشمند را به جلو می‌برد.

۴.مدل Gemini 2.0 به‌صورت عمومی منتشر می‌شود و رقابت در بین مدل‌های AI را افزایش می‌دهد.

۵.مدل ChatGPT حافظه‌اش را افزایش داد و مکالمات را بیشتر هوشمند کرد.

۶.مدل Lyft، Claude AI را ادغام کرده و وظایف بیشتری را در خدمات مشتریانش خودکار کرده است.

۷. گوگل تبلیغ سوپر باول خود را بعد از یک اشتباه AI دوباره طراحی کرد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
🔥4👏21🥰1👌1
🌐 معرفی بهترین وبسایت ها برای پردازش تصویر

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
👌53👏2🔥1🥰1
🆕️ امکان استفاده از مدل‌های بزرگ برای همه!

📍اجرای مدل‌های بزرگی مثل DeepSeek-R1 با ۶۷۱ میلیارد پارامتر بر روی سخت‌افزارهای معمولی، تقریبا غیر ممکن به نظر می‌رسید.

اما تیم KVCache . AI با یک رویکرد نوین، این چالش را پشت سر گذاشته‌اند!
این تیم با استفاده از محاسبات ناهمگن (heterogeneous computing)، توانسته بخش‌هایی از پردازش را به CPU واگذار کند و به این ترتیب، مدل‌های بزرگ را روی کارت گرافیک‌هایی با حافظه ۲۴ گیگابایت مثل RTX 4090 اجرا کند.

• بخش‌های پراکنده مدل (MoE) روی حافظه رم (DRAM) و CPU قرار می‌گیرند.

• بخش‌های اصلی و پرکاربرد مدل روی GPU پردازش می‌شوند.

• با استفاده از کوانتیزاسیون ۴ بیتی، حافظه لازم برای اجرای مدل فقط ۲۴ گیگابایت است!

📥GitHub

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👌3👏21
🆕️ عصای Smart Cane با قابلیت‌های هوش مصنوعی برای نابینایان

شرکت WeWalk از نسخه جدید عصای نابینایان خود رونمایی کرده است که یکی از بهترین نمونه‌های استفاده از هوش مصنوعی را به‌نمایش می‌گذارد. این عصا قادر به شناسایی موانع بر سر راه کاربر است و از دستیار صوتی برای کمک به فرد بهره می‌برد.

عصای هوشمند WeWalk Smart Cane 2 با حسگرهای مختلف خود و قابلیت‌های هوش مصنوعی به نابینایان یا کم‌بینایان کمک می‌کند تا زندگی راحت‌تری داشته باشند. هم‌بنیان‌گذار WeWalk که خودش از بدو تولد نابینا بوده است، می‌گوید Smart Cane 2 می‌تواند حرکت را ساده‌تر و ایمن‌تر کند و قابلیت‌هایی مثل مسیریابی نقطه‌به‌نقطه و تشخیص موانع را ارائه کند.

این عصای پیشرفته از دستیار صوتی مبتنی بر ChatGPT بهره می‌برد تا در لحظه اطلاعات لازم را در اختیار کاربر بگذارد و حتی نیازی به بیرون آوردن موبایل از جیب یا کیف وجود نداشته باشد. دسته این عصا نسبت به نسل قبلی باریک‌تر شده است تا راحت‌تر بتوان آن را در دست گرفت.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#Medical_AI
👏31🔥1
Intellimage ( intelligent image processing )
🆕️ معرفی مدل جدید مولتی مدال در ورودی و خروجی از DeepSeek به نام Janus https://github.com/deepseek-ai/Janus
🆕️ معرفی سری Janus از DeepSeek

📉 سری Janus نسل جدیدی از مدل‌های هوش مصنوعی است که به منظور کار با داده‌های متنوعی نظیر متن، تصویر و ترکیب این دو طراحی شده است. این مدل‌ها به گونه‌ای ساخته شده‌اند که قادرند هر نوع ورودی (متن یا تصویر) را دریافت کرده و هر نوع خروجی (متن یا تصویر) تولید نمایند. به همین دلیل، به این مدل‌ها اصطلاحاً مدل‌های "any-to-any" اطلاق می‌شود که به معنای تبدیل هر چیزی به هر چیزی است.

📉 نسخه پیشرفته‌ی این سری: Janus-Pro
این نسخه با سه بهبود اصلی ارائه شده است:

۱. استراتژی آموزشی بهینه‌شده: فرآیند یادگیری مدل را دقیق‌تر کرده است.

۲. اضافه شدن داده‌های بیشتر: توانایی مدل را افزایش داده است.

۳. بزرگ‌تر شدن ابعاد مدل: عملکرد آن در درک و تولید تصویر از متن را به طور قابل توجهی تقویت کرده است.

📉 نتیجه این پیشرفت‌ها، توانمندی بسیار بالای Janus-Pro در درک و تولید داده‌های چندرسانه‌ای (Multimodal) است و حتی در تولید تصویر از متن، پایداری بالایی را نشان می‌دهد.

📉 نسخه اصلی، یعنی Janus، دارای یک معماری جالب و هوشمندانه می‌باشد. این مدل پردازش تصویر را از سایر وظایف جدا کرده است، اما همچنان با یک معماری یکپارچه‌ی ترانسفورمر تمامی جنبه‌ها را مدیریت می‌کند. این طراحی باعث شده است که مدل در هر دو بخش درک و تولید، بسیار منعطف و کارآمد باشد و حتی از مدل‌های تخصصی موجود در این زمینه پیشی بگیرد.

📉 مدل دیگری که در این سری وجود دارد، JanusFlow نام دارد که ایده‌ای نوآورانه را اجرایی کرده است: ترکیب مدل‌های اتورگرسیو با روشی پیشرفته به نام Rectified Flow. این ترکیب به سادگی و به طور مؤثری انجام شده است و نیازی به پیچیدگی خاصی ندارد. نتیجه این تلاش، مدلی است که هم قادر به تولید تصویر می‌باشد و هم در زمینه‌های چندرسانه‌ای عملکردی برتر از سایر مدل‌های موجود را ارائه می‌دهد.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👏31🔥1👌1
🆕️ تحقیق فوق‌العاده و هیجان انگیز متا: ارتباط مستقیم بین مغز و نوشتار!

خبر هیجان‌انگیز از مرکز BCBL! متا به تازگی با همکاری این مرکز، قدم بزرگی در زمینه ارتباط بین مغز و نوشتار برداشته است. در این تحقیق، ۳۵ داوطلب در حین تایپ جملات، تحت نظر قرار گرفتند و فعالیت‌های مغزی آن‌ها با استفاده از دستگاه‌های MEG و EEG ضبط شد.

پژوهشگران با بهره‌گیری از هوش مصنوعی، تلاش کردند تا با تحلیل سیگنال‌های مغزی این افراد، جملات را دوباره بسازند. نتایج شگفت‌انگیز بود! آن‌ها موفق شدند تا ۸۰ درصد از حروف را به درستی تشخیص دهند که این عملکرد دو برابر سیستم‌های EEG معمولی است!

این دستاورد جدید، ادامه‌ای بر کارهای قبلی متا در کشف راز ادراک تصاویر و صدا از مغز است و حالا به مرحله تولید جملات رسیده. موفقیت این پروژه می‌تواند درب‌های تازه‌ای را برای ایجاد واسط‌های مغز و کامپیوتر باز کند و آینده‌ای نویدبخش برای ارتباطات انسان‌ها رقم بزند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
👏3👌21
🔍 نقش AI در تشخیص‌های رادیولوژیک

هوش مصنوعی (AI) پتانسیل حمایت از تشخیص‌ها در رادیولوژی را دارد. با این حال، کمبود شفافیت در بسیاری از موارد، فهم توصیه‌های AI را دشوار کرده است. محققان بررسی کرده‌اند که آیا و چگونه نمایش‌های بصری استفاده شده در تحلیل تصاویر AI ، که به آن‌ها نقشه‌های برجستگی (saliency maps) گفته می‌شود ، می‌توانند کمک کنند.

فرآیند تصمیم‌گیری AI باید به اندازه کافی شفاف باشد تا پزشکان بتوانند بهترین ارزیابی را از اینکه چقدر می‌توانند به توصیه‌های AI اعتماد کنند، داشته باشند. این مسئله تا کنون دشوار بوده است.

می‌توان نقشه‌ای برای هر توصیه‌ای که سیستم AI ارائه می‌دهد ایجاد کرد که نشان دهد کدام بخش‌های تصویر در فرآیند تصمیم‌گیری لحاظ شده‌اند. این نقشه‌ها، که به آن‌ها نقشه‌های برجستگی گفته می‌شود، مناطق داخل یک تصویر را نشان می‌دهند که شبکه عصبی بر اساس آن‌ها پیش‌بینی کرده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
👌3👏21🔥1🥰1
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی

🩻 رادیولوژیست‌ها از نرم‌افزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده می‌کنند. این نرم‌افزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکس‌های X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شده‌اند.

🩻 این نرم‌افزارها کمک می‌کنند تا رادیولوژیست‌ها بتوانند به بهترین شکل ممکن به تحلیل تصاویر بپردازند و در تشخیص بیماری‌ها دقیق‌تر عمل کنند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
👏3👌31🔥1
Intellimage ( intelligent image processing )
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی 🩻 رادیولوژیست‌ها از نرم‌افزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده می‌کنند. این نرم‌افزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکس‌های X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شده‌اند.…
🖇 معرفی نرم افزار های کاربردی در پردازش تصاویر پزشکی

۱.نرم افزار OsiriX: یک نرم‌افزار محبوب برای مشاهده و پردازش تصاویر پزشکی، به‌ویژه برای تصاویر MRI و CT. این نرم‌افزار مخصوص macOS است و قابلیت‌ تجزیه و تحلیل تصاویر سه‌بعدی را دارد.

۲.نرم افزار RadiAnt DICOM Viewer: نرم‌افزاری برای مشاهده تصاویر DICOM که به رادیولوژیست‌ها کمک می‌کند تا به سرعت تصاویر را بارگذاری و تحلیل کنند.

۳.نرم افزار 3D Slicer: یک نرم‌افزار منبع باز برای تجزیه و تحلیل تصاویر پزشکی و پردازش داده‌های سه‌بعدی. این نرم‌افزار امکانات پیشرفته‌ای برای تجزیه و تحلیل و ساخت تصاویر سه‌بعدی دارد.

۴.نرم افزار Philips IntelliSpace Portal: این نرم‌افزار یک پلتفرم جامع برای پردازش تصاویر پزشکی است که به رادیولوژیست‌ها امکان می‌دهد تا تصاویر را تجزیه و تحلیل و نتایج را به راحتی به اشتراک بگذارند.

۵.نرم افزار Siemens syngo.plaza: نرم‌افزاری از شرکت زیمنس که ابزاری قوی برای پردازش و تحلیل تصاویر پزشکی ارائه می‌دهد و به رادیولوژیست‌ها امکان مدیریت و تجزیه و تحلیل تصاویر را می‌دهد.

۶.نرم افزار  GE Healthcare Centricity: یک نرم‌افزار که به رادیولوژیست‌ها کمک می‌کند تا تصویربرداری‌های پزشکی را مدیریت و تحلیل کنند و امکاناتی برای بهبود کارایی در جریان کار را فراهم می‌کند.

۷.نرم افزار MIM Software: یک نرم‌افزار تخصصی برای بخش بندی و تحلیل تصاویر پزشکی، که به خصوص در رادیوتراپی و اتوماسیون فرآیندهای بالینی کاربرد دارد.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
👌5👏21🔥1🥰1
📚 مدل‌های استدلالی (Reasoning Models) چیستند و چگونه ساخته می‌شوند؟

• این روزها نام مدل‌های استدلالی مثل DeepSeek R1 را زیاد می‌شنوید. اگر هنوز با مفهوم و کاربرد این مدل‌ها آشنا نیستید، با ما همراه باشید تا از insights آقای سباستین راشکا (نویسنده کتاب "Build a Large Language Model From Scratch") بهره‌مند شوید. نظریه ایشان در بررسی مدل‌های استدلالی قابل تامل است.

• تعریف مدل استدلالی: این مدل‌ها برای حل سوالات پیچیده و چندمرحله‌ای طراحی شده‌اند. به عنوان مثال، حل یک سوال فیزیک یا ریاضی نیاز به استدلال دارد، در حالی که سوالاتی ساده مانند "پایتخت فرانسه کجاست؟" به این مدل‌ها نیازی ندارند.

• مواقع مناسب استفاده: این مدل‌ها در مواردی که نیاز به سرعت و هزینه پایین داریم یا سوالات دانشی داریم، کارایی ندارند. همچنین، برای سوالات ساده نیز مناسب نیستند زیرا ممکن است بیش از حد فکر کنند!

• مدل DeepSeek R1 شامل سه بخش اصلی است: DeepSeek-R1-Zero ، DeepSeek-R1 و DeepSeek-R1-Distill.

• روش‌های ساخت و بهبود مدل‌های استدلالی: چهار روش اصلی برای تولید این مدل‌ها معرفی شده است:

  ۱.روش Inference-time scaling

  ۲.روش RL خالص

  ۳.روش SFT + RL

  ۴.روش SFT خالص با Distillation

• نکات کلیدی درباره R1: R1 بهینه‌تر و ارزان‌تر از O1 است، زیرا دیپ‌سیک بیشتر بر روی آموزش مدل وقت گذاشته است.

• توسعه مدل‌های استدلالی با بودجه کم:معمولا اگر بودجه محدود باشد ، روش Distillation مدنظر قرار می‌گیرد . طبق اطلاعات ارائه شده، این روش می‌تواند با هزینه‌ای بسیار کم، نتایج خوبی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👏3🔥21🥰1👌1
🆕️تشخیص چهره از ۱۰۰ کیلومتری؛ چین قوی‌ترین دوربین جاسوسی جهان را معرفی کرد!

• دانشمندان چینی با استفاده از فناوری لیزر پیشرفته موفق به ساخت دوربینی شدند که می‌تواند جزئیات میلی‌متری را از فاصله ۱۰۰ کیلومتری ثبت کند و ماهواره‌ها را در مدار شناسایی کند. این دستاورد قبلاً غیرممکن به نظر می‌رسید اما این سیستم جدید لایدار (LIDAR) می‌تواند برای شبیه‌سازی دقیق نقشه‌ها و نیز نظارت‌های نظامی استفاده شود.

• در این آزمایش، سیستم لایدار با دقت خارق‌العاده‌ای توانست جزئیات اجسام را تا اندازه ۱.۷ میلی‌متر از فاصله ۱۰۱.۸ کیلومتری تشخیص دهد. این تکنولوژی که توانست دقت اندازه‌گیری فواصل را به ۱۵.۶ میلی‌متر برساند، ۱۰۰ برابر بهتر از دوربین‌های جاسوسی و تلسکوپ‌های مبتنی‌بر لنزهای معمولی عمل کرد.

• پیشرفت‌های این سیستم نتیجه استفاده از یک لیزر ۱۰۳ وات، پردازش بی‌درنگ داده‌ها، الگوریتم‌های تطبیقی برای کاهش نویز نور لیزر و دهانه نوری بزرگ است. این فناوری به محققان اجازه می‌دهد نه‌فقط ماهواره را مشاهده کنند، بلکه به‌وضوح شماره سریال آن را نیز بخوانند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
🔥62👏2👌2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🆕️ معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!

• نکته جالب اینجاست که Mercury تمامی توکن‌ها (کلمات یا بخش‌های کلمات) را یکجا تولید و سپس بهینه‌سازی می‌کند، بر خلاف مدل‌های مبتنی بر ترنسفورمر که هر توکن را یکی یکی تولید می‌کنند.

• این مدل به طور شگفت‌انگیزی تا ۱۰ برابر سریع‌تر از مدل‌های پیشرفته و بهینه‌شده برای سرعت مانند "GPT-4o Mini" و "Claude 3.5 Haiku" اجرا می‌شود و عملکردی کاملاً مشابه آنها دارد. این یعنی شما می‌توانید از همان سطح کیفیت و دقت، اما با سرعتی بسیار بالاتر بهره‌مند شوید.

• علاوه بر این، Mercury به سرعتی بیش از ۱۰۰۰ توکن در ثانیه بر روی پردازنده‌های گرافیکی "NVIDIA H100" دست یافته است. این سرعت فوق‌العاده، امکان تولید متن‌های طولانی و پیچیده را در کمترین زمان ممکن فراهم می‌کند.

• نکته قابل توجه اینکه این سرعت بالا بدون نیاز به استفاده از تراشه‌های تخصصی به دست آمده است. به عبارت دیگر، شما می‌توانید با استفاده از سخت‌افزارهای استاندارد، از قدرت و سرعت بی‌نظیر مدل‌های "Mercury Coder" بهره‌مند شوید.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👌31🔥1👏1
Intellimage ( intelligent image processing )
🆕️ معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری! • نکته جالب اینجاست که Mercury تمامی توکن‌ها (کلمات یا بخش‌های کلمات) را یکجا تولید و سپس بهینه‌سازی می‌کند، بر خلاف مدل‌های مبتنی بر ترنسفورمر که هر توکن را یکی یکی تولید می‌کنند. •…
🖇 تغییرات بزرگ در دنیای مدل‌های زبانی!

︎تا کنون بیشتر مدل‌های زبانی بزرگ (LLMs) از روش مشابهی برای آموزش استفاده می‌کردند و به صورت Autoregression عمل می‌کردند، یعنی کلمات را از چپ به راست پیش‌بینی می‌کردند. اما حالا یک روش جدید به نام Diffusion به میدان آمده است!

︎ روش Diffusion کاملاً متفاوت است؛ این روش به جای حرکت از چپ به راست، همه چیز را یکجا تولید می‌کند. شما با نویز شروع کرده و به تدریج آن را حذف می‌کنید تا به یک جریان از کلمات برسید.

︎ جالب است بدانید که بسیاری از ابزارهای هوش مصنوعی تولید تصویر و ویدیو، مانند DALL-E، Stable Diffusion و Midjourney، نیز از همین روش Diffusion استفاده می‌کنند تا تصاویر واقع‌گرایانه و خلاقانه تولید کنند.

︎ قبلاً تلاش‌هایی برای استفاده از این متد در تولید متن انجام شده بود، اما هیچ‌کدام به شکل تجاری موفق نبوده‌اند. حالا ما شاهد اولین استفاده تجاری از این روش هستیم که می‌تواند تأثیر بسزایی بر آینده مدل‌های زبانی داشته باشد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
👌31🔥1🥰1👏1
🆕️ معرفی #کتاب:

📚 Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications

Chip Huyen

📖 کتاب "طراحی سیستم‌های یادگیری ماشین: یک فرآیند تکراری برای برنامه‌های آماده تولید" نوشته Chip Huyen ، به بررسی چالش‌ها و پیچیدگی‌های طراحی سیستم‌های یادگیری ماشین می‌پردازد. این کتاب برای افرادی که به دنبال ایجاد و مدیریت سیستم‌های یادگیری ماشین قابل اعتماد، مقیاس‌پذیر و قابل نگهداری هستند، بسیار مفید است.
🌐 book website

🆔️ telegram channel:

https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
🔥3👏21🥰1
Intellimage ( intelligent image processing )
🆕️ معرفی #کتاب: 📚 Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications Chip Huyen 📖 کتاب "طراحی سیستم‌های یادگیری ماشین: یک فرآیند تکراری برای برنامه‌های آماده تولید" نوشته Chip Huyen ، به بررسی چالش‌ها و پیچیدگی‌های…
🖇 توضیح نکات کلیدی کتاب:

• رویکرد جامع: نویسنده با نگاهی کلی به طراحی سیستم‌ها، هر تصمیم طراحی را در زمینه کمک به دستیابی به اهداف کلی سیستم بررسی می‌کند.

• فرآیند تکراری: این کتاب بر اساس مطالعات موردی واقعی و با ارجاعات کافی، یک چارچوب تکراری برای طراحی سیستم‌های ML ارائه می‌دهد.

• حل مسائل واقعی: از انتخاب داده‌های مناسب و معیارهای درست تا خودکارسازی فرآیند توسعه و ارزیابی مدل‌ها، این کتاب به شما کمک می‌کند تا مشکلات کسب‌وکار را حل کنید.

• نظارت بر سیستم: یاد خواهید گرفت که چگونه یک سیستم نظارتی ایجاد کنید تا به سرعت مشکلات احتمالی مدل‌ها را شناسایی و رفع کنید.

• توسعه سیستم‌های مسئول: این کتاب بر اهمیت توسعه سیستم‌های یادگیری ماشین مسئول و اخلاقی تأکید دارد.

+ اگر به دنبال درک عمیق‌تری از طراحی و پیاده‌سازی سیستم‌های یادگیری ماشین هستید، این کتاب منبعی ارزشمند برای شما خواهد بود.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
#AI_book
2👏2🔥1
s41592-025-02595-5.pdf
18.3 MB
نوآوری های پژوهشی دنیای تصویر

🔍 بررسی مقاله ؛

📄 Cellpose3: one-click image restoration for improved cellular segmentation

• در دنیای میکروسکوپی، تصاویر ممکن است به دلیل نویز، تاری یا کمبود نمونه‌برداری دچار افت کیفیت شوند. این مشکلات معمولاً باعث می‌شود که روش‌های تقسیم‌بندی سلولی نتوانند به درستی عمل کنند.محققان Carsen Stringer و Marius Pachitariu در مقاله‌ای که در مجله Nature Methods منتشر شده، از نسخه جدیدی به نام Cellpose3 رونمایی کرده‌اند.

• نوآوری Cellpose3 با هدف حل این مشکلات توسعه یافته و توانسته است بهبودهای قابل توجهی در کیفیت تصویر و تقسیم‌بندی برای تصاویر نویزی، تاری و کم‌نمونه ارائه دهد. برخلاف روش‌های قبلی که بر روی بازیابی مقادیر پیکسل تمرکز داشتند، Cellpose3 به گونه‌ای آموزش دیده که تصاویری را تولید کند که به خوبی توسط مدل‌های تقسیم‌بندی عمومی شناسایی شوند و در عین حال شباهت بصری با تصاویر هدف را حفظ کنند.

• این ابزارها به صورت «یک کلیک» در رابط گرافیکی Cellpose و همچنین در API آن در دسترس کاربران قرار گرفته است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
2👏2🔥1
Intellimage ( intelligent image processing )
s41592-025-02595-5.pdf
🖇 توضیحات عملکردCellpose3 به عنوان یک نرم‌افزار و ابزار پیشرفته برای تقسیم‌بندی تصاویر میکروسکوپی

• این ابزار به کاربران کمک می‌کند تا به طور خودکار سلول‌ها و ساختارهای بیولوژیکی را در تصاویر شناسایی و تفکیک کنند. ویژگی‌های اصلی Cellpose3 عبارتند از:

۱. احیای تصویر: Cellpose3 قادر است تصاویر با کیفیت پایین، شامل تصاویری که دچار نویز، تاری یا کمبود نمونه‌برداری هستند، را بهبود بخشد.

۲. تقسیم‌بندی خودکار: این نرم‌افزار با استفاده از مدل‌های یادگیری عمیق (Deep Learning) می‌تواند سلول‌ها و ساختارهای مختلف را در تصاویر شناسایی کند و آنها را به طور دقیق تفکیک کند.

۳. رابط کاربری آسان: Cellpose3 دارای یک رابط کاربری گرافیکی است که به کاربران اجازه می‌دهد تا با یک کلیک به احیای تصویر و تقسیم‌بندی بپردازند. این ویژگی باعث می‌شود که حتی کاربرانی که تخصص فنی کمتری دارند نیز بتوانند از این ابزار بهره‌برداری کنند.

۴. عملکرد مناسب در شرایط چالش‌برانگیز: Cellpose3 به گونه‌ای طراحی شده است که در شرایطی که تصاویر دچار مشکلاتی مانند نویز یا تاری هستند، عملکرد خوبی داشته باشد و نتایج دقیقی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#article
👏31🔥1
📌 مروری بر پستهای اخیر کانال Intellimage

• آموزش نرم افزارهای کاربردی در پردازش تصاویر پزشکی :
https://news.1rj.ru/str/Intellimage/528

• آموزش مدل‌های استدلالی و نحوه ساخت آنها :

https://news.1rj.ru/str/Intellimage/529

• تشخیص چهره از ۱۰۰ کیلومتری؛ چین قوی‌ترین دوربین جاسوسی جهان را معرفی کرد:

https://news.1rj.ru/str/Intellimage/530

• معرفی Mercury: اولین مدل زبانی بزرگ defusion (dLLM) با کیفیت تجاری!

https://news.1rj.ru/str/Intellimage/531

• معرفی کتاب "طراحی سیستم‌های یادگیری ماشین: یک فرآیند تکراری برای برنامه‌های آماده تولید" :
https://news.1rj.ru/str/Intellimage/533

• بررسی مقاله Cellpose3: one-click image restoration for improved cellular segmentation :

https://news.1rj.ru/str/Intellimage/536

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👏2👌21🔥1
🆕️ علی‌بابا مدل هوش مصنوعی جدیدش به نام QwQ-Max-Preview را معرفی کرد!

علی‌بابا با معرفی مدل هوش مصنوعی جدید خود، QwQ-Max-Preview، حسابی غوغا کرده است. این مدل قرار است با غول‌هایی مانند o1 از OpenAI و R1 از DeepSeek رقابت کند. جالب است بدانید علی‌بابا در سه سال آینده قصد دارد ۵۳ میلیارد دلار روی زیرساخت‌های ابری و هوش مصنوعی سرمایه‌گذاری کند. این یعنی چینی‌ها با سرعت بالایی در دنیای تکنولوژی پیش می‌روند!

مدل QwQ-Max-Preview بر پایه مدل Qwen 2.5-Max ساخته شده و قرار است در زمینه استدلال و حل مسائل پیچیده عملکرد بهتری داشته باشد.

لینک دسترسی به وبسایت QwQ :
🌐 https://chat.qwen.ai/

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
👏72🔥1🥰1👌1