Intellimage ( intelligent image processing ) – Telegram
Intellimage ( intelligent image processing )
1.33K subscribers
393 photos
101 videos
37 files
637 links
پردازش تصویر هوشمندIntellimage

📚پژوهشگر و فناور در زمینه ی پردازش تصویر

طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین

📞 ارتباط با ما: @Intellimage_admin
Download Telegram
🪩 معرفی DeepLens شرکت آمازون

نوآوری DeepLens ، یک سرویس وب از شرکت آمازون است.
یکی از برنامه های مراقبت پزشکی که از DeepLens استفاده می کند DermLens است. DermLens هدفش کمک به بیمار برای مدیریت بیماری پوستی psoriasis است. این برنامه داده های گزارش شده را در دسترس تیم پزشکی قرار می دهد.

ابزار بینایی ماشین، داده ها را به برنامه میفرستد و کاربر می تواند تخمین شدت بیماری را مشاهده کند. تیم DermLens یک برنامه موبایل برای گزارش علائم اضافی مانند خارش و خستگی را هم توسعه داده است.

در طی تحقیقی که این تیم در ژونال American Dermatology به ثبت رسانده، این شرکت ادعا کرده که DermLens در ۹۲ بیمار تست شده و ۷۲ درصد از بیماران اعلام کرده اند که ترجیح می دهند از دوربین های DermLens به جای گوشی های هوشمند استفاده کنند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#top_news
#machin_vision
#image_processing
3👏1
🪩تحلیل تصاویر آنژیوگرافی با مدل SE-RegUNet

شبکه SE-RegUNet یک نوع شبکه عصبی کانولوشنی است که به‌طور خاص برای تقسیم‌بندی تصاویر پزشکی طراحی شده است.

این مدل از ویژگی‌های انکودرهای RegNet بهره‌برداری می‌کند و به‌دنبال بهینه‌سازی فرایند استخراج ویژگی‌ها از تصاویر پیچیده است.

مدل SE-RegUNet دارای بلوک‌هایی برای فشرده‌سازی و فعال‌سازی است که کارایی آن را در استخراج ویژگی‌های دقیق بهبود می‌بخشد.

هدف اصلی این مدل دقت بالا در شناسایی و تقسیم‌بندی نواحی خاص در تصاویر پزشکی (مانند عروق کرونر در آنژیوگرافی) است.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#deep_learning
2👏2
🪩 معرفی شبکه های Large Language Models

شبکه‌های LLM (Large Language Models) به مدل‌های یادگیری ماشینی اطلاق می‌شوند که به‌طور خاص برای پردازش و تولید زبان طبیعی طراحی شده‌اند.

این مدل‌ها با استفاده از تعداد بسیار بالایی پارامتر، توانایی درک و تولید متنی را دارند و می‌توانند در طیف گسترده‌ای از وظایف زبانی از جمله تولید متن، ترجمه، پاسخ به سوالات، تحلیل احساسات و غیره به کار گرفته شوند.

برخی از مثال‌های معروف LLMها شامل GPT-3 و GPT-4 (توسعه‌یافته توسط OpenAI)، BERT و RoBERTa (توسعه‌یافته توسط Google) و LLaMA (توسعه‌یافته توسط Meta) هستند.

این مدل‌ها به دلیل قدرت و دقت بالایشان در پردازش متن به طور گسترده در زمینه های مختلف مورد استفاده قرار می‌گیرند.

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#deep_learning
#LLM
4🔥1👏1
🪩توانایی LLM در شخصی سازی درمان بیماران

هوش مصنوعی (AI) در حوزه بهداشت و درمان پیشرفت‌های قابل توجهی در درمان‌های پزشکی هوشمند داشته است. با این حال، سیستم‌های بهداشت و درمان هوشمند سنتی به داده‌های ایستا و استانداردهای یکپارچه محدود هستند و این امر مانع از ادغام کامل با شرایط فردی و دیگر چالش‌ها می‌شود. بنابراین، یک روش حرفه‌ای و دقیق‌تر در حوزه بهداشت هوشمند برای توسعه مورد نیاز است.

به این منظور،چارچوب نوآورانه Heath-LLM پیشنهاد می‌شود که استخراج ویژگی‌های بزرگ‌مقیاس و نمره‌دهی مبادله‌ای دانش پزشکی را ترکیب می‌کند.
در مقایسه با روش‌های سنتی مدیریت سلامت، این روش دارای سه مزیت اصلی است:
اول، این روش گزارش‌های سلامت را در یک مدل بزرگ ادغام می‌کند تا اطلاعات دقیق‌تری درباره وظایف ارائه دهد.
دوم، از تخصص پزشکی حرفه‌ای برای تنظیم نمرات وزنی ویژگی‌های سلامت استفاده می‌شود.
سوم،از یک چارچوب استخراج ویژگی نیمه‌خودکار برای افزایش توان تحلیلی مدل‌های زبانی استفاده می‌شود و بینش کارشناسان برای بهبود دقت پیش‌بینی بیماری‌ها بهره‌برداری می‌شود.
🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#LLM
3🔥1
🖇معرفی الگوریتم Soft Actor-Critic (SAC)

🔘 الگوریتم Soft Actor-Critic (SAC) یک روش یادگیری تقویتی است که برای بهینه‌سازی تصمیم‌گیری در محیط‌های پیوسته طراحی شده است.

🔘 الگوریتم SAC از یک سیاست نرم استفاده می‌کند که به جای تمرکز فقط بر حداکثر کردن پاداش، به ماکسیمم کردن پاداش به همراه کاهش عدم قطعیت (Entropy) می‌پردازد. این رویکرد کمک می‌کند تا یادگیری بهتر و پایدارتر انجام شود و از یادگیری فقط بر اساس پاداش جلوگیری می‌کند.

🔘 الگوریتم SAC از روش‌های بهینه‌سازی برپایه گرادیان برای به‌روزرسانی پارامترهاو عملگرهای خود استفاده می‌کند.

🔘 با توجه به این ویژگی‌ها، الگوریتم SAC به عنوان یکی از الگوریتم‌های کارآمد و قوی در زمینه یادگیری تقویتی شناخته می‌شود، به ویژه در مسائلی با فضای عمل پیوسته.

باماهمراه باشید 🌱
🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#machin_vision
#image_processing
3👏1
🌐 عملکرد پردازش تصویر در نظارت بر خون از دست رفته

شرکت gauss surgical روش هایی را برای نظارت بر از دست رفتن خون توسعه داده که می تواند زمان از دست رفتن خون را در شرایط پزشکی به صورت بلادرنگ تخمین بزند. این روش، انتقال خون را به حداکثر می رساند و همچنین خونریزی را بهتر از چشم انسان تشخیص می دهد.

خط تریتون شرکت Gauss Surgical برای نظارت بر خون از دست رفته، شامل تریتون اتاق جراحی است که از یک برنامه ی مبتنی بر iPad برای گرفتن تصاویری از خون در اسفنج های جراحی و محفظه های مکش استفاده می کند. این تصاویر توسط الگوریتم های بینایی ماشین برای تخمین مقدار خون از دست رفته پردازش می شود. این شرکت ادعا می کند که این برنامه توسط مختصصان پزشکی در بیمارستان ها طی عملیات جراحی استفاده می شود.

برای تعیین صحت و درستی برنامه تریتون اتاق جراحی، این برنامه در حین عمل های جراحی مورد مطالعه قرار گرفته و توسط سازمان غذا و داروی آمریکا درسال ۲۰۱۷ تایید شده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#machin_vision
#image_processing
4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
📽 بررسی برخی از کاربردهای پردازش تصویر در صنعت :

- بررسی عیوب بافت
- بررسی عیوب قطعات
- تشخیص خرابی چاپ
- تشخیص خرابی جوش در جوشکاری
- تشخیص عیوب روی مواد پلاستیکی
- بررسی اشکالات بسته بندی

🔎 vision system

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#deep_learning
5👏1
SegGPT: Segmenting Everything In Context

🆕️ ما SegGPT را معرفی می‌کنیم!
یک مدل عمومی برای تقسیم‌بندی همه چیز در یک زمینه مشخص!


🟡 انواع مختلف وظایف تقسیم‌بندی در یک چارچوب یادگیری درون‌متنی عمومی ادغام شده است که داده‌های تقسیم‌بندی مختلف را با تبدیل آن‌ها به یک فرمت مشترک از تصاویر، سازگار می‌کند.

🟡 آموزش SegGPT به‌صورت یک مسئله رنگ‌آمیزی درون‌متنی با نقشه‌برداری رنگ تصادفی برای هر نمونه داده فرموله شده است.

🟡 پس از آموزش، SegGPT می‌تواند وظایف تقسیم‌بندی دلخواه را در تصاویر یا ویدیوها از طریق استنتاج درون‌متنی انجام دهد، از جمله تقسیم‌بندی اشیاء، مواد، قطعات، حاشیه و متن.

🟡 مدل SegGPT بر روی دامنه وسیعی از وظایف، از جمله تقسیم‌بندی معنایی با نمونه‌های محدود، تقسیم‌بندی اشیاء ویدئویی، تقسیم‌بندی معنایی و تقسیم‌بندی پانورامیک ارزیابی شده است و نتایج مثبتی به صورت کیفی و کمی داشته است.
🧾paper

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#SegGPT
👏21🔥1
Forwarded from DeepMind AI Expert (Farzad 🦅)
در این مقاله، نویسندگان CancerLLM، یک مدل 7 میلیارد پارامتری را ارائه می‌کنند که برای وظایف خاص سرطان طراحی شده است. از قبل بر روی 2.67 میلیون یادداشت بالینی و 515524 گزارش #پاتولوژی در 17 نوع #سرطان آموزش دیده است.

◾️ CancerLLM: A Large Language Model in Cancer Domain

#علوم_پزشکی #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
2👌1
کمک Masked Attention به شبکه های عصبی گراف

▪️شبکه‌های عصبی گراف (GNN) به دلیل انعطاف‌پذیری، کارایی و عملکرد خوب، به روشی برای یادگیری بر روی داده‌های ساختار یافته گراف تبدیل شده‌اند. با این حال، طراحی GNN های قدرتمند و همه منظوره اغلب به تلاش های تحقیقاتی قابل توجهی نیاز دارد و بر اپراتورهای ارسال پیام ، به دقت ساخته شده است. این می تواند زمان بر باشد و ممکن است همیشه به بهینه ترین راه حل برای یادگیری نمودار معین منجر نشود.

▪️بااین وجود Masked Attention for Graphs (MAG) یک جایگزین ساده اما موثر برای GNN های سنتی ارائه می دهد. MAG به جای تکیه بر عملگرهای پیچیده ارسال پیام، نمودارها را به عنوان مجموعه گره یا لبه نشان می دهد و با پوشاندن ماتریس وزن توجه، اتصال را تقویت می کند. این الگوهای توجه به مدل اجازه می دهد مستقیماً از ساختار نمودار یاد بگیرد. علیرغم سادگی، MAG به عملکرد پیشرفته‌ای در کارهای دوربرد دست می‌یابد و از خطوط پایه ارسال پیام قوی و روش‌های مبتنی بر توجه در سطح گره و گراف بهتر عمل می‌کند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#GNN
2🔥1👏1
🔗 معرفی کتابخانه Dynamic-Link Library

کتابخانه DLL (Dynamic-Link Library) یک نوع فایل در سیستم‌عامل ویندوز است که شامل توابع، کلاس‌ها و داده‌هایی است که برنامه‌ها می‌توانند به‌صورت مشترک از آن استفاده کنند.

این کتابخانه‌ها به برنامه‌ها اجازه می‌دهند که فقط قسمتی از کد را به‌صورت جداگانه بارگذاری کنند و در نتیجه، استفاده بهینه‌تری از حافظه و منابع سیستم داشته باشند.

با استفاده از DLL‌ها، توسعه‌دهندگان می‌توانند قابلیت‌ها را بین برنامه‌ها به‌اشتراک بگذارند و همچنین به راحتی قابلیت‌های جدیدی اضافه کنند.

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#DLL
1🔥1👏1
🪩 معرفی پژوهش های پردازش تصویر و بینایی ماشین در صنعت

▪️ در سال‌های اخیر، پردازش تصویر و بینایی ماشین به سرعت در حال رشد بوده‌اند و در صنعت کاربردهای متنوع و جدیدی یافته‌اند. در اینجا به یکسری از موارد مهم و جدید اشاره می کنیم:

. تشخیص عیوب محصول: استفاده از بینایی ماشین برای شناسایی عیوب تولید در خطوط تولید.

. بصری‌سازی داده‌ها: تبدیل داده‌های صنعتی به تصاویر قابل تحلیل به کمک تکنیک‌های پردازش تصویر.

. پایش وضعیت سلامت ماشین‌آلات: استفاده از بینایی ماشین برای تشخیص مشکلات و نقص‌های ماشین‌آلات.

. تحلیل ویدئویی در زمان واقعی: نظارت بر فرآیندها و کنترل کیفیت با استفاده از ویدئوهای زنده.

. خودروهای خودران: استفاده از تکنیک‌های بینایی ماشین برای ناوبری و شناسایی موانع.

. تحلیل تصویر برای کشاورزی دقیق: استفاده از بینایی ماشین برای بررسی سلامت و کیفیت محصولات کشاورزی.

. بازیابی آنلاین تصاویر: جستجوی مقایسه و شناسایی تصاویر صنعتی در بانک‌های اطلاعاتی.

. تشخیص رفتار غیرعادی در خط تولید: شناسایی رفتارهایی که ممکن است به وقوع حوادث منجر شوند.

. افزایش کارایی انبارها: استفاده از دید ماشین برای مدیریت موجودی و مکان‌یابی اتوماتیک کالاها.

. پایش آنالیز تصویری در فرآیندهای شیمیایی: بررسی و تحلیل تصاویر برای بهینه‌سازی فرآیندهای تولید.

. تشخیص و پردازش چهره برای امنیت: استفاده از فناوری شناسایی چهره در سیستم‌های امنیتی صنعتی.

. تحلیل تصاویر پزشکی برای تجهیزات پزشکی: بهبود تشخیص و تحلیل تصویر با استفاده از بینایی ماشین.

. مدل‌سازی و شبیه‌سازی رفتار مواد: استفاده از تصاویر برای شبیه‌سازی رفتار مواد تحت شرایط مختلف.

. راهنمایی و هدایت ماشین‌های صنعتی: استفاده از بینایی ماشین برای هدایت و کنترل ماشین‌آلات و روبات‌ها.

. تشخیص و شناسایی اشیاء در محیط‌های پیچیده: بهبود سیستم‌های تشخیص اشیاء در محیط‌های شلوغ و غیرمترقبه.

. بهبود سیستم‌های نسل پنجم ارتباطات: استفاده از بینایی ماشین برای بهینه‌سازی عملکرد شبکه‌ها.

. آشکارسازی نشت‌ها: استفاده از تکنیک‌های پردازش تصویر برای شناسایی نشت‌ها در فرآیندهای صنعتی.

. تحلیل تصاویر هوایی و ماهواره‌ای: استفاده از بینایی ماشین برای تحلیل داده‌های فضایی در فضاهای بزرگ صنعتی.

. سیستم‌های واقعیت افزوده (AR) برای آموزش: ایجاد سیستم‌های آموزشی تعاملی با استفاده از بینایی ماشین و AR.

. تشخیص ناهنجاری در داده‌های تولید: شناسایی و تحلیل ناهنجاری‌ها برای ارتقاء کیفیت و کارایی.

▪️این مسائل تنها نمونه‌هایی از مباحث روز در پردازش تصویر و بینایی ماشین در صنعت هستند و با پیشرفت تکنولوژی، این حوزه‌ها همچنان در حال گسترش و نوآوری هستند.

🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#image_processing
🔥32👏1
🪩 معرفی بهترین سایت ها برای پیاده سازی و اجرای کدهای پروژه های سنگین هوش مصنوعی به صورت آنلاین :
▪️. Google Colab

. Kaggle

▪️. Deepnote

. AWS SageMaker

▪️. GCP Notebooks

. Azure Notebooks

▪️. Cocalc

. Binder

▪️. Saturncloud

. Datablore

▪️. IBM Notebooks

. Ola kutrim

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#Mazums_AI
#programming
2🔥1
💢 تشخیص سرقت در فروشگاه به کمک بینایی ماشین

شرکت StopLift ادعا می کند که یک سیستم بینایی ماشین توسعه داده که دزدی ها و دیگر کمبود ها را در فروشگاه های زنجیره ای کاهش می دهد.

محصول شرکت که ScanItAll نام دارد سیستمی است که خطاهای فروشندگان و همچنین فروشندگانی که محصولات را اسکن نمی کنند را مشخص می کند. نام دیگر این محصول sweethearting است. sweethearting به معنای اسکن تقلبی یک محصول توسط فروشنده است. در sweethearting فروشنده برای مشتری خود که دوست، خانواده یا همکار او است، اجناسی را اسکن نمی کند.

تکنولوژی بینایی ماشین موجود در ScanItAll در دوربین های متصل به سقف و سیستم های POS فروشگاه وجود دارد. نرم افزار از طریق دوربین، مشاهده می کند که آیا صندوقدار همه ی کالاها را اسکن می کند. اگر محصولی در POS اسکن نشود، با عنوان “گم شده” توسط نرم افزار برچسب می خورد. بعد از ثبت این مورد، نوبت مدیریت است که تدابیری را برای جلوگیری از موارد مشابه در آینده اتخاذ کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
3🔥1
بهبود عملکرد LLM با تصحیح خودکار ، به سبک گوگل!

▪️تصحیح خودکار یک قابلیت بسیار مطلوب برای LLMها است، اما تاکنون عمدتاً نا موفق بوده است.

▪️درواقع رویکردهای موجود یا به مدل‌های چندگانه نیاز دارند یا به نظارت خارجی تکیه می‌کنند.

▪️روش جدید DeepMind گوگل به نام SCoRe، توانایی تصحیح خودکار یک LLM را با استفاده از داده‌های تولید شده توسط خودش به طور قابل توجهی بهبود می‌بخشد.

این روش به این صورت کار می‌کند:

۱. مدل به تنهایی مجموعه‌ای از آثار تصحیح را تولید می‌کند.

۲. سپس بر روی این آثار با استفاده از یادگیری تقویتی آموزش می‌بیند و یاد می‌گیرد که چگونه پاداش را برای تصحیح خودکار موثر حداکثری کند.

۳. نکته کلیدی این است که SCoRe از تکنیک‌های تنظیم (regularization) استفاده می‌کند تا از حفظ پاسخ‌های با پاداش بالا جلوگیری کند. به جای این، مدل یک استراتژی قوی برای تصحیح خودکار را یاد می‌گیرد.

+ وقتی که این روش بر روی مدل‌های Gemini 1.0 Pro و 1.5 Flash اعمال شد، عملکرد تصحیح خودکار آنها به ترتیب 15.6٪ و 9.1٪ در معیارهای MATH و HumanEval افزایش یافت.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#LLM
2🔥1
🩻 نقش Localization در پردازش تصاویر پزشکی

الگوریتم Localization (محل‌یابی) در پردازش تصاویر پزشکی به معنای شناسایی و تعیین موقعیت دقیق نواحی خاص در داخل بدن است.این نقش در زمینه‌های مختلفی اهمیت دارد و می‌تواند به بهبود تشخیص کمک کند.

در ادامه به برخی از جنبه‌های کلیدی نقش localization در پردازش تصاویر پزشکی اشاره می‌شود:

1️⃣. شناسایی نواحی مشکوک: Localization به پزشکان کمک می‌کند تا نواحی مشکوک یا عارضه‌های احتمالی مانند تومورها، زخم‌ها یا عفونت‌ها را به‌طور دقیق شناسایی کنند. این اطلاعات بسیار مهم است چرا که می‌تواند تعیین‌کننده روش‌های درمانی باشد.

2️⃣. بهبود دقت تشخیص: با داشتن اطلاعات دقیق در مورد موقعیت ناهنجاری‌ها، دقت تشخیص افزایش می‌یابد. این مسئله کمک می‌کند تا پزشکان بتوانند تفسیر بهتری از تصاویر پزشکی داشته باشند و نتیجه‌گیری‌های بهتری در مورد وضعیت بیمار کنند.

3️⃣. راهنمایی برای درمان: Localization می‌تواند به عنوان یک ابزار راهنمایی در حین انجام درمان‌های آندوسکوپیک مانند بیوپسی یا درمان‌های مداخله‌ای عمل کند. تعیین دقیق موقعیت ناهنجاری‌ها به پزشکان کمک می‌کند تا در زمان درمان به‌طور مؤثرتری عمل کنند.

4️⃣. افزایش کارایی تصویربرداری: با بهره‌برداری از تکنیک‌های localization، می‌توان تصویر برداری را به نحوی بهینه کرد که روی نواحی خاص تمرکز بیشتری داشته باشد و از زمان و منابع در حین انجام تصویربرداری صرفه‌جویی کند.

5️⃣. تحلیل و تفسیر بهتر: پس از localization مناسب، ویژگی‌های بالینی و تصویرگری بهتر از نواحی مشکوک برای مقایسه و تجزیه و تحلیل‌های بعدی فراهم می‌شود، که می‌تواند به عنوان یک منبع ارزشمند برای تحقیقات علمی و تلاش‌های بالینی به‌کار رود.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
3🔥1👏1
🪩سازنده Chat GPT: احتمالاً تا چندهزار روز دیگر به اَبَرهوش مصنوعی دست می‌یابیم

🔹️«سم آلتمن»، مدیرعامل OpenAI، به‌تازگی در وبلاگ شخصی‌اش چشم‌انداز خود را درباره آینده‌ مبتنی بر هوش مصنوعی بشر تشریح کرد. او در این مقاله تصویری ترسیم می‌کند که در آن پیشرفت انسان به لطف هوش مصنوعی شتاب می‌گیرد. به‌ باور آلتمن، ابرهوش مصنوعی (ASI) در چندهزار روز آینده ظهور خواهد کرد.

🔹️هدف فعلی OpenAI ایجاد هوش جامع مصنوعی (AGI) است که به فناوری اطلاق می‌شود که می‌تواند با هوش انسان در انجام بسیاری از کارها بدون نیاز به آموزش‌های خاص مطابقت داشته باشد. در مقابل، ASI یا ابرهوش مصنوعی نیز وجود دارد که پا را از AGI فراتر می‌گذارد و می‌توان آن را سطحی از هوش ماشینی دانست که می‌تواند به‌طرز چشمگیری در هر کار فکری، حتی تا حدی غیرقابل‌درک برای ما بهتر از انسان‌ها عمل کند.

🔹️سم آلتمن در مقاله خود تاریخ دقیقی برای ظهور این عصر جدید ذکر نمی‌کند و فقط می‌گوید در چندهزار روز آینده، به ASI خواهیم رسید. بااین‌حال می‌توان تخمین زد ظرف یک دهه به این فناوری برسیم.
🔎 Akharinkhabar

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI
#top_news
2🔥1
🟠 معرفی Region Adjacency Graph (RAG) که فوق العاده جذاب است!

گراف هم‌جواری نواحی ( RAG) یک ساختار داده‌ای است که برای نمایش و تجزیه و تحلیل ویژگی‌های تصویر استفاده می‌شود. این گراف به طور خاص برای نشان دادن ارتباطات بین نواحی مختلف در یک تصویر به کار می‌رود. به عبارت دیگر، گراف هم‌جواری نواحی می‌تواند نواحی (مانند بخش‌های مختلف یک شیء یا پس‌زمینه) را به عنوان گره‌ها و ارتباطات بین آن‌ها (مانند پیوستگی یا تماس) را به عنوان یال‌ها نمایش دهد.

هر ناحیه ای که در تصویر شناسایی شده، یک گره در گراف را تشکیل می‌دهد. این نواحی معمولاً با استفاده از تکنیک‌های نوینی مانند آستانه‌گذاری، خوشه‌بندی یا تقسیم‌بندی تصویر مشخص می‌شوند.

در نهایت، گراف هم‌جواری نواحی ابزاری مفید برای درک و تحلیل تصاویر پیچیده است و می‌تواند به بهبود دقت الگوریتم‌های پردازش تصویر کمک کند.

با ماهمراه باشید🌱
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
3👏1
🖇چرا شبکه‌های عصبی گراف در سال ۲۰۲۴ اهمیت دارند؟

هر سیستمی که شامل موجودیت‌ها و روابط بین آن‌ها باشد می‌تواند به‌عنوان یک گراف شناخته شود. اگرچه الگوریتم‌های یادگیری عمیق در دهه گذشته در زمینه‌هایی مانند پردازش زبان طبیعی، بینایی کامپیوتری و شناسایی گفتار پیشرفت‌های چشمگیری داشته‌اند، به دلیل توانایی آن‌ها در استخراج ویژگی‌های سطح بالا از داده‌ها با عبور از لایه‌های غیرخطی، اکثر معماری‌های یادگیری عمیق به‌طور خاص برای داده‌های ساختار اقلیدسی طراحی شده‌اند، مانند داده‌های جدولی، تصاویر، متن و صدا، در حالی که داده‌های گرافی به‌طور عمده نادیده گرفته شده‌اند.

روش‌های هوش مصنوعی سنتی برای استخراج اطلاعات از اشیاء رمزگذاری شده با ساختارهای نسبتاً «سخت» طراحی شده‌اند. به عنوان مثال، تصاویر معمولاً به‌عنوان شبکه‌های ۲ بعدی ثابت از پیکسل‌ها رمزگذاری می‌شوند و متن به‌عنوان یک دنباله ۱ بعدی از کلمات (یا توکن‌ها). ساختار گراف اطلاعات ارزشمندی را که از نمایندگی داده با ابعاد بالاتر از این موجودیت‌ها و روابط آن‌ها ناشی می‌شود، مطرح می‌کند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#GNN
3🔥1
🪩شبکه های عصبی گراف(GNN) پشتیبان پیشرفت های اخیر هوش مصنوعی هستند!

در حالی که سیستم‌های هوش مصنوعی مانند ChatGPT اخیراً در کانون توجه قرار گرفته‌اند، شبکه‌های عصبی گراف (GNN) به سرعت در حال پیشرفت هستند.

در چند سال گذشته، GNN ها به آرامی به قهرمان پنهان پشت یک سری دستاوردهای هیجان‌انگیز تبدیل شده‌اند که از پیشرفتهای تحقیقاتی و دانشگاهی به راه‌حل‌های واقعی و به‌کارگیری شده در مقیاس بزرگ تبدیل شده‌اند.

شرکت‌هایی مانند اوبر، گوگل، علی‌بابا، پینترست و توییتر در حال تغییر به رویکردهای مبتنی بر GNN در برخی از محصولات اصلی خود هستند، که این تغییر به دلیل بهبودهای قابل توجه عملکرد که این روش‌ها در مقایسه با معماری‌های پیشرفته هوش مصنوعی قبلی نشان می‌دهند، صورت گرفته است.

داده‌های ساختار گرافی یک چارچوب عمومی و انعطاف‌پذیر برای توصیف و تحلیل هر مجموعه ممکن از موجودیت‌ها و تعاملات متقابل آن‌ها را فراهم می‌کند.
🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#deep_learning
#GNN
4👏3