Intellimage ( intelligent image processing ) – Telegram
Intellimage ( intelligent image processing )
1.33K subscribers
396 photos
101 videos
37 files
640 links
پردازش تصویر هوشمندIntellimage

📚پژوهشگر و فناور در زمینه ی پردازش تصویر

طراحی و پیاده سازی پروژه های پردازش تصویر و بینایی ماشین

📞 ارتباط با ما: @Intellimage_admin
Download Telegram
🆕️مدل Titans معماری جدید AI درگوگل

🔍 گوگل به تازگی معماری جدیدی به نام «تایتان‌» (Titans) را برای هوش مصنوعی معرفی کرده است که توانایی ذخیره‌سازی داده‌های بلندمدت را دارد.

این معماری از نظر کارایی به مراتب بهتر از مدل قبلی و معروف Transformers عمل می‌کند.

تایتان‌ از یک ماژول حافظه عصبی استفاده می‌کند که به آن‌ها این امکان را می‌دهد که یاد بگیرند چه اطلاعاتی را باید به خاطر بسپارند و کدام‌ها را فراموش کنند. این ماژول اجازه می‌دهد میلیون‌ها نقطه داده را با دقت بالا پردازش کنند بدون اینکه چیزی از دست برود.

در واقع، طراحی این معماری الهام‌گرفته از حافظه انسان است. حافظه کوتاه مدت ما دقیق اما محدود است، در حالی که حافظه بلند مدت ما داده‌ها را برای مدت بیشتری ذخیره می‌کند. تایتان‌ نیز از ترکیب این دو نوع حافظه استفاده می‌کند.

این ویژگی‌ها به مدل اجازه می‌دهد مسائل بسیار پیچیده‌ ای را حل کند.علی بهروز، محقق ارشد این معماری جدید در گوگل، یک ایرانی و دانش‌آموخته دانشگاه شریف است.
🆔️telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#AI_news
🔥3👏3👌21
🆕️ارتقاء دقت تشخیص در ماموگرافی و توموگرافی با هنگینگ پروتکل جدید نرم‌افزار diVision

در دنیای مدرن تصویربرداری پزشکی، نرم‌افزارهایی که قادر به مدیریت و نمایش مؤثر تصاویر پزشکی هستند، حیاتی‌اند. هنگینگ پروتکل دیویژن به‌ویژه برای تصاویر پیچیده ماموگرافی و توموگرافی طراحی شده و مزایای زیر را ارائه می‌دهد:

۱. مرتب‌سازی خودکار تصاویر: این ویژگی دسترسی سریع به تصاویر را تسهیل می‌کند.
۲. سازگاری با پروتکل‌های مختلف: عملکرد بهینه با روش‌های تشخیصی متعدد.
۳. تطبیق‌پذیری با دستگاه‌های مختلف: مناسب برای مراکز پزشکی بزرگ و کلینیک‌های کوچک.
۴. تنظیمات سفارشی: قابلیت شخصی‌سازی بر اساس نیازهای پزشکان.

مزایای کلیدی این پروتکل:
- افزایش دقت تشخیصی؛
- کاهش زمان تشخیص؛
- بهبود تجربه کاربری.

+ این پروتکل جدید نه تنها به بهبود کیفیت تشخیص کمک می‌کند، بلکه ابزاری کلیدی برای ارتقاء درمان بیماران به شمار می‌آید.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#medical_news
👏3👌21🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
📽 عملکرد هوش مصنوعی Gemini 2.0 در تفسیر تصاویر پزشکی

یک رادیولوژیست برزیلی برای تفسیر MRI شانه‌ی بیمار از این هوش مصنوعی کمک می‌گیرد و در پایان از او می‌خواهد تا گزارش نهایی را هم تهیه کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#medical_AI
👏9🔥31👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🅿️ دوره پایتون

قسمت ۱۸ پردازش تصویر در
#پایتون

📚
#پروژه شناسایی خودرو در پایتون

🔎 persianovin
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#programming
#python
👏51🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🆕️ مدل o3-mini ، رتبه برتر در کدنویسی

مدل o3-mini از OpenAI اخیراً در یک چالش کدنویسی، DeepSeek R1 را پشت سر گذاشت. موضوع چالش این بود:
"یک برنامه پایتون بنویسید که یک توپ را درون یک شش‌ضلعی چرخان نمایش دهد. توپ باید تحت تأثیر جاذبه و اصطکاک قرار گیرد و به صورت واقعی از دیواره‌های چرخان بجهد."

مدل o3-mini، دومین مدل "استدلال‌گر" OpenAI است که برای تجزیه و تحلیل، تفکر و اصلاح پاسخ‌ها قبل از ارائه، زمان بیشتری صرف می‌کند. این ویژگی‌ها باعث می‌شود که o3-mini بتواند نتایج دقیق‌تر و بهتری ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#programming
#python
👏72👌2🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🆕️ فناوری Veesion مؤثر در امنیت

︎با فناوری بینایی ماشین و هوش مصنوعی Veesion که حالا در حال نظارت برفروشگاه‌هاست، سیستم‌های نسل جدید برای شناسایی رفتارهای مشکوک به کار گرفته می‌شوند.

︎این هوش مصنوعی حرکات خاصی مانند پنهان کردن اجناس در جیب‌ها، کیف‌ها یا کالسکه‌ها را ردیابی کرده و به کارکنان فروشگاه هشدارهای فوری ارسال می‌کند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#AI_news
👏3🔥2👌21
🆕️ زمان‌بندی سکته مغزی با استفاده از هوش مصنوعی

︎یکی از چالش‌های اصلی در زمینه سکته مغزی، تعیین زمان دقیق وقوع سکته است تا بهترین درمان ممکن انتخاب شود. یک تیم تحقیقاتی شامل دانشمندان دانشگاه فنی مونیخ (TUM) الگوریتمی توسعه داده‌اند که می‌تواند زمان سکته را با دقت بسیار بالا مشخص کند و در مقایسه با روش‌های کنونی، دقت آن دو برابر بیشتر است.

︎دانشمندان از دانشگاه امپریال لندن، دانشگاه ادینبرو و TUM با استفاده از هوش مصنوعی دقت زمان‌بندی سکته را بهبود بخشیده‌اند. این مدل که بر روی ۸۰۰ اسکن مغزی با زمان‌های مشخص سکته آموزش دیده است، می‌تواند به‌طور مستقل نواحی آسیب‌دیده را در اسکن‌های CT شناسایی کرده و زمان سکته را تخمین بزند.

︎این مطالعه که در مجله "NPJ Digital Medicine" منتشر شده است، الگوریتم را بر روی داده‌های نزدیک به ۲۰۰۰ بیمار دیگر آزمایش کرده است. نرم‌افزار نشان داد که دقت آن دو برابر بیشتر از روش‌های تصویری استاندارد است و همچنین در تخمین "سن بیولوژیکی" آسیب مغزی موفق عمل کرده که نشان می‌دهد آسیب چقدر پیشرفت کرده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
👏4👌21🔥1🥰1
🆕️ تصویربرداری اپتوآکوستیک: روشی نوین برای بررسی دیابت

🩺 تغییرات در رگ‌های خونی کوچک یکی از عوارض شایع دیابت است. محققان دانشگاه فنی مونیخ (TUM) و موسسه هلماولتز مونیخ، روشی را توسعه داده‌اند که می‌تواند این تغییرات میکروواسکولار را در پوست اندازه‌گیری کرده و شدت بیماری را ارزیابی کند. این روش با ترکیب هوش مصنوعی و فناوری تصویربرداری اپتوآکوستیک با وضوح بالا به دست آمده است.

روش‌های تصویربرداری اپتوآکوستیک با استفاده از پالس‌های نوری، امواج اولتراسوندی را در بافت تولید می‌کنند. این امواج توسط سنسورها ضبط شده و به تصاویر تبدیل می‌شوند.

سیگنال‌ها ناشی از انبساط و انقباض‌های کوچک بافتی هستند که دور مولکول‌هایی که نور را به شدت جذب می‌کنند، قرار دارند. یکی از این مولکول‌ها هموگلوبین است که در رگ‌های خونی متمرکز است. به همین دلیل، تصویربرداری اپتوآکوستیک می‌تواند تصاویری دقیق و منحصر به فرد از رگ‌ها تولید کند که با روش‌های غیر تهاجمی دیگر امکان‌پذیر نیست.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#Medical_AI
👏21🔥1👌1
Intellimage ( intelligent image processing )
🆕️ تصویربرداری اپتوآکوستیک: روشی نوین برای بررسی دیابت 🩺 تغییرات در رگ‌های خونی کوچک یکی از عوارض شایع دیابت است. محققان دانشگاه فنی مونیخ (TUM) و موسسه هلماولتز مونیخ، روشی را توسعه داده‌اند که می‌تواند این تغییرات میکروواسکولار را در پوست اندازه‌گیری…
🖇 پیشرفت های تصویربرداری اپتوآکوستیک

پروفسور واسیلیس نزیاتکریستوس، رئیس گروه تصویربرداری بیولوژیکی در TUM، می‌گوید: «با RSOM، اکنون می‌توانیم به‌طور کمی اثرات دیابت را توصیف کنیم.» این روش به‌تازگی امکان‌پذیر شده است که RSOM به‌صورت قابل حمل و مقرون به صرفه باشد. این یافته‌ها راه جدیدی را برای پایش مداوم وضعیت بیش از ۴۰۰ میلیون نفر مبتلا به دیابت در سراسر جهان فراهم می‌آورد. در آینده، با انجام معاینات سریع و بدون درد، تنها در چند دقیقه می‌توان تعیین کرد که آیا درمان‌ها مؤثر هستند یا خیر، حتی در خانه.

مطالعات نشان می‌دهد که با ترکیب ۳۲ ویژگی مختلف پوست، می‌توان به ارتباط بین وضعیت رگ‌های خونی کوچک و شدت دیابت پی برد. این پیشرفت می‌تواند انقلابی در روش‌های پایش و درمان دیابت ایجاد کند و به بهبود کیفیت زندگی بیماران کمک کند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
#Medical_AI
👏21🔥1👌1
🆕️ پیشرفت‌های اخیر AI

︎اخیر OpenAI ابزار جدیدی به نام Deep Research را راه‌اندازی کرد که به پژوهشگران کمک می‌کند تا سریع‌تر و عمیق‌تر تحقیقات خود را انجام دهند. این ابزار AI-powered بسیار underrated است و تاثیر زیادی بر روند پژوهش خواهد گذاشت.

︎سایر مدلها نیز پیشرفت هایی داشته اند از جمله؛

۱.مدل Hugging Face نسخه‌ای از Deep Research را بازتولید کرد و ثابت کرد که حرکت‌های متن‌باز با سرعت در حال پیشرفت هستند.

۲.مدل Deep Research به عنوان یک دستیار پژوهشی قوی عمل می‌کند.

۳.مدل GitHub Copilot حالت Agent Mode را اضافه کرد و برنامه‌نویسی هوشمند را به جلو می‌برد.

۴.مدل Gemini 2.0 به‌صورت عمومی منتشر می‌شود و رقابت در بین مدل‌های AI را افزایش می‌دهد.

۵.مدل ChatGPT حافظه‌اش را افزایش داد و مکالمات را بیشتر هوشمند کرد.

۶.مدل Lyft، Claude AI را ادغام کرده و وظایف بیشتری را در خدمات مشتریانش خودکار کرده است.

۷. گوگل تبلیغ سوپر باول خود را بعد از یک اشتباه AI دوباره طراحی کرد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
🔥4👏21🥰1👌1
🌐 معرفی بهترین وبسایت ها برای پردازش تصویر

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
👌53👏2🔥1🥰1
🆕️ امکان استفاده از مدل‌های بزرگ برای همه!

📍اجرای مدل‌های بزرگی مثل DeepSeek-R1 با ۶۷۱ میلیارد پارامتر بر روی سخت‌افزارهای معمولی، تقریبا غیر ممکن به نظر می‌رسید.

اما تیم KVCache . AI با یک رویکرد نوین، این چالش را پشت سر گذاشته‌اند!
این تیم با استفاده از محاسبات ناهمگن (heterogeneous computing)، توانسته بخش‌هایی از پردازش را به CPU واگذار کند و به این ترتیب، مدل‌های بزرگ را روی کارت گرافیک‌هایی با حافظه ۲۴ گیگابایت مثل RTX 4090 اجرا کند.

• بخش‌های پراکنده مدل (MoE) روی حافظه رم (DRAM) و CPU قرار می‌گیرند.

• بخش‌های اصلی و پرکاربرد مدل روی GPU پردازش می‌شوند.

• با استفاده از کوانتیزاسیون ۴ بیتی، حافظه لازم برای اجرای مدل فقط ۲۴ گیگابایت است!

📥GitHub

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👌3👏21
🆕️ عصای Smart Cane با قابلیت‌های هوش مصنوعی برای نابینایان

شرکت WeWalk از نسخه جدید عصای نابینایان خود رونمایی کرده است که یکی از بهترین نمونه‌های استفاده از هوش مصنوعی را به‌نمایش می‌گذارد. این عصا قادر به شناسایی موانع بر سر راه کاربر است و از دستیار صوتی برای کمک به فرد بهره می‌برد.

عصای هوشمند WeWalk Smart Cane 2 با حسگرهای مختلف خود و قابلیت‌های هوش مصنوعی به نابینایان یا کم‌بینایان کمک می‌کند تا زندگی راحت‌تری داشته باشند. هم‌بنیان‌گذار WeWalk که خودش از بدو تولد نابینا بوده است، می‌گوید Smart Cane 2 می‌تواند حرکت را ساده‌تر و ایمن‌تر کند و قابلیت‌هایی مثل مسیریابی نقطه‌به‌نقطه و تشخیص موانع را ارائه کند.

این عصای پیشرفته از دستیار صوتی مبتنی بر ChatGPT بهره می‌برد تا در لحظه اطلاعات لازم را در اختیار کاربر بگذارد و حتی نیازی به بیرون آوردن موبایل از جیب یا کیف وجود نداشته باشد. دسته این عصا نسبت به نسل قبلی باریک‌تر شده است تا راحت‌تر بتوان آن را در دست گرفت.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#Medical_AI
👏31🔥1
Intellimage ( intelligent image processing )
🆕️ معرفی مدل جدید مولتی مدال در ورودی و خروجی از DeepSeek به نام Janus https://github.com/deepseek-ai/Janus
🆕️ معرفی سری Janus از DeepSeek

📉 سری Janus نسل جدیدی از مدل‌های هوش مصنوعی است که به منظور کار با داده‌های متنوعی نظیر متن، تصویر و ترکیب این دو طراحی شده است. این مدل‌ها به گونه‌ای ساخته شده‌اند که قادرند هر نوع ورودی (متن یا تصویر) را دریافت کرده و هر نوع خروجی (متن یا تصویر) تولید نمایند. به همین دلیل، به این مدل‌ها اصطلاحاً مدل‌های "any-to-any" اطلاق می‌شود که به معنای تبدیل هر چیزی به هر چیزی است.

📉 نسخه پیشرفته‌ی این سری: Janus-Pro
این نسخه با سه بهبود اصلی ارائه شده است:

۱. استراتژی آموزشی بهینه‌شده: فرآیند یادگیری مدل را دقیق‌تر کرده است.

۲. اضافه شدن داده‌های بیشتر: توانایی مدل را افزایش داده است.

۳. بزرگ‌تر شدن ابعاد مدل: عملکرد آن در درک و تولید تصویر از متن را به طور قابل توجهی تقویت کرده است.

📉 نتیجه این پیشرفت‌ها، توانمندی بسیار بالای Janus-Pro در درک و تولید داده‌های چندرسانه‌ای (Multimodal) است و حتی در تولید تصویر از متن، پایداری بالایی را نشان می‌دهد.

📉 نسخه اصلی، یعنی Janus، دارای یک معماری جالب و هوشمندانه می‌باشد. این مدل پردازش تصویر را از سایر وظایف جدا کرده است، اما همچنان با یک معماری یکپارچه‌ی ترانسفورمر تمامی جنبه‌ها را مدیریت می‌کند. این طراحی باعث شده است که مدل در هر دو بخش درک و تولید، بسیار منعطف و کارآمد باشد و حتی از مدل‌های تخصصی موجود در این زمینه پیشی بگیرد.

📉 مدل دیگری که در این سری وجود دارد، JanusFlow نام دارد که ایده‌ای نوآورانه را اجرایی کرده است: ترکیب مدل‌های اتورگرسیو با روشی پیشرفته به نام Rectified Flow. این ترکیب به سادگی و به طور مؤثری انجام شده است و نیازی به پیچیدگی خاصی ندارد. نتیجه این تلاش، مدلی است که هم قادر به تولید تصویر می‌باشد و هم در زمینه‌های چندرسانه‌ای عملکردی برتر از سایر مدل‌های موجود را ارائه می‌دهد.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#AI_news
👏31🔥1👌1
🆕️ تحقیق فوق‌العاده و هیجان انگیز متا: ارتباط مستقیم بین مغز و نوشتار!

خبر هیجان‌انگیز از مرکز BCBL! متا به تازگی با همکاری این مرکز، قدم بزرگی در زمینه ارتباط بین مغز و نوشتار برداشته است. در این تحقیق، ۳۵ داوطلب در حین تایپ جملات، تحت نظر قرار گرفتند و فعالیت‌های مغزی آن‌ها با استفاده از دستگاه‌های MEG و EEG ضبط شد.

پژوهشگران با بهره‌گیری از هوش مصنوعی، تلاش کردند تا با تحلیل سیگنال‌های مغزی این افراد، جملات را دوباره بسازند. نتایج شگفت‌انگیز بود! آن‌ها موفق شدند تا ۸۰ درصد از حروف را به درستی تشخیص دهند که این عملکرد دو برابر سیستم‌های EEG معمولی است!

این دستاورد جدید، ادامه‌ای بر کارهای قبلی متا در کشف راز ادراک تصاویر و صدا از مغز است و حالا به مرحله تولید جملات رسیده. موفقیت این پروژه می‌تواند درب‌های تازه‌ای را برای ایجاد واسط‌های مغز و کامپیوتر باز کند و آینده‌ای نویدبخش برای ارتباطات انسان‌ها رقم بزند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#machin_vision
👏3👌21
🔍 نقش AI در تشخیص‌های رادیولوژیک

هوش مصنوعی (AI) پتانسیل حمایت از تشخیص‌ها در رادیولوژی را دارد. با این حال، کمبود شفافیت در بسیاری از موارد، فهم توصیه‌های AI را دشوار کرده است. محققان بررسی کرده‌اند که آیا و چگونه نمایش‌های بصری استفاده شده در تحلیل تصاویر AI ، که به آن‌ها نقشه‌های برجستگی (saliency maps) گفته می‌شود ، می‌توانند کمک کنند.

فرآیند تصمیم‌گیری AI باید به اندازه کافی شفاف باشد تا پزشکان بتوانند بهترین ارزیابی را از اینکه چقدر می‌توانند به توصیه‌های AI اعتماد کنند، داشته باشند. این مسئله تا کنون دشوار بوده است.

می‌توان نقشه‌ای برای هر توصیه‌ای که سیستم AI ارائه می‌دهد ایجاد کرد که نشان دهد کدام بخش‌های تصویر در فرآیند تصمیم‌گیری لحاظ شده‌اند. این نقشه‌ها، که به آن‌ها نقشه‌های برجستگی گفته می‌شود، مناطق داخل یک تصویر را نشان می‌دهند که شبکه عصبی بر اساس آن‌ها پیش‌بینی کرده است.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
👌3👏21🔥1🥰1
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی

🩻 رادیولوژیست‌ها از نرم‌افزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده می‌کنند. این نرم‌افزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکس‌های X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شده‌اند.

🩻 این نرم‌افزارها کمک می‌کنند تا رادیولوژیست‌ها بتوانند به بهترین شکل ممکن به تحلیل تصاویر بپردازند و در تشخیص بیماری‌ها دقیق‌تر عمل کنند.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
👏3👌31🔥1
Intellimage ( intelligent image processing )
📊 نرم افزار های کاربردی در پردازش تصاویر پزشکی 🩻 رادیولوژیست‌ها از نرم‌افزارهای مختلفی برای پردازش و تحلیل تصاویر پزشکی استفاده می‌کنند. این نرم‌افزارها عمدتاً برای تجزیه و تحلیل تصاویر رادیولوژیک مانند عکس‌های X-ray، CT اسکن، MRI، و اولتراسونیک طراحی شده‌اند.…
🖇 معرفی نرم افزار های کاربردی در پردازش تصاویر پزشکی

۱.نرم افزار OsiriX: یک نرم‌افزار محبوب برای مشاهده و پردازش تصاویر پزشکی، به‌ویژه برای تصاویر MRI و CT. این نرم‌افزار مخصوص macOS است و قابلیت‌ تجزیه و تحلیل تصاویر سه‌بعدی را دارد.

۲.نرم افزار RadiAnt DICOM Viewer: نرم‌افزاری برای مشاهده تصاویر DICOM که به رادیولوژیست‌ها کمک می‌کند تا به سرعت تصاویر را بارگذاری و تحلیل کنند.

۳.نرم افزار 3D Slicer: یک نرم‌افزار منبع باز برای تجزیه و تحلیل تصاویر پزشکی و پردازش داده‌های سه‌بعدی. این نرم‌افزار امکانات پیشرفته‌ای برای تجزیه و تحلیل و ساخت تصاویر سه‌بعدی دارد.

۴.نرم افزار Philips IntelliSpace Portal: این نرم‌افزار یک پلتفرم جامع برای پردازش تصاویر پزشکی است که به رادیولوژیست‌ها امکان می‌دهد تا تصاویر را تجزیه و تحلیل و نتایج را به راحتی به اشتراک بگذارند.

۵.نرم افزار Siemens syngo.plaza: نرم‌افزاری از شرکت زیمنس که ابزاری قوی برای پردازش و تحلیل تصاویر پزشکی ارائه می‌دهد و به رادیولوژیست‌ها امکان مدیریت و تجزیه و تحلیل تصاویر را می‌دهد.

۶.نرم افزار  GE Healthcare Centricity: یک نرم‌افزار که به رادیولوژیست‌ها کمک می‌کند تا تصویربرداری‌های پزشکی را مدیریت و تحلیل کنند و امکاناتی برای بهبود کارایی در جریان کار را فراهم می‌کند.

۷.نرم افزار MIM Software: یک نرم‌افزار تخصصی برای بخش بندی و تحلیل تصاویر پزشکی، که به خصوص در رادیوتراپی و اتوماسیون فرآیندهای بالینی کاربرد دارد.

🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#software
👌5👏21🔥1🥰1
📚 مدل‌های استدلالی (Reasoning Models) چیستند و چگونه ساخته می‌شوند؟

• این روزها نام مدل‌های استدلالی مثل DeepSeek R1 را زیاد می‌شنوید. اگر هنوز با مفهوم و کاربرد این مدل‌ها آشنا نیستید، با ما همراه باشید تا از insights آقای سباستین راشکا (نویسنده کتاب "Build a Large Language Model From Scratch") بهره‌مند شوید. نظریه ایشان در بررسی مدل‌های استدلالی قابل تامل است.

• تعریف مدل استدلالی: این مدل‌ها برای حل سوالات پیچیده و چندمرحله‌ای طراحی شده‌اند. به عنوان مثال، حل یک سوال فیزیک یا ریاضی نیاز به استدلال دارد، در حالی که سوالاتی ساده مانند "پایتخت فرانسه کجاست؟" به این مدل‌ها نیازی ندارند.

• مواقع مناسب استفاده: این مدل‌ها در مواردی که نیاز به سرعت و هزینه پایین داریم یا سوالات دانشی داریم، کارایی ندارند. همچنین، برای سوالات ساده نیز مناسب نیستند زیرا ممکن است بیش از حد فکر کنند!

• مدل DeepSeek R1 شامل سه بخش اصلی است: DeepSeek-R1-Zero ، DeepSeek-R1 و DeepSeek-R1-Distill.

• روش‌های ساخت و بهبود مدل‌های استدلالی: چهار روش اصلی برای تولید این مدل‌ها معرفی شده است:

  ۱.روش Inference-time scaling

  ۲.روش RL خالص

  ۳.روش SFT + RL

  ۴.روش SFT خالص با Distillation

• نکات کلیدی درباره R1: R1 بهینه‌تر و ارزان‌تر از O1 است، زیرا دیپ‌سیک بیشتر بر روی آموزش مدل وقت گذاشته است.

• توسعه مدل‌های استدلالی با بودجه کم:معمولا اگر بودجه محدود باشد ، روش Distillation مدنظر قرار می‌گیرد . طبق اطلاعات ارائه شده، این روش می‌تواند با هزینه‌ای بسیار کم، نتایج خوبی ارائه دهد.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
👏3🔥21🥰1👌1
🆕️تشخیص چهره از ۱۰۰ کیلومتری؛ چین قوی‌ترین دوربین جاسوسی جهان را معرفی کرد!

• دانشمندان چینی با استفاده از فناوری لیزر پیشرفته موفق به ساخت دوربینی شدند که می‌تواند جزئیات میلی‌متری را از فاصله ۱۰۰ کیلومتری ثبت کند و ماهواره‌ها را در مدار شناسایی کند. این دستاورد قبلاً غیرممکن به نظر می‌رسید اما این سیستم جدید لایدار (LIDAR) می‌تواند برای شبیه‌سازی دقیق نقشه‌ها و نیز نظارت‌های نظامی استفاده شود.

• در این آزمایش، سیستم لایدار با دقت خارق‌العاده‌ای توانست جزئیات اجسام را تا اندازه ۱.۷ میلی‌متر از فاصله ۱۰۱.۸ کیلومتری تشخیص دهد. این تکنولوژی که توانست دقت اندازه‌گیری فواصل را به ۱۵.۶ میلی‌متر برساند، ۱۰۰ برابر بهتر از دوربین‌های جاسوسی و تلسکوپ‌های مبتنی‌بر لنزهای معمولی عمل کرد.

• پیشرفت‌های این سیستم نتیجه استفاده از یک لیزر ۱۰۳ وات، پردازش بی‌درنگ داده‌ها، الگوریتم‌های تطبیقی برای کاهش نویز نور لیزر و دهانه نوری بزرگ است. این فناوری به محققان اجازه می‌دهد نه‌فقط ماهواره را مشاهده کنند، بلکه به‌وضوح شماره سریال آن را نیز بخوانند.
🆔️ telegram channel:
https://news.1rj.ru/str/Intellimage
#image_processing
#AI_news
🔥62👏2👌2🥰1