Forwarded from School of AI (Hamidreza Hosseinkhani)
گوگل نامِ TensorFlow Lite را به LiteRT تغییر داد.
درابتدا، TFLite نسخهای سبک از مدلهای تنسورفلو برای اجرا روی دستگاههای موبایل بود.
اما در ادامه تبدیل به یک runtime عمومی برای اجرای مدلهای یادگیری ماشین نوشتهشده توسط TensorFlow و Keras و Pytorch و JAX برروی دستگاههای Edge از جمله موبایلهای اندرویدی و iOS و همینطور Embedded Devices شد.
نام جدید، بیانگر ویژن جدید این محصولست.
https://developers.googleblog.com/en/tensorflow-lite-is-now-litert/?linkId=10850223
درابتدا، TFLite نسخهای سبک از مدلهای تنسورفلو برای اجرا روی دستگاههای موبایل بود.
اما در ادامه تبدیل به یک runtime عمومی برای اجرای مدلهای یادگیری ماشین نوشتهشده توسط TensorFlow و Keras و Pytorch و JAX برروی دستگاههای Edge از جمله موبایلهای اندرویدی و iOS و همینطور Embedded Devices شد.
نام جدید، بیانگر ویژن جدید این محصولست.
https://developers.googleblog.com/en/tensorflow-lite-is-now-litert/?linkId=10850223
❤2👍2
Tensorflow(@CVision)
مدیر اجرایی سامسونگ توی رویداد CEO summit که اخیرا برگذار شد افشا کرد که gpt 5 بیش از ۳ و نیم تریلیون پارامتر داره و نسبت به مدل قبلی بارها هوشمند تره. به نظر تمرکز همچنان روی حفظ بخش عظیمتر داده های اینترنت توسط مدل های بزرگ هست
توی دقیقه ۲۷ این گفتگو آندری کارپاتی میگه:
https://youtu.be/hM_h0UA7upI
Ray Kurzweil
میگه:
https://www.azquotes.com/quote/847331
مدلهای هوشمند نسل اینده به طرز شگفتآوری کوچک هستن و باور داره که مدلهای فعلی ظرفیت زیادی رو صرف یادآوری چیزهایی میکنن که مهم نیستن، از طرفی مجموعه دادهها به بهترین شکل انتخاب نشدن.
میگه ما باید به هسته شناختی برسیم و به نظرم این هسته شناختی میتونه بسیار کوچیک باشه. این هسته چیزیه که فکر میکنه و اگر نیاز به جستجوی اطلاعات داشته باشه، میدونه چطوری از ابزارهای مختلف استفاده کنه. میگه بنظر من حتی مدلی با یک میلیارد پارامتر هم کافیه.(برگرفته شده از تقطیر دانش مدل های بزرگتر)
https://youtu.be/hM_h0UA7upI
Ray Kurzweil
میگه:
در بین اندامهای مغز، فقط یک بخش برای درک و بیان فرآیندهای منطقی بهینه شده و اون لایه بیرونی مغز که قشر مخ نام داره. این بخش تکاملیافته، برخلاف بقیه مغز، نسبتاً تخته و ضخامت اون تنها حدود ۰٫۳۲ سانتیمتر و شامل ۶ میلیون نورون میشه. این اندام پیچدرپیچ، اون توانایی رو که برای درک کارها و خودمان داریم، رو به ما میده
https://www.azquotes.com/quote/847331
YouTube
No Priors Ep. 80 | With Andrej Karpathy from OpenAI and Tesla
Andrej Karpathy joins Sarah and Elad in this week of No Priors. Andrej, who was a founding team member of OpenAI and the former Tesla Autopilot leader, needs no introduction. In this episode, Andrej discusses the evolution of self-driving cars, comparing…
👍26❤2
مدل متن باز Reflection 70B معرفی شد، و ادعا میشه بهترین مدل اوپن سورس جهان باشه!
این مدل با استفاده از تکنیک Reflection-Tuning آموزش دیده، تکنیکی که به مدلهای زبانی بزرگ اجازه میده تا اشتباهات خودشون رو اصلاح کنن
مدل 405B هفته آینده منتشر خواهد شد و انتظار میره که این مدل بهترین مدل در جهان باشه
دمو:
https://reflection-playground-production.up.railway.app/
دانلود:
https://huggingface.co/mattshumer/Reflection-70B
این مدل با استفاده از تکنیک Reflection-Tuning آموزش دیده، تکنیکی که به مدلهای زبانی بزرگ اجازه میده تا اشتباهات خودشون رو اصلاح کنن
مدل 405B هفته آینده منتشر خواهد شد و انتظار میره که این مدل بهترین مدل در جهان باشه
دمو:
https://reflection-playground-production.up.railway.app/
دانلود:
https://huggingface.co/mattshumer/Reflection-70B
huggingface.co
mattshumer/Reflection-Llama-3.1-70B · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤15👍5🔥5🙏1👌1
Tensorflow(@CVision)
مدل متن باز Reflection 70B معرفی شد، و ادعا میشه بهترین مدل اوپن سورس جهان باشه! این مدل با استفاده از تکنیک Reflection-Tuning آموزش دیده، تکنیکی که به مدلهای زبانی بزرگ اجازه میده تا اشتباهات خودشون رو اصلاح کنن مدل 405B هفته آینده منتشر خواهد شد و انتظار…
لازم به ذکره Reflection 70B حتی در برابر پیشرفتهترین مدلهای متن بسته (مانند Claude 3.5 Sonnet و GPT-4o) نیز عملکرد بسیار خوبی داره و بهترین مدل زبانی بزرگ در حداقل آزمونهای MMLU، MATH، IFEval و GSM8K هست و در تمام معیارهای ارزیابی شده، GPT-4o رو شکست میده، به صورتی که عملکرد Llama 405B حتی به این مدل نزدیک نیست!
مدلهای زبانی بزرگ کنونی، تمایل به توهمزنی دارن و نمیتونن زمانی که این کار رو دارن انجام میدن تشخیص بدن.
در زمینه هوش مصنوعی، وقتی میگیم یه مدل زبانی بزرگ (LLM) "توهم میزنه"، به این معنیه که اون مدل اطلاعاتی رو تولید میکنه که با واقعیت مطابقت نداره. به عبارت دیگه، مدل اطلاعاتی رو ایجاد میکنه که گویی واقعی هستن، در حالی که در واقع ساخته ذهن خود مدله.
برای مثال: اگه از یه مدل زبانی بپرسین که اولین انسان روی ماه چه کسی بود و مدل به شما یک نام جعلی بده، در این صورت مدل در حال توهم زدنه.
اما Reflection-Tuning به مدلهای زبانی بزرگ اجازه میده تا اشتباهات خودش رو تشخیص بدن و قبل از ارائه پاسخ، اونها رو تصحیح کنن
جزییات و مقاله هفته آینده منتشر میشه و بیشتر در مورد اون خواهیم نوشت
مدلهای زبانی بزرگ کنونی، تمایل به توهمزنی دارن و نمیتونن زمانی که این کار رو دارن انجام میدن تشخیص بدن.
در زمینه هوش مصنوعی، وقتی میگیم یه مدل زبانی بزرگ (LLM) "توهم میزنه"، به این معنیه که اون مدل اطلاعاتی رو تولید میکنه که با واقعیت مطابقت نداره. به عبارت دیگه، مدل اطلاعاتی رو ایجاد میکنه که گویی واقعی هستن، در حالی که در واقع ساخته ذهن خود مدله.
برای مثال: اگه از یه مدل زبانی بپرسین که اولین انسان روی ماه چه کسی بود و مدل به شما یک نام جعلی بده، در این صورت مدل در حال توهم زدنه.
اما Reflection-Tuning به مدلهای زبانی بزرگ اجازه میده تا اشتباهات خودش رو تشخیص بدن و قبل از ارائه پاسخ، اونها رو تصحیح کنن
جزییات و مقاله هفته آینده منتشر میشه و بیشتر در مورد اون خواهیم نوشت
👍16❤2🔥2🤔1
Tensorflow(@CVision)
لازم به ذکره Reflection 70B حتی در برابر پیشرفتهترین مدلهای متن بسته (مانند Claude 3.5 Sonnet و GPT-4o) نیز عملکرد بسیار خوبی داره و بهترین مدل زبانی بزرگ در حداقل آزمونهای MMLU، MATH، IFEval و GSM8K هست و در تمام معیارهای ارزیابی شده، GPT-4o رو شکست میده،…
متد جدیدی که در این کار ارایه شده بسیار حائز اهمیته و به مدلهای زبانی اجازه میده تا خودشون رو بهبود بدن. این به معنای کاهش وابستگی به دادههای آموزشیه که یکی از چالشهای اصلی در توسعه مدلهای زبانی این روزهاست
این روش شبیه به نحوه عملکرد AlphaZero هست. Demis Hassabis نیز مدتیه در مورد ترکیب بازی خودکار با مدلهای زبانی بزرگ صحبت میکنه. نکات ارزشمندی رد و بدل میشه
https://youtu.be/eqXfhejDeqA?feature=shared
این روش شبیه به نحوه عملکرد AlphaZero هست. Demis Hassabis نیز مدتیه در مورد ترکیب بازی خودکار با مدلهای زبانی بزرگ صحبت میکنه. نکات ارزشمندی رد و بدل میشه
https://youtu.be/eqXfhejDeqA?feature=shared
🔥5❤1👍1
Forwarded from 🚀 کلاسویژن | یادگیری هوش مصنوعی از پایه تا پیشرفته
📢فردا، دوشنبه ۱۹ شهریور
اولین جلسه آنلاین دوره یادگیری عمیق است،
دوستانی که ثبت نام کردند اما پیامک عضویت در گروه کلاس را دریافت نکردهاند لطفاً حتماً به پشتیبانی پیام دهند.
📞@classvision_support
اولین جلسه آنلاین دوره یادگیری عمیق است،
دوستانی که ثبت نام کردند اما پیامک عضویت در گروه کلاس را دریافت نکردهاند لطفاً حتماً به پشتیبانی پیام دهند.
📞@classvision_support
👍5❤2
Forwarded from School of AI (Hamidreza Hosseinkhani)
مجلهی مشهور TIME نام ایلان ماسک، موسس شرکتهای Tesla و SpaceX و Neuralink و همبنیانگزار OpenAI را از لیست ۱۰۰ چهرهی تاثیرگزار در دنیای AI حذف کرد 😂
بااینحال اسکارلت جانسون، هنرپیشهی فیلمهای هالیوودی و صداپیشهی فیلم Her همچنان در این لیست قرار دارد. 🤔
بسیاری این تصمیم رو ناشی از سوگیریهای سیاسی این مجله و مرتبط با حمایتهای اخیر ماسک از Trump عنوان کردهاند.
بااینحال اسکارلت جانسون، هنرپیشهی فیلمهای هالیوودی و صداپیشهی فیلم Her همچنان در این لیست قرار دارد. 🤔
بسیاری این تصمیم رو ناشی از سوگیریهای سیاسی این مجله و مرتبط با حمایتهای اخیر ماسک از Trump عنوان کردهاند.
😁31👍10🤔3❤2🤯1
گوگل لبز درحال توسعه ابزاری به اسم Illuminate هست که مقالات علمی را به بحثهای صوتی در قالب پادکست توسط هوش مصنوعی تبدیل میکند. این پروژه برای تولید خلاصه مقاله و در قالب پرسش و پاسخ از مدل زبانی گوگل Gemini استفاده میکند که توسط ویس های مختلف، یک مصاحبهگر مرد و یک متخصص زن ، به گفت و گو و بحث در مورد مقاله میپردازند. Illuminate در مرحله بتا هست و از لینک زیر هم برای لیست انتظار میتونید ثبت نام کنید:
http://illuminate.google.com
http://illuminate.google.com
🔥29👍7🙏3🤯2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
این مدل ویدیویی مبتنی بر هوش مصنوعی، از طریق متن، ویدیوهای باکیفیت 6 ثانیه ای با رزولوشن 720p و سرعت 25 فریم در ثانیه تولید می کنه و یه راه حل سریع و کارآمد برای ایجاد محتوای ویدیویی جذابه
دو تا سرباز هخامنشی ایران باستان رو در نظر بگیرین که در حال بازی کردن سوپر ماریو هستن
Two Achaemenid soldiers with ancient Persian battle attire are playing Super Mario
https://hailuoai.com/
دو تا سرباز هخامنشی ایران باستان رو در نظر بگیرین که در حال بازی کردن سوپر ماریو هستن
Two Achaemenid soldiers with ancient Persian battle attire are playing Super Mario
https://hailuoai.com/
❤14👍2
مدل جدید OpenAI o1-preview معرفی شد که یه سری از مدلهای هوش مصنوعی برای حل مسائل پیچیدست. این مدلها با تمرکز بیشتر روی استدلال و تحلیل، میتونن وظایف دشوار در زمینههای علمی، برنامهنویسی و ریاضی رو بهتر حل کنن.
این مدلها هنوز برخی ویژگیهای ChatGPT، مانند جستجوی وب و آپلود فایل را ندارن، اما برای وظایف استدلال پیچیده پیشرفتی قابلتوجه به حساب میاد.
https://openai.com/index/introducing-openai-o1-preview/
این مدلها هنوز برخی ویژگیهای ChatGPT، مانند جستجوی وب و آپلود فایل را ندارن، اما برای وظایف استدلال پیچیده پیشرفتی قابلتوجه به حساب میاد.
https://openai.com/index/introducing-openai-o1-preview/
Openai
Introducing OpenAI o1
👍9
Tensorflow(@CVision)
مدل جدید OpenAI o1-preview معرفی شد که یه سری از مدلهای هوش مصنوعی برای حل مسائل پیچیدست. این مدلها با تمرکز بیشتر روی استدلال و تحلیل، میتونن وظایف دشوار در زمینههای علمی، برنامهنویسی و ریاضی رو بهتر حل کنن. این مدلها هنوز برخی ویژگیهای ChatGPT،…
Audio
به اینجا رسیدیم با اوپناِیآی اُو۱
یه مدل تازه، هوشمند و نو
حالا بیشتر فکر میکنه، قبل از جواب
همه چیز رو میسنجه، دقیق و حساب
خبر تازه داریم، از او۱ و تلاش
پژوهش و محصول، پیشرفت و فراش
جهان هوش مصنوعی، درگیر و دلفریب
با او۱ میریم به آینده، نزدیک و عجیب
Low Beat😁
یه مدل تازه، هوشمند و نو
حالا بیشتر فکر میکنه، قبل از جواب
همه چیز رو میسنجه، دقیق و حساب
خبر تازه داریم، از او۱ و تلاش
پژوهش و محصول، پیشرفت و فراش
جهان هوش مصنوعی، درگیر و دلفریب
با او۱ میریم به آینده، نزدیک و عجیب
Low Beat😁
😁12👍1😱1
Tensorflow(@CVision)
مدل جدید OpenAI o1-preview معرفی شد که یه سری از مدلهای هوش مصنوعی برای حل مسائل پیچیدست. این مدلها با تمرکز بیشتر روی استدلال و تحلیل، میتونن وظایف دشوار در زمینههای علمی، برنامهنویسی و ریاضی رو بهتر حل کنن. این مدلها هنوز برخی ویژگیهای ChatGPT،…
This media is not supported in your browser
VIEW IN TELEGRAM
یک مثال بسیار جالب از قابلیت های O1 برای مصور سازی آموزش مکانیسم اتنشن به دانشجویان که قابلیت های برنامه نویسی مدل جدید رو به تصویر میکشه.
در این ویدئو یه مثال عملی از مدل جدید openai برای بهبود فرایند تدریس نشون داده میشه. اینجا گوینده به دنبال ایجاد ابزارهای تعاملی برای آموزش مکانیزمهای پیچیدای مثل "Self-attention" در ترانسفورمرها ست. هدف اصلی ایشون، توسعه ابزارهای تعاملی و مصورسازی برای فهم بهتر دانشجویان از این مفاهیم پیچیده ست. اشاره میکنه که مدل جدید میتونه با دقت بیشتری به دستورالعملهای پیچیده پاسخ بده و ابزارهای کارآمدتری رو ایجاد کنه.
در این ویدئو یه مثال عملی از مدل جدید openai برای بهبود فرایند تدریس نشون داده میشه. اینجا گوینده به دنبال ایجاد ابزارهای تعاملی برای آموزش مکانیزمهای پیچیدای مثل "Self-attention" در ترانسفورمرها ست. هدف اصلی ایشون، توسعه ابزارهای تعاملی و مصورسازی برای فهم بهتر دانشجویان از این مفاهیم پیچیده ست. اشاره میکنه که مدل جدید میتونه با دقت بیشتری به دستورالعملهای پیچیده پاسخ بده و ابزارهای کارآمدتری رو ایجاد کنه.
👌17🔥5👍3❤2
صحبت های چند ماه پیش Andrew Ng در مورد تحولات آینده و توسعه هوش مصنوعی با امکانات ارایه شده در مدل جدید openai O1 کاملا همخوانی داره.
به طور خلاصه در ویدیو میگه:
یک نمونه دیگه:
مقاله google deepmind هست که در ماه آگوست منتشر شد. این مقاله به بررسی این موضوع میپردازه که اگه به یه مدل زبانی بزرگ (LLM) زمان بیشتری برای استنتاج داده شه تا به پاسخ برسه، این مدل میتونه به عملکردی برسه که با مدلی 14 برابر بزرگتر از اون برابره:
https://arxiv.org/abs/2408.03314
به طور خلاصه در ویدیو میگه:
مدل های بزرگ زبانی کنونی، معمولا با وارد کردن یه پرسش یا درخواست، پاسخی رو ارائه میدن. اما در مدلهای جدیدتر، فرآیند پاسخدهی به صورت تکراری و بازخوردی طراحی شده، به این صورت که سیستم هوش مصنوعی میتوانه به صورت مداوم به اصلاح و بهبود پاسخ بپردازه. این روند به نام agentic workflows شناخته میشه.https://youtu.be/sal78ACtGTc?feature=shared
ایشون بیان میکنه که با استفاده از این مدلهای تعاملی، نتایج بهتری حاصل میشه و مثالی از برنامهنویسی ارائه میدهه که در اون سیستمهای هوش مصنوعی جدید با بازبینی و اصلاح کدهای خود، عملکردی بهتر از سیستمهای پیشرفتهتر دارن.
همچنین میگه که استفاده از ابزارهایی مانند reflection و multi-agent collaboration بهزودی در توسعه برنامههای هوش مصنوعی نقش مهمی ایفا خواهند کرد.
در آخر هم پیشبینی میکنه که این نوع سیستمها به پیشرفتهای بزرگی در عملکرد و قابلیتهای هوش مصنوعی منجر خواهد شد و استفاده از اونها در کارهای پیچیدهای مثل تحقیق و توسعه بسیار کارآمد خواهد بود.
یک نمونه دیگه:
مقاله google deepmind هست که در ماه آگوست منتشر شد. این مقاله به بررسی این موضوع میپردازه که اگه به یه مدل زبانی بزرگ (LLM) زمان بیشتری برای استنتاج داده شه تا به پاسخ برسه، این مدل میتونه به عملکردی برسه که با مدلی 14 برابر بزرگتر از اون برابره:
https://arxiv.org/abs/2408.03314
YouTube
What's next for AI agentic workflows ft. Andrew Ng of AI Fund
Andrew Ng, founder of DeepLearning.AI and AI Fund, speaks at Sequoia Capital's AI Ascent about what's next for AI agentic workflows and their potential to significantly propel AI advancements—perhaps even surpassing the impact of the forthcoming generation…
👍6🔥4
Tensorflow(@CVision)
صحبت های چند ماه پیش Andrew Ng در مورد تحولات آینده و توسعه هوش مصنوعی با امکانات ارایه شده در مدل جدید openai O1 کاملا همخوانی داره. به طور خلاصه در ویدیو میگه: مدل های بزرگ زبانی کنونی، معمولا با وارد کردن یه پرسش یا درخواست، پاسخی رو ارائه میدن. اما…
This media is not supported in your browser
VIEW IN TELEGRAM
این یه نمونه آزمایشگاهی جالب متن باز استفاده از Llama-3.1 و Groq برای ایجاد زنجیره استدلال مشابه o1 هست.
این روش به مدل اجازه میده تا فکر کنه و مسائل رو با بکارگیری مدل های بزرگتر پیشرو به صورت منطقی حل کنه. برخلاف o1، اینجا همه توکنهای استدلال نمایش داده میشن.
https://github.com/bklieger-groq/g1
این روش به مدل اجازه میده تا فکر کنه و مسائل رو با بکارگیری مدل های بزرگتر پیشرو به صورت منطقی حل کنه. برخلاف o1، اینجا همه توکنهای استدلال نمایش داده میشن.
https://github.com/bklieger-groq/g1
👍7
Audio
چطور زنجیرهی تفکر(chain of thoughtیا COT) ترانسفورمرها رو برای حل مشکلات ذاتی سریالی توانمند میکنه
لینک مقاله:
https://arxiv.org/abs/2402.12875
پادکست تولید شده توسط notebooklm
لینک مقاله:
https://arxiv.org/abs/2402.12875
پادکست تولید شده توسط notebooklm
👍7
انویدیا با تمرکز بر مدلهای پایه برای رباتهای انساننما، قصد داره رباتهای هوشمندی رو وارد زندگی روزمره کنه که ممکنه در دهه آینده نحوه زندگی و کار ما رو به طور اساسی تغییر بده.
در این ویدئو جیم فن (یکی از محققین ارشد انویدیا) به چندین موضوع مهم مرتبط با آینده رباتیک، هوش مصنوعی و آزمایشگاه هوش تجسمی انویدیا میپردازه که به صورت خلاصه نکات کلیدی رو به صورت خلاصه در ادامه میارم:
به نقل از جنسن هوانگ، مدیر عامل انویدیا، میگه که
این پیشبینی بر چشمانداز آینده ای تاکید داره که رباتها، بهویژه رباتهای هوشمند و انساننما، در ده سال آینده به اندازه گوشیهای هوشمند فراگیر میشن. تلاشهای کنونی انویدیا نیز در راستای همین رونده و بر روی ایجاد یه پلتفرم محاسباتی برای رباتهای انساننما تمرکز داره
انویدیا پروژه ای به نام Groot رو راه اندازی کرده وهدف این پروژه توسعه مدلهای هوش مصنوعی پایه برای رباتهای انساننما ست. این پروژه حول محور ایجاد "AI brain" برای رباتهای انساننما میچرخه و از نقاط قوت انویدیا در زمینه شبیهسازی و قدرت محاسباتی بهره میبره.
میگه یکی از چالشهای عمده در توسعه هوش مصنوعی برای رباتیک، در دسترس نبودن دادههای باکیفته. دادههای موجود در مقیاس اینترنت، دادههای واقعی رباتها و دادههای شبیهسازی شده هر یک دارای نقاط قوت و ضعف خاص خود هستن و کلید پیشرفت در رباتیک، استفاده موثر از این منابع داده به صورت ترکیبیه. نبود دادههای کنترل حرکتی از منابع آنلاین پیشرفت رو محدود میکنه، بنابراین شبیهسازی به عنوان ابزاری حیاتی، برای تولید دادههای لازم برای آموزش رباتها به کار میره
همچنین در مورد شباهتهای بین انقلاب GPT-3 در پردازش زبان طبیعی و پتانسیل یک جهش مشابه در رباتیک صحبت میکنه و معتقده که لحظه مشابه GPT-3 زمانی برای رباتیک زمانی اتفاق میفته که مدلهای هوش مصنوعی بتونن بطور عمومی مهارت های حرکتی (motor actions) مثل باز کردن در رو در سناریوهای واقعی و مختلف رو انجام بدن. این امر نیازمند پیشرفتهای قابل توجهی در هر دو سیستم سطح پایین (کنترل حرکتی) و سیستم سطح بالا (استدلال و برنامهریزی) هوش مصنوعه
یکی از دلایلی که انویدیا روی رباتهای انسان نما تمرکز داره اینه که این رباتها به بهترین شکل میتونن با دنیای موجود که برای انسانها طراحی شده، تعامل کنن. از نظر اقتصادی، رباتهای انسان نما میتونن صنایع مختلفی مانند بهداشت و درمان، مراقبت از سالمندان و تولید رو با انجام کارهایی مثل پخت و پز، تمیز کردن یا کار در کارخانه متحول کنن. با این حال، علاوه بر پیشرفتهای فنی، عواملی مثل هزینه، ایمنی و مقررات تعیین کننده این اصله که این رباتها با چه سرعتی به جریان اصلی زندگی وارد خواهند شد.
https://youtu.be/yMGGpMyW_vw?feature=shared
در این ویدئو جیم فن (یکی از محققین ارشد انویدیا) به چندین موضوع مهم مرتبط با آینده رباتیک، هوش مصنوعی و آزمایشگاه هوش تجسمی انویدیا میپردازه که به صورت خلاصه نکات کلیدی رو به صورت خلاصه در ادامه میارم:
به نقل از جنسن هوانگ، مدیر عامل انویدیا، میگه که
هر چیزی که حرکت میکنه، در نهایت خودکار خواهد شد.
این پیشبینی بر چشمانداز آینده ای تاکید داره که رباتها، بهویژه رباتهای هوشمند و انساننما، در ده سال آینده به اندازه گوشیهای هوشمند فراگیر میشن. تلاشهای کنونی انویدیا نیز در راستای همین رونده و بر روی ایجاد یه پلتفرم محاسباتی برای رباتهای انساننما تمرکز داره
انویدیا پروژه ای به نام Groot رو راه اندازی کرده وهدف این پروژه توسعه مدلهای هوش مصنوعی پایه برای رباتهای انساننما ست. این پروژه حول محور ایجاد "AI brain" برای رباتهای انساننما میچرخه و از نقاط قوت انویدیا در زمینه شبیهسازی و قدرت محاسباتی بهره میبره.
میگه یکی از چالشهای عمده در توسعه هوش مصنوعی برای رباتیک، در دسترس نبودن دادههای باکیفته. دادههای موجود در مقیاس اینترنت، دادههای واقعی رباتها و دادههای شبیهسازی شده هر یک دارای نقاط قوت و ضعف خاص خود هستن و کلید پیشرفت در رباتیک، استفاده موثر از این منابع داده به صورت ترکیبیه. نبود دادههای کنترل حرکتی از منابع آنلاین پیشرفت رو محدود میکنه، بنابراین شبیهسازی به عنوان ابزاری حیاتی، برای تولید دادههای لازم برای آموزش رباتها به کار میره
همچنین در مورد شباهتهای بین انقلاب GPT-3 در پردازش زبان طبیعی و پتانسیل یک جهش مشابه در رباتیک صحبت میکنه و معتقده که لحظه مشابه GPT-3 زمانی برای رباتیک زمانی اتفاق میفته که مدلهای هوش مصنوعی بتونن بطور عمومی مهارت های حرکتی (motor actions) مثل باز کردن در رو در سناریوهای واقعی و مختلف رو انجام بدن. این امر نیازمند پیشرفتهای قابل توجهی در هر دو سیستم سطح پایین (کنترل حرکتی) و سیستم سطح بالا (استدلال و برنامهریزی) هوش مصنوعه
یکی از دلایلی که انویدیا روی رباتهای انسان نما تمرکز داره اینه که این رباتها به بهترین شکل میتونن با دنیای موجود که برای انسانها طراحی شده، تعامل کنن. از نظر اقتصادی، رباتهای انسان نما میتونن صنایع مختلفی مانند بهداشت و درمان، مراقبت از سالمندان و تولید رو با انجام کارهایی مثل پخت و پز، تمیز کردن یا کار در کارخانه متحول کنن. با این حال، علاوه بر پیشرفتهای فنی، عواملی مثل هزینه، ایمنی و مقررات تعیین کننده این اصله که این رباتها با چه سرعتی به جریان اصلی زندگی وارد خواهند شد.
https://youtu.be/yMGGpMyW_vw?feature=shared
YouTube
Jim Fan on Nvidia’s Embodied AI Lab and Jensen Huang’s Prediction that All Robots will be Autonomous
AI researcher Jim Fan has had a charmed career. He was OpenAI’s first intern before he did his PhD at Stanford with “godmother of AI,” Fei-Fei Li. He graduated into a research scientist position at Nvidia and now leads its Embodied AI “GEAR” group. The lab’s…
❤7👍2