جهش ۲۰ واحدی در IQ هوش مصنوعی
جدول مربوط به تست IQ شش ماه پیش است که بیشترین ضریب هوشی آن یعنی کلودیا-۳ آیکیو را ۱۰۱ کسب کرده.
نمودار نرمال تست IQ مربوط به یک آزمایش اخیر است که GPT-o1 preview به ۱۲۰ رسیده.
یعنی طی شش ماه ۱۹ واحد افزایش در هوش!
البته در یک تست آفلاین یعنی تستی که هیچ وقت سوالات آن در اینترنت نبوده به ۱۰۰ رسیده است.
جدول مربوط به تست IQ شش ماه پیش است که بیشترین ضریب هوشی آن یعنی کلودیا-۳ آیکیو را ۱۰۱ کسب کرده.
نمودار نرمال تست IQ مربوط به یک آزمایش اخیر است که GPT-o1 preview به ۱۲۰ رسیده.
یعنی طی شش ماه ۱۹ واحد افزایش در هوش!
البته در یک تست آفلاین یعنی تستی که هیچ وقت سوالات آن در اینترنت نبوده به ۱۰۰ رسیده است.
👍5
استفاده از مدلهای زبانی برای دور زدن فیلترینگ:)
امروز یه کار عجیبی با Sonnet 3.5 کردم!
یه لینک رو میخواستم باز کنم باز نمیشد حتی با ویپیان!
لیست پکیجهای اون سایت در اون لینک بود باید باز میکردم تا پکیج مورد نظرم رو پیدا کنم.
مدل Sonnet3.5 میتونه یک url رو باز کنه و صفحه رو بخونه.
بهش گفتم لینک پکیج با فلان شرایط رو از این URL بهم بده:) رفت صفحه رو خوند لینکش رو داد:)
حالا بازم نمیتونستم دانلود کنم.
رفتم لینک رو توی colab با wget دانلود کردم! سرعت اینترنت colab مثل سرعت نوره!
بعد از Google Driver دانلود کردم:)
امروز یه کار عجیبی با Sonnet 3.5 کردم!
یه لینک رو میخواستم باز کنم باز نمیشد حتی با ویپیان!
لیست پکیجهای اون سایت در اون لینک بود باید باز میکردم تا پکیج مورد نظرم رو پیدا کنم.
مدل Sonnet3.5 میتونه یک url رو باز کنه و صفحه رو بخونه.
بهش گفتم لینک پکیج با فلان شرایط رو از این URL بهم بده:) رفت صفحه رو خوند لینکش رو داد:)
حالا بازم نمیتونستم دانلود کنم.
رفتم لینک رو توی colab با wget دانلود کردم! سرعت اینترنت colab مثل سرعت نوره!
بعد از Google Driver دانلود کردم:)
😁11🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
ایجنت پژوهشی خفن! (PaperQA2)
این ایجنت که به همراه مقاله و به صورت متن باز منتشر شده در بعضی از تسکهای پژوهشی از دانشجوهای دکتری و محققین پسداک هم بهتر عمل کرده!
این برتری بر دانشجوی دکتری و پسداک وقتی سوالات خیلی خاصتر مطرح میشن برجستهتر میشه این خودش رو در یک بنچمارک نشون داده.
اگر در پروژه ارشد یا دکتری literature review کرده باشید و واقعا سعی کرده باشید کار دقیق و عمیق و درست و حسابی انجام بدهید میدونید چقدر کار سخت، نیازمند حوصله و دقته. واقعا بیش از ۷۰ درصد یک پژوهش همین بررسی دقیق کارهای پیشینه که خیلی هم کار سیستماتیک و روشمندی نیست.
چند دقیقه کار کردن با این ابزار واقعا جایگزین چند هفته تلاش و پژوهش دقیق یک دانشجو باتجربه PhD ئه.
سوالی که داره جواب میده یکی از سختترین سوالات و مهمترین سوالات یک مرور ادبیات در مرور کارهای پیشینه! سوال تاریخی!
جواب دادن به سوالات تاریخی نیازمند تایملاین کردن دهها پژوهش و شناسائی تاثیراتشون روی همه. حتی جمع آوری اون مقالات کار سختیه چه برسه ترک کردن یک موضوع خاص در این همه مقالات در طول زمان و توصیف تغییراتش.
منبع: توئیت
این ایجنت که به همراه مقاله و به صورت متن باز منتشر شده در بعضی از تسکهای پژوهشی از دانشجوهای دکتری و محققین پسداک هم بهتر عمل کرده!
این برتری بر دانشجوی دکتری و پسداک وقتی سوالات خیلی خاصتر مطرح میشن برجستهتر میشه این خودش رو در یک بنچمارک نشون داده.
اگر در پروژه ارشد یا دکتری literature review کرده باشید و واقعا سعی کرده باشید کار دقیق و عمیق و درست و حسابی انجام بدهید میدونید چقدر کار سخت، نیازمند حوصله و دقته. واقعا بیش از ۷۰ درصد یک پژوهش همین بررسی دقیق کارهای پیشینه که خیلی هم کار سیستماتیک و روشمندی نیست.
چند دقیقه کار کردن با این ابزار واقعا جایگزین چند هفته تلاش و پژوهش دقیق یک دانشجو باتجربه PhD ئه.
سوالی که داره جواب میده یکی از سختترین سوالات و مهمترین سوالات یک مرور ادبیات در مرور کارهای پیشینه! سوال تاریخی!
جواب دادن به سوالات تاریخی نیازمند تایملاین کردن دهها پژوهش و شناسائی تاثیراتشون روی همه. حتی جمع آوری اون مقالات کار سختیه چه برسه ترک کردن یک موضوع خاص در این همه مقالات در طول زمان و توصیف تغییراتش.
منبع: توئیت
👍3🔥1
Dev Tweet
ایجنت پژوهشی خفن! (PaperQA2) این ایجنت که به همراه مقاله و به صورت متن باز منتشر شده در بعضی از تسکهای پژوهشی از دانشجوهای دکتری و محققین پسداک هم بهتر عمل کرده! این برتری بر دانشجوی دکتری و پسداک وقتی سوالات خیلی خاصتر مطرح میشن برجستهتر میشه این خودش…
اومدن برای 2000 تا ژن در فرمت ویکی پدیا یک ویکی جدید ساختن به اسم WikiCrow که از اطلاعات هر کدوم از این ژنها یک article ویکی بسازه. ویکیها رو دادن به دانشجوهای دکتری و پسداک دیدن مطالبی که نوشته از مطالب ویکی پدیا خیلی بهتره!
👍5
نوبل فیزیک رو دادن به جفری هینتون:))😳
به خاطر کارش در بولتزمن ماشینها Boltzmann machine
جایزه مشترک با جان هاپفیلد
منبع
به خاطر کارش در بولتزمن ماشینها Boltzmann machine
جایزه مشترک با جان هاپفیلد
منبع
X (formerly Twitter)
The Nobel Prize (@NobelPrize) on X
2024 physics laureate Geoffrey Hinton used a network developed by his co-laureate John Hopfield as the foundation for a new network: the Boltzmann machine. This can learn to recognise characteristic elements in a given type of data.
The Boltzmann machine…
The Boltzmann machine…
❤4
Dev Tweet
نوبل فیزیک رو دادن به جفری هینتون:))😳 به خاطر کارش در بولتزمن ماشینها Boltzmann machine جایزه مشترک با جان هاپفیلد منبع
اطلاعات غیر مفید:
یه نفر دیگه هم بود به جز جفری هینتون که هم تورینگ برنده شده هم نوبل.
البته نوبلش اقتصاده نه فیزیک.
آقای هربرت سیمون(Herbert A. Simon).
دهه ۷۰ میلادی.
و جالبه که اونم بخاطر کار در حوزهی AI هر دو جایزه رو گرفته!
یعنی کارش در حوزهی AI منجر به نوبل اقتصاد شده!
ACM's Turing Award for making "basic contributions to artificial intelligence, the psychology of human cognition, and list processing" (1975)
Nobel Memorial Prize in Economics "for his pioneering research into the decision-making process within economic organizations" (1978)
یه نفر دیگه هم بود به جز جفری هینتون که هم تورینگ برنده شده هم نوبل.
البته نوبلش اقتصاده نه فیزیک.
آقای هربرت سیمون(Herbert A. Simon).
دهه ۷۰ میلادی.
و جالبه که اونم بخاطر کار در حوزهی AI هر دو جایزه رو گرفته!
یعنی کارش در حوزهی AI منجر به نوبل اقتصاد شده!
ACM's Turing Award for making "basic contributions to artificial intelligence, the psychology of human cognition, and list processing" (1975)
Nobel Memorial Prize in Economics "for his pioneering research into the decision-making process within economic organizations" (1978)
👍3
گویا OpenAI طبق برنامه قرار تازه سال 2029 سودده بشه. یعنی سرمایهگذارای VC باید خیلی صبور باشن.
احتمالا OpenAI در سالهای آینده زمانی وارد دورهی سود خودش میشه که ایجنتها راه بیفتن و OpenAI بتونه در قالب SaaS ازشون پول بگیره.
یه چیز دیگه هم بگم، این $5 میلیارد ضرری که الان OpenAI داره رو نباید زیاد جدی گرفت. تو فضای سرمایهگذاری خطرپذیر، این ترازهای منفی عادیه.
قضیه جالب میشه که بدونید هزینهش تا پایان ۲۰۲۶ حدود ۱۴ میلیارد دلار و تا پایان ۲۰۲۹ حدود ۴۴ میلیارد دلار برآورد شده!
هزینه حقوقش خیلی جالبه یکسال ۷۰۰ میلیون دلار حقوق داده!
نکته جالب دیگهش اینه که هزینهی آموزشش از هزینهی run یعنی inference ش یک میلیارد دلار بیشتره! این نشون میده چقدر آموزش پرهزینه است که وقتی اینقدر کاربر داره و اینقدر ازش استفاده میشه(هزینه inference) هنوز به پای هزینهی آموزش نمیرسه!
احتمالا OpenAI در سالهای آینده زمانی وارد دورهی سود خودش میشه که ایجنتها راه بیفتن و OpenAI بتونه در قالب SaaS ازشون پول بگیره.
یه چیز دیگه هم بگم، این $5 میلیارد ضرری که الان OpenAI داره رو نباید زیاد جدی گرفت. تو فضای سرمایهگذاری خطرپذیر، این ترازهای منفی عادیه.
قضیه جالب میشه که بدونید هزینهش تا پایان ۲۰۲۶ حدود ۱۴ میلیارد دلار و تا پایان ۲۰۲۹ حدود ۴۴ میلیارد دلار برآورد شده!
هزینه حقوقش خیلی جالبه یکسال ۷۰۰ میلیون دلار حقوق داده!
نکته جالب دیگهش اینه که هزینهی آموزشش از هزینهی run یعنی inference ش یک میلیارد دلار بیشتره! این نشون میده چقدر آموزش پرهزینه است که وقتی اینقدر کاربر داره و اینقدر ازش استفاده میشه(هزینه inference) هنوز به پای هزینهی آموزش نمیرسه!
👍7
Dev Tweet
شرکتهای بزرگ در توسعه LLMها هر کدوم مسیر متفاوتی رو طی میکنند. OpenAI و گوگل در پی ساخت مدلهای زبانی خیلی بزرگ هستند. فیسبوک در پی ساختن مدلهای کارآمد متنبازه ولی نقطه مقابل گوگل و OpenAI که در پی ارائه سرویسهای ابری Foundation Model است تمرکز اپل…
دوباره اعضای همون تیم ایرانی اپل که چند ماه پیش یک مقاله ازشون گذاشتم یک مقاله دیگه دادن خیلی مورد توجه قرار گرفته.
قسمتهای هایلایت شده چکیده نتیجه کل مقاله رو به خوبی خلاصه میکنه.
قسمتهای هایلایت شده چکیده نتیجه کل مقاله رو به خوبی خلاصه میکنه.
👍5❤1
Dev Tweet
دوباره اعضای همون تیم ایرانی اپل که چند ماه پیش یک مقاله ازشون گذاشتم یک مقاله دیگه دادن خیلی مورد توجه قرار گرفته. قسمتهای هایلایت شده چکیده نتیجه کل مقاله رو به خوبی خلاصه میکنه.
از اینجا هم میتونید خلاصه مقاله رو بخونید.
Telegram
Tensorflow(@CVision)
این مقاله بررسی میکنه که آیا مدلهای زبانی بزرگ مثل Llama، Phi، Gemma، Mistral و GPT-4o و سری o1 از OpenAI واقعاً توانایی استدلال دارن یا فقط دارن الگوها رو بهخوبی تشخیص میدن. نکته اینجاست که مدلهای کوچکتر (مثلاً ۳ میلیارد پارامتری) الان عملکرد بهتری…
👍1
معرفی یک کورس دانشگاهی، آینهای برای دیدن زخمهای عمیق آکادمی ایران...
وقتی کورسهای جدیدی را که در دانشگاههای آمریکا، خصوصاً استنفورد و برکلی که خیلی در این مسئله پیشتاز هستند، در موضوعات روز میبینم به این نتیجه میرسم دانشگاه در ایران رسماً مرده!
به جز شریف که آن هم کاملاً به دو استاد مرتبط میشود یعنی دکتر رهبان و سلیمانی (و این هم کاملاً به انگیزه شخصی دو استاد برمیگردد و لاغیر)، بی اغراق من هیچ درسی در تحصیلات تکمیلی AI که موضوع آن دوره مبحث جدیدتری از مباحث ۲۰۱۶ باشد، ندیدهام.
حالا شما ببینید اصلاً این موضوع agentic AI هنوز به جایی نرسیده، خبری نیست، اما آمدهاند در برکلی کورسش کردهاند. کورس دانشگاهی شدن یه موضوع به این جدید غیر از این است که Andrew Ng در deeplearning.ai یک mini-course برگزار کند. چون در کورس دانشگاهی باید بتوانی اندازه شانزده هفتهی دو جلسه محتوای ارائه دهی و از آن پروژه و امتحان طرح کنی.
علتش این شکاف عمیق در بخش آموزش تحصیلات تکمیلی در ایران و آمریکا این است که دیگر در حداقل حوزه AI، تدریس از روی textbook دورهاش گذشته. اصلاً اینقدر سرعت تولید دانش زیاد است که نمیصرفد کسی از آن کتاب بنویسد. کتابش به سه ماه نرسیده شبیه کتابهای تاریخ میشود :) حالا استاد محترم حقیقتاً حال ندارد کورسی بگذارد که تکست بوک ندارد. چون نیاز به تسلط خیلی عمیق روی تعداد زیادی مقاله دارد و هم دانشجوهای بیانگیزه خستهات میکنند. در آن سر عالم، سالهاست یک استاد نیست که کورس را بگذارد. میکند استاد یک فهرست محتوا تدارک میبیند، مقدمات را خودش درس میدهد و در موارد تخصصی از پژوهشگر موضوعی مربوط به محتوا دعوت میکند آن موضوع را تدریس کند.
این را هم بگویم دوستان، این وضعیت تقصیر استاد نیست. استادی که در بهترین حالت در ۳۳ سالگی (در اکثر موارد بدون فرصت مطالعاتی و پسادکترا با سفارش ویژهی استاد راهنما در هیات جذب هیئت علمی میشود) و در معمول موارد در ۴۰ سالگی هیات علمی میشود و تازه بعد از این همه درس خواندن میخواهند بهش در حد نصف حقوق (دقت کنید نصف!) کارگرهای خانگی بنگلادشی توی امارات بدهند و اگر در ۶۰ سالگی استاد تمام شود در حد آن کارگر ساده بیمهارت بنگلادشی حقوق بگیرد. از استادی که لنگ حقوق و نان شب و اجاره خانه است توقعی نمیتوانی داشته باشی.
منی که بیش از یک دهه عمرم در دانشگاه بودم فقط و فقط در استاد و دانشجو افول دیدم و بس. تازه فقط مشکل حقوق استاد نیست، همین استاد باید کار چهار هیات علمی را بکند. علت هم کمبود شدید و پایین بودن نسبت تعداد هیئت علمی به دانشجو است. دیگر نه دانشگاه پول دارد هیات علمی استخدام کند و نه دیگر آدم باسوادی رزومه برای هیات جذب دانشگاهها میفرستد، چون یا اپلای میکنند یا وارد بازار کار میشوند. اگر وارد منجلاب هیات علمی شدن بشوند دیگر فراری نیست.
خیلی از آزمایشگاههای تحصیلات تکمیلی سالهاست که دیگر رسماً جلسه آزمایشگاه ندارند! چون دانشجو دکتری پسر که نمیتواند تا ۳۰ سالگی از جیب پدر بخورد باید کار کند. حتی اگر از سمت خانواده تامین باشد چون آن مدرک دکتری فردا که فارغالتحصیل شود بدون سابقه کاری موثر بیمعنی و بیفایده است. دانشجو هم کار میکند، استاد هم خیلی نمیتواند فشار بیاورد چون اگر فشار زیاد شود در جا انصراف میدهد (چندین مورد در این سالها دیدم).
وضعیت دانشجوی ارشد و کارشناسی جدید که والذاریاتی است قابل گفتن نیست...
خلاصه دانشگاهی که دانشجو و استادش مردهاند خودش هم میمیرد...
مساله این نیست که ما نمیفهمیم یا بلد نیستیم، مساله تمامش اقتصادی است. مساله امروز ما در همه چیز از جمله آکادمی GDP per Capita است. خدا میداند چند ماه پیش با استادم صحبت کردیم از حوزه رسالهام (که چهار پنج کورس سر و صاحبدار بیشتر ازش در دنیا نیست) یک کورس در دانشکده ارائه کنیم اما هم من هم استادم میدانستیم به نتیجه نمیرسد چون این کارها در کنار انگیزه وقت میخواهد. نه من و نه خودش وقت این کارها را نداریم. من عمده وقتم را کار میکنم نه پژوهش، آن هم خیلی حوصله ندارد ساعت کاریاش را در دانشگاه پر کند.
معرفی این کورس جدید Agentic AI هم سر درد و دل من را باز کرد...
خلاصه که وضعیت دانشگاه این مملکت شبیه بقیه چیزهایش هست، شبیه صنعت برقش، شبیه اقتصادش...
نشستهایم بالای سر پیکر محتضر این گربه عزیز فقط آه میکشیم 😭😭😭.
وقتی کورسهای جدیدی را که در دانشگاههای آمریکا، خصوصاً استنفورد و برکلی که خیلی در این مسئله پیشتاز هستند، در موضوعات روز میبینم به این نتیجه میرسم دانشگاه در ایران رسماً مرده!
به جز شریف که آن هم کاملاً به دو استاد مرتبط میشود یعنی دکتر رهبان و سلیمانی (و این هم کاملاً به انگیزه شخصی دو استاد برمیگردد و لاغیر)، بی اغراق من هیچ درسی در تحصیلات تکمیلی AI که موضوع آن دوره مبحث جدیدتری از مباحث ۲۰۱۶ باشد، ندیدهام.
حالا شما ببینید اصلاً این موضوع agentic AI هنوز به جایی نرسیده، خبری نیست، اما آمدهاند در برکلی کورسش کردهاند. کورس دانشگاهی شدن یه موضوع به این جدید غیر از این است که Andrew Ng در deeplearning.ai یک mini-course برگزار کند. چون در کورس دانشگاهی باید بتوانی اندازه شانزده هفتهی دو جلسه محتوای ارائه دهی و از آن پروژه و امتحان طرح کنی.
علتش این شکاف عمیق در بخش آموزش تحصیلات تکمیلی در ایران و آمریکا این است که دیگر در حداقل حوزه AI، تدریس از روی textbook دورهاش گذشته. اصلاً اینقدر سرعت تولید دانش زیاد است که نمیصرفد کسی از آن کتاب بنویسد. کتابش به سه ماه نرسیده شبیه کتابهای تاریخ میشود :) حالا استاد محترم حقیقتاً حال ندارد کورسی بگذارد که تکست بوک ندارد. چون نیاز به تسلط خیلی عمیق روی تعداد زیادی مقاله دارد و هم دانشجوهای بیانگیزه خستهات میکنند. در آن سر عالم، سالهاست یک استاد نیست که کورس را بگذارد. میکند استاد یک فهرست محتوا تدارک میبیند، مقدمات را خودش درس میدهد و در موارد تخصصی از پژوهشگر موضوعی مربوط به محتوا دعوت میکند آن موضوع را تدریس کند.
این را هم بگویم دوستان، این وضعیت تقصیر استاد نیست. استادی که در بهترین حالت در ۳۳ سالگی (در اکثر موارد بدون فرصت مطالعاتی و پسادکترا با سفارش ویژهی استاد راهنما در هیات جذب هیئت علمی میشود) و در معمول موارد در ۴۰ سالگی هیات علمی میشود و تازه بعد از این همه درس خواندن میخواهند بهش در حد نصف حقوق (دقت کنید نصف!) کارگرهای خانگی بنگلادشی توی امارات بدهند و اگر در ۶۰ سالگی استاد تمام شود در حد آن کارگر ساده بیمهارت بنگلادشی حقوق بگیرد. از استادی که لنگ حقوق و نان شب و اجاره خانه است توقعی نمیتوانی داشته باشی.
منی که بیش از یک دهه عمرم در دانشگاه بودم فقط و فقط در استاد و دانشجو افول دیدم و بس. تازه فقط مشکل حقوق استاد نیست، همین استاد باید کار چهار هیات علمی را بکند. علت هم کمبود شدید و پایین بودن نسبت تعداد هیئت علمی به دانشجو است. دیگر نه دانشگاه پول دارد هیات علمی استخدام کند و نه دیگر آدم باسوادی رزومه برای هیات جذب دانشگاهها میفرستد، چون یا اپلای میکنند یا وارد بازار کار میشوند. اگر وارد منجلاب هیات علمی شدن بشوند دیگر فراری نیست.
خیلی از آزمایشگاههای تحصیلات تکمیلی سالهاست که دیگر رسماً جلسه آزمایشگاه ندارند! چون دانشجو دکتری پسر که نمیتواند تا ۳۰ سالگی از جیب پدر بخورد باید کار کند. حتی اگر از سمت خانواده تامین باشد چون آن مدرک دکتری فردا که فارغالتحصیل شود بدون سابقه کاری موثر بیمعنی و بیفایده است. دانشجو هم کار میکند، استاد هم خیلی نمیتواند فشار بیاورد چون اگر فشار زیاد شود در جا انصراف میدهد (چندین مورد در این سالها دیدم).
وضعیت دانشجوی ارشد و کارشناسی جدید که والذاریاتی است قابل گفتن نیست...
خلاصه دانشگاهی که دانشجو و استادش مردهاند خودش هم میمیرد...
مساله این نیست که ما نمیفهمیم یا بلد نیستیم، مساله تمامش اقتصادی است. مساله امروز ما در همه چیز از جمله آکادمی GDP per Capita است. خدا میداند چند ماه پیش با استادم صحبت کردیم از حوزه رسالهام (که چهار پنج کورس سر و صاحبدار بیشتر ازش در دنیا نیست) یک کورس در دانشکده ارائه کنیم اما هم من هم استادم میدانستیم به نتیجه نمیرسد چون این کارها در کنار انگیزه وقت میخواهد. نه من و نه خودش وقت این کارها را نداریم. من عمده وقتم را کار میکنم نه پژوهش، آن هم خیلی حوصله ندارد ساعت کاریاش را در دانشگاه پر کند.
معرفی این کورس جدید Agentic AI هم سر درد و دل من را باز کرد...
خلاصه که وضعیت دانشگاه این مملکت شبیه بقیه چیزهایش هست، شبیه صنعت برقش، شبیه اقتصادش...
نشستهایم بالای سر پیکر محتضر این گربه عزیز فقط آه میکشیم 😭😭😭.
CS 194/294-196 Large Language Model Agents
CS294/194-196 Large Language Model Agents
Fall 2024
👍15❤4😢2👎1💔1
سیستم رو باز کردم دیدم از دیشب داره یه ویدئو کرش کورس دیپ لرنینگ پخش میشه
این ویدئو ۳.۲ میلیون بازدید داره!!!
کرش کورس با بازدید میلیونی!
بعد اومدم تو کامنتا فهمیدم چطوری اینقدر ویو گرفته:))))
این ویدئو ۳.۲ میلیون بازدید داره!!!
کرش کورس با بازدید میلیونی!
بعد اومدم تو کامنتا فهمیدم چطوری اینقدر ویو گرفته:))))
😁4🤡3
یک سوال آموزنده و کاربردی:
به نظرتون آیا آموزش دادن مجدد(re-training) مدل به دادههایی که اونها را درست پیشبینی کرده است میتواند به کارآیی مدل بیافزاید؟ چرا؟
اگر حال ندارید در موردش صحبت کنید، جواب مثبت را با 👍 و جواب منفی رو با 👎 بصورت reaction نشان دهید.
به نظرتون آیا آموزش دادن مجدد(re-training) مدل به دادههایی که اونها را درست پیشبینی کرده است میتواند به کارآیی مدل بیافزاید؟ چرا؟
اگر حال ندارید در موردش صحبت کنید، جواب مثبت را با 👍 و جواب منفی رو با 👎 بصورت reaction نشان دهید.
👎15👍13
Dev Tweet
یک سوال آموزنده و کاربردی: به نظرتون آیا آموزش دادن مجدد(re-training) مدل به دادههایی که اونها را درست پیشبینی کرده است میتواند به کارآیی مدل بیافزاید؟ چرا؟ اگر حال ندارید در موردش صحبت کنید، جواب مثبت را با 👍 و جواب منفی رو با 👎 بصورت reaction نشان…
برای نظر دادن روی پست نیاز نیست عضو گروه متصل به کانال بشوید.
Dev Tweet
یک سوال آموزنده و کاربردی: به نظرتون آیا آموزش دادن مجدد(re-training) مدل به دادههایی که اونها را درست پیشبینی کرده است میتواند به کارآیی مدل بیافزاید؟ چرا؟ اگر حال ندارید در موردش صحبت کنید، جواب مثبت را با 👍 و جواب منفی رو با 👎 بصورت reaction نشان…
دمتون گرم بخاطر نظراتتون
من تا فردا تجربه خودم و تئوری کار رو براتون ارسال میکنم
اگه تا فردا هم بیشتر نظر بدید ذهن من واسه نوشتن نکاتم بازتر میشه.
اینکه تقریبا رایها نصف نصفه واسه من خیلی مهمه!
چرا؟ چون اگر سوال من براتون مبهم جا نیفتاده باشه یعنی یک تردید جدی نسبت به این سوال کلیدی در ذهن مخاطب هست و این یعنی پرداختن بهش ارزش داره!
من تا فردا تجربه خودم و تئوری کار رو براتون ارسال میکنم
اگه تا فردا هم بیشتر نظر بدید ذهن من واسه نوشتن نکاتم بازتر میشه.
اینکه تقریبا رایها نصف نصفه واسه من خیلی مهمه!
چرا؟ چون اگر سوال من براتون مبهم جا نیفتاده باشه یعنی یک تردید جدی نسبت به این سوال کلیدی در ذهن مخاطب هست و این یعنی پرداختن بهش ارزش داره!
من یکی از اعتیادام اینه حتما نویسندههای یک مقاله و affiliationهاشون رو نگاه میکنم وقتی تو لیست نویسندهها یه ایرانی ببینم سریع میرم ببینم طرف کیه!
یکی از آزمایشگاههایی که کاراش خیلی به رساله دکتری من مربوطه همین مرکز تحقیقاتی ترندز Trends هست وابسته به دانشگاه جورجیا استیت هست. به تبع زیاد پیش میاد که برم مقالههاشون رو بخونم. و انصافا در حوزه AI و تصاویر مغزی جز خفنترین مراکز تحقیقاتی دنیا هستن حسب مقالاتشون.
یه نگاه سرسری انداختم دیدم ۱۵ نفر ایرانی داره!
هم غصه میخورم هم کیف میکنم🤩 ولی حسم بیشتر اولیه😢.
تازه اسم همه رو هم نزده چون یکی سریا رو میشناسم ولی تو این صفحه نبود.
https://trendscenter.org/people
یکی از آزمایشگاههایی که کاراش خیلی به رساله دکتری من مربوطه همین مرکز تحقیقاتی ترندز Trends هست وابسته به دانشگاه جورجیا استیت هست. به تبع زیاد پیش میاد که برم مقالههاشون رو بخونم. و انصافا در حوزه AI و تصاویر مغزی جز خفنترین مراکز تحقیقاتی دنیا هستن حسب مقالاتشون.
یه نگاه سرسری انداختم دیدم ۱۵ نفر ایرانی داره!
هم غصه میخورم هم کیف میکنم🤩 ولی حسم بیشتر اولیه😢.
تازه اسم همه رو هم نزده چون یکی سریا رو میشناسم ولی تو این صفحه نبود.
https://trendscenter.org/people
TReNDS
People - TReNDS
😢3
Dev Tweet
یک سوال آموزنده و کاربردی: به نظرتون آیا آموزش دادن مجدد(re-training) مدل به دادههایی که اونها را درست پیشبینی کرده است میتواند به کارآیی مدل بیافزاید؟ چرا؟ اگر حال ندارید در موردش صحبت کنید، جواب مثبت را با 👍 و جواب منفی رو با 👎 بصورت reaction نشان…
عذرخواهی میکنم از تاخیری که در نوشتن جواب این نظرسنجی پیش آمده یه کم زیاد سرم شلوغ شده کارا پیش خورده.
👍3
طلیعهی جدید تحول در توسعه مدلهای یادگیری ماشین
در حالی که هنوز خیلیها حتی در کامیونیتی AI (چه برسد به بقیهی بچههای فنی) با تأثیر ابزارهایی مانند Cursor، Cline و GitHub Copilot در افزایش ویژه بهرهوری در برنامهنویسی آشنا نیستند، ما در آستانه ورود به دوره جدیدی از توسعه مدلهای یادگیری ماشین به صورت End2End و مبتنی بر ایجنت هستیم.
من درباره سیستمهایی صحبت میکنم مقالاتشون به تازگی منتشر شده و میشه و محصولاتشون هنوز در مرحله waitlist هستند. برای شروع برای اینکه بفهمید دارم از چی حرف میزنم اول نگاهی به گیف زیر از ایجنت Neo بیندازید. این فریمورک لینک چالش کگل را در ورودی میگیره، به صورت خودکار مساله یادگیری ماشین مربوط به چالش را تحلیل میکند. Neo با رویکرد multi-agent کار میکند: یک ایجنت مساله را میفهمد، سپس یک ایجنت data engineer دیتاست را دانلود و پیشپردازش میکند، مراحل ساخت مدل را از داده تا خروجی در یک فضای درخت تصمیم ترسیم میکند با یک ایجنت منتقد critic بهترین مسیر داده تا مدل مناسب را پیدا میکند، مدل را آموزش میدهد و نتایج را ارزیابی میکند.
اگر این ایجنتها در حد ایده استارتاپی بودند اصلا جدی نمیگرفتم چون ماهی صد تا از این استارتاپهای مولتی ایجنت مبتنی بر LLM میاد که بعد از چند وقت محو میشن و دیگه خبری ازشون نیست.
جدی بودن توسعه و آموزش مدل یادگیری ماشین بصورت end2end توسط multi-agent رو از مقاله بنچ مارک یک ماه پیش openAl موسوم به ML-Bench میشه بهش پی برد.
پروژههای متن بازی متعددی هم مثل AideML برای این کار ارائه شده، در بنچمارک MLE-bench اپنایآی که شامل ۷۵ چالش کگل است، عملکرد چشمگیری داشته و چهار برابر رقیب دوم مدال کسب کرده است. AIDE در آزمایشهای داخلی روی بیش از ۶۰ مسابقه Kaggle توانسته از ۵۰٪ شرکتکنندگان عملکرد بهتری داشته باشد. به نظر من اگه شخصی ۵۰ درصد بالایی شرکتکنندهای کگل در ۶۰ تسک مختلف
بطور اتفاقی به چشمم اومد که MetaGPT که از مشهورترین فریمورکهای multi-agen هست هم اخیراً اکستنشن SELA را معرفی کرده که اون هم یک AutoML مبتنی بر ایجنته. با بسط یک درخت تصمیم گسترده برای فضای راهحلها انتخاب مدل model selection هوشمندانهتری انجام میده و به کمک تکنیکی موسوم به Monte Carlo Tree Search، در فضای راهحلها جستجو میکنه و نسبت به مدلهای AutoML سنتی مدلهای بهینهتری رو برای آموزش انتخاب میکنه.
اگر دوست دارید موارد مشابه بیشتری ببینید خودتون یک نگاه به OpenHands بندازید.
به نظر میرسد طی ماههای آینده به شکل عملی با موجی از این تحولات مواجه خواهیم شد که صنعت توسعه یادگیری ماشین را متحول خواهد کرد. و LLMهایی که تا همین امروز به تهدیدی برای مهندسی نرمافزار تبدیل شده بودند امروز دارند به تهدیدی برای دیتاساینتیستها و مهندسین یادگیری ماشین تبدیل میشوند.
در حالی که هنوز خیلیها حتی در کامیونیتی AI (چه برسد به بقیهی بچههای فنی) با تأثیر ابزارهایی مانند Cursor، Cline و GitHub Copilot در افزایش ویژه بهرهوری در برنامهنویسی آشنا نیستند، ما در آستانه ورود به دوره جدیدی از توسعه مدلهای یادگیری ماشین به صورت End2End و مبتنی بر ایجنت هستیم.
من درباره سیستمهایی صحبت میکنم مقالاتشون به تازگی منتشر شده و میشه و محصولاتشون هنوز در مرحله waitlist هستند. برای شروع برای اینکه بفهمید دارم از چی حرف میزنم اول نگاهی به گیف زیر از ایجنت Neo بیندازید. این فریمورک لینک چالش کگل را در ورودی میگیره، به صورت خودکار مساله یادگیری ماشین مربوط به چالش را تحلیل میکند. Neo با رویکرد multi-agent کار میکند: یک ایجنت مساله را میفهمد، سپس یک ایجنت data engineer دیتاست را دانلود و پیشپردازش میکند، مراحل ساخت مدل را از داده تا خروجی در یک فضای درخت تصمیم ترسیم میکند با یک ایجنت منتقد critic بهترین مسیر داده تا مدل مناسب را پیدا میکند، مدل را آموزش میدهد و نتایج را ارزیابی میکند.
اگر این ایجنتها در حد ایده استارتاپی بودند اصلا جدی نمیگرفتم چون ماهی صد تا از این استارتاپهای مولتی ایجنت مبتنی بر LLM میاد که بعد از چند وقت محو میشن و دیگه خبری ازشون نیست.
جدی بودن توسعه و آموزش مدل یادگیری ماشین بصورت end2end توسط multi-agent رو از مقاله بنچ مارک یک ماه پیش openAl موسوم به ML-Bench میشه بهش پی برد.
پروژههای متن بازی متعددی هم مثل AideML برای این کار ارائه شده، در بنچمارک MLE-bench اپنایآی که شامل ۷۵ چالش کگل است، عملکرد چشمگیری داشته و چهار برابر رقیب دوم مدال کسب کرده است. AIDE در آزمایشهای داخلی روی بیش از ۶۰ مسابقه Kaggle توانسته از ۵۰٪ شرکتکنندگان عملکرد بهتری داشته باشد. به نظر من اگه شخصی ۵۰ درصد بالایی شرکتکنندهای کگل در ۶۰ تسک مختلف
بطور اتفاقی به چشمم اومد که MetaGPT که از مشهورترین فریمورکهای multi-agen هست هم اخیراً اکستنشن SELA را معرفی کرده که اون هم یک AutoML مبتنی بر ایجنته. با بسط یک درخت تصمیم گسترده برای فضای راهحلها انتخاب مدل model selection هوشمندانهتری انجام میده و به کمک تکنیکی موسوم به Monte Carlo Tree Search، در فضای راهحلها جستجو میکنه و نسبت به مدلهای AutoML سنتی مدلهای بهینهتری رو برای آموزش انتخاب میکنه.
اگر دوست دارید موارد مشابه بیشتری ببینید خودتون یک نگاه به OpenHands بندازید.
به نظر میرسد طی ماههای آینده به شکل عملی با موجی از این تحولات مواجه خواهیم شد که صنعت توسعه یادگیری ماشین را متحول خواهد کرد. و LLMهایی که تا همین امروز به تهدیدی برای مهندسی نرمافزار تبدیل شده بودند امروز دارند به تهدیدی برای دیتاساینتیستها و مهندسین یادگیری ماشین تبدیل میشوند.
Weco AI
AIDE: Human-Level Performance on Data Science Competitions | Weco AI
In the world of data science, Kaggle competitions have become a widely accepted standard...
1👍5