مهندسی نرمافزار و هوش مصنوعی
(تجربه من از برنامه نویسی با مدل زبانی)
من تقریبا یک سالی هست که خیلی کم کد مینویسم چون دیگه میدونم چطوری تسکهام روی برای copilot توضیح بدم اونجوری که میخوام انجامش بده.
با وجود اینکه خیلی کمتر کد زدم برنامههای بیشتری تولید کردم مثلا برای کارام برنامههای کوچیک کوچیک خیلی بیشتر نوشتم.
مدلهای زبانی دارند سطح انتزاعی فکر کردن ما در مورد برنامهها رو بالا میبرند یعنی مثلا اگر سینتکس جاوا رو بلد نیستید و خیلی کتابخونههاش رو نمیشناسید ولی اگر زبان اصلی شما پایتون است و پارادایم شیگرائی را در پایتون خوب بلدید با کمترین زمان ممکن میتونید سوئیچ کنید روی جاوا. حتی یک برنامه نویس پایتون که شی گرایی رو خیلی خوب بلده با کمک مدل زبانی میتونه کد جاوا خیلی بهتری بنویسه چون مدلهای زبانی کاری کردند که اصل بر تسلط بر انتزاعه و مهندسی نرم افزار است نه مهارت توسعه فانکشن و کلاس.
تجربه من در استفاده از مدلهای زبانی رایگان که context length کوتاهتری به نسبت مدلهای پولی دارند این بوده که همین context length مانع بزرگی برای استفاده کردن از مدل زبانی در سطح انتزاعی بالاتره چون از وقتی context length نسخه copilot من از ۴۰۰۰ تا به ۸۰۰۰تا کاراکتر افزایش پیدا کرده میبینم که میتونم برای تسکهای انتزاعی تری استفادهش کنم اما با افزایش context length مدل معمولا دچار نوعی حواس پرتی میشه و ممکنه لازم باشه یک چیز رو با طرق مختلف ازش بخواهید تا براتون انجام بده.
این رو امروز که تو شرکت مجبور به یک ریفکتور سنگین بودیم و با یک پترن خاصی داشتیم توسعه میدادیم فهمیدیم(اصلا نمیدونم برای اون نیاز خاص ما دیزاین پترن وجود داره یا نه چون یک پترنی درآوردیم که ظاهرا تا الان جواب داده اگه جواب نده احتمالا تا نیمه خرداد تیممون تعلیق میشه😂) جایی بود که فقط تجربه به دادمون میرسید (نه اینکه بگم خیلی باتجربه بودیم) یعنی اگر باتجربهتر بودیم اون کد رو بهتر طراحی میکردیم و اگر تجربه رو نداشتیم مدل زبانی به دادمون نمیرسید و رسما به فنا میرفتیم.
پ.ن: اینا رو منی مینویسم که حتی عکسی رو که مدیر از باگ سیستم با گوشیش از روی مانتیور گرفته تو تلگرام برام فرستاده با copilot حلش میکنم!
پ.ن۲: اگر فعلا قصد در حال حاضر مهندسی نرمافزار بلد نیستید یعنی تجربه یا توانایی یا موقعیت کد زدن در کدبیسهای بزرگ رو ندارید استفاده بیرویه و غلط از این مدلهای زبانی با ایجاد توهم مهندس افزار بودن به فنا میدهتون چون در سیستمی که مثلا بیش از هزارتا تسک داره بیش از اینکه توسعه مهم باشه نظم توسعه(معماری) مهمه چون اگر بیزینس بخواد اسکیل کنه و چه به لحاظ اسکیل کردن فیچرها و چه منابع، اگر معماری درست و درمون نداشته باشید ممکنه کل بیزینس رو با سر بزنید زمین. یک از دوستان که خیلی برنامه نویس قابلی بود تعریف میکرد چطوری ریفکتور کردن(با پروژه بزرگ رو ریفکتور کرده باشی تا بدونی چاه ریفکتور چیه😐) بیحساب و کتاب و بیموقع باعث شده بود بیزینسشون به علت محدودیت منابع مالی کل پروژه رو جمع کنه:) (اسم پروژه رو بگم اکثرا میشناسید)
پ.ن۳: حرفهایی که من در مورد مدل زبانی میزنم واسه الانه نه شش ماهه دیگه! به زودی مدلهای زبانی در سطح انتزاع بالاتر مثل معماری هم پیشرفت خواهند کرد و میتونن از من و شما با best practiceهای بهتری و design patternهای مناسبتری کد بزنن!
پ.ن۴: اگر پ.ن قبلی شما رو به ترس انداخته که چقدر احتمالش بالاست که مدلهای زبانی ممکنه آینده کاری نیروهای فنی حوزه آیتی رو به فنا بدن(شاید نگرانی بجایی باشه ولی من فعلا نگران نیستم) به نظرم دورترین شغل در رده فنی به جایگزین شدن با هوش مصنوعی تسکهای رده devops است.(به نظر حتی مهندسی محصولم با فهمی که من از تسکاش دارم خیلی میتونه مورد تهدید قرار بگیره مگر اینکه اون نیرو تجربه تحلیل بیزینسی خودش رو خیلی بالا ببره که اون موقع میشه طلا)
پ.ن۵: چرا در مورد آینده شغلیم و هوش مصنوعی نگران نیستم چون معتقدم چیزی که شغل من رو به خطر میاندازه بحرانهای اقتصادی و بهخصوص بحران منابع مالی در حوزه tech هست که دیگر شرکتها و سرمایه گزاران علاقه به برنامههای توسعهای نداشته باشند و بخواهند صرفا از سرویسهای جاری کسب درآمد کنند ولی مادامی که علاقه به توسعه وجود داشته باشد نیازش هم پیدا میشود و تقاضا برای نیروی فنی به وجود میآید.
پ.ن۶: آنقدر تعلیق زدم هاشیه(پ.نها) از اصل متن بیشتر شد:)
لطفا نقدم کنید تا بیشتر فکر کنم بیشتر یاد بگیرم❤️
(تجربه من از برنامه نویسی با مدل زبانی)
من تقریبا یک سالی هست که خیلی کم کد مینویسم چون دیگه میدونم چطوری تسکهام روی برای copilot توضیح بدم اونجوری که میخوام انجامش بده.
با وجود اینکه خیلی کمتر کد زدم برنامههای بیشتری تولید کردم مثلا برای کارام برنامههای کوچیک کوچیک خیلی بیشتر نوشتم.
مدلهای زبانی دارند سطح انتزاعی فکر کردن ما در مورد برنامهها رو بالا میبرند یعنی مثلا اگر سینتکس جاوا رو بلد نیستید و خیلی کتابخونههاش رو نمیشناسید ولی اگر زبان اصلی شما پایتون است و پارادایم شیگرائی را در پایتون خوب بلدید با کمترین زمان ممکن میتونید سوئیچ کنید روی جاوا. حتی یک برنامه نویس پایتون که شی گرایی رو خیلی خوب بلده با کمک مدل زبانی میتونه کد جاوا خیلی بهتری بنویسه چون مدلهای زبانی کاری کردند که اصل بر تسلط بر انتزاعه و مهندسی نرم افزار است نه مهارت توسعه فانکشن و کلاس.
تجربه من در استفاده از مدلهای زبانی رایگان که context length کوتاهتری به نسبت مدلهای پولی دارند این بوده که همین context length مانع بزرگی برای استفاده کردن از مدل زبانی در سطح انتزاعی بالاتره چون از وقتی context length نسخه copilot من از ۴۰۰۰ تا به ۸۰۰۰تا کاراکتر افزایش پیدا کرده میبینم که میتونم برای تسکهای انتزاعی تری استفادهش کنم اما با افزایش context length مدل معمولا دچار نوعی حواس پرتی میشه و ممکنه لازم باشه یک چیز رو با طرق مختلف ازش بخواهید تا براتون انجام بده.
این رو امروز که تو شرکت مجبور به یک ریفکتور سنگین بودیم و با یک پترن خاصی داشتیم توسعه میدادیم فهمیدیم(اصلا نمیدونم برای اون نیاز خاص ما دیزاین پترن وجود داره یا نه چون یک پترنی درآوردیم که ظاهرا تا الان جواب داده اگه جواب نده احتمالا تا نیمه خرداد تیممون تعلیق میشه😂) جایی بود که فقط تجربه به دادمون میرسید (نه اینکه بگم خیلی باتجربه بودیم) یعنی اگر باتجربهتر بودیم اون کد رو بهتر طراحی میکردیم و اگر تجربه رو نداشتیم مدل زبانی به دادمون نمیرسید و رسما به فنا میرفتیم.
پ.ن: اینا رو منی مینویسم که حتی عکسی رو که مدیر از باگ سیستم با گوشیش از روی مانتیور گرفته تو تلگرام برام فرستاده با copilot حلش میکنم!
پ.ن۲: اگر فعلا قصد در حال حاضر مهندسی نرمافزار بلد نیستید یعنی تجربه یا توانایی یا موقعیت کد زدن در کدبیسهای بزرگ رو ندارید استفاده بیرویه و غلط از این مدلهای زبانی با ایجاد توهم مهندس افزار بودن به فنا میدهتون چون در سیستمی که مثلا بیش از هزارتا تسک داره بیش از اینکه توسعه مهم باشه نظم توسعه(معماری) مهمه چون اگر بیزینس بخواد اسکیل کنه و چه به لحاظ اسکیل کردن فیچرها و چه منابع، اگر معماری درست و درمون نداشته باشید ممکنه کل بیزینس رو با سر بزنید زمین. یک از دوستان که خیلی برنامه نویس قابلی بود تعریف میکرد چطوری ریفکتور کردن(با پروژه بزرگ رو ریفکتور کرده باشی تا بدونی چاه ریفکتور چیه😐) بیحساب و کتاب و بیموقع باعث شده بود بیزینسشون به علت محدودیت منابع مالی کل پروژه رو جمع کنه:) (اسم پروژه رو بگم اکثرا میشناسید)
پ.ن۳: حرفهایی که من در مورد مدل زبانی میزنم واسه الانه نه شش ماهه دیگه! به زودی مدلهای زبانی در سطح انتزاع بالاتر مثل معماری هم پیشرفت خواهند کرد و میتونن از من و شما با best practiceهای بهتری و design patternهای مناسبتری کد بزنن!
پ.ن۴: اگر پ.ن قبلی شما رو به ترس انداخته که چقدر احتمالش بالاست که مدلهای زبانی ممکنه آینده کاری نیروهای فنی حوزه آیتی رو به فنا بدن(شاید نگرانی بجایی باشه ولی من فعلا نگران نیستم) به نظرم دورترین شغل در رده فنی به جایگزین شدن با هوش مصنوعی تسکهای رده devops است.(به نظر حتی مهندسی محصولم با فهمی که من از تسکاش دارم خیلی میتونه مورد تهدید قرار بگیره مگر اینکه اون نیرو تجربه تحلیل بیزینسی خودش رو خیلی بالا ببره که اون موقع میشه طلا)
پ.ن۵: چرا در مورد آینده شغلیم و هوش مصنوعی نگران نیستم چون معتقدم چیزی که شغل من رو به خطر میاندازه بحرانهای اقتصادی و بهخصوص بحران منابع مالی در حوزه tech هست که دیگر شرکتها و سرمایه گزاران علاقه به برنامههای توسعهای نداشته باشند و بخواهند صرفا از سرویسهای جاری کسب درآمد کنند ولی مادامی که علاقه به توسعه وجود داشته باشد نیازش هم پیدا میشود و تقاضا برای نیروی فنی به وجود میآید.
پ.ن۶: آنقدر تعلیق زدم هاشیه(پ.نها) از اصل متن بیشتر شد:)
لطفا نقدم کنید تا بیشتر فکر کنم بیشتر یاد بگیرم❤️
Telegram
Dev Tweet Media
👍7
Dev Tweet
مهندسی نرمافزار و هوش مصنوعی (تجربه من از برنامه نویسی با مدل زبانی) من تقریبا یک سالی هست که خیلی کم کد مینویسم چون دیگه میدونم چطوری تسکهام روی برای copilot توضیح بدم اونجوری که میخوام انجامش بده. با وجود اینکه خیلی کمتر کد زدم برنامههای بیشتری تولید…
طولانیه ولی لطفا بخوانید بهم فیدبک بدید دمتون گرم❤️
Forwarded from Python BackendHub (Mani)
این عکس واقعا خیلی قشنگ نشون میده over engineering رو. بیشتر مواقع زمانی اتفاق میفته که میخوایم آینده رو پیشبینی کنیم.
تا وقتی به حد کافی نقطه مشخص دارین سعی نکنید سولوشنی بدید که همه کیس هارو کاور کنه. معمولا سولوشن پرفکت اول مسیر خودشو نشون نمیده.
@PyBackendHub
تا وقتی به حد کافی نقطه مشخص دارین سعی نکنید سولوشنی بدید که همه کیس هارو کاور کنه. معمولا سولوشن پرفکت اول مسیر خودشو نشون نمیده.
@PyBackendHub
Python BackendHub
این عکس واقعا خیلی قشنگ نشون میده over engineering رو. بیشتر مواقع زمانی اتفاق میفته که میخوایم آینده رو پیشبینی کنیم. تا وقتی به حد کافی نقطه مشخص دارین سعی نکنید سولوشنی بدید که همه کیس هارو کاور کنه. معمولا سولوشن پرفکت اول مسیر خودشو نشون نمیده. @PyBackendHub
کانال تو حوزه برنامه نویسی مثه علف هرز زیاده اکثرا دنبال کردنشون نفعی خاصی به شما نمیرسونه این کانال واقعا جز معدود کانالهاییه که اگه به مهندسی نرمافزار علاقه دارید به دردتون میخوره.
مطالب واقعا مفیدی مینویسه که معمولا دید خوبی میده مخصوصا اگه تجربه کار پروداکشن داشته باشید.
نویسندهش رو نمیشناسم ولی دمش گرم❤️
@PyBackendHub
مطالب واقعا مفیدی مینویسه که معمولا دید خوبی میده مخصوصا اگه تجربه کار پروداکشن داشته باشید.
نویسندهش رو نمیشناسم ولی دمش گرم❤️
@PyBackendHub
👍5
اکستنش خفن مایکروسافت برای Vscode برای کارهای Data Science
اگر تجربه کار کردن با csv رو داشته باشید و بخواهید یه کار تحلیلی دم دستی بکنید احتمالا مستقیم میرید سراغ notebook. حالا یا jupyter رو مستقیم توی بروزر اجرا کنید یا توی vscode.
وقتی واقعا جذاب نیست هنوز!
چون هی باید کد روی dataframe های پاندا بزنی مخصوصا جایی باشه کد زدنه واقعا اهمیت نداشته باشه و خروجی تحلیل موردی شما اهمیت بیشتری داشته. مثلا وقتی که بخواهید unique_count مقادیر هر ستون رو بگیرید. یا مثلا سریعتر بتونم چندتا چیز رو با هم فیلتر کنم و درگیر نوشتن کوئری روی Dataframe نشم خیلی بهتره.
دیروز این اکستنش خفن مایکروسافت رو دیدم
Data Wrangler
باهاش کار کردم واقعا لذت بخش بود و واقعا سرعت کار رو زیاد میکرد و مجبور نبودی روی چیزی که دوست نداری تمرکز کنی و فقط روی نتیجه تمرکز میکنیی.
حتما به گیت هابش سر بزنید.
جالبش اینکه هم روی سلولهای Jupyter کار میکنه یعنی میتونید با کد pandas تغییرات مد نظر رو بدید و دیتافریم حاصل رو میگیره و روی تحلیل اولیه میزنه. و هم روی فایل CSV رو با ابزارهای تحلیلی باز میکنه و از عملیاتهایی که انجام میده کد تولید میکنه.
تا زمانی که این گیف رو نبینید متوجه نمیشید چه لعبتیه:)).
اگر تجربه کار کردن با csv رو داشته باشید و بخواهید یه کار تحلیلی دم دستی بکنید احتمالا مستقیم میرید سراغ notebook. حالا یا jupyter رو مستقیم توی بروزر اجرا کنید یا توی vscode.
وقتی واقعا جذاب نیست هنوز!
چون هی باید کد روی dataframe های پاندا بزنی مخصوصا جایی باشه کد زدنه واقعا اهمیت نداشته باشه و خروجی تحلیل موردی شما اهمیت بیشتری داشته. مثلا وقتی که بخواهید unique_count مقادیر هر ستون رو بگیرید. یا مثلا سریعتر بتونم چندتا چیز رو با هم فیلتر کنم و درگیر نوشتن کوئری روی Dataframe نشم خیلی بهتره.
دیروز این اکستنش خفن مایکروسافت رو دیدم
Data Wrangler
باهاش کار کردم واقعا لذت بخش بود و واقعا سرعت کار رو زیاد میکرد و مجبور نبودی روی چیزی که دوست نداری تمرکز کنی و فقط روی نتیجه تمرکز میکنیی.
حتما به گیت هابش سر بزنید.
جالبش اینکه هم روی سلولهای Jupyter کار میکنه یعنی میتونید با کد pandas تغییرات مد نظر رو بدید و دیتافریم حاصل رو میگیره و روی تحلیل اولیه میزنه. و هم روی فایل CSV رو با ابزارهای تحلیلی باز میکنه و از عملیاتهایی که انجام میده کد تولید میکنه.
تا زمانی که این گیف رو نبینید متوجه نمیشید چه لعبتیه:)).
Telegram
Dev Tweet Media
❤7👍1
آیندهی هوش مصنوعی
در این رشته توئیت مقایسه جالبی بین روند توسعه سرعت هواپیما و نرخ کلاک cpu با روند توسعه ai انجام داده که نکات خیلی جالبیداره. من چند تا نکتهش رو در ادامه میارم:
۱. مقایسه پیشرفتهای سریع در سرعت هواپیماها در دهه ۱۹۶۰ با پیشرفت فعلی در هوش مصنوعی نشان میده که همانطوری که روند افزایش سرعت هواپیماها در هوانوردی به یک سطح ثابت رسید، توسعه هوش مصنوعی نیز ممکنه با کندی مواجه شود. انتظار رشد مداوم در سرعت هواپیما آنقدر بالا رفته بود که مردم پیشاپیش رزرو پیشین پروازهای به ماه رو رزرو. میکردند چون مطمئن بودند این روند افزایش سرعت اینقدر ادامه داره که روزی با راحتی میشه با هواپیما به ماه سفر کرد. اما این اتفاق نیفتاد و این روند با محدودیتهای غیرمنتظرهای روبرو شد.
در فناوری این رو میشه به عنوان یک قاعده ی طلایی در نظر گرفت رشد که «رشد نمایی در نهایت به سیگموید تبدیل میشود» یعنی رشد در فناوری اغلب از یک روند نمایی پیروی میکند ولی در نهایت به سطحی ثابت میرسد و یک منحنی سیگموئیدی (Sigmoid) را تشکیل میدهد. این الگو در حوزههای مختلف فناوری مانند ثابت شدن سرعت کلاک CPUها هم دیده شد.
برای هوش مصنوعی، بهویژه مدلهای زبان بزرگ (LLMs) مانند GPT-3 و GPT-4، دو چالش اصلی میتواند مانع از توسعه بیشتر میشه:
۱. کیفیت دادهها: دسترسی به دادههای باکیفیت برای آموزش مدل کارآمد حیاتیه. امکان دارد که منبع دادههای ارزشمند در حال تمام شدن باشه یعنی شرکتهای بزرگ ai tech هر چی داده با کیفیت بود رو جمع کردند داده با کیفیت زیادی باقی نمونده این نکته توضیح میده که چرا مدلهای اخیر این شرکتها سطوح عملکرد مشابهی دارند و مدتیه جهش قابل توجهی در مدلهاشون ندارند.
۲. دادههای مصنوعی: در صورتی که دادههای طبیعی با کیفیت تموم شده باشند دادههای مصنوعی میتوانند به رفع خلأهای آموزشی خاص و بهبود تواناییهای مخصوص به حوزه کمک کنند، ممکن است جایگزین تنوع و غنای دادههای واقعی تولید شده توسط انسان نشوند.
علاوه بر این، افزایش اندازه یک مدل هوش مصنوعی لزوماً به معنای بهتر شدن عملکرد در کاربردهای عملی نیست، حتی اگر بهبود در معیارهای نظری مانند پیچیدگی (توانایی مدل در پیشبینی کلمه بعدی) را به همراه داشته باشد.
یک سوال مهم در پیشبینی آیندهی LLMها پاسخ به این سوال است که آیا مدلهای زبان بزرگ میتوانند واقعاً فهمیده و فراتر از دادههای آموزشی خود تعمیم دهند یا اینکه محدود به وظایفی هستند که صراحتاً در آنها نمایش داده شدهاند. اگر مدلهای زبان بزرگ واقعاً به دادههای آموزشی خود محدود باشند، پس افزایش دادهها دیگر مفید نخواهد بود زیرا تمام وظایفی که قرار است در آن نمایش داده شوند، قبلاً نمایش داده شدهاند. این میتواند به این معنا باشد که مدلهای زبان بزرگ، مانند سایر مدلهای یادگیری ماشین، به نقطه بازدهی کاهشی خواهند رسید.
۲. مدتها از زمان انتظار برای ارائهی GPT-5 میگذرد، تغییرات در تمرکز شرکتها، و تغییرات در انتظارات جامعه هوش مصنوعی ممکن است نشان دهنده این باشد که محدودیتهای مقیاسبندی مدلهای هوش مصنوعی در حال حاضر توسط کسانی که در خط مقدم تحقیقات هوش مصنوعی هستند، پذیرفته شده است.
انتشار سریع GPT-3.5 به دنبال GPT-4 منجر به توهمی شده که از سرعت پیشرفتهای مدلهای زبانی بزرگ را ایجاد کرده باشد. این رشته توئیت درکی واقعبینانهتر از هوش مصنوعی به عنوان بخشی از چرخه فناوری را ارائه میدهد.
در مجموع، در حالی که هوش مصنوعی پیشرفتهای قابل توجهی داشته است، با چالشهایی مواجه است که میتواند پیشرفت آن را کند کند، همانطور که سایر فناوریها در گذشته تجربه کردهاند. آینده مقیاسبندی هوش مصنوعی نامشخص است و صنعت در حال سازگاری با این مرحله از توقف است.
در این رشته توئیت مقایسه جالبی بین روند توسعه سرعت هواپیما و نرخ کلاک cpu با روند توسعه ai انجام داده که نکات خیلی جالبیداره. من چند تا نکتهش رو در ادامه میارم:
۱. مقایسه پیشرفتهای سریع در سرعت هواپیماها در دهه ۱۹۶۰ با پیشرفت فعلی در هوش مصنوعی نشان میده که همانطوری که روند افزایش سرعت هواپیماها در هوانوردی به یک سطح ثابت رسید، توسعه هوش مصنوعی نیز ممکنه با کندی مواجه شود. انتظار رشد مداوم در سرعت هواپیما آنقدر بالا رفته بود که مردم پیشاپیش رزرو پیشین پروازهای به ماه رو رزرو. میکردند چون مطمئن بودند این روند افزایش سرعت اینقدر ادامه داره که روزی با راحتی میشه با هواپیما به ماه سفر کرد. اما این اتفاق نیفتاد و این روند با محدودیتهای غیرمنتظرهای روبرو شد.
در فناوری این رو میشه به عنوان یک قاعده ی طلایی در نظر گرفت رشد که «رشد نمایی در نهایت به سیگموید تبدیل میشود» یعنی رشد در فناوری اغلب از یک روند نمایی پیروی میکند ولی در نهایت به سطحی ثابت میرسد و یک منحنی سیگموئیدی (Sigmoid) را تشکیل میدهد. این الگو در حوزههای مختلف فناوری مانند ثابت شدن سرعت کلاک CPUها هم دیده شد.
برای هوش مصنوعی، بهویژه مدلهای زبان بزرگ (LLMs) مانند GPT-3 و GPT-4، دو چالش اصلی میتواند مانع از توسعه بیشتر میشه:
۱. کیفیت دادهها: دسترسی به دادههای باکیفیت برای آموزش مدل کارآمد حیاتیه. امکان دارد که منبع دادههای ارزشمند در حال تمام شدن باشه یعنی شرکتهای بزرگ ai tech هر چی داده با کیفیت بود رو جمع کردند داده با کیفیت زیادی باقی نمونده این نکته توضیح میده که چرا مدلهای اخیر این شرکتها سطوح عملکرد مشابهی دارند و مدتیه جهش قابل توجهی در مدلهاشون ندارند.
۲. دادههای مصنوعی: در صورتی که دادههای طبیعی با کیفیت تموم شده باشند دادههای مصنوعی میتوانند به رفع خلأهای آموزشی خاص و بهبود تواناییهای مخصوص به حوزه کمک کنند، ممکن است جایگزین تنوع و غنای دادههای واقعی تولید شده توسط انسان نشوند.
علاوه بر این، افزایش اندازه یک مدل هوش مصنوعی لزوماً به معنای بهتر شدن عملکرد در کاربردهای عملی نیست، حتی اگر بهبود در معیارهای نظری مانند پیچیدگی (توانایی مدل در پیشبینی کلمه بعدی) را به همراه داشته باشد.
یک سوال مهم در پیشبینی آیندهی LLMها پاسخ به این سوال است که آیا مدلهای زبان بزرگ میتوانند واقعاً فهمیده و فراتر از دادههای آموزشی خود تعمیم دهند یا اینکه محدود به وظایفی هستند که صراحتاً در آنها نمایش داده شدهاند. اگر مدلهای زبان بزرگ واقعاً به دادههای آموزشی خود محدود باشند، پس افزایش دادهها دیگر مفید نخواهد بود زیرا تمام وظایفی که قرار است در آن نمایش داده شوند، قبلاً نمایش داده شدهاند. این میتواند به این معنا باشد که مدلهای زبان بزرگ، مانند سایر مدلهای یادگیری ماشین، به نقطه بازدهی کاهشی خواهند رسید.
۲. مدتها از زمان انتظار برای ارائهی GPT-5 میگذرد، تغییرات در تمرکز شرکتها، و تغییرات در انتظارات جامعه هوش مصنوعی ممکن است نشان دهنده این باشد که محدودیتهای مقیاسبندی مدلهای هوش مصنوعی در حال حاضر توسط کسانی که در خط مقدم تحقیقات هوش مصنوعی هستند، پذیرفته شده است.
انتشار سریع GPT-3.5 به دنبال GPT-4 منجر به توهمی شده که از سرعت پیشرفتهای مدلهای زبانی بزرگ را ایجاد کرده باشد. این رشته توئیت درکی واقعبینانهتر از هوش مصنوعی به عنوان بخشی از چرخه فناوری را ارائه میدهد.
در مجموع، در حالی که هوش مصنوعی پیشرفتهای قابل توجهی داشته است، با چالشهایی مواجه است که میتواند پیشرفت آن را کند کند، همانطور که سایر فناوریها در گذشته تجربه کردهاند. آینده مقیاسبندی هوش مصنوعی نامشخص است و صنعت در حال سازگاری با این مرحله از توقف است.
Telegram
Dev Tweet Media
Dev Tweet
آیندهی هوش مصنوعی در این رشته توئیت مقایسه جالبی بین روند توسعه سرعت هواپیما و نرخ کلاک cpu با روند توسعه ai انجام داده که نکات خیلی جالبیداره. من چند تا نکتهش رو در ادامه میارم: ۱. مقایسه پیشرفتهای سریع در سرعت هواپیماها در دهه ۱۹۶۰ با پیشرفت فعلی در…
این رشته توئیت از جهت نقد توهمات عوامانه در مورد قابلیتها و آیندههای هوش مصنوعی آوردم که گاهی آدمهای خیلی مهم رو هم درگیر خودش میکنه ولی خب اونها معمولا از دامن زدن به این توهمات یه چیزی گیرشون میاد...
البته من لزوما با هر چیزی که میذارم هم نظر نیستم ولی از جهت دیدن کلان ایدههای متفاوت به اینها میپردازم.
البته من لزوما با هر چیزی که میذارم هم نظر نیستم ولی از جهت دیدن کلان ایدههای متفاوت به اینها میپردازم.
👍4
Dev Tweet
ورژن قدیمیِ 《هوش مصنوعی باعث بیسوادی آدما میشه》
این باور معمولا از اونجا ناشی میشه که آدما هر چی بیشتر دانش low level(منظور سطح کیفی نیست منظور سطح انتزاعه) داشته باشن و از مکانیزم هر چیزی سر دربیارن خفنترن!
من خودم به شخصه دنبال خرید اشتراک برای سرویس های چت بات مثه GPT4 و Gemini و Claude AI هستم.
چند روزه دارم بررسی میکنم یه اشتراک به صرفه و مناسب کار خوردم رو بخرم.
امروز این بررسی Wall Street Journal رو دیدم.
سرویس Perplexity بهترین سرویس شده در بین فاکتورهای مقایسه و بدترین هم Copilot!
البته مقایسه Perplexity با GPT و Claude و Gemini کار غلطیه.
سرویس Perplexity باید با You.com و Peo.com و Copilot مقایسه بشه.
منبع
چند روزه دارم بررسی میکنم یه اشتراک به صرفه و مناسب کار خوردم رو بخرم.
امروز این بررسی Wall Street Journal رو دیدم.
سرویس Perplexity بهترین سرویس شده در بین فاکتورهای مقایسه و بدترین هم Copilot!
البته مقایسه Perplexity با GPT و Claude و Gemini کار غلطیه.
سرویس Perplexity باید با You.com و Peo.com و Copilot مقایسه بشه.
منبع
👍2
Dev Tweet
من خودم به شخصه دنبال خرید اشتراک برای سرویس های چت بات مثه GPT4 و Gemini و Claude AI هستم. چند روزه دارم بررسی میکنم یه اشتراک به صرفه و مناسب کار خوردم رو بخرم. امروز این بررسی Wall Street Journal رو دیدم. سرویس Perplexity بهترین سرویس شده در بین فاکتورهای…
اگر شما تجربه خرید اشتراک رو دارید بنویسید از چه سرویسی استفاده میکنید راضی هستید یا نه.
من خودم دارم متقاعد میشم برم اشتراک text.cortex رو بگیرم.
بعدا توضیح میدم چرا.
من خودم دارم متقاعد میشم برم اشتراک text.cortex رو بگیرم.
بعدا توضیح میدم چرا.
گندکاری جدید گوگل با AI Overview
دقت کرده باشید گوگل بالای سرچهایش جدیدا یک چیزی میاره تحت عنوان AI Overview یک کادر صورتی رنگ داره.
شبیه چیزی که Bing با کمک GPT4 h آورده بود بهش میگفت Deep search.
ولی در این چند روزه که عرضه شده با جوابهای شدیدا گمراه کننده شدیدا گند بالا آورده!
مثلاهایش را پائین با عکس ضمیمه میکنم.
ببخشید اگر بعضی مثالها بی ادبانه است.
منبع مثالها برای دیدن مثالهای بیشتر.
دقت کرده باشید گوگل بالای سرچهایش جدیدا یک چیزی میاره تحت عنوان AI Overview یک کادر صورتی رنگ داره.
شبیه چیزی که Bing با کمک GPT4 h آورده بود بهش میگفت Deep search.
ولی در این چند روزه که عرضه شده با جوابهای شدیدا گمراه کننده شدیدا گند بالا آورده!
مثلاهایش را پائین با عکس ضمیمه میکنم.
ببخشید اگر بعضی مثالها بی ادبانه است.
منبع مثالها برای دیدن مثالهای بیشتر.
X (formerly Twitter)
Jeremiah Johnson 🌐 (@JeremiahDJohns) on X
Google's new AI search results are having quite the week. Here's a thread with some of my favorite answers: