دستاوردهای یادگیری عمیق(InTec) – Telegram
دستاوردهای یادگیری عمیق(InTec)
9.53K subscribers
363 photos
40 videos
44 files
674 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
اینکه راجب این مدل و دیتاست اون (هردو رایگان منتشر شده) بعد زا ۴ روز هیچ چیزی نشنیدم چیزی هست که آزار دهنده هست.
اینکه ۱۰۰۰ تا پست راجب chatgpt 5.1 دیدم ولی راجب این به سختی ۱ پست تازه همین هم به لطف ابزاری که برای کرال کردن و خلاصه ‌کردن مطالب مفید اجرا دارم دیدم.

داستان چیه ؟
متا یک مدل ASR جدید + دیتاست منتشر کرده که بیش از 1600 زبان رو شناسایی می‌کنه حتی شاید بشه گفت کم استفاده‌ترین زبان‌های موجود رو و مدل‌هاش رو هم توی سایز های مختلف منتشر کرده.
من کدهای دموی خودش رو اجرا کردم نتایجش خوب بود.

خیلی پروژه‌های شخصی و کارهای قشنگی میشه با این مدل‌ها کرد:
Meta OmniLingual
👍155
Antigravity

یک مقدار باگ داره ولی اذیت نمی‌کنه (روی لپ‌تاپ تست اولیه زدم ولی چیز خوبیه!)

تازه که کرسر اومده بود همچین وضعیتی داشت ولی با توجه به اینکه گوگل پشت این قضیه هست فکر نمی‌کنم فیکس کردنش خیلی طولانی باشه.

من با اکانت تمیز + vpn تست کردم؛ کارم تموم شد روی این سیستم هم تست می‌کنم اگر محدودیت داشت اطلاع میدم!

درنهایت اینکه ؛ برای استفاده شخصی رایگان هست ولی احتمال ۹۹٪ از دیتاها برای ترین مدل‌هاش استفاده می‌کنه (اینم جک خواهم کرد)

Download Link
👍153
دستاوردهای یادگیری عمیق(InTec)
Antigravity یک مقدار باگ داره ولی اذیت نمی‌کنه (روی لپ‌تاپ تست اولیه زدم ولی چیز خوبیه!) تازه که کرسر اومده بود همچین وضعیتی داشت ولی با توجه به اینکه گوگل پشت این قضیه هست فکر نمی‌کنم فیکس کردنش خیلی طولانی باشه. من با اکانت تمیز + vpn تست کردم؛ کارم…
Gemini Pro 3

قطعا مدل عالی‌ای هست؛ شکی ندارم.
ولی
Antigravity

آشغال هست؛ تست بیشتر انجام دادم.

Back to neovim + Gemini 3 Pro



https://gemini.google.com/app

مدل دیگه‌ای که معرفی شده :
Grok4.1
هست؛ بدون تعارف Grok4 یکی از بهترین مدل‌هایی بود که ازش استفاده می‌کردم!

پینوشت:
Grok4.1
که اتفاقا دسترسی رایگان هم داره refactor خیلی خوب انجام میده و البته سرعت بهتری هم داره؛ کار امشب در اومد.
تست این دو مدل جدید با بنچمارک کد اختصاصی خودم!
👍2512
دستاوردهای یادگیری عمیق(InTec)
+ Nano Banana Pro
اگر از این مدل بخواید براتون تصاویر واقعی تولید کنید (مثلا تصاویر شهر و خیابون) بسیار عالی اینکار رو انجام می‌ده. این موضوع برای باقی تصاویر تولید شده در سبک واقعی هم صادق هست.

با توجه به اینکه توی مدل‌های قبلی تمرکز گوگل برای مدل‌های تولید عکس روی قابلیت in-painting بوده؛ من فکر می‌کنم از یک تکنیک مشابه استفاده کرده؛ شخصا اینکار رو تست کردم :

قبلتر برای یک پروژه تولید تصویر که اتفاقا واقعی بودنش برامون مهم بود؛ بجای اینکه تصاویر رو از نویز تولید کنم سعی کردم اونها رو از تصاویر mask شده تولید کنم. بطوریکه برای تمام تصاویر تصویر رفرنس به مدل داده می‌شد و تصویری که کاربر درخواست داده بر اساس معمولا ترکیب ۲ تا ازین رفرنس‌ها تولید می‌شد.
اون زمان پروژه خیلی سختی بود اما نتایج قابل قبولی داشت.

توی کار من به کمک Image2Text برای تصاویر رفرنس تگ‌های لازم تولید شده بود؛ چرا فکر می‌کنم nano bana pro هم داره ازین تکنیک استفاده می‌کنه ؟ تجربه!

۱- قبل از تولید تصویر اگر راجب چیزی صحبت کنید که نمی‌دونه؛ سرچ انجام میشه. (می‌تونه عکس رفرنس جدید پیدا کنه)

ادامه پست بعدی ...
👍152
دستاوردهای یادگیری عمیق(InTec)
اگر از این مدل بخواید براتون تصاویر واقعی تولید کنید (مثلا تصاویر شهر و خیابون) بسیار عالی اینکار رو انجام می‌ده. این موضوع برای باقی تصاویر تولید شده در سبک واقعی هم صادق هست. با توجه به اینکه توی مدل‌های قبلی تمرکز گوگل برای مدل‌های تولید عکس روی قابلیت…
۲- بعضی وقتا جزئیات خیلی ریز رو به راحتی و عالی تولید می‌کنه؛ مثلا ازش بخواید یک آدم رو وسط خیابونای تهران ازش عکس تولید کنه.
جزئیاتی مثل برگ درخت و زاویه تابش و ... همگی عالی هستند (بخش کلی رو مدل دست بهش نمیزنه)
تمرکز مدل هم روی آدمی هست که خواستید؛ جزئیات بدن اون آدم توی تصویر هم کاملا درست هست.
اما توی همون راستا به جزئیات نوشته‌های تابلوهای نزدیک به اون آدم (موضوع اصلی Generation دقت کنید) پیکسل‌ها و اطلاعات نزدیک به آبجکتی که تولید شده بهم ریخته میشه.

۳- من هم توی پروژه‌ای که کار کردم همین موارد رو دیدم؛ برای تست بهتر می‌تونید ترکیب دوتا عکسی رو بخواید که پس زمینه شلوغ باشه (عکس هم ازون نقطه کم باشه) + آبجکت مدنظر رو وسط اون شلوغی بخواید.


توی تصویر بالا دقت کنید؛
جزئیات اصیی ساختمون‌ها؛ تابلوهای دوراتر؛ درخت‌ها و ... درست هست اما هرچقدر به درخواست اصلی (۱۰ تا برنامه‌نویس وسط ولیعصر کد بزنند) نزدیک می‌شیم جزئیات بهم ریخته تر میشه: تابلوهارو ببیند؛ یا نوشته روی اتوبوس؛ مانیتور

حتی به صورت این ۱۰ نفر و آدمای اطراف دقت کنید؛ افرادی که نزدیکتر هستند صورتشون بهتر تولید شده و افرادی که فاصله بیشتری دارند انگار صورت‌های بهم ریخته هست.
برید روی گوگل مپ و تصاویر خیابون‌هایی که آدم داخلش هست رو ببینید؛ صورت‌ها روی برای privacy گوگل mask کرده و تقریبا هم افکت مشابهی بهتون میده اگر از Banana بخواید اون ماسک‌ها رو با صورت جایگزین کنه.
این مورد برای پلاک‌های ماشین‌ها هم اتفاق میوفته؛ توی عکس بعدی که تولید می‌کنید خیالون رو شلوغ در نظر نگیرید؛ و به پلاک ماشین‌ها توجه کنید.

خلاصه که شخصا فکر می‌کنم؛ تمرکز گوگل بیشتر روی In-painting هست تا هرچیز دیگری
👍144
ادیت نمی‌زنم؛ یکی از دوستان توی گروه نظرم راجب Deepseek 3.2 رو پرسیدند:

پاسخ بنده :
چند روزه دارم ازش استفاده می‌کنم

درکش راجب مسائلی که دیتا به اندازه کافی روی اینترنت داره خوبه
یا مسائلی که خودتون بهش میدید ولی کانتکست بزرگی داره

خوبیش نسبت به Gemini3 Pro اینه که حتی استفاده رایگانش هم زیاد میاد.

نسبت به باقی موارد مثل z.ai, ... که توی کانال قبلتر گفتم هم :
اینه که متن بیشتری از چت قبلی رو بنظر میاد نگه میداره یا attention بهتری داره

فرض کن توی پیام ۵ام ازش یک راهکاری خواستی
پیام ۶ و ۷ رو فرستادی و به یک راهکار کاربردی رسیدی (چت‌های طولانی)

پیام ۸ به یک راهکار optimize تر رسیدی بر اساس توضیحات چت‌های قبلی و ...

اگر بهش بگی راهکارهای قبلی رو فراموش کن و این راهکار رو دنبال کن و بگو چطوری مسئله رو حل کنم

اینو می‌فهمه، توی چت‌های خیلی طولانی z.ai , grok , chatgpt اگر مباحث چت‌های این وسط خیلی شبیه به هم باشه قاطی می‌کنند

این تا اینجا اینطوری نبوده برای من
36👍6
RandRng
Message
این پست خارج از بحث کانال هست ولی چون این اواخر خیلی بهم پیام داده شده
ترجیح دادم بصورت عمومی توی کانال اعلام کنم!

که حداقل خودتون حواستون رو جمع کنید!
38👍8
خیلی سعی کردم این پست رو نذارم ولی خیلی صحبت‌ها شد.

پزشکیان یک سخنرانی کرده که نتیجه‌اش می‌شه؛ هوش مصنوعی بدرد نمی‌خوره.

این بود که گفتم:
رئیس جمهور گاوتون، ضربه آخر رو به پیکر بی‌جان هوش مصنوعی زد


درسته این آقا انقدر گاو بود که گردنش انداختند تا ضربه آخر رو بزنه.
اما هوش مصنوعی رو قبلتر ازین نابود کردند، گاوهای قبلتری تلاش‌های بسیار کردند و پول‌های کلان رو به اسم هوش مصنوعی به دوستان و همنوعان خودشون رانت دادند.


۹۹٪ این اواخر که دیگه هیچ حرفی نمی‌زنم و اعتراضی ندارم چون امیدی به درست شدن نیست، شما تا وقتی اعتراض می‌کنی که فکر می‌کنی امکان درست شدنش هست شاید کسی ندیده یا نفهمیده.
👍1066
تعداد زیادی مدرس الکی اون بیرون هست که کد زدن با chatgpt رو آموزش میده.

توی مواردی که من دیدم معمولاً ۹۰٪ خودشون هم سواد کافی ندارند و همین باعث یک سری صحبت‌های آبکی و دوزاری میشه توی این دوره‌ها.

کنار این آدم‌ها هم ۲۰-۳۰٪ سنیور الکی داریم که متأسفانه من هم باهاشون برخورد داشتم.
این گروه هم فکر می‌کنند AI تا آخر ۲۰۲۶ جای برنامه‌نویس‌ها رو خواهد گرفت (نظرشون اینه که دیتاسنترهای جدید که بهره‌برداری بشه، کار در میاد)

بدون تعارف بگم، اگر از کسی این رو شنیدید که برنامه‌نویسی با حضور AI جزو مشاغلی هست که حذف میشه؛ شک نکنید طرف سواد کافی نداره.
مدل‌های LLM فقط و فقط می‌تونند جای Junior ها رو بگیرند، اونم جونیورهایی که فقط کد زدن یادگرفتند و نه اون‌هایی که استانداردهای توسعه نرم‌افزار و الگوریتم و ... رو یادگرفتند، چند وقت پیش توی یک جایی مثال زدم:

بهتره LLM رو مثل کارآموزی فرض کنید که ۱-۲ سال کنار ۱۰ تا سنیور نشسته فقط از رو دست اون‌ها کد کپی کرده ولی هیچوقت پشت قضیه رو نخونده


یک چنین کارآموزی می‌تونه کدهای نمونه‌ای به شما تحویل بده که توی سطح سنیور هست اما نمی‌تونه با شما راجبش بحث کنه
می‌تونه کار استاندارد بهتون تحویل بده ولی دلیل استاندارد بودن کارش رو نفهمیده و ...

هیچ نیروی فنی‌ای به این آدم، لقب سنیور نخواهد داد.

یک پستی چند مدت پیش توی کانال Rust گذاشتم:
https://news.1rj.ru/str/pyrust/187

این ویدئو رو ببینید، مفاهیمی که صحبت می‌شه رو گوش بدید و تلاش کنید از LLM این خروجی رو بگیرید.
هیچکدوم از مدل‌ها حتی سمت این موارد هم نمی‌رند مگر اینکه دقیقاً اشاره کنید که چی می‌خواهید و برای کدوم بخش کد می‌خواید اینکار رو کنید.

بله LLM خوب هست ولی در همون حد کارهای ساده و روزمره، اگر کد یا پروژه جدی‌ای رو دارید توسعه می‌دید.
خیلی روش حساب نکنید.

در نهایت:
فکر می‌کنم متن بالا جواب پرتکرار ترین سوال هم باشه، برنامه‌نویسی یاد بگیریم یا نه ؟
بله؛ حتماً یاد بگیرید الان بهترین زمان هست.
61👍23
Forwarded from Python Hints
خیلی درده، وقتی هیچی واسه از دست دادن نداری.
110👍3
Forwarded from Python Hints
ی جمله‌ی معروفی هست:
«در جنگ‌ها، این سربازان‌اند که کشته می‌شوند، نه رهبران.»


در اعتراض به دزدی، اختلاس، ناکارآمدی و فساد و ... هم

دزد و مختلس و مسئولِ ناکارآمد در آرامش‌اند،
اما
این معترض و محافظ‌اند که روبه‌روی هم وایساده و همدیگر را می‌کشند.
معترض می‌دونه برای چی اعتراض می‌کند.
اما آقای محافظ…
تو هم می‌دانی از چی داری دفاع می‌کنی؟
55👍24
Forwarded from Python Hints
کانال randrng انقدر ریپورت شد که بسته شد 😂

چرا ؟!؟

چون بورس تهران و بانک کشاورزی شمارو به فراخوان و اعتراض دعوت کردند.

درحال پیگیری با تلگرام هستم.

پینوشت:
مشکل mass report بوده مثل اینکه.
درحال پیگیری پروسه هستم، چون هیچکدوم از قوانین تلگرام رو نقض نکردم!
اگر برگشت؛ درجریان خواهید بود.


آقا به من چه که اکانت‌های

بانک کشاورزی
معاملات بورس تهران


روی لینکدین فراخوان تجمع میدند ؟
من فقط دیدم اکانت رسمی هست گذاشتم، ببینم شما هم دیدید ؟
21👍3
Forwarded from Python Hints
ممکنه این کانال @pyhints و کانال @pytens و همچنین @pyrust هم ریپورت بشه.

چون با mass report طرف هستیم.
کانال‌ها هم که عمومی هست و برای ریپورت کردن نیازی به عضو شدن نیست.

برنامه‌ای برای جایگزین کردن کانال‌ها بصورت عمومی ندارم؛ اگر فکر می‌کنند با ریپورت کردن کانال‌های من ۴۷ سال دزدی و اختلاس و بی‌کفایتی و ... حل می‌شه
و
مشکلات از بین میره؛ حتماً اینکار رو بکنند.

شاید تلگرام باید یک راهکاری هم می‌ذاشت که کاربرهای کانال هم بتونند نظر یا حمایت شون رو اعلام کنند، بخصوص به وقت mass report با این همه گفتم زودتر اعلام کپینوش


پی‌نوشت‌:
اگر این اتفاق افتاد برای دوستان نزدیک لینک خصوصی خواهم فرستاد.
مثل روزهای اول @pytens و البته خصوصی خواهد بود.
50👍1