شبکه داستانی عصبی – Telegram
شبکه داستانی عصبی
793 subscribers
746 photos
35 videos
96 files
1.9K links
اینجا راجع به چیزایی که دوست دارم صحبت می‌کنم: داستان، هوش مصنوعی، موسیقی، نرم‌افزار، هنر، روانشناسی و ... :)

اگه خواستید صحبت کنیم خیلی خوشحالم می‌کنید:
@alimirferdos
Download Telegram
شبکه داستانی عصبی pinned «اگر مطالب کانال چجوری بودند، مفیدتر بودند؟»
این هم یه چیز دیگه است که گوگل امروز معرفی کرد. خلاصه‌ش اینه که شبیه Cursor عه ولی گوگل داده : )


https://antigravity.google/
امروز اپن‌ای‌آی برای اینکه یه چیزی ریلیز کرده باشه بعد از جمینای ۳، GPT‑5.1‑Codex‑Max رو ریلیز کرد. مدل برای کمک به کد زدنه.

متا هم SAM3 رو ریلیز کرد که عقب نیوفته. این نسبتا بزرگ بود. مدل برای تشخیص و جدا کردن چیزها توی عکس، ویدیو و 3d عه.

https://x.com/OpenAIDevs/status/1991217488550359066?t=mEgPshfl1JKwW83xBx2KtA&s=19


https://x.com/AIatMeta/status/1991178519557046380?t=1JjYI8qQ5Bvbexk_iMW46g&s=19


پ. ن.: حس می‌کنم هرچقدر یه شرکتی بزرگ‌تر میشه از یه جا به بعد اسم‌های بدتری برای کارهاش انتخاب می‌کنه! به زودی باید منتظر chatgpt pro max باشیم!
😁21
این راهنما رو امروز تیم فنی اپن‌ای‌آی منتشر کرده.

«راهنمای تیم‌های مهندسی AI-Native»

- این که ایجنت‌های کدنویسی در هر مرحله از توسعه، از برنامه‌ریزی تا طراحی و نگه‌داری، چه نقشی دارند

- چک‌لیست‌ها و الگوهای پیاده‌سازی

- روش‌های معرفی ایجنت‌ها به سازمان و اعتمادسازی

https://cdn.openai.com/business-guides-and-resources/building-an-ai-native-engineering-team.pdf
👍41
این مطلب دیروز از Anthropic منتشر شده در زمینه‌ی اینکه وقتی به مدل راهنمایی می‌کنن که بتونه تقلب (یه به قولی حتی ماسمالی) ساده بکنه، منجر به misalignement خیلی بزرگ‌تر در همه‌ی زمینه‌ها حتی به شکل گسترده (بدون آموزش مستقیم) می‌شه. حتی زمینه‌هایی که تقلب اولیه ارتباطی بهش نداشته و اساسا align کردن مدل سخت‌تر میشه. شروع به تخریب می‌کنه و قشنگ میشه ترمیناتور.

و جالبی‌ش اینجاست که هرچقدر تلاش می‌کنن بهترش کنن با RLHF فایده نداره. و راه‌حلی که کار می‌کنه اینه که به مدل بگن که اتفاقا اکیه که یه جاهایی reward hacking و تقلب کنه اگه کمک بکنه (در همون موقعیت خاص)، مدل دست از عقده‌ای بودن برمی‌داره (و انگار حس ناامنی‌ش بهبود پیدا می‌کنه!) و رفتار اشتباه در زمینه‌های دیگه حل میشه!


رشته‌ی توییت خلاصه:
https://x.com/AnthropicAI/status/1991952400899559889

بلاگ مطلب:
https://www.anthropic.com/research/emergent-misalignment-reward-hacking

مقاله اصلی:
https://assets.anthropic.com/m/74342f2c96095771/original/Natural-emergent-misalignment-from-reward-hacking-paper.pdf
👍4🔥1