NEW BOT Телеграм, страница

AI Pulse

گوگل اعلام کرده که کاربران اپلیکیشن Gemini حالا می‌تونن هم تصاویر تولیدشده توسط هوش مصنوعی و هم عکس‌هایی که از گوشی یا کامپیوترشون آپلود می‌کنن رو مستقیماً ویرایش کنن. این قابلیت که از امروز به‌صورت تدریجی فعال می‌شه، به‌مرور در دسترس کاربران در بیشتر کشورها قرار می‌گیره و پشتیبانی از بیش از ۴۵ زبان رو هم شامل می‌شه.

ابزار جدید Gemini که شبیه نسخه‌ به‌روزرسانی‌شده‌ی ChatGPT در ویرایش تصویر عمل می‌کنه، از یک فرآیند چندمرحله‌ای استفاده می‌کنه تا به درخواست‌های کاربر پاسخ‌های دقیق‌تر و ترکیبی از متن و تصویر بده. با این ابزار می‌شه بک‌گراند تصویر رو عوض کرد، اشیاء رو جابه‌جا کرد یا عناصر جدیدی به تصویر اضافه کرد.

گوگل می‌گه برای جلوگیری از سوءاستفاده و نگرانی‌های مربوط به دیپ‌فیک، همه‌ی تصاویر ویرایش‌شده با Gemini دارای واترمارک نامرئی خواهند بود و این شرکت در حال تست واترمارک‌های قابل‌مشاهده هم هست.

@aipulse24

👍10❤4🔥3

2.19K viewsMohammad, 13:36

AI Pulse

یه مقاله‌ی تازه از تیم تحقیقاتی Cohere، دانشگاه‌های استنفورد، MIT و AI2، سازمان LM Arena رو متهم کرده که شرایطی فراهم کرده تا چند شرکت خاص هوش مصنوعی، از جمله Meta، OpenAI، Google و Amazon، امتیازهای بهتری در پلتفرم معروف Chatbot Arena کسب کنن.

طبق این مقاله، شرکت‌هایی مثل Meta تونستن نسخه‌های مختلفی از مدل‌هاشون رو به‌صورت خصوصی توی این پلتفرم آزمایش کنن، ولی فقط نتایج مدل‌هایی که خوب عمل کرده بودن منتشر شده. این یعنی بدون اینکه بقیه شرکت‌ها از این فرصت بهره‌مند باشن، چند شرکت خاص تونستن مدل بهتری ارائه بدن و جایگاه بالاتری توی جدول رتبه‌بندی بگیرن.

‏Chatbot Arena که سال ۲۰۲۳ به‌عنوان یه پروژه‌ی تحقیقاتی از دانشگاه UC Berkeley شروع شد، به‌سرعت تبدیل شده به یکی از معیارهای محبوب برای مقایسه مدل‌های هوش مصنوعی. شیوه‌ی کارش این‌طوریه که دو مدل کنار هم قرار می‌گیرن، کاربر یکی رو انتخاب می‌کنه و رای‌ها در طول زمان امتیاز نهایی مدل رو مشخص می‌کنن.

با این حال، مقاله می‌گه برخلاف ادعای بی‌طرف بودن LM Arena، شرکت Meta بین ژانویه تا مارس، ۲۷ مدل مختلف رو به‌صورت خصوصی تست کرده ولی در نهایت فقط امتیاز یه مدل قوی رو منتشر کرده — همونی که بعداً در صدر جدول قرار گرفت.

‏LM Arena توی جوابیه‌ای که برای TechCrunch فرستاده، مقاله رو پر از "اشتباه" و "تحلیل‌های مشکوک" دونسته و گفته که امکان تست برای همه‌ی شرکت‌ها بازه و اگه شرکتی تست بیشتری انجام داده، به این معنی نیست که بقیه ناعادلانه برخورد شدن. با این حال، نویسنده‌های مقاله می‌گن این سطح از دسترسی فقط به تعداد محدودی شرکت اطلاع داده شده بوده.

نویسنده‌های مقاله که از نوامبر ۲۰۲۴ شروع به بررسی داده‌ها کردن، می‌گن بیش از ۲.۸ میلیون نبرد بین مدل‌ها رو در طول پنج ماه تحلیل کردن و به این نتیجه رسیدن که بعضی شرکت‌ها نه‌تنها بیشتر تونستن مدل تست کنن، بلکه مدل‌هاشون هم بیشتر وارد رقابت شده‌ن و داده‌های بیشتری جمع کردن — چیزی که به مدل‌ها توی تمرین و بهبود عملکرد کمک کرده.

در حالی‌که بعضی از اطلاعات مقاله با تکیه بر «خوداظهاری» مدل‌ها درباره اینکه ساخت کدوم شرکت‌ان جمع‌آوری شده (که روش دقیقی نیست)، سارا هوکر می‌گه وقتی یافته‌های اولیه با LM Arena به اشتراک گذاشته شده، اونا مخالفتی نکردن.

در پایان، نویسنده‌های مقاله از LM Arena خواستن تغییراتی در روند خودش ایجاد کنه؛ از جمله اینکه سقف مشخصی برای تست‌های خصوصی تعیین بشه، نتایج این تست‌ها به‌صورت عمومی منتشر بشه و نرخ نمایش مدل‌ها توی نبردها برای همه‌ی شرکت‌ها یکسان بشه. LM Arena بعضی از این پیشنهادها رو پذیرفته، اما گفته منتشر کردن امتیاز مدل‌هایی که هنوز عرضه نشدن، منطقی نیست.

این مقاله در حالی منتشر شده که Meta چند هفته پیش هم بابت دستکاری رتبه‌ها در زمان عرضه‌ی Llama 4 خبرساز شده بود. حالا هم LM Arena اعلام کرده قراره شرکت راه بندازه و سرمایه جذب کنه — موضوعی که پرسش‌های تازه‌ای درباره‌ی استقلال و شفافیت این سازمان مطرح می‌کنه.

نسخه کامل این مقاله رو میتونید از اینجا دانلود و مشاهده کنید.

@aipulse24

👍17❤5💔2

2.86K viewsMohammad, 15:33

AI Pulse

گوگل روز سه‌شنبه نسخه جدیدی از مدل هوش مصنوعی پرچمدارش، یعنی Gemini 2.5 Pro Preview (نسخه I/O) رو معرفی کرد؛ مدلی که به گفته‌ی شرکت، تونسته از بسیاری از رقبای شناخته‌شده در بنچمارک‌های معتبر جلو بزنه. این نسخه از طریق API جمنای، پلتفرم‌های Vertex AI و AI Studio در دسترسه و قیمتش با همون نسخه‌ی Gemini 2.5 Pro یکیه. گوگل همچنین این مدل رو توی اپلیکیشن Gemini مخصوص وب و موبایل هم فعال کرده.

انتشار این مدل دقیقاً قبل از کنفرانس سالانه‌ی توسعه‌دهنده‌های گوگل با عنوان I/O انجام شده، و به همین خاطر بهش لقب "نسخه I/O" دادن. انتظار می‌ره گوگل در این رویداد، مجموعه‌ای از مدل‌های جدید و ابزارهای مجهز به هوش مصنوعی رو معرفی کنه. این شرکت در رقابتی تنگاتنگ با رقبایی مثل OpenAI و xAI قرار گرفته؛ شرکت‌هایی که به‌زودی مدل‌هایی با عملکرد بالا عرضه می‌کنن.

به‌گفته‌ی گوگل، Gemini 2.5 Pro Preview (نسخه I/O) پیشرفت چشم‌گیری توی زمینه‌هایی مثل کدنویسی، ویرایش و تبدیل کد و ساخت اپ‌های تعاملی وب داشته. این مدل تونسته رتبه‌ی اول بنچمارک WebDev Arena رو از آن خودش کنه؛ معیاری که عملکرد مدل‌ها در ساخت وب‌اپ‌های زیبا و کاربردی رو می‌سنجه. همچنین در حوزه‌ی درک ویدیو، امتیاز ۸۴.۸٪ در بنچمارک VideoMME کسب کرده. گوگل می‌گه این نسخه، دقت فراخوانی توابع رو بهتر کرده و نسبت به بازخوردهای توسعه‌دهنده‌ها واکنش نشون داده؛ ضمن اینکه "سلیقه‌ی خوبی در طراحی صفحات وب" داره.

@aipulse24

❤15👍7

3.05K viewsMohammad, edited 10:47