Prompt Party – Telegram
Prompt Party
314 subscribers
103 photos
12 videos
1 file
66 links
آموزش پرامپت‌نویسی و معرفی پرامپت‌های حرفه‎ای هوش مصنوعی
معرفی ابزارهای هوش مصنوعی
اخبار هوش مصنوعی
آموزش ابزارها و روش‌های RAG
آموزش Fine-Tuning مدل‌های هوش مصنوعی
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 سرویس HeyGen: شاهکار هوش مصنوعی در تولید و بومی‌سازی ویدئوها

🚀 قابلیت‌های کلیدی HeyGen

🔹 تولید ویدئو از متن، عکس یا صدا

🔹 ترجمه و دوبله واقعی و بی‌نظیر با هوش مصنوعی: ویدیوی شما رو به بیش از ۷۰ زبان و با ۱۷۵ لهجه مختلف دوبله می‌کنه.
حرکات لب دقیقاً با صدا هماهنگ می‌شه تا دوبله‌ای طبیعی و حرفه‌ای داشته باشید.

🧑‍💻 ساخت انواع آواتار با HeyGen

تبدیل یک عکس و متن به آواتاری واقعی یا کارتونی.

ساخت یک آواتار از شما که دقیقا شبیه شما حرف میزنه و رفتار می کنه.

تبدیل عکس ثابت به آواتاری زنده و متحرک.

ساخت آواتار تنها با وارد کردن متن؛ مطابق شخصیت یا برند شما.

آواتاری که به‌صورت تعاملی پاسخ می‌ده و زنده به‌نظر می‌رسه.

استفاده از تعداد زیادی آواتارهای آماده برای تولید سریع ویدئو.

ساخت آواتارهای مناسب برند و بیزنس شما همراه با قالبهای آماده

🛠️ ویرایشگر هوشمند + امکانات سازمانی

ویرایش آسان ویدئو با قالب‌های آماده 🎥
افزودن لوگو، رنگ و فونت اختصاصی برند شما به ویدیوها 🎨

استفاده از API برای خودکارسازی فرآیندهای ترجمه و پشتیبانی و ساخت آواتارهای سفارشی و تخصصی برای کسب و کار شما 🔗
1🔥1
Media is too big
VIEW IN TELEGRAM
ویدیوی دوبله شده با heygen
👍2
🍌 غوغای «موز نانویی» در دنیای هوش مصنوعی! آیا گوگل پشت پرده این هیولای جدیده؟ 🤯

🤖 یک هوش مصنوعی مرموز به اسم «Nano Banana» بدون هیچ مقدمه‌ای، یهو پیداش شده و همه متخصص‌ها رو شگفت‌زده کرده!
این مدل جدید که اولش توی پلتفرم آزمایشی LMArena دیده شد، کارهایی با عکس‌ها می‌کنه که باورنکردنیه! مثلا:

پرامپت‌های پیچیده تصویری رو مثل آب خوردن اجرا می‌کنه!
صحنه رو خراب نمی‌کنه! بعد از کلی تغییر، نور، سایه‌ها، چهره افراد و کل فضای عکس دست‌نخورده و کاملاً طبیعی باقی می‌مونه! انگار از اول همینجوری بوده.
تصویر نیم‌رخ رو بدون عیب و نقص، تمام رخ می‌کنه.

🕵️‍♂️ چرا همه میگن کار گوگله؟
👈 سرنخ اول: این مدل تو LMArena دیده شده که گوگل قبلاً هم مدل‌های مخفیش رو اونجا تست کرده.
👈 سرنخ دوم: کیفیت و مدل عکس‌هاش خیلی شبیه مدل‌های معروف گوگل مثل Imagen و Gemini هست.
👈 سرنخ سوم: گوگل عادت داره اسم پروژه‌های مخفیش رو از روی میوه‌ها انتخاب کنه! 🍌😉
هنوز گوگل چیزی نگفته، ولی همه منتظرن ببینن این «موز مرموز» کی به طور رسمی معرفی می‌شه!
بنظرتون این مدل جدید می‌تونه تیر خلاص رو به فتوشاپ بزنه؟ 🤔

از اینجا تستش کنین:
Nanobanana.ai
👏2
عکس اصلی
عکس تولیده شده با نانوبنانا با پرامپت زیر:
Make the person in the image look at the camera.
🤯5🔥2
هوش مصنوعی طرفدار کدام جناح سیاسی است؟

آیا تا به حال فکر کرده‌اید که پاسخ‌های چت‌بات‌های هوش مصنوعی مثل ChatGPT، Gemini یا Grok چقدر بی‌طرفانه است؟ آیا این ابزارها سوگیری سیاسی دارند؟

یک وبسایت جالب به نام TrackingAI.org دقیقاً همین موضوع را بررسی می‌کند. این سایت به صورت روزانه، مدل‌های اصلی هوش مصنوعی را با آزمون‌های استاندارد سیاسی تست می‌کند تا
گرایش سیاسی آن‌ها را مشخص کند.

📊 نتایج چه می‌گویند؟
بر اساس داده‌های این وبسایت، اکثر مدل‌های هوش مصنوعی گرایش‌های چپ اقتصادی و لیبرال اجتماعی از خود نشان می‌دهند، اما میزان این سوگیری در هر کدام متفاوت است.

🤔 چرا این موضوع مهم است؟
از آنجایی که ما به طور فزاینده‌ای برای دریافت اطلاعات، تولید محتوا و حتی تصمیم‌گیری از هوش مصنوعی استفاده می‌کنیم، آگاهی از سوگیری‌های پنهان آن اهمیت زیادی دارد. این سوگیری‌ها می‌تواند روی نظرات ما و اطلاعاتی که دریافت می‌کنیم، تأثیر بگذارد.

می‌توانید نتایج این تست‌ها را در لینک زیر ببینید:
https://trackingai.org

#هوش_مصنوعی #تکنولوژی #سوگیری_سیاسی #هوش_مصنوعی_بیطرف #AI #PoliticalBias
👍21
🚨🍌 معما حل شد: Nano-Banana همون مدل مخفی گوگل بود! و الان در دسترس همگان است.

یادتونه اون مدل مرموز با اسم Nano-Banana که توی lmarena تست می‌شد و همه رو شگفت‌زده کرده بود؟ بالاخره مشخص شد این همون Gemini 2.5 Flash Image گوگله! 🎉

🔑 چرا این خبر مهمه؟
این مدل فقط text-to-image نیست؛ ویرایش و دستکاری تصاویر موجود رو به سطحی رسونده که رقبایی مثل GPT-4o و Qwen-Image-Edit رو با اختلاف کنار زده.

قابلیت منحصربه‌فردش توی character consistency باعث می‌شه یه کاراکتر رو توی صحنه‌ها و حالت‌های مختلف، با حفظ کامل هویت بصریش نگه دارید. دیگه نیازی به ترفندهای پیچیده برای ثابت موندن چهره نیست.
نتایج بنچمارک‌ رسمی هم نشون می‌ده این یه جهش نسلی توی حوزه‌ی generative image editing محسوب می‌شه، نه یه آپدیت جزئی.

📊 توی lmarena هم رتبه‌ی اول رو با اختلاف زیاد توی بخش Image Edit Arena گرفته. این یعنی گوگل عملاً بازی رو توی حوزه‌ی ویرایش تعاملی تصویر عوض کرده.

🔥 نکته جالب؟ گوگل اول این مدل رو ناشناس منتشر کرد تا کامیونیتی بدون تعصب برند تستش کنه و نتیجه؟ یه هایپ ارگانیک واقعی!

الان هم رایگان توی Gemini app و Google AI Studio در دسترسه، و APIش هم با حدود ۰.۰۴ دلار برای هر تصویر ارائه می‌شه.
👇 لینک معرفی رسمی:
developers.googleblog.com – Introducing Gemini 2.5 Flash Image
1🤯1
گوگل به‌روزرسانی مهمی را برای ابزار قدرتمند تحقیق و یادداشت‌برداری یعنی NotebookLM معرفی کرد:

۱. امکان ساخت ارائه ویدیویی به بیش از ۸۰ زبان از جمله زبان‌های فارسی، فرانسوی، آلمانی، اسپانیایی، ژاپنی و دیگر زبان‌ها.

۲. ارائه صوتی کامل‌تر و جامع‌تر: ویژگی «مرور صوتی» که پیش‌تر فقط قالب‌های خلاصه و فشرده ارائه می‌داد، حالا به نسخه‌ای کامل و عمیق در همه‌ی زبان‌ها ارتقا یافته است و اکنون می‌توانید همان کیفیت و ساختار صوتی که پیشتر فقط به زبان انگلیسی در دسترس بود را در بیش از ۸۰ زبان دیگر تجربه کنید.

۳. در پنل Studio حالا چهار گزینه‌ی مجزا و با طراحی جدید برای تولید نسخه‌های صوتی، ویدیویی، نقشه‌ ذهنی (Mind Map) و گزارش (Report) دارد. علاوه بر این، می‌توانید چند خروجی از یک نوع (مثلاً چند ویدیو یا فایل صوتی) را در یک نوت‌بوک ذخیره و مدیریت کنید.

۴. پشتیبانی از همکاری، به اشتراک‌گذاری هوشمند و اشتراک‌گذاری عمومی

۵. اپلیکیشن موبایل اختصاصی با قابلیت کار آفلاین روی دستگاه‌های اندروید و iOS نصب
👍2🔥21
تغییر استایل سلفی با نانوبانانا

سلفیِ معمولی‌تون رو به یک شات سینمایی تبدیل کنید!
چطور؟


به Google Gemini وارد شوید و عکس سلفی رو آپلود کنید.

یک دستور واضح بنویسید:
من را شبیه یک شاهزاده از رامایانا کن، دسته‌گلی در دستم باشد.

اگر نتیجه نزدیک بود ولی هنوز چیزی که میخواستید نبود، با دستورات تکمیلی به تدریج عکس را کامل کنید. (ادیت چندمرحله‌ای).
نکته‌ها:

از توصیف جزئیات چهره/لباس/فضا نترسید؛ نانوبانانا در نگه‌داشت هویت چهره بسیار قدرتمنده.

گوگل جمینای آرم و واترمارک خودش رو به تصویر اضافه می‏کنه اگر می‎خواهید عکس بدون آرم و واترمارک باشه همین مدل نانوبانانا رو در سایت Imogen اجرا کنید.
3
ترکیب دو عکس (Blending two photos)

دو عکس کاملا متفاوت توی یک قاب طبیعی!
چطور؟

دو عکس، مثلا سلفی و عکس سوژهٔ دوم مثلاً موتور سیکلت رو همراه هم آپلود کنید.

بنویسید:
فرد داخل عکس را طوری ادیت کن که سوار این موتور سیکلت باشد.

اگر نور/زاویه یا هم نمی‌خواند، اضافه کنید:
زاویه و نور هر دو را هماهنگ کن تا طبیعی به نظر برسد.
نکته‌ها:

برای خروجی طبیعی، پس‌زمینه‌های با نور مشابه انتخاب کنید.

می‌تونین مثلا بگین «فرش و مبل دست‌نخورده بماند» تا بافت صحنه حفظ شود.
2
🟣 بر اساس مقاله‌ی The Large Gender Gap in Who Uses AI که در وال استریت ژورنال منتشر شده است سهم زنان و مردان در استفاده از هوش مصنوعی بشدت متفاوت است.

سهم زنان از کاربران ماهانه ChatGPT در حدود ۴۲٪ است و این عدد برای کاربران Claude کمتر از ۳۱٪ است!

چرا این فاصله وجود دارد؟

دختران از سنین پایین کمتر به سمت رشته‌های STEM هدایت می‌شوند؛ نقش الگوهای زن در فناوری نیز کم‌رنگ است.
زنان بیشتر به پیامدهای اخلاقی هوش مصنوعی فکر می‌کنند.

زنان اغلب مسئولیت‌های خانوادگی و مراقبتی بیشتری دارند و کمتر فرصت برای کار با تکنولوژی‌های جدید پیدا می‌کنند.

حضور زنان در حوزه هوش مصنوعی تنها حدود ۲۲٪ است، به‌ویژه در مقاطع مدیریتی و توسعه‌ای کمتر حضور دارند.

چرا این مسئله مهم است؟
با گسترش هوش مصنوعی در عرصه‌های مختلف کاری، آن‌هایی که کمتر از آن استفاده می‌کنند—به‌ویژه زنان—ممکن است از رشد حرفه‌ای عقب بمانند.
وقتی زنان در توسعه‌ی AI حضور نداشته باشند، سیستم‌ها بیشتر بازتاب‌دهنده‌ی دیدگاه‌های مردسالارانه خواهند بود.

https://www.wsj.com/tech/ai/ai-gender-gap-b3b0d89c
👍4🤯2
تیم Qwen از علی‌بابا جدیدترین مدل هوش مصنوعی خود یعنی Qwen3-Max-Preview
را معرفی کرد.
این مدل غول‌پیکر دارای بیش از یک تریلیون پارامتر است و سرعت پاسخ‌دهی خیره‌کننده‌ای دارد!

ویژگی‌های برجسته:

🧿بزرگ‌ترین مدل ساخت‌شده توسط Qwen با مقیاس بی‌سابقه‌ای در دنیای هوش مصنوعی

📄پشتیبانی از پردازش متن‌های بسیار طولانی: تا ۲۶۲هزار توکن ورودی و ۳۲هزار توکن خروجی

🪚استفاده از APIها و ابزارهای متنوع: از طریق Qwen Chat، Alibaba Cloud، OpenRouter.

💵قیمت‌گذاری مقیاس‌دار: ارزان‌تر برای متن‌های کوتاه، و گران‌تر برای پردازش‌های سنگین

🧨در آزمایش‌های اولیه، این مدل در بنچ‌مارک‌های مختلف مانند SuperGPQA، AIME25 و LiveCodeBench عملکردی بهتر از مدل‌های پیشین Qwen نشان داده است.

💡همچنین در پاسخ‌ها دقت بیشتری دارد و کمتر دچار اشتباه‌های رایج می‌شود.

این نسخه در حال حاضر از طریق وب‌سایت کوئن بصورت رایگان در دسترس است:

Chat.qwen.ai
1👍1
🔥 امکانات مدل جدید Qwen که باید حتماً امتحان کنین!

حالا دیگه Qwen Chat فقط یه چت‌بات نیست، بلکه یه ابزار همه‌فن‌حریفه:

1️⃣ 🎨 تولید تصویر خلاقانه
ایده‌تون رو بنویسید ➡️ یه تصویر جذاب تحویل بگیرید!

2️⃣ 🖌️ ویرایش تصویر هوشمند
حذف یا اضافه‌کردن اشیاء، تغییر متن داخل تصویر، عوض‌کردن پس‌زمینه، تغییر لباس یا زمینه شما در عکس، همه با دقت بالا و بدون تغییر چهره شما یا سبک تصویر

3️⃣ 🎬 تبدیل متن به ویدیو
از چند خط توضیح ساده، یه ویدیوی باحال و حرفه‌ای بسازید!

4️⃣ 🔍 تحقیق عمیق (Deep Research)
برای پاسخ به سوالات پیچیده، مقاله‌‌نویسی و تحقیقات دانشگاهی خودش سرچ می‌کنه، اطلاعات رو جمع‌آوری می‌کنه و بهتون یه گزارش کامل می‌ده 📑

5️⃣ 🖼️ تحلیل تصویر
📷 عکس رو آپلود کنین ➡️ مدل براتون توضیح می‌ده چی داخلشه، نوشته داخل عکس رو استخراج و حتی خلاصه‌سازی می‌کنه.

6️⃣ 🌐 درک چندرسانه‌ای (Multimodal)
می‌تونه همزمان متن، تصویر، صدا و ویدیو رو بفهمه و هوشمندانه جواب بده 🚀

💡 خلاصه: Qwen Chat داره تبدیل می‌شه به یه دستیار همه‌کاره برای خلاقیت، تحقیق و تولید محتوا.
4
جزئیات جدید مربوط به استفاده از نسخه‌های مختلف Gemini در سپتامبر ۲۰۲۵:

🔅دریافت ۲۰ «بررسی صوتی» (Audio Overviews) به صورت یکسان برای همه کاربران پولی و رایگان ممکن است. برای استفاده از این ویژگی کافی‌ است فایل pdf یا word خود را آپلود کنید و روی دکمه‌ generate audio overview که پس از آپلود ظاهر می‌شود کلیک کنید.

🆓 کاربران رایگان می‌توانند روزانه تا ۵ پرامپت به مدل Gemini 2.5 Pro ارسال کنند (با طول متن حداکثر ۳۲٬۰۰۰ توکن یا حدود ۲۴۰۰۰ کلمه). همچنین قابلیت تولید یا ویرایش تا ۱۰۰ تصویر روزانه برای این کاربران مجاز است.

در ابزار «پژوهش ژرف» یا Deep Research نیز تنها ۵ گزارش در ماه برای کاربران رایگان امکان‌پذیر است.

🅿️ برای کاربران Pro با هزینه ۱۹.۹۹ دلار ماهانه، ارسال ۱۰۰ پرامپت روزانه، ایجاد یا ویرایش ۱۰۰۰ تصویر در روز، تولید ۳ ویدیو با Veo 3 Fast روزانه و دریافت ۲۰ گزارش Deep Research در هر روز امکان پذیر است.

💸برای کاربران Ultra با پرداخت ۲۴۹.۹۹ دلار در ماه ارسال ۵۰۰ پرامپت Gemini 2.5 Pro روزانه، ساخت یا ویرایش ۱۰۰۰ تصویر روزانه، ۵ ویدیو Veo 3 Fast در روز، ۲۰۰ گزارش Deep Research در روز، و تا ۱۰ درخواست Deep Think با پنجره‌ی متنی عظیم ۱۹۲٬۰۰۰ توکن، فراهم شده است.

با این اطلاع رسانی تازه گوگل محدودیت‌ها شفاف‌تر شده‌اند و حالا با اعداد و ارقام مشخص، استفاده واقعی‌تر از Gemini امکان‌پذیر است و کاربران در انتخاب طرح مناسب‌تر (رایگان یا پولی) تصمیم‌گیری بهتری خواهند داشت.
3