prompt_engineering_for_beginers_mehdi_kiani (1).pdf
939.6 KB
Prompt Engineering for Beginners
این کتاب یک راهنمای جامع و بسیار روان برای همه کسانی است که میخواهند هنر «پرامپت نویسی» یا همان مهندسی پرامپت را از پایه یاد بگیرند. نویسنده کتاب آقای Mark J. Baars و مترجم آن آقای مهدی کیانی، دانشجوی دکتری مهندسی کامپیوتر، هستند.
1⃣ مبانی هوش مصنوعی و پردازش زبان طبیعی به زبان ساده.2⃣ اصول طراحی پرامپتهای مؤثر، از ساختارهای پایه تا تکنیکهای پیشرفته.3⃣ تکنیکهای پیشرفتهای مانند پرامپتهای زنجیره فکری، مبتنی بر نقش و چندمرحلهای.4⃣ کاربردهای عملی در حوزههای مختلفی مثل کسبوکار، آموزش، تولید محتوای خلاقانه (عکس، موسیقی و ویدئو) و حتی حقوق و پزشکی.5⃣ شناسایی خطاهای رایج و روشهای عیبیابی برای رسیدن به بهترین نتیجه.
منبع:
🔻 پینوشت:
#پرامپت_نویسی #مهندسی_پرامپت #معرفی_کتاب
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
در چت جیپیتی با این پرامپت؛ با توجه به شناختی که از شما داره، یک ست LEGO براتون طراحی میکنه:
create an image of a Lego set based on what you know about me منبع
🔻 پینوشت:
#فان
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤6😁2🔥1
چندماهی هست دارم یک پادکست با موضوع علمی (بیشتر در حوزه علوم زیستی شامل زیستشناسی، بیوتکنولوژی، مهندسی ژنتیک و ...) برای افراد غیرمتخصص، با استفاده از چند هوش مصنوعی تولید میکنم. البته همه روند با AI نیست، و بخشهایی رو دستی انجام میدم که مطابق چیزی که مد نظرم هست تولید بشه و خیلی ماشینی نباشه!
منابع استفاده شده برای این پادکست، بخش اخبار وبسایت معتبر Nature هست که روی جدیدترین مقالات علمی در دنیا، خبر کار میکنه؛ یا به بهانه یک مقاله علمی جدید، یک گزارش کامل تهیه میکنه.
۲۰ اپیزود اول رو با NotebookLM درست کردم، اما مراحل ویرایش صدا و تصحیحِ تلفظ اشتباه کلمات فارسی، شدنی، ولی بسیار زمانبر بود.
از اپیزود ۲۱ به بعد؛ متن خبر رو با یک پرامپت طولانی و کامل به جمنای میدم، ازش میخوام به شکل گفتگوی دو نفره (دو نفر متخصص در حوزهٔ اون خبر) با رعایت حفظ حالت روایی و داستانگویی (storytelling)، ایجاد قلاب برای شروع بحث و همچنین خلاصه و نتیجهگیری در پایان، برام تولید کنه.
متن تولید شده رو با Generate speech (در بخش Generate Media) که در Google AI Studio هست تبدیل به صدا میکنم.
اینجا هم ممکنه بعضی کلمات رو درست تلفظ نکنه که خب کار راحتتره، دوباره با همین بخش «فقط» همون جملات رو دوباره تولید میکنم و در نرمافزار ویرایش صدا جایگزین میکنم.
بعد در یک نرمافزار رایگان و اوپنسورسِ ویرایش صدا (Audacity) کمی کیفیت صدا رو بهتر میکنم (و اگه در تلفظها اصلاحی نیاز باشه انجام میدم)، موزیک رو اضافه میکنم و در نهایت روی پلتفرم پادکست RedCircle که رایگان هست منتشر میکنم.
هرچند بیشتر هدفم موضوعات علوم زیستی هست، ولی خبر علمی که برای خودم جالب باشه رو هم با این روش تولید میکنم.
مثلا چند خبری که با محتوای این کانال سازگار هست اینا هستند:
🔻 پینوشت:
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤18🔥8👍4
اگر شما هم از افرادی بودید که Google AI Pro دانشجویی (شامل Gemeni Pro و کلی امکانات دیگه مثل NotebookLM Plus و ...) رو گرفته بودید (حدود ۳ ماه پیش)؛ ظاهرا کمتر از یکماه (۲۲ سپتامبر ۲۰۲۵ | ۳۱ شهریور ۱۴۰۴) فرصت دارید که تایید کنید دانشجوی محصل در آمریکا هستید تا این اشتراک یکساله مجانی قطع نشه.
هنوز راه حل درست حسابی برای وریفای کردن دانشجویی پیدا نشده. اگه پیدا بشه اطلاعرسانی میکنم.
🖥 @Explore_AI
هنوز راه حل درست حسابی برای وریفای کردن دانشجویی پیدا نشده. اگه پیدا بشه اطلاعرسانی میکنم.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤6😱5🙏1
چند هفتهای بود همه جا حرف از یه مدل ناشناس بود که توی رقابتهای LMArena (مرجع مقایسه مدلهای مختلف هوش مصنوعی) سر و صدا کرده بود:
— رتبه ۱ ویرایش تصویر
— رتبه ۱ تبدیل متن به تصویر
خروجیهای این مدل، اونقدر قوی و متفاوت بود که اسمش سر زبونها افتاد: Nano Banana.
حدس و گمانهایی بود که این مدل، آیا وابسته به یک شرکتِ بزرگ هست یا توسط یک تیم کوچک در حال توسعه هست؟
امروز معما حل شد؛ گوگل رسماً اعلام کرده این مدل در واقع همون Gemini 2.5 Flash Image هست که به اپلیکیشن جمنای و ابزارهای توسعهدهندهها اضافه شده.
یکی از دردسرهای مدلهای قبلی این بود که وقتی میخواستی عکسی رو ویرایش کنی، قیافهی شخصیت داخل تصویر عوض میشد یا حیوان خانگیت دیگه شبیه خودش نبود. نانو بانانا این مشکل رو تا حد زیادی حل کرده. مثلا میتونی ازش بخوای دوستت رو با مدل موی دهه ۶۰ یا لباس بالرین نشون بده، بدون اینکه چهرهش تغییر کنه.
فقط بحث تغییر ساده نیست. این مدل دستورات دقیق و عجیب رو هم میفهمه. مثلاً میگی «شخص سمت چپ رو به شوالیه قرون وسطایی تبدیل کن ولی پسزمینه دستنخورده بمونه»، یا حتی «این عکس سگ رو با این عکس آدم ترکیب کن»؛ و نتیجه دقیقاً همون میشه که خواستی.
میتونه المانهای یک تصویر رو به تصویر دیگه منتقل کنه. مثلا رنگ و بافت گلبرگهای یک گل رو بذاره روی یک جفت چکمه. این یعنی از طراحی محصول گرفته تا هنر دیجیتال، دست شما برای خلاقیت بازه.
تصاویر خروجی آنقدر طبیعی و دقیق هستن که انگار با دوربین گرفته شدن. همین باعث شده توی بنچمارکهای LMArena رتبهی اول رو بگیره و حتی از مدلهای Midjourney و OpenAI جلو بزنه (رتبهبندی داخل تصاویر بالا هستن).
هم برای کاربرهای عادی در اپلیکیشن جمنای باز شده (تا ۱۰۰ ویرایش رایگان در روز) و هم برای کاربرهای پولی (تا ۱۰۰۰ ویرایش). توسعهدهندهها هم میتونن از طریق API و AI Studio و Vertex AI بهش دسترسی داشته باشن.
نانو بنانا میتونه خیلی از کارهایی که با Photoshop ساعتها طول میکشه، در چند ثانیه انجام بده. یک پلتفرم فروش آنلاین حتی گزارش داده با این مدل تونسته هزینههای عکاسی رو بهشدت پایین بیاره و نرخ فروشش رو ۳۴٪ افزایش بده.
از ساخت تبلیغات آماده در کمتر از یک ساعت گرفته تا خلق کاراکتر برای بازیهای ویدیویی، این مدل به تیمهای خلاق سرعت و دقت تازهای داده.
مدلهای OpenAI با GPT-4o و Midjourney بازار رو تکون داده بودن. اما گوگل با نانو بنانا نشون داد عقب نیست. مخصوصاً وقتی بدونیم جمنای ماهانه ۴۵۰ میلیون کاربر داره، در برابر ۷۰۰ میلیون کاربر هفتگی ChatGPT.
گوگل برای جلوگیری از سوءاستفاده، همهی تصاویر رو با واترمارکهای SynthID (قابلدیدن و نامرئی) علامتگذاری میکنه. این یعنی جعل و فیکسازی سختتر میشه.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤11🔥6👍5👎1
شرکت xAI (شرکت هوش مصنوعی ایلان ماسک) از جدیدترین مدل خودش به نام Grok Code Fast 1 رونمایی کرده؛ مدلی که مخصوص کارهای کدنویسی ساخته شده و از ۲۸ آگوست ۲۰۲۵ بهطور عمومی در دسترسه.
منبع: وبسایت رسمی x.ai
🔻 پینوشت:
تا یک هفته امکان استفاه مجانی از این مدل در GitHub Copilot و Cursor و Cline و Roo Code و Kilo Code و opencode و Windsurf وجود داره.
#معرفی_هوش_مصنوعی
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤25👍6
🚀 انتشار جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
ظاهرا گوگل بیسروصدا از جدیدترین و قدرتمندترین مدل زبانی خودش به اسم Gemini 3 Pro، رونمایی کرده؛ مدلی که به گفته خود گوگل، هوشمندترین ساختهٔ اون تا به امروز هست و دارای پیشرفتهترین (لبه تکنولوژی) توانایی استدلال منطقی SOTA (State-of-the-Art).
ویژگیهای مدل زبانی جمنای ۳ پرو:
🧠 درک چندوجهی (Multimodal): درک و تحلیل انواع دادهها از جمله متن، تصویر، صدا، ویدیو و کد، بطور همزمان.
🤖 دستیار هوشمند خودکار (Agentic): مثل یک دستیار واقعی، وظایف پیچیده رو به صورت خودکار انجام بده؛ از کنترل مرورگر گرفته تا اجرای ابزارهای مختلف.
💻 وایب کدینگ: به کاربران اجازه میده تنها با توصیف ایدههای خود به زبان ساده، کدهای پیچیده، برنامهها، SVGهای حرفهای و ... تولید کنن!
📆 دانش بهروز: یکی از مهمترین ویژگیهای این مدل، تاریخ دانش اون هست که تا ژانویه ۲۰۲۵ گفته شده و اطلاعات بسیار جدیدتری نسبت به مدلهای قبلی داره.
🤔 چطور به این مدل دسترسی پیدا کنیم؟
اگر سری به Google AI Studio بزنید، «فعلا» کنار این مدل با برچسب "Confidential" یا "Preview" میبینید. این تگ به این معنا هست که مدل هنوز به صورت عمومی منتشر نشده و دسترسی به اون فقط برای کاربران خاص (مثل توسعهدهندگان منتخب، تستکنندهها یا بعضی مشترکین Gemini Advanced) فعال شده تا قبل از عرضه نهایی، بازخوردها جمعآوری بشه.
به همین علت، اگر جزو کاربران دارای دسترسی اولیه نباشید، موقع تلاش برای استفاده از این مدل احتمالاً با پیام زیر مواجه میشید:
وضعیت دسترسی برای عموم:
دسترسی فعلی: از نوامبر به صورت محدود (Preview) در AI Studio در دسترس قرار گرفته. عرضه عمومی احتمالاً در ماههای آینده (اواخر دسامبر، یا اوایل سال آینده میلادی) خواهد بود.
قیمتگذاری (برای توسعهدهندگان و کاربران API):
◀️ تا 200 هزار توکن: ورودی $2.00 / خروجی $12.00
◀️ بیش از 200 هزار توکن: ورودی $4.00 / خروجی $18.00
چطوری چک کنیم دسترسی داریم یا نه؟
1⃣ اکانت Gemini Advanced خود را چک کنید: بعضی کاربران بدون اطلاع قبلی، این آپدیت رو دریافت کردند.
2⃣ به Google AI Studio سر بزنید: شاید شما هم جزو کاربران خوششانس باشید! (aistudio.google.com)
3⃣ - صبور باشید: اگه هنوز دسترسی ندارید، فعلا از مدلهای قدیمیتر مثل Gemini 2.5 Pro استفاده کنید و منتظر عرضه عمومی بمونید.
🖥 @Explore_AI
ظاهرا گوگل بیسروصدا از جدیدترین و قدرتمندترین مدل زبانی خودش به اسم Gemini 3 Pro، رونمایی کرده؛ مدلی که به گفته خود گوگل، هوشمندترین ساختهٔ اون تا به امروز هست و دارای پیشرفتهترین (لبه تکنولوژی) توانایی استدلال منطقی SOTA (State-of-the-Art).
ویژگیهای مدل زبانی جمنای ۳ پرو:
اگر سری به Google AI Studio بزنید، «فعلا» کنار این مدل با برچسب "Confidential" یا "Preview" میبینید. این تگ به این معنا هست که مدل هنوز به صورت عمومی منتشر نشده و دسترسی به اون فقط برای کاربران خاص (مثل توسعهدهندگان منتخب، تستکنندهها یا بعضی مشترکین Gemini Advanced) فعال شده تا قبل از عرضه نهایی، بازخوردها جمعآوری بشه.
به همین علت، اگر جزو کاربران دارای دسترسی اولیه نباشید، موقع تلاش برای استفاده از این مدل احتمالاً با پیام زیر مواجه میشید:
You've reached your rate limit. Please try again later.
وضعیت دسترسی برای عموم:
دسترسی فعلی: از نوامبر به صورت محدود (Preview) در AI Studio در دسترس قرار گرفته. عرضه عمومی احتمالاً در ماههای آینده (اواخر دسامبر، یا اوایل سال آینده میلادی) خواهد بود.
قیمتگذاری (برای توسعهدهندگان و کاربران API):
چطوری چک کنیم دسترسی داریم یا نه؟
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤7
کاوش در دنیای هوش مصنوعی
جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
رشته توییت حساب کاربری جمنای در توییتر (X) در مورد معرفی جمنای ۳ گوگل:
توییت اول:
توییت دوم:
توییت سوم:
توییت چهارم:
[ویدئوی دوم همین پست]
توییت پنجم:
توییت ششم:
🖥 @Explore_AI
توییت اول:
مورد انتظارترین عرضه سال ما اینجاست.
- جمنای ۳ (Gemini 3)، هوشمندترین مدل ما
- رابطهای کاربری مولد، برای پاسخهایی با طراحی بینقص
- ایجنت جمنای، ساختهشده برای انجام کارهای پیچیده از طرف شما
ببینید جمنای ۳ چطور میتونه بهتون کمک کنه یاد بگیرید، بسازید و برای هر چیزی برنامهریزی کنید 🧵
توییت دوم:
غول هوش مصنوعی.
جمنای ۳ استاندارد جدیدی برای عملکرد مدلهای هوش مصنوعی تعیین میکنه تا بتونید بدون هیچ وقفهای خلق کنید، کد بزنید و بسازید.
◀️ درک چندوجهی، استدلال فوقپیشرفته و پنجره متنی ۱ میلیون توکنی برای ترکیب و تحلیل ویدیو، تصویر، متن و صدا.
◀️ بهترین مدل ایجنتی (عاملی) و کدنویسی حسی (Vibe Coding) ما تا به امروز.
◀️ پاسخهای کاربردیتر، با فرمتبندی بهتر و خلاصهتر.
توییت سوم:
ظاهر جدید.
با طراحی تازه و فرمتبندی بهتر پاسخها، شروع چت، پیدا کردن چیزهایی که ساختید و یادگیری به روش بصری راحتتر شده.◀️ اطلاعات در جمنای ۳، که واقعگرایانهترین (Factual) مدل ماست، خلاصهتر شده.◀️ دو قابلیت آزمایشی جدید، یعنی چیدمان بصری و نمای پویا، نتایج رو به شکلی جذابتر و بصریتر ارائه میدن.◀️ خرید کردن با لینک محصولات، لیستها، جداول مقایسه و موارد دیگه، از همیشه آسونتر شده.
توییت چهارم:
ایجنت جمنای.
با «ایجنت جمنای» که یک قابلیت آزمایشیه، جمنای میتونه کارهای چندمرحلهای رو براتون انجام بده—همه تحت هدایت خودتون.◀️ رزرو سفر، مرتبسازی اینباکس یا گرفتن وقت ملاقات.◀️ ازش بخواید قیمتها رو مقایسه کنه، با فروشندهها تماس بگیره یا زمانهای خالی رو هماهنگ کنه.◀️ کنترل دست شماست: ایجنت جمنای قبل از اقدامات حساس مثل خرید کردن یا ارسال پیام، تاییدیه میگیره.
فقط برای مشترکین طرح اولترا (Ultra) در آمریکا در دسترس است.
[ویدئوی دوم همین پست]
توییت پنجم:
رایگان برای دانشجوها.
دانشجوهای واجد شرایط در آمریکا، طرح پرو جمنای رو برای یک سال کامل رایگان دریافت میکنن که شامل دسترسی به جمنای ۳، آپلود نامحدود تصویر، NotebookLM@ و موارد دیگه میشه.
ثبتنام در http://gemini.google.com/students (شرایط و قوانین اعمال میشود)
توییت ششم:
عرضه جهانی جمنای ۳ از همین امروز شروع میشه.
با انتخاب گزینه “Thinking” از منوی انتخاب مدل در http://gemini.google امتحانش کنید.
بعد توی ریپلایها بهمون بگید که برای کدوم ویژگیها بیشتر از همه هیجاندارید.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤4
کاوش در دنیای هوش مصنوعی
جدیدترین مدل هوش مصنوعی گوگل: جمنای ۳ پرو
توییت lmarena.ai در رابطه با جمنای ۳:
(توضیح اینکه: سایت lmarena.ai، معتبرترین پلتفرم برای رتبهبندی مدلهای هوش مصنوعی هست. در این سایت، کاربران بهصورت ناشناس با دو مدل مختلف چت میکنن و برنده [پاسخ بهتر] رو انتخاب میکنن. رتبهبندیهای این سایت به عنوان «استاندارد طلایی» برای سنجش قدرت واقعی هوش مصنوعی در دنیا شناخته میشه.
ترجمه توییت:
🖥 @Explore_AI
(توضیح اینکه: سایت lmarena.ai، معتبرترین پلتفرم برای رتبهبندی مدلهای هوش مصنوعی هست. در این سایت، کاربران بهصورت ناشناس با دو مدل مختلف چت میکنن و برنده [پاسخ بهتر] رو انتخاب میکنن. رتبهبندیهای این سایت به عنوان «استاندارد طلایی» برای سنجش قدرت واقعی هوش مصنوعی در دنیا شناخته میشه.
ترجمه توییت:
مدل Gemini-3-Pro از تیم گوگلدیپمایند حالا در تمام لیدربوردهای (جداول ردهبندی) اصلی آرنا رتبه ۱# را کسب کرده است.
🥇رتبه ۱# در متن، بینایی (Vision) و توسعه وب - بالاتر از Grok-4.1، Claude-4.5 و GPT-5
🥇رتبه ۱# در کدنویسی، ریاضی، نویسندگی خلاق، درخواستهای طولانی و تقریباً تمام لیدربوردهای شغلی.
جهشهای عظیم نسبت به Gemini-2.5:
🔸توسعه وب در آرنای کد: ۱۴۸۷ (۲۸۰+ امتیاز در مقایسه با نسخه ۲٫۵)
🔸متن: ۱۵۰۱ (۵۰+ امتیاز)
🔸بینایی: ۱۳۲۸ (۷۰+ امتیاز)
🔸سطح کارشناس آرنا (Arena Expert): جزو ۳ تای برتر (تنها ۳ امتیاز فاصله با رتبه ۱)
تبریک فراوان به تیم گوگلدیپمایند برای این دستاورد بزرگ! 👏
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥2
در گزارش جدیدی که از OpenAI (سازنده ChatGPT) منتشر شده، نشون میده شکاف بزرگی بین کسانی که «بلدن» با هوش مصنوعی کار کنن و بقیه افراد (کارمندها) وجود داره.
ماجرا فقط کارکردن با هوش مصنوعی و تعداد سوال پرسیدن نیست.
دنیای کار داره به دو دسته تقسیم میشه: کسانی که فقط تماشاچی هستن و کسانی که با سرعت جلو میرن. وقتشه که از سطح «سوال و جواب ساده» بگذریم و «قلقهای حرفهای» رو یاد بگیریم.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍9👏1