MHRCODE | برنامه‌نویسی با طعم توت‌فرنگی – Telegram
MHRCODE | برنامه‌نویسی با طعم توت‌فرنگی
3.43K subscribers
22 photos
1 video
116 links
آدرس ها:
گروه: @MhrCodeGP
ویرگول: virgool.io/@mhrlife
مدیوم: medium.com/@mhrlife
Download Telegram
A photograph of this Persian poem written seamlessly on a carpet:

"""
من تو شدم تو من شدی من تن شدم تو جان شدی
تا کس نگوید بعد از این من دیگرم ، تو دیـــگری
"""
چند روزه که «جمنای» (Gemini) یه مدل جدید به اسم Nano Banana Pro معرفی کرده که به نظرم واقعاً انقلابی بوده.

اول بگم که Nano Banana Pro نسخه بزرگ‌تر Nano Banana هست، اما کیفیتشون اصلاً با هم قابل مقایسه نیست. راستش هیچ مدلی از نظر کیفیت به پاش نمی‌رسه. حتی gpt-1.5-image جدید هم به اندازه این مدل جنرال نیست و درک عمیق نداره.

چیزایی که توی این مدل دیدم و بقیه مدل‌ها ندارن:
۱. متن فارسی رو خیلی دقیق و با جزئیات بالا می‌نویسه. حتی فونت رو هم می‌فهمه!
۲. درک مکانی و Context بالایی داره. مثلاً بگی «میدون آزادی»، دقیقاً همون رو می‌سازه.
۳. می‌تونه فکر کنه، پس مسائل هندسه رو هم حل می‌کنه!
۴. توی یه Test Case نشون داد که عکس رادیولوژی رو می‌فهمه و زائده‌ها رو تشخیص می‌ده.
۵. UIهای خیلی خوبی می‌سازه؛ اونم با جزئیات بالا.
۶. توی ترکیب چند تا عکس با هم عالی عمل می‌کنه.
۷. خروجی 4K با دقت خیلی بالا می‌ده.

اگه روی عکس‌های بالا کلیک کنید، می‌تونید Prompt هر کدوم رو ببینید.

چطور بهش دسترسی داشته باشیم؟
بی‌دردسرترین راه اینه که اکانت Open Router رو شارژ کنید. لینک مدل در Open Router.

نکات منفی؟
خیلی گرونه. تولید هر عکس 1K حدود ۱۵-۲۰ سنت تموم می‌شه؛ یعنی بین ۲۰ تا ۲۵ هزار تومن! در حالی که مدل Nano Banana معمولی (که از Gemini Flash استفاده می‌کنه)، هر عکسش حدود ۳ سنت، یعنی ۳ هزار تومن درمیاد.
راستش جز این، نکته منفی دیگه‌ای ندیدم. حتی سرعت تولید 4K اون از بقیه مدل‌های 4K سریع‌تره، با اینکه کیفیتش دو سر و گردن بالاتره.
12👍4
کارهای زیادی می‌شه باهاش کرد. به نظرم این تازه به قول معروف Tip of the iceberg هست.

مثلاً می‌تونیم خیلی آماتوری چند تا عکس رو ترکیب کنیم و یه Composition Sketch بسازیم. بعد ازش بخوایم اون رو سینمایی کنه و عکس‌ها رو Seamless با هم Blend کنه.
5
Generate a comical Farsi info graphic based on this content:

زبان گولنگ:
سریع + مولتی پروسس + عالی برای کانکارنسی بالا + تایپ سیف

زبان پایتون:
سرعت توسعه بالا + ابزار‌های خیلی زیاد + کامیونیتی بزرگتر + فرصت‌های بیشتر
👍9
MHRCODE | برنامه‌نویسی با طعم توت‌فرنگی
Generate a comical Farsi info graphic based on this content: زبان گولنگ: سریع + مولتی پروسس + عالی برای کانکارنسی بالا + تایپ سیف زبان پایتون: سرعت توسعه بالا + ابزار‌های خیلی زیاد + کامیونیتی بزرگتر + فرصت‌های بیشتر
و در آخر:

چون خودش قابلیت Reasoning و پردازش داره، دستتون خیلی بازه. می‌تونید بهش داکیومنت فارسی بدید و ازش بخواید براتون اینفوگرافیک، تبلیغات، اسلایدشو و... بسازه!
🔥14
💡 صوت و موسیقی با LLMها

توی این یک ساله، LLMها خیلی سریع‌تر دارن پیشرفت می‌کنن. یکی از جاهایی که خیلی خوب توش پیشرفت کردن، تولید صدا و موزیکه.

همین چند ماه پیش بود که گوگل ورژن TTS مدل‌های Gemini 2.5 Flash و Pro رو معرفی کرد. این مدل‌ها به طرز باورنکردنی‌ای کیفیت فارسی‌شون خوبه و می‌تونن با احساسات درست، مثل یه native ایرانی صحبت کنن.

برای تست کردنش می‌تونید از AI Studio گوگل استفاده کنید:
https://aistudio.google.com/generate-speech?model=gemini-2.5-pro-preview-tts

این نمونه پادکست با مدل‌های tts گوگل:
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Audio
پرامپت:

یک پادکست ایرانی که بین دو نفر هستند که اروم اروم صحبت میکنند
Speaker 1: ببین، می‌گن ستاره‌های نوترونی جِرم خورشید رو دارن ولی به اندازه تهران‌ن! این چه وضعشه؟
Speaker 2: آره، وقتی یک ستاره غول‌پیکر منفجر می‌شه، هسته‌اش فشرده می‌شه تا جایی که دیگه بین اتم‌ها جا نمونه. یعنی چیزی که باید فضای خالی باشه، حالا پُر می‌شه.
Speaker 1: پس چرا فرو نمی‌ریزه رو هم؟
Speaker 2: چون نوترون‌ها یه خاصیت دارن که میگن "اجازه نمی‌دم دیگه فشرده‌تر بشم!" این مقاومت جلوی فروپاشیش رو می‌گیره.
Speaker 1: خب این یعنی چی؟ مثلاً چقدر سنگینه؟
Speaker 2: یک قاشق چای‌خوری از این ستاره، چند میلیارد تن وزن داره! یعنی اگه بخوای بلندش کنی، انگار داری کوه می‌بری.
8
حالا یه سری شرکت‌ها هستن که یه قدم فراتر رفتن! تولید موزیک با LLM. و راستش خروجی‌های خیلی خوبی هم می‌دن.

سایت suno.com یکی از اوناست که بهتون توکن رایگان هم می‌ده و همین الان می‌تونید ایده‌هاتون رو تبدیل به موزیک فارسی کنید! نکته‌اش اینه که باید کلمات سخت رو طوری بنویسید که بتونه راحت تلفظ کنه. مثلاً Indentation رو بنویسید این-دِن-تِی-شِن.
3
Pyhthonthonthonthon
MhrCode
اینم یه موزیک نمونه که دیس پایتون رو میدیم توش :))
🔥202
اگه می‌خواید بدونید ماهیت ChatGPT و امثالهم چیه، یه مثال ساده براتون می‌زنم:

فرض کنید توی یه اتاقی هستید و هیچ ارتباطی با دنیای بیرون ندارید. هر چند وقت یکی می‌یاد و یه ترتیبی از کارت‌ها بهتون می‌ده. ازتون می‌خواد کارت بعدی رو بهش بدید. اگه درست باشه، غذا می‌ده. اگه نه، هیچی!

شما یه جعبه صدتایی از کارت‌ها دارید و هر دفعه فقط می‌تونید یکی رو برگردونید.

وقتی سال‌ها بگذره، دیگه متوجه می‌شید کدوم ترتیب ها احتمالا درست هستن. هر وقت لیست جدیدی بهتون دادن، یا دقیقا این ترتیب رو دیدید یا احتمال میدید شبیه‌ترین به کدوم ترتیب قدیمی هست و اون کارتی که احتمال غذا گرفتنتون بیشتر باشه رو بهش میدید که اکثر مواقع هم درست حدس می‌زنید و غذا میگیرید!

حالا سوال: شما می‌دونید دارید چی‌کار می‌کنید؟ تاثیر کارتون چیه؟ کارت‌ها معنیشون چیه؟ نه! فقط توی ذهنتون یه سری پترن درآوردید. با دیدن ورودی‌ها، احتمال می‌دید خروجی‌ها چیه. مدل‌های زبانی بزرگ هم همین‌قدر احمق‌ن. هیچی نمی‌دونن! فقط براساس پترن‌های که بهشون غذا دادید یاد میگیرن چه کارتی احتمال بیشتری درسته.

حالا شاید شما وقتی بهش پترن دادید و غذا می‌دادید، اولویتتون روی درست حرف زدن باشه نه علمی حرف زدن! اون موقع سوالی بپرسید ازش یه طوری غیر علمی ولی درست حرف می‌زنه که همه باور میکنن!
👍24👎32🔥2
یه تعدادی مطلب دیگه میخواستم بذارم و اماده کردم ولی الان زمانش نیست واقعا. مراقب سلامتی خودتون و نزدیکاتون باشید ❤️
59👎6👍2🔥2