شبکه داستانی عصبی – Telegram
شبکه داستانی عصبی
793 subscribers
746 photos
35 videos
96 files
1.9K links
اینجا راجع به چیزایی که دوست دارم صحبت می‌کنم: داستان، هوش مصنوعی، موسیقی، نرم‌افزار، هنر، روانشناسی و ... :)

اگه خواستید صحبت کنیم خیلی خوشحالم می‌کنید:
@alimirferdos
Download Telegram
دیروز معرفی شد:
بعد از مدل‌هایی که با متن عکس درست می‌کنند حالا مدل‌هایی که با متن صدا درست میکنن!!

We present “AudioGen: Textually Guided Audio Generation”!

AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).

https://twitter.com/FelixKreuk/status/1575846953333579776?t=nxspRrlWnoQ4BKKIr04dGQ&s=19
و همچنین رقیب جدید و جدی Copilot که میگفتی چی میخوای برات برنامه اش رو می‌نوشت، خودش هم به شکل اپن سورس:

The Gradio Demo for CodeGeeX, a large-scale multilingual code generation model with 13 billion parameters, pre-trained on a large code corpus of more than 20 programming languages is now on huggingface Spaces

https://twitter.com/_akhaliq/status/1575925494754996225?t=YkmxjDtTynKESIJlzjUR_Q&s=19
یه مقاله جالب جدید در زمینه‌ی به مرحله کارکرد بردن مدل‌های یادگیری ماشین که بررسی خیلی جالبی داشته و دسته‌بندی کرده و یه سری پترن و آنتی پترن درآورده:

Another really interesting paper on MLOPs. It's great to get insights into how some companies deploy machine learning systems today.

https://twitter.com/omarsar0/status/1575884962653405184?t=SzQFA69hJ_-FZWrg2Iu7jA&s=19
Audio
There once was a girl who lived in Iran...
امروز تسلا، همون شرکته که مال ایلان ماسکه و ماشین خودران و اینا می‌ساخت، اولین پروتوتایپ از ربات انسان‌نمای آپیتموس رو رونمایی کرد

https://twitter.com/_brohrer_/status/1576368293719736320?t=HifVdkYRqYA4s2CNrNj6cw&s=19
Soroode Zan
Mehdi Yarrahi
«سرود زن»
تقديم به زنان و مردان ستم ستيز ایران

‌زن زندگى آزادى

#MahsaAmini
#مهسا_امينى
@mehdiyarrahi
2
حدود یک ماه و نیم پیش، مجموعه openai یه چیز جدیدی به dalle2 (همون اولین مدل خفن تبدیل متن به عکس) اضافه کرد به اسم Outpainting که این امکان رو می‌داد که یه عکس به عنوان شروع بدی و اطرافش رو بکشی و پر کنی. این پستشه:
https://openai.com/blog/dall-e-introducing-outpainting/

مدل dalle2 یک مدل تجاری بود اما یکی از مدل‌های اپن سورس (که همه به کدش و خودش دسترسی دارند) که کمی بعدتر ارائه شد stablediffusion بود. این مدل هم اخیرا نسخه‌ای مشابه outpainting داد به اسم infinity که کدش رو اینجا میشه دید:
https://github.com/lkwq007/stablediffusion-infinity

اما چیز جالب این دمو عه:
https://huggingface.co/spaces/lnyan/stablediffusion-infinity

توی این دمو میتونید عکستون رو آپلود کنید؛ بعد یه متن بنویسید و بخش‌های مختلفش رو گسترش بدید و بکشید.
شبکه داستانی عصبی
حدود یک ماه و نیم پیش، مجموعه openai یه چیز جدیدی به dalle2 (همون اولین مدل خفن تبدیل متن به عکس) اضافه کرد به اسم Outpainting که این امکان رو می‌داد که یه عکس به عنوان شروع بدی و اطرافش رو بکشی و پر کنی. این پستشه: https://openai.com/blog/dall-e-introducing…
این دو تا رو الان سعی کردم بکشم با مضامین این روزها. البته که خیلی کار و حوصله‌ی بیشتری می‌خواد که چیزهای بهتری بشه ازش به دست آورد. این همون جاییه که «مهندسی متن ورودی» یا Prompt engineering مطرح میشه؛ به این معنا که ما متن ورودی رو دقیقا چی بدیم که بشه نتایج خوبی گرفت.
👍2