Tensorflow(@CVision) – Telegram
Tensorflow(@CVision)
15.3K subscribers
1.29K photos
310 videos
81 files
2.53K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras
Download Telegram
LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models
21 Sep 2023 ·

paper : https://arxiv.org/pdf/2309.12307v1.pdf
code : https://github.com/dvlab-research/longlora
We present LongLoRA, an efficient fine-tuning approach that extends the context sizes of pre-trained large language models (LLMs), with limited computation cost. Typically, training LLMs with long context sizes is computationally expensive, requiring extensive training hours and GPU resources. For example, training on the context length of 8192 needs 16x computational costs in self-attention layers as that of 2048. In this paper, we speed up the context extension of LLMs in two aspects. On the one hand, although dense global attention is needed during inference, fine-tuning the model can be effectively and efficiently done by sparse local attention. The proposed shift short attention effectively enables context extension, leading to non-trivial computation saving with similar performance to fine-tuning with vanilla attention. Particularly, it can be implemented with only two lines of code in training, while being optional in inference. On the other hand, we revisit the parameter-efficient fine-tuning regime for context expansion. Notably, we find that LoRA for context extension works well under the premise of trainable embedding and normalization. LongLoRA demonstrates strong empirical results on various tasks on LLaMA2 models from 7B/13B to 70B. LongLoRA adopts LLaMA2 7B from 4k context to 100k, or LLaMA2 70B to 32k on a single 8x A100 machine. LongLoRA extends models' context while retaining their original architectures, and is compatible with most existing techniques, like FlashAttention-2. In addition, to make LongLoRA practical, we collect a dataset, LongQA, for supervised fine-tuning. It contains more than 3k long context question-answer pairs.
👍9👌1
ایجاد optical illusion با مدل‌های دیفوژنی

در چند روز گذشته، ترند ایجاد تصاویر دارای خطای دید با مدل‌های دیفوژنی تبدیل متن به تصویر بالا گرفته. تو این مساله، مدل با ورودی گرفتن یک پرامپت (مثل مثلا درخت‌ها تو پاییز) و البته یک تصویر پایه دیگه (مثل تصویر مریم میرزاخانی)، مدل میاد و جوری تصویر تولید می‌کنه که اصلش همون پرامپت اصلی (یعنی درخت‌های پاییزی) هست ولی وقتی که چشماتون رو اندکی چپ می‌کنید یا از دور به تصویر نگاه می‌کنید اون تصویر پایه (مثل مریم میرزاخانی) رو می‌تونید ببینید. ما هم چند نمونه جالب و البته نمونه‌هایی که خودمون تولید کردیم رو اینجا گذاشتیم. اگه خواستید خودتون هم امتحانش کنید میتونید از اینجا امتحان کنید:

https://huggingface.co/spaces/pngwn/IllusionDiffusion

🙏ctedit: @nlp_stuff
👍337
👍11
🔹 ۲۰ مهر ۱۴۰۲ | معاون اجتماعی سازمان وظیفه عمومی فراجا:
لغو سهمیه امریه شرکت‌های دانش‌بنیان برای مشمولان دارای مدرک کارشناسی، صحت ندارد؛
مشمولان فارغ‌التحصیل کارشناسی و بالاتر، می‌توانند از امریه شرکت‌های دانش‌بنیان استفاده کنند.

isna.ir/news/1402072013902
🤩14
Forwarded from School of AI
جف هینتون، پدرخوانده هوش مصنوعی بازنشست شد…
72
Forwarded from Ai Events️ (حمید محمودآبادی)
یه خبر عالی!
دانشکده کامپیوتر دانشگاه شریف این ترم درس LLM با تدریس اساتید دکتر رهبان، دکتر سلیمانی و دکتر عسگری گذاشته!

لینک سرفصل‌ها

لینک ویدیوها

اگر چه مطالبی که عنوان میشه رو میتونید تو دوره‌های کوتاه کورسرا پیدا کنید، اما دیدن این درس نگاه جامعی بهتون می‌ده و قطعا خالی از لطف نیست.
@Ai_Events
44👍13👌3
⭕️دانشکده ریاضی و علوم کامپیوتر با همکاری انجمن علمی علوم کامپیوتر برگزار میکند:

🟢سمینار یادگیری ماشین قابل اعتماد: بررسی اطمینان در هوش مصنوعی

🗣سخنران: محمد سبک‌رو

- پژوهشگر در Okinawa institute of Science and Technology
- پژوهشگر در پژوهشگاه دانش‌های بنیادین IPM

🕐زمان برگزاری: دوشنبه ۸ آبان، ساعت ۱۴
آمفی تئاتر دانشکده ریاضی و علوم کامپیوتر
👍21
Forwarded from School of AI
جناب دکتر توتون‌چیان، استاد دانشگاه Drexel برای جمعه‌ی این هفته (بعد از ظهر) یک جلسه‌ی آنلاین برای به‌اشتراک‌گذاری تجربه‌‌ها در زمینه‌ی کاربردهای جدید LLM ها در محیط واقعی برگزار می‌کنند.

اگر متخصص علوم داده یا یادگیری ماشین هستید و تجربه‌ای در این زمینه دارید و یا می‌خواهید از تجربه‌ی سایر متخصصین در این زمینه استفاده کنید، در این جلسه شرکت کنید.

زمان دقیق و لینک زوم متعاقبا در همین کانال و همچنین در گروه دکتر توتون‌چیان (لینک زیر) اعلام خواهد شد.

https://news.1rj.ru/str/+8mhPMpJw97QwOWUx
👍5🤔1