Forwarded from Ali's Notes
Statistics for Applications
@css_nlp
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
MIT 18.650 Statistics for Applications, Fall 2016
MIT 18.650 Statistics for Applications, Fall 2016 View the complete course: http://ocw.mit.edu/18-650F16 Instructor: Philippe Rigollet This course offers an ...
👍3
آیا LLM ها می توانند بدون درخواست پرامپت به طور موثر استدلال کنند؟
◾️ Chain-of-Thought Reasoning Without Prompting
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Chain-of-Thought Reasoning Without Prompting
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3
در این #مقاله بررسی میکنند که چگونه LLMها پاسخها را بر اساس زمینههای کاربر استنباط میکنند و بدون درخواستهای صریح تطبیق میدهند.
◾️ Implicit Personalization in Language Models: A Systematic Study
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Implicit Personalization in Language Models: A Systematic Study
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍2
5 تا از مقالات برگزیده در #کنفرانس EMNLP2024 پذیرش شدند.
◾️ An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance
◾️ Towards Robust Speech Representation Learning for Thousands of Languages
◾️ Backward Lens: Projecting Language Model Gradients into the Vocabulary Space
◾️ Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method
◾️ CoGen: Learning from Feedback with Coupled Comprehension and Generation
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance
◾️ Towards Robust Speech Representation Learning for Thousands of Languages
◾️ Backward Lens: Projecting Language Model Gradients into the Vocabulary Space
◾️ Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method
◾️ CoGen: Learning from Feedback with Coupled Comprehension and Generation
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4
آلومینیوم دیتاست | آموزش هوش مصنوعی
بدون شرح! @AluminumDataset
تحلیل های مختلفی برای این نمودار میشه کرد.
یکی از تحلیل ها اینکه این نمودار داره نشون میده یکی از منابع تغذیه هوش مصنوعی داره کم میشه البته صرفا مختص سایت stack overflow نیست و سایتهای زیادی دارن کاربرانشون رو از دست میدن که باعث میشه تولید چنین دیتا هایی کم بشه. قطعا این روند توی آینده هوش مصنوعی اثر میگذاره.
#هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
یکی از تحلیل ها اینکه این نمودار داره نشون میده یکی از منابع تغذیه هوش مصنوعی داره کم میشه البته صرفا مختص سایت stack overflow نیست و سایتهای زیادی دارن کاربرانشون رو از دست میدن که باعث میشه تولید چنین دیتا هایی کم بشه. قطعا این روند توی آینده هوش مصنوعی اثر میگذاره.
#هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍18👌1🕊1
چگونه تقسیم بندی می تواند تولید گزارش های #رادیولوژی را بهبود ببخشد؟
◾️ MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4
مدل جدید Marco-o1 معرفی شد تا جرقه ای برای بقیه مدلها باشه تا به سمت استدلال بزرگ برای راه حل های باز باشد.
- یک مجموعه داده CoT برای فعال کردن توانایی های استدلال LLM ساخته و منتشر کرد.
ا LLM یکپارچه با MCTS برای گسترش فضای راه حل.
- مدل را در کار دنیای واقعی کاوش کرد: ترجمه محلی...
◾️ Github
◾️ Hugging Face
◾️ Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions
#مقاله #ایده_جذاب #یادگیری_تقویتی #دیتاست
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
- یک مجموعه داده CoT برای فعال کردن توانایی های استدلال LLM ساخته و منتشر کرد.
ا LLM یکپارچه با MCTS برای گسترش فضای راه حل.
- مدل را در کار دنیای واقعی کاوش کرد: ترجمه محلی...
◾️ Github
◾️ Hugging Face
◾️ Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions
#مقاله #ایده_جذاب #یادگیری_تقویتی #دیتاست
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍2
اگر دنبال #دوره خوب راجب نظریه گراف میگردید دانشگاه MIT #کلاس_آموزشی این دوره رو داره.
◾️ Graph Theory and Additive Combinatorics
◾️ YouTube: Graph Theory and Additive Combinatorics
#کتاب #الگوریتمها #نظریه_گراف #گراف
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Graph Theory and Additive Combinatorics
◾️ YouTube: Graph Theory and Additive Combinatorics
#کتاب #الگوریتمها #نظریه_گراف #گراف
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3❤1👌1
یه ابزار ترجمه و دوبله (dubb) ویدیو با کیفیت خیلی بالا و با کپشن در حد و استاندارد Netflix-quality هست. فعلا از زبان فارسی پشتیبانی نمیکنه ولی میتونین توسعه بدید اینو با مدلهای موجود این فیچر رو بهش اضافه کنین
◾️ VideoLingo: is an all-in-one video translation, localization, and dubbing tool aimed at generating Netflix-quality subnoscripts. It eliminates stiff machine translations and multi-line subnoscripts while adding high-quality dubbing, enabling global knowledge sharing across language barriers.
#پروژه #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ VideoLingo: is an all-in-one video translation, localization, and dubbing tool aimed at generating Netflix-quality subnoscripts. It eliminates stiff machine translations and multi-line subnoscripts while adding high-quality dubbing, enabling global knowledge sharing across language barriers.
#پروژه #هوش_مصنوعی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍8🔥1
اگر #هوش_مصنوعی بتواند پیشرفت بیماری را به عنوان یک ویدیو شبیه سازی کند چه می شود؟
▪️ Medical Video Generation for Disease Progression Simulation
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Medical Video Generation for Disease Progression Simulation
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3👎2🆒2
خبر مهم
شرکت تسلا اعلام کرد:
استخدام متخصص برنامه نویس و مهندس نرم افزار و …
به صورت دورکاری
حقوق سالیانه بین ۸۰ هزار تا ۲۷۰ هزار دلار
https://www.tesla.com/careers/search/
https://www.tododisca.com/en/elon-musk-seeks-people-from-an-world-work-home-payroll-of-270000-annual/amp/
شرکت تسلا اعلام کرد:
استخدام متخصص برنامه نویس و مهندس نرم افزار و …
به صورت دورکاری
حقوق سالیانه بین ۸۰ هزار تا ۲۷۰ هزار دلار
https://www.tesla.com/careers/search/
https://www.tododisca.com/en/elon-musk-seeks-people-from-an-world-work-home-payroll-of-270000-annual/amp/
👍8🆒3👌2
اگر پولتون میرسه و در عرصه هوش مصنوعی حرفه ای هستید میتونین این مادربورد ایسوس رو خریداری کنین یکی ازز امتیازات خوب این مادربورد قابلیت پشتیبانی از دوتا کارت گرافیک 4090 هستش و بسیاری امکانات دیگه
https://exo.ir/product/asus-rog-crosshair-x870e-hero
قشنگ ی سرور شخصی دارین
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://exo.ir/product/asus-rog-crosshair-x870e-hero
قشنگ ی سرور شخصی دارین
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
exo.ir
خرید مادربرد ASUS ROG CROSSHAIR X870E HERO از فروشگاه اگزو گیم
مادربرد ASUS ROG CROSSHAIR X870E HERO محصولی از ایسوس (ایسوز) و عضوی از سری راگ کراسهر (آر او جی کراس هایر) است که به سوکت AM5 ای ام دی، چیپست بالا ردهی ایکس 870 و 4 اسلات رم DDR5 مجهز شده است که سازگار با پردازندههای 7000 و 8000 و 9000 خواهد بود.
👍4👎3
در این مقاله از اینکه مشکل شبکه های عصبی چیست؟ صحبت میشه و بحث به اینکه چرا نیاز به شبکه های عصبی بیزی داریم به پایان میرسه.
◾️ Bayesian Neural Networks
#شبکه_عصبی #مقاله #آمار
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Bayesian Neural Networks
#شبکه_عصبی #مقاله #آمار
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6👎2🆒1
Future LLM agents speak JSON, python, and other structures. Excited to announce XGrammar, an structured generation library that enables zero-overhead structure constraining
◾️ Achieving Efficient, Flexible, and Portable Structured Generation with XGrammar
#پایتون #برنامه_نویسی #هوش_مصنوعی #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Achieving Efficient, Flexible, and Portable Structured Generation with XGrammar
#پایتون #برنامه_نویسی #هوش_مصنوعی #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6👎2❤1
در این مقاله ادعا شده که مدل کوچک Hymba که توسعه داده شده از مدلهای بزرگی نظیر Llama-3.2 and Qwen-2.5 عملکردی خیلی بهتری داره
◾️ Hymba: A Hybrid-head Architecture for Small Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Hymba: A Hybrid-head Architecture for Small Language Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3👎2🆒2
Forwarded from مهندسی و علم داده
✅با افزایش مدلهای زبانی بزرگ (LLMs)، فاینتیونینگ برای وظایف خاص بیش از پیش اهمیت یافته است :
روش LoRA (Low-Rank Adaptation) :با افزودن ماتریسهای تطبیق کمرتبه، تعداد پارامترهای قابل آموزش را کاهش میدهد و فاینتیونینگ را سریعتر و بهینهتر میکند.
روش LoRA-FA : (LoRA with Feature Augmentation) این روش LoRA را با تقویت ویژگیهای خارجی ترکیب میکند و ویژگیهای خاص وظیفه را به مدل اضافه میکند تا عملکرد را با حداقل بار اضافی افزایش دهد.
روش Vera: (Virtual Embedding Regularization Adaptation) Vera به تنظیم نمایههای مدل در حین فاینتیونینگ کمک میکند و از بیشبرازش جلوگیری کرده و تعمیمپذیری را در حوزههای مختلف بهبود میبخشد.
روش Delta LoRA :این روش بهروزرسانی فقط لایههای مهمتر را هدف قرار میدهد و هزینههای محاسباتی را کاهش میدهد در حالی که اثربخشی فاینتیونینگ حفظ میشود.
روش : Prefix Tuning بهجای تغییر وزنهای مدل، این تکنیک توکنهای پیشوند خاص وظیفه را یاد میگیرد که خروجی مدل را هدایت میکند و امکان سازگاری مؤثر با وظایف جدید را فراهم میآورد.
@BIMining
روش LoRA (Low-Rank Adaptation) :با افزودن ماتریسهای تطبیق کمرتبه، تعداد پارامترهای قابل آموزش را کاهش میدهد و فاینتیونینگ را سریعتر و بهینهتر میکند.
روش LoRA-FA : (LoRA with Feature Augmentation) این روش LoRA را با تقویت ویژگیهای خارجی ترکیب میکند و ویژگیهای خاص وظیفه را به مدل اضافه میکند تا عملکرد را با حداقل بار اضافی افزایش دهد.
روش Vera: (Virtual Embedding Regularization Adaptation) Vera به تنظیم نمایههای مدل در حین فاینتیونینگ کمک میکند و از بیشبرازش جلوگیری کرده و تعمیمپذیری را در حوزههای مختلف بهبود میبخشد.
روش Delta LoRA :این روش بهروزرسانی فقط لایههای مهمتر را هدف قرار میدهد و هزینههای محاسباتی را کاهش میدهد در حالی که اثربخشی فاینتیونینگ حفظ میشود.
روش : Prefix Tuning بهجای تغییر وزنهای مدل، این تکنیک توکنهای پیشوند خاص وظیفه را یاد میگیرد که خروجی مدل را هدایت میکند و امکان سازگاری مؤثر با وظایف جدید را فراهم میآورد.
@BIMining
👍9❤1👎1
این روزها در میون اخبار مربوط به #هوش_مصنوعی ، سرخط مهمی به چشم میخوره که توجه چندانی رو برنیانگیخت، اما نظرم خبر خیلی مهمیه: پژوهشگران دریایی موفق شدن به کمک بازسازی الگوی صوتی مکالمهی نهنگها، با یک گوژپشت، ۲۰ دقیقه "صحبت" کنن. نکتهی مهمش خود اینه که ما " نمیتونیم بفهمیم" که توی این ۲۰ دقیقه چه صحبتهایی بین نهنگ و ابزار هوش مصنوعی رد وبدل شده و چی باعث شده که نهنگ ۲۰ دقیقه در کنار قایق پژوهشگران مکث کنه و به صحبت "ادامه" بده....
▪️ Interactive bioacoustic playback as a tool for detecting and exploring nonhuman intelligence: “conversing” with an Alaskan humpback whale
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Interactive bioacoustic playback as a tool for detecting and exploring nonhuman intelligence: “conversing” with an Alaskan humpback whale
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
PubMed Central (PMC)
Interactive bioacoustic playback as a tool for detecting and exploring nonhuman intelligence: “conversing” with an Alaskan humpback…
Here we report on a rare and opportunistic acoustic turn-taking with an adult female humpback whale, known as Twain, in Southeast Alaska. Post hoc acoustic and statistical analyses of a 20-min acoustic exchange between the broadcast of a recorded ...
🔥10😱9❤6👍2👎1