Media is too big
VIEW IN TELEGRAM
قدرت" دست های پنهان" کاری کاری کرده که ایلان ماسک که برای منافع شخصیش در شرکتش میشناسیمش ولی به طور ناخودآگاه منافع عمومی رو داره محقق میکنه هیچکسی نمیتونه در برابر این خواست عمومی مقاومت کنه!
این فیلم مصاحبه برای دوسال پیش بوده و الان محقق شد.
بقول ایلان ماسک: این یک نظریه ای بود که باید ثابت میشد
#متفرقه #علم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
این فیلم مصاحبه برای دوسال پیش بوده و الان محقق شد.
پ.ن: اینجا مهندسین سازه، مکانیک، هوافضا، فیزیک و ریاضی و بسیاری از علوم دست در دست هم دادند تا یک شی که با ۴ برابر سرعت صوت و سنگین ترین شی که در حال سقوط هست را بتونن با علم ثابت کنند این کار ماهر شدنی هست
بقول ایلان ماسک: این یک نظریه ای بود که باید ثابت میشد
#متفرقه #علم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍22❤5👎2
This media is not supported in your browser
VIEW IN TELEGRAM
NVS Journal Club:
In this session, we will focus on NeRF, reviewing the original paper and discussing its core principles.
https://arxiv.org/pdf/2003.08934
Summary of NeRF:
NeRF synthesizes novel views of complex scenes by optimizing a continuous volumetric scene representation using a sparse set of input images. It utilizes a fully-connected neural network that takes a 5D coordinate—comprising the spatial location and viewing direction—as input, and outputs the volume density and radiance at that location. By querying points along camera rays and applying volume rendering techniques, NeRF generates photorealistic images. This method requires only the input images with known camera poses and has been shown to outperform previous methods in generating realistic novel views, particularly for scenes with intricate geometry and appearance.
Session Details:
- 📅 Date: Thursday, October 17
- 🕒 Time: 10:30 - 12:00 PM (IRST)
- 🌐 Link: https://meet.kntu.ac.ir/b/rooms/wap-f0a-qwv/join
In this session, we will focus on NeRF, reviewing the original paper and discussing its core principles.
https://arxiv.org/pdf/2003.08934
Summary of NeRF:
NeRF synthesizes novel views of complex scenes by optimizing a continuous volumetric scene representation using a sparse set of input images. It utilizes a fully-connected neural network that takes a 5D coordinate—comprising the spatial location and viewing direction—as input, and outputs the volume density and radiance at that location. By querying points along camera rays and applying volume rendering techniques, NeRF generates photorealistic images. This method requires only the input images with known camera poses and has been shown to outperform previous methods in generating realistic novel views, particularly for scenes with intricate geometry and appearance.
Session Details:
- 📅 Date: Thursday, October 17
- 🕒 Time: 10:30 - 12:00 PM (IRST)
- 🌐 Link: https://meet.kntu.ac.ir/b/rooms/wap-f0a-qwv/join
👍3👌2
DeepMind AI Expert
NVS Journal Club: In this session, we will focus on NeRF, reviewing the original paper and discussing its core principles. https://arxiv.org/pdf/2003.08934 Summary of NeRF: NeRF synthesizes novel views of complex scenes by optimizing a continuous volumetric…
In this webinar series, we aim to explore the exciting field of Novel View Synthesis (NVS), focusing particularly on two state-of-the-art techniques: Neural Radiance Fields (NeRF) and 3D Gaussian Splatting. These methods represent the forefront of NVS, as seen in the many papers published at top-tier conferences like CVPR. Over the course of this series, we will explore how these algorithms push the boundaries of view synthesis and neural rendering.
👍4👌1
DeepMind AI Expert
In this webinar series, we aim to explore the exciting field of Novel View Synthesis (NVS), focusing particularly on two state-of-the-art techniques: Neural Radiance Fields (NeRF) and 3D Gaussian Splatting. These methods represent the forefront of NVS, as…
ارسالی یکی از دوستان:
فردا ساعت 10:30 صبح بوقت ایران توی لب دکتر نصیحتکن از دانشگاه خواجهنصیر در مورد موضوع NeRF که اخیرا جزو موضوعات جذاب Computer vision هست، ارائه داریم. (پرزنتیشن و کانتنت فارسی درباره این موضوع نسبتا جدید تقریبا وجود نداره)
جلسه رایگان هست و همه میتونن شرکت کنن. گفتم اطلاع بدم اگه تمایل داشتید اطلاعرسانی کنید که اگه کسی علاقه داشت بتونه شرکت کنه.
Session Details:
- 📅 Date: Thursday, October 17
- 🕒 Time: 10:30 AM - 12:00 PM (IRST)
- 🌐 Link: https://meet.kntu.ac.ir/b/rooms/wap-f0a-qwv/join
فردا ساعت 10:30 صبح بوقت ایران توی لب دکتر نصیحتکن از دانشگاه خواجهنصیر در مورد موضوع NeRF که اخیرا جزو موضوعات جذاب Computer vision هست، ارائه داریم. (پرزنتیشن و کانتنت فارسی درباره این موضوع نسبتا جدید تقریبا وجود نداره)
جلسه رایگان هست و همه میتونن شرکت کنن. گفتم اطلاع بدم اگه تمایل داشتید اطلاعرسانی کنید که اگه کسی علاقه داشت بتونه شرکت کنه.
Session Details:
- 📅 Date: Thursday, October 17
- 🕒 Time: 10:30 AM - 12:00 PM (IRST)
- 🌐 Link: https://meet.kntu.ac.ir/b/rooms/wap-f0a-qwv/join
👍13😁3❤1👎1🔥1
معرفی سایت nn.labml.ai
در این سایت پیاده سازی #پایتورچ مدل ها و الگوریتم های مهم هوش مصنوعی به همراه توضیح خط به خط کد و فرمول های ریاضی به کار رفته در کد مقالات است.
و منبع عالی برای #کدخوانی #مقالات هست.
لیست موضوعات پیاده سازی شده در این سایت:
✨ Transformers
✨ Low-Rank Adaptation (LoRA)
✨Eleuther GPT-NeoX
✨Diffusion models
✨Generative Adversarial Networks
✨Recurrent Highway Networks
✨ LSTM
✨ HyperNetworks - HyperLSTM
✨ ResNet
✨ ConvMixer
✨ Capsule Networks
✨ U-Net
✨ Sketch RNN
✨ Graph Neural Networks
✨ Reinforcement Learning
✨ Counterfactual Regret Minimization (CFR)
✨ Optimizers
✨ Normalization Layers
✨ Distillation
✨ Adaptive Computation
✨ Uncertainty
✨ Activations
✨ Language Model Sampling
✨ Scalable Training/Inference
#منابع #هوش_مصنوعی
#مقاله_خوانی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
در این سایت پیاده سازی #پایتورچ مدل ها و الگوریتم های مهم هوش مصنوعی به همراه توضیح خط به خط کد و فرمول های ریاضی به کار رفته در کد مقالات است.
و منبع عالی برای #کدخوانی #مقالات هست.
لیست موضوعات پیاده سازی شده در این سایت:
✨ Transformers
✨ Low-Rank Adaptation (LoRA)
✨Eleuther GPT-NeoX
✨Diffusion models
✨Generative Adversarial Networks
✨Recurrent Highway Networks
✨ LSTM
✨ HyperNetworks - HyperLSTM
✨ ResNet
✨ ConvMixer
✨ Capsule Networks
✨ U-Net
✨ Sketch RNN
✨ Graph Neural Networks
✨ Reinforcement Learning
✨ Counterfactual Regret Minimization (CFR)
✨ Optimizers
✨ Normalization Layers
✨ Distillation
✨ Adaptive Computation
✨ Uncertainty
✨ Activations
✨ Language Model Sampling
✨ Scalable Training/Inference
#منابع #هوش_مصنوعی
#مقاله_خوانی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤19👍9👎1
آیا هوش مصنوعی می تواند فرآیندهای توسعه دارو را تغییر دهد؟
▪️ Y-Mol: A Multiscale Biomedical Knowledge-Guided Large Language Model for Drug Development
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Y-Mol: A Multiscale Biomedical Knowledge-Guided Large Language Model for Drug Development
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍9👎1🔥1
آیا هوش مصنوعی می تواند تصمیم گیری پزشکی را از طریق همکاری نمایندگی های تخصصی افزایش دهد؟
▪️ CliBench: A Multifaceted and Multigranular Evaluation of Large Language Models for Clinical Decision Making
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ CliBench: A Multifaceted and Multigranular Evaluation of Large Language Models for Clinical Decision Making
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👌5👍2👎2
آیا هوش مصنوعی می تواند دستخط پزشک را به دقت بخواند؟
◾️ MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prenoscriptions
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prenoscriptions
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
😁11🆒4👍3👎3🔥3
Forwarded from Mohammadmahdi Mirzaei
Media is too big
VIEW IN TELEGRAM
سلام به همگی
ویدیو ارائه هفته پیش کامیونیتی (مهدی آخی)
خوشحال میشیم اگه انتقاد و پیشنهادی دارید حتما بگید تا بتونیم دورهمیها رو بهبود بدیم.
ویدیو ارائه هفته پیش کامیونیتی (مهدی آخی)
خوشحال میشیم اگه انتقاد و پیشنهادی دارید حتما بگید تا بتونیم دورهمیها رو بهبود بدیم.
❤6👍2👎2👌2
- SAM 2.1: a model for image/video segmentation
- Spirit LM: multimodal LM that mixes text and speech
- Layer Skip: architecture designed for accelerated LLM generation. The early layers do a draft, and the following ones verify/improve
- Open Materials: datasets and models for materials discovery
- MEXMA: MIT-licensed pre-trained cross-lingual sentence encoder
- Self-Taught Evaluator: Technique to generate synthetic preference data
- Meta Lingua: simple repo for training at scale
https://huggingface.co/collections/reach-vb/sam-21-6702d40defe7611a8bafa881
https://huggingface.co/collections/facebook/layerskip-666b25c50c8ae90e1965727a
https://huggingface.co/collections/facebook/layerskip-666b25c50c8ae90e1965727a
- Spirit LM: multimodal LM that mixes text and speech
- Layer Skip: architecture designed for accelerated LLM generation. The early layers do a draft, and the following ones verify/improve
- Open Materials: datasets and models for materials discovery
- MEXMA: MIT-licensed pre-trained cross-lingual sentence encoder
- Self-Taught Evaluator: Technique to generate synthetic preference data
- Meta Lingua: simple repo for training at scale
https://huggingface.co/collections/reach-vb/sam-21-6702d40defe7611a8bafa881
https://huggingface.co/collections/facebook/layerskip-666b25c50c8ae90e1965727a
https://huggingface.co/collections/facebook/layerskip-666b25c50c8ae90e1965727a
huggingface.co
SAM 2.1 - a reach-vb Collection
Collection of SAM 2.1 model checkpoints
👍3👎1
راه اندازی ربات پاسخ گو به سوالات حقوقی فارسی
این ربات به کاربران امکان میدهد که سوالات حقوقی خود را به صورت مستقیم از طریق چت مطرح کنند و پاسخهای دقیق و متناسب با قوانین موجود دریافت کنند. این ابزار میتواند در وبسایتها و اپلیکیشنهای مشاوره حقوقی مورد استفاده قرار بگیرد تا تجربهی کاربران بهبود یافته و به سوالات آنان به سرعت پاسخ داده شود.
از این ربات میتوان در پروژههای مختلفی نظیر پلتفرمهای مشاوره حقوقی آنلاین، اپلیکیشنهای موبایل، و حتی سیستمهای داخلی شرکتها و سازمانها بهره برد.
📱 GitHub Repo
پ.ن: دوستان میگن که کدش خطا داره
دیتاهابر
#پروژه #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
این ربات به کاربران امکان میدهد که سوالات حقوقی خود را به صورت مستقیم از طریق چت مطرح کنند و پاسخهای دقیق و متناسب با قوانین موجود دریافت کنند. این ابزار میتواند در وبسایتها و اپلیکیشنهای مشاوره حقوقی مورد استفاده قرار بگیرد تا تجربهی کاربران بهبود یافته و به سوالات آنان به سرعت پاسخ داده شود.
از این ربات میتوان در پروژههای مختلفی نظیر پلتفرمهای مشاوره حقوقی آنلاین، اپلیکیشنهای موبایل، و حتی سیستمهای داخلی شرکتها و سازمانها بهره برد.
📱 GitHub Repo
پ.ن: دوستان میگن که کدش خطا داره
دیتاهابر
#پروژه #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥4❤2👍1
Forwarded from زندگی به عنوان سرویس
This media is not supported in your browser
VIEW IN TELEGRAM
برنامه نویسای "دیوار" و "کافه بازار" در حال آماده شدن برای باز کردن جیرا.
ریچ کیدزای لعنتی.
ههبلتخعبلحجنجحعغیمجمججحجممجومجد
@lifeAsAService
ریچ کیدزای لعنتی.
ههبلتخعبلحجنجحعغیمجمججحجممجومجد
@lifeAsAService
👍5🕊1
Forwarded from Out of Distribution (M S)
ایدههای جدید در صنعت بازیسازی به لطف دیفوژن
گاهی وقتا یک چیزی برای یک نیازی ابداع میشه ولی در ادامه نیاز دیگهای رو پاسخ میده که به ذهن آدم هم نمیرسیده از اول که به اون درد هم میخوره. حالا این شده قصه این پروژه جدیدی که با دیفوژنمدلها یک بازی کامپیوتری رو سیمولیت میکنند. اگر اشتباه نکنم داستان به صورت خلاصه این شکلیه که میان دادههای بازی رو جمع آوری میکنند و بعدش یک دیفوژن مدل رو بر حسب فریمهای قبلی و اکشنهای کاربر آموزشش میدن تا فریم بعدی بازی رو تولید کنه. بعدش، کاربر میشینه با این دیفوژن مدل تعامل میکنه و برحسب اکشنهایی که میزنه و فریمهای قبلی، دیفوژن مدل فریمهای بعدی رو براش تولید میکنه و به بیان دیگه دیفوژن مدل یک نوع جنریتور world model میشه. با این که خروجیهای فعلیشون خیلی نرم و شبیه به بازیهای عادی به نظر میاد هنوز البته جای کار داره و کلی مورد هست، مثلا چون مدل مموری نداره ممکنه شما در رو باز کنید برید توی یک اتاق بعد پشت سرتون رو برگردید نگاه کنید ببینید دری نیست:) (که البته از نظر من خیلی باحاله:)). با این حال ولی میشه متصور بود در عرض ۵ سال دیگه، با حضور LLMها و دیفوژن مدلها، صنعت بازیسازی هم محتول بشه.
لینک پروژه:
https://diamond-wm.github.io/
گاهی وقتا یک چیزی برای یک نیازی ابداع میشه ولی در ادامه نیاز دیگهای رو پاسخ میده که به ذهن آدم هم نمیرسیده از اول که به اون درد هم میخوره. حالا این شده قصه این پروژه جدیدی که با دیفوژنمدلها یک بازی کامپیوتری رو سیمولیت میکنند. اگر اشتباه نکنم داستان به صورت خلاصه این شکلیه که میان دادههای بازی رو جمع آوری میکنند و بعدش یک دیفوژن مدل رو بر حسب فریمهای قبلی و اکشنهای کاربر آموزشش میدن تا فریم بعدی بازی رو تولید کنه. بعدش، کاربر میشینه با این دیفوژن مدل تعامل میکنه و برحسب اکشنهایی که میزنه و فریمهای قبلی، دیفوژن مدل فریمهای بعدی رو براش تولید میکنه و به بیان دیگه دیفوژن مدل یک نوع جنریتور world model میشه. با این که خروجیهای فعلیشون خیلی نرم و شبیه به بازیهای عادی به نظر میاد هنوز البته جای کار داره و کلی مورد هست، مثلا چون مدل مموری نداره ممکنه شما در رو باز کنید برید توی یک اتاق بعد پشت سرتون رو برگردید نگاه کنید ببینید دری نیست:) (که البته از نظر من خیلی باحاله:)). با این حال ولی میشه متصور بود در عرض ۵ سال دیگه، با حضور LLMها و دیفوژن مدلها، صنعت بازیسازی هم محتول بشه.
لینک پروژه:
https://diamond-wm.github.io/
diamond-wm.github.io
💎 DIAMOND
Diffusion for World Modeling: Visual Details Matter in Atari (DIAMOND) 💎
👍9🆒2❤1
با رای هیئت عمومی دیوان عدالت اداری لزوم درج نام استاد راهنما بهعنوان نویسندهٔ مسئول مقاله ابطال شد:
دیوان عدالت اداری: اصل بر عدم صلاحیت استاد راهنما برای نویسنده مسئول بودن در مقاله است.
در بخشی از رای هیئت عمومی آمده است:
«مقاله علمی مستخرج از رساله، اثر حقوقی مستقلی است که پدیدآورنده آن دانشجو است و وی مالک فکری آن محسوب میشود و استاد راهنما صرفاً وظیفه نظارت بر آن را برعهده دارد.»
ببینیم چیمیشه بازم دانشجوی بیچاره بازم باید اسمشو بزنه 😂
دیوان عدالت اداری: اصل بر عدم صلاحیت استاد راهنما برای نویسنده مسئول بودن در مقاله است.
در بخشی از رای هیئت عمومی آمده است:
«مقاله علمی مستخرج از رساله، اثر حقوقی مستقلی است که پدیدآورنده آن دانشجو است و وی مالک فکری آن محسوب میشود و استاد راهنما صرفاً وظیفه نظارت بر آن را برعهده دارد.»
ببینیم چیمیشه بازم دانشجوی بیچاره بازم باید اسمشو بزنه 😂
👌38👍12👎1
🔥 فرصتی طلایی برای ورود به دنیای LLM ها و چتباتها!
با یادگیری فریمورک LangChain، میتوانید به ساخت و توسعه اپلیکیشن های مبتنی بر llm ها و AI Agentها (عوامل هوشمند) بپردازید که در حال حاضر یکی از پررونقترین حوزههای فناوری است. با توجه به افزایش تقاضا برای مدلهای زبانی پیشرفته و عوامل هوشمند در صنایع مختلف، مهارت در LangChain شما را برای فرصتهای شغلی فوقالعادهای مانند ساخت چتباتهای پیچیده، RAG،دستیارهای هوشمند و موتورهای جست و جو و ... آماده میکند. اگر به دنبال ورود به دنیای آینده هوش مصنوعی هستید، این دوره سکوی پرتاب شماست!
🔗 لینک دوره:
https://faradars.org/courses/langchain-framework-creating-a-personal-chatbot-fvait313
با یادگیری فریمورک LangChain، میتوانید به ساخت و توسعه اپلیکیشن های مبتنی بر llm ها و AI Agentها (عوامل هوشمند) بپردازید که در حال حاضر یکی از پررونقترین حوزههای فناوری است. با توجه به افزایش تقاضا برای مدلهای زبانی پیشرفته و عوامل هوشمند در صنایع مختلف، مهارت در LangChain شما را برای فرصتهای شغلی فوقالعادهای مانند ساخت چتباتهای پیچیده، RAG،دستیارهای هوشمند و موتورهای جست و جو و ... آماده میکند. اگر به دنبال ورود به دنیای آینده هوش مصنوعی هستید، این دوره سکوی پرتاب شماست!
🔗 لینک دوره:
https://faradars.org/courses/langchain-framework-creating-a-personal-chatbot-fvait313
👍6👎3
Forwarded from Recommender system (MehriMah Amiri)
LLM Agents MOOC
This course covers the following topics
- Foundation of LLMs
- Reasoning
- Planning, tool use
- LLM agent infrastructure
- Retrieval-augmented generation
- Code generation, data science
- Multimodal agents, robotics
- Evaluation and benchmarking on agent applications
- Privacy, safety and ethics
- Human-agent interaction, personalization, alignment
- Multi-agent collaboration
🔗 link : https://www.youtube.com/playlist?list=PLS01nW3RtgopsNLeM936V4TNSsvvVglLc
#llms #agents #mooc #onlinecourse #nlproc #deeplearning
This course covers the following topics
- Foundation of LLMs
- Reasoning
- Planning, tool use
- LLM agent infrastructure
- Retrieval-augmented generation
- Code generation, data science
- Multimodal agents, robotics
- Evaluation and benchmarking on agent applications
- Privacy, safety and ethics
- Human-agent interaction, personalization, alignment
- Multi-agent collaboration
🔗 link : https://www.youtube.com/playlist?list=PLS01nW3RtgopsNLeM936V4TNSsvvVglLc
#llms #agents #mooc #onlinecourse #nlproc #deeplearning
👍3❤1👌1
Forwarded from Recommender system (MehriMah Amiri)
https://fleuret.org/public/lbdl.pdf
== Table of Content ==
I Foundations
1 Machine Learning
- 1.1 Learning from data
- 1.2 Basis function regression
- 1.3 Under and overfitting
- 1.4 Categories of models
2 Efficient Computation
- 2.1 GPUs, TPUs, and batches
- 2.2 Tensors
3 Training
- 3.1 Losses
- 3.2 Autoregressive models
- 3.3 Gradient descent
- 3.4 Backpropagation
- 3.5 The value of depth
- 3.6 Training protocols
- 3.7 The benefits of scale
II Deep Models
4 Model Components
- 4.1 The notion of layer
- 4.2 Linear layers
- 4.3 Activation functions
- 4.4 Pooling
- 4.5 Dropout
- 4.6 Normalizing layers
- 4.7 Skip connections
- 4.8 Attention layers
- 4.9 Token embedding
- 4.10 Positional encoding
5 Architectures
- 5.1 Multi-Layer Perceptrons
- 5.2 Convolutional networks
- 5.3 Attention models
III Applications
6 Prediction
- 6.1 Image denoising
- 6.2 Image classification
- 6.3 Object detection
- 6.4 Semantic segmentation
- 6.5 Speech recognition
- 6.6 Text-image representations
- 6.7 Reinforcement learning
7 Synthesis
- 7.1 Text generation
- 7.2 Image generation
8 The Compute Schism
- 8.1 Prompt Engineering
- 8.2 Quantization
- 8.3 Adapters
- 8.4 Model merging
#deeplearning
== Table of Content ==
I Foundations
1 Machine Learning
- 1.1 Learning from data
- 1.2 Basis function regression
- 1.3 Under and overfitting
- 1.4 Categories of models
2 Efficient Computation
- 2.1 GPUs, TPUs, and batches
- 2.2 Tensors
3 Training
- 3.1 Losses
- 3.2 Autoregressive models
- 3.3 Gradient descent
- 3.4 Backpropagation
- 3.5 The value of depth
- 3.6 Training protocols
- 3.7 The benefits of scale
II Deep Models
4 Model Components
- 4.1 The notion of layer
- 4.2 Linear layers
- 4.3 Activation functions
- 4.4 Pooling
- 4.5 Dropout
- 4.6 Normalizing layers
- 4.7 Skip connections
- 4.8 Attention layers
- 4.9 Token embedding
- 4.10 Positional encoding
5 Architectures
- 5.1 Multi-Layer Perceptrons
- 5.2 Convolutional networks
- 5.3 Attention models
III Applications
6 Prediction
- 6.1 Image denoising
- 6.2 Image classification
- 6.3 Object detection
- 6.4 Semantic segmentation
- 6.5 Speech recognition
- 6.6 Text-image representations
- 6.7 Reinforcement learning
7 Synthesis
- 7.1 Text generation
- 7.2 Image generation
8 The Compute Schism
- 8.1 Prompt Engineering
- 8.2 Quantization
- 8.3 Adapters
- 8.4 Model merging
#deeplearning
👍7
Forwarded from Out of Distribution (M S)
هوش در لبه آشوب است
یک چیزی هست به نام اتوماتای سلولی ساده یا ECA. بدین صورت که یک آرایه یک بعدی از یک عده سلوله. هر سلول هم مقدارش میتونه صفر یا یک باشه و در طول گامهای زمانی مقادیر این سلولها بر حسب یک قاعده میتونن تغییر کنند که در ECA حالت بعدی برای هر سلولی صرفا قاعدهای از دقیقا دو خونه مجاور اون سلوله. بر همین حسب کلا ۲۵۶ تا قاعده میتونن وجود داشته باشند که البته ۸۸ تاشون فقط یونیک هستند. از طرف دیگه بر حسب این که این سلولها با مقداردهی اولیه رندوم در طول زمان چه پترنی رو طی میکنن این قاعدهها رو چهار دسته کردند: اونایی که به یک حالت یکنواخت همگرا میشن، اونایی که به یک حالت ثابت یا حالت چرخهای میرسن، اونایی که به یک حالت خاص نمیرسن و رفتار سیستم تصادفی میشه، و اونایی که به یک حالت پیچیدهای میرسن که بعضی نواحیشون استیبل و بعضی نواحشون پایداره ولی در کل یک سری ساختار توشون دیده میشه.
حالا یک پیپری اومده، از روند زمانی سلولهای هر قاعدهای نمونهبرداری کرده و دیتا درست کرده و یک معماری LLM طور با هدف Next Token Prediction رو روی این دادهها آموزش داده و انگار روی دادگان هر قاعدهای یک LLM جدا آموزش داده. در مرحله بعدی اوما هر کدوم از این LLMها رو روی تسکای پایین دستی مثل زیرمجموعهای از ARC و یک دیتاستی که توش هدف تشخیص حرکت بعدی شطرنج هست، فاین تیون کرده و نشون داده که اون مدلهایی که روی دادگان کلاس چهارم آموزش دیدن عملکرد بهتری رو روی تسکای پایین دستی ARC و شطرنج داشتند. در نهایت هم این نتیجهگیری رو کرده که شاید نیازی نیست که مدلهامون رو روی دادههای وسیع انسانی آموزش بدیم، بلکه شاید با آموزش دادن روی دادههایی با الگوهایی به قدر کافی پیچیده شاید بشه به هوش رسید (که از نظر من چرت میگه).
در کل دید و ایده جالبی داره و به همین بهانه ما رو با مفهوم Edge of Chaos هم آشنا کرد. مفهومی که انگار به یک حالتی از سیستم اشاره میکنه که در وضعی بین نظم و رندومنس قرار داره و در اون حالت پترنهای پیچیده ولی با دوام پایین (حالا یا در بعد زمان یا در بعد مکان) تولید میشن. گویا این مفهوم در شبکههای پیچیدهای در حوزههای زیستشناسی و روانشناسی و سیاست و علوم اجتماعی هم وجود داره.
لینک پیپر:
https://arxiv.org/abs/2410.02536
یک چیزی هست به نام اتوماتای سلولی ساده یا ECA. بدین صورت که یک آرایه یک بعدی از یک عده سلوله. هر سلول هم مقدارش میتونه صفر یا یک باشه و در طول گامهای زمانی مقادیر این سلولها بر حسب یک قاعده میتونن تغییر کنند که در ECA حالت بعدی برای هر سلولی صرفا قاعدهای از دقیقا دو خونه مجاور اون سلوله. بر همین حسب کلا ۲۵۶ تا قاعده میتونن وجود داشته باشند که البته ۸۸ تاشون فقط یونیک هستند. از طرف دیگه بر حسب این که این سلولها با مقداردهی اولیه رندوم در طول زمان چه پترنی رو طی میکنن این قاعدهها رو چهار دسته کردند: اونایی که به یک حالت یکنواخت همگرا میشن، اونایی که به یک حالت ثابت یا حالت چرخهای میرسن، اونایی که به یک حالت خاص نمیرسن و رفتار سیستم تصادفی میشه، و اونایی که به یک حالت پیچیدهای میرسن که بعضی نواحیشون استیبل و بعضی نواحشون پایداره ولی در کل یک سری ساختار توشون دیده میشه.
حالا یک پیپری اومده، از روند زمانی سلولهای هر قاعدهای نمونهبرداری کرده و دیتا درست کرده و یک معماری LLM طور با هدف Next Token Prediction رو روی این دادهها آموزش داده و انگار روی دادگان هر قاعدهای یک LLM جدا آموزش داده. در مرحله بعدی اوما هر کدوم از این LLMها رو روی تسکای پایین دستی مثل زیرمجموعهای از ARC و یک دیتاستی که توش هدف تشخیص حرکت بعدی شطرنج هست، فاین تیون کرده و نشون داده که اون مدلهایی که روی دادگان کلاس چهارم آموزش دیدن عملکرد بهتری رو روی تسکای پایین دستی ARC و شطرنج داشتند. در نهایت هم این نتیجهگیری رو کرده که شاید نیازی نیست که مدلهامون رو روی دادههای وسیع انسانی آموزش بدیم، بلکه شاید با آموزش دادن روی دادههایی با الگوهایی به قدر کافی پیچیده شاید بشه به هوش رسید (که از نظر من چرت میگه).
در کل دید و ایده جالبی داره و به همین بهانه ما رو با مفهوم Edge of Chaos هم آشنا کرد. مفهومی که انگار به یک حالتی از سیستم اشاره میکنه که در وضعی بین نظم و رندومنس قرار داره و در اون حالت پترنهای پیچیده ولی با دوام پایین (حالا یا در بعد زمان یا در بعد مکان) تولید میشن. گویا این مفهوم در شبکههای پیچیدهای در حوزههای زیستشناسی و روانشناسی و سیاست و علوم اجتماعی هم وجود داره.
لینک پیپر:
https://arxiv.org/abs/2410.02536
👍9❤2🕊1
دومین همایش "هوش مصنوعی و علوم ریاضی"
سخنرانان:
دکتر بهرام صادقی بی غم (دانشگاه الزهرا)
مدلسازی ریاضی، پلی به سوی اکوسیستم دیجیتال و دنیای هوش مصنوعی
دکتر محمد حسین رهبان (دانشگاه صنعتی شریف)
مدل های مولد مبتنی بر انتشار
دکتر محمد اکبری (دانشگاه صنعتی امیرکبیر)
ریاضیات و هوش مصنوعی: همزیستی برای آینده ای هوشمندتر
دکتر فرزاد اسکندری (دانشگاه علامه طباطبایی)
نقش مدل های آماری به همراه مولفه های هوش مصنوعی در چرخه حیات علم داده ها (کشف، تحلیل، مصورسازی و ارائه نمودن داده ها)
پنجشنبه مورخ 1403/08/03 از ساعت 8 تا 13
مکان: تهران، بزرگراه شهید حقانی، خروجی فرهنگستان ها و کتابخانه ملی، بلوار دکتر حسن حبیبی، فرهنگستان علوم، طبقه دوم، تالار ابوریحان
لینک حضور در وبینار:
https://skyroom.online/ch/ias/basic
#هوش_مصنوعی #علوم_ریاضی #همایش #سخنرانی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
سخنرانان:
دکتر بهرام صادقی بی غم (دانشگاه الزهرا)
مدلسازی ریاضی، پلی به سوی اکوسیستم دیجیتال و دنیای هوش مصنوعی
دکتر محمد حسین رهبان (دانشگاه صنعتی شریف)
مدل های مولد مبتنی بر انتشار
دکتر محمد اکبری (دانشگاه صنعتی امیرکبیر)
ریاضیات و هوش مصنوعی: همزیستی برای آینده ای هوشمندتر
دکتر فرزاد اسکندری (دانشگاه علامه طباطبایی)
نقش مدل های آماری به همراه مولفه های هوش مصنوعی در چرخه حیات علم داده ها (کشف، تحلیل، مصورسازی و ارائه نمودن داده ها)
پنجشنبه مورخ 1403/08/03 از ساعت 8 تا 13
مکان: تهران، بزرگراه شهید حقانی، خروجی فرهنگستان ها و کتابخانه ملی، بلوار دکتر حسن حبیبی، فرهنگستان علوم، طبقه دوم، تالار ابوریحان
لینک حضور در وبینار:
https://skyroom.online/ch/ias/basic
#هوش_مصنوعی #علوم_ریاضی #همایش #سخنرانی
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👌5👎3❤1👍1
Omiki & ASHER SWISSA & Skazi
Na Le(ASHER SWISSA Remix)
چون روز کوهنوردی هست گفتم امروزتونو پرانرژی شروع کنید و برید کوهنوردی حال روح و روانیتون رو عوض شه
#متفرقه
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
#متفرقه
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤5👍2