Forwarded from Tensorflow(@CVision) (Alister ☄️)
This media is not supported in your browser
VIEW IN TELEGRAM
یک مثال بسیار جالب از قابلیت های O1 برای مصور سازی آموزش مکانیسم اتنشن به دانشجویان که قابلیت های برنامه نویسی مدل جدید رو به تصویر میکشه.
در این ویدئو یه مثال عملی از مدل جدید openai برای بهبود فرایند تدریس نشون داده میشه. اینجا گوینده به دنبال ایجاد ابزارهای تعاملی برای آموزش مکانیزمهای پیچیدای مثل "Self-attention" در ترانسفورمرها ست. هدف اصلی ایشون، توسعه ابزارهای تعاملی و مصورسازی برای فهم بهتر دانشجویان از این مفاهیم پیچیده ست. اشاره میکنه که مدل جدید میتونه با دقت بیشتری به دستورالعملهای پیچیده پاسخ بده و ابزارهای کارآمدتری رو ایجاد کنه.
در این ویدئو یه مثال عملی از مدل جدید openai برای بهبود فرایند تدریس نشون داده میشه. اینجا گوینده به دنبال ایجاد ابزارهای تعاملی برای آموزش مکانیزمهای پیچیدای مثل "Self-attention" در ترانسفورمرها ست. هدف اصلی ایشون، توسعه ابزارهای تعاملی و مصورسازی برای فهم بهتر دانشجویان از این مفاهیم پیچیده ست. اشاره میکنه که مدل جدید میتونه با دقت بیشتری به دستورالعملهای پیچیده پاسخ بده و ابزارهای کارآمدتری رو ایجاد کنه.
👍1
در سال 1989، Yann LeCun و تیمش یک CNN LeNet 1 را آموزش دادن که قادر به تشخیص دست خط بود.
اونا ویدیویی منتشر کردند که نشون میداد چطور این مدل میتونه اعدادی رو که به صورت دستی روی یک کاغذ نوشته شده رو بخون.
الگوریتم شبکه عصبی Convolution CNN یکی از الگوریتمهایی هستن که امروزه جهانو تحت تأثیر قرار دادن.
به طور کلی، هر چیزی که میتونیم از روی یه تصویر یا ویدیو پیشبینی کنیم، یک #CNN است.
بسیاری از محققان بر این الگوریتم تکیه کرده و بسیاری از معروفترین مدلها رو از اون استخراج کردن.
این ویدیو رو ببینید.
منبع: Linkedin
@elmedade | آموزش علم داده و هوش مصنوعی
اونا ویدیویی منتشر کردند که نشون میداد چطور این مدل میتونه اعدادی رو که به صورت دستی روی یک کاغذ نوشته شده رو بخون.
الگوریتم شبکه عصبی Convolution CNN یکی از الگوریتمهایی هستن که امروزه جهانو تحت تأثیر قرار دادن.
به طور کلی، هر چیزی که میتونیم از روی یه تصویر یا ویدیو پیشبینی کنیم، یک #CNN است.
بسیاری از محققان بر این الگوریتم تکیه کرده و بسیاری از معروفترین مدلها رو از اون استخراج کردن.
این ویدیو رو ببینید.
منبع: Linkedin
@elmedade | آموزش علم داده و هوش مصنوعی
Linkedin
LeCun's LeNet 1 CNN for handwriting recognition | Zaheer Jahangir posted on the topic | LinkedIn
In 1989, Yann LeCun and his team trained a LeNet 1 CNN, which was able to detect handwriting.
They published a video showing how this model can read the… | 14 comments on LinkedIn
They published a video showing how this model can read the… | 14 comments on LinkedIn
👍1
Forwarded from Silicon Brain | جامعه هوش مصنوعی
This media is not supported in your browser
VIEW IN TELEGRAM
استفاده از LLM در آردوینو برای وظایف مختلف
توی این پروژه آزمایشی، از Hey و یه آردوینو نانو استفاده شده و دوتا LED رو با قدرت LLMهای MindsDB کنترل شده و همینطور که میبینید خیلی نتیجه جالبی داشته.
تو این پروژه Hey یک دستیار هوش مصنوعی مبتنی بر CLI هستش که توسط LLM ها پشتیبانی میشه. و میتونی به صورت کاستوم تنظیم کنی که م Hey به کدوم سرویس #LLM وصل شه.
حالا این کد از کجا درست میشه و چجوری به کجا ارسال میشه؟ از Hey توی پایتون استفاده میشه تا پرامت و ورودی کاربر رو بفرسته به مدل، نهایتا خروجی مدل یه کده مثل A1 که یعنی روشن کردن LED اول. اون A1 فرستاده میشه به Arduino# و اونجا طبق یک سری از شرطها، عملیات انجام میشه.
گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
توی این پروژه آزمایشی، از Hey و یه آردوینو نانو استفاده شده و دوتا LED رو با قدرت LLMهای MindsDB کنترل شده و همینطور که میبینید خیلی نتیجه جالبی داشته.
تو این پروژه Hey یک دستیار هوش مصنوعی مبتنی بر CLI هستش که توسط LLM ها پشتیبانی میشه. و میتونی به صورت کاستوم تنظیم کنی که م Hey به کدوم سرویس #LLM وصل شه.
حالا این کد از کجا درست میشه و چجوری به کجا ارسال میشه؟ از Hey توی پایتون استفاده میشه تا پرامت و ورودی کاربر رو بفرسته به مدل، نهایتا خروجی مدل یه کده مثل A1 که یعنی روشن کردن LED اول. اون A1 فرستاده میشه به Arduino# و اونجا طبق یک سری از شرطها، عملیات انجام میشه.
گیتهاب
@silicon_brain | از هوش مصنوعی عقب نمانید
👍3
Forwarded from یادگیری ماشین - دانشگاه شریف - پاییز ۱۴۰۳
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
یادگیری ماشین - دانشگاه شریف - پاییز ۱۴۰۳
توئیت آقای دکتر شریفی زارچی در مورد برگزاری کلاسهای یادگیری ماشین.
👍1
WordLlama Released on Hugging Face: An Open Source, Fast, Lightweight (16MB) NLP Toolkit for Tasks like Fuzzy-Deduplication, Similarity and Ranking Optimized for CPUs
#nlp #llm #Llama
@elmedade | آموزش علم داده و هوش مصنوعی
https://www.marktechpost.com/2024/09/19/wordllama-released-on-hugging-face-an-open-source-fast-lightweight-16mb-nlp-toolkit-for-tasks-like-fuzzy-deduplication-similarity-and-ranking-optimized-for-cpus/
#nlp #llm #Llama
@elmedade | آموزش علم داده و هوش مصنوعی
MarkTechPost
WordLlama Released on Hugging Face: An Open Source, Fast, Lightweight (16MB) NLP Toolkit for Tasks like Fuzzy-Deduplication, Similarity…
The release of WordLlama on Hugging Face marks a pivotal moment in natural language processing (NLP). This advanced language model is designed to offer developers, researchers, and businesses a highly efficient and accessible tool for various NLP applications.…
❤2👍1
سریعترین #LLM دنیا بنام #groq با سرعت 18 برابر #gpt و 10 برابر #Gmini معرفی شد.
این مدل رایگانه و از طریق این درگاه در دسترس عموم قرار گرفته.
https://groq.com
@elmedade | آموزش علم داده و هوش مصنوعی
این مدل رایگانه و از طریق این درگاه در دسترس عموم قرار گرفته.
https://groq.com
@elmedade | آموزش علم داده و هوش مصنوعی
Groq
Groq is fast, low cost inference.
The Groq LPU delivers inference with the speed and cost developers need.
👍1
Forwarded from Tensorflow(@CVision) (Alister ☄️)
This media is not supported in your browser
VIEW IN TELEGRAM
متا از هوش مصنوعی متا با قابلیت تولید صدا رونمایی کرد - رقیب مدل صوتی پیشرفته OpenAI
👍1
Forwarded from Tensorflow(@CVision) (Alister ☄️)
متا مجموعه جدیدی از مدلهای Llama 3.2 رو برای متن (1B، 3B) و بینایی (11B، 90B) منتشر کرد.
به صورت خلاصه :
مدلهای جدید متنی 1B و 3B با 9 تریلیون توکن آموزش دیدن
مدلهای چندوجهی بینایی جدید 11B و 90B روی 6 میلیارد زوج تصویر و متن آموزش دیدن
طول متن قابل پردازش 128K هست
مدلهای 1B و 3B از برخی روشهای تقطیر مدلهای 8B و 70B استفاده کردن
ارزیابیها برای مدلهای کوچک 1B و 3B و مدلهای چندوجهی بینایی 11B و 90B بسیار خوبه. 1B در آزمون MMLU نمره 49.3 و 3B نمره 63.4 رو کسب کردن. مدلهای چندوجهی بینایی در آزمون MMMU نمره 50.7 و 90B نمره 60.3 رو کسب کردن
https://huggingface.co/collections/meta-llama/llama-32-66f448ffc8c32f949b04c8cf
به صورت خلاصه :
مدلهای جدید متنی 1B و 3B با 9 تریلیون توکن آموزش دیدن
مدلهای چندوجهی بینایی جدید 11B و 90B روی 6 میلیارد زوج تصویر و متن آموزش دیدن
طول متن قابل پردازش 128K هست
مدلهای 1B و 3B از برخی روشهای تقطیر مدلهای 8B و 70B استفاده کردن
ارزیابیها برای مدلهای کوچک 1B و 3B و مدلهای چندوجهی بینایی 11B و 90B بسیار خوبه. 1B در آزمون MMLU نمره 49.3 و 3B نمره 63.4 رو کسب کردن. مدلهای چندوجهی بینایی در آزمون MMMU نمره 50.7 و 90B نمره 60.3 رو کسب کردن
https://huggingface.co/collections/meta-llama/llama-32-66f448ffc8c32f949b04c8cf
huggingface.co
Llama 3.2 - a meta-llama Collection
This collection hosts the transformers and original repos of the Llama 3.2 and Llama Guard 3
👍1
Forwarded from School of AI (Hamidreza Hosseinkhani)
تراشههای رایانهای نقش مهمی در پیشرفت هوش مصنوعی داشتهاند، حال نوبت به هوش مصنوعیست که دین خود را ادا کند.
چهارسال پیش، آزالیا میرحسینی در گوگل موفق شد بهکمک یادگیری تقویتی عمیق، روشی برای طراحی چیدمان تراشههای کامپیوتری (chip floorplanning) ابداع کند.
در این روش، ابتدا، یک Grid خالی درنظر گرفته شده و در هر تکرار، یکی از مولفهها (مدارها)، روی آن قرار میگیرد. پاداش نهایی از روی کیفیت چیدمان تراشهی نهایی مشخص میشود. یک شبکهی عصبی گرافی مبتنی بر یال (Edge-based GNN) ارتباط بین مولفهها را یادگرفته و آن را به بخشهای دیگر تعمیم میدهد.
لازم به ذکرست، تمام تراشههای شتابدهی هوش مصنوعی گوگل (TPU) و همینطور Google Axion توسط این روش طراحی شدهاند.
امروز بعد از چهار سال، این مدل، AlphaChip نام گرفت و بهزودی چکپوینت (وزنهای) آن برای استفادهی سایرین دردسترس قرار خواهد گرفت.
بلاگپست:
https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/
گیتهاب:
https://github.com/google-research/circuit_training/
چهارسال پیش، آزالیا میرحسینی در گوگل موفق شد بهکمک یادگیری تقویتی عمیق، روشی برای طراحی چیدمان تراشههای کامپیوتری (chip floorplanning) ابداع کند.
در این روش، ابتدا، یک Grid خالی درنظر گرفته شده و در هر تکرار، یکی از مولفهها (مدارها)، روی آن قرار میگیرد. پاداش نهایی از روی کیفیت چیدمان تراشهی نهایی مشخص میشود. یک شبکهی عصبی گرافی مبتنی بر یال (Edge-based GNN) ارتباط بین مولفهها را یادگرفته و آن را به بخشهای دیگر تعمیم میدهد.
لازم به ذکرست، تمام تراشههای شتابدهی هوش مصنوعی گوگل (TPU) و همینطور Google Axion توسط این روش طراحی شدهاند.
امروز بعد از چهار سال، این مدل، AlphaChip نام گرفت و بهزودی چکپوینت (وزنهای) آن برای استفادهی سایرین دردسترس قرار خواهد گرفت.
بلاگپست:
https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/
گیتهاب:
https://github.com/google-research/circuit_training/
👍2
School of AI
تراشههای رایانهای نقش مهمی در پیشرفت هوش مصنوعی داشتهاند، حال نوبت به هوش مصنوعیست که دین خود را ادا کند. چهارسال پیش، آزالیا میرحسینی در گوگل موفق شد بهکمک یادگیری تقویتی عمیق، روشی برای طراحی چیدمان تراشههای کامپیوتری (chip floorplanning) ابداع کند.…
لینک مقاله مربوطه (منتشر شده در ۲۶ دسامبر ۲۰۲۴)
🔗 https://www.nature.com/articles/s41586-024-08032-5.pdf
#یادگیری_عمیق #هوش_مصنوعی #یادگیری_تقویتی #یادگیری_تقویتی_عمیق
@elmedade | آموزش علم داده و هوش مصنوعی
🔗 https://www.nature.com/articles/s41586-024-08032-5.pdf
#یادگیری_عمیق #هوش_مصنوعی #یادگیری_تقویتی #یادگیری_تقویتی_عمیق
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
Python Basics CheatSheet.pdf
1.3 MB
چیت شیت پایتون برای مبتدیان
منبع: https://www.linkedin.com/posts/web3schools_python-basics-cheatsheet-activity-7247184942344888320-VC92?utm_source=share&utm_medium=member_android
#پایتون #برنامه_نویسی #چیت_شیت
@elmedade | آموزش علم داده و هوش مصنوعی
منبع: https://www.linkedin.com/posts/web3schools_python-basics-cheatsheet-activity-7247184942344888320-VC92?utm_source=share&utm_medium=member_android
#پایتون #برنامه_نویسی #چیت_شیت
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
Forwarded from علوم آماری و محاسباتی
ch12_0.pdf
2.2 MB
🔻رگرسیون خطی ساده
• Simple Linear Regression
• اسلاید آموزشی
• انگلیسی
• تعداد صفحات: ۸۲
🌀 University of Colorado
🔹کانال علوم آماری و محاسباتی
♾ @statistical_science
• Simple Linear Regression
• اسلاید آموزشی
• انگلیسی
• تعداد صفحات: ۸۲
🌀 University of Colorado
🔹کانال علوم آماری و محاسباتی
♾ @statistical_science
👍1
مقاله استاد دانشگاه شریف روی جلد نشریه معتبر علوم اعصاب و شیمی
تیم تحقیقاتی دکتر محمدرضا هرمزینژاد، استاد دانشکده شیمی دانشگاه صنعتی شریف، با توسعه حسگر آرایهای چندرنگی بر پایه پوششدهی فلزی نانومیلههای پلاسمونی طلا به وسیله نقره، روش رنگسنجی نوینی در تلفیق با روشهای #یادگیری_ماشین جهت تشخیص و اندازهگیری زیست نشانگرهای بیماریهای مرتبط با زوال عقل ارائه دادن و نتایج این پژوهش در مجله ACS Chemical Neuroscience منتشر شد و با تصمیم هیئت تحریریه مجله، به عنوان طرح روی جلد شماره اخیر این مجله انتخاب شد.
ادامه مقاله رو در این لینک بخونید.
@elmedade | آموزش علم داده و هوش مصنوعی
تیم تحقیقاتی دکتر محمدرضا هرمزینژاد، استاد دانشکده شیمی دانشگاه صنعتی شریف، با توسعه حسگر آرایهای چندرنگی بر پایه پوششدهی فلزی نانومیلههای پلاسمونی طلا به وسیله نقره، روش رنگسنجی نوینی در تلفیق با روشهای #یادگیری_ماشین جهت تشخیص و اندازهگیری زیست نشانگرهای بیماریهای مرتبط با زوال عقل ارائه دادن و نتایج این پژوهش در مجله ACS Chemical Neuroscience منتشر شد و با تصمیم هیئت تحریریه مجله، به عنوان طرح روی جلد شماره اخیر این مجله انتخاب شد.
ادامه مقاله رو در این لینک بخونید.
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
جایزه نوبل فیزیک ۲۰۲۴ به دو چهره سرشناس در حوزه هوش مصنوعی تعلق گرفت.
آقایان John J. Hopfield و Geoffrey E. Hinton به علت تحقیقاتشان برای آموزش شبکه عصبی با استفاده از فیزیک موفق به اخذ مدال نوبل ۲۰۲۴ شدند.
https://www.nobelprize.org/uploads/2024/10/press-physicsprize2024.pdf
@elmedade | آموزش علم داده و هوش مصنوعی
آقایان John J. Hopfield و Geoffrey E. Hinton به علت تحقیقاتشان برای آموزش شبکه عصبی با استفاده از فیزیک موفق به اخذ مدال نوبل ۲۰۲۴ شدند.
https://www.nobelprize.org/uploads/2024/10/press-physicsprize2024.pdf
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
DANA | علم داده و هوش مصنوعی
آقایان John J. Hopfield و Geoffrey E. Hinton به علت تحقیقاتشان برای آموزش شبکه عصبی با استفاده از فیزیک موفق به اخذ مدال نوبل ۲۰۲۴ شدند.
John Hopfield created an associative memory that can store and reconstruct images and other types of patterns in data. Geoffrey Hinton invented a method that can autonomously and properties in data, and so perform tasks such as identifying specifc elements in pictures.
@elmedade | آموزش علم داده و هوش مصنوعی
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
نوبل شیمی ۲۰۲۴ هم به محققین هوش مصنوعی بدلیل آموزش مدلهای پیشبینی ساختارهای پروتئینی مبتنی بر یادگیری ماشینی (شبکههای عصبی مصنوعی) تعلق گرفت.
@elmedade | آموزش علم داده و هوش مصنوعی
@elmedade | آموزش علم داده و هوش مصنوعی
👍1
ستاره نوظهور
هر چند یک هفته ای از انتشار مدل 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤–𝐑𝟏 می گذره، ریزش امروز سهام شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 باعث شد در وب فارسی هم این استارتاپ چینی مورد توجه قرار بگیره.
ماجرا از این قراره که یک استارتاپ چینی به اسم 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤 مدلی رو انتشار داده که تونسته با مدل 𝐎𝐩𝐞𝐧𝐀𝐈 𝐨𝟏 رقابت کنه.(𝟏) خوب این چه اهمیتی داره؟
– این مدل برای اولین بار به صورت اوپن سورس در اختیار همه قرار گرفته.(𝟐) همینطور مقاله مفصلی هم داره که جزئیات مدل و نحوه ترین کردن رو توضیح داده.(𝟑)
–شاید مهمترین نکته در مورد این مدل هزینه آموزش کم این مدل باشه. در واقع هزینه آموزش مدل 𝐑𝟏 به لطف خلاقیتی که در طراحی مدل داشته، فقط 𝟑 درصد هزینه آموزش مدل شرکت 𝐎𝐩𝐞𝐧𝐀𝐈 بوده یعنی حدود 𝟔 میلیون دلار و همین نکته باعث میشه هزینه 𝐀𝐏𝐈 اون در مقایسه با شرکت رقیب به مراتب کمتر باشه.
–ادعا شده ریزش سهام 𝐍𝐯𝐢𝐝𝐢𝐚 ناشی از انتشار همین مدل بوده. آمریکا صادرات 𝐆𝐏𝐔 𝐇𝟏𝟎𝟎 شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 به چین رو تحریم کرده و چگونگی آموزش این مدل بدون دسترسی به تعداد زیادی 𝐆𝐏𝐔 از نوع 𝐇𝟏𝟎𝟎 سوالات زیادی ایجاد کرده و باعث تردید در سودآوری و آینده شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 شده. این مسئله باعث شد بزرگ ترین ریزش قیمت سهام در تاریخ بازار سهام آمریکا امروز رقم بخوره و سهام شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 ریزش بیش از 450 میلیارد دلاری رو تجربه کنه (𝟒) . این ریزش حدود 3 برابر ارزش دلاری بورس تهران بود :)
–نکته جالب در مورد شرکت 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤 اینه که این شرکت توسط لیانگ ونفنگ - مهندس الکترونیک، کوانت منیجر و همبنیانگذار هج فاند 𝐇𝐢𝐠𝐡–𝐅𝐥𝐲𝐞𝐫- ایجاد شده. همه جا پای یک مالی در میان است! :)
از اینجا می تونید از این مدل به صورت رایگان تست کنید:
https://www.deepseek.com/
منبع: لینکدین
#deepseek #ai
@elmedade | علم داده و هوش مصنوعی
هر چند یک هفته ای از انتشار مدل 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤–𝐑𝟏 می گذره، ریزش امروز سهام شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 باعث شد در وب فارسی هم این استارتاپ چینی مورد توجه قرار بگیره.
ماجرا از این قراره که یک استارتاپ چینی به اسم 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤 مدلی رو انتشار داده که تونسته با مدل 𝐎𝐩𝐞𝐧𝐀𝐈 𝐨𝟏 رقابت کنه.(𝟏) خوب این چه اهمیتی داره؟
– این مدل برای اولین بار به صورت اوپن سورس در اختیار همه قرار گرفته.(𝟐) همینطور مقاله مفصلی هم داره که جزئیات مدل و نحوه ترین کردن رو توضیح داده.(𝟑)
–شاید مهمترین نکته در مورد این مدل هزینه آموزش کم این مدل باشه. در واقع هزینه آموزش مدل 𝐑𝟏 به لطف خلاقیتی که در طراحی مدل داشته، فقط 𝟑 درصد هزینه آموزش مدل شرکت 𝐎𝐩𝐞𝐧𝐀𝐈 بوده یعنی حدود 𝟔 میلیون دلار و همین نکته باعث میشه هزینه 𝐀𝐏𝐈 اون در مقایسه با شرکت رقیب به مراتب کمتر باشه.
–ادعا شده ریزش سهام 𝐍𝐯𝐢𝐝𝐢𝐚 ناشی از انتشار همین مدل بوده. آمریکا صادرات 𝐆𝐏𝐔 𝐇𝟏𝟎𝟎 شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 به چین رو تحریم کرده و چگونگی آموزش این مدل بدون دسترسی به تعداد زیادی 𝐆𝐏𝐔 از نوع 𝐇𝟏𝟎𝟎 سوالات زیادی ایجاد کرده و باعث تردید در سودآوری و آینده شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 شده. این مسئله باعث شد بزرگ ترین ریزش قیمت سهام در تاریخ بازار سهام آمریکا امروز رقم بخوره و سهام شرکت 𝐍𝐯𝐢𝐝𝐢𝐚 ریزش بیش از 450 میلیارد دلاری رو تجربه کنه (𝟒) . این ریزش حدود 3 برابر ارزش دلاری بورس تهران بود :)
–نکته جالب در مورد شرکت 𝐃𝐞𝐞𝐩𝐒𝐞𝐞𝐤 اینه که این شرکت توسط لیانگ ونفنگ - مهندس الکترونیک، کوانت منیجر و همبنیانگذار هج فاند 𝐇𝐢𝐠𝐡–𝐅𝐥𝐲𝐞𝐫- ایجاد شده. همه جا پای یک مالی در میان است! :)
از اینجا می تونید از این مدل به صورت رایگان تست کنید:
https://www.deepseek.com/
منبع: لینکدین
#deepseek #ai
@elmedade | علم داده و هوش مصنوعی
Deepseek
DeepSeek | 深度求索
深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。
👍1