Ai Events️ – Telegram
Ai Events️
6.15K subscribers
950 photos
83 videos
26 files
763 links
This channel aims to cover all events related to artificial intelligence, data science, etc.
Hamid Mahmoodabadi

در این کانال تمام رویدادهای مرتبط با هوش مصنوعی، علوم داده و ... پوشش داده می‌شود.
حمید محمودآبادی

Contact me:
@MahmoodabadiHamid
Download Telegram
انجمن علمی دانشکده ریاضی و علوم کامپیوتر دانشگاه صنعتی امیرکبیر برگزار می‌‌نماید:

بهینه‌سازی سبد سهام بااستفاده
از تئوری گراف و شبکه های عصبی


ارائه‌دهنده:
آقای محمدمهدی حاجی عباسی

تاریخ: دوشنبه ۳ دی ماه ۱۴۰۳
زمان: ساعت ۱۷:۰۰ الی ۱۸:۳۰

لینک گوگل میت:
https://meet.google.com/tbj-uumu-iyx
@MCS_SSC


@Ai_Events
👍63
می‌دونید سه مفهوم زیر چی هستند و چطور از هم تفکیک میشن؟
1. تشخیص نوآوری (Novelty Detection)
2. داده‌های خارج از توزیع (OOD)
3. تشخیص ناهنجاری (Anomaly Dete
ction)

هرکدام از این مفاهیم، با وجود شباهت‌های ظاهری، کاربردهای متفاوتی دارند و به‌ویژه در شرایط مختلف مدل‌های یادگیری ماشین، عملکردهای متفاوتی از خود نشان می‌دهند. در ادامه به توضیح هرکدام پرداخته و تفاوت‌های آن‌ها را بررسی می‌کنیم:

1. شناسایی نوآوری (Novelty Detection)
شناسایی نوآوری به فرآیند شناسایی نمونه‌هایی اشاره دارد که در داده‌های آموزشی حضور نداشته‌اند، اما ممکن است به یک یا چند کلاس جدید مرتبط باشند. این امر به‌طور خاص در مدل‌هایی که بر روی داده‌های محدود آموزش دیده‌اند، کاربرد دارد. هدف این است که مدل قادر باشد نمونه‌های جدیدی که ممکن است به کلاس‌های ناشناخته تعلق داشته باشند را شناسایی کند.
مثال: فرض کنید مدل شما برای تشخیص تصاویر سگ و گربه آموزش دیده است. اگر تصویر یک خرگوش به مدل داده شود، مدل باید این تصویر را به‌عنوان یک نمونه جدید شناسایی کرده و از آن‌جایی که در داده‌های آموزشی نبوده است، به‌عنوان کلاس جدید شناسایی کند.
ویژگی: این فرآیند بر شناسایی نمونه‌هایی متمرکز است که ممکن است با کلاس‌های جدید مرتبط باشند ولی به هیچ‌وجه در مجموعه داده‌های آموزش دیده‌شده وجود نداشته‌اند.

2. داده‌های خارج از توزیع (OOD - Out-of-Distribution Data)
داده‌های خارج از توزیع به نمونه‌هایی اطلاق می‌شود که به‌طور کلی از توزیع داده‌هایی که مدل روی آن آموزش دیده، متفاوت هستند. در این حالت، مدل با داده‌هایی روبه‌رو می‌شود که ویژگی‌های آن‌ها به‌طور قابل توجهی از داده‌های موجود در مجموعه آموزشی متفاوت است.
مثال: فرض کنید مدل شما بر اساس داده‌های حیوانات خانگی مانند سگ و گربه آموزش دیده است. اگر تصویر یک ماشین به مدل داده شود، این تصویر به‌عنوان داده‌ای خارج از توزیع شناسایی می‌شود چون مدل هیچ‌گاه بر داده‌هایی با چنین ویژگی‌هایی آموزش ندیده است.
ویژگی: در اینجا مدل به دنبال تشخیص نمونه‌هایی است که از نظر توزیع آماری با داده‌های آموزش‌دیده متفاوت باشند، حتی اگر نمونه‌های جدید به دسته‌های جدید تعلق نداشته باشند.

3. شناسایی ناهنجاری (Anomaly Detection)
شناسایی ناهنجاری به فرآیند تشخیص نمونه‌هایی اطلاق می‌شود که تفاوت قابل توجهی با سایر داده‌های موجود دارند. این نوع تشخیص به‌طور معمول برای شناسایی رفتارهای غیرطبیعی یا غیرمنتظره در داده‌ها مورد استفاده قرار می‌گیرد.
مثال: در یک سیستم مانیتورینگ، اگر مصرف پردازنده به‌طور ناگهانی و غیرمنتظره‌ای افزایش یابد، این وضعیت به‌عنوان یک ناهنجاری شناسایی می‌شود زیرا تفاوت زیادی با الگوهای عادی مصرف پردازنده دارد.
ویژگی: ناهنجاری‌ها نمونه‌هایی هستند که ویژگی‌هایشان به‌طور قابل توجهی از دیگر نمونه‌ها دور است و این امر می‌تواند به‌عنوان علائم خرابی سیستم، تقلب یا مشکلات عملکردی مشاهده شود.

تفاوت‌ها و مقایسه:

در ساده‌ترین شکل، تفاوت‌های این سه مفهوم به‌طور خلاصه به این صورت است:

- شناسایی نوآوری: تمرکز بر کشف کلاس‌های جدید که در داده‌های آموزش موجود نبوده‌اند.
- داده‌های خارج از توزیع (OOD): شناسایی نمونه‌هایی که از توزیع داده‌های آموزش متفاوت هستند، حتی اگر این نمونه‌ها به کلاس‌های جدید تعلق نداشته باشند.
- شناسایی ناهنجاری: شناسایی نمونه‌های غیرعادی که از نظر ویژگی‌ها به‌طور قابل توجهی از دیگر نمونه‌ها متفاوت‌اند.

کاربردها:

- شناسایی نوآوری (Novelty Detection): این مفهوم به‌طور ویژه در کاربردهایی مانند کشف کلاس‌های جدید در داده‌های پیچیده و در حال تغییر، یا زمانی که داده‌های جدید وارد می‌شوند، کاربرد دارد.
- داده‌های خارج از توزیع (OOD): این مفاهیم معمولاً در زمینه‌های امنیت مدل یا استفاده از مدل‌های عمومی که ممکن است با داده‌های خارج از حوزه خود مواجه شوند، کاربرد دارد.
- شناسایی ناهنجاری (Anomaly Detection): این مورد به‌ویژه در شناسایی تقلب، خرابی سیستم‌ها یا تشخیص رفتار غیرعادی در سیستم‌های پیچیده مانند شبکه‌های کامپیوتری و سیستم‌های نظارتی کاربرد دارد.

به عنوان جمع‌بندی، این سه مفهوم با وجود شباهت‌های اولیه، در اساس و کاربرد تفاوت‌های مهمی دارند. شناسایی نوآوری بیشتر بر شناسایی کلاس‌های جدید متمرکز است، در حالی که OOD به شناسایی داده‌هایی می‌پردازد که کاملاً خارج از توزیع داده‌های آموزش‌دیده هستند، و شناسایی ناهنجاری به دنبال نمونه‌هایی است که از الگوهای عادی دور هستند.
👍8👎1
مصی کوهنورد، مدیر منابع انسانی دیجی‌کالا، اعلام کرد: مهاجرت با ۴۶ درصد و یافتن موقعیت شغلی بهتر با ۱۵ درصد، مهم‌ترین دلایل خروج نیروهای دیجی‌کالا در سال ۱۴۰۳ بوده‌اند. این آمار نشان می‌دهد که نرخ مهاجرت نسبت به سال گذشته ۹ درصد افزایش و خروج به دلیل یافتن شغل بهتر ۲۰ درصد کاهش یافته است

وی با اشاره به نرخ خروج ۲۰ درصدی نیروی کار متخصص در سال گذشته، گفت: برای مدیریت این چالش، تصمیم گرفتیم با انجام نظرسنجی‌ها و تحلیل داده‌ها، دلایل این مسئله را بررسی کنیم. نتایج نشان داد که ۳۷ درصد از خروج‌ها به دلیل مهاجرت، ۳۵ درصد به دلیل یافتن شغل بهتر و مابقی به دلایل متفرقه بوده است. همچنین، ۴۰ درصد از خروجی‌ها در رده سنی ۲۱ تا ۳۵ سال قرار داشتند که بخش عمده‌ای از آن‌ها به دلیل مهاجرت شرکت را ترک کردند

وی توضیح داد: نتایج نظرسنجی به ما کمک کرد تا دغدغه‌ها و نیازهای نیروهای خود را بهتر بشناسیم. مشکلاتی نظیر دستمزد پایین، حجم زیاد کار، احساس دیده نشدن و عدم شفافیت در سلسله‌مراتب از جمله مهم‌ترین چالش‌های مطرح‌شده بودند. در نتیجه، فرهنگ کاری‌مان را تغییر دادیم و توانستیم نرخ خروج نیروها را ۷ درصد کاهش دهیم
Source

@Ai_Events
👍7😢1
Ai Events️
. دکتر غضنفری، رئیس صندوق توسعه ملی: کل دارایی صندوق توسعه ملی، ۱۵۰ میلیارد دلار بود که ۱۰۰ میلیارد دلار رو دولت‌های مختلف برداشت کردند و ۴۰ میلیارد دلار، تسهیلات به صنایع پتروشیمی، نیروگاه‌ها و ... داده شده که اون‌ها هم به دلیل قیمت‌گذاری دستوری قادر به…
This media is not supported in your browser
VIEW IN TELEGRAM
دکتر غضنفری، رئیس صندوق توسعه ملی: صندوق توسعه ملی مشارکت خود را در حوزه‌های نفت و گاز، هوش مصنوعی و انرژی‌های تجدیدپذیر افزایش داده است.

پی‌نوشت:‌ حرکت بسیار پسندیده و مثبتی هست، اما با توجه به تحریم‌ها در واردات سخت افزار و همچنین بروکراسی‌های پیچیده (و گاها سفارشی) دسترسی به چنین منابع مالی، انتظار نتیجه چندانی از این حرکت نداریم. اما به خاطر می‌سپریم که این وظیفه ما به عنوان کارشناس هست که این برنامه‌ها، بودجه‌هایی که تخصیص داده میشه و طرح‌هایی که مورد پذیرش واقع می‌شه رو زیر ذره‌بین بگیریم و با استفاده از هر رسانه‌ای، مطلوب رو خواهان باشیم.
همچنین از قبل می‌دونیم که بودجه‌ی صندوق توسعه، از منابعی که متعلق به تک‌تک ما هست تامین میشه.

@Ai_Events
👏5
کارگاه آنلاین هوش مصنوعی کاربردی


این کارگاه، برای عموم، علاقه‌مندان و متخصصان به مباحث هوش مصنوعی و خصوصا
مدیران شرکت‌ها / سازمان‌ها / ارگان‌ها و هم‌چنین برنامه‌نویسان گرامی مفید
خواهد بود.

لینک ثبت‌نام در کارگاه آنلاین:

https://evnd.co/d20rX


@Ai_Events
1
📣 TA Application Form

🤖 Deep Learning
🧑🏻‍🏫 Dr. Fatemeh  Seyyedsalehi
🧑‍💻 Computer science group at the department of mathematics, Sharif University

Deadline: January 26th

https://forms.gle/z7betBT2N2ACCrir8

توجه: این موقعیت مختص دانشجویان شریف نمی‌باشد و افراد دیگر خارج از دانشگاه هم می‌توانند استفاده کنند.

@Ai_Events
👍31
دومین رویداد از سلسله رویدادهای "هوش مصنوعی در آموزش عالی" با موضوع:

تولید محتوا در عصر هوش مصنوعی: با رویکرد تنظیم برنامه درسی

👤 Supriya Kulkarni, Founder of The Ethics Company, Indonesia
👤Trinidad Balart, AI on Education Developer, USA
👤 Amir Shahraini, AI Policy Researcher, Iran (Moderator)

📅 چهارشنبه، ۱۹ دی ماه ۱۴۰۳ ساعت ۱۷ الی ۱۸:۳۰

لینک ثبت‌نام در رويداد

افزودن به تقویم گوگل

لینک پخش زنده رویداد
(هنگام ورود، گزینه میهمان را انتخاب کنید.)
پشتیبانی

@spri_sharif

@Ai_Events
👍4
How Machine Learning Algorithms works!

@Ai_Events
👍2🔥2
جلسه‌ی دوازدهم ژورنال‌کلاب مدل‌های زبانی بزرگ با موضوع:
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

سخنران: محمدرضا صالحی، دانشجوی دکترای دانشگاه واشینگتن و پژوهشگر در شرکت اپل

زمان: یک‌شنبه ۱۴۰۳/۱۰/۳۰، ساعت ۲۱:۳۰ تا ۲۳:۰۰
مکان برگزاری: vc.sharif.edu/ch/mjafari

در این جلسه:
مدل‌های Molmo و PixMo بررسی می‌شوند که با استفاده از وزن‌ها و داده‌های باز، پیشرفت‌هایی چشمگیر در مدل‌های چندوجهی زبان-تصویر ارائه داده‌اند. این مدل‌ها با تکیه بر مجموعه‌داده‌های نوآورانه، زیرنویس‌های دقیق انسانی، و معماری بهینه‌سازی‌شده، عملکردی رقابتی با سیستم‌های انحصاری دارند و تمامی وزن‌ها، داده‌ها و کدهای آن‌ها به‌صورت باز منتشر شده است.

منابع:

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

افزودن رویداد به تقویم گوگل

@Ai_Events
👍5
Audio
رادیو جادی، شماره 186
در رادیوی ۱۸۶ خیلی خبرها از هوش مصنوعی هستن. از پول‌های عظیمی که دراومده و خرج می‌شه تا جایگزینی انسان‌ها. چین ساخت
باتری برای جهان رو سختتر کرده و اروپا شارژ باتری رو آسونتر. با ما باشین
که جهان هکرهای بیشتری می‌خواد حتی اگر دوربینشون جای اشتباهی باشه.


00:00 - رادیوجادی ۱۸۶ خوش اومدی پاپای
01:20 - ربات هایی که از فیلم جراحی یاد گرفتن
07:20 - بازمتن شدن ران:ای آی توسط انویدیا
13:31 - حمایت ساپورت از ویزاهای اچ ۱ب آمریکا
15:30 - محدودیت‌های بیشتر چین بر روی فلزات مرتبط با باتری
18:30 - سرمایه‌گذاری ۸۰ میلیارد دلاری مایکروسافت در دیتاسنترهای هوش مصنوعی
24:16 - روز پابلک دامین ۲۰۲۵ و پایان یکسری کپی رایت‌ها
25:24 - قانون اجبار شارژ از طریق یو اس بی سی در اروپا عملیاتی شد
28:34 - بخش آخر
35:12 - تشکر از حامیان

https://youtu.be/JK9MNhlv6aA

@Ai_Container
👍1
شرکت VideoLAN، سازنده پلیر محبوب VLC، اعلام کرده در حال کار روی قابلیت جدیدی هست که نه تنها امکان زیرنویس کردن خودکار فایلهای پخش شده در این پلیر رو با استفاده از هوش مصنوعی افلاین و از طریق سخت افزار موجود در کامپیوتر مهیا میکنه بلکه امکان ترجمه اونهارو به طور اتوماتیک به 100 زبان مختلف هم فراهم میکنه.

این شرکت هنوز زمانی برای عرضه این قابلیت اعلام نکرده.

@Ai_Events
🔥22👍4
سهمیه‌بندی هوش مصنوعی توسط آمریکا/ ایران به طور کامل از دریافت این فناوری منع می شود

رویترز: دولت آمریکا اعلام کرد که محدودیت‌های بیشتری بر صادرات تراشه‌های هوش مصنوعی و فناوری‌های مرتبط اعمال خواهد کرد.

این مقررات جهان را به سه سطح تقسیم می‌کند. حدود ۱۸ کشور، از جمله ژاپن، بریتانیا، کره جنوبی و هلند، اساساً از قوانین معاف خواهند بود.

حدود ۱۲۰ کشور، از جمله سنگاپور، عربستان و امارات، با محدودیت‌ مواجه خواهند شد و کشورهایی که تحت تحریم تسلیحاتی هستند مانند روسیه، چین و ایران به‌طور کامل از دریافت این نوع فناوری منع خواهند شد.

منبع
@Ai_Events
😐20🤬12👍91😁1
انجمن علمی دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر با همکاری پیام‌رسان بله برگزار می‌کند:

پنجمین دوره‌ی رویداد هوش مصنوعی امیرکبیر
AAISS

سخنرانی و کارگاه

زمان برگزاری از ۲ لغایت ۱۵ بهمن‌ماه(به صورت مجازی)

در صورت حضور در هر کدام از ارائه ها و کارگاه ها،گواهی مجازی حضور در آن ارائه و کارگاه به شخص شرکت کننده اعطا خواهد شد.

اطلاعات بیشتر و ثبت نام:
autaaiss.com

@ceitssc
@aaiss_aut

@Ai_Events
👍7👎7
گوگل یک نوع معماری جدید از خانواده‌ی transformerها به نام Titans معرفی کرده که مثل مغز انسان عمل می‌کنه و حتی تو بعضی از وظایف از اون بهتر هم عمل کرده!

این سیستم:
• دارای سه نوع حافظه بلندمدت، کوتاه مدت و دائمی است و می‌تواند داده‌های بی‌اهمیت را در حین حفظ چیزهای مهم فراموش کند.
• حافظه بلند مدت آن یاد می گیرد و به روز می شود و امکان پردازش سریعتر و کارآمدتر را فراهم می کند.
ا • Titans در کارهایی مانند پیش‌بینی، تجزیه و تحلیل ژنوم و پردازش داده‌های مبتنی بر زمان برتری دارد.
• می تواند حجم بسیار بیشتری از اطلاعات را نسبت به GPT-4 مدیریت کند و معادل 25 کتاب را در آن واحد تجزیه و تحلیل کند.


این پست مدیوم کمک می‌کنه که نحوه‌ی عملکرد این معماری رو بهتر متوجه بشید!

@Ai_Events
8👍4🥴2
توی مراسم سوگند ترامپ، تکنولوژیست‌ها جایگاه بهتری از اعضای کنگره داشتن. مطمئنا به پول و قدرت مرتبطه ولی همین که در یک کشور تکنولوژیست ها می‌شن منبع قدرت و جاشون بهتر از سیاستمدارها است، نکته جالبیه.

حالا اینکه حواس زوکربرگ کمی پرته، بحث دیگه‌ای است 😜
منبع

@Ai_Events
👍17🤣5🙊42🥱1
پروژه 500 میلیارد دلاری هوش مصنوعی

پروژه استارگیت OpenAI با هدف ایجاد یک زیرساخت بزرگ هوش مصنوعی، با دسترسی انحصاری OpenAI، طراحی شده است. این طرح مستلزم بیش از 500 میلیارد دلار بودجه در طول چهار ساله که با 100 میلیارد دلار شروع میشه (یکی از بزرگترین سرمایه‌گذاری‌های زیرساختی در تاریخ آمریکا) که حتی از پروژه منهتن و برنامه آپولو (در صورت تعدیل تورم) پیشی میگیره!!!

انتظار میره که Stargate بیش از 100000 شغل ایجاد کنه، با تمرکز روی برنامه‌های پزشکی مثل تحقیق در مورد داروهای سرطان، تشخیص زودهنگام بیماری و...

شرکای کلیدی این پروژه عبارتند از Softbank، Nvidia، Oracle، MGX (امارات متحده عربی)، مایکروسافت و Arm.

قرار است ساخت ده مرکز داده در تگزاس، با برنامه ریزی برای بیست مرکز داده در سراسر آمریکا، که همه به هم مرتبط هستند، آغاز شود.

فقط برای اینکه متوجه بشید این پروژه چقدر بزرگه:
پروژه منهتن (دهه 1940): 30 میلیارد دلار به پول امروز
برنامه آپولو (دهه 1960 تا 70): 257 میلیارد دلار به پول امروز
پروژه StarGate: حدود 500 میلیارد دلار در مدت تنها چهار سال

@Ai_Events
🔥9👍21💔1
داستان غول نوظهور چینی هوش مصنوعی  Deepseek

شرکت deepseek که امروز همه‌مون از مدل رایگان بی‌محدودیت deepseek v3 به وجود اومدیم و الان هم مدل متن باز رایگان R1 رو به عنوان رقیب برای o1 داده، چطوری شکل گرفته؟
این شرکت بدون هیچ سرمایه‌گذاری خطرپذیر، مدلی متن‌باز تولید کرد که با غول‌هایی مانند OpenAI و Anthropic رقابت می‌کند. مدلی که با یک‌دهم هزینه آموزش و ۲۰ تا ۵۰ برابر ارزان‌تر در استنتاج، به مرزهای جدیدی در هوش مصنوعی دست یافته است.
در سال ۲۰۰۷، سه مهندس به نام‌های Xu Jin، Zheng Dawei و Liang Wenfeng (مدیرعامل فعلی) در دانشگاه Zhejiang با هم آشنا شدند و با هدف ساخت یک صندوق کمّی (Quant) که با هوش مصنوعی پیشرفته کار کند، دور هم جمع شدند. از آن زمان تا امروز یک استراتژی در جذب نیرو انسانی داشتند، به جای استخدام افراد باتجربه، آن‌ها روی استعدادهای جوان و کنجکاو سرمایه‌گذاری کردند. مدیر مدیر عامل deepseek l می‌گه: «ما بیشتر نقش‌های فنی را به فارغ‌التحصیلان جدید یا افرادی با ۱ تا ۲ سال تجربه سپردیم.».

این تیم به مدت ۸ سال به‌طور خاموش روی ایده‌های مختلف معاملات الگوریتمی کار کردند تا اینکه در سال ۲۰۱۵ شرکت High-Flyer را تأسیس کردند. فرهنگ استخدام و نوآوری آن‌ها به خوبی جواب داد. تا سال ۲۰۲۱، آن‌ها به موفقیت‌های چشمگیری دست یافته بودند:
۱۴۰ میلیون دلار سرمایه‌گذاری و ساخت یک پلتفرم بزرگ هوش مصنوعی برای معاملات.
مالکیت ۱۰,۰۰۰ کارت گرافیک NVIDIA A100.
تبدیل شدن به یکی از ۴ صندوق کمّی برتر با ۱۵ میلیارد دلار دارایی تحت مدیریت (AUM).

اما سپس همه چیز فروپاشید. سال ۲۰۲۲ موفقیت High-Flyer به نقطه ضعف آن تبدیل شد. آن‌ها خیلی بزرگ و سریع رشد کرده بودند و شروع به از دست دادن میلیاردها دلار کردند، طی چند فصل متوالی روی سرمایه‌های تحت مدیریت‌شون ضرر دادند و از شاخص بازار بورس چین عقب ماندند.
دولت چین در پی کندی اقتصادی، بحران مسکن و کاهش شاخص بورس، شروع به محدود کردن صنعت معاملات کمّی کرد. شاخص CSI300 (شاخص سهام برتر چین) به پایین‌ترین حد خود رسید و معامله‌گران فرکانس بالا را مقصر اصلی این فروپاشی دانستند. High-Flyer با خطر انقراض مواجه شد.
در سال ۲۰۲۳ آن‌ها تغییر جهت دادند. DeepSeek، یک آزمایشگاه هوش مصنوعی، با استفاده از استعدادهای موجود و ۱۰,۰۰۰ کارت گرافیک خود تأسیس کردند. بدون هیچ سرمایه‌گذاری خطرپذیر. آن‌ها همه چیز را روی این شرط بستند.
آن‌ها همان فلسفه استخدام خود را حفظ کردند: استخدام «فارغ‌التحصیلان نخبه» جای محققان باتجربه هوش مصنوعی.
مدیر عامل deepseek می‌گه: «هیچ جادوگری وجود ندارد. ما بیشتر فارغ‌التحصیلان جدید از دانشگاه‌های برتر، دانشجویان دکتری در سال‌های چهارم یا پنجم و برخی جوانانی که چند سال پیش فارغ‌التحصیل شده‌اند را استخدام می‌کنیم.»

شرکت DeepSeek در اوایل سال ۲۰۲۴ با معرفی DeepSeek v2 را ارائه کردند.
تا سپتامبر، آن‌ها ابتدا مقاله‌ی R1-lite-preview را به عنوان اولین مدلی که با مدل استدلالی o1 OpenAI رقابت می‌کرد، منتشر کردند، . این مدل با استفاده از یک تکنیک جدید یادگیری تقویتی (RL) که از محاسبات زمان استنتاج  استفاده می‌کرد، از همه رقبا (متن‌باز یا اختصاصی) پیشی گرفت.
در کریسمس، آن‌ها DeepSeek v3  ارائه کردند که با تنها ۶ میلیون دلار هزینه آموزش، با ChatGPT-4o و Claude 3.5 Sonnet رقابت کرد.
هزینه‌های API که ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا است.

این هفته، آن‌ها اولین مدل استدلالی کاملاً متن‌باز را منتشر کردند که با OpenAI o1 برابری می‌کرد. آن‌ها یافته‌های خود را به‌صورت عمومی به اشتراک گذاشتند و فاش کردند که این مدل را تنها از طریق یادگیری تقویتی (RL) و بدون نیاز به تنظیم دقیق نظارت‌شده یا مدل‌سازی پاداش آموزش داده‌اند.
و هزینه‌های API هنوز ۲۰ تا ۵۰ برابر ارزان‌تر از رقبا هستند:
مدل DeepSeek R1 حدود  ۰.۱۴ تا ۰.۵۵ دلار برای هر ۱ میلیون توکن ورودی، ۲.۱۹ دلار برای هر ۱ میلیون توکن خروجی.
مدل OpenAI o1 حدود ۷.۵۰ تا ۱۵ دلار برای هر ۱ میلیون توکن ورودی، ۶۰ دلار برای هر ۱ میلیون توکن خروجی.
Source

@Ai_Events
👍1610
شرکت OpenAI از ابزار جدید Operator رونمایی کرد: تحولی در انجام کارهای اینترنتی

شرکت OpenAI، از ابزار جدید خود به نام Operator رونمایی کرده است که می‌تواند به‌طور خودکار وظایف مختلف آنلاین را انجام دهد.

این ابزار با استفاده از مرورگر داخلی خود، قادر است صفحات وب را مشاهده کرده و با آن‌ها تعامل کند. از جمله قابلیت‌های آن می‌توان به تایپ، کلیک و اسکرول در صفحات وب اشاره کرد.

همچنین Operator از هوش مصنوعی پیشرفته استفاده می‌کند و به کاربران این امکان را می‌دهد که بدون نیاز به انجام اقدامات دستی، کارهای اینترنتی خود را انجام دهند.

این ابزار ابتدا برای مشترکان نسخه پرو ChatGPT در آمریکا در دسترس خواهد بود و OpenAI قصد دارد آن را به سایر کاربران نیز گسترش دهد.

تو این ویدئو می‌تونید توضیحات و نحوه کارکردش رو با حضور آقای سم‌ آلتمن ببینید:
https://youtu.be/CSE77wAdDLg


@Ai_Events
👏4
سخنرانی تخصصی دانشکده مهندسی کامپیوتر با همکاری انجمن علمی برگزار می‌شود:

هوش مصنوعی و استنتاج کاتوره‌ای💻
توسط دکتر سیاوش ارجمند بیگدلی، دانشیار دانشگاه صنعتی دانمارک

زمان: شنبه ۶ بهمن، ساعت ۱۲:۳۰ الی ۱۳:۳۰



📍 مکان: آمفی تئاتر دانشکده مهندسی کامپیوتر دانشگاه امیرکبیر

@Ai_Events
👍3🔥3