کل یوتیوب پر شده از این مقاله :
https://arxiv.org/pdf/2501.00663
و تقریبا تمام دوستان دارند در مورد
Transformers v2.0
صحبت میکنند.
میشه بازم گوگل خالق و باعث انقلاب دیگری باشه یا این هم یک ترند تبلیغاتی دیگر هست ؟
https://arxiv.org/pdf/2501.00663
و تقریبا تمام دوستان دارند در مورد
Transformers v2.0
صحبت میکنند.
میشه بازم گوگل خالق و باعث انقلاب دیگری باشه یا این هم یک ترند تبلیغاتی دیگر هست ؟
❤25👍7
deepseek r1 منتشر شد؛ مقاله از نحوه ترین مدل - وزنها و ... همه چیز
حتی مجوز
commercial use رو هم دادهhttps://github.com/deepseek-ai/DeepSeek-R1
GitHub
GitHub - deepseek-ai/DeepSeek-R1
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub.
👍34❤8
oh oh
عجب خبری؛ یک محقق امنیتی تکنیکی رو پیدا کرده که باهاش از
chatgpt برای DDOS کردن هر سایتی استفاده میشه کرد.و چون از سرورهای
chatgpt هم درخواستها ارسال میشه مقابله باهاش راحت نیست؛ قطعا تیم close ai جلوی این رو میگیره ولی به این فکر کنید که همه شرکتهایی که این خدمات رو میدند به احتمال زیاد این باگ رو دارند.ندید میگم؛ ۹۹٪ شرکتهای ایرانی که مدل رو خودشون دپلوی میکنند این باگ رو دارند. با توجه به چیزهایی که دیدم.
ReadMore
GitHub
security-advisories/2025-01-ChatGPT-Crawler-Reflective-DDOS-Vulnerability.md at main · bf/security-advisories
Security advisories for vulnerabilities. Contribute to bf/security-advisories development by creating an account on GitHub.
👍17❤16
Youtube
سرمایه گذاری
سرمایه گذاری
500 میلیارد دلاری (حداقل) روی زیرساختهای هوش مصنوعی؛ این فقط برای سرور و ... هست طبق متنی که Close/Open AI منتشر کرده.YouTube
BREAKING: Trump—Flanked By Larry Ellison, Sam Altman, & Masayoshi Son—Announces Project Stargate
President Trump, flanked by top tech executives and AI experts, announces a major new AI initiative called Project Stargate
Fuel your success with Forbes. Gain unlimited access to premium journalism, including breaking news, groundbreaking in-depth reported…
Fuel your success with Forbes. Gain unlimited access to premium journalism, including breaking news, groundbreaking in-depth reported…
👍16❤6
دستاوردهای یادگیری عمیق(InTec)
Youtube سرمایه گذاری 500 میلیارد دلاری (حداقل) روی زیرساختهای هوش مصنوعی؛ این فقط برای سرور و ... هست طبق متنی که Close/Open AI منتشر کرده.
روز اول ترامپ؛
بیشتر از حداقل ۱۶ سال گذشته رئیس جمهورهای ایران برای کشورش سرمایهگذاری و ... به همراه آورد.
یعنی مبالغ و کارهایی که توی روز اول انجام شد؛ حتی ۵٪ اش توی ۱۶ سال گذشته توی ایران انجام نشده.
بیشتر از حداقل ۱۶ سال گذشته رئیس جمهورهای ایران برای کشورش سرمایهگذاری و ... به همراه آورد.
یعنی مبالغ و کارهایی که توی روز اول انجام شد؛ حتی ۵٪ اش توی ۱۶ سال گذشته توی ایران انجام نشده.
👍51❤5
بدترین سرویس پشتبانی که به عمرم دیدم :
ایرانسل هست با اختلاف، ۳ ماهه داره مشکل اینترنت من رو حل میکنه
دائم هم میگه، تا ۴۸ ساعت آینده کارشناسان ما مشکل شمارو حل خواهند کرد
سری آخر کلا سیمکارت قطع شد (به خدا جدی میگم)
پشتیبانی تالیا از ایرانسل قویتره 😂
پ.ن : اینجا گذاشتم برسه دستشون، چون توی کانال بودند بچهها از ایرانسل
ایرانسل هست با اختلاف، ۳ ماهه داره مشکل اینترنت من رو حل میکنه
دائم هم میگه، تا ۴۸ ساعت آینده کارشناسان ما مشکل شمارو حل خواهند کرد
سری آخر کلا سیمکارت قطع شد (به خدا جدی میگم)
پشتیبانی تالیا از ایرانسل قویتره 😂
پ.ن : اینجا گذاشتم برسه دستشون، چون توی کانال بودند بچهها از ایرانسل
👍72❤1
#Quick
امروز متوجه شدم که
حتما باید این پارامترها رو توی محیط چت هم کانفیگ کنید.
اگر میخواید برای همه یوزرها هم کانفیگ کنید :
این موارد رو درست تنظیم کنید؛ بعد مدلهارو مجدد تست کنید خروجیها به مراتب بهتر خواهد بود.
امروز متوجه شدم که
open-webui هیچ اهمیتی به پارامترهایی که روی مدل Modelfile توی ollama گذاشتید نمیده.حتما باید این پارامترها رو توی محیط چت هم کانفیگ کنید.
اگر میخواید برای همه یوزرها هم کانفیگ کنید :
Settings > General > Advanced Parameters Admin Panel > Settings > Models > Edit > Advance Paramsاین موارد رو درست تنظیم کنید؛ بعد مدلهارو مجدد تست کنید خروجیها به مراتب بهتر خواهد بود.
👍13❤1
دستاوردهای یادگیری عمیق(InTec)
بدترین سرویس پشتبانی که به عمرم دیدم : ایرانسل هست با اختلاف، ۳ ماهه داره مشکل اینترنت من رو حل میکنه دائم هم میگه، تا ۴۸ ساعت آینده کارشناسان ما مشکل شمارو حل خواهند کرد سری آخر کلا سیمکارت قطع شد (به خدا جدی میگم) پشتیبانی تالیا از ایرانسل قویتره…
راهکار دادند (از بچههای ایرانسل) که توی برنامه ایرانسل و چت آنلاین پیگیری کنم، همینکارو کردم و حالم بدتر شد :
۱- بعد از هر پیام که ارسال میکنم، باید از برنامه بیام بیرون و مجدداً وارد بشم تا بتونم پیام دیگری بدم یا پیامهای پشتیبانی رو بخونم.
۲- بخاطر مشکل اول، گفتم عکس آپلود کنم که برنامه crash کرد و پرید بیرون
۳- تاریخچه چتها رو ندارم، یعنی بعد از
۴- بعد از تمام سختیها همون جواب قبل رو میگیری:
مشکل شما به واحد
تا اینجا فکر میکردم فقط پشتیبانی ایرانسل مشکل داره
ولی الان متوجه شدم، تیم دولوپرهاش هم مشکل دارند.
بعد اینا دنبال راهاندازی
هوش مصنوعی قاتل از دست این شرکتا میزنه بیرونا 😂😂
۱- بعد از هر پیام که ارسال میکنم، باید از برنامه بیام بیرون و مجدداً وارد بشم تا بتونم پیام دیگری بدم یا پیامهای پشتیبانی رو بخونم.
۲- بخاطر مشکل اول، گفتم عکس آپلود کنم که برنامه crash کرد و پرید بیرون
۳- تاریخچه چتها رو ندارم، یعنی بعد از
crash کردن باید از اول دوباره کل پیامهارو بفرستم برای کارشناس دیگر و در یک چت دیگر که میشه همون لوپ مشکل ۱ و ۲ ۴- بعد از تمام سختیها همون جواب قبل رو میگیری:
مشکل شما به واحد
X ارسال شد، X هم که مجهول پس هیچ راه حلی نیست و خرید بسته اینترنتی و ... بدون استفاده میشه سود 100% برای شرکت.تا اینجا فکر میکردم فقط پشتیبانی ایرانسل مشکل داره
ولی الان متوجه شدم، تیم دولوپرهاش هم مشکل دارند.
بعد اینا دنبال راهاندازی
LLM, AI, ... هم هستند؛ مشتی تو توی API, MobileAPP نویسی موندی (چیزی که با ۴ تا تست در میاد) بعد میخوای بری روی مواردی کار کنی که BlackBox هست ؟هوش مصنوعی قاتل از دست این شرکتا میزنه بیرونا 😂😂
👍53❤3
جنگ بین سم آلتمن و ایلان ماسک رو دوست دارم.
سم آلتمن که ضد ترامپ بوده و توییتهای جنجالی کم نداره
و
ایلان ماسک که طرفدار ترامپ هست.
و البته پروندههای مختلف علیه سم آلتمن و OpenAI؛ مصاحبه ۸ روز قبل تاکر کارلسون رو ببینید.
Tucker Carlson Youtube
سم آلتمن که ضد ترامپ بوده و توییتهای جنجالی کم نداره
و
ایلان ماسک که طرفدار ترامپ هست.
و البته پروندههای مختلف علیه سم آلتمن و OpenAI؛ مصاحبه ۸ روز قبل تاکر کارلسون رو ببینید.
Tucker Carlson Youtube
YouTube
Mother of Likely Murdered OpenAI Whistleblower Reveals All, Calls for Investigation of Sam Altman
Suchir Balaji worked as an engineer for Sam Altman building AI, until he decided that Altman was committing crimes. Balaji became a whistleblower, and soon after was found dead in his apartment. California authorities claim it was suicide. Crime scene photos…
👍11❤2
دستاوردهای یادگیری عمیق(InTec)
deepseek r1 منتشر شد؛ مقاله از نحوه ترین مدل - وزنها و ... همه چیز حتی مجوز commercial use رو هم داده https://github.com/deepseek-ai/DeepSeek-R1
وبسایت
قطعا دیگه شکی توی این موضوع نیست.
deepseek فابلیت استفاده همزمان از Search, DeepThink رو فعال کرده که نتابیج رو چندین برابر بهتر کرده.قطعا دیگه شکی توی این موضوع نیست.
👍47❤6
deepseek یک مدل دیگه منتشر کرد؛ همه این ارزونتر شدن و بهبودها و ... رو میبینید ؟
میدونید همش بخاطر این بوده که پروژه
deepseek یک side project برای یک تیم در زمینه الگوریتم و محاسبات و مایننگ و ... بوده ؟حالا باز بیاید بگید چقدر ریاضیات مهم هست برای کار هوش مصنوعی.
👍74❤8
رفتم روی تست
https://msty.app/
تا اینجا جالب بوده هم مشکلاتم با
تستهای بیشتر بگیرم؛ اگر خوب باشه حتما اون دو مورد قبلی رو پاک میکنم.
تنها مشکل فعلی: کاش با
https://msty.app/
تا اینجا جالب بوده هم مشکلاتم با
openweb-ui رو حل کرده هم مشکلاتم با LM-Studioتستهای بیشتر بگیرم؛ اگر خوب باشه حتما اون دو مورد قبلی رو پاک میکنم.
تنها مشکل فعلی: کاش با
tauri نوشته بودنش. (این پست آپدیت میشه)msty.ai
AI your way. Simple. Powerful. Private.
Unleash the power of AI with Msty
👍21❤2
من واقعا
دقت میکنم دیتا لیک انجام نشه و
groq رو دوس دارم بخصوص این ویژگی که بالای ۲۰۰ توکن هم میزنه برای thinking , ... خیلی عالیه ولی شرمنده دقت میکنم دیتا لیک انجام نشه و
chat.deepseek.com رو استفاده میکنم چون خروجی مدل بزرگتر به مراتب از مدل ۷۰ میلیارد پارامتری بهتره.👍14❤1
دستاوردهای یادگیری عمیق(InTec)
من واقعا groq رو دوس دارم بخصوص این ویژگی که بالای ۲۰۰ توکن هم میزنه برای thinking , ... خیلی عالیه ولی شرمنده دقت میکنم دیتا لیک انجام نشه و chat.deepseek.com رو استفاده میکنم چون خروجی مدل بزرگتر به مراتب از مدل ۷۰ میلیارد پارامتری بهتره.
این موج نفرت ضد
بدون احترام؛ احمقانه هست.
آمریکا و اروپا و چین و ... نداره؛ همه از دیتای شما استفاده خواهند کرد، یادتون نره
اینکه ادعای
دعوای بین بزرگان هست؛ یعنی در حد ۱۰ شرکت برتر ایران هم بهشون ربطی نداره
قطعاً هیچکدوم حتی همون ۵ میلیون دلار هزینهی ادعایی
با توجه به قیمت
اما اینکه شرکت مادر
دروغ یا حقیقت برای ماها بعنوان؛ محقق - مهندس - توسعه دهنده و یا حتی کاربر انتشار و ادعاهای
پ.ن : این موضوع راجب سانسور و گارد و ... هم هست
اینکه سوال رو توی چینی یا انگلیسی سانسور میکنه ولی روی زبانهای دیگه نه نشون دهنده ضعف مدل یا تیم نیست بلکه فقط نشون میده توسعه مدل سانسور و گارد برای این تیم اهمیتی نداشته.
خیلی مهم هست چون خیلی سادهتر از
deepseek و به سمت ابزارهای آمریکا و اروپا بدون احترام؛ احمقانه هست.
آمریکا و اروپا و چین و ... نداره؛ همه از دیتای شما استفاده خواهند کرد، یادتون نره
chatGpt3.5 روی متن کتابهایی آموزش دیده بود که از راه غیرقانونی دریافت شده بود یا روی کدهایی که LICENSE اونها ضد اینکار بود.اینکه ادعای
DeepSeek راجب تعداد GPU , ... حقیقت داره یا خیر برای من و شما نباید مهم باشه.دعوای بین بزرگان هست؛ یعنی در حد ۱۰ شرکت برتر ایران هم بهشون ربطی نداره
قطعاً هیچکدوم حتی همون ۵ میلیون دلار هزینهی ادعایی
deepseek رو هم نمیکنند روی R&D هوش مصنوعی.با توجه به قیمت
api و مقالهای که تیم deepseek منتشر کرده و توییتهای Andrej Karpaty توی این مدت راجب دستاوردهای deepseek خیلی دور از ذهن هم نیست.اما اینکه شرکت مادر
deepseek اینکار رو کرده تا سهامهایی مثل Nvidia و ... پایین بیاد و بتونه سرمایهگذاری کنه هم نکتهای هست که بخاطر اون میگویند که deepseek دروغ میگه.دروغ یا حقیقت برای ماها بعنوان؛ محقق - مهندس - توسعه دهنده و یا حتی کاربر انتشار و ادعاهای
deepseek خیلی خیلی سودمند بوده و هست.پ.ن : این موضوع راجب سانسور و گارد و ... هم هست
اینکه سوال رو توی چینی یا انگلیسی سانسور میکنه ولی روی زبانهای دیگه نه نشون دهنده ضعف مدل یا تیم نیست بلکه فقط نشون میده توسعه مدل سانسور و گارد برای این تیم اهمیتی نداشته.
خیلی مهم هست چون خیلی سادهتر از
distill مدل جدید میتونستند گارد و سانسور انجام بدند بخصوص اینکه llama3 و ... این رو در اختیار گذاشته👍47❤18
دستاوردهای یادگیری عمیق(InTec)
این موج نفرت ضد deepseek و به سمت ابزارهای آمریکا و اروپا بدون احترام؛ احمقانه هست. آمریکا و اروپا و چین و ... نداره؛ همه از دیتای شما استفاده خواهند کرد، یادتون نره chatGpt3.5 روی متن کتابهایی آموزش دیده بود که از راه غیرقانونی دریافت شده بود یا روی کدهایی…
#موقت
پیگیر چند مورد از ویدئوهایی و عکسهایی که فرستادید شدم.
منتشر کننده.های اولش فروشندههای اکانتهای chatgpt هستند.
کاری ندارم که سر عموم مردم کلاه میذارند اما اینکه مثلاً متخصصها هم داره سرشون کلاه میره جای تعجب داره 🤯
پیگیر چند مورد از ویدئوهایی و عکسهایی که فرستادید شدم.
منتشر کننده.های اولش فروشندههای اکانتهای chatgpt هستند.
کاری ندارم که سر عموم مردم کلاه میذارند اما اینکه مثلاً متخصصها هم داره سرشون کلاه میره جای تعجب داره 🤯
👍32
خبر داغ:
ادعا جدید
توی تستهای بسیاری از کاربران هم این موضوع نشون داده شده.
شخصاً تست نکردم.
ادعا جدید
Deepseek ؛ ۲ برابر سرعت بیشتر برای inference و کدی که توسط خود deepseek R1 زده شده.توی تستهای بسیاری از کاربران هم این موضوع نشون داده شده.
self improving AIشخصاً تست نکردم.
❤41👍8
Alibaba
ادعا کرده مدل جدیدش از
deepseek هم عملکرد بهتری داره و این ادعا توی بنچمارکها تایید میشه :https://qwenlm.github.io/blog/qwen2.5-max/
نکته جالبتر؛ هیچکدوم از خبرگزاریها دیگه این مدل رو با
chatgpt مقایسه نکردند و مستفیم با deepseek مقایسه شده.Qwen
Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model
QWEN CHAT API DEMO DISCORD
It is widely recognized that continuously scaling both data size and model size can lead to significant improvements in model intelligence. However, the research and industry community has limited experience in effectively scaling…
It is widely recognized that continuously scaling both data size and model size can lead to significant improvements in model intelligence. However, the research and industry community has limited experience in effectively scaling…
👍38❤1
دستاوردهای یادگیری عمیق(InTec)
Alibaba ادعا کرده مدل جدیدش از deepseek هم عملکرد بهتری داره و این ادعا توی بنچمارکها تایید میشه : https://qwenlm.github.io/blog/qwen2.5-max/ نکته جالبتر؛ هیچکدوم از خبرگزاریها دیگه این مدل رو با chatgpt مقایسه نکردند و مستفیم با deepseek مقایسه شده.
من مدل رو روی زبان Rust و با توجه به تسکهای این چندروز اخیر خودم تست کردم.
بنظرم به خوبی Deepseek R1 نیست قطعا ولی از Deepseek v3 عملکرد بهتری داره.
خوبی مدل این هست که متدها و آرگومانهای ورژنهای آخر پکیجهارو به خوبی میشناسه؛ چیزی که توی chatgpt نیست.
اما سرعتش به خوبی chatgpt, deepseek نیست واقعا.
بنظرم به خوبی Deepseek R1 نیست قطعا ولی از Deepseek v3 عملکرد بهتری داره.
خوبی مدل این هست که متدها و آرگومانهای ورژنهای آخر پکیجهارو به خوبی میشناسه؛ چیزی که توی chatgpt نیست.
اما سرعتش به خوبی chatgpt, deepseek نیست واقعا.
👍24❤1
دستاوردهای یادگیری عمیق(InTec)
من مدل رو روی زبان Rust و با توجه به تسکهای این چندروز اخیر خودم تست کردم. بنظرم به خوبی Deepseek R1 نیست قطعا ولی از Deepseek v3 عملکرد بهتری داره. خوبی مدل این هست که متدها و آرگومانهای ورژنهای آخر پکیجهارو به خوبی میشناسه؛ چیزی که توی chatgpt نیست.…
از میزیتهای دیگهاش Image, Video جنریت رو داره (بصورت رایگان)
که تصاویر خوبی هم تولید میکنه؛ پرامپت تصویر بالا :
surprise me.
که تصاویر خوبی هم تولید میکنه؛ پرامپت تصویر بالا :
surprise me.
👍29❤3