DBRX: Перспективная открытая LLM-модель от Databricks
Databricks выпустила DBRX, новую открытую LLM-модель. Она превосходит GPT-3.5 и даже конкурирует с Gemini 1.0 Pro в некоторых областях, таких как программирование.
Преимущества DBRX:
👉 Вдвое быстрее LLaMA2-70B
👉На 40% меньше Grok-1
👉Доступна с открытым исходным кодом на Hugging Face
Вообщем это следующий шаг для разработчиков, исследователей и бизнеса - это помогает от генерации SQL-запросов до сложных задач программирования и математики.
Пробовали ли вы DBRX или другие открытые LLM-модели? Ставь огонек 🔥 Будем и эту тему продвигать вперед
#llm #genai #opensource #databricks #coding
Databricks выпустила DBRX, новую открытую LLM-модель. Она превосходит GPT-3.5 и даже конкурирует с Gemini 1.0 Pro в некоторых областях, таких как программирование.
Преимущества DBRX:
👉 Вдвое быстрее LLaMA2-70B
👉На 40% меньше Grok-1
👉Доступна с открытым исходным кодом на Hugging Face
Вообщем это следующий шаг для разработчиков, исследователей и бизнеса - это помогает от генерации SQL-запросов до сложных задач программирования и математики.
Пробовали ли вы DBRX или другие открытые LLM-модели? Ставь огонек 🔥 Будем и эту тему продвигать вперед
#llm #genai #opensource #databricks #coding
🔥15❤2
DataWorkshop - AI & ML
Вчера мы учились читать научные статьи и я показал один трюк, который часто используется в "этом мире" (со всем уважением к настоящей науке, но именно этот трюк часто находит применение). Запомни, что везде действуют свои правила игры, и чем быстрее ты их…
This media is not supported in your browser
VIEW IN TELEGRAM
Для настроения.
Сегодня немного разминался: писал решение, которое будет автоматически парсить публикации из arXiv и затем их сжимать, чтобы можно было легко спросить: "Какая там модель, что умеет?"
Кстати, стоит заметить, что качество публикаций стало более читабельным, чем, скажем, ещё лет десять назад. Всё чаще есть ссылка на код на GitHub, и его можно потрогать руками (кстати, советую).
#paper #science #read #parse #llm
Сегодня немного разминался: писал решение, которое будет автоматически парсить публикации из arXiv и затем их сжимать, чтобы можно было легко спросить: "Какая там модель, что умеет?"
Кстати, стоит заметить, что качество публикаций стало более читабельным, чем, скажем, ещё лет десять назад. Всё чаще есть ссылка на код на GitHub, и его можно потрогать руками (кстати, советую).
#paper #science #read #parse #llm
❤4👍4
Так, я так и не понял почему xgboost свинья, ну даже если и так... то там как минимум дикий кабначик, который порвет многие "модные решения".
Насчет остальных, то да - игрушки, поигрались и хватит ❤️
P.S. Я до сих пор удивляюсь почему почти везде очень долго изучаются PCA, SVM, Naive Bayes итд Никогда не вндерял их на "продакшн" и не знаю ни одного успешного кейса.
Насчет остальных, то да - игрушки, поигрались и хватит ❤️
P.S. Я до сих пор удивляюсь почему почти везде очень долго изучаются PCA, SVM, Naive Bayes итд Никогда не вндерял их на "продакшн" и не знаю ни одного успешного кейса.
❤11🔥1
Выбери пожалуйста что на сегодня важнее всего для Тебя и уже в апреле будет больше всего именно про тему которая выиграет. Где сейчас Твой самый главный затык?
Anonymous Poll
25%
Нет знаний о том, как подготовить данные для обучения и предсказаний в машинном обучении.
25%
Не знаю, как правильно использовать базовые инструменты и модели машинного обучения.
57%
Не знаю, с чего начать, когда нужно построить модель машинного обучения для решения конкретной задач
9%
Не умею тренировать свою модель машинного обучения и понимать, что можно изменить
16%
Не умею создавать новые признаки в модели машинного обучения
39%
Недостаток практики и упражнений в области построения моделей ML
25%
Неуверенность или незнание как писать код на Python для работы с данными.
25%
Непонимание, что можно изменять в моделях в первую очередь, чтобы улучшать результат.
18%
Ограниченные знания о метриках успеха.
30%
Недостаток знаний/неуверенность в области практической статистики
❤6
Лови пдф-ку, сохраняй в закладки и делись с другими :)
Обещал, что сейчас работаю над шпаргалками. Кстати, над xgboost тоже думаю скоро выпустить, немного перфекционизм не отпускает, все время думаю, что еще чуть-чуть допилить 😂
Но сегодня я добавляю для разогрева, как делать повороты таблицы. С одной стороны, это очень простая задача, но цель следующая: обратить внимание на то, что важно. Например, на то, что работая с данными, нужно думать «матрицами», а не числами. Другая история — я плавно хочу тебя подвести к модным алгоритмам, где, между прочим, важен «механизм внимания». Чтобы лучше разобраться, хорошо попробовать написать куски кода «на коленке», тогда и публикации проще читать.
В общем, поддержи, насколько заходит такой формат (и обязательно проголосуй выше). 🔥🔥
#pdf
@data_work
Обещал, что сейчас работаю над шпаргалками. Кстати, над xgboost тоже думаю скоро выпустить, немного перфекционизм не отпускает, все время думаю, что еще чуть-чуть допилить 😂
Но сегодня я добавляю для разогрева, как делать повороты таблицы. С одной стороны, это очень простая задача, но цель следующая: обратить внимание на то, что важно. Например, на то, что работая с данными, нужно думать «матрицами», а не числами. Другая история — я плавно хочу тебя подвести к модным алгоритмам, где, между прочим, важен «механизм внимания». Чтобы лучше разобраться, хорошо попробовать написать куски кода «на коленке», тогда и публикации проще читать.
В общем, поддержи, насколько заходит такой формат (и обязательно проголосуй выше). 🔥🔥
@data_work
🔥12❤3
DataWorkshop - AI & ML
transpose.png
Помогу интерпретировать. Это такой фундамент, который нужно понимать и потом будет проще достигать цель.
"100x100" означает таблицу размером 100 на 100 (100 строк и 100 столбцов), далее "100k x 10k" означает 100 тысяч строк и 10 тысяч столбцов.
И далее видим время.
Для реализации 3 это занимает 19 секунд, для реализации 4 (где используется букву .T - матричный подход, "не трогаем" каждое число на уровне Python) - 199 нано секунд. Для понимания: 1 секунда это 1,000,000,000 наносекунд. Миллиард, Карл! 😎
Напомню, что в 1 веке (100 лет)у нас примерно 3 млрд. секунд. Вообще, есть разница в том, считать секунду или век, не так ли? И что еще важно, писать код - это всего лишь одна строчка (не всегда так просто). В общем, с данными нужно работать на уровне таблиц, а не значений.
Для Тебя это новое? 👍
"100x100" означает таблицу размером 100 на 100 (100 строк и 100 столбцов), далее "100k x 10k" означает 100 тысяч строк и 10 тысяч столбцов.
И далее видим время.
Для реализации 3 это занимает 19 секунд, для реализации 4 (где используется букву .T - матричный подход, "не трогаем" каждое число на уровне Python) - 199 нано секунд. Для понимания: 1 секунда это 1,000,000,000 наносекунд. Миллиард, Карл! 😎
Напомню, что в 1 веке (100 лет)у нас примерно 3 млрд. секунд. Вообще, есть разница в том, считать секунду или век, не так ли? И что еще важно, писать код - это всего лишь одна строчка (не всегда так просто). В общем, с данными нужно работать на уровне таблиц, а не значений.
Для Тебя это новое? 👍
👍13❤2
DataWorkshop - AI & ML
Выбери пожалуйста что на сегодня важнее всего для Тебя и уже в апреле будет больше всего именно про тему которая выиграет. Где сейчас Твой самый главный затык?
Итак, у нас есть победитель "запроса"!
"Не знаешь, с чего начать, когда нужно построить модель машинного обучения для решения конкретной задачи?"
Запрос понятен и звучит как самый важный на данный момент.
Немного повторюсь, но это важно:
- ML нельзя научить, но можно научиться! Это ремесло. ️
- Важно пропустить через себя поток информации и приобрести опыт.
- Просто читать статьи, книги или туториалы недостаточно.
- В DataWorkshop есть разные форматы обучения, но все они всегда про практику.
Начиная с курсов, мастер-классов или нового формата, которого нет в мире "команда DS/ML" (ну я не нашел), но он очень крутой. Правда, требует больших усилий чтобы его провести (наверное поэтому мало кто это сможет).
"Не знаешь, с чего начать, когда нужно построить модель машинного обучения для решения конкретной задачи?"
Запрос понятен и звучит как самый важный на данный момент.
Немного повторюсь, но это важно:
- ML нельзя научить, но можно научиться! Это ремесло. ️
- Важно пропустить через себя поток информации и приобрести опыт.
- Просто читать статьи, книги или туториалы недостаточно.
- В DataWorkshop есть разные форматы обучения, но все они всегда про практику.
Начиная с курсов, мастер-классов или нового формата, которого нет в мире "команда DS/ML" (ну я не нашел), но он очень крутой. Правда, требует больших усилий чтобы его провести (наверное поэтому мало кто это сможет).
🔥7❤3
В рунете мы еще не запускали поток, но уже был в Польше. Было круто! Результат есть, про это расскажу больше (наверное как вебинар?).
Важно отметить, что команда (именно команда!) сделала результат в течение двух недель. По факту каждый участник зарегестрировал весь путь "с чего начать, когда нужно построить модель ML для решения конкретной задачи"
Это было больше, чем просто тренировать модель - мы (именно команда!) сделали как минимум реальный MVP с бизнес-ценностью. Опыт колоссальный!
Как промежуточные метрики (ликбез):
- 6059 экспериментов (один эксперимент - это больше, чем тренировать модель);
- 49 тетрадок;
- появилось более 2k кода, который можно забрасывать на продакшн.
Все это было сделано командой, поэтому нужно было правильно настроить инструменты (GitHub и т.д.). ️Версионированние данных. кода, экспериментов!
Запуск такого симулятора - это круто, но это имеет смысл, когда есть решительно настроенные люди, которым хочется в течение 2 (или 3) недель конкретно поработать, чтобы приобрести реальный опыт ML/DS.
Ставь 🔥🔥🔥 и это будет как сигнал, что готов(а) принять участие и прокачать себя по полной в ML/DS. Результат гарантирую лично!
От тебя сейчас зависит, запускаем ли поток "команды DS" в течение месяца. Что думаешь?
Важно отметить, что команда (именно команда!) сделала результат в течение двух недель. По факту каждый участник зарегестрировал весь путь "с чего начать, когда нужно построить модель ML для решения конкретной задачи"
Это было больше, чем просто тренировать модель - мы (именно команда!) сделали как минимум реальный MVP с бизнес-ценностью. Опыт колоссальный!
Как промежуточные метрики (ликбез):
- 6059 экспериментов (один эксперимент - это больше, чем тренировать модель);
- 49 тетрадок;
- появилось более 2k кода, который можно забрасывать на продакшн.
Все это было сделано командой, поэтому нужно было правильно настроить инструменты (GitHub и т.д.). ️Версионированние данных. кода, экспериментов!
Запуск такого симулятора - это круто, но это имеет смысл, когда есть решительно настроенные люди, которым хочется в течение 2 (или 3) недель конкретно поработать, чтобы приобрести реальный опыт ML/DS.
Ставь 🔥🔥🔥 и это будет как сигнал, что готов(а) принять участие и прокачать себя по полной в ML/DS. Результат гарантирую лично!
От тебя сейчас зависит, запускаем ли поток "команды DS" в течение месяца. Что думаешь?
🔥30👍3❤🔥1
Закрутилось, завертелось :)
В последнее время, кроме того, что стало больше проектов, меня еще и чаще стали приглашать на конференции.
Вот в пятницу был на Data Science Summit. Одна из самых больших конференций в Польше про ML/DS. Более тысячи участников.
Моя презентация была практической, где я рассказывал про мой опыт и конкретные прикладные примеры из разных отраслей: e-commerce, логистика, автомобильная, телекоммуникация, строительная.
А название презентации было - "Как внедрять модель ML, которая влияет на решения на миллионы евро". На практике это выглядит совсем иначе, чем знания из книжек. Очень много "жизненных историй" и умения взаимодействовать с людьми и технологиями. Только "математики" не хватит.
P.S. Кстати, приходилось ли вам видеть, как выглядит расплавленный алюминий и какое это имеет отношение к ML (и решениям на миллионы)?
P.P.S Ставь реакцию 🔥 будет уверенность, что это ценно и важно для Тебя
В последнее время, кроме того, что стало больше проектов, меня еще и чаще стали приглашать на конференции.
Вот в пятницу был на Data Science Summit. Одна из самых больших конференций в Польше про ML/DS. Более тысячи участников.
Моя презентация была практической, где я рассказывал про мой опыт и конкретные прикладные примеры из разных отраслей: e-commerce, логистика, автомобильная, телекоммуникация, строительная.
А название презентации было - "Как внедрять модель ML, которая влияет на решения на миллионы евро". На практике это выглядит совсем иначе, чем знания из книжек. Очень много "жизненных историй" и умения взаимодействовать с людьми и технологиями. Только "математики" не хватит.
P.S. Кстати, приходилось ли вам видеть, как выглядит расплавленный алюминий и какое это имеет отношение к ML (и решениям на миллионы)?
P.P.S Ставь реакцию 🔥 будет уверенность, что это ценно и важно для Тебя
🔥27👍3❤2
- ИИ отнимет у людей работу! - сказал испуганный человек о прогрессе ИИ.
- Ну не знаю, думаю, это работает иначе, - сказал практик.
Майлс Астрей, талантливый фотограф, сделал необычное фото фламинго, которое выглядело как безголовое розовое облако на тонких ножках. Эта фотография была настолько "творческой", что легко можно было подумать, что она была сгенерирована искусственным интеллектом.
Фотография Астрея получила две награды в категории ИИ на престижном международном фотоконкурсе "1839 Awards". Однако оказалось... (упс) что она не имела ничего общего с искусственным интеллектом - она была сделана обычной фотокамерой.
Эта неожиданная правда привела к дисквалификации фотографии с конкурса, несмотря на то, что ранее она заняла третье место и получила приз зрительских симпатий в категории ИИ. Астрей намеренно подал свою фотографию в эту категорию, чтобы доказать, что искусство, созданное человеком, все еще имеет огромное воздействие в мире, где доминируют алгоритмы.
- Ну не знаю, думаю, это работает иначе, - сказал практик.
Майлс Астрей, талантливый фотограф, сделал необычное фото фламинго, которое выглядело как безголовое розовое облако на тонких ножках. Эта фотография была настолько "творческой", что легко можно было подумать, что она была сгенерирована искусственным интеллектом.
Фотография Астрея получила две награды в категории ИИ на престижном международном фотоконкурсе "1839 Awards". Однако оказалось... (упс) что она не имела ничего общего с искусственным интеллектом - она была сделана обычной фотокамерой.
Эта неожиданная правда привела к дисквалификации фотографии с конкурса, несмотря на то, что ранее она заняла третье место и получила приз зрительских симпатий в категории ИИ. Астрей намеренно подал свою фотографию в эту категорию, чтобы доказать, что искусство, созданное человеком, все еще имеет огромное воздействие в мире, где доминируют алгоритмы.
👍8❤2
Это одна, можно сказать, случайная история. Мне нравится эта аналогия, которая показывает таланты людей. У каждого из нас есть свои таланты, просто мы часто их скрываем. Но если раскрыть свой талант, никакой ИИ не сможет его превзойти 🙂
ИИ отлично подходит для решения конкретных задач в бизнесе. Об этом я тоже регулярно пишу, отправляю в новостной рассылке или записываю в своем подкасте biznesmysli.pl (пока что только на польском). ИИ предоставляет огромные возможности для бизнеса, но помните, что у любой палки два конца, и всегда
существует золотая середина.
То, что, на мой взгляд, человек сейчас должен сделать, это понять, какова его роль. Сложный вопрос, но ИИ заставляет нас его задать.
Резонирует? ❤️
ИИ отлично подходит для решения конкретных задач в бизнесе. Об этом я тоже регулярно пишу, отправляю в новостной рассылке или записываю в своем подкасте biznesmysli.pl (пока что только на польском). ИИ предоставляет огромные возможности для бизнеса, но помните, что у любой палки два конца, и всегда
существует золотая середина.
То, что, на мой взгляд, человек сейчас должен сделать, это понять, какова его роль. Сложный вопрос, но ИИ заставляет нас его задать.
Резонирует? ❤️
👍11❤6
Отдых важен!
- "Я не успеваю за изменениями (остановите, мне нужно выйти), у меня паника!" - очередная жалоба вместе с просьбой пришла ко мне.
- "Отдохни, все хорошо" - искренне советую, что нужно сделать.
Расскажу историю. За последние полтора года у меня у самого не было полноценного отдыха. Не жалуюсь, просто хочу поделиться с Тобой некоторыми размышлениями. Сейчас утро, нахожусь на берегу Атлантического океана. Здесь спокойно и приходят разные мысли, которыми хочется поделиться. Сегодня не будет про технический ML, хотя это все очень взаимосвязано. Думаю написать серию постов, связанных с моими мыслями и опытом. Интересно, насколько это будет ценно. Моя жена говорит, чтобы я делился своими мыслями с миром, а не только с ней 😉
Наблюдая за мной со стороны, жизнь кажется очень активной и веселой, и можно сказать, так оно и есть. Постоянно перемещаюсь, налетал, наверное, 10к+ километров, участвую в реальных проектах ML (менее очевидных, например, связанных с промышленностью, все хочу начать и этим тоже делиться), обучаю тысячи людей как напрямую, так и через ведущие фирмы телекомов, банков (трансформации больших фирм), участвую в крутых конференциях - в общем, жизнь - конфетка.
Но при всем этом можно заиграться. Именно поэтому я начал с того, что отдых важен. Это звучит просто, может даже банально, но все же это то, что помогает еще быстрее (если есть такая необходимость) двигаться вперед.
А теперь давай про Тебя, чтоб было лучше понятно, про что это я. Вот смотри, сейчас происходит много событий в ML/AI. Правила жизни прямо меняются на глазах. Начиная с ChatGPT 3.5 (которая, к слову, сейчас уже очень посредственная модель (можно даже сказать, уже и плохая по сравнению с конкурентами), но тогда казалась прям идеальной) и дальше больше. А прошло-то всего года с копейками, может, скоро уже будет два. Многие профессии уже сейчас начали изменяться. Особенно там, где есть текст, но, например, самый очевидный - это копирайтеры. Но не только. Это также касается всех, кто работает с документацией (в том числе юристы) или, может, менее очевидный пример - продуктологи или даже программисты (код - это тоже текст). И что делать? Паниковать?
- "Я не успеваю за изменениями (остановите, мне нужно выйти), у меня паника!" - очередная жалоба вместе с просьбой пришла ко мне.
- "Отдохни, все хорошо" - искренне советую, что нужно сделать.
Расскажу историю. За последние полтора года у меня у самого не было полноценного отдыха. Не жалуюсь, просто хочу поделиться с Тобой некоторыми размышлениями. Сейчас утро, нахожусь на берегу Атлантического океана. Здесь спокойно и приходят разные мысли, которыми хочется поделиться. Сегодня не будет про технический ML, хотя это все очень взаимосвязано. Думаю написать серию постов, связанных с моими мыслями и опытом. Интересно, насколько это будет ценно. Моя жена говорит, чтобы я делился своими мыслями с миром, а не только с ней 😉
Наблюдая за мной со стороны, жизнь кажется очень активной и веселой, и можно сказать, так оно и есть. Постоянно перемещаюсь, налетал, наверное, 10к+ километров, участвую в реальных проектах ML (менее очевидных, например, связанных с промышленностью, все хочу начать и этим тоже делиться), обучаю тысячи людей как напрямую, так и через ведущие фирмы телекомов, банков (трансформации больших фирм), участвую в крутых конференциях - в общем, жизнь - конфетка.
Но при всем этом можно заиграться. Именно поэтому я начал с того, что отдых важен. Это звучит просто, может даже банально, но все же это то, что помогает еще быстрее (если есть такая необходимость) двигаться вперед.
А теперь давай про Тебя, чтоб было лучше понятно, про что это я. Вот смотри, сейчас происходит много событий в ML/AI. Правила жизни прямо меняются на глазах. Начиная с ChatGPT 3.5 (которая, к слову, сейчас уже очень посредственная модель (можно даже сказать, уже и плохая по сравнению с конкурентами), но тогда казалась прям идеальной) и дальше больше. А прошло-то всего года с копейками, может, скоро уже будет два. Многие профессии уже сейчас начали изменяться. Особенно там, где есть текст, но, например, самый очевидный - это копирайтеры. Но не только. Это также касается всех, кто работает с документацией (в том числе юристы) или, может, менее очевидный пример - продуктологи или даже программисты (код - это тоже текст). И что делать? Паниковать?
🔥7
Продложение 👇
Нет!
Точно не паниковать или делать что-то странное. Как по мне, когда такие мысли приходят, нужно создать условия для решения этой задачи. Для начала нужны силы (можно сказать, энергия), чтобы думать и принимать решения. Звучит просто, но, наблюдая за людьми, общаясь, я вижу, что большинство людей находятся на "энергетическом нуле". Как отдыхать? Кстати, очень хороший вопрос. Каждому это индивидуально, но в той ситуации, где мы сейчас находимся, очень важна природа и тишина. Это может быть дача, дом у бабушки с дедушкой или еще что-то. Это не обязательно должно быть что-то дорогое (точно не громкие курорты). В общем, вкратце, нужно сбросить с себя накопленный слой переживаний, успокоиться и наполнить свою батарейку. Для этого порой достаточно хотя бы пары дней, лучше, конечно, недели. И далее, когда нет тревожности, можно начать работать над тем, что делать. Ведь количество возможностей, которое открывается, оно тоже большое. Нужно научить мозг смотреть немного под другим углом.
Ставь реакцию 🔥, буду продолжать. Еще иногда записываю сторис на запрещенограмме.
Кстати, меня тут спрашивали, какую книгу посоветовать. Не очень люблю это делать, могу объяснить почему, но одну крутую (и тонкую) могу посоветовать. Ставь реакцию, и буду продолжать. Сейчас есть время, и очень хочется делиться мыслями. Я уже давно заметил, что передавать только технические знания – этого мало, и лучше всего это работает в связке, когда мозги начинают по-другому работать.
P.S. Кстати, посты пишу сам, но что интересно, у меня с русским (да и любым другим языком, я уже еще пару знаю) с грамматикой всегда проблемы были. Поэтому ChatGPT (хотя чаще использую Claude) тоже участвовал, чтобы исправить ошибки. Вот так вот, даже здесь пригодился.
P.P.S. Жду Твою реакцию, меня это вдохновит и буду дальше делиться 🔥
Нет!
Точно не паниковать или делать что-то странное. Как по мне, когда такие мысли приходят, нужно создать условия для решения этой задачи. Для начала нужны силы (можно сказать, энергия), чтобы думать и принимать решения. Звучит просто, но, наблюдая за людьми, общаясь, я вижу, что большинство людей находятся на "энергетическом нуле". Как отдыхать? Кстати, очень хороший вопрос. Каждому это индивидуально, но в той ситуации, где мы сейчас находимся, очень важна природа и тишина. Это может быть дача, дом у бабушки с дедушкой или еще что-то. Это не обязательно должно быть что-то дорогое (точно не громкие курорты). В общем, вкратце, нужно сбросить с себя накопленный слой переживаний, успокоиться и наполнить свою батарейку. Для этого порой достаточно хотя бы пары дней, лучше, конечно, недели. И далее, когда нет тревожности, можно начать работать над тем, что делать. Ведь количество возможностей, которое открывается, оно тоже большое. Нужно научить мозг смотреть немного под другим углом.
Ставь реакцию 🔥, буду продолжать. Еще иногда записываю сторис на запрещенограмме.
Кстати, меня тут спрашивали, какую книгу посоветовать. Не очень люблю это делать, могу объяснить почему, но одну крутую (и тонкую) могу посоветовать. Ставь реакцию, и буду продолжать. Сейчас есть время, и очень хочется делиться мыслями. Я уже давно заметил, что передавать только технические знания – этого мало, и лучше всего это работает в связке, когда мозги начинают по-другому работать.
P.S. Кстати, посты пишу сам, но что интересно, у меня с русским (да и любым другим языком, я уже еще пару знаю) с грамматикой всегда проблемы были. Поэтому ChatGPT (хотя чаще использую Claude) тоже участвовал, чтобы исправить ошибки. Вот так вот, даже здесь пригодился.
P.P.S. Жду Твою реакцию, меня это вдохновит и буду дальше делиться 🔥
🔥27
This media is not supported in your browser
VIEW IN TELEGRAM
Модель ChatGPT и похожие очень известны, но существуют альтернативы, которые, может быть, менее популярны. Их иногда называют open-source, но это не совсем верное утверждение. Скорее, правильнее сказать open-weight - в общем, можешь скачать веса и запустить, например, на ноутбуке или на сервере.
Примером такой модели является llama (лама). Сейчас уже есть 3-я версия, которая доступна в 3 размерах (самая большая 400+ млрд параметров) и по качеству далеко обходит GPT-3.5 и приближается к GPT-4.
Так вот, эксклюзивные кадры, как тренируется такая модель 😂
@data_work
#llama #gpt #training #llm #ai
Примером такой модели является llama (лама). Сейчас уже есть 3-я версия, которая доступна в 3 размерах (самая большая 400+ млрд параметров) и по качеству далеко обходит GPT-3.5 и приближается к GPT-4.
Так вот, эксклюзивные кадры, как тренируется такая модель 😂
@data_work
#llama #gpt #training #llm #ai
🤣13👏4
AI под собственной крышей
ChatGPT, который сейчас постоянно на слуху и часто является синонимом AI, на самом деле это один из доступных вариантов. В какой-то момент времени действительно GPT-3.5 сделала значительный рывок, в отличие от того, что можно было запустить самостоятельно. Это дало импульс, чтобы активно начинать догонять. Кстати, это вообще интересный момент с точки зрения психологии: когда кто-то достигает точки X, то в голове что-то щелкает и становится понятно, что это возможно. Поэтому резко многим удается достичь этой же точки, и это становится только вопросом времени, и обычно это происходит быстро.
Как пример, было что-то похожее с марафонами. Вспомнилась история 6 мая 1954 года, когда британский бегун Роджер Баннистер впервые в истории пробежал милю быстрее четырёх минут, установив мировой рекорд с результатом 3 минуты 59,4 секунды. До этого многие спортсмены и эксперты считали, что человеческие возможности ограничены, и никто не сможет пробежать милю быстрее, чем за 4 минуты. Это мнение базировалось на длительном отсутствии прогресса в улучшении результатов на этой дистанции. Что интересно, после того, как Роджер Баннистер преодолел этот барьер, произошло нечто удивительное: в течение следующих нескольких лет многие другие бегуны также начали пробегать милю быстрее четырёх минут. Вот так пробивается стеклянный потолок, и ML/AI здесь не исключение.
AI/ML можно использовать не только через API ChatGPT и похожие, но можно держать его у себя (например, на ноутбуке). Понятно, что большие языковые модели очень требовательны к мощностям, и не все так легко можно запустить, но есть разные способы оптимизации. Кстати, что тоже важно, речь идет не только про работу с текстом, но также с рисунками или аудио. Например, на видео это я в самолете (кстати, без доступа к интернету) продолжаю работать над курсом и делаю транскрипцию с видео, чтобы потом записать в финальной версии более улучшенного качества. Целый процесс, как сейчас можно, "беря на работу LLM", улучшать качество своих продуктов.
Интересно? Ставь реакцию! 🔥
@data_work
#llama #gpt #training #llm #ai
ChatGPT, который сейчас постоянно на слуху и часто является синонимом AI, на самом деле это один из доступных вариантов. В какой-то момент времени действительно GPT-3.5 сделала значительный рывок, в отличие от того, что можно было запустить самостоятельно. Это дало импульс, чтобы активно начинать догонять. Кстати, это вообще интересный момент с точки зрения психологии: когда кто-то достигает точки X, то в голове что-то щелкает и становится понятно, что это возможно. Поэтому резко многим удается достичь этой же точки, и это становится только вопросом времени, и обычно это происходит быстро.
Как пример, было что-то похожее с марафонами. Вспомнилась история 6 мая 1954 года, когда британский бегун Роджер Баннистер впервые в истории пробежал милю быстрее четырёх минут, установив мировой рекорд с результатом 3 минуты 59,4 секунды. До этого многие спортсмены и эксперты считали, что человеческие возможности ограничены, и никто не сможет пробежать милю быстрее, чем за 4 минуты. Это мнение базировалось на длительном отсутствии прогресса в улучшении результатов на этой дистанции. Что интересно, после того, как Роджер Баннистер преодолел этот барьер, произошло нечто удивительное: в течение следующих нескольких лет многие другие бегуны также начали пробегать милю быстрее четырёх минут. Вот так пробивается стеклянный потолок, и ML/AI здесь не исключение.
AI/ML можно использовать не только через API ChatGPT и похожие, но можно держать его у себя (например, на ноутбуке). Понятно, что большие языковые модели очень требовательны к мощностям, и не все так легко можно запустить, но есть разные способы оптимизации. Кстати, что тоже важно, речь идет не только про работу с текстом, но также с рисунками или аудио. Например, на видео это я в самолете (кстати, без доступа к интернету) продолжаю работать над курсом и делаю транскрипцию с видео, чтобы потом записать в финальной версии более улучшенного качества. Целый процесс, как сейчас можно, "беря на работу LLM", улучшать качество своих продуктов.
Интересно? Ставь реакцию! 🔥
@data_work
#llama #gpt #training #llm #ai
🔥13👍3❤2
Какой инструмент знаешь и используешь на практике?
Anonymous Poll
5%
ollama
5%
llama.cpp
7%
LM Studio
2%
Open WebUI
2%
LibreChat
78%
Ничего ещё не использую, но помоги в этом разобраться
2%
Мне это не интересно :)
🤔2