Стать специалистом по машинному обучению – Telegram
Стать специалистом по машинному обучению
10.4K subscribers
101 photos
13 videos
28 files
600 links
Канал о машинном обучении для людей

Учусь разбираться в терминах ML вместе с вами. Для разбора теории приглашаю профессионалов. Подкаст: https://mlpodcast.mave.digital

С вопросами и предложениями пишите @kmsint
Download Telegram
Audio
Алексей Толстиков. Про Школу Анализа Данных. Зачем? Кому? Как?
15🔥7👎4🤝2💋1
Больше каналов по ML богу каналов по ML!

Я периодически подписываюсь на новые каналы, чтобы не только быть в курсе, что происходит в индустрии, но и чтобы найти для себя интересных авторов и потенциальных гостей подкаста. Вот, новая мини-подборка, которую я читаю. Каналы небольшие, посты не очень частые. Частота постов для меня имеет значение, потому что я просто не успеваю всё просматривать, когда канал генерирует контент со скоростью света. Даже хорошие каналы с высокой частотой обычно сначала уходят в мьют, а потом, когда там накапливается больше нескольких сотен непрочитанных постов, переезжают в архив или я из них вообще выхожу, потому что понимаю, что вряд ли когда-то найду в себе силы и желание всё это прочитать. Лучше редко, но метко, говорили мне в школе

Плюс, мне очень нравятся именно авторские каналы, за которыми видно автора, а не бренд. В современном мире сильная фраза «Человеку нужен человек» актуальна как никогда.
15👍12🔥7💯5🤡2👎1🤣1💋1
Кому комбинаторики? На Степике есть два хороших курса по комбинаторике. Один начального уровня, а второй экстремальный. Экстремальный, кстати от небезызвестного Райгородского! До экстремального пока не добрался, думаю, что не осилю без предварительной подготовки, поэтому прохожу начальный - довольно легко идёт.

1. Комбинаторика для начинающих.
2. Экстремальная комбинаторика.

P.S. Экстремальная комбинаторика номинирована на Stepik Awards 2025 как лучший бесплатный курс. Если желаете - можете поддержать.
3👍42🔥1291💋1
На прошлой неделе был на ивенте Яндекса для молодых и амбициозных эмэльщиков - Data Dojo (произносится как дата додзё, но с ударением, как это ни странно, не на ё, а на о). Про саму тусовку чуть ниже, а сейчас главная мысль, которую я думал на протяжении всего вечера. Не верьте, что начинающие разработчики больше не нужны и в индустрии застой. Продолжайте повышать свою квалификацию, если когда-то захотели стать специалистами по машинному обучению, работы и задач хватает. Если бы это было не так, такие мероприятия, с таким большим количеством посетителей и с таким большим количеством команд, желающих к себе молодых дарований, не имели бы никакого смысла. Зачем вкладывать немалые ресурсы в организацию встречи, если ни стажёры, ни джуны больше никому не нужны и любая нейросетка их уже заменила. Нет, не заменила.

Инженеры, обычно, довольно скептичные люди и начинают верить в чудо только тогда, когда оно реально случается. И если оно начнёт случаться - мы это обязательно увидим по действиям тех, кто как раз очень плотно соприкасается с самыми передовыми разработками в области ИИ. Думаю, первое, чем они займутся - это внедрят "чудо" на местах и, вот, тогда, действительно, вложения в привлечение и обучение молодых специалистов перестанут быть оправданными. Бизнес, особенно, многолетний, умеет считать деньги, уж, поверьте. Ну, а пока с рынком найма для решения ML-задач всё в порядке и Data Dojo тому неиллюзорное подтверждение.

Теперь немного о самом мероприятии. Формат был следующий - сначала несколько докладов. Про тренды уходящего года в ML. Про подготовку интересных задач для участников соревнования Yandex Cup. И про то, как Алису учили вычленять слова активации среди любого шума.

Мне больше всего понравился третий доклад. Очень увлеченный спикер - Дмитрий Солодуха - руководитель команды голосовой активации. Несколько лет назад у меня был подкаст с Олегом Найдиным, который раньше занимался схожим направлением и, кажется, за это время много чего изменилось. Договорились с Дмитрием, что как-нибудь встретимся в подкасте и он поделится деталями работы его команды.

Второй доклад тоже запомнился. Ведущий разработчик службы поведения и предсказания департамента Автономного транспорта Сергей Фиронов рассказал, как они готовили задачи для соревнования. И разумеется, сложностей там хватало. И баланс между сложностью и полезностью соблюсти нужно, и читерские подходы предусмотреть, и интереса с нестандартностью добавить, чтобы мотивация у участников была. По реакции зала было понятно, что многие участвовали в контесте и, кажется, остались довольны.

После докладов можно было поговорить с командами, занимающимися машинным обучением, чтобы попытаться понять какое направление и какая команда тебе ближе (по духу, или как это сейчас модно говорить - по вайбу, по задачам, по перспективам роста). Ну, а потом нетворкинг, свободное общение, игры в игровые автоматы... Я играл в Пак-ман и вспоминал книгу "Первому игроку приготовиться", где главный герой, как раз в пак-мане нашёл пасхалку, решившую исход его борьбы.

Много общался с молодыми ребятами и нанимающими командами, вспоминал свои студенческие годы. Видел Петра Ермакова 🙂 Пётр, привет! Уезжал с мероприятия со спокойной уверенностью, что всё идёт своим чередом, что люди-специалисты нужны не меньше, а то и больше, чем раньше и что молодое поколение продолжит отлично справляться с технологическими вызовами современности.
👍1915🔥10💋1😡1
Вчера перед сном на ютубе увидел превью ролика с задачей нахождения центра круга с помощью линейки. У ролика была аннотация "Эту задачу в 1956 г давали в СССР, чтобы отсеять с матфака при поступлении". Начал смотреть и автор сказал, что покажет 2 "нелегальных" с точки зрения математиков способа и один "легальный". На этом моменте я выключил, чтобы попытаться немного обдумать задачу самостоятельно.

Два "нелегальных" способа придумал сразу. Хотя, на тот момент, я до сих пор не посмотрел ролик и не знал, какие решения предложит автор. Суть моих "нелегальных" сводилась к тому, чтобы воспользоваться прямым углом на линейке (её основной и торцевой частью) и тогда можно будет либо построить два прямых угла внутри окружности, которые, как известно, будут опираться на диаметр, а на пересечении этих диаметров окажется центр. Либо можно окружность вписать в квадрат и тогда центр будет на пересечении диагоналей этого квадрата. Пока это писал, придумал третий способ 🙂 Можно провести две касательные и к ним перпендикуляры - пересечение перпендикуляров даст центр.

Но, вот, с легальным способом пришлось помучиться. Я уснул, так и не решив задачу в голове, с ощущением, что на матфак в 1956-м меня бы не взяли. Основная идея состояла в том, чтобы построить угол из двух касательных и затем разделить этот угол биссектрисой пополам. Это даст возможность построить диаметр. Проделав эту операцию два раза на пересечении диаметров будет центр. Но что-то я не придумал/не вспомнил как линейкой один угол поделить на два равных. Только циркулем помню как.

Так как задача не отпускала всю ночь, с утра сел за её решение. Во-первых, вспомнил, что если взять за основу то, что у линейки противоположные стороны параллельны, то биссектрису построить очень легко. Но этот способ мне тоже показался "нелегальным". Короче, промучился я какое-то время, ничего не придумал и пошёл смотреть ролик. Увы, меня постигло разочарование - легальным оказался способ, подразумевающий, что у линейки как раз параллельные стороны. Правда, там не угол пополам делили, а строили равнобедренную трапецию на параллельных хордах, а затем на пересечении диагоналей трапеции и вершины треугольника, в которую сходится данная трапеция, получали диаметр. Так что реально легального способа я так и не узнал 🙂

Но задача всё равно классная, прям, почувствовал, как ржавые шестерёнки в мозгах приходят в движение.

P.S. Нелегальные способы совпали 🙂

UPD: В комментариях предложили реально "легальный" способ решения.

UPD2: Увы, решение оказалось ошибочным. Получается, реально "легального" способа не существует. В комментариях есть ссылка на википедию.
🔥26👍114💋1
Недавно в канале был пост про то, как Яндекс перестраивает процесс найма в ML и делает его более оптимальным. На этом решили не останавливаться: 13 и 14 декабря пройдет Weekend Offer ML. Мероприятие упрощает получение оффера и дает возможность устроится в Яндекс буквально за выходные.

Если вы инфраструктурный или DL-инженер с опытом в NLP, CV, ASR, TTS или RecSys, это ваш вариант. Нужно будет пройти всего две (вместо обычных трёх) технические секции в субботу, а уже в воскресенье, после финальных интервью с командами, получить оффер.

Это возможность стать специалистом ключевых R&D команд, включая Alice AI LLM (YandexGPT), Яндекс Переводчик и Компьютерное зрение, где вы будете работать над самыми передовыми прикладными задачами и создавать сервисы, которыми пользуются миллионы 👾

Главное — зарегистрироваться на мероприятие до 9 декабря 12:00 мск. Все подробности и форма для регистрации доступны по ссылке.
👍4🔥3👎1💋1🤝1
Сначала хотел написать пост про AI марафон, который решил для себя устроить, но нашёл в заметках недописанный текст, который, как мне кажется, очень неплохо предваряет пост про марафон, проливая свет на мотивацию. Поэтому сначала доработал "недописанную" заметку, а про AI марафон на днях напишу.

Поймал себя на мысли, что кажется нашёл ответ на своё поведение в плане обучения. Одна из самых продуктивных стратегий обучения выработалась у меня стихийно. Я вообще не прикладывал к её появлению и развитию никаких усилий. Чтобы хорошо разобраться в какой-то новой теме - нужно потреблять много информации по этой теме, даже если она тебе уже хорошо знакома. Очень редко бывает так, что ты, ну, прям, на 100% знаешь всё даже из основ.

И эта мысль пришла ко мне в голову, когда я в очередной раз читал про переобучение в машинном обучении. Если у модели было мало (точнее, недостаточно) эпох обучения - будет недообучение, когда модель не может делать нормальные предсказания ни на старых, ни тем более, на новых данных. А если будет мало данных, но много эпох - будет переобучение, когда модель прекрасно делает предсказания только на данных, которые видела, - по сути, заучивая их, без способности к обобщению (генерализации).

Именно поэтому иногда имеет смысл перечитывать великие труды, чтобы укрепить свою нейросеть, которая может разболтаться (деградировать) от низкопробной литературы. Поэтому стоит перечитывать, ставшие классикой, книги об инженерных подходах. Обычно книги содержат в себе несколько слоёв реальности, которые могут и не открыться при первом прочтении. Автор всегда мыслит и пишет, исходя из своего понимания мироустройства, даже если пытается объяснить какие-то концепции для тех, кому тема книги или отдельные главы - это что-то новое. У него свои ассоциативные ряды, свои мысленные отсылки на личный опыт, свои, кажущиеся релевантными, аналогии. И понять их при первом прочтении обычно не представляется возможным, потому что, в принципе, сложно следить за мыслью автора, чтобы хотя бы общую идею уловить. Куда, уж, там о нюансах думать?

В общем, читать книги по несколько раз, проходить одни и те же курсы дважды, пересматривать лекции - это довольно эффективный способ учиться. Я часто любимые подкасты переслушиваю и всегда нахожу что-то новое, и ранее упущенное, интересное для себя.
💯25👍14🔥75💋1
Что-то мне за последнее время уже несколько одарённых ребят 14-летнего возраста встретились, с которыми про ML можно разговаривать чуть ли не на равных. Как-то я вспоминаю себя 14-летнего и не уверен, что смог бы сразу в индустрии работать, не смотря на мою любовь к компьютерам и бейсику 🙂 Это я сейчас про самого молодого финалиста в ML-треке соревнования Yandex Cup, финал которого прошел в Стамбуле. Восьмой класс, а он уже LLM-ки вращает не хуже взрослых.

Масштаб ML-направления в соревновании сильно вырос, в том числе и географически. Участие могли принимать специалисты со всего мира, разработчики собрались из 60-ти стран. Всего по всем трекам было подано порядка двадцати тысяч заявок, что тоже говорит о росте интересе к соревнованию.

Я писал недавно пост о том, что был на Data Dojo, где подробно послушал о том, как придумывали задачи для ML-трека. Самое цепляющее, на мой взгляд, там было то, что задачи не были "сферическими", а брались из реальной разработки и адаптировались под соревнование. А так как конкуренция в авангарде технологий - это всегда соревнование, то участники получили возможность почувствовать себя среди той самой основной движущей силы цивилизации, которая через ML и AI стремительно преображается. Да так, что никто понятия не имеет, что через 10 лет будет.

Я уже несколько лет подряд смотрю, что за задачи на соревновании и понимаю, что они под силу, действительно, сильным. А изучить потом подходы к решению всегда интересно и полезно. Много раз слышал, что решать олимпиадные задачи можно натренироваться, потому что там имеет большое значение насмотренность и навык выделения общих паттернов. В целом, задачи уже решены кем-то много раз, а значит, точно имеют решение. В задачах же, которые предлагает индустрия, часто и решения может не существовать, то есть приходится браться за задачу без уверенности, что она решаема. А это порождает как-будто разные ощущения. В первом случае ты точно знаешь, что дверь есть и нужно её просто (хотя, конечно, часто совсем не просто) найти, а во втором никаких гарантий, что и дверь-то существует. И, вот, эта способность генерировать нестандартные подходы к поиску решений для нерешённых задач - то, что ещё не получается автоматизировать, даже с помощью гигантских трансформеров. Талантливые специалисты нужны и такие масштабные мероприятия - хороший способ не только их найти для самой индустрии, но и им самим показать их ценность на пути преодоления технологических вызовов.

В общем, меня радует, что такие соревнования существуют. Что их организуют наши компании. Что молодые специалисты легко могут заявить о себе. Легко, конечно, не в плане "с лёгкостью выиграть соревнование", а про доступность участия. И, да, 14-летние ребята, конечно, удивляют. Мирон, тебе отдельный привет!
1🔥2719👍8🤝2💋1
Нашёл самое лучшее объяснение того самого странного факта, что сумма ряда натуральных чисел внезапно -1/12:

1 + 2 + 3 + 4 + ... = - 1/12

Когда я впервые столкнулся с этим фактом, да ещё и со строгим его математическим доказательством, в очередной раз убедился, что далеко не всё в жизни может быть интуитивно понятным.

Если кратко, то объяснение сводится к тому, что есть классическое понимание суммы, которым мы привыкли пользоваться в быту и у ряда натуральных чисел вычислить такую сумму нельзя, потому что ряд состоит из бесконечного числа слагаемых, да ещё и расходится при этом, а есть так называемая "обобщённая сумма", которая является некоторым математически корректным способом поставить в соответствие расходящимся рядам (да и не только рядам) определённое число. То есть обобщённая сумма - это не только про "сколько получится", а ещё и про "как корректно определить результат", когда обычное сложение уже не работает.

Мы определяем какими свойствами должна обладать сумма каких-либо элементов, определяем правила суммирования и дальше путём строгих непротиворечивых вычислений получаем довольно конкретный результат. А то, что привычное бытовое суммирование очень похоже и обладает теми же свойствами, что и обобщённое суммирование, так это просто частный случай. Это как со специальной теорией относительности - ньютоновская механика её частный случай и не на релятивистских скоростях объекты ведут себя очень интуитивно и понятно (как и бытовое суммирование), но чем ближе к скоростям света, тем больше появляется контр-интуитивных эффектов.

В общем, после ролика моя интуиция немного успокоилась и приняла соответствующие правила игры. Очень подробное объяснение с большим количеством примеров.
🔥16👍95💋3
Я довольно давно подписан на ютуб-канал "Космос просто", где уже много лет бессменный ведущий "Я Андрей" рассказывает про всё, что связано с космическими исследованиями, черпая информацию, в основном, из научных статей. Под одним из роликов я увидел комментарий, в котором девушка написала, что только что закончила смотреть ВСЕ ролики на канале, завершив тем самым марафон, который сама для себя придумала.

Я подумал: а, ведь, классная идея! Надо подобный марафон устроить с просмотром докладов на канале ODS (Open Data Science). Во-первых, можно будет проследить историю изменений в актуальности тем, в подходах к решению задач, в актуальности самих задач. Я считаю очень важным понимать исторический контекст, чтобы знать почему одни решения закрепились, а вторые теперь считаются антипаттернами. Во-вторых, обогатить свой кругозор, чтобы иметь более широкое представление об области, нежели из учебников и личных практических кейсов. А в-третьих, чтобы обратить внимание на детали, потому как общие концепции уже довольно неплохо мне знакомы.

В общем, как я сказал выше, идея мне показалась интересной и полезной и я начал смотреть ролики, начиная, аж, с 2016-го года! Как же сразу захотелось туда с сегодняшним опытом 🙂 Нормальные фреймворки только зарождаются, бизнес только-только нащупывает рабочие подходы, трансформеры и LLM ещё не захватили мир, для заслуживающих внимание результатов достаточно пары видеокарт...

Первые ролики почти все подряд про соревнования на Kaggle. Очень забавно наблюдать за тем, как кто-то пытался логически обосновать выбор моделей, конструировал свои фичи, читал актуальные статьи, чтобы найти самые продвинутые подходы... А в топе часто оказывался тот, кто решал задачу старым добрым брутфорсом, то есть перебором моделей, фич и гипер-параметров. Минимум времени на исследование задачи, просто выбор того, что интуитивно кажется должно сработать, предобработка данных для экспериментов и несколько дней (иногда недель) тупого перебора автоматическим универсальным скриптом, подходящим для всех соревнований 🙂

Сразу вспомнил, что в математических задачах тоже перебор довольно часто используется. Так, знаменитая, теорема о 4-х красках была доказана, по сути, перебором. А для некоторых задач достаточно подобрать хотя бы один пример, когда какое-то утверждение не выполняется, чтобы точно быть уверенным в ложности (ограниченности) этого утверждения.

Решил, что буду каждый день смотреть минимум по 2 видоса и наиболее интересные идеи конспектировать. К сожалению, такой темп выдерживать пока не получается и периодически наступают перерывы, но, тем не менее, постоянно возвращаюсь к реализации плана.

Так что марафон продолжается! Буду иногда делиться инсайтами!
👍40🔥198😱3💋1
Один из инсайтов, который явно вырисовывается в процессе просмотра докладов по ML и DS в рамках AI-марафона (и это базовая база) - не стоит спешить обучать и оценивать модели, пока вы основательно не поработали с данными. Хорошо проведённый EDA (исследовательский анализ данных) зачастую является залогом успеха на следующих этапах решения задачи.

Во-первых, может так оказаться, что для решения задачи даже ML не нужен, а есть уже хорошие, надёжные, дешёвые решения, которые вам подойдут, сэкономив кучу времени и человеко-ресурсов.

Во-вторых, можно сразу оптимизировать данные, выкинув, например, линейно-зависимые фичи.

В-третьих, можно явно увидеть фичи, которые имеют большую значимость, чем остальные и, значит, можно искусственно повысить их вес, часто существенно увеличивая скор, практически, любой модели.

В-четвёртых, разумеется, в процессе легко устранить всякий мусор в данных (выбросы, пропуски и т.п.). Тут, останавливаться не буду. Очевидное.

В-пятых, когда вы изучаете конкретные данные для конкретной задачи, вы автоматически начинаете лучше понимать предметную область, а значит, есть большая вероятность, что будете выдвигать и проверять более осмысленные гипотезы, опять же экономя человеко-часы.

Вот, прям, очень наглядно. Часто участники соревнований сначала закидывают данные как есть в кучу разных моделей, получают какие-то оценки, выбирают лучшие модели, а затем садятся за работу с данными и эта работа повышает метрики так, что условно сотые места на лидер-борде превращаются в десятые.

Марафон продолжается. Уже посмотрел 32 ролика. Это, навскидку, где-то 25 часов видео.
13💯11👍9🔥7💋1
Как попасть в среду, где "выращивают" фаундеров и продакт‑лидеров, а не просто выдают диплом?

Если проанализировать современные высокотехнологичные стартапы, то можно заметить, что их основатели и ключевые сотрудники так или иначе "светились" в экосистеме Бизнес‑школы МФТИ. Кто‑то пришёл туда из бакалавриата, кто‑то зашёл через мероприятия, кто‑то - через совместную магистратуру БШ МФТИ & Сбера "Запуск высокотехнологичных продуктов".

Это не удивительно, потому что эта магистратура не "для галочки". Здесь люди реально запускают пилоты и продукты: часть ребят уже успела выйти в ТОП‑100 лучших российских стартапов, некоторые ушли в продакты крупных компаний, ещё часть выросла до СРО (Chief Product Officer) в технологическом бизнесе. И очень позитивным подтверждением того, что программы востребованы является то, что вокруг БШ МФТИ за последние годы сформировалась полноценная экосистема - кейс-чемпионаты, проектные треки, акселерационные истории, нетворкинг и питчи. И всё это благодаря сильнейшим преподам МФТИ и технологической экспертизе Сбера. 

P.S. А со следующего года появятся ещё и курсы по прокачке навыков для практикующих предпринимателей. Круто!

Короче говоря, если вы:

• хотите влиять на то, что создаётся и зачем;
• думаете о своём стартапе, но боитесь не справиться без окружения и поддержки;
• целитесь в продуктовые/бизнес‑роли в крупном технологическом бизнесе,

То погружение в экосистему БШ МФТИ - это определённо ваша точка роста! Посмотреть формат, треки и истории выпускников можно здесь 👉 https://business.mipt.ru/masters

А дальше уже сами решайте, как глубоко вы готовы в это погрузиться!

erid:2Vtzqx6H2RQ ПАО "Сбербанк", ИНН 7707083893
💋63👍3🔥1
А только меня стали раздражать мусорные картинки в статьях, сгенерированные нейросетками? Казалось бы, иллюстрация должна ИЛЛЮСТРИРОВАТЬ что-то в статье, чтобы либо сделать текст понятнее, либо акцентировать внимание на каком-то важном аспекте, либо немного переключить читателя для удержания внимания. Но что сейчас? Конечно, каждый теперь сам себе иллюстратор и в голове наверняка представляет идеальные иллюстрации к каждому предложению своей статьи. Но когда пытается объяснить свои образы нейросети - получается как обычно. А потом, видимо, жалко картинку выкидывать, дай я её в статье оставлю.

У меня вопрос: зачем, а самое главное - на хера? Это просто бессмысленное отвлечение внимания, которое никак не помогает лучше погрузиться в контекст автора. Это как рекламные баннеры, которые если не режет какой-нибудь адблок, могут вызвать эпилепсию.

У меня в детстве была классная книжка с фокусами, которая, в основном, была проиллюстрирована абсолютно бессмысленными картинками, не относящимися к сути книги. Там я впервые увидел фрактал Мандельброта, например. Правда узнал о том, что это был он только спустя лет пятнадцать, наверное. Я искренне не понимал зачем все эти картинки. Чтобы что? Теперь понимаю, это же были 90-е и книги продавались хорошо. Надо было просто объём дать. Но, блин, сейчас-то это зачем в статьях?

Буду верить, что скоро все наиграются и это бессмысленное и беспощадное нейроиллюстрирование закончится.
💯41🤝5🤔31💋1
С Новым годом, друзья! 🌲

Под занавес уходящего года разговариваем с Лексом Кравецким об образовании в новом выпуске подкаста!

Извечный вопрос: что не так с образованием? Почему так сложно, когда можно намного проще? Большие языковые модели - это причина необходимости изменения подходов к образованию или лишь катализатор давно назревшей необходимости? Почему в школе учат тому, что легко проверить, а не тому, что было бы, действительно, полезно? Нужно ли начинать изучать программирование с абстракций низкого уровня? Нужно ли всем уметь программировать? Интерес - главный стимулятор образования в любой области, но как понять, что тебе, возможно, станет интересным, если пока совсем неинтересно? Учат ли в школах и ВУЗах учиться? А, может, в школах нужно перестать детям вдалбливать знания, а просто дать возможность играть в компьютерные игры сколько хочется? Почему при устройстве на работу больше смотрят на предыдущий опыт работы, чем на оценки в ВУЗе, но в ВУЗе студенты зарабатывают оценки, а не опыт? А нужно вообще получать диплом в современном мире?

https://mlpodcast.mave.digital/ep-77
🔥154👍2💋1
Audio
Лекс Кравецкий. Про образование. ИИ - это причина назревающих изменений или катализатор?
🔥10🤝21💋1
"Курс о том, как мыслит видеокарта, если бы она умела мыслить" (с)

Наткнулся на очень хороший курс, который во-первых, классно и понятно прочитан, а во-вторых, проясняет как происходят вычисления на видеокартах, давая полноценное архитектурное представление всех основных процессов на уровне железа.

Понравилась мысль, что понимание архитектуры позволяет избегать "неработающих" оптимизаций. Потому что если какая-то оптимизация не работает, то лучше её вообще убрать, потому что код станет проще, а соответственно, будет более поддерживаемый. И такого там полно. Очень ценные акценты.

https://www.youtube.com/playlist?list=PL5p-5hHpsHBoIL4WI6OaPdWpCTkr774zN
🔥1810👍6💋1
Небольшая рекомендация для тех, кто пишет технические статьи (например, для Хабра). Не пересказывайте документацию! Если я уже дорос до уровня, что мне комфортно разбираться с фичами какого-либо сервиса или какой-то библиотеки через чтение документации, то мне не будет никакой пользы от вашей статьи. А если документация мне ещё не под силу, то и ваша статья мне не поможет.

Я считаю, что статья должна решать следующие задачи:

1. Объяснять что-то более простым языком, чем язык документации, начиная с ответов на вопрос "Зачем?". И только во вторую очередь, когда понятно "зачем" статья должна отвечать на вопрос "Как?".

2. Рассказывать про личные интересные находки, которые не описаны в документации, но которые красиво решают какие-то задачи.

3. Показывать применение какого-то сервиса в реальном проекте, с описанием нюансов имплементации сервиса в проект. Причём, нюансы должны быть описаны подробно, чтобы читатели сразу могли получить представление о том, с чем они могут столкнуться, если воспользуются вашим опытом.

4. Рассказывать об ограничениях и ошибках. Не бывает идеальных инструментов и "серебряных пуль". Если вы где-то уткнулись в неочевидное поведение, словили странный баг, потратили вечер на выяснение, почему оно не работает так, как ожидается - это и есть главная ценность для будущей статьи. Документация почти никогда не говорит: "в реальности вам, скорее всего, будет больно вот здесь". А, ведь, именно такие моменты экономят читателю часы и дни.

5. Формировать мышление, а не только давать рецепт. Хорошая техническая статья учит не столько "делай как я", сколько "думай вот в этом направлении". Почему выбран именно такой подход? Какие были альтернативы? Почему они хуже именно в этом контексте? После такой статьи читатель может применить идею в другом проекте, с другими технологиями - и это лучший показатель полезности статьи.

Если коротко: документация - это справочник, а статья - это чужой опыт, пропущенный через боль, муки выбора и реальные ограничения. И если после вашей статьи читатель думает не "я это уже читал в доке", а "о, теперь я понимаю, когда и зачем это использовать" - значит, вы всё сделали правильно.
🔥19💯65👍5💋1
В одном из обсуждений увидел интересную идею, что в будущем можно было бы производить чипы, в которых веса самых-самых LLM сразу "выжжены" аппаратно, то есть, чтобы не нужно было бы их загружать из оперативной памяти. Тогда это дало бы, во-первых, уменьшение стоимости инференса, во-вторых, безопасность, потому что не пришлось бы отправлять свои данные сторонним вендорам, в-третьих, стимулировало бы экономику, потому что чипы бы устаревали и их стремились бы менять на более продвинутые, в-четвёртых, снизилась бы необходимость в огромных дата-центрах.

Причём, можно было бы расширить архитектуру компьютеров, чтобы была возможность вставить несколько чипов - один для лучшей модели общего назначения, второй - для лучшей модели для кодинга, третий - для генерации картинок и т.п. Апгрейд компа во многом сводился бы к покупке новых чипов с новыми моделями.

Ну, и сразу удобный интерфейс для LoRA, чтобы расширить возможности моделей в чипах.
🤔19🔥9👍3😱3💋1