Forwarded from gonzo-обзоры ML статей
Не могу не поделиться ссылкой на такой классный курс!
MIT 6.S192: Deep Learning for Art, Aesthetics, and Creativity
https://ali-design.github.io/deepcreativity
Лекции на ютубе:
https://www.youtube.com/watch?v=MABLFo7IV3I&list=PLCpMvp7ftsnIbNwRnQJbDNRqO6qiN3EyH
MIT 6.S192: Deep Learning for Art, Aesthetics, and Creativity
https://ali-design.github.io/deepcreativity
Лекции на ютубе:
https://www.youtube.com/watch?v=MABLFo7IV3I&list=PLCpMvp7ftsnIbNwRnQJbDNRqO6qiN3EyH
Forwarded from Базы данных & SQL
Как продавать шкуры и ловить троллей в Telegram с помощью Kafka, Kubernetes, PostgreSQL и Redis
Читать статью
Читать статью
Хабр
Как продавать шкуры и ловить троллей в Telegram с помощью Kafka, Kubernetes, PostgreSQL и Redis
С чего все началось Работаю в IT больше 15 лет. Чем только не занимался, но всегда следовал правилу - каждые майские праздники я пытаюсь применить на практике что-то новое. В этом году я прочитал...
Forwarded from Fless (Victor Rogulenko | fless.pro)
Вот те самые статьи о поведенческих интервью в FAANG, о которых недавно писал.
Даже если не знать регалий автора, по тексту видно, что он знает дело.
Статьи подойдут и для консалтинга, хотя фит в big3 проще бихейва в Амазон.
Ссылок куча, тк я выписал все бесплатные. Можете ещё подписаться на платные и поддержать Дейва, автора. Списались с ним в Дискорде - клёвый парень.
LEADERSHIP POSTS
https://www.scarletink.com/interviewing-at-amazon-leadership-principles/
https://www.scarletink.com/yet-more-painful-mistakes-which-were-key-to-my-career-success/
https://www.scarletink.com/enjoying-my-break-briefly-saying-hello/
https://www.scarletink.com/how-to-pass-amazon-behavioral-leadership-principles-interview/
https://www.scarletink.com/disagree-and-commit-getting-things-done/
https://www.scarletink.com/amazon-writing-exercise-nailing-the-interview/
https://www.scarletink.com/5-whys-method-analyze-root-cause/
https://www.scarletink.com/your-system-is-not-perfect-balancing-operational-investments/
https://www.scarletink.com/customer-obsession-and-anecdotes/
https://www.scarletink.com/increase-productivity-by-slowing-growth/
https://www.scarletink.com/are-right-a-lot-amazon-leadership-principle/
https://www.scarletink.com/basics-why-meritocracy-does-not-exist/
https://www.scarletink.com/skip-level-meetings-think-broader-look-further/
https://www.scarletink.com/self-driven-career-grow-without-an-awesome-manager/
https://www.scarletink.com/why-amazon-is-innovative-roadmap-before-resources/
https://www.scarletink.com/why-stereotypes-arent-always-bad-managing-with-patterns/
https://www.scarletink.com/embrace-uncomfortable-behaviors-boost-value/
https://www.scarletink.com/everything-you-need-to-know-one-on-one-meetings/
https://www.scarletink.com/opinion-companies-should-eliminate-bias/
https://www.scarletink.com/how-to-write-linkedin-profile-why-it-matters/
https://www.scarletink.com/what-to-expect-amazon-interview-process/
https://www.scarletink.com/human-leadership-principles-respecting-humans/
https://www.scarletink.com/why-good-enough-is-better-than-perfect/
https://www.scarletink.com/how-to-pass-the-amazon-technical-interview/
https://www.scarletink.com/outcomes-dont-matter-building-mechanisms-leader/
https://www.scarletink.com/6-actions-manager-takes-support-team-members/
https://www.scarletink.com/recognizing-excellence-in-others/
https://www.scarletink.com/interview-mistake-3-neglecting-context-interviewer/
https://www.scarletink.com/why-its-better-say-no/
https://www.scarletink.com/9-simple-actions-build-culture-empathy/
https://www.scarletink.com/forge-stronger-relationship-with-manager/
https://www.scarletink.com/simple-explanation-why-your-manager-is-mediocre/
https://www.scarletink.com/how-amazon-bar-raiser-process-works/
https://www.scarletink.com/interview-mistake-2-speaking-poorly-about-your-previous-co-workers/
https://www.scarletink.com/hoax-you-can-win-relationship/
https://www.scarletink.com/interview-mistake-1-running-your-mouth/
https://www.scarletink.com/filling-your-headcount-hiring-at-amazon/
https://www.scarletink.com/to-become-a-leader-act-like-one/
https://www.scarletink.com/failure-is-critical-to-success-and-growth/
https://www.scarletink.com/as-a-leader-time-is-your-most-valuable-resource/
https://www.scarletink.com/technical-skills-are-overrated-focus-on-your-attitude/
https://www.scarletink.com/finding-your-ideal-boss/
https://www.scarletink.com/leading-vs-winning/
https://www.scarletink.com/answer-the-unasked-questions/
https://www.scarletink.com/them-and-how-theyre-always-screwing-up/
Даже если не знать регалий автора, по тексту видно, что он знает дело.
Статьи подойдут и для консалтинга, хотя фит в big3 проще бихейва в Амазон.
Ссылок куча, тк я выписал все бесплатные. Можете ещё подписаться на платные и поддержать Дейва, автора. Списались с ним в Дискорде - клёвый парень.
LEADERSHIP POSTS
https://www.scarletink.com/interviewing-at-amazon-leadership-principles/
https://www.scarletink.com/yet-more-painful-mistakes-which-were-key-to-my-career-success/
https://www.scarletink.com/enjoying-my-break-briefly-saying-hello/
https://www.scarletink.com/how-to-pass-amazon-behavioral-leadership-principles-interview/
https://www.scarletink.com/disagree-and-commit-getting-things-done/
https://www.scarletink.com/amazon-writing-exercise-nailing-the-interview/
https://www.scarletink.com/5-whys-method-analyze-root-cause/
https://www.scarletink.com/your-system-is-not-perfect-balancing-operational-investments/
https://www.scarletink.com/customer-obsession-and-anecdotes/
https://www.scarletink.com/increase-productivity-by-slowing-growth/
https://www.scarletink.com/are-right-a-lot-amazon-leadership-principle/
https://www.scarletink.com/basics-why-meritocracy-does-not-exist/
https://www.scarletink.com/skip-level-meetings-think-broader-look-further/
https://www.scarletink.com/self-driven-career-grow-without-an-awesome-manager/
https://www.scarletink.com/why-amazon-is-innovative-roadmap-before-resources/
https://www.scarletink.com/why-stereotypes-arent-always-bad-managing-with-patterns/
https://www.scarletink.com/embrace-uncomfortable-behaviors-boost-value/
https://www.scarletink.com/everything-you-need-to-know-one-on-one-meetings/
https://www.scarletink.com/opinion-companies-should-eliminate-bias/
https://www.scarletink.com/how-to-write-linkedin-profile-why-it-matters/
https://www.scarletink.com/what-to-expect-amazon-interview-process/
https://www.scarletink.com/human-leadership-principles-respecting-humans/
https://www.scarletink.com/why-good-enough-is-better-than-perfect/
https://www.scarletink.com/how-to-pass-the-amazon-technical-interview/
https://www.scarletink.com/outcomes-dont-matter-building-mechanisms-leader/
https://www.scarletink.com/6-actions-manager-takes-support-team-members/
https://www.scarletink.com/recognizing-excellence-in-others/
https://www.scarletink.com/interview-mistake-3-neglecting-context-interviewer/
https://www.scarletink.com/why-its-better-say-no/
https://www.scarletink.com/9-simple-actions-build-culture-empathy/
https://www.scarletink.com/forge-stronger-relationship-with-manager/
https://www.scarletink.com/simple-explanation-why-your-manager-is-mediocre/
https://www.scarletink.com/how-amazon-bar-raiser-process-works/
https://www.scarletink.com/interview-mistake-2-speaking-poorly-about-your-previous-co-workers/
https://www.scarletink.com/hoax-you-can-win-relationship/
https://www.scarletink.com/interview-mistake-1-running-your-mouth/
https://www.scarletink.com/filling-your-headcount-hiring-at-amazon/
https://www.scarletink.com/to-become-a-leader-act-like-one/
https://www.scarletink.com/failure-is-critical-to-success-and-growth/
https://www.scarletink.com/as-a-leader-time-is-your-most-valuable-resource/
https://www.scarletink.com/technical-skills-are-overrated-focus-on-your-attitude/
https://www.scarletink.com/finding-your-ideal-boss/
https://www.scarletink.com/leading-vs-winning/
https://www.scarletink.com/answer-the-unasked-questions/
https://www.scarletink.com/them-and-how-theyre-always-screwing-up/
Scarletink
The Amazon Leadership Principles - A Complete Interview Guide
A summary on how to pass the Amazon leadership principles behavioral interviews, and get a job at Amazon.
Forwarded from Поступашки - ШАД, Стажировки и Магистратура
#How_to_заботать
How to заботать собес в Тиньку на аналитика?
Гут Шабес. Выражаю огромную благодарность, кто продолжает отправлять контесты: спасибо, что делаете прогнившую корпоративную культуру хоть чуточку ярче🥰🥰
Тем временем уже стартуют первые собесы на стажёров от Тинькофф Старт. Вспоминаем, как готовиться на проадкт-аналтика (+материалы). Времени не так много, поэтому в честь праздника подгон по каждому акту АВ теста, чтобы получить хоть какое-то представление об этой науке.
Если кратенько, то процесс АБ теста следующий: есть новое предложение, как улучшить метрики и его нужно протестить; берём репрезентативную выборку из генеральной совокупности, разбиваем ее на тест и контроль: на тест воздействуем, на контроль нет. Смотрим на получившиеся метрики, выбираем тест, чтобы проверить стат значимость и затем делаем вывод можем ли мы выкатывать фичу (в совковых учебниках пишут, что если нет стат значимости, то отвергаем альтернативу, но на практике обычно все посложнее).
Начнем с конца:
1. Какой тест выбрать для проверки двух гипотез? Если у нас уже есть разбитая выборка на тест и контроль (А и Б)
{https://youtu.be/oa8j8TOndpE
https://youtu.be/YuC1ZZTqdBA
https://vkteam.medium.com/practitioners-guide-to-statistical-tests-ed2d580ef04f
https://www.youtube.com/watch?v=-zps6hm0nX8&t=190s}
2. Как разбить репрезентативную выборку на тест и контроль (А и Б)?
{https://habr.com/ru/company/avito/blog/571096/}
3. Как определить какой размер репрезентативной выборки нам нужен? Которую мы затем разбиваем
{https://www.youtube.com/watch?v=2nP_gcut7SU}
4. Как из всей генеральной совокупности взять репрезентативную выборку (чтобы ее можно было экстраполировать на всю генеральную совокупность)? И вообще как обрабатывать данные перед тестом
{https://habr.com/ru/company/avito/blog/571094/
https://habr.com/ru/company/avito/blog/571096/
https://habr.com/ru/company/uchi_ru/blog/500918/}
Делимся замечаниями и материалами в комментах. Тетрадки лежат там же😎😎
How to заботать собес в Тиньку на аналитика?
Гут Шабес. Выражаю огромную благодарность, кто продолжает отправлять контесты: спасибо, что делаете прогнившую корпоративную культуру хоть чуточку ярче🥰🥰
Тем временем уже стартуют первые собесы на стажёров от Тинькофф Старт. Вспоминаем, как готовиться на проадкт-аналтика (+материалы). Времени не так много, поэтому в честь праздника подгон по каждому акту АВ теста, чтобы получить хоть какое-то представление об этой науке.
Если кратенько, то процесс АБ теста следующий: есть новое предложение, как улучшить метрики и его нужно протестить; берём репрезентативную выборку из генеральной совокупности, разбиваем ее на тест и контроль: на тест воздействуем, на контроль нет. Смотрим на получившиеся метрики, выбираем тест, чтобы проверить стат значимость и затем делаем вывод можем ли мы выкатывать фичу (в совковых учебниках пишут, что если нет стат значимости, то отвергаем альтернативу, но на практике обычно все посложнее).
Начнем с конца:
1. Какой тест выбрать для проверки двух гипотез? Если у нас уже есть разбитая выборка на тест и контроль (А и Б)
{https://youtu.be/oa8j8TOndpE
https://youtu.be/YuC1ZZTqdBA
https://vkteam.medium.com/practitioners-guide-to-statistical-tests-ed2d580ef04f
https://www.youtube.com/watch?v=-zps6hm0nX8&t=190s}
2. Как разбить репрезентативную выборку на тест и контроль (А и Б)?
{https://habr.com/ru/company/avito/blog/571096/}
3. Как определить какой размер репрезентативной выборки нам нужен? Которую мы затем разбиваем
{https://www.youtube.com/watch?v=2nP_gcut7SU}
4. Как из всей генеральной совокупности взять репрезентативную выборку (чтобы ее можно было экстраполировать на всю генеральную совокупность)? И вообще как обрабатывать данные перед тестом
{https://habr.com/ru/company/avito/blog/571094/
https://habr.com/ru/company/avito/blog/571096/
https://habr.com/ru/company/uchi_ru/blog/500918/}
Делимся замечаниями и материалами в комментах. Тетрадки лежат там же😎😎
Forwarded from Поступашки - ШАД, Стажировки и Магистратура
Forwarded from Поступашки - ШАД, Стажировки и Магистратура
#How_to_заботать
How to заботать собеседование на jun product-аналитика?
Уже не для кого не секрет, что из-за весны 2020 (пандемия) и 24-го февраля отечественные компании остро ощущают нехватку кадров. Джунов набирают тупо с улицы, а на Teamlead позицию ставят без внятного опыта работы. Такая "коррекция кадров" привела к тому, что стажер в другом финтехе спокойно залетает на Middle😳😳 В общем лучшего времени, чтобы начать карьеру может и не быть, а наименее требовательная по background область: конечно же product-аналитика. Отличный вариант для тех, у кого не срослись отношения с "программированием", но способны сложить 2 + 2. И недурное начало пути, если интересно попробовать себя в будущем как Data Scientist или Quantitative researcher🤓🤓. Могу заверить, что если ваша мама не употребляла алкоголь во время беременности, то у вас все получится, а подборка следующих материалов вам в этом поможет😎😎
Все книжки в комментариях, там же делимся любимыми материалами.
SQL
В принципе только это и стоит спрашивать джунов, ибо, похоже, ничем более они и не занимаются..
1. Интерактивный tutorial.
Кратенько ознакомитесь с возможностями sql и поймете о чем это вообще
2. Тренажер на stepik.
Хорошее продолжение, но дальше второго модуля точно не стоит смотреть. Также можете пропустить создания, удаление таблиц и прочее-прочее, спрашивать такое не будут, а при нужде загляните в документацию.
3. SQL ex
Куча упражнений с теорией, есть даже оконки
4. Документация PostgreSQL
Скорее всего, он и будет
5. Статьи про оконные функции
Джунов особо не спрашивают, скорее тема middle+, да и те на деле ими разве что строки нумеруют.
Статья_1 и Статья_2
Математическая Статистика
1. Курсы Карпова на stepik
Все на пальцах, но другого с вас на собесе и не спросят
Часть1, Часть2, Часть3
2. StatQuest
Дополнение к Карпову
3. "Практическая статистика для специалистов Data Science" Питер и Эндрю Брюс.
Недурно раскрыты важнейшие статистические понятия на куче примеров
4. "Теория вероятностей и математическая статистика" Л. Н. Фадеева, А. В. Лебедев.
Стандартный курс математической статистики для экономистов дополнит представления, полученные выше, в терминах теории вероятностей.
5. AB-тесты
Главное, что спросят на собесе. Смотрите How to заботать AB тесты
Cтатистика на python
1. Tutorial по python
Знакомит со всеми основными возможностями языка, нужными в работе. Если видите в первый раз, то там же можно и порешать задачки.
2. Numpy, Pandas, Matplotlib
1) Cтавим Jupyter Notebook
Вообще дедовский метод: освоить это все в процессе курса по статистическому практикум, скачать какой Data set с Kaggle и дрочить его, читая документацию. Но если очень охото можете посмотреть tutorialы для дебилов
1) Если знаем english, то смотрим freecodecamp:
https://www.youtube.com/watch?v=QUT1VHiLmmI&t=162.. – Numpy
https://www.youtube.com/watch?v=3Xc3CA655Y4&t=16s.. –Matplotlib
https://www.youtube.com/watch?v=vmEHCJofslg&t=151.. – Pandas
В целом канал очень крутой, куча всего классного по проге и мл.
2) Курс Хирьянова по анализу данных в МГУ (лекции 7,8,9,10, ноутбуки с кодом прилагаются на сосайте).
3. Курс по статистическому практикуму (notebook zip в комментах)
Много всего интересного: от библиотек до регрессий. Самое важно для собеса: научиться проверять гипотезы на независимых и парных выборках.
Продуктовое понимание
Здесь спрашивают представляете ли вы вообще, чем придется заниматься и как используется все вышеперечисленное.
1. Курс Тинькофф по аналитике
Темы разобраны поверхностно, но кратенько обобщит и структурирует все изученное на продуктовых примерах (notebook zip в комментах)
2. Наш файлик с основными метриками
3. ШМЯ
Здесь смотрим не раскрытые темы, смотреть полностью будет too mach
How to заботать собеседование на jun product-аналитика?
Уже не для кого не секрет, что из-за весны 2020 (пандемия) и 24-го февраля отечественные компании остро ощущают нехватку кадров. Джунов набирают тупо с улицы, а на Teamlead позицию ставят без внятного опыта работы. Такая "коррекция кадров" привела к тому, что стажер в другом финтехе спокойно залетает на Middle😳😳 В общем лучшего времени, чтобы начать карьеру может и не быть, а наименее требовательная по background область: конечно же product-аналитика. Отличный вариант для тех, у кого не срослись отношения с "программированием", но способны сложить 2 + 2. И недурное начало пути, если интересно попробовать себя в будущем как Data Scientist или Quantitative researcher🤓🤓. Могу заверить, что если ваша мама не употребляла алкоголь во время беременности, то у вас все получится, а подборка следующих материалов вам в этом поможет😎😎
Все книжки в комментариях, там же делимся любимыми материалами.
SQL
В принципе только это и стоит спрашивать джунов, ибо, похоже, ничем более они и не занимаются..
1. Интерактивный tutorial.
Кратенько ознакомитесь с возможностями sql и поймете о чем это вообще
2. Тренажер на stepik.
Хорошее продолжение, но дальше второго модуля точно не стоит смотреть. Также можете пропустить создания, удаление таблиц и прочее-прочее, спрашивать такое не будут, а при нужде загляните в документацию.
3. SQL ex
Куча упражнений с теорией, есть даже оконки
4. Документация PostgreSQL
Скорее всего, он и будет
5. Статьи про оконные функции
Джунов особо не спрашивают, скорее тема middle+, да и те на деле ими разве что строки нумеруют.
Статья_1 и Статья_2
Математическая Статистика
1. Курсы Карпова на stepik
Все на пальцах, но другого с вас на собесе и не спросят
Часть1, Часть2, Часть3
2. StatQuest
Дополнение к Карпову
3. "Практическая статистика для специалистов Data Science" Питер и Эндрю Брюс.
Недурно раскрыты важнейшие статистические понятия на куче примеров
4. "Теория вероятностей и математическая статистика" Л. Н. Фадеева, А. В. Лебедев.
Стандартный курс математической статистики для экономистов дополнит представления, полученные выше, в терминах теории вероятностей.
5. AB-тесты
Главное, что спросят на собесе. Смотрите How to заботать AB тесты
Cтатистика на python
1. Tutorial по python
Знакомит со всеми основными возможностями языка, нужными в работе. Если видите в первый раз, то там же можно и порешать задачки.
2. Numpy, Pandas, Matplotlib
1) Cтавим Jupyter Notebook
Вообще дедовский метод: освоить это все в процессе курса по статистическому практикум, скачать какой Data set с Kaggle и дрочить его, читая документацию. Но если очень охото можете посмотреть tutorialы для дебилов
1) Если знаем english, то смотрим freecodecamp:
https://www.youtube.com/watch?v=QUT1VHiLmmI&t=162.. – Numpy
https://www.youtube.com/watch?v=3Xc3CA655Y4&t=16s.. –Matplotlib
https://www.youtube.com/watch?v=vmEHCJofslg&t=151.. – Pandas
В целом канал очень крутой, куча всего классного по проге и мл.
2) Курс Хирьянова по анализу данных в МГУ (лекции 7,8,9,10, ноутбуки с кодом прилагаются на сосайте).
3. Курс по статистическому практикуму (notebook zip в комментах)
Много всего интересного: от библиотек до регрессий. Самое важно для собеса: научиться проверять гипотезы на независимых и парных выборках.
Продуктовое понимание
Здесь спрашивают представляете ли вы вообще, чем придется заниматься и как используется все вышеперечисленное.
1. Курс Тинькофф по аналитике
Темы разобраны поверхностно, но кратенько обобщит и структурирует все изученное на продуктовых примерах (notebook zip в комментах)
2. Наш файлик с основными метриками
3. ШМЯ
Здесь смотрим не раскрытые темы, смотреть полностью будет too mach
Forwarded from Vladimir P
Может слишком академично, но 2х томник Грина, как на английском, так и в переводе, например
https://www.litres.ru/uilyam-g-grin/ekonometricheskiy-analiz-kniga-1-42912528/
https://www.litres.ru/uilyam-g-grin/ekonometricheskiy-analiz-kniga-1-42912528/
Forwarded from gonzo-обзоры ML статей
Generative AI
Последние месяцы на поляне Generative AI праздник за праздником.
Начнём с генерации картинок.
Пока OpenAI со своим DALLE-2 медленно распиаривался, под боком возник быстрорастущий офигенный сервис Midjourney, забивший на сайт, API и всё такое, и предоставивший доступ к своим моделям через бота в Discord. Midjourney очень правильно начал работать с коммьюнити, набрал популярность и вышел в законодатели мод на этом рынке.
В отличие от OpenAI, Midjourney не требовал исключительных прав на все творения, оставляя все права пользователю и беря себе лицензию на их использование. Midjourney также разрешил коммерческое использование творений. У них есть пара оговорок касающихся бесплатного плана, а также компаний с выручкой больше $1M, но это всё очень reasonable. Оно у них, конечно, менялось и уточнялось по ходу дела, но явно было более либерально в отличие от terms OpenAI, где всё их, только private use, и всё такое.
И это кстати отдельный интересный вопрос этического плана — нормально ли, что система, обученная на результатах труда множества людей, присваивает весь производный результат себе, включая кстати и труд других людей по придумыванию правильных prompt'ов и селекции результатов. Где тот современный Маркс, который напишет Капитал 2.0?
Midjourney на днях вышел из закрытой беты в открытую https://www.facebook.com/intentoco/photos/a.1093842744008324/5486357671423454/) и OpenAI вынужден был последовать той же дорогой -- сразу прекратили играть в тщательно фильтруемые инвайты и тоже вышли в public beta, а также изменили terms на более коммерчески пригодные (https://www.facebook.com/intentoco/photos/a.1093842744008324/5493404720718749/).
Если бы не Midjourney, уверен, OpenAI бы ещё полгода свою илитность эксплуатировали. Конкуренция -- это прекрасно. И это только начало.
Также из области генерации картинок недавно широко разошлась новость (https://www.facebook.com/story.php?story_fbid=pfbid035HKtaMKL9ibTW2BH66cMecbCvj7RCXusf7w5yGkFP9xVHpg64Y4BcYCmv4Ea7x7Fl&id=4) про мартовскую работу Make-A-Scene (https://arxiv.org/abs/2203.13131), где при генерации картинки дополнительно к тексту можно давать эскиз с семантической маской. Это позволяет точно контролировать где на картинке что должно быть. В каком-то смысле это продолжение истории с аналогичным графическим редактором от Nvidia.
В генерации текстов тоже большое достижение -- опубликована модель BLOOM (https://www.facebook.com/intentoco/posts/pfbid02TEHE1sQYf78pXu9ZWEXcbfJ1DfZKQrCVSnB5PFEntSSQRFJW98CCSevGegWYCib2l) проекта BigScience и HuggingFace. Модель полностью открытая, на 176B параметров, мультиязычная с поддержкой 46 человеческих и 13 программистских языков.
Кстати, OpenAI Codex вроде ещё в private beta, инвайты как-то продолжают раздавать, мне даже с месяц назад прислали. Но зато можно попробовать построенный на нём GitHub Copilot (https://github.com/features/copilot/). А также в июне вышел Amazon CodeWhisperer (https://aws.amazon.com/blogs/machine-learning/introducing-amazon-codewhisperer-the-ml-powered-coding-companion/). Интересно, насколько BLOOM здесь будет хорош.
По части мультиязычности большое достижение — это публикация модели NLLB-200, способной переводить напрямую между 200 языками (https://www.facebook.com/intentoco/photos/a.1093842744008324/5452925358100019/).
Также сравнительно недавно Яндекс выпустил в опенсорс свою YaLM на 100B параметров (https://www.facebook.com/intentoco/posts/pfbid02MNduVaBTRv2ZnBgjEiWyuSst7zFnpRbXxcDXQ5oKWENtFmNdvvx8JFkshwgxgmEul), на тот момент самую большую опенсорсную GPT-like модель.
А ещё до этого Гугл выложил в опенсорс (https://www.facebook.com/intentoco/photos/a.1093842744008324/5409287722463783/) свой Switch Transformer на 1.6T параметров (https://news.1rj.ru/str/gonzo_ML/472).
В общем, поляна расцветает буйным цветом. Bessemer Venture Partners недавно опубликовали хороший пост про то, что generative AI — это новая платформенная революция (https://www.bvp.com/atlas/is-ai-generation-the-next-platform-shift).
Последние месяцы на поляне Generative AI праздник за праздником.
Начнём с генерации картинок.
Пока OpenAI со своим DALLE-2 медленно распиаривался, под боком возник быстрорастущий офигенный сервис Midjourney, забивший на сайт, API и всё такое, и предоставивший доступ к своим моделям через бота в Discord. Midjourney очень правильно начал работать с коммьюнити, набрал популярность и вышел в законодатели мод на этом рынке.
В отличие от OpenAI, Midjourney не требовал исключительных прав на все творения, оставляя все права пользователю и беря себе лицензию на их использование. Midjourney также разрешил коммерческое использование творений. У них есть пара оговорок касающихся бесплатного плана, а также компаний с выручкой больше $1M, но это всё очень reasonable. Оно у них, конечно, менялось и уточнялось по ходу дела, но явно было более либерально в отличие от terms OpenAI, где всё их, только private use, и всё такое.
И это кстати отдельный интересный вопрос этического плана — нормально ли, что система, обученная на результатах труда множества людей, присваивает весь производный результат себе, включая кстати и труд других людей по придумыванию правильных prompt'ов и селекции результатов. Где тот современный Маркс, который напишет Капитал 2.0?
Midjourney на днях вышел из закрытой беты в открытую https://www.facebook.com/intentoco/photos/a.1093842744008324/5486357671423454/) и OpenAI вынужден был последовать той же дорогой -- сразу прекратили играть в тщательно фильтруемые инвайты и тоже вышли в public beta, а также изменили terms на более коммерчески пригодные (https://www.facebook.com/intentoco/photos/a.1093842744008324/5493404720718749/).
Если бы не Midjourney, уверен, OpenAI бы ещё полгода свою илитность эксплуатировали. Конкуренция -- это прекрасно. И это только начало.
Также из области генерации картинок недавно широко разошлась новость (https://www.facebook.com/story.php?story_fbid=pfbid035HKtaMKL9ibTW2BH66cMecbCvj7RCXusf7w5yGkFP9xVHpg64Y4BcYCmv4Ea7x7Fl&id=4) про мартовскую работу Make-A-Scene (https://arxiv.org/abs/2203.13131), где при генерации картинки дополнительно к тексту можно давать эскиз с семантической маской. Это позволяет точно контролировать где на картинке что должно быть. В каком-то смысле это продолжение истории с аналогичным графическим редактором от Nvidia.
В генерации текстов тоже большое достижение -- опубликована модель BLOOM (https://www.facebook.com/intentoco/posts/pfbid02TEHE1sQYf78pXu9ZWEXcbfJ1DfZKQrCVSnB5PFEntSSQRFJW98CCSevGegWYCib2l) проекта BigScience и HuggingFace. Модель полностью открытая, на 176B параметров, мультиязычная с поддержкой 46 человеческих и 13 программистских языков.
Кстати, OpenAI Codex вроде ещё в private beta, инвайты как-то продолжают раздавать, мне даже с месяц назад прислали. Но зато можно попробовать построенный на нём GitHub Copilot (https://github.com/features/copilot/). А также в июне вышел Amazon CodeWhisperer (https://aws.amazon.com/blogs/machine-learning/introducing-amazon-codewhisperer-the-ml-powered-coding-companion/). Интересно, насколько BLOOM здесь будет хорош.
По части мультиязычности большое достижение — это публикация модели NLLB-200, способной переводить напрямую между 200 языками (https://www.facebook.com/intentoco/photos/a.1093842744008324/5452925358100019/).
Также сравнительно недавно Яндекс выпустил в опенсорс свою YaLM на 100B параметров (https://www.facebook.com/intentoco/posts/pfbid02MNduVaBTRv2ZnBgjEiWyuSst7zFnpRbXxcDXQ5oKWENtFmNdvvx8JFkshwgxgmEul), на тот момент самую большую опенсорсную GPT-like модель.
А ещё до этого Гугл выложил в опенсорс (https://www.facebook.com/intentoco/photos/a.1093842744008324/5409287722463783/) свой Switch Transformer на 1.6T параметров (https://news.1rj.ru/str/gonzo_ML/472).
В общем, поляна расцветает буйным цветом. Bessemer Venture Partners недавно опубликовали хороший пост про то, что generative AI — это новая платформенная революция (https://www.bvp.com/atlas/is-ai-generation-the-next-platform-shift).
Facebook
Log in or sign up to view
See posts, photos and more on Facebook.
Forwarded from Пристанище Дата Сайентиста
Наткнулся на небольшой набор задачек по программированию под CUDA.
Задачки представляет собой попытку научить начинающих программировать GPU полностью интерактивным способом.
В упражнениях используется NUMBA, которая работает с ядрами CUDA и в основном идентичен написанию низкоуровневого кода CUDA.
Думаю, что за несколько часов вы сможете перейти от основ к пониманию реальных алгоритмов, на которых сегодня основано 99% глубокого обучения.
Ссылка на github: https://github.com/srush/GPU-Puzzles
Задачки представляет собой попытку научить начинающих программировать GPU полностью интерактивным способом.
В упражнениях используется NUMBA, которая работает с ядрами CUDA и в основном идентичен написанию низкоуровневого кода CUDA.
Думаю, что за несколько часов вы сможете перейти от основ к пониманию реальных алгоритмов, на которых сегодня основано 99% глубокого обучения.
Ссылка на github: https://github.com/srush/GPU-Puzzles
GitHub
GitHub - srush/GPU-Puzzles: Solve puzzles. Learn CUDA.
Solve puzzles. Learn CUDA. Contribute to srush/GPU-Puzzles development by creating an account on GitHub.