#python #chatgpt #weakai
Я старался не поддаваться хайпу и не обращать особо внимания на ChatGPT, но не вышло. Да, она не умеет считать и выдаёт порой странные факты. Но посмотрите только, что она творит в кодинге! Всё началось с задачи оптимизации поиска хэша в большом файле отсюда. Не знаю, сколько времени потратил автор на код в статье, день или несколько часов, но я "смог" воспроизвести и превзойти его результаты буквально за минуты с помощью этой нейросети. Если это не слабый ИИ, тогда что это? Пока это неидеально, конечно, и нужно задавать наводящие вопросы, а то и исправлять ошибки. Но это уже может ускорить работу программиста на порядок. А что будет через год?!
Я старался не поддаваться хайпу и не обращать особо внимания на ChatGPT, но не вышло. Да, она не умеет считать и выдаёт порой странные факты. Но посмотрите только, что она творит в кодинге! Всё началось с задачи оптимизации поиска хэша в большом файле отсюда. Не знаю, сколько времени потратил автор на код в статье, день или несколько часов, но я "смог" воспроизвести и превзойти его результаты буквально за минуты с помощью этой нейросети. Если это не слабый ИИ, тогда что это? Пока это неидеально, конечно, и нужно задавать наводящие вопросы, а то и исправлять ошибки. Но это уже может ускорить работу программиста на порядок. А что будет через год?!
🔥3😱1
Forwarded from Техножрица 👩💻👩🏫👩🔧
Очень рекомендую посмотреть обзорный доклад "10 лет новой эпохи машинного обучения" с прошедшего YaTalks. Докладчик подсвечивает ключевые моменты из истории развития ML и нейросетей за последние десять лет и делится своими мыслями на тему того, что будет дальше.
Доклад даёт хороший контекст и будет понятен в том числе и тем, кто не занимается ML профессионально.
https://youtu.be/ikhPeK33zCw?t=13782
Доклад даёт хороший контекст и будет понятен в том числе и тем, кто не занимается ML профессионально.
https://youtu.be/ikhPeK33zCw?t=13782
YouTube
YaTalks 2022. Lifestyle: Career and Development
Вызовы, с которыми мы сталкиваемся сегодня, часто не имеют отношения к технологиям. Они требуют другого опыта — прежде всего, жизненного. Профессиональные связи обрели новую ценность, а сообщество стало ещё более значимым.
Вместе со спикерами трека про жизнь…
Вместе со спикерами трека про жизнь…
👍2
Глубокие мысли, надо подумать, как AV действительно лучше встроить в FE на практике. Типа, нет test, чтобы применить AV? Создай его! )
Forwarded from Small Data Science for Russian Adventurers
#приёмы
В старом посте я описывал приём AV: решение задачи разделения обучения и теста позволяет понять
1) какие признаки стабильны,
2) как отобрать обучающую подвыборку максимально похожую на тест.
Из того, что я тогда не сказал, но это полезно:
1) логично встроить AV в процедуру отбора признаков (чтобы отбиралось не просто подпространство с высоким качеством решения, но и стабильное),
2) когда нет теста (а его на практике часто и нет) можно разбить объекты по времени (странно, но при решении прикладных задач это делают очень редко),
3) из нестабильных признаков часто получаются хорошие стабильные, причём с помощью простых приёмов (например, доход клиента делим на медианных доход в этом месяце). Поэтому AV можно встроить и в генератор признаков;)
В старом посте я описывал приём AV: решение задачи разделения обучения и теста позволяет понять
1) какие признаки стабильны,
2) как отобрать обучающую подвыборку максимально похожую на тест.
Из того, что я тогда не сказал, но это полезно:
1) логично встроить AV в процедуру отбора признаков (чтобы отбиралось не просто подпространство с высоким качеством решения, но и стабильное),
2) когда нет теста (а его на практике часто и нет) можно разбить объекты по времени (странно, но при решении прикладных задач это делают очень редко),
3) из нестабильных признаков часто получаются хорошие стабильные, причём с помощью простых приёмов (например, доход клиента делим на медианных доход в этом месяце). Поэтому AV можно встроить и в генератор признаков;)
❤1
Forwarded from Пресидский залив (Nadia ズエバ)
⚡️ open close openai расщедрились и релизнули свой трансформер для voice tech задач в opensource!
Основное — это конечно английский asr, но также и много другого, например any-to-english translation. Тут нет явного рокетсаенса, но зато есть веса, обученные на огромном датасете, которые можно скачать прямо сейчас, что как мне кажется еще лучше 😎
Почему это круто?
На мой взгляд самая интересная часть это энкодер, который можно вытащить из пайплайна и использовать как устойчивый к различным трудным данным feature extractor. Разработчики говорят, что учили модель на почти 700k данных, среди которых были очень разные примеры — и с акцентами, и с шумами, и просто музыка. Отдельная боль в ASR — это когда из бекграунд музыки распознаются рандомные словаиногда нехорошие 🙃 то есть можно дофайнтюнить энкодер, а дальше поставить что угодно — от классификатора до voice conversion.
Полная модель с декодером тоже очень интересна — особенно, если вы не делаете бенчмарк на LibriSpeech, а работаете с клиентскими данными, которые часто содержат большое число шумов, акцентов, или даже пение и музыку (откройте демку, там будет k-pop🕺🏻). Сказано, что на таких данных модель по качеству лучше на 50% — как именно подсчитали эту цифру, правда, я не нашла 💁🏻♀️
В репозитории есть несколько конфигураций модели, как это было с GPT-семейством, от tiny c 39M до large c 1550M параметров, которая вполне может подойти для дистилляцииили kaggle-соревнований.
Кроме того, судя по демо, Whisper сразу делает расстановку знаков препинания. Base (вторая по величине модель) весит всего 140 мб, так что если убрать все ненужные части (или даже декодер), останется очень приятный размер, который вполне можно использовать на разного рода девайсах. Круто, желаю openai больше таких прикладных проектов 🌚
Подробнее читать тут
#tech
Основное — это конечно английский asr, но также и много другого, например any-to-english translation. Тут нет явного рокетсаенса, но зато есть веса, обученные на огромном датасете, которые можно скачать прямо сейчас, что как мне кажется еще лучше 😎
Почему это круто?
На мой взгляд самая интересная часть это энкодер, который можно вытащить из пайплайна и использовать как устойчивый к различным трудным данным feature extractor. Разработчики говорят, что учили модель на почти 700k данных, среди которых были очень разные примеры — и с акцентами, и с шумами, и просто музыка. Отдельная боль в ASR — это когда из бекграунд музыки распознаются рандомные слова
Полная модель с декодером тоже очень интересна — особенно, если вы не делаете бенчмарк на LibriSpeech, а работаете с клиентскими данными, которые часто содержат большое число шумов, акцентов, или даже пение и музыку (откройте демку, там будет k-pop🕺🏻). Сказано, что на таких данных модель по качеству лучше на 50% — как именно подсчитали эту цифру, правда, я не нашла 💁🏻♀️
В репозитории есть несколько конфигураций модели, как это было с GPT-семейством, от tiny c 39M до large c 1550M параметров, которая вполне может подойти для дистилляции
Кроме того, судя по демо, Whisper сразу делает расстановку знаков препинания. Base (вторая по величине модель) весит всего 140 мб, так что если убрать все ненужные части (или даже декодер), останется очень приятный размер, который вполне можно использовать на разного рода девайсах. Круто, желаю openai больше таких прикладных проектов 🌚
Подробнее читать тут
#tech
❤1
https://www.youtube.com/watch?v=UKDX4n7vB1k&ab_channel=GDGRussia
#web #mobile #crossplaform #flutter
Обзор кросс-платформенного фреймфорка Flutter (7 лет с момента релиза). Позволяет создавать (почти) одинаково выглядящие веб, android, iOs приложения с (почти) единой кодовой базой. Использует С/Java-подобный язык Dart, который компилируется в С или JS. В целом кажется привлекательным решением, если нужно, чтобы работал и сайт, и приложухи на мобилках, а нет бюджета нанимать отдельных разработчиков на каждую платформу. Думаю его использовать для следующего проекта. Веб-версия отображает в html либо canvas, пример. Проблемы: SEO, картинки из CDN (из-за CORS), параллельность на веб-версии.
#web #mobile #crossplaform #flutter
Обзор кросс-платформенного фреймфорка Flutter (7 лет с момента релиза). Позволяет создавать (почти) одинаково выглядящие веб, android, iOs приложения с (почти) единой кодовой базой. Использует С/Java-подобный язык Dart, который компилируется в С или JS. В целом кажется привлекательным решением, если нужно, чтобы работал и сайт, и приложухи на мобилках, а нет бюджета нанимать отдельных разработчиков на каждую платформу. Думаю его использовать для следующего проекта. Веб-версия отображает в html либо canvas, пример. Проблемы: SEO, картинки из CDN (из-за CORS), параллельность на веб-версии.
YouTube
Александр Денисов | Flutter и веб-разработка. Тварь ли дрожащая или право имеет?
В современном мире бизнесу очень редко необходим только веб-сайт, или только мобильное приложение, обычно требуется создать сразу сайт и мобильное приложение вместе. В такой ситуации всегда стоит выбор, какие технологии использовать? Как правило есть три…
Используете ли Вы веб-версию сервиса (соцсеть, трекер и т.п.) на мобильных устройствах, или предпочитаете нативные приложения под свою платформу?
Anonymous Poll
0%
Даже не пользуюсь сервисом, если у него нет нативного приложения
14%
Предпочитаю нативное приложение
57%
Без разницы, какое использовать, веб или мобильное, лишь бы хорошо работало
29%
Всегда стараюсь использовать веб-версию
https://www.youtube.com/watch?v=Hq42zNQUQNo
#standardmodel #quantumgravity #elementaryparticles #darkmatter #послушайнаночь
Мало что может сравниться с восторгом познания глубинного устройства мира. Возможно, это и является целью существования человечества, то, что упёртые религиозные фанатики отрицают, а более "продвинутые" верующие и называют познанием Бога. Пока мы решаем мелкие рутинные задачи в своей области, не надо забывать о глобальной картине мироздания. В моё время в школьном учебнике физики ещё не было информации о кварках и Стандартной модели, насколько помню, а в Вашем? В очередной раз поражает "необъяснимая эффективность математики". Почему физическая реальность НАСТОЛЬКО ХОРОШО соответствует миру идей? От позитрона, которого "на кончике пера" вывел Дирак и который по сути был мнимым корнем квадратного уравнения, до космологической постоянной, которую Эйнштейн добавил в свои уравнения ОТО просто чтобы придать им более общий математический вид, и называл "величайшей ошибкой" за всю свою научную деятельность, и которая через 70 лет начала считаться вполне реальной плотностью энергии чистого вакуума, приводящей к ускоренному расширению Вселенной.
#standardmodel #quantumgravity #elementaryparticles #darkmatter #послушайнаночь
Мало что может сравниться с восторгом познания глубинного устройства мира. Возможно, это и является целью существования человечества, то, что упёртые религиозные фанатики отрицают, а более "продвинутые" верующие и называют познанием Бога. Пока мы решаем мелкие рутинные задачи в своей области, не надо забывать о глобальной картине мироздания. В моё время в школьном учебнике физики ещё не было информации о кварках и Стандартной модели, насколько помню, а в Вашем? В очередной раз поражает "необъяснимая эффективность математики". Почему физическая реальность НАСТОЛЬКО ХОРОШО соответствует миру идей? От позитрона, которого "на кончике пера" вывел Дирак и который по сути был мнимым корнем квадратного уравнения, до космологической постоянной, которую Эйнштейн добавил в свои уравнения ОТО просто чтобы придать им более общий математический вид, и называл "величайшей ошибкой" за всю свою научную деятельность, и которая через 70 лет начала считаться вполне реальной плотностью энергии чистого вакуума, приводящей к ускоренному расширению Вселенной.
YouTube
Элементарные частицы, масса и гравитация | Физик Алексей Семихатов
В гостях Алексей Михайлович Семихатов – доктор физико-математических наук, ведущий телепрограмм «Вопрос науки» и «Время» на канале «Наука» и популяризатор науки
Разобрались в так называемой стандартной модели элементарных частиц: что такое элементарные частицы…
Разобрались в так называемой стандартной модели элементарных частиц: что такое элементарные частицы…
❤2
#chatgpt #learning #knowledgemanagement #anki #businessidea
Глубокие языковые модели, похоже, будут идеальны для автосоздания карточек Анки. Не знаю, планируется ли выкладка в открытый доступ чатГПТ, но она уже отлично умеет формулировать вопросы и ответы к утверждению, и подсвечивать утверждения, противоречащие научным знаниям (для тех случаев, когда ученик неверно понял материал, или материал содержал ошибки или явную ложь). Что невероятно круто, она оперирует не просто в системе true-false, а в true-false-unknown. Тем самым, похоже, даже "слабый" искусственный интеллект приведёт к взрывному росту уровня интеллекта естественного ) Предвижу внедрение этой технологии в школах всего мира.
Глубокие языковые модели, похоже, будут идеальны для автосоздания карточек Анки. Не знаю, планируется ли выкладка в открытый доступ чатГПТ, но она уже отлично умеет формулировать вопросы и ответы к утверждению, и подсвечивать утверждения, противоречащие научным знаниям (для тех случаев, когда ученик неверно понял материал, или материал содержал ошибки или явную ложь). Что невероятно круто, она оперирует не просто в системе true-false, а в true-false-unknown. Тем самым, похоже, даже "слабый" искусственный интеллект приведёт к взрывному росту уровня интеллекта естественного ) Предвижу внедрение этой технологии в школах всего мира.
👍2
#fun #openings #retro #covers #friday
https://youtu.be/CzdO8Hd_Wxc
Красивый кавер и заставка. А сам мини-сериал 1899 я рекомендую лишь тем, кто хочет сломать себе мозг )
One pill makes you larger,
And one pill makes you small.
And the ones that mother gives you
Don’t do anything at all.
Feed your head
When logic and proportion
Have fallen sloppy dead,
And the White Knight is talking backwards
And the Red Queen’s off with her head.
https://youtu.be/CzdO8Hd_Wxc
Красивый кавер и заставка. А сам мини-сериал 1899 я рекомендую лишь тем, кто хочет сломать себе мозг )
One pill makes you larger,
And one pill makes you small.
And the ones that mother gives you
Don’t do anything at all.
Feed your head
When logic and proportion
Have fallen sloppy dead,
And the White Knight is talking backwards
And the Red Queen’s off with her head.
YouTube
1899 Opening Intro (White Rabbit Cover)
1899 opening intro scene song by Jefferson Airplane - White Rabbit cover. Original soundtrack 1899 Netflix series. Title sequence.
🔥1
#news #law #dataleaks
А ведь в своё время топам фэйсбука сотрудничество с Cambridge Analytica наверняка казалось отличной идеей.
https://3dnews.ru/1079328/meta-soglasilas-uregulirovat-isk-po-intsidentu-s-cambridge-analytica-za-725-millionov
"Внесудебное урегулирование завершит тяжбу, начало которой было положено в 2018 году, когда стало известно об открытии Facebook данных 87 млн пользователей платформы британской компании Cambridge Analytica, специализировавшейся на политическом консалтинге. Адвокаты истцов назвали сумму в $725 млн крупнейшей в истории урегулирования коллективных исков по конфиденциальности данных в США и максимальной выплатой со стороны Meta в адрес коллективного истца. При этом компания не признала факта правонарушений и заявила, что согласилась на урегулирование иска «в интересах сообщества и акционеров».
В 2019 году компания выплатила $5 млрд за урегулирование расследования Федеральной торговой комиссии (FTC) в отношении её политики конфиденциальности и $100 млн за урегулирование претензий Комиссии по ценным бумагам и биржам (SEC) за введение инвесторов в заблуждение в отношении неправомерного применения персональных данных пользователей."
А ведь в своё время топам фэйсбука сотрудничество с Cambridge Analytica наверняка казалось отличной идеей.
https://3dnews.ru/1079328/meta-soglasilas-uregulirovat-isk-po-intsidentu-s-cambridge-analytica-za-725-millionov
"Внесудебное урегулирование завершит тяжбу, начало которой было положено в 2018 году, когда стало известно об открытии Facebook данных 87 млн пользователей платформы британской компании Cambridge Analytica, специализировавшейся на политическом консалтинге. Адвокаты истцов назвали сумму в $725 млн крупнейшей в истории урегулирования коллективных исков по конфиденциальности данных в США и максимальной выплатой со стороны Meta в адрес коллективного истца. При этом компания не признала факта правонарушений и заявила, что согласилась на урегулирование иска «в интересах сообщества и акционеров».
В 2019 году компания выплатила $5 млрд за урегулирование расследования Федеральной торговой комиссии (FTC) в отношении её политики конфиденциальности и $100 млн за урегулирование претензий Комиссии по ценным бумагам и биржам (SEC) за введение инвесторов в заблуждение в отношении неправомерного применения персональных данных пользователей."
3DNews - Daily Digital Digest
Meta согласилась выплатить $725 млн по коллективному иску о передаче данных Cambridge Analytica
Компания Meta (бывшая Facebook) согласилась выплатить $725 млн за урегулирование коллективного иска, в котором гиганта соцсетей обвинили в передаче персональных данных пользователей третьим лицам, включая Cambridge Analytica.