Подписчик напарсил, а главное разметил капчи
kaggle
kaggle
Kaggle
Russian CAPTCHA Images base64
40 thousand images of Russian captcha
🔥31❤2👍1🤮1
В принципе я бы выбрал посмотреть Валеру Бабушкина
YouTube
Перформанс ревью и калибровка в технологических компаниях | Валерий Бабушкин | karpov.courses
Курс Hard ML: https://bit.ly/3LB4idK
Курс System Design: https://bit.ly/3BVRdbK
По промокоду PERFREVIEW вы получите скидку 10% на обе программы
Перформанс ревью — это процесс оценки сотрудников компании, который позволяет бизнесу оценить эффективность человека…
Курс System Design: https://bit.ly/3BVRdbK
По промокоду PERFREVIEW вы получите скидку 10% на обе программы
Перформанс ревью — это процесс оценки сотрудников компании, который позволяет бизнесу оценить эффективность человека…
👍21👎12🔥1
Forwarded from See All
keynote wrap-up: https://blogs.nvidia.com/blog/2022/09/20/keynote-gtc-nvidia-ceo/
https://blogs.nvidia.com/blog/2022/03/22/h100-transformer-engine/ - про трансформер энджин в новых девайсах, тут и замеры и что и как и где
https://blogs.nvidia.com/blog/2022/09/20/grace-hopper-recommender-systems/ - про рекомендашки
https://blogs.nvidia.com/blog/2022/09/20/computer-vision-cloud/ - про CV в облаке(мало деталей)
https://nvidianews.nvidia.com/news/nvidia-launches-omniverse-cloud-services-for-building-and-operating-industrial-metaverse-applications - про клауд для омниверса и его отдельные составляющие
https://nvidianews.nvidia.com/news/nvidia-unveils-drive-thor-centralized-car-computer-unifying-cluster-infotainment-automated-driving-and-parking-in-a-single-cost-saving-system - про новую железку для SDC
https://nvidianews.nvidia.com/news/nvidia-jetson-orin-nano-sets-new-standard-for-entry-level-edge-ai-and-robotics-with-80x-performance-leap - про новый джетсон нано, я ослышался (не поверил ушам) - не в 18, а в 80 раз перформанс лучше
https://blogs.nvidia.com/blog/2022/09/20/drive-sim-neural-reconstruction-engine/ - про симулятор для SDC, который восстанавливает мир, который можно харвестить и дергать модельки, менять пути, етц
Игровое:
https://www.nvidia.com/en-us/geforce/news/dlss3-ai-powered-neural-graphics-innovations/ - про DLSS 3.0
https://www.nvidia.com/en-us/geforce/news/rtx-remix-announcement/ - про прогу для RTX’ивания старых игр
https://www.nvidia.com/en-us/geforce/news/rtx-40-series-graphics-cards-announcements/ - в целом про 40ую игровую серию
Остальное можно чекнуть тут: https://nvidianews.nvidia.com/news/
https://blogs.nvidia.com/blog/2022/03/22/h100-transformer-engine/ - про трансформер энджин в новых девайсах, тут и замеры и что и как и где
https://blogs.nvidia.com/blog/2022/09/20/grace-hopper-recommender-systems/ - про рекомендашки
https://blogs.nvidia.com/blog/2022/09/20/computer-vision-cloud/ - про CV в облаке(мало деталей)
https://nvidianews.nvidia.com/news/nvidia-launches-omniverse-cloud-services-for-building-and-operating-industrial-metaverse-applications - про клауд для омниверса и его отдельные составляющие
https://nvidianews.nvidia.com/news/nvidia-unveils-drive-thor-centralized-car-computer-unifying-cluster-infotainment-automated-driving-and-parking-in-a-single-cost-saving-system - про новую железку для SDC
https://nvidianews.nvidia.com/news/nvidia-jetson-orin-nano-sets-new-standard-for-entry-level-edge-ai-and-robotics-with-80x-performance-leap - про новый джетсон нано, я ослышался (не поверил ушам) - не в 18, а в 80 раз перформанс лучше
https://blogs.nvidia.com/blog/2022/09/20/drive-sim-neural-reconstruction-engine/ - про симулятор для SDC, который восстанавливает мир, который можно харвестить и дергать модельки, менять пути, етц
Игровое:
https://www.nvidia.com/en-us/geforce/news/dlss3-ai-powered-neural-graphics-innovations/ - про DLSS 3.0
https://www.nvidia.com/en-us/geforce/news/rtx-remix-announcement/ - про прогу для RTX’ивания старых игр
https://www.nvidia.com/en-us/geforce/news/rtx-40-series-graphics-cards-announcements/ - в целом про 40ую игровую серию
Остальное можно чекнуть тут: https://nvidianews.nvidia.com/news/
NVIDIA Blog
Keynote Wrap-Up: NVIDIA CEO Unveils Next-Gen RTX GPUs, AI Workflows in the Cloud
New cloud services to support AI workflows and the launch of a new generation of GeForce RTX GPUs featured today in NVIDIA CEO Jensen Huang’s GTC keynote, which was packed with new systems, silicon, and software. “Computing is advancing at incredible speeds…
❤4👍4
не ругайте российскую оппозицию, она ничего не сделала
😁90🤡33💩27😢10👍8🔥8🤔2🌚2👏1🤯1😈1
В какой то момент мы стали жить в ебучем четвертом сезоне атаки титанов
👍52🔥12🤡11🤬2🖕2🤮1
не давайте math phd писать код, потом будете такую хуету править:
ngpu = len(lightning_config.trainer.gpus.strip(",").split(','))
ngpu = len(lightning_config.trainer.gpus.strip(",").split(','))
🔥47😁19😱2
#чтивонаночь
Whisper
Дисклеймер:
Я буду во многом повторять пост Саши из команды Silero - гения TTS/STT и кажется одного из самых крутых speech engineer которых я знаю.
Данные:
Крауленный интернет, вычищенный от транскриптов, asr
Пунктуация минимально приводят к стандарту, мы учим seq2seq оно само выучит.
Русского к слову довольно много, модель неплохо понимает русский.
В сумме:
680 тысяч часов
Архитектурно:
encoder-decoder трансфоремер, на вхиод окно в 25 миллисекунд и шагом в 10 миллисекунд, 16кгц, которые сворачивают 2*Conv1d и прогоняют через GELU
Самая большая модель - скромные 1.5b параметров.
Скорость и точность:
1) модель сильно медленее класических asr, тут вообще без шансов
2)
- Качество сильно падает на коротких аудио;
- Галлюцинации на других языках;
- Для языков, кроме английского, правил нормализации текста нет как таковых, она выдает некое "своё" рандомное видение;
- В примерах от авторов есть только batch size 1
paper
code
большой разбор whisper
А самое главное - мой подписчик с ником Dim собрал бота с Whisper, за что большое ему спасибо
Играться с large моделькой:
@whisperOpenAIbot
Картинка украдена из поста
Whisper
Дисклеймер:
Я буду во многом повторять пост Саши из команды Silero - гения TTS/STT и кажется одного из самых крутых speech engineer которых я знаю.
Данные:
Крауленный интернет, вычищенный от транскриптов, asr
Пунктуация минимально приводят к стандарту, мы учим seq2seq оно само выучит.
Русского к слову довольно много, модель неплохо понимает русский.
В сумме:
680 тысяч часов
Архитектурно:
encoder-decoder трансфоремер, на вхиод окно в 25 миллисекунд и шагом в 10 миллисекунд, 16кгц, которые сворачивают 2*Conv1d и прогоняют через GELU
Самая большая модель - скромные 1.5b параметров.
Скорость и точность:
1) модель сильно медленее класических asr, тут вообще без шансов
2)
- Качество сильно падает на коротких аудио;
- Галлюцинации на других языках;
- Для языков, кроме английского, правил нормализации текста нет как таковых, она выдает некое "своё" рандомное видение;
- В примерах от авторов есть только batch size 1
paper
code
большой разбор whisper
А самое главное - мой подписчик с ником Dim собрал бота с Whisper, за что большое ему спасибо
Играться с large моделькой:
@whisperOpenAIbot
Картинка украдена из поста
👍5🔥3🤮1
Forwarded from Hints research
Друзья, сейчас важно помочь с релокацией тем, кто хочет уехать, но не может финансово сделать это в одиночку.
Вероятно многим в канале это не актуально, но прошу об услуге
1. Поделитесь с теми, кому это поможет
2. Поставьте в комментарии к городу, в котором вы находитесь, что вы там, это поможет запустить активность чата
——
Чат для поиска людей, с которыми можно скооперироваться для аренды жилья за границей
https://news.1rj.ru/str/friends_for_relocate
Зачем это?
- многие уезжают по одиночке
- многим дорого снимать квартиру на одного
- а если снимать вместе то сильно дешевле
- квартиры уже сильно подорожали (в 2-3 раза) плюс однушки заняты
Как использовать
- выбирайте из списка в канале город, куда собираетесь ехать
- пишите в комментарии когда собираетесь ехать, или что уже приехали и ищете соседей
- пишите тем кто едет туда же
- снимайте квартиру совместно
Зовите других людей
- многие не решаются уезжать, потому что уже очень дорого, а зарплата не позволяет
- расскажите им про чат, чтобы они увидели, с кем могут скооперироваться, как могут сэкономить, и наконец решились уехать
Вероятно многим в канале это не актуально, но прошу об услуге
1. Поделитесь с теми, кому это поможет
2. Поставьте в комментарии к городу, в котором вы находитесь, что вы там, это поможет запустить активность чата
——
Чат для поиска людей, с которыми можно скооперироваться для аренды жилья за границей
https://news.1rj.ru/str/friends_for_relocate
Зачем это?
- многие уезжают по одиночке
- многим дорого снимать квартиру на одного
- а если снимать вместе то сильно дешевле
- квартиры уже сильно подорожали (в 2-3 раза) плюс однушки заняты
Как использовать
- выбирайте из списка в канале город, куда собираетесь ехать
- пишите в комментарии когда собираетесь ехать, или что уже приехали и ищете соседей
- пишите тем кто едет туда же
- снимайте квартиру совместно
Зовите других людей
- многие не решаются уезжать, потому что уже очень дорого, а зарплата не позволяет
- расскажите им про чат, чтобы они увидели, с кем могут скооперироваться, как могут сэкономить, и наконец решились уехать
🔥15🤡5💩3👍1
Тред поиска удалённой работы.
Если у вас есть вакансия с удалённой работой, разместите ниже в следующем формате:
Что нужно делать на работе:
Вилка:
Если у вас есть вакансия с удалённой работой, разместите ниже в следующем формате:
Что нужно делать на работе:
Вилка:
👍29❤2🔥1
memeDenoscriptions.zip
208.6 MB
Подписчик напарсил мемов с текстовыми описаниями 😎
Автор: Nik
Автор: Nik
🤩24👍3🎉3🔥2
Forwarded from Градиент обреченный (Sergei Averkiev)
🔺 Woland-10
Сделал параллельный корпус на 10 языков (ru, be, uk, en, de, it, fr, es, hu, zh) из различных редакций романа Мастер и Маргарита. Всего получилось ~7.5k параллельных групп строк.
〰️ Выровнял при помощи своей выравнивалки Lingtrain (а это, напомню, проект открытый). Получилось довольно быстро, особенно с новой картой, — со своей GPU жизнь действительно заиграла новыми красками 😁
Сначала нашел и разметил 10 текстов на разных языках, потом выровнял каждую пару с оригиналом. Потом все выравнивания совместно. Могу описать подробней, если интересно.
Могут встречаться шероховатости, так как все равно надо дополнительно проверять качество, но в целом выглядит пристойно (если что — пишите), буду ещё улучшать.
Сделал параллельный корпус на 10 языков (ru, be, uk, en, de, it, fr, es, hu, zh) из различных редакций романа Мастер и Маргарита. Всего получилось ~7.5k параллельных групп строк.
〰️ Выровнял при помощи своей выравнивалки Lingtrain (а это, напомню, проект открытый). Получилось довольно быстро, особенно с новой картой, — со своей GPU жизнь действительно заиграла новыми красками 😁
Сначала нашел и разметил 10 текстов на разных языках, потом выровнял каждую пару с оригиналом. Потом все выравнивания совместно. Могу описать подробней, если интересно.
Могут встречаться шероховатости, так как все равно надо дополнительно проверять качество, но в целом выглядит пристойно (если что — пишите), буду ещё улучшать.
🇷🇺 Вино какой страны предпочитаете в это время дня?👉 GitHub
🇧🇾 Вiно з якое краiны вы любiце ў гэтую пару дня?
🇺🇦 Вино якої країни вам більше до вподоби цієї пори дня?
🇬🇧 What country's wine do you prefer at this time of day?'
🇩🇪 Den Wein welches Landes bevorzugen Sie zu dieser Tageszeit?"
🇫🇷 Du vin de quel pays préférez-vous, à cette heure de la journée ?
🇮🇹 Il vino di quale paese preferisce a quest'ora del giorno?
🇪🇸 ¿De qué país lo prefiere a esta hora del día?
🇭🇺 Milyen bort szeret a legjobban ilyenkor déltájban?
🇨🇳 平常在这个时间您喜欢喝哪国产的葡萄酒?
👍29🔥11❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Да я буду проводить референсы с атакой титанов, а что вы мне сделаете?
🤨26👍13🥰6🌚5🤔4🤣3🖕3👏1😢1😈1