Пользуйтесь и делитесь с коллегами 🤝
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7⚡2👍1
Forwarded from Цифровой чай
Как нейронки пишут тексты
#матчасть
Один из самых популярных сейчас видов нейросетей — это т.н. чат-боты, сервисы, в которых вы общаетесь с нейросетью, как в чате (ChatGPT, YandexGPT и т.п.). При этом ваш компьютерный собеседник может и диалог о погоде поддержать, и на вопросы ответить, и текст по запросу написать. Как нейросети генерируют слова, фразы и длиннющие тексты? Сегодня в общих чертах познакомимся с этим процессом.
🎓 Пополняем словарный запас
Сначала нейросеть необходимо обучить. Для этого в неё загружают много текстов — книги, статьи, заметки, сайты и т.п. И когда я говорю "много", я имею в виду действительно много: если измерять в классике, то для обучения качественной нейронки потребуется более 5 миллионов романов "Война и мир" по объёму текста.
По мере загрузки в нейросеть тексты разбиваются на маленькие фрагменты — слова, корни слов, слоги, отдельные буквы. Каждый такой фрагмент называют токен, и каждый токен кодируется числовым значением. Именно в таком виде, набором определённых чисел, нейросеть воспринимает показанные ей тексты.
🔍 Ищем закономерности
Как я уже описывал, основной метод обучения нейросетей — это выявление закономерностей. Именно этим и занимаются нейронки, "разгребая" загруженные в них тонны текста. Язык — штука структурированная и закономерная. И если закономерностей не видно в одном телеграм-посте, то в пяти миллионах романов они проявляются, как на ладони, были бы эффективные алгоритмы для их поиска, и хватило бы вычислительной мощности. Основная цель нейронки на этом этапе — понять, какие токены чаще используются вместе, в какой комбинации и в каких случаях.
🔮 Учимся прогнозировать
Накопив достаточный объём данных о взаимосвязях токенов, нейросеть начинает прогнозировать, какие токены с максимальной вероятностью должны идти после введённых (токены в вашем вопросе — это отправная точка, а токены в ответе чат-бота — это результат прогнозирования). По мере обучения нейросеть делает это всё лучше и лучше. Этому процессу помогают ИИ-тренеры, подсказывающие нейросети верные ответы при обучении, а также пользователи, оценивающие ответы нейронки в процессе общения с ней (да, нейросети тоже собирают лайки).
🤖👱🏻♂️ Мы не такие уж разные
На первый взгляд этот процесс может показаться каким-то магическим, но если разобраться, мы, люди, обрабатываем информацию приблизительно так же. Привычные там буквы, слова или звуки имеют для нашего мозга сугубо абстрактный смысл, и складываются они во что-то вразумительное как раз на основе закономерностей, которым наш мозг обучается с детства. Сотни различных языков и диалектов, на которых миллиарды людей описывают один и тот же окружающий мир — яркая иллюстрация этого. И идея работы нейросетей не удивительна, учитывая, что они проектировались, опираясь на принципы работы человеческого мозга.
📌 Если сжать всё вышесказанное в одно предложение, то можно сказать, что нейросети понимают наши слова, выявив огромное количество закономерностей в языке, а отвечают нам, научившись на основе этих закономерностей прогнозировать "правильное" сочетание букв и слов в ответе. Увы, никакой магии, сугубо математика и статистика.
@digitaltea | про IT доступно
#матчасть
Один из самых популярных сейчас видов нейросетей — это т.н. чат-боты, сервисы, в которых вы общаетесь с нейросетью, как в чате (ChatGPT, YandexGPT и т.п.). При этом ваш компьютерный собеседник может и диалог о погоде поддержать, и на вопросы ответить, и текст по запросу написать. Как нейросети генерируют слова, фразы и длиннющие тексты? Сегодня в общих чертах познакомимся с этим процессом.
Сначала нейросеть необходимо обучить. Для этого в неё загружают много текстов — книги, статьи, заметки, сайты и т.п. И когда я говорю "много", я имею в виду действительно много: если измерять в классике, то для обучения качественной нейронки потребуется более 5 миллионов романов "Война и мир" по объёму текста.
По мере загрузки в нейросеть тексты разбиваются на маленькие фрагменты — слова, корни слов, слоги, отдельные буквы. Каждый такой фрагмент называют токен, и каждый токен кодируется числовым значением. Именно в таком виде, набором определённых чисел, нейросеть воспринимает показанные ей тексты.
Как я уже описывал, основной метод обучения нейросетей — это выявление закономерностей. Именно этим и занимаются нейронки, "разгребая" загруженные в них тонны текста. Язык — штука структурированная и закономерная. И если закономерностей не видно в одном телеграм-посте, то в пяти миллионах романов они проявляются, как на ладони, были бы эффективные алгоритмы для их поиска, и хватило бы вычислительной мощности. Основная цель нейронки на этом этапе — понять, какие токены чаще используются вместе, в какой комбинации и в каких случаях.
Накопив достаточный объём данных о взаимосвязях токенов, нейросеть начинает прогнозировать, какие токены с максимальной вероятностью должны идти после введённых (токены в вашем вопросе — это отправная точка, а токены в ответе чат-бота — это результат прогнозирования). По мере обучения нейросеть делает это всё лучше и лучше. Этому процессу помогают ИИ-тренеры, подсказывающие нейросети верные ответы при обучении, а также пользователи, оценивающие ответы нейронки в процессе общения с ней (да, нейросети тоже собирают лайки).
🤖👱🏻♂️ Мы не такие уж разные
На первый взгляд этот процесс может показаться каким-то магическим, но если разобраться, мы, люди, обрабатываем информацию приблизительно так же. Привычные там буквы, слова или звуки имеют для нашего мозга сугубо абстрактный смысл, и складываются они во что-то вразумительное как раз на основе закономерностей, которым наш мозг обучается с детства. Сотни различных языков и диалектов, на которых миллиарды людей описывают один и тот же окружающий мир — яркая иллюстрация этого. И идея работы нейросетей не удивительна, учитывая, что они проектировались, опираясь на принципы работы человеческого мозга.
@digitaltea | про IT доступно
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤3🤮2
👉 Deploying to AWS Lambda with Serverless + GitHub Actions (Modern CI/CD)
По традиции предлагаем использовать Яндекс Браузер со встроенным синхронным переводчиком (если надо).
Если что-то не сработает, в комментах на YouTube есть решения
Полезные ссылки:
➖ Бессерверная платформа
➖ GitHub Actions
➖ Исходный код
Пользуйтесь и делитесь с коллегами 🤝
#aws #lambda #serverless #github #ci/cd
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3⚡2
Подписывайтесь на Telegram наших партнёров: Zabbix — @zabbix_ru, ElasticSearch/OpenSearch — @elasticstack_ru
Дополнительную информацию можно уточнить у @galssoftware либо обратиться одним из способов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2😎2
Продолжаем делиться опытом через книги.
👉 Сегодня это — System Design. Подготовка к сложному интервью
Интервью по System Design (проектированию ИТ-систем) популярны у работодателей, на них легко проверить навыки общения и оценить умение решать реальные задачи.
Пройти такое собеседование непросто, поскольку в проектировании ИТ-систем не существует единственно правильных решений. Речь о самых разнообразных системах со множеством особенностей. Вам могут предложить выбрать общую архитектуру, а потом пройтись по всем компонентам или, наоборот, сосредоточиться на одном аспекте. Но важно продемонстрировать понимание и знание системных требований, ограничений и узких мест.
Что внутри?
➖ Инсайдерская информация: что на самом деле нужно интервьюерам
➖ 4-х шаговый подход к решению любой задачи system design
➖ 16 вопросов из реальных интервью с подробными решениями.
➖ 188 диаграмм о том, как работают реальные системы.
Читайте и делитесь с коллегами 🤝
#devops #devopsbooks
@DevOpsKaz
👉 Сегодня это — System Design. Подготовка к сложному интервью
Интервью по System Design (проектированию ИТ-систем) популярны у работодателей, на них легко проверить навыки общения и оценить умение решать реальные задачи.
Пройти такое собеседование непросто, поскольку в проектировании ИТ-систем не существует единственно правильных решений. Речь о самых разнообразных системах со множеством особенностей. Вам могут предложить выбрать общую архитектуру, а потом пройтись по всем компонентам или, наоборот, сосредоточиться на одном аспекте. Но важно продемонстрировать понимание и знание системных требований, ограничений и узких мест.
Что внутри?
➖ Инсайдерская информация: что на самом деле нужно интервьюерам
➖ 4-х шаговый подход к решению любой задачи system design
➖ 16 вопросов из реальных интервью с подробными решениями.
➖ 188 диаграмм о том, как работают реальные системы.
Читайте и делитесь с коллегами 🤝
#devops #devopsbooks
@DevOpsKaz
🔥9👍4⚡1
Изучайте генеративный ИИ и создавайте приложения без кода — хакатон PartyRock поможет получить практические навыки в этой сфере и даст возможность выиграть до 120 000💵 в виде кредитов AWS.
👉 Участвовать в хакатоне
Что нужно сделать на хакатоне (на выбор):
Работы участников принимаются до 12 марта 2024 г. А принять участие может любой совершеннолетний. Объединяйтесь в команды или пробуйте силы в одиночку!
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
PartyRock: Everyone can build AI Apps
❤3🔥3👍2
#devops #DevOpsИнженер #sre #cv
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10👍4👾4
Онлайн-обучение Linux, проектированию и архитектуре 👇
🔑 Интересно, что под капотом любой инфраструктуры? Приглашаем на курс «Управление собственным Linux-сервером». На курсе вы получите в полное управление собственную виртуальную машину (8CPU, 12GB RAM, 100GB NVME, Ubuntu 22) и научитесь профессиональной настройке, мониторингу и управлению Linux-сервером
🔑 Стремитесь расширить свои навыки программирования и проектирования? Приходите на буткемп «Производительность и масштабируемость», который позволит вам погрузиться в мир highload за максимально короткий срок, даже не обладая опытом работы в хайлоад-проектах.
Вас ждут «живые» онлайн-сессии (лекции, брейнштормы и презентации домашних проектов) + практика на собственной инфраструктуры с первого дня.
Автор курса — Алексей Рыбак (@rybakalexey), ex-CTO Badoo и Vezet, член программного комитета Highload с многолетним опытом разработки ПО и управления технологическими организациями.
Вас уже ждут!
🔑 Интересно, что под капотом любой инфраструктуры? Приглашаем на курс «Управление собственным Linux-сервером». На курсе вы получите в полное управление собственную виртуальную машину (8CPU, 12GB RAM, 100GB NVME, Ubuntu 22) и научитесь профессиональной настройке, мониторингу и управлению Linux-сервером
🔑 Стремитесь расширить свои навыки программирования и проектирования? Приходите на буткемп «Производительность и масштабируемость», который позволит вам погрузиться в мир highload за максимально короткий срок, даже не обладая опытом работы в хайлоад-проектах.
Вас ждут «живые» онлайн-сессии (лекции, брейнштормы и презентации домашних проектов) + практика на собственной инфраструктуры с первого дня.
Автор курса — Алексей Рыбак (@rybakalexey), ex-CTO Badoo и Vezet, член программного комитета Highload с многолетним опытом разработки ПО и управления технологическими организациями.
Вас уже ждут!
🔥5⚡2👍2
Разбор финального задания с тренировки по DevOps от Яндекса
Сами тренировки уже прошли, но годные материалы доступны. Например, как развернуть инсталляцию приложения из готового бинарника, которая будет соответствовать SLA из ТЗ? Звучит предельно просто, но только на первый взгляд.
Многие с заданием Яндекса не справились, но благодаря этому у нас есть шанс подглядеть правильное решение.
👉 Читайте полный разбор от SRE-специалиста Яндекс Маркета
#devops #sre #sla
@DevOpsKaz
Сами тренировки уже прошли, но годные материалы доступны. Например, как развернуть инсталляцию приложения из готового бинарника, которая будет соответствовать SLA из ТЗ? Звучит предельно просто, но только на первый взгляд.
Многие с заданием Яндекса не справились, но благодаря этому у нас есть шанс подглядеть правильное решение.
👉 Читайте полный разбор от SRE-специалиста Яндекс Маркета
#devops #sre #sla
@DevOpsKaz
🔥7👍6❤3⚡2
Сразу две новости от компании Nixys.
🟢 Во-первых, DevOps-инженер компании Роман Емельянов в своей статье рассказал о нюансах при работе с Prometheus при настройке мониторинга в крупных инфраструктурах. Приятного прочтения!
🟢 Во-вторых, канал DevOps FM перешел за рубеж в 3000 подписчиков — любознательных DevOps'ов и системных администраторов.
Поздравляем коллег!🎉
🟢 Во-первых, DevOps-инженер компании Роман Емельянов в своей статье рассказал о нюансах при работе с Prometheus при настройке мониторинга в крупных инфраструктурах. Приятного прочтения!
🟢 Во-вторых, канал DevOps FM перешел за рубеж в 3000 подписчиков — любознательных DevOps'ов и системных администраторов.
Поздравляем коллег!🎉
👍17👾6🎉1
🔥 Производительность PostgreSQL: мониторинг и улучшение
База данных PostgreSQL предлагает надежные функции для различных приложений. Её производительность зависит от многих факторов — их и рассмотрели в новой статье: от инструментов для исследования проблем до их решения с помощью передовых методов оптимизации.
Примеры кода для оптимизации внутри 🫡
В тексте:
— Исследование проблем с производительностью
— Анализ производительности запросов
— Профилирование загрузки базы данных
— Методы оптимизации производительности
— Настройка конфигурации базы данных
Читайте и делитесь с коллегами 🤝
#devops #database #postgresql #db
@DevOpsKaz
База данных PostgreSQL предлагает надежные функции для различных приложений. Её производительность зависит от многих факторов — их и рассмотрели в новой статье: от инструментов для исследования проблем до их решения с помощью передовых методов оптимизации.
Примеры кода для оптимизации внутри 🫡
В тексте:
— Исследование проблем с производительностью
— Анализ производительности запросов
— Профилирование загрузки базы данных
— Методы оптимизации производительности
— Настройка конфигурации базы данных
Читайте и делитесь с коллегами 🤝
#devops #database #postgresql #db
@DevOpsKaz
👍4🔥4❤2⚡2
«Площадка объединяет единомышленников, которые развивают казахстанские IT-компании и влияют на ландшафт казахстанского IT.
В день конференции, 27 апреля, IT-комьюнити соберётся в одном месте, чтобы послушать доклады от экспертов ведущих казахстанских и зарубежных компаний, узнать больше об интересном опыте и достижениях своих коллег. И если вы хотите к нам присоединиться и выступить на beetech conf, следует пройти по ссылке и подать заявку», — сообщили организаторы.
Подать доклад желающие смогут в любой из 3-х стримов. Перейдя по ссылке, найдёте фокусные направления для каждого из стримов и критерии выбора докладов:
1. Management (Agile & Product)
2. Engineering
3. Big Data
Дедлайн — 29 февраля 2024 год.
В этом году конференция будет проходить 27 апреля в Алматы в NARXOZ University.
В 2023 году конференция была посвящена тому, как гиганты и корпорации становятся гибкими и переходят на собственную разработку. Также обсудили насущные боли казахстанского IT и локальные особенности рынка.
Среди спикеров были эксперты из Beeline Казахстан, Kolesa Group, Jusan Bank, OZON Казахстан, Банк Фридом Финанс, 1Fit, inDrive и другие. Посмотреть записи всех докладов можно тут.
👉 Станьте спикером и заявите о себе
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍4
В Стамбуле состоялся саммит Google AI Academy Istanbul: Bold and Responsible, на котором эксперты и представители госорганов стран Центральной Азии и Турции обсуждали вопросы цифровой трансформации образования с использованием искусственного интеллекта, пишет Бiлiмдi Ел.
«Цифровой» вице-министр науки и высшего образования Динара Щеглова представила казахстанский проект по разработке и внедрению соответствующих программ в университетах и исследовательских центрах.
В своем Instagram-аккаунте Динара Щеглова сообщила о переговорах с Google по поводу запуска образовательного курса Google DeepMind для преподавателей и реализации пилотного проекта Google for education, а также организации в казахстанских вузах Google students clubs.
Подписывайтесь на RealDigital
«Цифровой» вице-министр науки и высшего образования Динара Щеглова представила казахстанский проект по разработке и внедрению соответствующих программ в университетах и исследовательских центрах.
В своем Instagram-аккаунте Динара Щеглова сообщила о переговорах с Google по поводу запуска образовательного курса Google DeepMind для преподавателей и реализации пилотного проекта Google for education, а также организации в казахстанских вузах Google students clubs.
Подписывайтесь на RealDigital
👍5👾5😎2🔥1
Каждому образу Docker соответствует Dockerfile. Это набор инструкций, который нужен для записи образа. В нем описывается, что должно находиться в образе, какие команды, зависимости и процессы он будет содержать.
👉 В этом репозитории вы найдете Dockerfile для 13 языков программирования:
#devops #docker #dockerfile
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍6⚡2❤2👾2
👉 Смотрите здесь
• Используем Terraform для создания экземпляра EC2 для Jenkins, Docker и SonarQube • Настраиваем Jenkins • Настраиваем SonarQube и интеграцию SonarQube с Jenkins • Создаем конвейер Jenkins для сборки и отправки образа Docker в DockerHub • Создаем экземпляр EC2 и настраиваем Prometheus и Grafana • Настраиваем уведомления через Jenkins • Создаем кластер AWS EKS • Интегрируем Prometheus с EKS и импортируем панель мониторинга Grafana для Kubernetes • Настройка конвейера Jenkins для развертывания приложения на AWS EKS • Установка триггера и проверка конвейера CI/CDПо традиции предлагаем использовать Яндекс Браузер со встроенным синхронным переводчиком (если надо).
👉 Наша компания Core 24/7 может помочь с внедрением SonarQube — платформы для непрерывного анализа и измерения качества кода, особенно полезной для сложных мультиязычных проектов.
#devops #jenkins #cicd #aws #docker #sonarqube
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍5❤3⚡2
Веб-серверы на Linux гораздо популярнее, чем те, которые работают на других ОС. Оно и понятно — стабильность, безопасность и совместная разработка с открытым исходным кодом всегда будет впереди.
Смотрите во второй карточке 👆
P.S результаты розыгрыша через 2 часа
#devops #linux
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥6⚡2❤2👾2
Результаты конкурса на бесплатное обучение и сертификацию от The Linux Foundation.
Поздравляем🥳 :
➖ Ilyas Z
➖ @Stmiii
➖ @WhoisEnter17
➖ @LittleJohnRu
➖ @asap_899
➖ @vse_po_klassike
➖ @R7337R
➖ @veroncheg
➖ @Butterzz
➖ @Nursultan_Makhambet
Каждый победитель получит по ваучеру — мы напишем в личку в субботу!
Вы не в числе победителей? Ничего страшного. Оставайтесь с нами — впереди другие конкурсы, море полезного контента и, конечно, обучение со скидкой от наших партнёров.
#devops #конкурс
@DevOpsKaz
Поздравляем
➖ Ilyas Z
➖ @Stmiii
➖ @WhoisEnter17
➖ @LittleJohnRu
➖ @asap_899
➖ @vse_po_klassike
➖ @R7337R
➖ @veroncheg
➖ @Butterzz
➖ @Nursultan_Makhambet
Каждый победитель получит по ваучеру — мы напишем в личку в субботу!
Вы не в числе победителей? Ничего страшного. Оставайтесь с нами — впереди другие конкурсы, море полезного контента и, конечно, обучение со скидкой от наших партнёров.
#devops #конкурс
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Loom
Розыгрыш ваучеров - Google Таблицы - 9 February 2024
👍21🔥10👎5🎉4⚡3
ClickHouse — это колоночная база данных. Бывший сотрудник компании рассказал, как оптимизировал производительность запросов. Вы сможете попробовать эти советы и практики на своем проекте и оценить их эффективность.
👉 В статье рассказывает:
Пользуйтесь и делитесь с коллегами 🤝
#cicd #clickhouse #devops
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥5❤2👾2