Data Science UA – Telegram
Data Science UA
1.86K subscribers
812 photos
36 videos
3 files
1.28K links
🌏 Ми одне з найбільших Data Science ком'юніті Європи.

🔹ІT Рекрутинг
🔹AI Тренінги
🔹AI Івенти

👉🏻 Знайшли проблему, або маєте пропозиції щодо розвитку спільноти?
До ваших послуг @DataScienceUA_assistant
Download Telegram
Менше ніж 1800 хвилин до початку Data Science UA Meetup – а це означає лише одне… зустрічаємось вже завтра!🔥

Лишилося всього 5 квитків – вхопи свій шанс прокачати AI-скіли та зануритися у реальні кейси від практиків, поки не пізно!

Нагадуємо тобі про теми, які розкриють наші спікери:

🔹 Олексій Шалденко & Костянтин Здор – Co-founders у Wantent
"Майбутнє аналізу контенту: AI-агенти, синтетичні аудиторії та відео для глибинного розуміння глядачів"

🔹 Максим Кметь – Senior AI Engineer у MacPaw
"Промпт – це лише початок: практичний гайд з контролю та оцінювання LLM"

Доєднуйся до мітапу вже завтра, 23 вересня о 18:00 за київським часом у БЦ Gulliver, Creative Quarter, вежа Б, 12-й поверх👋

🔸Мова: Українська
🔸Вхопи свій квиток або придбай доступ до запису тут
8🔥6👀3
❗️Лишилися 3 ОСТАННІ КВИТКИ та лічені години до Data Science UA Meetup!

Хочеш дізнатися, як AI-агенти прогнозують поведінку глядачів і як правильно формулювати промпти для точних результатів?

Практичні інсайти, лайфхаки, нетворкінг (і смачний чай з печивом!) – твої must-have сьогодні на Data Science UA Meetup.

📍 Київ, 18:00, БЦ Gulliver, Creative Quarter, вежа Б, 12-й поверх.

Не барися – купуй квиток або доступ до запису та будь у темі!

До зустрічі 😎 🌎
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1142
Хочеш розпочати кар’єру в АІ, але не знаєш з чого почати? Відповідь вже на dev.ua! 📋

У новій статті на dev.ua Олександра Богуславська, CEO & Founder Data Science UA, разом із іншими топ-експертами поділилися практичними порадами, як розпочати і прокачати кар’єру в АІ.

У статті ти знайдеш інформацію про:

Курси та тренінги, які реально прискорюють розвиток AI-інженера
3 ключові навички, які виділяють AI-інженера на ринку
AI-інженер майбутнього: хто він і як виглядатиме

Чи робиш ти перші кроки в АІ, чи прагнеш підвищити свій рівень – ці поради допоможуть обрати потрібні курси, прокачати навички та здобути практичний досвід 😉

🔗 Читай повну статтю тут *tap-tap*
85👍2
Data Science UA Meetup: Як це було 👀🔥

23 вересня ми зібрали AI-ком’юніті на офлайн-мітап – і це був справжній restart після літа: нова енергія, свіжі ідеї та атмосфера живого спілкування.

👉 До нас приєдналися понад 70 учасників: AI-інженери, дата сайєнтисти, продакти та розробники, щоб зрозуміти, як AI працює на практиці.

Про що говорили? Та ви і так знаєте 😅
Але запис мітапу все ж таки готуємо.

👏🏻 Дякуємо нашим спікерам – Максиму Кметь, Senior AI Engineer у MacPaw; Олексію Шалденку, CEO & Co-Founder компанії Wantent та Костянтину Здору, Head of AI & Co-Founder Wantent – а також Олександрі Богуславській, CEO Data Science UA, за чудову модерацію мітапу.

Побачимось на наступному Data Science UA мітапі 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥62🤝1
Що робити восени, коли серіали вже закінчились, а до зими ще далеко? Правильно – качати нові скіли 💻🔥

Ця добірка курсів від robot_dreams – саме те, що треба.

🔹«Дата-аналітика» – опануй стек технічних та аналітичних навичок і навчись працювати з реальними датасетами на курсі-професії, з можливістю стажуватися в SKELAR.

🔹«Прогнозування та аналіз часових рядів» – навчись перетворювати історичні дані на чіткі прогнози та поглиблюй експертизу в ML з отриманням практичного досвіду роботи з моделями ARIMA, SARIMA й нейромережами.

🔹«Python для аналітиків» – виходь за межі стандартних SQL-запитів і вручну зведених таблиць: працюй з великими обсягами даних, автоматизуй аналітику, будуй інтерактивні візуалізації та самостійно обробляй дані з різних джерел.

Мінімум прокрастинації – максимум апгрейду 😉
105👍2🔥1
Як перестати марнувати бюджет на АІ та насправді перетворити його на прибуткові результати? 🤔💸

Олександра Богуславська
, CEO та Founder Data Science UA, поділилася з AIN.UA практичним чеклістом, який стане корисним для будь-якого бізнесу, що планує впровадження АІ.

Читай повну статтю тут 👈🏻
114👍2
👻 Monsters under the bed? Не страшно.
Залишитися без кар’єрних шансів? Ось це вже horror.

Тому тримай добірку вакансій від Data Science UA!

Lead:
🎃 Computer Vision Lead
🎃 AI Datasets Lead
🎃 MLOps Team Lead

Senior:
🎃 Senior Data Scientist/NLP Lead
🎃 MLOps Engineer
🎃 Senior/Middle Data Scientist (Data Preparation & Pre-training)
🎃 Senior/Middle Data Scientist (Benchmarking & Alignment)
🎃 Business Analyst
🎃 Senior Full Stack Engineer
🎃 Senior MLOps Engineer

Middle:
🎃 Data Engineer
🎃 Data Scientist
🎃 Data Analyst
🎃 Middle Python/Go Developer

Junior:
🎃 Quantitative Researcher

Надішли друзям, щоб врятувати їх від «job nightmare» 😅
Please open Telegram to view this post
VIEW IN TELEGRAM
10😁4🆒41
Замість новин на сьогодні 😉👇🏻
Forwarded from ML || DL
Attention Sinks: Allowing Attention Not To Pay Attention 🙅‍♂️

Нещодавно читав гарний пост про архітектуру GPT-OSS. Більшість змін порівняно з GPT2 були вже знайомі з таких відкритих архітектур як LLaMa, Qwen, або Gemma, але є одна цікава ідея, про яку раніше не чув — attention sinks.

Recap: Attention Patterns ✍️

Пригадаємо, що у механізмі уваги для кожного токену формується так званий attention pattern — ваги, з якими він “зверне увагу” на попередні токени з контексту (включно з ним самим).

Для кожної голови цей pattern буде різним: іноді увага звертається на попередній токен, іноді — на останнє згадане імʼя, іноді — на надані few-shot examples, тощо.

What’s the problem? 🤔

Через те, що attention pattern формується через softmax, сума його коефіцієнтів завжди дорівнює одиниці. Тобто кожний токен в будь-якому разі “змушений” звернути на щось увагу. Але справа в тому, що не існує текстів, для яких кожна з attention heads має зробити щось корисне — зазвичай більшість з них не є активними.

Тому часто голови уваги вивчають наступну поведінку: якщо жодна з ознак, яку вони очікують, не зустрічається у контексті, то вся увага просто йде на перші кілька токенів (саме вони й називаються attention sinks у оригінальній роботі, де це було виявлено). Тобто перші токени стають таким собі буфером, який не несе в собі корисного сенсу, і в який заглядають просто якщо в тексті не відбувається нічого надзвичайного.

Цей “хак” призводить до таких проблем як ускладнена інтерпретованість моделі, або погіршення якості при роботі з великими послідовностями, коли ці самі перші токени випадають з KV cache.

What’s the solution?

Для уникнення цього є кілька способів (тик, тик), але реалізація від OpenAI здається найбільш елегантною.

Для кожної голови створюється додатковий параметр (sink), який конкатенується до рядків QK scores, і … це все 🙂 Ми отримуємо новий ”фейковий” елемент у softmax, який може перейняти увагу на себе, якщо жодного патерну не було виявлено. Так як голов зазвичай не багато, це не створює великого overhead, а зазначені раніше проблеми зникають.

Висновок: Цікавий приклад того, як інтерпретація дозволяє виявляти і вирішувати реальні проблеми в моделях, які важко було б ідентифікувати, сприймаючи їх як чорний ящик.
🔥1333
This media is not supported in your browser
VIEW IN TELEGRAM
Як думаєш, які з цих відео справжні? 🤔
Спойлер: вони всі ж такі реальні, як твої обіцянки жити з понеділка по новому.

Усі вони згенеровані новенькою Sora 2 від OpenAI. Тепер усе виглядає ще природніше: рухи об’єктів, звуки, діалоги – навіть помилки виглядають правдоподібно.

Якщо раніше баскетбольний м’яч міг просто зникнути й “телепортуватися” в кошик, то тепер він відскакує від підлоги, якщо гравець промахнувся ⛹️‍♂️

Основні фічі:

👉🏻 Вперше модель не просто генерує картинку, а відтворює логіку реального світу – об'єкти поводяться так, як вони б поводились у житті.

👉🏻 Генерує людям всього 5 пальців (жарт!)

👉🏻 Підтримує кілька стилів: від реалістичних кінематографічних сцен до аніме.

👉🏻 Тепер можна додати себе у відео: достатньо один раз записати коротке відео й голос у застосунку і Sora зможе вставити твою зовнішність та голос у будь-який згенерований сюжет.

👉🏻 Запустили навіть iOS-додаток Sora (щось на кшталт TikTok майбутнього) – соцмережу на базі моделі, де можна створювати й реміксити відео, а також додавати свої “cameos” (аватар + голос). Додаток поки доступний у США та Канаді.

Як вам таке оновлення? 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
114🔥2😁2
EdTech, HealthTech та AI стартапи, ви готові залучати інвестиції, вдосконалювати продукт та масштабуватись?

Challenger Accelerator запрошує вас приєднатись до когорти 4.0 на equity-free умовах. Бенефіти, які ви отримаєте:

▶️ $25К грант від UMAEF для переможця.
▶️ $75К + кредитів від USF на хмарні сервіси для 3-х кращих команд та ін. партнерські бенефіти.
▶️ Поїздка на Latitude59 для кращих стартапів.
▶️ 30+ годин індивідуального менторства від топових бізнес та технічних експертів програми.
▶️ 15+ годин воркшопів з практикуючими спеціалістами з product market fit, інвестпривабливості, маркетингу й продажів тощо.
▶️ Сесії з українськими та міжнародними інвесторами та рекомендації від них.
▶️ Нетворкінг та комьюніті івенти.
▶️ Пост акселераційну підтримку.

Умова для стартапів: мати від 2-х людей в команді та продукт на рівні MVP. Наявність перших клієнтів чи ринкової валідації буде перевагою.

📅 Гібридний формат участі з січня по квітень 2026 з Демо Днем у квітні.

Дедлайн подачі заявок — 20 листопада.
Реєстрація тут 👈🏻

Якщо ви хочете познайомитись з командою Challenger ближче, реєструйтесь на Challenger Startup Roast, який пройде 14 жовтня в Києві. У вас буде можливість запітчити своє рішення інвесторам і експертам та отримати зворотній зв’язок. Є можливість долучитись як гість: https://surl.li/uebbvn

Організатори: Civitta та RadarTech за підтримки #ESTDEV #FromThePeopleOfEstonia
114🤩3
🤖 AI допомагає відкривати нові математичні структури!

DeepMind запустили
AlphaEvolve – LLM-агента, який допомагає відкривати нові комбінаційні структури та просувати теоретичну комп’ютерну науку вперед.

AlphaEvolve не просто пише код, він його еволюціонує: тестує фрагменти, вдосконалює найуспішніші та знаходить нові математичні структури, які можна автоматично перевірити.

Також агент застосовує методику gadget reduction та «lifting», щоб знайдені скінченні структури давали універсальні теореми.

Основні результати:👇🏻

🔹 MAX-4-CUT – покращено межу наближення для NP-складної задачі. Знайдено «gadget» із 19 змінних і складною схемою ваг, що встановило нову межу 0.987.

🔹 Ramanujan-графи – знайдено графи з великими 2-cut на до 163 вузлах, що суттєво покращило середню складність сертифікації властивостей графів.

🔹 Hardness of approximation – нові структури піднімають планку для дослідження складності апроксимацій.

Цікаво, що AlphaEvolve не вигадує нові формули – він доводить правильність результатів, а перевірка займає у 10 000 разів менше часу завдяки оптимізованим алгоритмам.

Користувачі вже жартують, що тепер AI не лише пише код, а й може захистити PhD сам за себе 😅
12😁6🔥2👀2
Чим більше працюємо з даними, тим більше переконуємось: інсайти з’являються не лише з кодом, а й зі спільноти 😉

Сьогодні рекомендуємо одну з таких – Data Life UA – де діляться практичними штуками з Python, SQL, PySpark, AWS, Power BI та обговорюють складні технічні кейси простою мовою.

Від коротких інсайтів до детальних гайдів, від нових інструментів до справжніх лайфхаків – якщо дані це частина твоєї рутини 👉🏻 @DataLifeUA
84🔥3🤝2
🎓 Безкоштовні курси від Google Cloud, щоб зробити твою осінь ще більш продуктивною

Знайомся з переліком👇

🟢 Beginner: Foundations of GenAI

На курсі дізнаєшся:
• що таке GenAI і чим він відрізняється від класичного ML;
• як писати ефективні промпти;
• як застосовувати принципи Responsible AI у роботі.

🟡 Intermediate: Use Gemini in your day-to-day

Про що цей курс – і так зрозуміло, але корисним він буде для:

Developers – детальніше про автогенерацію та пояснення коду;
Architects – як будувати інфраструктуру за допомогою простих промптів;
Data pros – використання BigQuery + Gemini для запитів і прогнозів;
Security & DevOps – виявлення проблем, підвищення безпеки систем і керування кластерами.

🟣 Advanced: Build GenAI apps end to end

Хочеш глибше зануритися у розробку GenAI-застосунків? Тоді цей курс саме для тебе 👇🏻

• створення застосунків з Gemini + Streamlit;
• робота з RAG, vector search і мультимодальними промптами;
• методологія MLOps для GenAI-проєктів;
• моделі під капотом: Transformers, BERT, diffusion.

Обирай курс, прокачуй знання й отримуй цифрові skill-badges від Google Cloud – чудове поповнення до твого професійного профілю 😉
🔥84👀2
Знаємо, що пошук роботи – це як дебаг: довго, боляче, але результат вартий того 😅

Ми підкинули свіжу порцію можливостей – може, саме тут твій next career fix!

Lead:
⚙️ Computer Vision Lead
⚙️ AI Datasets Lead
⚙️ MLOps Team Lead

Senior:
⚙️ Senior Data Scientist/NLP Lead
⚙️ MLOps Engineer
⚙️ Senior/Middle Data Scientist (Data Preparation & Pre-training)
⚙️ Senior/Middle Data Scientist (Benchmarking & Alignment)
⚙️ Business Analyst
⚙️ Full Stack Engineer
⚙️ Senior MLOps Engineer
⚙️ Senior Full Stack AI Engineer

Middle:
⚙️ Data Engineer
⚙️ Data Scientist
⚙️ Data Analyst
⚙️ Python Developer

Junior:
⚙️ Quantitative Researcher

І не забувай надіслати другу - хай і він знайде свою стабільну версію “career 2.0” 💼
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥42
Андрій Карпати випустив nanochat – можливість створити власний LLM за $100 💵

За його словами, цей проєкт дозволяє пройти повний цикл створення мовної моделі за мінімальні кошти.

Репозиторій створено в рамках курсу LLM101n від Eureka Labs і містить усе необхідне:
🔹 токенізатор на Rust
🔹 систему підкачки датасету FineWeb-EDU
🔹 скрипти для файнтюнінгу, інференсу та збору метрик
🔹 веб-інтерфейс для спілкування з моделлю

Для навчання потрібен інстанс з 8 GPU Nvidia H100. Процес триває близько 4 годин, вартість оренди ~24$/год → ≈100$ за повний цикл.
Запуск однією командою: speedrun.sh, веб-інтерфейс активується python -m noscripts.chat_web.

Детальний звіт про хід навчання можна отримати командою: cat report.md.

Весь код проєкту відкритий і доступний на GitHub 😎
15👍6👀5
Що зробили хлопці з Microsoft цього разу? 💻😲

Отож, з нового:

📍Компанія запустила свій перший генератор картинок – MAI-Image-1. Модель стартувала з 9-го місця в LMArena і поки що доступна лише там. Незабаром її інтегрують у Copilot та Bing Image Creator.

📍Далі – GitHub на новому рівні.
Microsoft готує масштабне оновлення платформи, щоб зміцнити позиції в AI-розробці. За планом, GitHub стане центром усієї розробки програмного забезпечення на базі АІ.

📍Якщо ти досі не оновився до Windows 11 – саме час. Підтримку Windows 10 офіційно припинено, а оновлень безпеки більше не буде 🪟⚡️
😁93👀2
☕️ Кава – це boost(), а меми – motivation.update().

Бо ніщо не тримає систему стабільною так, як добрий жарт про робочі будні!

Хай ваш робочий тиждень компілюється без помилок 🤞🏻

Бай зе вей, ми зараз збираємо AI-команду з 50 інженерів в Абу-Дабі 🇦🇪

Думаємо, що ти можеш бути perfect match для нас, тому дивись увесь перелік вакансій тут
13😁5🔥4👀1