Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
В дополнение к нашим вчерашним новогодним открыточкам, парочка способов поздравить самых продвинутых

Для любителей математики – нестареющая классика: x-max формула. А для фанатов программирования – кот(д) в мешке – запусти и узнаешь, что будет...


from colorama import Fore

def heart_shape(msg="Merry Christmas"):
lines = []
for y in range(15, -15, -1):
line = ""
for x in range(-30, 30):
f = ((x * 0.05) ** 2 + (y * 0.1) ** 2 - 1) ** 3 - (x * 0.05) ** 2 * (y * 0.1) ** 3
line += msg[(x - y) % len(msg)] if f <= 0 else " "
lines.append(line)
print(Fore.RED+"\n".join(lines))
print(Fore.GREEN+msg)
heart_shape()
👍3414😁8🤔4
Microsoft выпустила приложение для Copilot

Copilot работает на базе последней версии ChatGPT-4, к которой дает полностью бесплатный доступ. Также в сервис интегрирован DALL-E 3. Доступно пока только для Android (и не в России) в GooglePlay.

P.S. Google, кстати, тоже не отстает. На днях они добавили в поисковик возможность генерировать изображения.
👍30🔥64🤪2
Наглядная инфографика с важными релизами в области ИИ.
👍462🤓2🔥1
Думали, что релизов в этом году больше не будет? Мы тоже, но тут Сбер представил доступ к GigaCode внешним разработчикам.

🌟Поддержка 15 языков программирования.
🌟Совместимость с популярными IDE (есть Jupyter Notebook).
🌟Расширенная кодогенерация, семантический поиск по коду, обнаружение уязвимостей.

Про опенсурс речи не идет, и из подробностей только, что тестировали на сотрудниках компании, и что ускоряет работу на 25%. Если есть те, кому дали попробовать – расскажите в комментариях. Ссылка для получения раннего доступа: https://gigacode.ru/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍285🔥5🫡3🤔2🤯2
Все еще лучшая архитектура трансформера.
59👍11🔥6😁6🤯3
Не знаешь, что поделать на новогодних праздниках?

А как насчет почтить 2023 чтением популярных статей. Нашли для вас гитхаб с золотом: автор с начала года собирает все трендовые и интересные статьи и собрал уже больше 5.5 тыс ⭐️.

Ссылка: https://github.com/dair-ai/ML-Papers-of-the-Week

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥87❤‍🔥1
Учить ML теорию vs Забывать ML теорию.
👍165🔥33😁29🐳159💯9😨5
This media is not supported in your browser
VIEW IN TELEGRAM
Я и мои попытки подобрать гиперпараметры.
😁20130🔥10👍5🎄5💯2💘1
Мы все ближе к Новому году, время подводить итоги.

Канал за год вырос почти в 2 раза и медленно, но верно приближается к званию самого большого рускоязычного канала по Machine Learning (не авторских, по просмотрам).

Цели на следующий год уже расписаны, дальше только лучше. Спасибо, что вы с нами и с наступающим!
60👍17🔥9🗿2🤯1😨1
Приложение чат-бота Copilot с бесплатными GPT-4 и DALL-E 3 теперь есть и для iOS, есть в российском App Store.
👍31😨16🔥96🤯4😐1
Forwarded from XOR
from time import sleep
from tqdm import tqdm
for i in tqdm(range(365)):
sleep(24*60*60)
👍63😁475
Итоги 2023

Ну что, доели свои салатики? Пора строить планы на новый год и подводить итоги старого. Рассказываем, что важного произошло с индустрией ИИ в 2023, и как это повлияет на нас в будущем.

Пишите в комментариях, чем больше всего запомнился вам прошлый год – и чего ждете от наступившего!
👍315🔥4💋1
Годовой рост выручки OpenAI составляет 5700%

Издание The Information сообщает, что объем выручки компании за 2023 год перешагнул отметку в $1.6 млрд. В 2022 году при этом они заработали всего $28 млн.

Конечно, такой бурный рост вызывает внимание инвесторов. Однако, мы до сих пор не знаем, сколько компания тратит на работу ChatGPT.

Да, может и не зря Сэм в таких часах гоняет.
👍30🔥104🤯31😐1🆒1
Вот такая вот NY party, получается
👍60😁29🎄92🤔21
На клавиатурах для Windows появится новая клавиша для вызова ИИ

Видимо Microsoft действительно верит в то, что за ИИ будущее. В 2024 году они планируют оснащать клавиатуры ноутбуков и ПК новой клавишей Copilot. Она заменит правый Ctrl.

Кстати, в прошлый раз клавиатуры меняли аж 30 лет назад – тогда на них появилась клавиша Windows.
👍50🫡21🔥11🗿75
Microsoft побили SOTA эмбеддиг-моделей

Главный камень преткновения современных подходов – данные: собрать хороший датасет для «fetching tasks» очень сложно и дорого. Поэтому часто модели сначала обучают на неразмеченный general данных, а потом файнтюнят на датасетах поменьше. Производительность таких моделей неплохая, но для RAG-систем без дополнительных танцев с бубном они обычно слабоваты.

Но в Microsoft придумали простой и действенный способ обойти эти ограничения. Они решили попросить LLM саму составить датасет, то есть сгенерировать триплеты «задача - релевантный документ - нерелевантный документ», а после обучать эмбеддинги с помощью парного лосса.

Итог – новая SOTA. Этот простой и гениальный подход теперь в топе Huggingface Leaderboard, и может стать поворотной точкой для RAG.

Статья | Модель | Датасет
👍6012🔥10🤪3