Data Brew – Telegram
Data Brew
1.04K subscribers
121 photos
34 videos
3 files
84 links
Пишу про рынок, собесы и заметки общего содержания.

Ютуб:https://www.youtube.com/@echemenev
Сотрудничество:@echemenev
Download Telegram
Forwarded from karpov.courses
Возможно, вы заметили, что на нашем канале давно не проходили mock-собеседования c Валерием Бабушкиным, но мы решили исправить эту ситуацию!

14 июля в 19:30 (GMT+3) Валерий проведёт System Design интервью в прямом эфире! На повестке — дизайн системы сети заправок и ритейл-магазинов при ней. Ждём вас на трансляции :)
👍1💯1
По описанию очень годный сервис, особенно для маленьких медиа и блогеров
Forwarded from Инвестируй и зарабатывай💰NOSCAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Строем идем сюда:
Согласны?
Зацените что появилось, теперь с математикой говорим на человечком языке
Forwarded from LEFT JOIN
Chat Notebooks: ноутбуки Wolfram со встроенной языковой моделью 🧠
Идея ноутбуков, появившаяся на свет в 1987 (нет, мы сейчас не про те, что лэптопы!), за 36 лет своего существования оказала существенное влияние на рабочие процессы в науке о данных, став их неотъемлемой частью. И вот на днях взята новая веха: отныне, ноутбуки Wolfram дополняются функционалом для работы с языковой моделью.

В интерфейсе ноутбуков Wolfram появились «окошки» для общения с ИИ. В статье рассказывается о двух типах новых ноутбуков: ноутбуки с правами на чат (chat-enabled) и ноутбуки, управляемые с помощью чата (chat-driven). Вторые отличаются от первых тем, что для работы с ними не требуется прибегать к языку программирования Wolfram. Также любопытен тот факт, что ячейки чата в ноутбуке считываются ИИ последовательно, то есть, каждая последующая учитывает информацию из предыдущей, но не знает о последующей.

Другой особенностью Chat Notebooks является то, что искусственный образ, роль которого вы бы хотели, чтобы ИИ играл в общении с вами, может настраиваться на разных уровнях: вы можете указать роль ИИ для всей переписки в ноутбуке, а также задать отдельные образы внутри каждого отдельного чата.

В целом, Chat Notebooks похож на интеграцию ChatGPT в интерфейс ноутбуков Wolfram. Подробное руководство по работе с новшеством вы найдете в статье. А в комментариях мы приглашаем вас обсудить, какие другие сервисы нуждаются в интеграциии языковых моделей!
Сохраню а то потеряется
🔵КАКИЕ ВОПРОСЫ МОГУТ ЗАДАТЬ НА СОБЕСЕДОВАНИИ АНАЛИТИКУ ДАННЫХ

😱 Большинство людей нервничают перед собеседованием, особенно в области анализа данных. Но чем лучше вы подготовлены, тем меньше будете нервничать.

Я подготовил базовый список наиболее распространенных вопросов на собеседовании с аналитиком данных.
Прежде чем приступить к следующему собеседованию, ознакомьтесь со следующими вопросами, которые могут задать на собеседовании. Если ответы даются вам легко, отлично; практика делает совершенным. Если вы обнаружите, что немного запинаетесь, все равно отлично; вы обнаружили области для улучшения.

Это лишь общий набор вопросов, и конкретные вопросы могут варьироваться в зависимости от компании, должности и уровня опыта, на который вы претендуете.

🔥👇С ВАС 50 РЕАКЦИЙ И Я РАССКАЖУ О ТОМ КАК БОРОТЬСЯ С ВЫГОРАНИЕМ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤‍🔥1🔥1👀1
Фейковые ссылки chatGPT

Каждый раз, когда я прошу chatGPT дать мне ссылку на какую-то основную обзорную работу в научной области, она выдаёт мне фейковые статьи. Выглядят как настоящие, но их тупо не существует!

Я понимаю, в целом, почему так происходит, но вот хорошее пошаговое расследование того, почему так получается на примере «самой известной экономической статьи».

Кратко:

1. ChatGPT учится по началу фразы оценивать вероятность возможных продолжений.

2. Если ты просишь её назвать самую известную статью в экономике, она, используя информацию из интернета, предсказывает самые вероятные слова, продолжающие запрос.

3. Самые частые слова в названии экономических статей: «economic» и «theory». Поэтому ответ будет начинаться с этих слов.

4. Самое вероятное слово, продолжающее эту последовательность - “history”. Получаем «A theory of economic history”.

5. Дальше выбирается самый вероятный (читай: цитируемый) автор в области экономики.

6. Самое популярное число авторов в экономических статьях – 2. Поэтому выбирается соавтор, который чаще всего появлялся в интернете (читай: цитировался) вместе с выбранным первым автором.

7. Журнал подбирается тот, в котором чаще всего печатался первый автор.

8. Год публикации подбирается более или менее из середины творческой биографии автора(ов).

P.S. Когда я в очередной раз жаловался на фейковые ссылки chatGPT, мне подсказали, что есть сервис, который выдает существующие ссылки по такому же свободному запросу – https://app.wordtune.com/editor/.
Forwarded from Борис опять
#ml #искусственный_интеллект

# The Bitter Lesson

The Bitter Lesson - знаменитое эссе от профессора Rich Sutton и один из самых важных текстов для спекциалистов по ML и всех пытающихся разобраться в буме AI. Текст написан в 2019 году и оказался пророческим, предсказав бум ChatGPT/GPT-4 и победу подхода OpenAI.

Речь вот о чем. Традиционно ученые в AI считали, что искусственный интеллект требует какого-то особого подхода, какой-то “звездной пыли.” Это называется inductive bias: некие особые знания о проблеме, направляющие машинное решение. Считалось, что чем умнее мы хотим получить машину, тем хитрее должны быть наши эвристики и тем глубже должно быть наше понимание проблемной области.

Эмпирически это казалось верным. Например, ученые наблюдали сильынй прирост качества в машинном переводе после того, как глубоко изучили лингвистику и закодировали часть ее правил в свою систему. Аналогично в анализе изображений кто-то мог придумать хитрый фильтр или стоэтапный выделять ключевые точки. Такие результаты позволял ученым почувствовать себя очень умными (и не зря!), опубликоваться, защитить свои PhD и в целом удовлетворить всех участников академической среды.

Но вот что происходило из раза в раз: кто-то просто докидывал вычислений и побольше данных. И побеждал все хитрые методы! Все добытые слезами, потом и кровью inductive bias методы оказывались на пыльной полке истории.

Так было в шахматах: сначала все делали хитрые движки, но победила система построенная практически на полном переборе. Так же было с Go. Так же было со Старкрафтом. Скорее всего так будет с Nethack.

В компьютерном зрении конволюционные нейросети победили “ручной” SIFT и подобные методы. Автор SIFT позже сказал, что создал свой метод только потому, что у него не было нейросетей, которые делают бррр. В машинном переводе LSTM положили на лопатки все системы на основе правил. ChatGPT/GPT-4 это предельный случай: модель построенная на чистом “stack more layers” обращается с языком лучше, чем все создания компьютерных лингвистов.

Горький урок в том, что общие методы построенные на вычислениях побеждают хитрости построенные на человеческой интуиции. Урок этот все еще не усвоен до конца: PhD продолжают делать хитрые методы, а общие системы остаются не в почете. Тот кто усвоит урок будет иметь более точную модель реальности.

Очень советую прочитать оригинал эссе по ссылке в заголовке.
👍2