NEW BOT Телеграм, страница - 939361292

bugs ans letters

18 subscribers

34 photos

3 videos

3 files

135 links

Мой канал для себя про NLP. В основном – помойка из ссылок.

Download Telegram

About

Blog

Apps

Platform

bugs ans letters

bugs ans letters

Forwarded from эйай ньюз

Там Карпатый опять отжигает. Он выпустил часовую лекцию «Интро в большие языковые модели».

Образовательный контент от Карпатого всегда топовый. Нужно смотреть! #ликбез

Часть 1: LLMs
00:00:00 Intro: Large Language Model (LLM) talk
00:00:20 LLM Inference
00:04:17 LLM Training
00:08:58 LLM dreams
00:11:22 How do they work?
00:14:14 Finetuning into an Assistant
00:17:52 Summary so far
00:21:05 Appendix: Comparisons, Labeling docs, RLHF, Synthetic data, Leaderboard

Часть 2: Future of LLMs
00:25:43 LLM Scaling Laws
00:27:43 Tool Use (Browser, Calculator, Interpreter, DALL-E)
00:33:32 Multimodality (Vision, Audio)
00:35:00 Thinking, System 1/2
00:38:02 Self-improvement, LLM AlphaGo
00:40:45 LLM Customization, GPTs store
00:42:15 LLM OS

Часть 3: LLM Security
00:45:43 LLM Security Intro
00:46:14 Jailbreaks
00:51:30 Prompt Injection
00:56:23 Data poisoning
00:58:37 LLM Security conclusions

Слайды

@ai_newz

[1hr Talk] Intro to Large Language Models

This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…

12 views17:49

bugs ans letters

Forwarded from Nuaf

https://www.linkedin.com/posts/arti-yadav-4936051a6_resume-covertips-resumewriters-activity-7137752421413310464-2OKU

@walsk , кто-то запилил экстеншен для линкедина

Arti Yadav on LinkedIn: #resume #covertips #resumewriters #resumetips #linkedin | 106 comments

📜Resume Cover Letters Hack You Must Know📃💁‍♀️

📃🌟A concise and compelling cover letter is your first chance to stand out and be considered a strong… | 106 comments on LinkedIn

10 views09:52

bugs ans letters

Forwarded from Voice stuff

HiFTNet

Субъективные оценки на LJSpeech показывают, что наша модель значительно
превосходит как iSTFTNet, так и HiFi-GAN, достигая производительности уровня оригинальных аудио. HiFTNet также превосходит BigVGAN на LibriTTS для дикторов вне обучающего сета и достигает сравнимой с BigVGAN производительности, при этом работая в четыре раза быстрее, используя всего 1/6 параметров.
Наша работа устанавливает новую планку для эффективного и высококачественного нейронного вокодинга, прокладывая путь к приложениям реального времени.
требующих высокого качества синтеза речи.

https://github.com/yl4579/HiFTNet

GitHub - yl4579/HiFTNet: HiFTNet: A Fast High-Quality Neural Vocoder with Harmonic-plus-Noise Filter and Inverse Short Time Fourier…

HiFTNet: A Fast High-Quality Neural Vocoder with Harmonic-plus-Noise Filter and Inverse Short Time Fourier Transform - yl4579/HiFTNet

12 views13:54

bugs ans letters

Сохраню как пример применения чатгопоты и arxivexplorer

10 views09:58

bugs ans letters

Forwarded from Valia Walsk

https://chat.openai.com/share/c6ce4ef8-870d-4a0c-9157-4a1106113345
Лол, зацени. Это в х15 божественнее гугла.

A conversational AI system that listens, learns, and challenges

9 views09:58

bugs ans letters

LinkedIn придумал интересный формат. Редакторы собрали советы на тему "как сохранять и повышать свою актуальность" (в данном случае – в сфере ML), а потом попросили свою социальную платформу прокомментировать эти советы. С учётом правой колонки, кажется, можно принять решение, что стоит делать, а что – нет.

What are the best ways to stay updated on machine learning algorithms and data analysis? | Data Analysis

Learn the best ways to keep yourself updated on the latest trends, tools, and techniques in machine learning algorithms and data analysis.

14 views10:36

bugs ans letters

Forwarded from AI для Всех (Artemii)

🔍

Метод адаптации больших языковых моделей - LoRA

В области искусственного интеллекта существует важная задача: адаптация больших предобученных языковых моделей, (например GPT-4 или Llama), для конкретных задач. Традиционный подход - полное дообучение, требует переобучения всех параметров модели. Но так как модели большие - переобучать их непомерно дорого и ресурсоемко.

Решением этой проблемы является метод LoRA (Low-Rank Adaptation), разработанный исследователями из Microsoft. Кстати, я уже упоминал этот метод раньше.

LoRA фиксирует веса предобученной модели и встраивает обучаемые матрицы разложения низкого ранга в каждый/любой по выбору слой трансформера. Таким образом, мы можем значительно снизить количество обучаемых параметров для последующих задач.

💡 Как это работает?
- Обычно, когда мы учим модель, мы меняем множество настроек (называемых весами) в ней. Это как регулировка множества крутилок, чтобы модель лучше справлялась со своей задачей.
- LoRA говорит, что не нужно крутить все крутилки. Она предлагает менять только некоторые из них, основываясь на идее, что это будет почти так же эффективно.
- Получается, что вместо того чтобы настраивать множество параметров, мы фокусируемся только на ключевых. Следовательно, процесс обучения становится быстрее и требует меньше ресурсов (денег).

Эксперименты показали, что LoRA работает наравне или лучше, чем полное дообучение на таких моделях, как RoBERTa, DeBERTa, GPT-2 и GPT-3, несмотря на меньшее количество обучаемых параметров.

🔗 GitHub проекта
🤩 Статья

Please open Telegram to view this post

VIEW IN TELEGRAM

17 views15:03

bugs ans letters

Forwarded from Личинка программиста (Дмитрий Косенко)

Выложил бенчмарк для автоматической оценки LLM для русского языка при помощи gpt-4. По факту это просто переведенная версия официального mt-bench, только с модифицированным интерфейсом просмотра и завернутым в докер чтобы это продолжало работать и через год. Ну и соответственно там есть небольшой лидерборд. https://github.com/dmitrymailk/mt_bench_ru

14 views09:37

bugs ans letters

#cv Отличная, хотя уже и не очень новая, статья про action recognition.

Что такое «Action Recognition»?

Год назад моя статья про трекинг была тепло принята на Хабре. Эта статья - продолжение. В ней я сделал обзор современных методов распознавания действий. От самых простых и удобных, до самых сложных....

12 views16:40

bugs ans letters

#ml #nlp #llama2 #russian Немного про русскоязычные генеративные модели: Сайга (дообучен токенизатор, применена LoRA) и Вихрь (токенизатор сделан с нуля, затюнена вся модель).
Из забавного: “Модели имеют свойство тупеть после обучения в лоб, те метрики у модели которая видела русские токены метрики будут ХУЖЕ чем у модели которая русских токенов НЕ видела.”

Как (быстро) сделать русский локальный ChatGPT

Эта история началась в начале марта этого года. ChatGPT тогда был в самом расцвете. Мне в Telegram пришёл Саша Кукушкин, с которым мы знакомы довольно давно. Спросил, не занимаемся ли мы с Сашей...

16 views11:06

bugs ans letters

Пара статей про машинный перевод в 2023 году для целей локализации. #ml #translation

Как мы сделали переводчик точнее и дешевле Google и Yandex

Всем привет! Меня зовут Никита, я Data Scientist из Raft. Сегодня я расскажу вам о том, как мы решили задачу перевода каталога товаров большого интернет-магазина с русского на арабский язык с...

13 views20:37

bugs ans letters

Буду сегодня спамить скринами с epic.ai.
Реализация, например.

13 viewsedited 17:24

bugs ans letters

40 views18:44

bugs ans letters

Как устроен один из NPC-ботов

42 views20:46

bugs ans letters

Прогрессию можно представить как мутабельную БД, в которой единожды упомянутый факт добавляется в контект

41 views20:50

bugs ans letters

Примеры развития прогрессии

40 views20:55

bugs ans letters

..и развитие в многоагентной среде.

46 views20:56

bugs ans letters

47 views20:58

bugs ans letters

#memo #epic Попробовать weaviate как векторную БД
Также из полезного - Zilliz (я так и не понял, они разработчики Milvus, или разработали расширение) и Ray

GitHub - weaviate/weaviate: Weaviate is an open-source vector database that stores both objects and vectors, allowing for the combination…

Weaviate is an open-source vector database that stores both objects and vectors, allowing for the combination of vector search with structured filtering with the fault tolerance and scalability of ...

59 views21:08

bugs ans letters

Очень крутой дэшборд для нескольких моделей, захощенных в Google: TextFX, ImageFX, десятки подзадач, которые они решают

23 views10:12

bugs ans letters

#memo SDXL с примерами - большая генеративная модель для изображений

Stable Diffusion Art

Stable Diffusion XL 1.0 model - Stable Diffusion Art

Stable Diffusion XL (SDXL) is the latest AI image model that can generate realistic people, legible text, and diverse art styles with excellent image

18 views08:34