DH CLOUD – Telegram
DH CLOUD
792 subscribers
88 photos
5 videos
7 files
250 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Борис Орехов опубликовал препринт с результатами эксперимента, в котором участвовало под сотню студентов-филологов. Задача была в том, чтобы понять, могут ли респонденты угадать стиль автора, на котором обучалась lstm-модель. Проверялись короткие отрывки в 4 строки, сгенерированные нейросетями, натренированными на текстах Некрасова, Мандельштама и раннего Пастернака. Во всех случаях большинство ответов оказались верными. Важным для результатов оказалось и то, знают ли респонденты стихи поэта наизусть.
17🔥2
Прикладной анализ данных в социальных науках

Академия Яндекса совместно с Европейским университетом в Санкт-Петербурге разработала новый хендбук (онлайн-учебник) «Прикладной анализ данных в социальных науках». Хендбук составлен так, чтобы любой человек без навыков в области анализа данных или программирования мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python. Учебник бесплатный.
🔥16👍3
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию

Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.

🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.

😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.

🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.

🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:

https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
🔥8👍1
Forwarded from DHRussia Новости
29 июня – 2 июля 2023 г. истфак МГУ и АИК проводят международную летнюю онлайн-школу молодых ученых «Историческая информатика – 2023».

Регистрация на Школу открыта до 21:00 (msk) 28 июня 2022 года: https://aik.timepad.ru/event/2428502/ (по ссылке есть и программа лектория первого дня Школы).

Кто хочет попробовать себя в качестве докладчика в день молодежной конференции в рамках Школы, должен успеть зарегистрироваться не позднее 20 июня.
👍5
Forwarded from DHRussia Новости
Продолжается регистрация заявок на конференцию «Информационные технологии в гуманитарных исследованиях», которая пройдет с 25 по 28 сентября 2023 года на базе Сибирского федерального университета в Красноярске в смешанном формате.

Регистрация участников и приём текстов докладов проводятся по адресу: https://conf.sfu-kras.ru/dhri/ до 30 июня.
2
Forwarded from DHRussia Новости
В ближайшую среду 28 июня 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание онлайн-семинара «Цифровая среда» Института цифровых гуманитарных исследований СФУ.

На семинаре выступит Владислава Леонидовна Гайдук (ГМИИ имени А.С.Пушкина) с докладом «Цифровой архив в музее: проблемы и перспективы».

Аннотация доклада и форма регистрации доступны по адресу:
https://dhri.timepad.ru/event/2468014/
👍1
Началась III летняя школа по исторической информатике. Организаторы: Исторический факультет МГУ и межрегиональная ассоциация "История и компьютер".

На скриншоте - сооснователь DH CLOUD Борис Орехов читает лекцию "Вызовы GPT для современного гуманитария".

Программа школы: https://www.hist.msu.ru/about/gen_news/rss/90064
4
Исторические почтовые открытки с дореволюционной политической карикатурой, памятниками русской архитектуры и милыми попугайчиками — теперь прямо в телеграме!

Уже полтора года при издании “Системный Блокъ” существует проект оцифровки, расшифровки и изучения старых почтовых открыток “Пишу тебе”. И вот наконец “Пишу тебе” дорос до собственного медиа-канала. Подписывайтесь на телеграм-канал проекта, теперь про открытки рассказывают там, а не в Системном Блоке. И рассказывают больше и богаче:

https://news.1rj.ru/str/pishuteberu

Там тоже будут цифровые сюжеты: разметка и классификация объектов на открытках с помощью компьютерного зрения, изучение корпуса расшифрованных текстов количественными методами, картографирование почтовой переписки и GIS-ы, анализ метаданных…
5
TRANSKRIBUS - самая знаменитая платформа для распознавания текстов рукописей, исторических документов и старинных книг. 18 июля Transkribus проводит бесплатный вводный вебинар для тех, кто хочет научиться работать с платформой, а заодно и представит новый интерфейс https://readcoop.eu/events/introduction-to-transkribus-and-the-new-user-interface/?utm_content=166445544&utm_medium=social&utm_source=facebook&hss_channel=fbp-546945145805190
🔥9👎1
Летний набор в «Системный Блокъ»

«Системный Блокъ» запускает новые направления и расширяется — приглашаем новых авторов, редакторов, продюсеров, PR-менеджеров, дата-аналитиков. Нас объединяет интерес к науке и технологиям и желание вдохновлять людей. Среди нас есть филологи, программисты, менеджеры, историки, журналисты и аналитики — люди из совершенно разных сфер.

Мы полностью волонтерский проект. Ниже вы найдете набор ролей, которые могут быть интересны вам или вашим друзьям. Если что-то из этого вам близко, добро пожаловать к нам! Если вы хотите присоединиться, но идеальной роли нет, то все равно оставляйте заявку!

В посте — неполный перечень ролей, которые сейчас открыты, а в статье — подробное описание задач и пожеланий к участникам.

1. Авторы в рубрики — от филологии, искусства, общества до «как это работает»

2. Редактор, выпускающий редактор Телеграма

3. Продюсер рубрики (новой или существующей), менеджер лектория или ивент-менеджер, комьюнити-менеджер

4. PR-менеджер «Системного Блока» или «Пишу тебе», маркетолог

5. Продакт-менеджер на развитие IT-продуктов в «Системном Блоке» и «Пишу тебе»

6. Куратор проектов на хакатоне, продюсер дата-исследований в дата-отдел, визуализатор в дата-отдел

7. Программист/ведущий программист в одну из команд

8. Аналитик в одну из команд

9. Иллюстратор статей, графический дизайнер

10. Data Worm — специалист по поиску данных в открытых источниках

Если вас заинтересовала одна из ролей – приглашаем заполнить форму до 10.07.
4
Faculty of Liberal Arts and Sciences in Montenegro объявляет набор на бакалавриат в 2023 году.

Шесть majors на выбор: Art History, Cross Cultural Linguistics, Digital Humanities, Media Studies and Journalism, New Political Sciences и Social Theory and Sociological Research.

Преподавание на английском и русском языках, срок обучения — 3 года, по стандартам Болонской системы.
👍1
В Граце завтра начинается ежегодная конференция Digital Humanities 2023. Тема этого года "Сотрудничество как возможность". Конференцию проводит Альянс организаций цифровых гуманитарных наук (ADHO).

Следить за новостями конференции лучше всего в твиттере по #DH2023

https://youtu.be/2_T4PYJK1Ag
13
Представляем DH CLOUD на заседании Европейской DH ассоциации. Выступает Динара Гагарина
32👎1
Сегодня представили DH CLOUD на ежегодном собрании правления ADHO (Alliance of Digital Humanities Organizations). ADHO - это верхнеуровневая организация, объединяющая локальные ассоциации DH по всему миру. https://adho.org/
🔥111👏1
Одна из важнейший задач ADHO - организация ежегодной конференции по Digital Humanities. В 2023 году в Граце будет представлено 229 докладов, 106 постеров и 28 воркшопов. Регистрация участников продолжается до сих пор, уже зарегистрировалось 875 человек, из них 100 человек онлайн. Организаторы, не ожидавшие такого количества участников, будут транслировать стрим открывающей сессии. А это значит, что лекцию профессора Сары Кендердайн “Two-Fold Revolutions: Computational Museology in the Age of Experience” смогут увидеть все желающие на ютуб канале конференции https://www.youtube.com/@dh_graz137
👍113
Forwarded from Говорим по-русски! С О.Северской и Ko (Ольга Северская)
#НашеВидео 📺 Как возникают и меняют свое значение сленговые слова? Есть ли у социальных сетей своя собственная грамматика? Можно ли говорить о типичных соцсетевых ошибках?

📌 На эти вопросы отвечают Борис Орехов, доцент НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН, и... корпус "Социальные сети" в составе Национального корпуса русского языка.

📍Посмотрев видео, вы узнаете:

▫️Как и когда "бумер" превратился из машины в человека? Как узнать, когда появились "вайб" и "кринж"?

▫️Кто эти люди, которым впервые стало "фиолетово НА проблемы"? Какие еще есть типичные для соцсетей грамматические конструкции?

▫️Что такое "болие лимение"? Как определить частые ошибки?

▫️Можно ли сегодня представить в корпусе язык эмодзи?

▫️Чем может помочь (а чем пока нет) корпусная лингвистика в изучении языка соцсетей?

Видео уже доступно 👉 на нашем ютуб-канале.

📎 Корпус "Социальные сети" можно посмотреть и попробовать с ним поработать. До конца июля он будет обновлен.
🔥9
Forwarded from Alex/Лёша Kulikov
Присоединяйтесь к хакатонам Системного Блока @sysblok!

После организации хакатонов по Digital Humanities и участия в DemHack Системный Блокъ продолжает развивать направление хакатонов. Мы готовы пригласить в команду специалистов, которым интересно придумывать и курировать проекты на будущих хакатонах по различным темам, а также участвовать в них.

Мы будем рады как организаторам (менеджерам хакатонов, экспертам и кураторам проектов), так и участникам хакатонов — заполняйте анкету, чтобы рассказать больше о себе и быть в курсе новостей!

Анкета: https://forms.gle/A2zKv2CxaRvrycHA6
5👍2