DH CLOUD – Telegram
DH CLOUD
792 subscribers
88 photos
5 videos
7 files
250 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Румыния становится важным центром DH образования. Туда переехал из Лейпцига летний европейский университет «Сulture and technology» А в конце июня пройдет школа по корпусной лингвистике и digital humanities. (❗️взнос всего 50 евро) https://dilarass.uvt.ro/
6👍6
Борис Орехов опубликовал препринт с результатами эксперимента, в котором участвовало под сотню студентов-филологов. Задача была в том, чтобы понять, могут ли респонденты угадать стиль автора, на котором обучалась lstm-модель. Проверялись короткие отрывки в 4 строки, сгенерированные нейросетями, натренированными на текстах Некрасова, Мандельштама и раннего Пастернака. Во всех случаях большинство ответов оказались верными. Важным для результатов оказалось и то, знают ли респонденты стихи поэта наизусть.
17🔥2
Прикладной анализ данных в социальных науках

Академия Яндекса совместно с Европейским университетом в Санкт-Петербурге разработала новый хендбук (онлайн-учебник) «Прикладной анализ данных в социальных науках». Хендбук составлен так, чтобы любой человек без навыков в области анализа данных или программирования мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python. Учебник бесплатный.
🔥16👍3
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию

Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.

🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.

😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.

🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.

🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:

https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
🔥8👍1
Forwarded from DHRussia Новости
29 июня – 2 июля 2023 г. истфак МГУ и АИК проводят международную летнюю онлайн-школу молодых ученых «Историческая информатика – 2023».

Регистрация на Школу открыта до 21:00 (msk) 28 июня 2022 года: https://aik.timepad.ru/event/2428502/ (по ссылке есть и программа лектория первого дня Школы).

Кто хочет попробовать себя в качестве докладчика в день молодежной конференции в рамках Школы, должен успеть зарегистрироваться не позднее 20 июня.
👍5
Forwarded from DHRussia Новости
Продолжается регистрация заявок на конференцию «Информационные технологии в гуманитарных исследованиях», которая пройдет с 25 по 28 сентября 2023 года на базе Сибирского федерального университета в Красноярске в смешанном формате.

Регистрация участников и приём текстов докладов проводятся по адресу: https://conf.sfu-kras.ru/dhri/ до 30 июня.
2
Forwarded from DHRussia Новости
В ближайшую среду 28 июня 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание онлайн-семинара «Цифровая среда» Института цифровых гуманитарных исследований СФУ.

На семинаре выступит Владислава Леонидовна Гайдук (ГМИИ имени А.С.Пушкина) с докладом «Цифровой архив в музее: проблемы и перспективы».

Аннотация доклада и форма регистрации доступны по адресу:
https://dhri.timepad.ru/event/2468014/
👍1
Началась III летняя школа по исторической информатике. Организаторы: Исторический факультет МГУ и межрегиональная ассоциация "История и компьютер".

На скриншоте - сооснователь DH CLOUD Борис Орехов читает лекцию "Вызовы GPT для современного гуманитария".

Программа школы: https://www.hist.msu.ru/about/gen_news/rss/90064
4
Исторические почтовые открытки с дореволюционной политической карикатурой, памятниками русской архитектуры и милыми попугайчиками — теперь прямо в телеграме!

Уже полтора года при издании “Системный Блокъ” существует проект оцифровки, расшифровки и изучения старых почтовых открыток “Пишу тебе”. И вот наконец “Пишу тебе” дорос до собственного медиа-канала. Подписывайтесь на телеграм-канал проекта, теперь про открытки рассказывают там, а не в Системном Блоке. И рассказывают больше и богаче:

https://news.1rj.ru/str/pishuteberu

Там тоже будут цифровые сюжеты: разметка и классификация объектов на открытках с помощью компьютерного зрения, изучение корпуса расшифрованных текстов количественными методами, картографирование почтовой переписки и GIS-ы, анализ метаданных…
5
TRANSKRIBUS - самая знаменитая платформа для распознавания текстов рукописей, исторических документов и старинных книг. 18 июля Transkribus проводит бесплатный вводный вебинар для тех, кто хочет научиться работать с платформой, а заодно и представит новый интерфейс https://readcoop.eu/events/introduction-to-transkribus-and-the-new-user-interface/?utm_content=166445544&utm_medium=social&utm_source=facebook&hss_channel=fbp-546945145805190
🔥9👎1
Летний набор в «Системный Блокъ»

«Системный Блокъ» запускает новые направления и расширяется — приглашаем новых авторов, редакторов, продюсеров, PR-менеджеров, дата-аналитиков. Нас объединяет интерес к науке и технологиям и желание вдохновлять людей. Среди нас есть филологи, программисты, менеджеры, историки, журналисты и аналитики — люди из совершенно разных сфер.

Мы полностью волонтерский проект. Ниже вы найдете набор ролей, которые могут быть интересны вам или вашим друзьям. Если что-то из этого вам близко, добро пожаловать к нам! Если вы хотите присоединиться, но идеальной роли нет, то все равно оставляйте заявку!

В посте — неполный перечень ролей, которые сейчас открыты, а в статье — подробное описание задач и пожеланий к участникам.

1. Авторы в рубрики — от филологии, искусства, общества до «как это работает»

2. Редактор, выпускающий редактор Телеграма

3. Продюсер рубрики (новой или существующей), менеджер лектория или ивент-менеджер, комьюнити-менеджер

4. PR-менеджер «Системного Блока» или «Пишу тебе», маркетолог

5. Продакт-менеджер на развитие IT-продуктов в «Системном Блоке» и «Пишу тебе»

6. Куратор проектов на хакатоне, продюсер дата-исследований в дата-отдел, визуализатор в дата-отдел

7. Программист/ведущий программист в одну из команд

8. Аналитик в одну из команд

9. Иллюстратор статей, графический дизайнер

10. Data Worm — специалист по поиску данных в открытых источниках

Если вас заинтересовала одна из ролей – приглашаем заполнить форму до 10.07.
4
Faculty of Liberal Arts and Sciences in Montenegro объявляет набор на бакалавриат в 2023 году.

Шесть majors на выбор: Art History, Cross Cultural Linguistics, Digital Humanities, Media Studies and Journalism, New Political Sciences и Social Theory and Sociological Research.

Преподавание на английском и русском языках, срок обучения — 3 года, по стандартам Болонской системы.
👍1
В Граце завтра начинается ежегодная конференция Digital Humanities 2023. Тема этого года "Сотрудничество как возможность". Конференцию проводит Альянс организаций цифровых гуманитарных наук (ADHO).

Следить за новостями конференции лучше всего в твиттере по #DH2023

https://youtu.be/2_T4PYJK1Ag
13
Представляем DH CLOUD на заседании Европейской DH ассоциации. Выступает Динара Гагарина
32👎1
Сегодня представили DH CLOUD на ежегодном собрании правления ADHO (Alliance of Digital Humanities Organizations). ADHO - это верхнеуровневая организация, объединяющая локальные ассоциации DH по всему миру. https://adho.org/
🔥111👏1
Одна из важнейший задач ADHO - организация ежегодной конференции по Digital Humanities. В 2023 году в Граце будет представлено 229 докладов, 106 постеров и 28 воркшопов. Регистрация участников продолжается до сих пор, уже зарегистрировалось 875 человек, из них 100 человек онлайн. Организаторы, не ожидавшие такого количества участников, будут транслировать стрим открывающей сессии. А это значит, что лекцию профессора Сары Кендердайн “Two-Fold Revolutions: Computational Museology in the Age of Experience” смогут увидеть все желающие на ютуб канале конференции https://www.youtube.com/@dh_graz137
👍113
Forwarded from Говорим по-русски! С О.Северской и Ko (Ольга Северская)
#НашеВидео 📺 Как возникают и меняют свое значение сленговые слова? Есть ли у социальных сетей своя собственная грамматика? Можно ли говорить о типичных соцсетевых ошибках?

📌 На эти вопросы отвечают Борис Орехов, доцент НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН, и... корпус "Социальные сети" в составе Национального корпуса русского языка.

📍Посмотрев видео, вы узнаете:

▫️Как и когда "бумер" превратился из машины в человека? Как узнать, когда появились "вайб" и "кринж"?

▫️Кто эти люди, которым впервые стало "фиолетово НА проблемы"? Какие еще есть типичные для соцсетей грамматические конструкции?

▫️Что такое "болие лимение"? Как определить частые ошибки?

▫️Можно ли сегодня представить в корпусе язык эмодзи?

▫️Чем может помочь (а чем пока нет) корпусная лингвистика в изучении языка соцсетей?

Видео уже доступно 👉 на нашем ютуб-канале.

📎 Корпус "Социальные сети" можно посмотреть и попробовать с ним поработать. До конца июля он будет обновлен.
🔥9