Технолитигация – Telegram
Технолитигация
206 subscribers
25 photos
29 links
Авторский канал Артема Сабирова о литигации, технологиях и их переплетении.
Download Telegram
Гос.экзамен в МГУ сдал на 4.
Рассказывал про теоретическую семантику и применение нейросетей для задачи классификации текстов.
Продолжаю в том же духе!
3683
Первая часть адвокатского экзамена - тестирование - пройдена. Проскочил!
238
Магистерсткую диссертацию защитил на 4!
От выступления получил удовольствие.
Следующий рубеж - адвокатский экзамен.
4533
Технолитигация
Май - время стратегических рубежей 11 мая - дочери исполняется 1 год 14 мая - гос.экзамен в магистратуре МГУ 16 мая - адвокатский экзамен (тест) 28 мая - защита магистерской. В теории, на май может выпасть и устная часть адвокатского экзамена. Работаем.…
Итоги спринта май-середина июня:

1. На дне рождения Веры Артемовны порвали два баяна -

2. Гос.экзамен в МГУ -

3. Тест в рамках адвокатского экзамена -

4. Защита магистерской в МГУ -

Я очень рад завершению госа и защите магистерской. Высвободились доп.ресурсы, которые раньше шли на магистратуру, теперь из режима "копим знания" перехожу в режим "применяем знания".
26
Семинар по персональным данным

Уже завтра будет наш второй семинар из цикла по персональным данным. В этот раз есть возможность онлайн-участия.
Обсудим не только мои любые утечки персональных данных, но и последние нововведения в области локализации (а там штрафы за повторное нарушение, на минуточку, до 18 млн. руб.).
Присоединяйтесь!
842
Сегодня провели еще один увлекательный семинар по перс.данным.
Затронули злободневные проблемы - утечки, новые требования к локализации (с 1 июля), обсудили статистику привлечения к административной ответственности по ст. 13.11 и другим статьям КоАП, связанным с персональными данными.
Я рассказывал про привлечение к ответственности за:
- неопубликование политики обработки ПД;
- игнорирование требований пользователя, касающиеся обработки его перс.данных;
- игнорирование требований об уточнении / уничтожении перс.данных;
- нарушение требований к хранению данных (не в эл.виде) - это случаи, когда условная поликлиника выбросила в мусорку во дворе медицинские карты своих пациентов.

Ближайшее время напишу об этих составах более подробно. Не переключайтесь!
9
Благодарности

В этом месяце завершилась большая веха моей профессиональной жизни - я закончил магистратуру по компьютерной лингвистике в МГУ.

Для меня ясно, что этот путь я сумел пройти потому, что мои близкие меня поддержали.

Вот они:
1. Супруга, которая была моей поддержкой и опорой, несмотря на обстоятельства.
2. Виктор Домшенко, без помощи и огня которого я бы вряд ли дошел до конца.
3. Папа, мама, бабушка, брат, сестра и тетя, которые меня всегда во всем поддерживают.

Я безгранично благодарен этим людям, без них ничего бы не вышло.

Сейчас, после завершения МГУ занимаюсь долгосрочным планированием развития в области права и технологий.
407
Не про технолитигацию

В отпуске прочитал две работы К.С. Станиславского: "Работа актера над собой" и "Моя жизнь в искусстве".

1. Очень мало профессий, которые требуют специфической работы с подсознанием. Пока могу выделить только актеров и военных. И те, и другие в процессе обучения ломают себя в прямом и переносном смысле. Актеры, в частности, "должны вызывать у себя вдохновение во время, указанное в афише". Было интересно через щель в заборе поглядеть на этот необычный мир деятелей сцены.

Из того, как я понял текст, актеры добиваются высокого уровня исполнения, когда убеждают себя в правдоподобности происходящего. Дальше вступает человеческая природа (подсознание), которая создает роль без каких-либо наигрышей и актерских штампов. Сознание заинтересовывает подсознание. Актер как бы говорит себе: "да, все декорации вокруг и лица пьесы - ненастоящие. Я это знаю, мне до этого нет дела. Но если бы они были настоящие, то я бы действовал или отнесся к такому-то событию следующим образом".

Разумеется, у книги 2-3-4 дна, я увидел, что смог. Нашел много пересечений со своей профессией. Нам, судебным юристам, тоже нужно самим поверить в правовую позицию, и только потом убеждать других. Было и про тщеславие и восприятие критики, но они всем известны и поэтому скучны. Меня подкупило, что Станиславский не стесняется писать о своих промахах и ошибках.

"Работа актера над собой" оставила сильный след. Не то, чтобы я научился управлять вдохновением, но я увидел как это делают (или пытаются делать) актеры. Забрал пару приемчиков себе.

2. "Моя жизнь в искусстве" - автобиография.

Меня позабавило два момента. В первом Станиславский пишет, что "на все лето уехал в Финляндию, сидел на скалах, и мысленно перебирал свои роли". Вот это уровень свободы! На все лето в Финляндию, да еще и без смартфона. Хотя в действительности это сидение на скалах дало сильнейший толчок его знаменитой системе, которая потом произвела большой взрыв.

Второй момент - Станиславский родился в богатой семье. Но всю жизнь у него были финансовые качели - то миллионер, то в долгах (после своих театральных "стартапов"). А потом еще пришла революция, и все деньги он потерял. В сотый раз увидел пример того, что жизнь по призванию, жизнь Творца позволяет относиться к материальному проще, но без крайностей античных философов.

Я получил удовольствие от чтения, а читать ли книги "других миров" - оставляю на ваше усмотрение.


P.S. Я тоже посидел. Правда, не на скалах, не в Финляндии и не все лето, но тоже отрефлексировал свой последний год жизни. В грядущем деловом сезоне буду воплощать задумки.
201
AI-помощник для страховых компаний

Ранее я писал про Первый Аджастер – платформа для помощи страхователям в подаче заявлений о страховых выплатах.
А недавно Y Combinator «выпустил» AI-помощника для противоположной стороны - для страховщиков. Называется Solva.

Основная идея продукта – заменить человека на этапе первичной проверки документов и помочь ему оценить обоснованность заявления о выплате страхового возмещения. Solva предлагает следующий функционал:

1) Проверка полноты комплекта документов к заявлению, незаполненных данных;
2) Проверка заявления на предмет соответствия внутренним правилам (про то, как это делается с т.з. комп.науки и семантики я писал магистерскую);
3) Автоматическое выявление мошенничества (я считаю, что здесь только статистика поможет и AI не нужен, но идентификация мошенничества - это отдельная наука)

Обещают, что ответы ИИ будут со ссылками на источники, и что продукт соответствует жестким банковским требованиям к безопасности, а также всем условиям GDPR. В общем – «был бы у меня такой кот …».

У меня нет никаких сомнений, что внутри российских страховых групп человеку уже давно помогает ИИ, но такого функционала в форме отдельного стартапа у нас не встречал.

Видимо, уже недалеко времена, когда сначала между собой будут разбираться AI-страхователь и AI-страховщик, а человек как арбитр будет по итогам их спора принимать решение.

#обзор_продукта
73
Индустрия автоматизированной проверки сайтов

В России очень много сайтов. В рунете (.ru, .рф, .su) зарегистрировано 6,4 млн доменных имен. Многие из них имеют сайты. А сколько сайтов в других зонах (.com и т.п.), которые ориентированы на россиян и принадлежат россиянам – сказать еще сложнее.

Ко всему этому хозяйству появились требования и запреты в разных плоскостях: персональные данные, запрещенные материалы, маркировка рекламы и т.п. Очевидно, государственный служащий проверять такие объемы вручную не может. И тут на помощь приходит автоматизация и ИИ.

РКН:

- проверяет сайт на предмет соответствия законодательству о персональных данных
- проверяет сайт на предмет соблюдения законодательства о рекламе
- проверяет (планирует проверять) сайт на наличие незаконного контента

В противовес РКН появилась линейка продуктов, которые делают то же самое без участия или с минимальным участием человека, но в отличие от РКН это не приводит к разбирательствам с органом:

- РосКом онлайн - проверяет сайт на предмет соответствия законодательству о персональных данных, о рекламе и даже ГК РФ (любопытно)
- 1PS.ru – проверка на соответствие законодательству о персональных данных;
- 152scan – проверка на соответствие законодательству о персональных данных;
И еще масса продуктов, которые решают ту же самую задачу, но с использованием юристов, пример.

С точки зрения технологии под капотом использование ИИ неочевидно: для базового сценария (охватывает 90% нарушений) достаточно поиска по ключевым словам. Для ИИ я вижу две задачи: определение незаконного контента и проверка сайта по конкретному чек-листу (как это делается для оптимизации договорной работы). Не думаю, что из этих двух задач можно полностью исключить человека.

Ранее я писал про страховщиков и страхователей, там сначала между собой будут разбираться ИИ-агенты, и уже затем будет подключаться человек. Теперь так и в случае с проверкой сайтов.

#обзор_продукта
9
AI-детекторы: часть 1

Все больше людей используют ИИ для создания текстов во всех сферах. И иногда встает вопрос о том, а не является ли конкретный текст порождением ИИ, что по определению снижает мое доверие к нему (независимо от сферы – СМИ или юриспруденция). Здесь на сцену выходят AI-детекторы: софт, который позволяет ответить на вопрос, «кто» написал анализируемый текст.

Под капотом AI-детектора находятся модели разной степени развития, т.к. задача бинарной классификации - стандартная. Поэтому палитра внутренностей AI-детектора широкая: от простых логистических регрессий и наивного байесовского классификатора, до больших языковых моделей.

Первая страница поисковика дает десяток ссылок на разные онлайн детекторы, выбирай – не хочу.

Однако мой опыт их использования показал, что они не работают. Я предлагал нескольким AI-детекторам работы как дореволюционных правоведов, так и советских и современных. Их вердикт был одинаковый: текст сгенерирован ИИ.

Например, фрагмент из учебника гражданского права под редакцией Ю.С. Гамбарова оказался сгенерирован ИИ с вероятностью 74% (по версии одного сайта, на картинке) и с вероятностью 100% сгенерирован ИИ - по версии другого сайта.

В обратную сторону, когда я предлагал для анализа сгенерированный ИИ текст, результат лучше: AI-детектор определил вероятность его ИИ-авторства как 50%. При таком качестве анализа можно использовать монетку и подбрасывать ее над каждым текстом, надежность будет такая же.

Разумеется, у такой недостоверности может быть масса причин – начиная с языка (может быть русский звучит для модели аномально, если вы используется «импортный» софт) и заканчивая невероятным улучшением качества текстов моделей в последнее. В любом случае, я использую ИИ-детекторы лишь как игрушку из любопытства – подтвердит он или опровергнет мое предположение о происхождении текста, но никогда не полагаюсь на его вывод.

P.S. использование ИИ для генерации текстов поддерживаю, но в разумных пределах, когда автор не пытается переложить на языковую модель процесс собственного мышления.
11
AI-детекторы: часть 2

«Естественный» интеллект пока еще справляется с задачей идентификации сгенерированных текстах лучше. Но не везде. Например, в Китае новелла, сгенерированная ИИ, победила в литературном конкурсе. И это 2023 год, страшно подумать, на что языковые модели способны сейчас.

Применительно к юриспруденции я убежден, что генеративным моделям еще очень далеко до подражания юристу. Сужу только по своему опыту. ИИ часто прокалывается в этом:

1. Юристы очень любят пассивный залог. как бы Нора Галь его ни обличала. ИИ на этом обычно спотыкается – он любит скорее активный залог. Это логично, т.к. в обучающей выборке, которая состоит не только из юридических текстов, активный залог преобладает. Поэтому из обучения ИИ скорее всего «нахватался» именно шаблонов с активным залогом.

2. У текстов ИИ больше эмпатии к читателю. ИИ напишет «нам с вами необходимо», «мы должны», юрист в 99% случаев напишет безлично или в 3-м лице: «необходимо» или «покупатель обязан».

3. Очевидная нелогичность. Я недавно написал так: «в результате рассмотрения дела судом первой инстанции иск удовлетворен в полном объеме». В этом фрагменте, на минуточку, 5 подряд идущих существительных, а всего их 8. В таких длинных последовательностях ИИ может нарушать согласование существительных и выбирать не тот падеж. Есть шутка на эту тему, возникшая на заре обработки естественного языка: знаете самое частотное сочетание из 3 подряд идущих прилагательных? Ответ: российские железные дороги.

4. Вымышленные нормы и даты. Тут без комменатриев. Подозрения усиливаются, если нет конкретики: номера пунктов, дни в датах.

5. Необычное деление ответа на блоки и необычное именование блоков. Например, я ни разу у юристов в деловых текстах (включая письма, процессуальные документы) не встречал блок, озаглавленный так: «Почему это полезно?». А у ИИ встречаю регулярно.

6. Буква «ё». ИИ ее очень любит, а в юридических текстах я встречаю ее очень редко. Особенно ярко это выявляется при сравнении других текстов того же автора – обычно не пишет, а тут старательно везде указал «ё».

7. Специальная терминология, которую используете только ваша компания, команда, школа кунг-фу. На этом билете в социальную среду ИИ точно проколется.

Разумеется, если хорошенько поработать над сгенерированным текстом, то отличить его от человеческого будет невозможно, и, в таком случае ИИ ускорит работу юриста, что я поддерживаю обеими руками.

Какие лайфхаки используете вы?
111
В продолжение постов про AI-детекцию не лишним будет упомянуть другие сферы, где ИИ активно помогает писать - это программирование.

Там с качеством работы LLM все лучше, т.к. обучить написанию кода легче. Еще бы, ведь синтаксис и словарь любого языка программирования не сравнятся с естественеым языком.

Поэтому разработчики часто пользуются им для кодинга. Но LLM, как и любой инструмент, при неправильном использовании превращается во вредителя:

- ИИ генерирует код в 1.7 раз хуже, чем человек. Это ведет к тому, что скорость разработки падает на 19%.

- Разработчики "глупеют" из-за частого использования ИИ.

Чтобы таких последствий не было, придется делать самим то, что все ждут от LLM - думать. Это нужно для того, чтобы ставить ясный и структурированный промпт, которого не будет, если вы довольно серьезно продумали задачу сами. И вот тогда вы с большей вероятностью получите хороший ответ и быстрее сделаете задачу. По-другому никак.

У юристов пока ситуация лучше:

- ИИ генерирует юридический текст в 3 раза хуже (по моим прикидкам) чем человек;

- промпт-инжиниринг у большинства юристов на бытовом уровне, где качественная отработка LLM юридических задач невозможна.

Поэтому замедление проектов и снижение когнитивных способностей нам в ближайшее время не грозит.
73
Дорогие подписчики, спасибо, что вы со мной, читаете и делитесь постами. С наступающим новым годом, желаю, чтобы все мечты сбывались и всегда была искра!
21