Ранее я писал о том, что подготовку протоколов судебных заседаний поручат ИИ. В ОАЭ пошли дальше - они планируют делегировать ИИ написание законов. Пока это только планы, но прежде всего властям ОАЭ придется решить проблему низкого качества LLM для арабского языка (чем менее распространен язык, тем меньше под него обучают модели).
Анализируя некоторые наши федеральные законы, я прихожу к выводу, что ИИ пишет законы в России примерно с 2000 года.
Анализируя некоторые наши федеральные законы, я прихожу к выводу, что ИИ пишет законы в России примерно с 2000 года.
Вышла моя статья по отдельному вопросу об утечках ПД
Ранее я писал о том, что повышение штрафов неизбежно заставит бизнес внимательнее относиться к спорам о привлечении административной ответственности за утечки.
Это же приведет к тому, что юристы на другом уровне глубины будут аргументировать свои позиции, что станет толчком к развитию административно-деликтного права.
В спорах об утечке есть интересная особенность - там невластный субъект сообщает властному субъекту сведения об объективной стороне правонарушения (в котором, скорее всего, сам будет уличен). Ближайший аналог из уголовного права - признательные показания.
Как суд должен оценивать такие сведения об объективной стороне, сообщенные потенциальным нарушителем? Может ли оператор отказаться от них или изменить? Вопрос, конечно, общетеоретический, но в статье я изложил свое видение применительно к уведомлению оператора об утечке.
P.S. если нужен полный текст - вы знаете, что делать;)
Ранее я писал о том, что повышение штрафов неизбежно заставит бизнес внимательнее относиться к спорам о привлечении административной ответственности за утечки.
Это же приведет к тому, что юристы на другом уровне глубины будут аргументировать свои позиции, что станет толчком к развитию административно-деликтного права.
В спорах об утечке есть интересная особенность - там невластный субъект сообщает властному субъекту сведения об объективной стороне правонарушения (в котором, скорее всего, сам будет уличен). Ближайший аналог из уголовного права - признательные показания.
Как суд должен оценивать такие сведения об объективной стороне, сообщенные потенциальным нарушителем? Может ли оператор отказаться от них или изменить? Вопрос, конечно, общетеоретический, но в статье я изложил свое видение применительно к уведомлению оператора об утечке.
P.S. если нужен полный текст - вы знаете, что делать;)
www.advgazeta.ru
Доказательственная сила уведомления оператора об утечке персональных данных
Впервые в КоАП введено наказание за невыполнение обязанности уведомлять об утечке
Судебная практика по утечкам перс.данных
Я как-то писал о том, что мы проанализировали много судебных актов на уровне мировых судей и районных судов. Делимся с вами!
Я как-то писал о том, что мы проанализировали много судебных актов на уровне мировых судей и районных судов. Делимся с вами!
ПРАВО.Ru
Эмпирический анализ судебной практики об утечках персональных данных
С 30 мая административная ответственность за утечки персональных данных станет намного суровее. Другой важной поправкой будет изменение компетентного суда: сейчас эти дела рассматривают мировые судьи, будут — арбитражные суды. Поэтому интересно рассмотреть…
Май - время стратегических рубежей
11 мая - дочери исполняется 1 год
14 мая - гос.экзамен в магистратуре МГУ
16 мая - адвокатский экзамен (тест)
28 мая - защита магистерской.
В теории, на май может выпасть и устная часть адвокатского экзамена.
Работаем. Будет💣 💣 💣
11 мая - дочери исполняется 1 год
14 мая - гос.экзамен в магистратуре МГУ
16 мая - адвокатский экзамен (тест)
28 мая - защита магистерской.
В теории, на май может выпасть и устная часть адвокатского экзамена.
Работаем. Будет
Please open Telegram to view this post
VIEW IN TELEGRAM
Технолитигация
Май - время стратегических рубежей 11 мая - дочери исполняется 1 год 14 мая - гос.экзамен в магистратуре МГУ 16 мая - адвокатский экзамен (тест) 28 мая - защита магистерской. В теории, на май может выпасть и устная часть адвокатского экзамена. Работаем.…
Итоги спринта май-середина июня:
1. На дне рождения Веры Артемовны порвали два баяна - ✅
2. Гос.экзамен в МГУ - ✅
3. Тест в рамках адвокатского экзамена - ✅
4. Защита магистерской в МГУ - ✅
Я очень рад завершению госа и защите магистерской. Высвободились доп.ресурсы, которые раньше шли на магистратуру, теперь из режима "копим знания" перехожу в режим "применяем знания".
1. На дне рождения Веры Артемовны порвали два баяна - ✅
2. Гос.экзамен в МГУ - ✅
3. Тест в рамках адвокатского экзамена - ✅
4. Защита магистерской в МГУ - ✅
Я очень рад завершению госа и защите магистерской. Высвободились доп.ресурсы, которые раньше шли на магистратуру, теперь из режима "копим знания" перехожу в режим "применяем знания".
Семинар по персональным данным
Уже завтра будет наш второй семинар из цикла по персональным данным. В этот раз есть возможность онлайн-участия.
Обсудим не только мои любые утечки персональных данных, но и последние нововведения в области локализации (а там штрафы за повторное нарушение, на минуточку, до 18 млн. руб.).
Присоединяйтесь!
Уже завтра будет наш второй семинар из цикла по персональным данным. В этот раз есть возможность онлайн-участия.
Обсудим не только мои любые утечки персональных данных, но и последние нововведения в области локализации (а там штрафы за повторное нарушение, на минуточку, до 18 млн. руб.).
Присоединяйтесь!
Telegram
LEVEL Legal Services
⬜️ Виктор Домшенко, партнёр, глава практики коммерческих споров и групповых исков, LEVEL Legal Services, и Алексей Мунтян, основатель и CEO Privacy Advocates, эксперт в области инфоприватности и внешний DPO в транснациональных холдингах, проведут практический…
Сегодня провели еще один увлекательный семинар по перс.данным.
Затронули злободневные проблемы - утечки, новые требования к локализации (с 1 июля), обсудили статистику привлечения к административной ответственности по ст. 13.11 и другим статьям КоАП, связанным с персональными данными.
Я рассказывал про привлечение к ответственности за:
- неопубликование политики обработки ПД;
- игнорирование требований пользователя, касающиеся обработки его перс.данных;
- игнорирование требований об уточнении / уничтожении перс.данных;
- нарушение требований к хранению данных (не в эл.виде) - это случаи, когда условная поликлиника выбросила в мусорку во дворе медицинские карты своих пациентов.
Ближайшее время напишу об этих составах более подробно. Не переключайтесь!
Затронули злободневные проблемы - утечки, новые требования к локализации (с 1 июля), обсудили статистику привлечения к административной ответственности по ст. 13.11 и другим статьям КоАП, связанным с персональными данными.
Я рассказывал про привлечение к ответственности за:
- неопубликование политики обработки ПД;
- игнорирование требований пользователя, касающиеся обработки его перс.данных;
- игнорирование требований об уточнении / уничтожении перс.данных;
- нарушение требований к хранению данных (не в эл.виде) - это случаи, когда условная поликлиника выбросила в мусорку во дворе медицинские карты своих пациентов.
Ближайшее время напишу об этих составах более подробно. Не переключайтесь!
Благодарности
В этом месяце завершилась большая веха моей профессиональной жизни - я закончил магистратуру по компьютерной лингвистике в МГУ.
Для меня ясно, что этот путь я сумел пройти потому, что мои близкие меня поддержали.
Вот они:
1. Супруга, которая была моей поддержкой и опорой, несмотря на обстоятельства.
2. Виктор Домшенко, без помощи и огня которого я бы вряд ли дошел до конца.
3. Папа, мама, бабушка, брат, сестра и тетя, которые меня всегда во всем поддерживают.
Я безгранично благодарен этим людям, без них ничего бы не вышло.
Сейчас, после завершения МГУ занимаюсь долгосрочным планированием развития в области права и технологий.
В этом месяце завершилась большая веха моей профессиональной жизни - я закончил магистратуру по компьютерной лингвистике в МГУ.
Для меня ясно, что этот путь я сумел пройти потому, что мои близкие меня поддержали.
Вот они:
1. Супруга, которая была моей поддержкой и опорой, несмотря на обстоятельства.
2. Виктор Домшенко, без помощи и огня которого я бы вряд ли дошел до конца.
3. Папа, мама, бабушка, брат, сестра и тетя, которые меня всегда во всем поддерживают.
Я безгранично благодарен этим людям, без них ничего бы не вышло.
Сейчас, после завершения МГУ занимаюсь долгосрочным планированием развития в области права и технологий.
Не про технолитигацию
В отпуске прочитал две работы К.С. Станиславского: "Работа актера над собой" и "Моя жизнь в искусстве".
1. Очень мало профессий, которые требуют специфической работы с подсознанием. Пока могу выделить только актеров и военных. И те, и другие в процессе обучения ломают себя в прямом и переносном смысле. Актеры, в частности, "должны вызывать у себя вдохновение во время, указанное в афише". Было интересно через щель в заборе поглядеть на этот необычный мир деятелей сцены.
Из того, как я понял текст, актеры добиваются высокого уровня исполнения, когда убеждают себя в правдоподобности происходящего. Дальше вступает человеческая природа (подсознание), которая создает роль без каких-либо наигрышей и актерских штампов. Сознание заинтересовывает подсознание. Актер как бы говорит себе: "да, все декорации вокруг и лица пьесы - ненастоящие. Я это знаю, мне до этого нет дела. Но если бы они были настоящие, то я бы действовал или отнесся к такому-то событию следующим образом".
Разумеется, у книги 2-3-4 дна, я увидел, что смог. Нашел много пересечений со своей профессией. Нам, судебным юристам, тоже нужно самим поверить в правовую позицию, и только потом убеждать других. Было и про тщеславие и восприятие критики, но они всем известны и поэтому скучны. Меня подкупило, что Станиславский не стесняется писать о своих промахах и ошибках.
"Работа актера над собой" оставила сильный след. Не то, чтобы я научился управлять вдохновением, но я увидел как это делают (или пытаются делать) актеры. Забрал пару приемчиков себе.
2. "Моя жизнь в искусстве" - автобиография.
Меня позабавило два момента. В первом Станиславский пишет, что "на все лето уехал в Финляндию, сидел на скалах, и мысленно перебирал свои роли". Вот это уровень свободы! На все лето в Финляндию, да еще и без смартфона. Хотя в действительности это сидение на скалах дало сильнейший толчок его знаменитой системе, которая потом произвела большой взрыв.
Второй момент - Станиславский родился в богатой семье. Но всю жизнь у него были финансовые качели - то миллионер, то в долгах (после своих театральных "стартапов"). А потом еще пришла революция, и все деньги он потерял. В сотый раз увидел пример того, что жизнь по призванию, жизнь Творца позволяет относиться к материальному проще, но без крайностей античных философов.
Я получил удовольствие от чтения, а читать ли книги "других миров" - оставляю на ваше усмотрение.
P.S. Я тоже посидел. Правда, не на скалах, не в Финляндии и не все лето, но тоже отрефлексировал свой последний год жизни. В грядущем деловом сезоне буду воплощать задумки.
В отпуске прочитал две работы К.С. Станиславского: "Работа актера над собой" и "Моя жизнь в искусстве".
1. Очень мало профессий, которые требуют специфической работы с подсознанием. Пока могу выделить только актеров и военных. И те, и другие в процессе обучения ломают себя в прямом и переносном смысле. Актеры, в частности, "должны вызывать у себя вдохновение во время, указанное в афише". Было интересно через щель в заборе поглядеть на этот необычный мир деятелей сцены.
Из того, как я понял текст, актеры добиваются высокого уровня исполнения, когда убеждают себя в правдоподобности происходящего. Дальше вступает человеческая природа (подсознание), которая создает роль без каких-либо наигрышей и актерских штампов. Сознание заинтересовывает подсознание. Актер как бы говорит себе: "да, все декорации вокруг и лица пьесы - ненастоящие. Я это знаю, мне до этого нет дела. Но если бы они были настоящие, то я бы действовал или отнесся к такому-то событию следующим образом".
Разумеется, у книги 2-3-4 дна, я увидел, что смог. Нашел много пересечений со своей профессией. Нам, судебным юристам, тоже нужно самим поверить в правовую позицию, и только потом убеждать других. Было и про тщеславие и восприятие критики, но они всем известны и поэтому скучны. Меня подкупило, что Станиславский не стесняется писать о своих промахах и ошибках.
"Работа актера над собой" оставила сильный след. Не то, чтобы я научился управлять вдохновением, но я увидел как это делают (или пытаются делать) актеры. Забрал пару приемчиков себе.
2. "Моя жизнь в искусстве" - автобиография.
Меня позабавило два момента. В первом Станиславский пишет, что "на все лето уехал в Финляндию, сидел на скалах, и мысленно перебирал свои роли". Вот это уровень свободы! На все лето в Финляндию, да еще и без смартфона. Хотя в действительности это сидение на скалах дало сильнейший толчок его знаменитой системе, которая потом произвела большой взрыв.
Второй момент - Станиславский родился в богатой семье. Но всю жизнь у него были финансовые качели - то миллионер, то в долгах (после своих театральных "стартапов"). А потом еще пришла революция, и все деньги он потерял. В сотый раз увидел пример того, что жизнь по призванию, жизнь Творца позволяет относиться к материальному проще, но без крайностей античных философов.
Я получил удовольствие от чтения, а читать ли книги "других миров" - оставляю на ваше усмотрение.
P.S. Я тоже посидел. Правда, не на скалах, не в Финляндии и не все лето, но тоже отрефлексировал свой последний год жизни. В грядущем деловом сезоне буду воплощать задумки.
AI-помощник для страховых компаний
Ранее я писал про Первый Аджастер – платформа для помощи страхователям в подаче заявлений о страховых выплатах.
А недавно Y Combinator «выпустил» AI-помощника для противоположной стороны - для страховщиков. Называется Solva.
Основная идея продукта – заменить человека на этапе первичной проверки документов и помочь ему оценить обоснованность заявления о выплате страхового возмещения. Solva предлагает следующий функционал:
1) Проверка полноты комплекта документов к заявлению, незаполненных данных;
2) Проверка заявления на предмет соответствия внутренним правилам (про то, как это делается с т.з. комп.науки и семантики я писал магистерскую);
3) Автоматическое выявление мошенничества (я считаю, что здесь только статистика поможет и AI не нужен, но идентификация мошенничества - это отдельная наука)
Обещают, что ответы ИИ будут со ссылками на источники, и что продукт соответствует жестким банковским требованиям к безопасности, а также всем условиям GDPR. В общем – «был бы у меня такой кот …».
У меня нет никаких сомнений, что внутри российских страховых групп человеку уже давно помогает ИИ, но такого функционала в форме отдельного стартапа у нас не встречал.
Видимо, уже недалеко времена, когда сначала между собой будут разбираться AI-страхователь и AI-страховщик, а человек как арбитр будет по итогам их спора принимать решение.
#обзор_продукта
Ранее я писал про Первый Аджастер – платформа для помощи страхователям в подаче заявлений о страховых выплатах.
А недавно Y Combinator «выпустил» AI-помощника для противоположной стороны - для страховщиков. Называется Solva.
Основная идея продукта – заменить человека на этапе первичной проверки документов и помочь ему оценить обоснованность заявления о выплате страхового возмещения. Solva предлагает следующий функционал:
1) Проверка полноты комплекта документов к заявлению, незаполненных данных;
2) Проверка заявления на предмет соответствия внутренним правилам (про то, как это делается с т.з. комп.науки и семантики я писал магистерскую);
3) Автоматическое выявление мошенничества (я считаю, что здесь только статистика поможет и AI не нужен, но идентификация мошенничества - это отдельная наука)
Обещают, что ответы ИИ будут со ссылками на источники, и что продукт соответствует жестким банковским требованиям к безопасности, а также всем условиям GDPR. В общем – «был бы у меня такой кот …».
У меня нет никаких сомнений, что внутри российских страховых групп человеку уже давно помогает ИИ, но такого функционала в форме отдельного стартапа у нас не встречал.
Видимо, уже недалеко времена, когда сначала между собой будут разбираться AI-страхователь и AI-страховщик, а человек как арбитр будет по итогам их спора принимать решение.
#обзор_продукта
Telegram
Технолитигация
#обзор_продукта
Название: Первый Аджастер
Боль, которую лечит продукт: сложный процесс подачи документов для получения страхового возмещения.
Описание продукта: платформа, которая сводит клиента, желающего получить страховое возмещение и НЕ желающего «возиться…
Название: Первый Аджастер
Боль, которую лечит продукт: сложный процесс подачи документов для получения страхового возмещения.
Описание продукта: платформа, которая сводит клиента, желающего получить страховое возмещение и НЕ желающего «возиться…
Индустрия автоматизированной проверки сайтов
В России очень много сайтов. В рунете (.ru, .рф, .su) зарегистрировано 6,4 млн доменных имен. Многие из них имеют сайты. А сколько сайтов в других зонах (.com и т.п.), которые ориентированы на россиян и принадлежат россиянам – сказать еще сложнее.
Ко всему этому хозяйству появились требования и запреты в разных плоскостях: персональные данные, запрещенные материалы, маркировка рекламы и т.п. Очевидно, государственный служащий проверять такие объемы вручную не может. И тут на помощь приходит автоматизация и ИИ.
РКН:
- проверяет сайт на предмет соответствия законодательству о персональных данных
- проверяет сайт на предмет соблюдения законодательства о рекламе
- проверяет (планирует проверять) сайт на наличие незаконного контента
В противовес РКН появилась линейка продуктов, которые делают то же самое без участия или с минимальным участием человека, но в отличие от РКН это не приводит к разбирательствам с органом:
- РосКом онлайн - проверяет сайт на предмет соответствия законодательству о персональных данных, о рекламе и даже ГК РФ (любопытно)
- 1PS.ru – проверка на соответствие законодательству о персональных данных;
- 152scan – проверка на соответствие законодательству о персональных данных;
И еще масса продуктов, которые решают ту же самую задачу, но с использованием юристов, пример.
С точки зрения технологии под капотом использование ИИ неочевидно: для базового сценария (охватывает 90% нарушений) достаточно поиска по ключевым словам. Для ИИ я вижу две задачи: определение незаконного контента и проверка сайта по конкретному чек-листу (как это делается для оптимизации договорной работы). Не думаю, что из этих двух задач можно полностью исключить человека.
Ранее я писал про страховщиков и страхователей, там сначала между собой будут разбираться ИИ-агенты, и уже затем будет подключаться человек. Теперь так и в случае с проверкой сайтов.
#обзор_продукта
В России очень много сайтов. В рунете (.ru, .рф, .su) зарегистрировано 6,4 млн доменных имен. Многие из них имеют сайты. А сколько сайтов в других зонах (.com и т.п.), которые ориентированы на россиян и принадлежат россиянам – сказать еще сложнее.
Ко всему этому хозяйству появились требования и запреты в разных плоскостях: персональные данные, запрещенные материалы, маркировка рекламы и т.п. Очевидно, государственный служащий проверять такие объемы вручную не может. И тут на помощь приходит автоматизация и ИИ.
РКН:
- проверяет сайт на предмет соответствия законодательству о персональных данных
- проверяет сайт на предмет соблюдения законодательства о рекламе
- проверяет (планирует проверять) сайт на наличие незаконного контента
В противовес РКН появилась линейка продуктов, которые делают то же самое без участия или с минимальным участием человека, но в отличие от РКН это не приводит к разбирательствам с органом:
- РосКом онлайн - проверяет сайт на предмет соответствия законодательству о персональных данных, о рекламе и даже ГК РФ (любопытно)
- 1PS.ru – проверка на соответствие законодательству о персональных данных;
- 152scan – проверка на соответствие законодательству о персональных данных;
И еще масса продуктов, которые решают ту же самую задачу, но с использованием юристов, пример.
С точки зрения технологии под капотом использование ИИ неочевидно: для базового сценария (охватывает 90% нарушений) достаточно поиска по ключевым словам. Для ИИ я вижу две задачи: определение незаконного контента и проверка сайта по конкретному чек-листу (как это делается для оптимизации договорной работы). Не думаю, что из этих двух задач можно полностью исключить человека.
Ранее я писал про страховщиков и страхователей, там сначала между собой будут разбираться ИИ-агенты, и уже затем будет подключаться человек. Теперь так и в случае с проверкой сайтов.
#обзор_продукта
РБК Тренды
6,4 млн доменов зарегистрировано в Рунете
7 апреля 2024 года Рунету — российскому сегменту интернета — исполняется 30 лет. Рассказываем, сколько зарегистрировано сайтов в Рунете и доменов в национальных доменных зонах .ru, .рф и .su
AI-детекторы: часть 1
Все больше людей используют ИИ для создания текстов во всех сферах. И иногда встает вопрос о том, а не является ли конкретный текст порождением ИИ, что по определению снижает мое доверие к нему (независимо от сферы – СМИ или юриспруденция). Здесь на сцену выходят AI-детекторы: софт, который позволяет ответить на вопрос, «кто» написал анализируемый текст.
Под капотом AI-детектора находятся модели разной степени развития, т.к. задача бинарной классификации - стандартная. Поэтому палитра внутренностей AI-детектора широкая: от простых логистических регрессий и наивного байесовского классификатора, до больших языковых моделей.
Первая страница поисковика дает десяток ссылок на разные онлайн детекторы, выбирай – не хочу.
Однако мой опыт их использования показал, что они не работают. Я предлагал нескольким AI-детекторам работы как дореволюционных правоведов, так и советских и современных. Их вердикт был одинаковый: текст сгенерирован ИИ.
Например, фрагмент из учебника гражданского права под редакцией Ю.С. Гамбарова оказался сгенерирован ИИ с вероятностью 74% (по версии одного сайта, на картинке) и с вероятностью 100% сгенерирован ИИ - по версии другого сайта.
В обратную сторону, когда я предлагал для анализа сгенерированный ИИ текст, результат лучше: AI-детектор определил вероятность его ИИ-авторства как 50%. При таком качестве анализа можно использовать монетку и подбрасывать ее над каждым текстом, надежность будет такая же.
Разумеется, у такой недостоверности может быть масса причин – начиная с языка (может быть русский звучит для модели аномально, если вы используется «импортный» софт) и заканчивая невероятным улучшением качества текстов моделей в последнее. В любом случае, я использую ИИ-детекторы лишь как игрушку из любопытства – подтвердит он или опровергнет мое предположение о происхождении текста, но никогда не полагаюсь на его вывод.
P.S. использование ИИ для генерации текстов поддерживаю, но в разумных пределах, когда автор не пытается переложить на языковую модель процесс собственного мышления.
Все больше людей используют ИИ для создания текстов во всех сферах. И иногда встает вопрос о том, а не является ли конкретный текст порождением ИИ, что по определению снижает мое доверие к нему (независимо от сферы – СМИ или юриспруденция). Здесь на сцену выходят AI-детекторы: софт, который позволяет ответить на вопрос, «кто» написал анализируемый текст.
Под капотом AI-детектора находятся модели разной степени развития, т.к. задача бинарной классификации - стандартная. Поэтому палитра внутренностей AI-детектора широкая: от простых логистических регрессий и наивного байесовского классификатора, до больших языковых моделей.
Первая страница поисковика дает десяток ссылок на разные онлайн детекторы, выбирай – не хочу.
Однако мой опыт их использования показал, что они не работают. Я предлагал нескольким AI-детекторам работы как дореволюционных правоведов, так и советских и современных. Их вердикт был одинаковый: текст сгенерирован ИИ.
Например, фрагмент из учебника гражданского права под редакцией Ю.С. Гамбарова оказался сгенерирован ИИ с вероятностью 74% (по версии одного сайта, на картинке) и с вероятностью 100% сгенерирован ИИ - по версии другого сайта.
В обратную сторону, когда я предлагал для анализа сгенерированный ИИ текст, результат лучше: AI-детектор определил вероятность его ИИ-авторства как 50%. При таком качестве анализа можно использовать монетку и подбрасывать ее над каждым текстом, надежность будет такая же.
Разумеется, у такой недостоверности может быть масса причин – начиная с языка (может быть русский звучит для модели аномально, если вы используется «импортный» софт) и заканчивая невероятным улучшением качества текстов моделей в последнее. В любом случае, я использую ИИ-детекторы лишь как игрушку из любопытства – подтвердит он или опровергнет мое предположение о происхождении текста, но никогда не полагаюсь на его вывод.
P.S. использование ИИ для генерации текстов поддерживаю, но в разумных пределах, когда автор не пытается переложить на языковую модель процесс собственного мышления.
AI-детекторы: часть 2
«Естественный» интеллект пока еще справляется с задачей идентификации сгенерированных текстах лучше. Но не везде. Например, в Китае новелла, сгенерированная ИИ, победила в литературном конкурсе. И это 2023 год, страшно подумать, на что языковые модели способны сейчас.
Применительно к юриспруденции я убежден, что генеративным моделям еще очень далеко до подражания юристу. Сужу только по своему опыту. ИИ часто прокалывается в этом:
1. Юристы очень любят пассивный залог. как бы Нора Галь его ни обличала. ИИ на этом обычно спотыкается – он любит скорее активный залог. Это логично, т.к. в обучающей выборке, которая состоит не только из юридических текстов, активный залог преобладает. Поэтому из обучения ИИ скорее всего «нахватался» именно шаблонов с активным залогом.
2. У текстов ИИ больше эмпатии к читателю. ИИ напишет «нам с вами необходимо», «мы должны», юрист в 99% случаев напишет безлично или в 3-м лице: «необходимо» или «покупатель обязан».
3. Очевидная нелогичность. Я недавно написал так: «в результате рассмотрения дела судом первой инстанции иск удовлетворен в полном объеме». В этом фрагменте, на минуточку, 5 подряд идущих существительных, а всего их 8. В таких длинных последовательностях ИИ может нарушать согласование существительных и выбирать не тот падеж. Есть шутка на эту тему, возникшая на заре обработки естественного языка: знаете самое частотное сочетание из 3 подряд идущих прилагательных? Ответ: российские железные дороги.
4. Вымышленные нормы и даты. Тут без комменатриев. Подозрения усиливаются, если нет конкретики: номера пунктов, дни в датах.
5. Необычное деление ответа на блоки и необычное именование блоков. Например, я ни разу у юристов в деловых текстах (включая письма, процессуальные документы) не встречал блок, озаглавленный так: «Почему это полезно?». А у ИИ встречаю регулярно.
6. Буква «ё». ИИ ее очень любит, а в юридических текстах я встречаю ее очень редко. Особенно ярко это выявляется при сравнении других текстов того же автора – обычно не пишет, а тут старательно везде указал «ё».
7. Специальная терминология, которую используете только ваша компания, команда, школа кунг-фу. На этом билете в социальную среду ИИ точно проколется.
Разумеется, если хорошенько поработать над сгенерированным текстом, то отличить его от человеческого будет невозможно, и, в таком случае ИИ ускорит работу юриста, что я поддерживаю обеими руками.
Какие лайфхаки используете вы?
«Естественный» интеллект пока еще справляется с задачей идентификации сгенерированных текстах лучше. Но не везде. Например, в Китае новелла, сгенерированная ИИ, победила в литературном конкурсе. И это 2023 год, страшно подумать, на что языковые модели способны сейчас.
Применительно к юриспруденции я убежден, что генеративным моделям еще очень далеко до подражания юристу. Сужу только по своему опыту. ИИ часто прокалывается в этом:
1. Юристы очень любят пассивный залог. как бы Нора Галь его ни обличала. ИИ на этом обычно спотыкается – он любит скорее активный залог. Это логично, т.к. в обучающей выборке, которая состоит не только из юридических текстов, активный залог преобладает. Поэтому из обучения ИИ скорее всего «нахватался» именно шаблонов с активным залогом.
2. У текстов ИИ больше эмпатии к читателю. ИИ напишет «нам с вами необходимо», «мы должны», юрист в 99% случаев напишет безлично или в 3-м лице: «необходимо» или «покупатель обязан».
3. Очевидная нелогичность. Я недавно написал так: «в результате рассмотрения дела судом первой инстанции иск удовлетворен в полном объеме». В этом фрагменте, на минуточку, 5 подряд идущих существительных, а всего их 8. В таких длинных последовательностях ИИ может нарушать согласование существительных и выбирать не тот падеж. Есть шутка на эту тему, возникшая на заре обработки естественного языка: знаете самое частотное сочетание из 3 подряд идущих прилагательных? Ответ: российские железные дороги.
4. Вымышленные нормы и даты. Тут без комменатриев. Подозрения усиливаются, если нет конкретики: номера пунктов, дни в датах.
5. Необычное деление ответа на блоки и необычное именование блоков. Например, я ни разу у юристов в деловых текстах (включая письма, процессуальные документы) не встречал блок, озаглавленный так: «Почему это полезно?». А у ИИ встречаю регулярно.
6. Буква «ё». ИИ ее очень любит, а в юридических текстах я встречаю ее очень редко. Особенно ярко это выявляется при сравнении других текстов того же автора – обычно не пишет, а тут старательно везде указал «ё».
7. Специальная терминология, которую используете только ваша компания, команда, школа кунг-фу. На этом билете в социальную среду ИИ точно проколется.
Разумеется, если хорошенько поработать над сгенерированным текстом, то отличить его от человеческого будет невозможно, и, в таком случае ИИ ускорит работу юриста, что я поддерживаю обеими руками.
Какие лайфхаки используете вы?
В продолжение постов про AI-детекцию не лишним будет упомянуть другие сферы, где ИИ активно помогает писать - это программирование.
Там с качеством работы LLM все лучше, т.к. обучить написанию кода легче. Еще бы, ведь синтаксис и словарь любого языка программирования не сравнятся с естественеым языком.
Поэтому разработчики часто пользуются им для кодинга. Но LLM, как и любой инструмент, при неправильном использовании превращается во вредителя:
- ИИ генерирует код в 1.7 раз хуже, чем человек. Это ведет к тому, что скорость разработки падает на 19%.
- Разработчики "глупеют" из-за частого использования ИИ.
Чтобы таких последствий не было, придется делать самим то, что все ждут от LLM - думать. Это нужно для того, чтобы ставить ясный и структурированный промпт, которого не будет, если вы довольно серьезно продумали задачу сами. И вот тогда вы с большей вероятностью получите хороший ответ и быстрее сделаете задачу. По-другому никак.
У юристов пока ситуация лучше:
- ИИ генерирует юридический текст в 3 раза хуже (по моим прикидкам) чем человек;
- промпт-инжиниринг у большинства юристов на бытовом уровне, где качественная отработка LLM юридических задач невозможна.
Поэтому замедление проектов и снижение когнитивных способностей нам в ближайшее время не грозит.
Там с качеством работы LLM все лучше, т.к. обучить написанию кода легче. Еще бы, ведь синтаксис и словарь любого языка программирования не сравнятся с естественеым языком.
Поэтому разработчики часто пользуются им для кодинга. Но LLM, как и любой инструмент, при неправильном использовании превращается во вредителя:
- ИИ генерирует код в 1.7 раз хуже, чем человек. Это ведет к тому, что скорость разработки падает на 19%.
- Разработчики "глупеют" из-за частого использования ИИ.
Чтобы таких последствий не было, придется делать самим то, что все ждут от LLM - думать. Это нужно для того, чтобы ставить ясный и структурированный промпт, которого не будет, если вы довольно серьезно продумали задачу сами. И вот тогда вы с большей вероятностью получите хороший ответ и быстрее сделаете задачу. По-другому никак.
У юристов пока ситуация лучше:
- ИИ генерирует юридический текст в 3 раза хуже (по моим прикидкам) чем человек;
- промпт-инжиниринг у большинства юристов на бытовом уровне, где качественная отработка LLM юридических задач невозможна.
Поэтому замедление проектов и снижение когнитивных способностей нам в ближайшее время не грозит.
Дорогие подписчики, спасибо, что вы со мной, читаете и делитесь постами. С наступающим новым годом, желаю, чтобы все мечты сбывались и всегда была искра!