#обзор_продукта
Название: AI-Referent
Боль, которую лечит продукт: распознавание документов и их первичный анализ. Для крупных компаний, где входящая корреспонденция измеряется не штуками, а в килограммах и тоннах, вопрос распознавания стоит остро: нужно понять, к какому подразделению документ расписать, насколько он критичен (срочен) для компании. Сюда же относится распознавание и анализ материалов судебного дела.
Описание продукта: позволяет распознавать более 1000 типов документов. К ним, я так понимаю, относятся разные унифицированные формы (ТОРГ-12, КС-2, КС-3) и т.п. Продукт сотрудничает с лидером рынка OCR – Smart Engines, поставщиком многих крупных компаний, который позволяет идентифицировать пользователя по паспортным данным и оказывает другие похожие услуги.
Если я правильно понял информацию на сайте, то после сканирования документа алгоритмы, заложенные в продукте (в т.ч. с ИИ, куда же без него), по скану распознают документ и извлекают из него ключевые сущности – тип документа, отправителя, текст, адресата, номер и т.п. Полученные данные предоставляются клиенту в формате json, что очень удобно для дальнейшей работы с документом.
Помимо предоставления данных о документе в удобном виде продукт проводит fraud analysis и photoshop detection. Что за fraud analysis входящего документа – я объяснить не могу. В крупную компанию написал мошенник, который известен продукту? Или в документах не совпадают данные?
Мое мнение о продукте:
Проверка документа на признаки фотошопа – интересная опция, но не уверен, что нужно тратить вычислительные ресурсы для этого на каждый документ. Также я не уверен, что задача по детекции фотошопа на сегодняшний день решается с высокими метриками, поэтому высока вероятность ложного срабатывания (False Positive), что опять же, будет зря привлекать повышенное внимание к каждому документу.
Задаче OCR (optical character recognition) больше 30 лет. На этом рынке есть гиганты (ABBY, Adobe, Amazon, Azure), крепкие середняки (nlogic, дочка Мегафона) и десятки (если не сотни) небольших продуктов. Львиная доля из них поддерживает русский язык или написана для русского языка в первую очередь. И это только те, о которых я знаю. Поэтому рынок довольно конкурентный.
Чем же выделяется AI Referent? Смотрим сайт:
1. Скорость распознавания (заявлено 8 секунд, а у конкурентов, дескать, 30+ секунд). Хотя прямо не указано, но скорее всего речь идет об 1 странице.
2. Поддержка более 100 языков. Удобная опция для компаний с разветвленной международной сетью.
3. Больше типов документов (1000 типов у AI Referent, 500 – у других компаний).
4. Круглосуточная тех.поддержка и ответы в течение часа. У конкурентов есть ограничения.
5. Ценообразование: оплата за документ, а не за каждое (даже неудачное) сканирование.
Сравнение себя с конкурентами, тем более с «абстрактным» – всегда тонкий лед. Например, вот тут утверждается, что Azure распознает 1 страницу не за 30, а за 13 секунд.
Если другие компании и правда такие медленные, жадные и ограничивают тех.поддержку, то продукт должен взлететь. Достаточно ли этих преимуществ в красном океане? Покажет время.
Название: AI-Referent
Боль, которую лечит продукт: распознавание документов и их первичный анализ. Для крупных компаний, где входящая корреспонденция измеряется не штуками, а в килограммах и тоннах, вопрос распознавания стоит остро: нужно понять, к какому подразделению документ расписать, насколько он критичен (срочен) для компании. Сюда же относится распознавание и анализ материалов судебного дела.
Описание продукта: позволяет распознавать более 1000 типов документов. К ним, я так понимаю, относятся разные унифицированные формы (ТОРГ-12, КС-2, КС-3) и т.п. Продукт сотрудничает с лидером рынка OCR – Smart Engines, поставщиком многих крупных компаний, который позволяет идентифицировать пользователя по паспортным данным и оказывает другие похожие услуги.
Если я правильно понял информацию на сайте, то после сканирования документа алгоритмы, заложенные в продукте (в т.ч. с ИИ, куда же без него), по скану распознают документ и извлекают из него ключевые сущности – тип документа, отправителя, текст, адресата, номер и т.п. Полученные данные предоставляются клиенту в формате json, что очень удобно для дальнейшей работы с документом.
Помимо предоставления данных о документе в удобном виде продукт проводит fraud analysis и photoshop detection. Что за fraud analysis входящего документа – я объяснить не могу. В крупную компанию написал мошенник, который известен продукту? Или в документах не совпадают данные?
Мое мнение о продукте:
Проверка документа на признаки фотошопа – интересная опция, но не уверен, что нужно тратить вычислительные ресурсы для этого на каждый документ. Также я не уверен, что задача по детекции фотошопа на сегодняшний день решается с высокими метриками, поэтому высока вероятность ложного срабатывания (False Positive), что опять же, будет зря привлекать повышенное внимание к каждому документу.
Задаче OCR (optical character recognition) больше 30 лет. На этом рынке есть гиганты (ABBY, Adobe, Amazon, Azure), крепкие середняки (nlogic, дочка Мегафона) и десятки (если не сотни) небольших продуктов. Львиная доля из них поддерживает русский язык или написана для русского языка в первую очередь. И это только те, о которых я знаю. Поэтому рынок довольно конкурентный.
Чем же выделяется AI Referent? Смотрим сайт:
1. Скорость распознавания (заявлено 8 секунд, а у конкурентов, дескать, 30+ секунд). Хотя прямо не указано, но скорее всего речь идет об 1 странице.
2. Поддержка более 100 языков. Удобная опция для компаний с разветвленной международной сетью.
3. Больше типов документов (1000 типов у AI Referent, 500 – у других компаний).
4. Круглосуточная тех.поддержка и ответы в течение часа. У конкурентов есть ограничения.
5. Ценообразование: оплата за документ, а не за каждое (даже неудачное) сканирование.
Сравнение себя с конкурентами, тем более с «абстрактным» – всегда тонкий лед. Например, вот тут утверждается, что Azure распознает 1 страницу не за 30, а за 13 секунд.
Если другие компании и правда такие медленные, жадные и ограничивают тех.поддержку, то продукт должен взлететь. Достаточно ли этих преимуществ в красном океане? Покажет время.
ai-referent.ru
Платформа для финансового анализа деятельности предприятия
Автоматический анализ финансовых документов предприятия, структурирование данных, выявление рисков и формирование отчетности
#промпт_инжиниринг
Думаю, что промпты и промпт-инжиниринг уже запечатлены в рептильной части нашего мозга – о них говорят все и всегда. Хочу поделиться с вами «фразочками», которые я часто добавляю в промпт, чтобы попытаться улучшить результат.
Почему «попытаться»? Мои многочисленные эксперименты показывают, что использование этих слов далеко не всегда улучшает качество ответа, может даже ухудшить. Поэтому спросить несколько раз на разных сессиях с LLM одно и то же – важный шаг в работе с LLM.
Итак, «фразочки»:
1. «Ты – опытный юрист с большим стажем. …» – задать роль;
2. Угроза: «В случае неправильного ответа меня уволят с работы»;
3. Поощрение: «Если ты ответишь правильно, то я заплачу тебе ___$»;
4. Попытка справиться с галлюцинациями: «Каждое твое утверждение должно быть основано на документе из запроса. Если твои утверждения не подтверждены каким-либо источником, ты должен предупредить меня об этом».
Лично знаю нескольких людей, которые делают промпт вежливым, и пишут «пожалуйста, сделай Х, спасибо». По нескольким моим запросам вежливость не имела никакого эффекта. Возможно, вежливые промпт-инженеры будут помилованы во время восстания машин
Пример запроса с использованием «фразочек» (мы использовали в том числе и его, когда участвовали в хакатоне):
«Ты – профессионал в сфере добычи и транспортировки нефти и продуктов из нефти, природного газа. Как профессионал, ты следуешь правилам:
1. Каждое твое утверждение должно быть основано на документе из запроса.
2. Если твои утверждения не подтверждены документом, ты должен предупредить меня об этом.
3. Выполняй эту инструкцию настолько точно, насколько сможешь.
4. За правильный ответ я заплачу 5 000 долларов».
Безусловно, это только фрагмент запроса, поскольку в нем отсутствуют более продвинутые техники – meta prompting, self-consistency, generate knowledge prompting и т.п. Но о них – в другой раз!
Думаю, что промпты и промпт-инжиниринг уже запечатлены в рептильной части нашего мозга – о них говорят все и всегда. Хочу поделиться с вами «фразочками», которые я часто добавляю в промпт, чтобы попытаться улучшить результат.
Почему «попытаться»? Мои многочисленные эксперименты показывают, что использование этих слов далеко не всегда улучшает качество ответа, может даже ухудшить. Поэтому спросить несколько раз на разных сессиях с LLM одно и то же – важный шаг в работе с LLM.
Итак, «фразочки»:
1. «Ты – опытный юрист с большим стажем. …» – задать роль;
2. Угроза: «В случае неправильного ответа меня уволят с работы»;
3. Поощрение: «Если ты ответишь правильно, то я заплачу тебе ___$»;
4. Попытка справиться с галлюцинациями: «Каждое твое утверждение должно быть основано на документе из запроса. Если твои утверждения не подтверждены каким-либо источником, ты должен предупредить меня об этом».
Лично знаю нескольких людей, которые делают промпт вежливым, и пишут «пожалуйста, сделай Х, спасибо». По нескольким моим запросам вежливость не имела никакого эффекта. Возможно, вежливые промпт-инженеры будут помилованы во время восстания машин
Пример запроса с использованием «фразочек» (мы использовали в том числе и его, когда участвовали в хакатоне):
«Ты – профессионал в сфере добычи и транспортировки нефти и продуктов из нефти, природного газа. Как профессионал, ты следуешь правилам:
1. Каждое твое утверждение должно быть основано на документе из запроса.
2. Если твои утверждения не подтверждены документом, ты должен предупредить меня об этом.
3. Выполняй эту инструкцию настолько точно, насколько сможешь.
4. За правильный ответ я заплачу 5 000 долларов».
Безусловно, это только фрагмент запроса, поскольку в нем отсутствуют более продвинутые техники – meta prompting, self-consistency, generate knowledge prompting и т.п. Но о них – в другой раз!
Хабр
Как мы заняли II место во II Корпоративном Хакатоне «ТехШторм»
1. Введение Я давно хотел поучаствовать в хакатоне. Хотелось приобщиться к особому вайбу скорости, импровизации и стресса. Увидел приглашение на очный хакатон в г. Альметьевск, организатором выступало...
Уже через неделю, 29 января, состоится крутая конференция «Групповые иски: 5 лет после реформы». Отличная возможность начать деловой сезон 2025 с содержательной дискуссии и общения с коллегами! Мероприятие пройдет в Шанинке.
Состав спикеров шикарный – консультанты из топовых юрфирм, ведущие ученые, инхаусы крупнейших компаний. И все будут обсуждать под разными углами только вопросы группового производства.
Событие примечательно еще и тем, что на конференции состоится публичная презентация вышедшей незадолго до НГ книги «Групповые иски: сложности и перспективы». В ней мы совместно с Виктором Домшенко провели подробный анализ платформ, которые агрегируют информацию по таким искам – собирают членов группы, привлекают судебных юристов, предлагают им удобную среду для взаимодействия и иным образом облегчают жизнь.
Если вы задумывались о создании такой платформы, то анализ разных наборов опций, реализации функционала и существующих решений вам не помешает!:)
Участие в мероприятии бесплатное, но с предварительной регистрацией здесь.
Состав спикеров шикарный – консультанты из топовых юрфирм, ведущие ученые, инхаусы крупнейших компаний. И все будут обсуждать под разными углами только вопросы группового производства.
Событие примечательно еще и тем, что на конференции состоится публичная презентация вышедшей незадолго до НГ книги «Групповые иски: сложности и перспективы». В ней мы совместно с Виктором Домшенко провели подробный анализ платформ, которые агрегируют информацию по таким искам – собирают членов группы, привлекают судебных юристов, предлагают им удобную среду для взаимодействия и иным образом облегчают жизнь.
Если вы задумывались о создании такой платформы, то анализ разных наборов опций, реализации функционала и существующих решений вам не помешает!:)
Участие в мероприятии бесплатное, но с предварительной регистрацией здесь.
#вместо_дешевого_дофамина
За 3 поездки на метро прочитал замечательную книгу.
Книга объясняет ясным языком экономические истины. Их я усвоил еще студентом, но книга позволила взглянуть на них иначе:
1. Я всегда смотрел на подсудность по выбору потребителя через призму дополнительной защиты слабой стороны - "ну зачем я буду тратить время, в другой районный суд ездить, я лучше в тот, который ближе к дому". Книга дает другой взгляд: подсудность по выбору потребителя создает конкуренцию судов и нивелирует эффект от "карманного суда".
2. Совершенства нет, всюду будут некие перемещенные издержки и свой набор плюсов и минусов. П. 1 очевидно приводит к росту издержек на сопровождение споров. Говорю как юрист, 6 раз посетивший Сыктывкар для участия в суде.
3. Встречают по одежке. Раньше я думал это аксиома, т.е. это никак не доказать. Для меня книга трансформировала народную мудрость в теорему: объясняется, почему это именно так и почему это работает. Даже если вы протестуете и ходите в офис в гавайских рубашках.
4. Различного рода экономические амнистии (капитала, дач, гаражей) - вынужденная мера, чтобы максимизировать выгоду от частной собственности.
5. Я довольно близорук к восточным правопорядкам, но в книге суд Таиланда по уровню независимости сравнивается с английским. Восток - дело тонкое.
Книгу рекомендую.
За 3 поездки на метро прочитал замечательную книгу.
Книга объясняет ясным языком экономические истины. Их я усвоил еще студентом, но книга позволила взглянуть на них иначе:
1. Я всегда смотрел на подсудность по выбору потребителя через призму дополнительной защиты слабой стороны - "ну зачем я буду тратить время, в другой районный суд ездить, я лучше в тот, который ближе к дому". Книга дает другой взгляд: подсудность по выбору потребителя создает конкуренцию судов и нивелирует эффект от "карманного суда".
2. Совершенства нет, всюду будут некие перемещенные издержки и свой набор плюсов и минусов. П. 1 очевидно приводит к росту издержек на сопровождение споров. Говорю как юрист, 6 раз посетивший Сыктывкар для участия в суде.
3. Встречают по одежке. Раньше я думал это аксиома, т.е. это никак не доказать. Для меня книга трансформировала народную мудрость в теорему: объясняется, почему это именно так и почему это работает. Даже если вы протестуете и ходите в офис в гавайских рубашках.
4. Различного рода экономические амнистии (капитала, дач, гаражей) - вынужденная мера, чтобы максимизировать выгоду от частной собственности.
5. Я довольно близорук к восточным правопорядкам, но в книге суд Таиланда по уровню независимости сравнивается с английским. Восток - дело тонкое.
Книгу рекомендую.
Forwarded from Soft Law Community
Боевая готовность в Шанинке 🔥
Сегодня здесь пройдет вторая научно-практическая конференция «Групповые иски: итоги 5 лет после реформы», организованная проектом Class Action Lab.
Содержательные дискуссии, живое общение исвежие экземпляры монографии о групповых исках .
Прямая трансляция конференции по ссылке.
Сегодня здесь пройдет вторая научно-практическая конференция «Групповые иски: итоги 5 лет после реформы», организованная проектом Class Action Lab.
Содержательные дискуссии, живое общение и
Прямая трансляция конференции по ссылке.
В эту среду на конференции рассказывал про цифровые платформы, которые созданы для сопровождения групповых исков.
Больше всего меня впечатлила французская платформа justice.cool. Она гарантирует конфиденциальность общения в группе, упрощает работу с доказательствами (как продукты ПравоТеха), берет на себя финансовые потоки (для ЕС это очень актуально), там даже ИИ есть.
ИИ, судя по описанию, помогает отвечать на вопросы доверителю, и такое применение вызывает у меня сомнения в эффективности применительно к российским реалиям. Остальные преимущества платформы это не уменьшает.
Самое главное - платформа за счет электронной подписи позволяет подать групповой иск в суд или заявление приставу, не выходя из платформы. Вау-эффект усиливается собственными подкастами, статьями от адвокатов и другим информационным сопровождением. С нашим ГПК такой функционал нам пока только снится (для СОЮ, по крайней мере).
Такого количества нужных опций я не встретил ни на одной платформе, это одназначно прекрасный пример продукта.
Сколько зарабатывает продукт я не нашел, но судя по количеству контента, продукт однозначно развивается.
Вот такой #обзор_продукта
Больше всего меня впечатлила французская платформа justice.cool. Она гарантирует конфиденциальность общения в группе, упрощает работу с доказательствами (как продукты ПравоТеха), берет на себя финансовые потоки (для ЕС это очень актуально), там даже ИИ есть.
ИИ, судя по описанию, помогает отвечать на вопросы доверителю, и такое применение вызывает у меня сомнения в эффективности применительно к российским реалиям. Остальные преимущества платформы это не уменьшает.
Самое главное - платформа за счет электронной подписи позволяет подать групповой иск в суд или заявление приставу, не выходя из платформы. Вау-эффект усиливается собственными подкастами, статьями от адвокатов и другим информационным сопровождением. С нашим ГПК такой функционал нам пока только снится (для СОЮ, по крайней мере).
Такого количества нужных опций я не встретил ни на одной платформе, это одназначно прекрасный пример продукта.
Сколько зарабатывает продукт я не нашел, но судя по количеству контента, продукт однозначно развивается.
Вот такой #обзор_продукта
Протоколы судебных заседаний будут делаться с помощью ИИ.
Сам неоднократно тестил распознавание и перевод в письменный текст аудиозаписи через Whisper, работает приемлемо.
Не знаю, спасет ли это нас от протоколов в одну-две страницы (как правило, они такие), но прогресс и оптимизация работы секретаря очевидны.
Стандартная для этой сферы проблема выгрузки чувствительных данных "третьему лицу" (в OpenAI или в Сбер) решается либо за счет локального размещения модели (сервера - в Судебном департаменте), либо анонимайзинг, либо - честное слово оператора LLM.
Надеюсь, технология покажет себя с лучшей стороны и ее раскатают на все суды в России.
Сам неоднократно тестил распознавание и перевод в письменный текст аудиозаписи через Whisper, работает приемлемо.
Не знаю, спасет ли это нас от протоколов в одну-две страницы (как правило, они такие), но прогресс и оптимизация работы секретаря очевидны.
Стандартная для этой сферы проблема выгрузки чувствительных данных "третьему лицу" (в OpenAI или в Сбер) решается либо за счет локального размещения модели (сервера - в Судебном департаменте), либо анонимайзинг, либо - честное слово оператора LLM.
Надеюсь, технология покажет себя с лучшей стороны и ее раскатают на все суды в России.
www.interfax-russia.ru
Искусственный интеллект будет вести протоколы судебных заседаний в Сахалинской области - Дальний Восток || Интерфакс Россия
Министерство цифрового и технологического развития Сахалинской области совместно с региональным агентством по обеспечению деятельности мировых судей намерены вн... читать далее на Interfax-Russia.ru
Анализируем судебных экспертов с помощью LLM
Я регулярно участвую в разбирательствах с участием судебных экспертов. Мы, оппоненты, а иногда и сам суд номинируют разных экспертов.
Когда письма всех кандидатов собраны на столе, начинается т.н. "битва за экспертов" - нужно убедить суд назначить экспертизу конкретным экспертам. В частности, для этого стороны проводят due dilligence всех экспертов и показывают его суду: "Посмотрите, какой эксперт Х плохой - в срок экспертизу никогда не сдает, а когда сдает - суд не считает ее достоверной". Наши оппоненты утверждают похожее, только для других экспертов. Послушав обе стороны, суд выберет экспертную организацию(назначит тех, кого номинировал сам).
На этом этапе работа юриста заключается в том, чтобы проанализировать много судебных актов (определения и решения), где упоминается конкретный эксперт и вычленить из них необходимую информацию.
Это можно поручить LLM.
Для этого нужны: промпт и судебный акт, где упоминается эксперт.
Промпт:
Что можно еще улучшить в будущем:
1. Загрузка судебных актов: если есть несколько десятков судебных актов, то можно сделать пайплайн, который по очереди загружает их в LLM вместе с промптом в один клик;
2. Поиск судебных актов: парсер, который собирает все судебные акты по ФИО эксперта (важно не спутать с однофамильцами);
3. Выдача ответа: тот же пайплайн может собирать ответы LLM и возвращать ответ в виде таблицы суд.акт/цитата.
4. Улучшать промпт, в т.ч. с учетом рекомендаций. Заклинание "ничего не придумывай" периодически не срабатывает.
На выходе получаем "поисковик" для анализа репутации экспертов.
Проверка ответов LLM - обязательна. LLM работает как ленивый паралигал: может где-то не досмотреть, а где-то для красного словца приукрасить. Даже несмотря на проверку, я сэкономил время.
Пользуйтесь!
P.S. пока писал пост, снова задумался о проблеме состязательности в судебной экспертизе. В США и Великобритании, насколько мне известно, процедура устроена иначе - там каждая сторона приводит своего эксперта и они состязаются в знаниях. Судебные юристы в этих странах также анализируют репутацию эксперта, но этот анализ не приводит к тому, что суд допускает и слушает только одного эксперта. Подробнее на эту тему рекомендую работу Дениса Архипова и Владимира Коновалова в журнале Закон.
Я регулярно участвую в разбирательствах с участием судебных экспертов. Мы, оппоненты, а иногда и сам суд номинируют разных экспертов.
Когда письма всех кандидатов собраны на столе, начинается т.н. "битва за экспертов" - нужно убедить суд назначить экспертизу конкретным экспертам. В частности, для этого стороны проводят due dilligence всех экспертов и показывают его суду: "Посмотрите, какой эксперт Х плохой - в срок экспертизу никогда не сдает, а когда сдает - суд не считает ее достоверной". Наши оппоненты утверждают похожее, только для других экспертов. Послушав обе стороны, суд выберет экспертную организацию
На этом этапе работа юриста заключается в том, чтобы проанализировать много судебных актов (определения и решения), где упоминается конкретный эксперт и вычленить из них необходимую информацию.
Это можно поручить LLM.
Для этого нужны: промпт и судебный акт, где упоминается эксперт.
Промпт:
Ты - юрист с большим стажем. Тебе нужно посмотреть решение суда и сказать, качественно ли экспертом ФИО проведена судебная экспертиза. Если экспертиза была проведена плохо - процитируй решение суда в этой части. Ничего не придумывай.
Что можно еще улучшить в будущем:
1. Загрузка судебных актов: если есть несколько десятков судебных актов, то можно сделать пайплайн, который по очереди загружает их в LLM вместе с промптом в один клик;
2. Поиск судебных актов: парсер, который собирает все судебные акты по ФИО эксперта (важно не спутать с однофамильцами);
3. Выдача ответа: тот же пайплайн может собирать ответы LLM и возвращать ответ в виде таблицы суд.акт/цитата.
4. Улучшать промпт, в т.ч. с учетом рекомендаций. Заклинание "ничего не придумывай" периодически не срабатывает.
На выходе получаем "поисковик" для анализа репутации экспертов.
Проверка ответов LLM - обязательна. LLM работает как ленивый паралигал: может где-то не досмотреть, а где-то для красного словца приукрасить. Даже несмотря на проверку, я сэкономил время.
Пользуйтесь!
P.S. пока писал пост, снова задумался о проблеме состязательности в судебной экспертизе. В США и Великобритании, насколько мне известно, процедура устроена иначе - там каждая сторона приводит своего эксперта и они состязаются в знаниях. Судебные юристы в этих странах также анализируют репутацию эксперта, но этот анализ не приводит к тому, что суд допускает и слушает только одного эксперта. Подробнее на эту тему рекомендую работу Дениса Архипова и Владимира Коновалова в журнале Закон.
Telegram
Технолитигация
#промпт_инжиниринг
Думаю, что промпты и промпт-инжиниринг уже запечатлены в рептильной части нашего мозга – о них говорят все и всегда. Хочу поделиться с вами «фразочками», которые я часто добавляю в промпт, чтобы попытаться улучшить результат.
Почему…
Думаю, что промпты и промпт-инжиниринг уже запечатлены в рептильной части нашего мозга – о них говорят все и всегда. Хочу поделиться с вами «фразочками», которые я часто добавляю в промпт, чтобы попытаться улучшить результат.
Почему…
Выложили видеозапись (пока только первую часть) конференции по групповым искам.
Для тех, кто не был очно или не подключался к трансляции - теперь есть возможность посмотреть.
Я рассказывал про цифровые платформы для групповых исков, которые делают жизнь судебных юристов и группы истцов проще. Мое выступление начинается отсюда.
P.S. Первые 30 секунд пришлось воевать с микрофоном, но я справился!
Для тех, кто не был очно или не подключался к трансляции - теперь есть возможность посмотреть.
Я рассказывал про цифровые платформы для групповых исков, которые делают жизнь судебных юристов и группы истцов проще. Мое выступление начинается отсюда.
P.S. Первые 30 секунд пришлось воевать с микрофоном, но я справился!
Загрязнение от дата-центров
Из кулуаров разного рода чатиков я узнал, что в 1 км от моего дома собираются строить дата-центр. Меня заинтересовало в первую очередь шумовое загрязнение, т.к. похожий дата-центр Росатома создавал такие шумы и вибрацию, чем спровоцировал недовольство жильцов.
Про шумовое загрязнение я в итоге написал статью. Помимо шумового загрязнения, дата-центры загрязняют воздух и уже нанесли США ущерб общественному здравоохранению на сумму в 5,4 млрд.(!) долларов.
Такие последствия вытекают из двух критичных для дата-центра потребностей: охлаждение и бесперебойная подача электричества (у кого при настройке сервера отключали свет - поймут меня). Это приводит к тому, что:
а) нужны огромные холодильные установки, которые сами по себе шумные,
б) использование дизельных генераторов на случай перебоя в подаче электричества.
Очевидно противоречие между потребностями жильцов в чистом воздухе и тишине и критичным для дата-центра функционалом. Поэтому не нужно обладать визионерским мышлением, чтобы сказать, что через 10 лет дата-центры станут одной из точек напряжения в современном городе.
Из кулуаров разного рода чатиков я узнал, что в 1 км от моего дома собираются строить дата-центр. Меня заинтересовало в первую очередь шумовое загрязнение, т.к. похожий дата-центр Росатома создавал такие шумы и вибрацию, чем спровоцировал недовольство жильцов.
Про шумовое загрязнение я в итоге написал статью. Помимо шумового загрязнения, дата-центры загрязняют воздух и уже нанесли США ущерб общественному здравоохранению на сумму в 5,4 млрд.(!) долларов.
Такие последствия вытекают из двух критичных для дата-центра потребностей: охлаждение и бесперебойная подача электричества (у кого при настройке сервера отключали свет - поймут меня). Это приводит к тому, что:
а) нужны огромные холодильные установки, которые сами по себе шумные,
б) использование дизельных генераторов на случай перебоя в подаче электричества.
Очевидно противоречие между потребностями жильцов в чистом воздухе и тишине и критичным для дата-центра функционалом. Поэтому не нужно обладать визионерским мышлением, чтобы сказать, что через 10 лет дата-центры станут одной из точек напряжения в современном городе.
VK
Про Чертаново Центральное. Пост со стены.
Гул.
Жители жалуются на круглосуточный гул, который исходит от нового здания ЦОД (дата-центр)... Смотрите полностью ВКонтакте.
Жители жалуются на круглосуточный гул, который исходит от нового здания ЦОД (дата-центр)... Смотрите полностью ВКонтакте.
Давно в канале ничего не писал. На то была причина… Я решил принять еще один вызов (в дополнение к учебе) и присоединился вместе с Виктором Домшенко к крутой команде LEVEL Legal Services (ex-Hogan Lovells).
Продолжаю верить в синергию классического юридического образования и IT, поэтому в команде буду заниматься коммерческими судебными спорами и развивать технолитигацию.
Энтузиазма и запала во мне и раньше было на троих, а теперь на шестерых!
Продолжаю верить в синергию классического юридического образования и IT, поэтому в команде буду заниматься коммерческими судебными спорами и развивать технолитигацию.
Энтузиазма и запала во мне и раньше было на троих, а теперь на шестерых!
Telegram
LEVEL Legal Services
⬜️Юридическая фирма LEVEL Legal Services объявляет о присоединении к практике разрешения споров и расследований команды первоклассных юристов в лице партнёра Виктора Домшенко и юриста Артёма Сабирова.
Виктор возглавил практику коммерческих споров и групповых…
Виктор возглавил практику коммерческих споров и групповых…
Чего только не сделаешь ради своего K-pop-idol
Любопытная история в Китае. Девушка высказалась негативно в отношении Чан Вон Ён, южнокорейской k-pop вокалистки.
Пишут, что 13-летняя дочь топ-менеджера Baidu (китайский поисковик) в отместку раскрыла персональные данные комментатора-хейтера и устроила ее травлю.
Позже выяснилось, что девочка неоднократно участвовала в нападках на ненавистников Чан Вон Ён, в сумме «слив» данные более сотни человек: имена, номера удостоверений личности, телефоны, IP-адреса.
Опустим "праведный гнев". Мне интересен гипотетический кейс, если бы такая ситуация произошла в России.
Тут любопытны как минимум 3 вещи:
1. Если бы утечка произошла до 30.05.2025. Baidu грозил бы административный штраф до 100 000 рублей, а в гражданском суде потерпевшие, думаю, получили бы по 20-30 т.р. морального вреда (из-за травли).
Я находил судебные акты, где штрафом в 60 000 рублей наказали за утечку 2 (двух!) пользователей.
2. Утечка после 30.05.2025. Административные штрафы за утечку данных вырастут в 30 раз (раньше - 100 000, сейчас - минимум 3 млн.). Но Baidu бы такой штраф не грозил, т.к. административной ответственности за утечку данных до 1000 пользователей с 30.05.2025 не будет:) поменяется ли ситуация с гражданским иском? Не думаю.
3. Как защищается Baidu? Они говорят, что утечки не было, а все слитые данные - это иностранные базы данных, полученные в результате хакерских атак. Как это проверить? Думаю, надо проводить а) экспертизу девайсов 13-летней девочки (хотя время упущено) б) сличать слитые данные и те самые БД из даркнета.
Аргумент про хакеров - типовой для споров об утечках по всему миру. С т.з. методологии я бы оценивал его с позиций:
а) база данных - источник повышенной опасности (не в смысле "может взорваться", а в смысле "нельзя контролировать"). Все по Павлодскому.
б) невозможно гарантировать 100% защиту от хакеров. Если нужно, то влезут и через соц.инженерию, и через атаки.
Поэтому универсальное возражение по типу "вы сами виноваты, что вас взломали" я бы отверг и разбирался в каждом конкретном случае, что сделал оператор, чтобы такой утечки не допустить.
Пойду послушаю, о чем поет Чан Вон Ён.
Любопытная история в Китае. Девушка высказалась негативно в отношении Чан Вон Ён, южнокорейской k-pop вокалистки.
Пишут, что 13-летняя дочь топ-менеджера Baidu (китайский поисковик) в отместку раскрыла персональные данные комментатора-хейтера и устроила ее травлю.
Позже выяснилось, что девочка неоднократно участвовала в нападках на ненавистников Чан Вон Ён, в сумме «слив» данные более сотни человек: имена, номера удостоверений личности, телефоны, IP-адреса.
Опустим "праведный гнев". Мне интересен гипотетический кейс, если бы такая ситуация произошла в России.
Тут любопытны как минимум 3 вещи:
1. Если бы утечка произошла до 30.05.2025. Baidu грозил бы административный штраф до 100 000 рублей, а в гражданском суде потерпевшие, думаю, получили бы по 20-30 т.р. морального вреда (из-за травли).
Я находил судебные акты, где штрафом в 60 000 рублей наказали за утечку 2 (двух!) пользователей.
2. Утечка после 30.05.2025. Административные штрафы за утечку данных вырастут в 30 раз (раньше - 100 000, сейчас - минимум 3 млн.). Но Baidu бы такой штраф не грозил, т.к. административной ответственности за утечку данных до 1000 пользователей с 30.05.2025 не будет:) поменяется ли ситуация с гражданским иском? Не думаю.
3. Как защищается Baidu? Они говорят, что утечки не было, а все слитые данные - это иностранные базы данных, полученные в результате хакерских атак. Как это проверить? Думаю, надо проводить а) экспертизу девайсов 13-летней девочки (хотя время упущено) б) сличать слитые данные и те самые БД из даркнета.
Аргумент про хакеров - типовой для споров об утечках по всему миру. С т.з. методологии я бы оценивал его с позиций:
а) база данных - источник повышенной опасности (не в смысле "может взорваться", а в смысле "нельзя контролировать"). Все по Павлодскому.
б) невозможно гарантировать 100% защиту от хакеров. Если нужно, то влезут и через соц.инженерию, и через атаки.
Поэтому универсальное возражение по типу "вы сами виноваты, что вас взломали" я бы отверг и разбирался в каждом конкретном случае, что сделал оператор, чтобы такой утечки не допустить.
Пойду послушаю, о чем поет Чан Вон Ён.
vc.ru
Китайская Baidu оказалась в центре скандала — 13-летняя дочь топ-менеджера «сливала» данные пользователей, которые критиковали…
Компанию заподозрили в нарушении конфиденциальности данных.
Сегодняшний день оказался богат на новости об утечках персональных данных.
Binance и Gemini
Криптобиржи регулярно подвергаются хакерским атакам. Недавний пример – хакеры украли с криптобиржи Bybit $1,5 млрд.
Пишут, что у криптобирж Binance и Gemini похищены данные 200+ тыс. пользователей.
Gemini комментариев пока не дает. Binance утечку отрицает и утверждает, что информация не была украдена с биржи, а собрана хакерами у пользователей с помощью вредоносного ПО. Любопытная вариация аргумента оператора "база данных не моя", не правда ли? Будем следить за развитием этого сюжета.
Роутеры Keenetic
В результате этой уязвимости в открытый доступ попали данные 1 млн пользователей, большая часть из которых – россияне. Это обусловлено тем, что Россия – основной рынок для гонконгской Keenetic.
Хотя в компании утверждают, что "риски совершения мошеннических действий в отношении пострадавших пользователей минимальны", эксперты по информационной безопасности придерживаются иного мнения:
Если у вас роутер Keenetic, имеет смысл обновить на нем пароли.
Этот кейс может быть интересен с точки зрения состава похищенных данных и их квалификации в качестве персональных данных.
#сорока_на_хвосте_принесла
Binance и Gemini
Криптобиржи регулярно подвергаются хакерским атакам. Недавний пример – хакеры украли с криптобиржи Bybit $1,5 млрд.
Пишут, что у криптобирж Binance и Gemini похищены данные 200+ тыс. пользователей.
Gemini комментариев пока не дает. Binance утечку отрицает и утверждает, что информация не была украдена с биржи, а собрана хакерами у пользователей с помощью вредоносного ПО. Любопытная вариация аргумента оператора "база данных не моя", не правда ли? Будем следить за развитием этого сюжета.
Роутеры Keenetic
В результате этой уязвимости в открытый доступ попали данные 1 млн пользователей, большая часть из которых – россияне. Это обусловлено тем, что Россия – основной рынок для гонконгской Keenetic.
Хотя в компании утверждают, что "риски совершения мошеннических действий в отношении пострадавших пользователей минимальны", эксперты по информационной безопасности придерживаются иного мнения:
Специалисты Cybernews установили, что в представленных анонимом наборах данных содержался широкий набор информации о пользователях: от паролей Wi-Fi и конфигураций маршрутизаторов до подробных сведений из журналов событий. Обладая конфиденциальными ключами из скомпрометированной базы, злоумышленники могут проникать как в домашние, так и корпоративные сети, отслеживать и перехватывать трафик, а также компрометировать дополнительные устройства.
Если у вас роутер Keenetic, имеет смысл обновить на нем пароли.
Этот кейс может быть интересен с точки зрения состава похищенных данных и их квалификации в качестве персональных данных.
#сорока_на_хвосте_принесла
РБК Крипто
У биржи Bybit похитили более $1 млрд в криптовалюте
Bybit заверяет, что остальные кошельки не пострадали, а вывод средств продолжается в штатном режиме
Потенциальные иски к AI-компаниям
Вчера я был на онлайн конференции, которую проводили King & Spalding. Удалось послушать сессию про ИИ в литигации.
Один спикер обратил внимание на "классические" нарушения, за которые AI-компании могут привлекать к ответственности в разных формах: от взыскания публичных штрафов (FTC) до возмещения убытков пользователям. Как человеку, который следит за AI продуктами в России и сфере права в частности, мне эти классические нарушения откликнулись:
1. "AI-powered" лопатка для блинов. Ситуация, когда компания переоценивает значение AI в своем продукте либо в продукте вообще нет AI. Этим компания вводит в заблуждение пользователя. В этой же сессии приводили пример дела Evolve, которой вменялось именно такое нарушение. На ум еще приходит "умные кассы" Amazon, где вместо декларируемого AI работали 1000 индийских рабочих. Если приземлить эту категорию потенциальных споров на российскую почву, то здесь я вижу скорее спор с ФАС о добросовестной рекламе. Спор об убытках пользователя теоретически возможен, но казус выглядит как фантастика.
2. AI-абьюзер. Ситуация, когда модель оскорбила / нахамила / обманула. Все мы много раз видели те самые мемы и новости. Если вы напишете промпт в LLM и получите нелицеприятный ответ, то для защиты своих прав в суде вам нужно будет пройти "огонь, воду и медные трубы" и суд общей юрисдикции в придачу. Начиная от фиксации ответа модели для суда, заканчивая объяснением, почему вы не читаете пользовательское соглашение. Не представляю себе размер морального вреда в этом случае, если даже за утечку персональных данных платят от 5 до 15 т.р. морального вреда.
Также обсуждали интересный вопрос о субъекте, который должен отвечать за ИИ-хулигана.
Я уверен, что с точки зрения теории гражданской ответственности мы должны отталкиваться от идеи источника повышенной опасности (такую обезьяну с гранатой невозможно контролировать). По крайней мере, это делает доказывание состава нарушения более адекватным процессом.
Но вот что касается субъектов - у меня нет уверенного ответа. В процессе эксплуатации ИИ довольно много претендентов на эту роль:
1. создатели ИИ (разработчики).
2. те, кто дообучил модель (тоже разработчики).
3. те, на чьих серверах ИИ размещена.
4. тот, кто предлагает продукт пользователю.
5. солидаритет
Из перечисленного - самый понятный вариант ответа - 4. Самый странный - 5 (пример про кузнеца, который выковал топор и разбойника, который с этим топором ограбил). С учетом прогнозов выше, ответ на этот вопрос мы получим не скоро.
P.S.прикрепляю карточки с конференции, там тоже есть примеры и обоснование.
Вчера я был на онлайн конференции, которую проводили King & Spalding. Удалось послушать сессию про ИИ в литигации.
Один спикер обратил внимание на "классические" нарушения, за которые AI-компании могут привлекать к ответственности в разных формах: от взыскания публичных штрафов (FTC) до возмещения убытков пользователям. Как человеку, который следит за AI продуктами в России и сфере права в частности, мне эти классические нарушения откликнулись:
1. "AI-powered" лопатка для блинов. Ситуация, когда компания переоценивает значение AI в своем продукте либо в продукте вообще нет AI. Этим компания вводит в заблуждение пользователя. В этой же сессии приводили пример дела Evolve, которой вменялось именно такое нарушение. На ум еще приходит "умные кассы" Amazon, где вместо декларируемого AI работали 1000 индийских рабочих. Если приземлить эту категорию потенциальных споров на российскую почву, то здесь я вижу скорее спор с ФАС о добросовестной рекламе. Спор об убытках пользователя теоретически возможен, но казус выглядит как фантастика.
2. AI-абьюзер. Ситуация, когда модель оскорбила / нахамила / обманула. Все мы много раз видели те самые мемы и новости. Если вы напишете промпт в LLM и получите нелицеприятный ответ, то для защиты своих прав в суде вам нужно будет пройти "огонь, воду и медные трубы" и суд общей юрисдикции в придачу. Начиная от фиксации ответа модели для суда, заканчивая объяснением, почему вы не читаете пользовательское соглашение. Не представляю себе размер морального вреда в этом случае, если даже за утечку персональных данных платят от 5 до 15 т.р. морального вреда.
Также обсуждали интересный вопрос о субъекте, который должен отвечать за ИИ-хулигана.
Я уверен, что с точки зрения теории гражданской ответственности мы должны отталкиваться от идеи источника повышенной опасности (такую обезьяну с гранатой невозможно контролировать). По крайней мере, это делает доказывание состава нарушения более адекватным процессом.
Но вот что касается субъектов - у меня нет уверенного ответа. В процессе эксплуатации ИИ довольно много претендентов на эту роль:
1. создатели ИИ (разработчики).
2. те, кто дообучил модель (тоже разработчики).
3. те, на чьих серверах ИИ размещена.
4. тот, кто предлагает продукт пользователю.
5. солидаритет
Из перечисленного - самый понятный вариант ответа - 4. Самый странный - 5 (пример про кузнеца, который выковал топор и разбойника, который с этим топором ограбил). С учетом прогнозов выше, ответ на этот вопрос мы получим не скоро.
P.S.прикрепляю карточки с конференции, там тоже есть примеры и обоснование.