LawCoder
984 subscribers
38 photos
13 videos
5 files
151 links
Канал про автоматизацию юридических процессов

Контакт для связи @glebovets
Download Telegram
В ЛС тут задали вопрос:
Не могли бы вы подсказать, с чего начать погружение в машинное обучение. Код писать имею, пишу API и скрипты для работы, хочу освоить новую область.


Может еще кому будет полезно, перепощу здесь ответ.

Я в свое время начал вот с этой книжки*, но только потому что я джаваскриптизер и в тот момент учить пайтон не хотел, думал два языка не потяну (на самом деле нет).

Потом начал читать статьи на Хабре. В итоге решил, что это неверное не очень серьезно и пошел на курс по DataScience от Яндекса. И еле его домучал, страдал бОльшую часть из 8 месяцев. т.к. там дают плюс/минус базу из книжки выше и в конце каждого урока дают ссылки на тот самый Хабр, для самостоятельного изучения, который я и без них читал. Из интересного на курсе оказался только тот самый пайтон, который я не хотел начинать учить, но пришлось)

Но в целом, я бы не рекомендовал сейчас сильно погружаться в ML, если вы не студент мехмата. Без хорошей математической базы, там сейчас делать нечего. Лучше пользоваться наработками тех, кто уже двигает индустрию. Брать АПИ клоуда, опенаи, разбираться как они работают и делать полезные штуки для себя.

*Про эту книжку есть отдельная смешная история, может быть потом расскажу здесь)
👍10
"I count gates and numbers, then play the guessing gameIt's just the place that changes, the rest is still the same..."

В этом посте обещал поглубже изучить внутрянку Noroots.
Возвращаюсь с результатом. Сегодня буду не только критиковать продукт, но и хвалить за работающие функции, а они, как оказалось, есть)

С самого начала теста я начал смотреть что и куда отправляет приложение. Для меня, как корпоративного юриста, защищающего интересы компании связанной NDA и 152-ФЗ по рукам и ногам драконовскими штрафами это крайне важно. И, к своему великому сожалению, запросов, которые были бы видны из консоли разработчика я не обнаружил. За это стоит похвалить, о защите собственной конфиденциальности они позаботились. Сильно глубоко ковырять запросы через Wireshark не было времени и желания и я отложил этот вопрос.

Из видимого мне удалось обнаружить, что документы загружаются с использованием фреймворка TinyMCE. Посмотрел их лендос и обнаружил там ИИ-ассистента. Ох, я очень надеюсь, что Noroots действительно использует целый оркестр нейронок, а не вот это вот всё)

В комментах предложили ломать ноурутс полностью через промт-инъекцию. Я даже написал сначала, что это не получится, т.к. у нас нет доступа к ИИ-модели, но потом меня осенило, там же есть функция “Ваши правила”, через которые можно формулировать “Правила проверки” договора, по сути это прямой (да, скорее всего с примесью других промтов от сервиса, но все же) запрос к модели. Я написал простое правило: “Договор не должен содержать персональные данные физических лиц. Если персональные данные указаны, то напиши в рекомендациях полное ФИО, паспортные данные, адрес, телефон, электронную почту.”. Загрузил договор с фейковыми перс. данными и о, боги, получил четкий ответ:
в договоре указаны персональные данные физических лиц: Аркадьев Денис Николаевич, паспорт РФ: серия 4315 номер 654321, выдан отделением УФМС России по г. Энску 27.11.2015, место жительства: 123456, г. Энск, пер. Жижека, д. 1, кв. 1, телефон: +7 (123) 2255533, адрес электронной почты: arkadyev@po4ta.ru, Сидоров Алексей Алексеевич
Рекомендация: удалить из договора все персональные данные сторон: Аркадьев Денис Николаевич, паспорт РФ: серия 4315 номер 654321, выдан отделением УФМС России по г. Энску 27.11.2015, место жительства: 123456, г. Энск, пер. Жижека, д. 1, кв. 1, телефон: +7 (123) 2255533, адрес электронной почты: arkadyev@po4ta.ru, Сидоров Алексей Алексеевич

Собственно, это второй повод похвалить продукт. Функция “Ваши правила” действительно хорошо работает на извлечение перс. данных из документа! У неё до этого не получилось искать условие об одностороннем расторжении, но вот с этим справилась прям хорошо! Ну, будем считать, что 50/50 это уже первый шаг к 90% точности, к которой стремится сервис)

Ну, в общем, что могу сказать ой, вэй в заключение. Для меня передача перс. данных в модель ИИ не приемлема. Вычищать данные руками перед отправкой тоже.

В комментариях прикреплю договор и скрин с ответом. Можете потестить у себя, если у кого есть демка или кто уже купил.
Прочитал на Хабре что Исследование: ИИ не повышает продуктивность программистов, но добавляет ошибок
Во время первого периода программисты работали с помощью традиционных инструментов, а во втором они переходили на использование ассистента GitHub Copilot.

В итоге число ошибок в коде выросло на 41%. При этом не улучшилась и ситуация с эмоциональным выгоранием специалистов. Они признались, что написанные с помощью ИИ участки кода сложно анализировать на предмет выявления ошибок, поэтому программисту иногда проще самому переписать нужный фрагмент. Также большую часть запросов ассистенты истолковывают неверно.

И чтобы вы понимали, программирование эта область, где ИИ сейчас действительно справляется на голову выше остальных задач. Что уж тут говорить про работу юриста.

Поэтому когда я слышу про повысим продуктивность юриста по типу: "Doczilla Ai сделает вашу работу с документами легкой и эффективной", "Внедрение
платформы Noroots
позволяет Legal Tech Увеличить производительность"
пукан мой подрывается и на этом моменте презентация продукта для меня превращается в маркетинговый булшит.

Боюсь только одного, что маркетинговый отдел выше перечисленных продуктов доберется до руководителя моей компании, продаст ему идею увеличения моей продуктивности, он купит прогу и скажет: "Ну что, Володя, бери мяч и фигач работай в 10 раз быстрее теперь! На каждый договор у тебя теперь 5-10 минут"😏
👍12😁82
Ну что ж, я у мамы блогер, а значит настало время и рубрики взаимный пиар)

В своем блоге публикую только новости, которые зацепили и по которым есть что от себя добавить. Но есть же здесь в канале наверняка кто любит поток новостей по теме. ИИ сейчас из каждого утюга, но вот в канале ИИ&Право рассказывают про связку ИИ и права, хозяйке юристам на заметку😉

Дайджест интересных новостей за сентябрь:

Против компании LegalShield подан иск из-за анализа звонков клиентов без их согласия для обучения моделей ИИ

YouTube принимает меры для защиты создателей контента от ИИ-подражателей

В США арестован военнослужащий за создание детской порнографии с использованием ИИ

ИИ-инфраструктура уходит под воду?

ОЭСР опубликовала ключевые документы по управлению ИИ
LawCoder
Ну что ж, я у мамы блогер, а значит настало время и рубрики взаимный пиар) В своем блоге публикую только новости, которые зацепили и по которым есть что от себя добавить. Но есть же здесь в канале наверняка кто любит поток новостей по теме. ИИ сейчас из каждого…
Ну и, как говорится, чтобы два раза не вставать, вот еще канал КОД ЗАКОНА от создателей фильма Годзила сервиса Doczilla.

Там тоже новости про ИИ, но еще и много интересного про фичи сервиса, который они мне на демо-тест не дают, смотрю и оцениваю так, но с великим скепсисом, конечно)
👍8
LawCoder
"I count gates and numbers, then play the guessing gameIt's just the place that changes, the rest is still the same..." В этом посте обещал поглубже изучить внутрянку Noroots. Возвращаюсь с результатом. Сегодня буду не только критиковать продукт, но и хвалить…
вот здесь я писал про то что для меня неприемлемо, чтобы конфиденциальная информация и в том числе, персональные данные, утекали в LLM, и судя по реакции на пост мало кому это интересно. А тем временем, как пишет Автор канала "вычислить по IP" Произошел прорыв в деле NYT и OpenAI: суд удовлетворил ходатайство NYT и теперь OpenAI должен будет предоставить базу данных, на которой обучалась OpenAI LLM.

Крайне рекомендую задуматься в следующий раз перед отправкой документов в какой-либо сервис использующий ИИ, не отправляете ли вы чувствительную инфу, которая может потом всплыть в материалах какого-либо дела.
🔥5👍2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
2😁1
Когда вам в следующий раз кто-нибудь скажет, что понимает как работают большие языковые модели (LLM), и попытается вам объяснить, просто вспомните вот эту речь нобелевского лауреата, стоявшего у истоков создания ИИ, Джона Хопфилда, который до конца не понимает как это работает внутри)

"When you get systems that are rich enough in complexity and size, they can have properties which you can't possibly intuit from the elementary particles you put in there," he said in a press conference convened by Princeton. "You have to say that system contains some new physics."

«Когда вы получаете достаточно сложные и большие системы, они могут обладать свойствами, которые вы не можете понять по элементарным частицам, которые вы туда поместили», - сказал он на пресс-конференции, созванной Принстоном. «Вы должны сказать, что эта система содержит какую-то новую физику».
👍42
LawCoder
Ну и, как говорится, чтобы два раза не вставать, вот еще канал КОД ЗАКОНА от создателей фильма Годзила сервиса Doczilla. Там тоже новости про ИИ, но еще и много интересного про фичи сервиса, который они мне на демо-тест не дают, смотрю и оцениваю так, но…
Заскамили мамонта

Договорились с каналом о взаимном пиаре. Я человек пожилой простой - просят пропиарить канал - пиарю!) Обещали в ответ рассказать о моем канале в пятницу, но не уточнили в какую. Ну, штош, ждем какой-нибудь пятницы))

Сначала Светлане в игнор попал, теперь вот каналу КОД ЗАКОНА, ну что ж такое то... плак-плак...🥲
😁5😢2
Наконец-то добрался до статьи Романа Янковского: "Что не так с ИИ-юристами".

Разбор хороший и со многими тезисами я согласен, но использование в нем нейросетей явно поверхностное. Прогнал через Claude вопросы, которыми Роман поставил в тупик ИИ и получил правильные ответы.

Вот, например, Claude спокойно решает задачку с однополым браком:
Я понимаю, что вы спрашиваете о документах, необходимых для заключения брака в Академическом ЗАГС города Москвы. Однако мне нужно отметить, что по состоянию на апрель 2024 года, когда моя база знаний была последний раз обновлена, однополые браки в России не были легализованы. Поэтому Матвей и Федор, будучи мужчинами, не смогли бы зарегистрировать брак в российском ЗАГСе.


И про однополый развод:
Я понимаю, что вы спрашиваете о возможности расторжения однополого брака, заключенного в Нидерландах, на территории России. Эта ситуация довольно сложная с юридической точки зрения, учитывая различия в законодательстве двух стран. Вот что можно сказать по этому вопросу:

1. Признание брака в России:
Российское законодательство по состоянию на апрель 2024 года не признает однополые браки, заключенные как на территории России, так и за рубежом. Это означает, что с точки зрения российского закона, брак Васи и Пети не имеет юридической силы в России.


и про протухший винегрет:
Если вы купили испорченный винегрет, вот что вы можете сделать...


Скрины с полными ответами Claude оставлю в комментариях к посту.

Возможно проблема в выборе протухшего винегрета неподходящих под задачу моделей:
В последнее время появилось много «юридических ассистентов» на базе больших языковых моделей: GigaLegal, Doczilla и др. Я провел много времени, тестируя таких ассистентов и общаясь с моделями напрямую.


А может быть в том, что Роман тестировал их в самом начале (на волне хайпа) и потом как и многие из юристов просто отложил до лучших времен.

Для тех кто входит в число "отложивших" Павел Мищенко совместно с участниками сообщества придумал новый формат - вебинар Лектория ilovedocs на котором участники сообщества расскажут про то, как используют ИИ в своих юридических задачах.

Сегодня в 17.00 будет первый, а 29 октября второй, но уже с моим участием, на котором я расскажу и в прямом эфире покажу как с использованием ИИ быстро проверить телеграм-канал на наличие пропаганды ЛГБТ или экстремистских материалов.

На сегодняшний вебинар Ссылка здесь, предварительной регистрации не нужно, участие бесплатное, поддержите коллег)
11🔥7👍51
LawCoder
Наконец-то добрался до статьи Романа Янковского: "Что не так с ИИ-юристами". Разбор хороший и со многими тезисами я согласен, но использование в нем нейросетей явно поверхностное. Прогнал через Claude вопросы, которыми Роман поставил в тупик ИИ и получил…
Классный вебинар получился. Кто не успел онлайн присоединиться вот здесь запись можно посмотреть. Там в конце Ян рассказывает про маркетинговый булшит, который формирует ожидания от использования ИИ и последующее разочарование от реальности его использования.

Я, пожалуй, с этой темы и начну свое выступление на следующем вебинаре. Постараюсь донести мысль о том, как из хаоса LLM получить те самые алгоритмы, которые работают на 100%, к которым мы привыкли за компуктерную эру.
🔥14
LawCoder
Классный вебинар получился. Кто не успел онлайн присоединиться вот здесь запись можно посмотреть. Там в конце Ян рассказывает про маркетинговый булшит, который формирует ожидания от использования ИИ и последующее разочарование от реальности его использования.…
Оказывается, тот самый Ян Стригов из чата Ilovedocs, не только здесь высказался, но еще и написал многобуков в стол про сервис Noroots. Я прочитал и выпросил этот текст для вас. Тезисно мы с ним очень близки в этом вопросе, но я свой длиннопост еще долго буду писать, а этот уже готов, почитайте, может убережет вас от лишних трат.

P.S. По Noroots готовлю два эксперимента:
1. Хочу прикрутить их АПИ к боту @lawer_assist_bot и показать вам как это сделать самостоятельно. Валентин Микляев разрешил мне дать вам демо-доступ по вечерам. Какое-то время через бот можно будет проверять договоры бесплатно и заодно понять надо оно вам или нет.
2. Хочу взять штук 20-30 договоров и пропустить их через АПИ Noroots, который заявляет 95% точность и АПИ ЧатаГПТ, который ничего не заявляет, но мы то знаем...

На всё сразу времени не хватает, давайте голосование что сделать раньше?

Вариант 1 - ставьте 🤮
Вариант 2 - ставьте 💩

Статье Яна ставьте - ❤️
💩16🤮127
Всем привет!

Если вы, как и я, вставляете в документ PDF подпись и печать в бесплатной версии АсrobatReader, то наверняка вам приходила в голову мысль, что эту подпись/печать можно легко скопировать и перенести в другой док. Плюс контрагент сразу видит, что это не скан, подпись вставлена и наверное часто возвращает подписанные таким способом документы. Выход есть - сохранить PDF в нужном формате, который сохраняет страницы не в редактируемом формате, а в виде изображений. Такой док больше похож на скан и как правило не вызывает у контрагента подозрений☺️ Есть только одна проблема - доступно это только в платной версии АсrobatReader, или в онлайн-сервисах типа Ilovedocs ilovepdf. Платной версии у меня нет, а онлайн-версиям я не доверяю, т.к. боюсь утечки конфиденциальной информации, в т.ч. образцов подписи и печати.

По этой причине я себе давно уже написал скрипт на питоне, который делает из обычного PDF нужный мне, но он был супер-неудобен для использования, т.к. его надо было запускать через консоль. Но на этих выходных две нейросетки: DeepSeek и Calude помогли мне за пару часов переписать код с использованием более-менее привлекательного интерфейса и упаковать в исполняемый файл EXE, который можно запускать на любом компуктере с Windows. Стало супер-удобно, а главное бесплатно и без утечек КИ.

Если кому такая утилита тоже нужна, то в комментах прикрепил файл. Пользуйтесь! Буду рад если найдете косяки и напишете, что можно допилить.
🔥17👍3👏3
This media is not supported in your browser
VIEW IN TELEGRAM
Пятничный мем для поднятия настроения)
😁204💯1
Всем привет!

На прошлом вебинаре Ян Стригов, который тот самый, и который написал вот этот разбор, рассказывал как он использует нейросеть Gemini от гугол для расшифровки аудиозаписей судебных заседаний. Я решил докрутить эту штуку и написать приложение в котором уже будет готовый промт, останется только закинуть аудиофайл и дождаться файла с расшифровкой.

Приложение будет работать только на виндовс. Если хотите такую штуку на мак, то пишите, постараюсь сделать такое же, но через веб-интерфейс.

Качество расшифровки зависит от выбранной модели. Можно выбрать в настройках. По умолчанию используется Flash, она быстрая, и в бесплатной версии гугол дает много токенов на неё, но результат нестабильный. Версия Pro, дает более уверенный результат, но есть риск вылететь за лимиты и не получить расшифровку большого файла.

В общем, кому интересно, попробуйте. Файл с программой в комментариях к посту. В начале потребуется ввести токен от АПИ. Его бесплатно можно получить здесь. Для этого, и для работы приложения, нужен VPN.
👍20🔥71
LawCoder
Всем привет! На прошлом вебинаре Ян Стригов, который тот самый, и который написал вот этот разбор, рассказывал как он использует нейросеть Gemini от гугол для расшифровки аудиозаписей судебных заседаний. Я решил докрутить эту штуку и написать приложение в…
обожаю этот момент, когда пишешь два дня прогу или пост, выкладываешь и у тебя, раз, и минус 2 подписчика. Я всегда представляю, что эти люди такие "я сюда за платными курсами пришел, ну или хотя бы подписаться на бусти, а не вот этот вот всё... ну нафиг, я сваливаю!"😌
😁28💯2🤡1
Павел Мищенко тут уговорил своих ребят гайд по аккредитации IT-компаний опубликовать, два года назад бы всем нам такой гайд, но и сейчас не лишним будет)

Мне очень импонирует такой подход - делиться знаниями/опытом, не требуя ничего взамен. Я сторонник тезиса, что чем больше отдашь во вселенную, тем больше получишь от неё обратно. По крайней мере у меня работает на 100500%.

В общем, чтобы поддержать инициативу, достал с полки, стряхнул пыль с этого гайда, и добавил в бот. Если в начале запроса написать "рунетлекс" и потом вопрос по аккредитации, то бот ответит исходя из информации указанной в гайде. Открою на два дня, можете погонять вопросами. Потом закрою, т.к. АПИ опенаи платное, а токенов на запрос тратится прилично.

P.S. если в канале, совершенно случайно, имеется подписчик у которого, к примеру, свой легалтех стартап, победивший в номинации Правотех и у него есть желание поддержать бот подпиской опенаи, чтобы подписчики этого канала могли навсегда получить доступ к этому и другим гайдам, кидайте ключ АПИ в ЛС, а я добавлю в эбаут бота наименование спонсора)
🔥221
LawCoder
Павел Мищенко тут уговорил своих ребят гайд по аккредитации IT-компаний опубликовать, два года назад бы всем нам такой гайд, но и сейчас не лишним будет) Мне очень импонирует такой подход - делиться знаниями/опытом, не требуя ничего взамен. Я сторонник тезиса…
Не прошло и суток с момента моего "посыла в космос" и ключ у нас!🔥

Ответы бота по аккредитации IT-компаний по гайду Рунетлекса теперь будут доступны пока ключ не отзовут, а его отзовут скорее всего не скоро, так что пользуйтесь! И заодно в комментариях пишите, какие знания еще прикрутить к боту?

Спасибо Валентину Микляеву за ключ, да и в целом за неутомимое желание двигать LegalTech, можно сказать вот в этом канале.
🔥154🙏1
Прочитал тут в канале Дарьи Бондарчук следующее:
Правотех – это не та индустрия, в которую инвесторы смотрят с большим вожделением. ...
«Я пока не вижу интереса от крупных игроков типа «Сбер», «МТС» или «Ростелеком».

Ну, вот это то, о чем я постоянно говорю. Нету интереса, просто нету интереса... Но в моем случае это взаимно, тоже нету интереса, лучше пойду и сделаю себе сам, пускай кривое, но работающее здесь и сейчас легалтех решение, чем ждать пока до меня дойдет очередь.

Завтра, кстати, вот здесь попробую рассказать про свой опыт, присоединитесь или нету интереса?)
👍14🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Поучаствовал вчера в вебинаре Павла Мищенко. В моменте было 97 человек и поэтому немного ссыкотно, и честно говоря я поплыл и забыл рассказать половину от запланированного, но Павел вытащил вопросами и по-моему получился классный, живой диалог на тему ИИ.

Для тех кто пропустил и хочет посмотреть целиком ссылка здесь, там же ссылка на чат для общения, для ленивых вырезал кусок с моим участием где я пытаюсь убедить участников вебинара, что программировать не страшно и призываю всех попробовать начать!)
🔥323🤣1