неШемяка! ИИ для юристов
67 subscribers
9 photos
11 links
AI Legal Tech
Download Telegram
Новости AI Legal и обновлений сервиса неШемяка!

https://neshemyaka.ru/

Теоретические и практические материалы об использование ИИ в работе юристов.​

Чат поддержки сервиса - @neshemyaka_chat. Ждем ваших отзывов, сообщений о багах, обсуждении результатов ИИ прогнозирования и предложений по развитию сервиса
2🔥1
неШемяка! ИИ для юристов pinned «Новости AI Legal и обновлений сервиса неШемяка! https://neshemyaka.ru/ Теоретические и практические материалы об использование ИИ в работе юристов.​ Чат поддержки сервиса - @neshemyaka_chat. Ждем ваших отзывов, сообщений о багах, обсуждении результатов…»
Китайские исследователи натравили TextDenseNet на 50 000 судебных решений и заставили нейросеть угадывать статьи и штрафы по одному только описанию дела.​

Оказалось, что плотные свёрточные блоки плюс отдельный вход для юридических ключевых слов уверенно обгоняют старые TextCNN/RNN по точности на 7–12 процентных пунктов.​

Для типовых кейсов модель вышла в ранг «робо‑ассистента судьи», но все редкие и странные дела по‑прежнему остаются людям — и авторы честно это признают.​

Мораль: прежде чем звать в суд новомодные GPT, можно уже неплохо разгрести рутину старой доброй CNN‑архитектурой, если нормально вычистить и размечать данные.

1. CNN, то бишь - сверточная, если совсем просто, это когда смотрим не на каждый входной элемент, а скользящим фильтром ищем паттерны

2. На картинке - структура TextDenseNet
2🔥1
Забавная заметка в Yale Law Journal, судьи одного из апелляционных судов о последней надежде на "спасение правосудия" - AI. Bibas S. Lawyers’ Monopoly and the Promises of AI

Судья Бибас пишет о крахе модели "кадиллак для всех": попытка навязать дорогих юристов даже в мелких делах привела к тому, что средний класс просто «глотает обиды» (lumping it), не имея доступа к суду. А единственное лекарство - радикальное дерегулирование и допуск AI.

AI здесь выступают "великим уравнителем". Нейросети уже лучше pro se истцов. "Судам нужно не запрещать AI из страха перед галлюцинациями, а учить стороны использовать его под контролем Rule 11 (санкции за ложь)".

При этом AI должно обрушить цены на на юридическую работу ("драфтинг" и т. п.), что даст доступ к праву "миллионами бедных". AI - это Uber на рынке юруслуг.

Мораль: вместо того чтобы ждать мифического «бесплатного адвоката для каждого» , которого никогда не будет (Civil Gideon), лучше пустить на рынок роботов. Больно для цеха, но полезно для общества.
2🔥2
Почему простые «AI-судьи» бесполезны в реальности

Опубликовал на zakon.ru обзор свежего препринта с EMNLP 2025. Исследование бьет в самую боль всех, кто делает LegalTech — разрыв между рафинированными датасетами и реальностью.

Идея, вобщем-то, на поверхности. В большинстве исследований по Legal Judgment Prediction модели тренируются на «юридических фактах», а это читерство. «Юридический факт» — это то, что прошло судейский фильтр и зафиксировано в решение.

В реальной жизни на входе в судебный процесс у нас этого нет. Есть только куча противоречивых доказательств от истца и ответчика.

Авторы предлагают внедрить промежуточный слой — Legal Fact Prediction (LFP). И пайплайн тогда становится таким: Сырые доказательства → AI восстанавливает картину мира (факты) → AI применяет право.

То есть сначала генерируем нарратив «как это видит суд» (fact-finding), и только потом применять нормы права. Именно по такому пути мы пойдем в неШемяке)

О некоторых результатах исследования читайте здесь. Сама статья.
🔥4💯1
Итоги 2025: Как «неШемяка!» научился предсказывать будущее (судебное)

Друзья, сегодня 31 декабря — время подвести итоги года! 🥂

⚡️ ЧТО СДЕЛАНО

С нуля до production за 2 месяца:

🏗 Техническая база
→ Взрослый ci/cd
→ Контейнеризация
→ Боевой VPS
→ Максимально оптимизированная PostgreSQL
→ Рефакторинг архитектуры: гибкая система LLM-провайдеров

🤖 AI-движок
→ Подключили премиум-модели: Claude, Gemini, GPT и др.
→ Fallback-механизм: если одна модель недоступна, автоматически переключается на другую
→ Работает как для бесплатного, так и для премиум анализа
→ Максимально докрутили скоринг ответов
→ Немаловажная часть - исследовательская, об этом - в следующем году.

💎 Продукт
→ Запустили премиум-тариф с пакетами (1/5/10/30 запросов)
→ Интеграция с Robokassa — полноценный платежный пайплайн
→ Magic links: доступ без регистрации через email
→ Автоудаление данных через 48 часов

🎨 UX/UI
→ Переработали всю структуру HTML
→ Добавили FAQ

🚀 **ЧТО ДАЛЬШЕ В 2026?**

Это только начало! В планах:

📊 Q1 2026: Расширение функционала
→ Добавление контекстных полей (тип документа, роль пользователя)
→ Новые услуги: оценка обжалования, анализ рисков
→ AI-генерация документов: проекты исков и жалоб

🔧 Q2: API и интеграции
→ API для юристов и компаний
→ Telegram-бот для быстрого доступа

📈 Q3-Q4: Масштабирование
→ B2B-направление для юридических фирм
→ Корпоративные подписки
→ White label решения

Спасибо всем, кто верит в проект!
🔥3👍1
Друзья, в "неШемяке!" небольшое, но важное обновление.

Теперь при анализе дела обязательно явно указывать свою роль в процессе: истец или ответчик (третьих лиц пока не завезли🙂).

В LLM Studies это называется Role-Based Prompting. Когда мы явно задаем роль, происходит несколько важных вещей на уровне архитектуры модели:

1. "Смена вектора внимания" (attention mechanism) - без указания на роль модель чаще выдает общие фразы, которые верны, но бесполезны для стратегии.

2. "Юридической силлогизм" (legal syllogism) - есть исследования, на этот раз - не "британских", а "китайских ученых"🙂, что LLM лучше справляются с прогнозом, когда их заставляют следовать структуре "Факты -> Норма -> Вывод" с позиции конкретной стороны. Указание роли сужает search space до релевантных прецедентов, отсекая шум.

3. "Снижение галлюцинаций" - когда роль не задана, модель пытается угодить всем сразу и часто выдумывает несуществующие "компромиссные" нормы.

Заходите тестить! Выбирайте свой меч ⚔️ или щит🛡 https://neshemyaka.ru/
🔥3
🎁 АКЦИЯ: премиум-прогноз бесплатно

Хотите получить разбор вашей ситуации с аргументами от GPT, Claude и других премиум-нейросетей бесплатно?

👇 Всего 2 простых шага

1️⃣ Подпишитесь на наш канал @neshemyaka
2️⃣ Расскажите о сервисе neshemyaka.ru в любой соцсети

📩 Как получить награду

Пришлите в комментарии к этому посту или на support@neshemyaka.ru ссылку на вашу публикацию.

Magic Link вышлем в течение часа (в рабочее время)
🔥3
неШемяка! ИИ для юристов pinned «🎁 АКЦИЯ: премиум-прогноз бесплатно Хотите получить разбор вашей ситуации с аргументами от GPT, Claude и других премиум-нейросетей бесплатно? 👇 Всего 2 простых шага 1️⃣ Подпишитесь на наш канал @neshemyaka 2️⃣ Расскажите о сервисе neshemyaka.ru в любой…»
Китайцы доказали: "голая" GPT не тянет юриспруденцию

Опубликовал новую статью на Zakon.ru с разбором свежего исследования «Chinese Labor Law Large Language Model Benchmark» (январь 2026).

Суть эксперимента:

Авторы сравнили мощные универсальные модели со специализированной LabourLawLLM, дообученной (SFT) на трудовом праве - набор из 12 типов задач.

📉 Результат предсказуем, но болен:
Универсальные модели проигрывают специалистам, как только дело доходит до:

1️⃣ Точных расчетов (компенсации, неустойки) — GPT пытается угадать цифру, а не посчитать.

2️⃣ Строгого цитирования норм — галлюцинации цветут пышным цветом.

3️⃣ Квалификации спора — путаются в нюансах, если не задать жесткую структуру.

Инженерный вывод:

Эпоха «промпт-инжиниринга» (когда мы просто просим GPT «быть хорошим юристом») уходит. Будущее — за пайплайнами, где задача разбивается на атомы: сначала NER (вытащить факты), потом Classification (понять суть спора), и только в конце — Reasoning.

Именно эту логику «декомпозиции» постепенно внедряю в "неШемяку!". Вместо того, чтобы просить нейросеть «написать ответ», заставляем ее сначала найти слабые места, потом проверить факты, и только потом — выдать прогноз. Работает дольше, но галлюцинирует реже.🙂

👉 Читать разбор на Zakon.ru: ссылка
👉 Сама статья на arXiv: ссылка
2👍2👌1
Когда роботы судят роботов: китайский эксперимент SimCourt

Пока мы тут прикручиваем RAGи и строим скромные пайплайны, исследователи из Университета Цинхуа выкатили интересный препринт. Они построили полноценную симуляцию суда, где все роли — от судьи до подсудимого — исполняют AI-агенты.

В чем суть?

Китайцы запустили ролевую игру (Role-Playing Simulation). Агенты жестко следуют 5 стадиям уголовного процесса.
👮‍♂️ Прокурор (агент с установкой "Attack Strategy") ищет дыры в алиби.
🧑‍💼 Адвокат (агент "Defense Strategy") давит на смягчающие.
👨‍⚖️ Судья слушает этот спор и выносит вердикт.

Некоторые результаты

AI-судья лучше удерживает структуру процесса и идеально цитирует нормы (ну, это ожидаемо).
Агенты отлично ловят оппонентов на противоречиях.
С присяжными работать пока не умеют - слишком логичные.

Вывод: Ваш следующий процессуальный оппонент, возможно, уже прогнал свою позицию через такой симулятор. 💀

🔗 Ссылка на разбор статьи на Хабре
📄 Оригинал препринта

#LegalAI #Tech
🔥3🆒1
Небольшое, но важное обновление в "неШемяке!"

До сих пор важный блок "ключевые факторы" (конкретные обстоятельства, на которые нейросеть обратила внимание при оценке шансов) оставались "служебной информацией": мы использовали их для валидации ответов LLM, но не выводили в интерфейс.

Теперь "ключевые факторы" стали доступны пользователям:

В базовом тарифе — топ-3 фактора
В премиуме — все факторы от каждой модели

Зачем это нужно?

Вместо абстрактного «вероятность 85%» вы видите на что именно опирается прогноз. Это помогает понять, какие документы критичны, где у вас сильная позиция, а где — уязвимость.
2
📉 Минус $300 млрд за сутки: Anthropic убивает динозавров LegalTech? 🦖🩸

На прошлой неделе на фондовом рынке США случилась настоящая "кровавая баня" для гигантов, на которых юристы молились десятилетиями. Thomson Reuters, Gartner, LexisNexis и др. - все полетели вниз на 15-20%. Причина? Anthropic выкатила новые специализированные плагины для Claude Cowork.

Рынок испугался не просто очередного чат-бота. Anthropic показала агентов, которые интегрируются прямо в рабочие процессы: сами проводят due diligence, проверку договоров, сверку комплаенса и готовят правовые справки.

Инвесторы рассудили просто: "Зачем платить тысячи долларов за подписку на базу судебной практики, если агент Клод сделает это быстрее и дешевле?". Эффект домино задел даже LegalZoom (-18%), показав, что "рвы" старых корпораций, казавшиеся неприступными, пересыхают на глазах.

Гиганты не умрут завтра, но их маржинальность в 40% - уже история. Для AI LegalTech-разработчиков же открываются перспективы, от которых захватывает дух...
💯4
⚖️ Новый модуль "Стоит ли обжаловать" в "неШемяке!"

Закончил работу над модулем оценки шансов на обжалование. Уже выкатил на прод.

Параллельно, выбирая LLM под капот этого блока, прогнал 150 свежих арбитражных дел, которые уже прошли апелляцию, через последние версии нейросеток — Claude Sonnet 4.6, GPT-5.2 Thinking и Gemini 3.1 Pro.

"Голый" текст решения первой инстанции нейросети анализируют хорошо — точность прогноза 72–78%. Но стоит добавить слабую позицию с вводной "наш клиент считает...", как ИИ впадает в сикофантию (угодливость). Вместо критики алгоритм начинает слепо поддакивать, завышая шансы на выигрыш до абсурдных 93%.

Один из главных выводов — оценивать свои судебные перспективы в обычном ChatGPT — путь к самообману. Нейросеть будет за вас "болеть". Выход один — устраивать AI-баттлы, искать программный консенсус. Только такой баланс дает юристу трезвый risk assessment.

Общее описание исследования - в статье на Хабре.

Всю математику сейчас упаковываю в небольшой препринт для arxiv.org.
2👍1🔥1
ИИ против «дела Долиной»: угадали аргументы, но вняли статистике

Шум вокруг дела Долиной утих, решил препарировать стандартным "нешемяковским" пайплайном - консенсусом трех топовых LLM (Claude, Gemini, GPT). Скормил им только решения первых трех инстанций и на выходе получил прогноз финала в Верховном Суде (веса моделей о нем, естественно, не знали).

Результат очень интересный:

Нейросетки указали на 5 аргументов для отмены из 7, использованных ВС РФ (реституция, стандарт осмотрительности покупателя и т. п.). Reasoning!

Итоговый прогноз на успех - всего 7%.

Почему? Потому что ИИ оказался большим практиком, чем мы. Модели посмотрели на суровую статистику ("три инстанции засилили - шансов почти нет") и не поверили, что Верховный Суд сломает статус-кво.

👉 [Ссылка на обзор - zakon.ru]
👉 [Ссылка на ИИ-прогноз - neshemyaka.ru]

В "неШемяке!" появился раздел "Публичные прогнозы".

Присылайте в комментариях ссылки на интересные дела (свежие, лучше арбитражные и в стадии обжалования). Разберем вместе!
🔥21
⚖️ Представляю Lexometrica Ground Truth

Два месяца трудов, связанных с практическим вопросом - какие модели поставить под капотом "неШемяки!"

Проблема в том, что открытые бенчмарки сегодня в глубоком кризисе. Из-за Test-Set Leakage нейросети просто заучивают ответы из интернета, создавая "метрическую иллюзию" интеллекта. На бумаге они отличники, а на реальном кейсе из практики Верховного суда — "плывут".

Чтобы найти истину, я собрал Lexometrica Ground Truth — закрытый blackbox из 30 анонимизированных кейсов, которых нет в сети. Нейросети были вынуждены не вспоминать, а реально думать.

Главные выводы исследования:

🥇 SOTA-дуополия: Лидеры рейтинга - GPT-5.4 Pro и Claude Opus 4.6. Только они показывают стабильный reasoning (0.80+) и безошибочно видят скрытые риски там, где другие просто пересказывают фабулу.

🥈 Феномен Gemini: Модель от Google набрала рекордные 0.99 в векторе "знание норм", но провалилась в их применении. Это идеальный цифровой справочник, который, увы, иногда в сложных сценариях теряет нить рассуждения.

🥉 Азиатский парадокс: У китайских Qwen и GLM — мощнейшие логические движки, но нулевое знание российского контекста. Вывод: идеальны для работы, но только в связке с RAG.

🏗 Локальный "парадокс безопасности": Наши GigaChat и YandexGPT пока в роли догоняющих. Одна из проблем — гипер-осторожность. Коллеги из Яндекса так перекрутили корпоративные фильтры, что модель часто отказывается отвечать даже на невинные вопросы по гражданскому праву. Это "зона роста", которую нужно превращать в "зону пользы".

👉 Разбор методологии: в статье на zakon.ru и на habr.com
📊 Рейтинг : https://lexometrica.com/bench/

Результаты какой модели удивили вас больше всего? 👇
🔥21👏1