NSR Specification - блог
354 subscribers
56 photos
17 videos
1 file
18 links
Технологии AI и ML для преобразования текста нормативных документов в машиночитаемый и машинопонимаемый форматы
Download Telegram
‼️ ВАЖНЫЕ НОВОСТИ ‼️

С 1 апреля 2025 года вступило в силу Постановление Правительства РФ №157, согласно которому все коммерческие организации обязаны провести ревизию оборудования и изделий в административных помещениях! 🏢

Что это значит?
Теперь каждая компания должна присвоить объектам коды Классификатора Строительной Информации. Включая:
Офисную мебель
Технику и оборудование
Даже розетки и выключатели!

⚠️ Первые проверки стартуют уже этим летом. Несоблюдение требований грозит серьёзными санкциями⚠️

🦾 Команда NSR Specification гордится тем, что одной из первых выполнила все требования и готова помочь остальным!

Времени осталось немного – советуем не откладывать! 🚀
😁18🔥3👍1👏1😱1
🔥NSR Specification отправляется в большой тур вместе с nanoДРАЙВ! 🔥

Готовы к серии встреч по всей России, где обсуждаем не абстрактную цифровизацию, а реальные решения для проектирования, строительства и производства.

✈️Наш маршрут:
📌 10 апреля — Казань (СиСофт Казань)
📌 15 апреля — Тюмень (СиСофт Омск)
📌 22 апреля — Санкт-Петербург (Ромбит, ТиБиЭс)
📌 24 апреля — Екатеринбург (АйДиТи)
📌 14 мая — Красноярск (Макссофт-24)
📌 20 мая — Новосибирск (МедиаТехнологии)
📌 3 июня — Челябинск (Нормасофт)
📌 5 июня — Уфа (Бюро САПР)

Стартуем в Казани!
🚀 10 апреля, Kazan Palace by Tasigo
От NSR Specification — Максим Журавлев

🔊 Что будет ?
🔹 nanoCAD — универсальная САПР-платформа для инженеров
🔹 BIM/ТИМ — эффективное проектирование и управление
🔹 Цифровая документация и автоматизация процессов
🔹 3D-моделирование и геотехнический мониторинг
🔹 Паспортизация объектов и сводные цифровые модели

О чем расскажем мы
👉 Машинопонимаемые правила проверки — как автоматизировать контроль проектов и избежать ошибок.
👉Новые функционал — свежие обновления, которые расширяют возможности проверок, делая процесс точнее и удобнее.

🎁 Плюс:
💡 Нетворкинг с экспертами
🎧 Розыгрыш умной колонки, наушников и других крутых призов

✈️ Следите за нашими анонсами! Будем напоминать вам о каждой встрече, чтобы никто не пропустил своё событие.

Регистрируйтесь на ближайшую конференцию:
Присоединиться
Увидимся на nanoДРАЙВ! 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🏆4👍1
Проект приказа.docx
68.5 KB
🤩Я была в отпуске. И честно пообещала себе ничего не смотреть про работу.
Но, как назло прогремела новость:
👆👆👆🌟🌟🌟🌟🙂🙂🙂🙂
Состав цифровой информационной модели, дополняющей графическую часть разделов проектной документации, направлен на публичное обсуждение

И тут же началось активное осуждение обсуждение.

Много весёлого заметили будущие пользователи 👀
Например, требование указывать массу у помещения. Или, определение количества символов в коде КСИ заданием на проектирование, в определённых случаях...

Я честно ждала выхода на работу, чтобы высказать свою боль. Это – наименование габаритов у элементов. 👻

Например, судя по положениям нового документа, у стены нужно указать: толщину, ширину, длину, высоту.🎰
❗️Оставим шутки про стены в четырёх измерениях.

Допустим, что можно что-то из перечисленных параметров не заполнять.👓
Высота и толщина – худо-бедно однозначны для понимания.

Но. Как ни крути ты эту стену – длина и ширина все равно будут взаимозаменяемыми понятиями. И нет ни одного документа, который бы говорил, что-где находится и когда все это закончится 🤯

Почему длина и ширина взаимозаменяемы

Потому что, длиной невольно хочется назвать габарит, который явно больше всех, включая высоту. А шириной – если меньше.

🟠То есть, в одном и том же проекте, одни и те же элементы будут иметь отличный набор наименований характеристик 🐊

Как же тогда реализовывать нормативные проверки
(Никак)
Мы никогда не сдвинемся с мёртвой точки, если не установим твердо и четко перечень характеристик для описания разных объектов: стен, перекрытий, ступеней, помещений. И не зафиксируем, что, в какую сторону будем измерять.🖋

Утопия, но куда ж без неё 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝8🏆5😁4👍2
Учебный центр СПб ГАУ «Центр государственной экспертизы» 👩‍💻 предоставил нам уникальную возможность рассказать о своей работе слушателям курса "Технология Информационного Моделирования" (https://t.me/spbexp_ru/784).

👽Я изо всех сил старалась быть максимально откровенной освещая текущую ситуацию.
🌏А, чтобы поддержать надежду на светлое будущее автоматизации ⭐️ впервые показала вживую полный цикл преобразования требований в правила проверки ЦИМ на разнообразных примерах.

Процесс разметки требований сложно назвать легким, зато этот метод реально работает и рушит опасные иллюзии про волшебную красную кнопку.🚨


💫Огромное спасибо @AlexanderShilo за поддержку
Ещё большее спасибо слушателям за внимание, терпение и интерес к нашей непростой работе!⭐️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👏43❤‍🔥1🏆1
Media is too big
VIEW IN TELEGRAM
Давно хотели показать, как мы мастерски научились обращаться с текстом требований для конвертации правил проверки ЦИМ! Надеемся, что вам будет не слишком скучно🐱
P.S. Процесс разметки текста - ерунда по сравнению со съемками демонстрационного видео) Зато сколько багов поправили в процессе!🌌
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍4🔥3👏2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
В предыдущем посте мы выложили видео, где во всех подробностях был показан процесс разметки текста требований. ⬆️
Внимательный зритель неизбежно задастся вопросом: "Ну и где же ваш хваленый ИИ, с помощью которого происходит автоматизация? Не считая подсказки семантических компонентов?"
Поэтому, хотим показать вам еще одно видео. С подсказками разметки простых суждений, которые мы можем запрашивать у генеративной модели.
Да, эти подсказки пока далеки от идеала: ИИ ошибается при выборе типа суждения (тип структурный вместо местоположения); добавляет лишние компоненты в суждения... Но, он учится! 👩‍🚀
И, мы очень надеемся, что наш модуль разметки не только выполнит конкретную задачу преобразования текста требований в правила, но и поможет ИИ начать лучше понимать тексты требований.❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥97❤‍🔥3
Media is too big
VIEW IN TELEGRAM
У нас ничего не получается 🤩

💜💜💜

крик души разработчика ПО (а душа у нас все-таки есть♍️).

Паника связана с тем, что мы пытаемся втиснуть все многообразие условий нормативного требования в ограниченное количество операций по проверке ЦИМ, реализованное в готовых программных решениях.

Это очень напоминает управление марионеткой на ниточках с помощью креста (ваги).🤩

Чем мы можем оперировать:
💜 фильтры по свойствам объектов
💜 оценка минимального расстояния (когда в случае наличия одного объекта относительно другого на определённом расстоянии- работает условие проверки)
💜 оценка наличия объекта (трудно для понимания, но, против факта не попрешь: в этом случае условие проверки будет работать, когда не получилось обнаружить один объект на определённом расстоянии, относительно другого)
💜 оценка пересечения объектов (условие проверки работает в случае, если есть физическое пересечение объектов)

И это все. Понимаете🪻Все🪻

А это означает 🤩
что из требования к лестницам в лестничных клетках, у которых должна быть определённая ширина или уклон, надо получить условие минимального расстояния: искать помещение/зону лестничной клетки относительно объекта лестницы, и, если она обнаружилась, то проверять значение ширины

🤩 Если же проверять надо лестницы не в зоне лестничной клетки, то, позарез надо обратить внимание на это коротенькое отрицание 🤩"не"🤩 и зацепившись за него, как за якорь ⚓️ создать условие проверки наличия объектов.
Чтобы оценивать свойства только тех лестниц, у которых лестничных клеток не нашлось😊

И это еще пол беды, а вот что делать с "открытыми лестницами"🪻
Как из этого текста получить в явном виде указание на то, что речь о лестницах не в лестничной клетке🪻

🖇Колясочная должна располагаться на расстоянии менее (не более) Х метров от входа - наличие соседних объектов
🖇Котельная должна располагаться на расстоянии более (не менее) Х метров от склада горючих материалов - минимальное расстояние

Тут уже надо искать 🖇comparative relation🖇, разумеется вместе с отрицанием "не" и в зависимости от их значения создавать правильное условие

А ведь может быть и "колясочная не должна располагаться на расстоянии более X метров от входа"😁

Вы только не подумайте, это все решаемо
Просто за любым алгоритмом автоматизации обязательно есть человек, который продумал и описал логику работы во всем многообразии вариантов🙏
А мы ещё и первые на этой не самой прямой дорожке🏃‍♀️
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥5👍2
This media is not supported in your browser
VIEW IN TELEGRAM
В качестве благодарности всем, кто выдерживает наши занудства, хотим показать интерфейс нового QA-чата (Вы будете первыми!).🚀

Совсем скоро начнем бета-тестирование. Надо только улучшить поиск фрагментов НД (за счет добавления мета-информации и внедрения гибридного поиска).

А! Еще добавим гиперссылки на подсистему требований. И будет совсем хорошо.🌌
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥115👍2
Конференция NFST (nfst.ru) в родном Питере.💫
Очень тёплый приём, очень интересные доклады! Особенно трогательно то, что организаторы помнят меня ещё в начале работы над продуктами NSR.
Как говорится, если долго смотреть на женщину, можно увидеть как из неё выходит толк (в виде машинопонимаемых требований).😂
Огромное спасибо за приглашение!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍7😁4
Меня часто спрашивают:

Сколько практической пользы получит проектная компания после внедрения наших высокотехнологичных решений

Причём отвечать надо в деньгах, на крайний случай, в процентах💰

Я, наверное, очень плохой продакт-менеджер☹️
потому что, подобные вопросы ставят меня в тупик.
До чертиков не люблю оперировать данными, которые невозможно проверить...🥲

Хочу пооткровенничать тут.⬇️

Итак, любая новая технология (а NSR- это новая технология) при внедрении неминуемо приведёт к увеличению трудоёмкости ⏺️

Взять хотя бы автоматические проверки для ЦИМ.

📌Чтобы их применять, необходимо не только пересмотреть и переработать нормативы, но и навести порядок в самом процессе проектирования.
Как минимум, понадобится разработать и внедрить стандарт, который позволит создавать единообразные, насыщенные информацией и структурированные ЦИМ

Только тогда можно будет применять универсальные проверки по нормативным сценариям 🖇️

И, если из такой ЦИМ будут выгружены комплекты чертежей ПД/РД, то, количество ошибок, разумеется, сократится. И можно будет ожидать повышение эффективности проектирования в виде сокращения сроков,  трудозатрат и прочее, прочее.

➡️Судя по проведённым пилотным проектам, в каждой пользовательской ЦИМ, около 30% проверок показывают реальные проблемы и ошибки.

Не соблюдаются минимальные расстояния между коммуникациями

Встречаются нарушения площадей помещений

Размещение объектов там, где их нельзя размещать

Здорово ли то, что мы можем найти такие нарушения?

Конечно здорово

Найденные и исправленные ошибки повышают шансы пройти экспертизу с первого раза🙏

Но, если ЦИМ так и останется красивым трехмерным образом🎰, который подняли по чертежам просто "чтобы было", то проверяй её автоматизировано, вручную или не проверяй вовсе -

пользы не будет никакой🐱🐱

🌚
Как бы так закончить чем-то позитивным?

У нас всех есть два пути:

1️⃣Оставить все как есть, без лишних трудностей и дополнительной пользы

2️⃣Не пожалеть своих усилий, чтобы потом иметь шанс на качественное улучшение рабочего процесса

🌼Мы выбираем не мечтать о светлом будущем, а твердо шагать в его направлении!🌼
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥157👍5
Media is too big
VIEW IN TELEGRAM
Испытала непреодолимое желание показать вживую конвертацию правил проверки ЦИМ из разметки. Без купюр, так сказать🤪
Сразу дико извиняюсь за то, что показываю на примере, который мы уже успели заездить. Но текст этого требования слишком удачный с точки зрения вариативности интерпритации🔥.
Для тех, кто смотрел прошлые демонстрации - что-то новенькое начинается с 6-й минуты🎆
Upd* Я очень боюсь внимательного зрителя, поэтому поясняю: CADLib МиА нумерует группы отбора начиная с 0, поэтому проверка характеристики "Высота ограждения" совершенно правильно сработает для группы1, под которой как раз и скрываются фильтры для отбора объекта "Лестница"😊
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1510👍2
Media is too big
VIEW IN TELEGRAM
🔥109👍5🥰3
Если сам себя не похвалишь... это за тебя сделает ИИ!!(Спасибо SUNO AI за песню🤩) Вот ссылка, если вам тоже хочется, чтобы про вас спели:

https://suno.com/ 🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8
Media is too big
VIEW IN TELEGRAM
Я торопыга🤪 Так спешила продемонстрировать работу новой функции отображения правил проверки ЦИМ в Подсистеме требований NSR Specification, что снимала ролик на одном дубле и забыла попрощаться🧑‍🚀Надеюсь, вы простите эту оплошность!
Самое главное: в скором будущем мы сможем начать публиковать базы профилей проверок ЦИМ для наших пользователей!🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥8👍6
Рубрика: NSR любит усложнять🔥

📍ЗАДАЧА:

Подготовить векторную базу фрагментов из пользовательских документов. Это нужно для реализации RAG-системы — движка, на котором будет работать наш QA-чат (мы уже активно его готовим к релизу).
🟡🟡🟡
Зачем
Чтобы чат мог не просто «искать по PDF-ке», а по-настоящему понимать документы, анализировать их, отвечать на вопросы, выявлять противоречия, несоответствия и прочие радости технической документации.

Кажется, всё уже придумали: передал документ в LLM — и готово.
Но, как обычно, не всё так просто.

Сегодня активно обсуждается end-to-end подход: загружаем в мультимодальную языковую модель весь PDF целиком, и она сама всё делает — определяет, где заголовки, где таблицы, где просто текст, и возвращает идеально структурированный результат✔️

Звучит как магия🔶
А по сути:
➡️один пайплайн,
➡️минимум ручной настройки,
➡️гибкость под любые форматы.

📎Но реальность вносит коррективы:
➡️стоит дорого,
➡️работает медленно,
➡️не всегда понятно, что модель сделала внутри (а сделала ли?),
➡️и, самое неприятное — возможны «галлюцинации»: модель может сгенерировать текст, которого в документе никогда не было. Даже если очень попросить — не делать🙃

Такой подход действительно выглядит как самое очевидное и желанное решение.
Но внедрять его в прод — рискованно. Особенно если важна точность.
⚫️⚫️⚫️
Поэтому вот другие, не менее крутые (а местами и надёжнее) варианты извлечения данных из PDF⬇️:

1️⃣▶️Извлечение текстового слоя (GetText)
Если в PDF документе текст сохранён как текст, а не как изображение, его можно извлекать напрямую — символы, строки, абзацы.
высокая точность, «чистый» текст, без искажений и опечаток.
структура PDF может быть нестандартной — текст часто хранится как фрагменты с координатами, а не логически связанные абзацы. В итоге порядок строк может нарушаться. Метод неприменим к сканированным страницам✉️

2️⃣▶️OCR (оптическое распознавание символов)
Если PDF — это скан или изображение, каждую страницу можно конвертировать в картинку (например, PNG) и передать в OCR✔️
На выходе — текст с координатами. Но возможны искажения, «битые» токены, проблемы с кодировкой.
Для повышения читаемости можно дополнительно применять языковые модели👤

3️⃣▶️OCR + LLM
Сочетание OCR и LLM позволяет восстановить логическую структуру текста — используя координаты и контекст, модель делает текст более читаемым и структурированным.
Но есть недостатки:
⏹️повышенная нагрузка на вычисления,
⏹️увеличение времени обработки,
⏹️и опять же — риск генерации лишнего текста (галлюцинации).

4️⃣▶️Гибридный подход (GetText + OCR + LLM)
Наиболее сбалансированное решение:
✔️если в документе есть текстовый слой — используем GetText,
✔️если это скан — подключаем OCR,
✔️затем применяем LLM для очистки и структурирования результата.

📍Вывод
По хорошему нам надо заморочиться и реализовать интерактивный сервис распознания, где, в зависимости от документа можно выбирать сценарий парсинга текста

Мы, как пионеры, не боимся трудностей, сами их находим и с честью преодолеваем 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👏31🥰1