DenoiseLAB
485 subscribers
1.34K photos
160 videos
3 files
1.58K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
никто не хочет прикупить
Qwen3Guard: Китайский ИИ-страж для безопасного AI

Компания Qwen представила специализированную модель-сторож — Qwen3Guard, первая в своем семействе модель ИИ, созданная исключительно для безопасности. Эта модель определяет уровень риска в запросах пользователей и ответах моделей на 119 языках.

Что это такое?
Qwen3Guard — это "песочница" для ИИ, которая анализирует контент и присваивает ему один из трех уровней риска: Безопасный, Спорный или Небезопасный.

Две версии для разных задач
Qwen3Guard-Gen — для анализа готовых текстов (офлайн-фильтрация датасетов)
Qwen3Guard-Stream — для real-time проверки во время генерации ответа

Ключевые преимущества
• Трехуровневая классификация рисков
• Поддержка 119 языков, включая русский
• Модели разного размера (0.6B, 4B, 8B) для любых мощностей
• Лидирующие результаты в тестах безопасности

Технические детали
Qwen3Guard-Stream использует архитектурное решение с двумя легковесными классификаторами в последнем слое Transformer, что позволяет анализировать токены по мере их генерации без значительных задержек.

Где использовать?
— Безопасная фильтрация обучающих данных
— Сигналы вознаграждения в RLHF
— Реальная модерация чатов
— Предотвращение jailbreak-атак

HuggingFace | ModelScope | Aliyun Service

#КитайскийИИ #КитайAI #AIбезопасность #Qwen #Модерация #ИИ
🔥1
🚀 Как оптимизировать Python‑код уже на старте — советы для новичков

Не нужно быть профи, чтобы писать быстрый и аккуратный код. Вот 7 простых приёмов, которые реально помогают:

1. Используй профайлеры (cProfile, Py‑Spy) 
   Перед оптимизацией — измерь время. Часто больше всего тормозят совсем неожиданные места.

2. Перестрой алгоритмы и структуры данных 
   Выбор между списком, множеством или словарём может кардинально изменить сложность: O(1) вместо O(n) при поиске.

3. Выбирай встроенные функции 
   map, max, join — всё это написано на C и работает быстрее ручных циклов.

4. Пиши list/dict comprehensions и используй zip, enumerate 
   Это компактнее, читабельнее и часто быстрее классических for-циклов.

5. Генераторы вместо списков, где не нужен весь набор сразу 
   Снижают потребление памяти и ускоряют обработку.

6. Переход на PyPy или JIT‑ускорители 
   PyPy, Numba и Cython могут дать прирост производительности в 2–100 раз для тяжёлых вычислений.

7. Избегай преждевременной оптимизации 
   Оптимизируй только то, что реально тормозит. Профайлер покажет, где именно.

🧩 Быстрый чек-лист:

• Измерил ли я время выполнения? 
• Подходящие ли структуры данных? 
• Используются ли встроенные функции? 
• Применены ли comprehensions и генераторы? 
• Рассматривал ли я PyPy или JIT? 
• Код по-прежнему читаемый?

Вывод: даже новичок может писать быстрый и понятный Python-код. Главное — думать, замерять и улучшать без фанатизма.

▶️ Подробности с кодом
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Ребят, знакомые попросили написать парсер, за денежку. Вот описалово. Кому интересно, контакты внизу.

Нужно собрать парсер который раз в день проверяет 5-10 позиций идентичных на 30 сайтах наших дилеров и выгружает нам в таблицу цены.

@Kir_Bekker
Breaking. Альтмана поймали за воровством видеокарт. Теперь ему грозит от 5 до 7 лет без инвестиций.

P.S. Видео ни в коем случае не фейк и не сгенерировано новой Sora 2

Шура Балаганов нашего времени ))
😁2
В Лондоне конфисковали крупнейшую сумму криптовалюты - 61000BTC у гражданки Китая Чжимин Цян. Вся сумма была получена преступным путем - привлечение вкладчиков с обещанием дохода до 300%. Жертвами стали более 128 тыс человек. Обвиняемая скрылась в Великобритании, легализовать средства пыталась через покупку недвижимости. Расследование длилось более 7 лет. Обвиняемая признала вину, в ближайшее время ей вынесут приговор. Что касается изъятых активов, то тут возник спор: Великобритания хочет покрыть средствами дефицит бюджета, в то время как китайские инвесторы требуют возврата средств.@BlackAudit
Китов начали прижимать
🇷🇺 Made in Russia: дайджест №16 новостей из мира IT, науки, космоса и технологий

От неба до блокчейна — новые технологии недели, сделанные в России:
🔸  JetOS — новая операционка для российских самолётов.
🔸 Датасет от «Т-Технологий» на 135 млрд взаимодействий.
🔸 ИИ-агенты в Yandex Cloud без строчки кода.
🔸  Алгоритм МФТИ против криптомошенников.
🔸 Программа НовГУ для контроля микросхем.

Все главные новости — в новом выпуске дайджеста: https://cnrlink.com/madeinrussiatg16
Пока Anthropic хайповал на своем 30 часовом агенте у партнёра у него утащили реальный научный приоритет в агентах для долгосрочной работы.

Это все серьёзно, поэтому статью публикует по факту главный научный журнал в мире Nature, где редакторы обычно отвергают статьи вендоров ИИ как плохо проверенные,  о мусоре с arxiv и говорить нечего.

В чем тут прорыв? Кажется поймали вариант группы агентов по планированию сложных задач, что как минимум смягчает самый сложный момент для ИИ как стратегическое планирование автономной деятельности. Предлагаемый Modular Agentic Planner (MAP) как минимум проходит разные тесты на планирование стратегии (ToH, PlanBench, StrategyQA)


Идея заключается в том, чтобы уйти от примитивных ToDo списков задач к декомпозиции их вглубь как Work Breakdown Structure (WBS). Сам WBS создаётся итеративно. Actor предлагает действия, Monitor контролирует возможность их и отсутствие ошибок, Predictor моделирует состояние целевой системы после такого действия (последствия), Evaluator оценивает как в PCAM насколько есть соответствие целям последствий действия. Orchestrator уже принимает их и вносит поправки в план. Это все отдельные агенты.

Повторить схему довольно просто и судя по тестам это не хайп, а довольно эффективно

https://www.nature.com/articles/s41467-025-63804-5

#agent #llm #ai
В Brave появится поисковая ИИ-функция Ask Brave

Разработчики Brave Software, стоящие за созданием ориентированного на конфиденциальность браузера и поисковика, представили функцию Ask Brave, которая объединяет поиск и ИИ-чат в единый интерфейс.

https://xakep.ru/2025/09/30/ask-brave/
В Афганистане полностью отключили интернет

По информации специалистов NetBlocks и Cloudflare, 29 сентября 2025 года в Афганистане была введена полная блокировка интернета. Аналитики сообщили, что сетевые провайдеры в стране были отключены поэтапно, и телефонная связь также работает с перебоями. Таким образом власти страны борются с безнравственностью.

https://xakep.ru/2025/10/01/af-blackout/

Обратно в 17 век...
Да что вы знаете о Hard Coding )))
😁1
Чума просто )))))
📆Команда GigaChat Audio едет в Нижний Новгород с митапом про речевые технологии

В программе — живые истории о том, как исследования становятся работающими сервисами:
🔘prod-ready распознавание речи на ограниченном наборе данных
🔘speaker diarization: распознавание по голосам в реальном времени
🔘быстрые команды с произвольной структурой для low-resource сценария колонок
🔘суммаризация трёхчасовых видео в GigaChat

В финале вечера — нетворкинг с ребятами из нашей команды.

📆 3 октября, 18:00
📍 Нижний Новгород, «Гараж»

🖥Регистрация и программа уже на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
ИИ-бот потряс Уолл-стрит, превратив $1 тыс. в $50 тыс. за рекордные 30 дней

Беспрецедентный результат искусственного интеллекта: новая торговая система на базе ИИ, согласно проверенным данным MyFxBook, принесла $14 158 прибыли с начальных $3200 всего за одну неделю.

Однако на первом успехе история не завершилась. Стартовав в мае 2025 года с $1000, бот вновь вызвал ажиотаж среди трейдеров. Всего за пять месяцев, к октябрю, он заработал прибыль в размере $5600, что представляет собой потрясающую доходность в 560%.

Такой результат привлек внимание трейдеров по всему миру, вызвав у них живой интерес и любопытство. Этот робот, использующий передовые технологии искусственного интеллекта, продемонстрировал свое мастерство, точно предсказывая рыночные тенденции и совершая сделки в автономном режиме.

Трейдеры могут выбирать различную скорость торговли — от медленной и стабильной до быстрой и агрессивной. Для тех, кого интересуют потенциальные доходы в аналогичных сценариях, доступен калькулятор ROI.

После таких прорывов в области ИИ, как ChatGPT, данное достижение кажется закономерным следующим шагом. Его производительность поражает не меньше, чем простота использования. Уже поползли слухи, что крупный американский хедж-фонд заинтересовался покупкой алгоритма. По мере развития этой истории финансовый мир замер в ожидании.
https://finzennews.com/news/index.php?utm_source=taboola&utm_medium=referral&utm_campaign=44233578&utm_content=4179542489&tblci=GiC23o6ysQijtCLq4vcmkyHaffnBemj5gsSO1BWRJyBuMSCdyFso5MCG_MGau4uCATDEBA#tblciGiC23o6ysQijtCLq4vcmkyHaffnBemj5gsSO1BWRJyBuMSCdyFso5MCG_MGau4uCATDEBA
Гонки !!!!
🤔Экспериментальная модель 🖥Extract-0 за $196 превзошла 👩‍💻 GPT-4 и 👩‍💻 o3 в извлечении данных?

Исследователь Энрике Годой из 🇧🇷Бразилии представил ИИ-модель Extract-0, специализированную LLM с 7 миллиардами параметров, которая демонстрирует новый уровень эффективности в извлечении структурированной информации из документов. Согласно исследованию, данная языковая модель превосходит по производительности популярные универсальные модели, включая GPT-4.1, o3 и GPT-4.1-2025. Ресёрчер ставит под сомнение устоявшуюся парадигму, где доминирующим фактором эффективности считается исключительно масштаб модели.

Ключ к успеху Extract-0 кроется в новаторской трехэтапной методологии обучения, которая позволила достичь высокой точности при минимальных затратах. Процесс включает генерацию 280 128 синтетических примеров данных с сохранением контекстной памяти, параметроэффективную тонкую настройку (LoRA), затрагивающую всего 0.53% весов модели, и обучение с подкреплением (GRPO) с использованием семантической функции вознаграждения. Такой подход позволяет ИИ-агенту понимать смысловую эквивалентность данных, а не простое текстуальное совпадение.

В ходе тестирования на эталонном наборе из 1000 задач по извлечению информации Extract-0 достиг среднего показателя вознаграждения 0.573, значительно опередив GPT-4.1 (0.457) и o3 (0.464).

◀️Для адаптации ❗️ DeepSeek-R1-Distill-Qwen-7B применялся метод Low-Rank Adaptation (LoRA), который изменил всего 0.53% от общего числа параметров модели (40.4 млн из 7.66 млрд).

◀️Изначально базовая модель без дообучения имела средний результат 0.232 и валидность JSON на уровне 42.7%.

◀️После этапа контролируемой тонкой настройки (Supervised Fine-Tuning) производительность модели выросла до 0.507, а валидность JSON достигла 79.9%.

◀️Финальный этап обучения с подкреплением (GRPO) позволил достичь итогового результата в 0.573 со средней валидностью JSON в 89.0%, что представляет собой кумулятивное улучшение на 147.0% по сравнению с базовой моделью.


🖥 Примечательно, что общая стоимость всего цикла обучения модели на одном графическом процессоре NVIDIA H100 составила всего $196.

Цифры наглядно демонстрируют экономическую и техническую состоятельность целенаправленной оптимизации под конкретную задачу. Исследование убедительно пытается доказать, что узкоспециализированные ИИ-решения могут быть не только конкурентоспособными, но и более эффективными по сравнению с масштабируемыми моделями общего назначения.

👆Ограничение исследования коренится в его валидационной парадигме, которая оценивает производительность модели исключительно на in-distribution данных. Обучающий и тестовый наборы сэмплированы из одного и того же синтетического распределения, поэтому продемонстрованная высокая производительность не позволяет сделать надежных выводов о способности модели работать также эффективно в реальных условиях на практических задачах. Таким образом, полученные метрики обладают высокой внутренней валидностью (в рамках созданного синтетического мира), но их внешняя валидность (применимость к реальным задачам) остается под вопросом.

👀 В любом случае ознакомиться с исследованием не помешает.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
3D-фильмы можно будет смотреть на обычном ноутбуке — разраб придумал технологию True3D Window Mode.

Она превращает ваш экран в «окно в трехмерное пространство» — вебка отслеживает движение головы и подстраивает под него глубину картинки
Специалист по молекулярному моделированию в Ligand Pro

Ligand Pro ищет квалифицированных специалистов в области структурной биоинформатики и молекулярного моделирования для работы над проектами, связанными с разработкой новых подходов к решению задачи молекулярного докинга и описанию взаимодействий типа белок-лиганд и белок-белок в целом.

Чем предстоит заниматься:

→ Собирать и автоматизировать пайплайны для расчета комплексов (оптимальной взаимной ориентации, энергии связывания, и др.) белок-лиганд и белок-белок методами молекулярной динамики.
→ Разрабатывать новые основанные на физико-химических свойствах молекул эмбеддинги для белков и лигандов с целью их дальнейшего использования при обучении ИИ моделей молекулярного докинга.
→ Осуществлять бенчмаркинг результатов ИИ моделей с помощью классических методов молекулярного моделирования.
→ Участвовать в подготовке публикаций в научных журналах и докладов на конференциях.

Какие необходимы навыки и знания:

→ Уверенное владение методом молекулярной динамики и его производными (приоритетны Metadynamics, Replica exchange simulations, Accelerated molecular dynamics, Alchemical transformations), знание принципов конструирования силовых полей AMBER, CHARMM, MARTINI, а также общих силовых полей для малых молекул (GAFF, CGenFF).
→ Опыт работы в пакете GROMACS и в сопутствующих программах, сервисах и библиотеках (PLUMED, Antechamber и ACPYPE, CHARMM-GUI, MDAnalysis и др.), в т.ч. в программах визуализации (VMD, PyMOL).
→ Опыт работы с программами для моделирования белковых структур и комплексов (AlphaFold, Boltz, I-TASSER).
→ Базовые навыки программирования на языке Python и работы в командной строке Unix.
→ Плюсом будут знания в области квантовой химии и навыки работы в соответствующих программных пакетах (ORCA, Gaussian, TeraChem и др.), знание языков программирования С++, C и CUDA.

Условия:

→ Оклад ₽100'000 - 250'000 в зависимости от квалификации, обсуждается по результатам собеседования
→ Очный или гибридный формат работы, офис в Сколтехе.
→ Гибкое начало дня.
→ Оформление по ТК РФ.
→ ДМС.

Контакт для связи:

@Egorchikk Егор Булавко, руководитель отдела моделирования в Ligand Pro


Ligand Pro (ligandpro.ru) — российский стартап, занимающийся созданием и совершенствованием цифровых инструментов рационального дизайна лекарственных средств. Наш арсенал включает методы глубокого обучения нейронных сетей, дополняющие и расширяющие возможности классических алгоритмов вычислительного драг дизайна, а также расчеты методами молекулярной динамики и квантовой химии.
1
Развивайте карьеру с лидером горно-металлургической отрасли на бесплатном онлайн-курсе от «Норникеля»!
Проходите карьерные консультации, получайте приоритетное рассмотрение на «Профстарт», а также экскурсии на производство и подарки для самых активных.

Что ждет на программе:
Выбор профессионального трека и резюме, которое действительно работает;
Топ-10 гибких навыков, которые ценят работодатели;
Развитие инженерного, критического и экологического мышления, управление рисками и проектами;
Истории из первых уст: как на самом деле работают на Севере;
Кейс-чемпионат в конце курса.

Подойдет не только технарям, но и студентам менеджерских и бизнес-направлений.
🔥Старт — 10 октября.
Начните учебный год с мощного апгрейда, регистрируйтесь по ссылке: https://u.to/hnBbIg
Please open Telegram to view this post
VIEW IN TELEGRAM
Цикл лекций по структурной биологии

На следующей неделе в ФИЦ Биотехнологии РАН❤️ стартует цикл лекций в рамках участия Центра в ФНТП «Развитие синхротронных и нейтронных исследований и исследовательской инфраструктуры на период до 2030 года».

🗓Каждую неделю по средам в 16:00 в течении двух месяцев ведущие ученые из ФИЦ Биотехнологии РАН, МГУ имени М.В.Ломоносова, МФТИ и других институтов РАН представят научно-образовательные лекции по тематикам, лежащим в русле современной интегративной структурной биологии, ориентированные на широкий круг слушателей.

08 октября, 16:00
Спектроскопия в исследовании белков
Максимов Е.Г., д.б.н, зав. лаб. физико-химии биомембран биологического факультета МГУ имени М.В. Ломоносова

15 октября, 16:00
Рентгеновские лазеры на свободных электронах в структурной биологии и разработке лекарств
Мишин А.В., МФТИ, к.ф-м.н, с.н.с., и.о. заведующего лаборатории структурной биологии рецепторов, сопряжённых с G белком

22 октября, 16:00
Биомедицинская масс-спектрометрия
Николаев Е.Н., д.ф-м.н, профессор, зав. лаб. масс-спектрометрии биомакромолекул ИБХФ РАН

29 октября, 16:00
Малоугловое рассеяние: принципы, применение в структурной биологии и перспективы
Штыкова Э.В., д.х.н, в.н.с. лаборатории биоэлектрохимии ИФХЭ РАН

05 ноября, 16:00
Методы молекулярного моделирования в исследовании биологических систем
Хренова М.Г, д.ф-м.н., руководитель группы молекулярного моделирования ФИЦ Биотехнологии РАН / зав. НИЛ квантовой химии и молекулярного моделирования МГУ имени М.В. Ломоносова

12 ноября, 16:00
Методы ИИ в биологии (первая лекция)
Головин А.В., д.х.н., профессор факультета биоинженерии и биоинформатики МГУ имени М.В. Ломоносова, с.н.с отдела математических методов в биологии НИИ Физико-химической биологии имени А. Н. Белозерского МГУ имени М.В. Ломоносова

19 ноября, 16:00
Методы ИИ в биологии (вторая лекция)
Головин А.В., д.х.н., профессор факультета биоинженерии и биоинформатики МГУ имени М.В. Ломоносова, с.н.с отдела математических методов в биологии НИИ Физико-химической биологии имени А. Н. Белозерского МГУ имени М.В. Ломоносова

26 ноября, 16:00
Криоэлектронная микроскопия
Моисеенко А.В., н.с. кафедры биоинженерии (Биологический факультет) МГУ имени М.В. Ломоносова

📍Лекции пройдут в конференц-зале ФИЦ Биотехнологии РАН по адресу: пр-т 60-летия Октября, д. 7, корп. 2.

❗️Участие бесплатное, вход свободный!
Трансляция не предусмотрена.

➡️Следите за анонсами!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4