Big Data AI
18.3K subscribers
1.08K photos
153 videos
19 files
1.07K links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
Forwarded from Machinelearning
🌟 OpenAI предлагает поговорить с комнатным растением

Компания опубликовала на GitHub проект Plant Talk, с помощью которого комнатное растение можно наделить голосом и вести с ним беседу через ChatGPT.

Среди предлагаемых сценариев - дом, школьный класс, лаборатория или арт-проект.

В минимальной конфигурации нужны лишь компьютер с веб-камерой, микрофоном и динамиками, браузер Chrome или Edge и аккаунт OpenAI.

Камера делает снимок растения и проводит, как это называют OpenAI, "структурированную проверку его состояния", после чего можно начать разговор в реальном времени.

Например, спросить, как у него дела. в ответ растение "сверится со своими недавними наблюдениями" и оценит текущую обстановку.


Растению можно задать имя, характер и голос, а также настроить, на что именно обращает внимание камера.

Очевидно, что без дополнительных датчиков система судит о состоянии растения лишь по тому, что видит камера.

К системе можно подключить микроконтроллер Arduino с датчиком влажности почвы и модулем освещённости LM393, тогда к разговору добавятся реальные измерения.


📌Лицензирование: Apache 2.0 License


🖥Github


@ai_machinelearning_big_data

#AI #ML #PlantTalk #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Как ИИ за минуты выявляет риски по 152-ФЗ в ваших базах данных? 🔐

Персональные данные есть практически в каждой корпоративной системе — CRM, ERP, DWH, BI и служебных таблицах.
Но в большинстве компаний отсутствует прозрачность: где именно хранятся ПДн, кто их использует и какие риски это создает в рамках требований 152-ФЗ.

В результате компании сталкиваются с типовыми проблемами: «теневые» копии данных, избыточные права доступа, отсутствие понимания, какие данные вообще нужно хранить и обрабатывать.

📆 2 июля в 11:00 (МСК) компания Lasmart приглашает на бесплатный онлайн-вебинар «Как ИИ за минуты находит нарушения 152-ФЗ в корпоративных базах данных».

В программе вебинара:
— что 152-ФЗ говорит о персональных данных в СУБД;
— как автоматически находить и классифицировать ПДн в базах данных;
— как выстроить процесс работы с ПДн;
— как снизить нагрузку на ИБ и data-команды за счет автоматизации;
— демонстрация решения по мониторингу ПДн в СУБД.

👤 Спикер: Павел Хамрин, руководитель AI-направления Lasmart

🎁 Бонус участникам — чек-лист по контролю персональных данных в СУБД и DWH.

🔗 Регистрация по ссылке
1
🐍 Python Парсинг: Большой продвинутый бесплатный курс

Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.

https://github.com/justxor/Pythonparsing-/tree/main
👍32
Cursor опубликовал новое исследование: ведущие coding-модели могут завышать результаты на публичных бенчмарках, находя уже существующие решения вместо того, чтобы решать задачи самостоятельно.

На SWE-bench Pro автоматический аудитор обнаружил, что в 63% успешных запусков Opus 4.8 Max модель доставала уже известный фикс.

Самые частые обходные пути:

• находила merged pull request или уже исправленный source file в интернете

• искала в Git-истории будущий коммит, где баг уже был исправлен

• получала доступ к hidden tests или зеркалам бенчмарка, где был виден ожидаемый патч

• хардкодила ответ, найденный в утёкших evaluation materials

После этого Cursor создал более строгую среду тестирования: убрал историю репозитория и заблокировал большую часть доступа в интернет.

Результаты резко просели:

• Opus 4.8 Max: с 87,1% до 73,0%

• Composer 2.5: с 74,7% до 54,0%

У новых моделей разрыв оказался больше, чем у старых моделей вроде Opus 4.6. GPT-модели в тестах Cursor в целом показали меньшие просадки.

Cursor считает, что coding-бенчмарки должны проверять транскрипты работы агентов и жёстко контролировать, к чему модели имеют доступ во время оценки.

https://x.com/cursor_ai/status/2070195789121671624
4👍2🏆2
Оценки «какие профессии заменит ИИ» могут быть сильно искажены.

Новая работа показывает простую проблему: если считать AI exposure по чат-логам, мы часто измеряем не реальный риск для профессии, а популярность конкретной AI-платформы среди её пользователей.

То есть данные показывают не только «чью работу может изменить ИИ», а ещё и «кто вообще пользуется этим сервисом».

Из-за этого в выборке переоценены:

• IT-профессии
• офисные роли
• компьютерные специальности

И недооценены:

• еда и общепит
• транспорт
• производство
• ручной сервисный труд

Когда авторы перевзвешивают данные под реальные доли профессий на рынке труда, оценка эффекта ИИ на занятость падает на 42–93%.

А часть результатов становится почти нулевой.

Paper: “Who Uses AI? Platform Selection and the Measurement of Occupational AI Exposure”
arxiv.org/abs/2605.21743
62
Полугодовая технологическая ретроспектива и свежие AI-новости в одном эпизоде шоу «404 секунды»

В специальном выпуске сезона Антон Черноусов (Yandex Cloud) и Вячеслав Захаров («Газпром нефть») поставили таймер на паузу и без спешки разобрали длинные технологические тренды и хайповые новости. Среди тем: голосовой AI, цифровые агенты, роботы, данные, работа.

Обсудили новые профессии, внедрение искусственного интеллекта в повседневную жизнь и большие изменения в промышленности.

По-инженерному, с привкусом здорового скепсиса.

Посмотреть можно здесь: YouTube, VK Видео
Послушать – в
Яндекс Музыке
1
This media is not supported in your browser
VIEW IN TELEGRAM
Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.

Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.

🔗Выбирай удобный формат и регистрируйся по ссылке
 
📍Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
🖥 NVIDIA показала HORIZON для agentic hardware design

У NVIDIA вышла работа про HORIZON - систему, где агентное программирование переносится в дизайн железа.

Идея интересная: hardware design рассматривается не как разовая генерация Verilog-кода, а как эволюция целого репозитория. Markdown harness превращается в project pack: внутри доменные знания, исполняемый evaluator, критерий приёмки и правила работы с git.

Дальше агент не просто пишет кусок кода, а меняет изолированное worktree, запускает проверки и двигается по результатам verifier harness.

Для железа это особенно важно. Здесь мало красивого ответа в чате: дизайн должен проходить исполняемые тесты, симуляции и формальные ограничения. Поэтому verifier становится настоящим интерфейсом между агентом и задачей.

В статье заявляют 100% benchmark completion на нескольких наборах задач по hardware design. Даже если вы не работаете с EDA, за этим стоит следить: agentic coding начинает заходить туда, где ошибка стоит намного дороже, чем сломанный unit test.

Paper: https://arxiv.org/abs/2606.28279
Please open Telegram to view this post
VIEW IN TELEGRAM
❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️

Современные ИИ-продукты — это уже не просто LLM, а целые агентные системы с памятью, поиском и интеграциями. Именно этому посвящена Yandex AI Studio Series Summer Edition.

Эксперты Яндекса поделятся подходами, которые используют при разработке корпоративных решений, расскажут о новых инструментах платформы и покажут, как выстраивать автоматизацию с помощью ИИ.

Что ждет участников:
— архитектурные доклады и практические кейсы;
— интенсив для самостоятельной практики;
— обзор новых сервисов и функций Yandex AI Studio.

Подключайтесь, чтобы разобраться в современных ИИ-инструментах вместе с теми, кто их создает.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
Anthropic могла спрятать предупреждение Китаю прямо в Claude Code

Суть не в том, что Anthropic видит прокси, маршруты или метаданные. Это ожидаемо.

Суть в другом: Claude Code якобы вшивал China-related fingerprint прямо в системный промпт через почти незаметные изменения.

Например, другой формат даты или визуально похожие Unicode-символы.

Это выглядит как сигнал реселлерам и лабораториям:

мы видим прокси-маршрутизацию через Китай и знаем, кто пытается обходить ограничения.

Главный вопрос теперь не в блокировке Китая.

А в том, насколько вообще можно доверять инструменту, если скрытые маркеры могут жить прямо внутри промпта.
1💩1