DataTalks
934 subscribers
475 photos
43 videos
375 links
Образовательный проект DataTalks. Рассказываем про управление данными на конференциях, митапах и марафонах.

#datatalks #безграниц #безрекламы #безводы

Контакты:
dataoffice@rt.ru
http://datatalks.rt.ru/
https://rutube.ru/channel/25367326/
Download Telegram
Всё больше российских компаний автоматизируют найм с помощью нейросетей. ИИ уже сокращает сроки поиска кандидатов почти вдвое. Активнее всего его используют в ритейле, логистике и банковском секторе. Но окончательное решение о найме по-прежнему остаётся за человеком.

Экосистема «Лукоморье» от «РТК ИТ Плюс» пополнилась тремя решениями: платформой «Акола» для no-code разработки приложений, системой «Диво» для автоматизации ИТ-служб и системой «Стрелка» для управления офисными пространствами. «Лукоморье» строится как единое цифровое пространство, где все продукты дополняют друг друга. За счет такой архитектуры бизнес может запускать ИТ-проекты быстрее, дешевле и без зависимости от поставщиков.

А в строительстве утверждён первый национальный стандарт использования ИИ, разработанный «Газпром нефтью» и партнёрами. Документ создаёт правовую основу для применения ИИ в строительном контроле. Цифровые решения, такие как дополненная реальность, уже помогают ускорить проверки на 80% и снизить расходы.
Please open Telegram to view this post
VIEW IN TELEGRAM
📢 Данные для ИИ или ИИ для данных?

27 марта Станислав Лазуков выступил на DATA&AI 2025 с докладом о взаимном влиянии данных и искусственного интеллекта.

В докладе поднимались темы:
🟣 как данные и искусственный интеллект влияют друг на друга;
🟣 как ИИ помогает с анализом данных — от чат-ботов до автоматизации разметки персональных данных и создания SQL-запросов;
🟣 как обеспечивать безопасный обмен данными, их обезличивание и каталогизацию;
🟣 какие инструменты и сценарии обработки позволяют получать качественные и релевантные данные для обучения моделей.


🔗 Запись выступления доступна по ссылке

📢 Подписывайтесь на RUTUBE канал TData, чтобы не пропустить новые видео!
Please open Telegram to view this post
VIEW IN TELEGRAM
В России укрепляется технологический суверенитет в ИБ. ГК «Солар» запустила Solar TI Feeds — сервис передачи данных об актуальных киберугрозах для SOC, EDR и других систем защиты. Потоки строятся на данных от сенсоров «Ростелекома» и аналитике Solar JSOC, обеспечивая высокую релевантность и быструю реакцию на инциденты.

DCAP-системы тоже в центре внимания. После ухода западных решений российские вендоры усилили позиции: 63% ИБ-специалистов оценивают отечественные DCAP как равные иностранным, а 24% считают их более продвинутыми, отмечает опрос «СерчИнформ». Главные задачи — защита от утечек, аудит данных и расследование инцидентов.

Необычный подход к ИТ-инфраструктуре предложили разработчики из НТИ: в России создают проект плавучих ЦОД на баржах. Они дешевле в строительстве, быстрее разворачиваются и могут работать в отдалённых регионах. Проект уже на стадии эскизного проектирования, в числе потенциальных заказчиков — крупные компании, госкорпорации и даже иностранные государства.
На ЦКАД в Подмосковье стартовали испытания беспилотных фур КАМАЗа и Navio. Проект расширяет сеть беспилотных логистических коридоров — к 2030 году их протяженность должна достигнуть 20 тысяч километров. Систему мониторинга и киберзащиты обеспечит платформа «ЭРА-ГЛОНАСС».

А в Музее транспорта Москвы появился первый российский беспилотный автобус «Матрёшка». Прототип 2016 года, рассчитанный на восемь пассажиров, способен проезжать 130 км без подзарядки. Автобус «Матрёшка» станет частью постоянной экспозиции в зоне «Будущее».

Тем временем исследователи Georgia Tech разработали алгоритм MPPI для беспилотников, который помогает автомобилям сохранять устойчивость в экстремальных условиях, анализируя тысячи траекторий в реальном времени с помощью GPU.
OpenAI ускоряет выпуск своих моделей: тестирование безопасности занимает всего несколько дней. Это поможет компании оставаться конкурентоспособной, но увеличивает риски.

Учёные из Санкт-Петербурга применили ИИ в экологии: их нейросеть оценивает уровень CO₂ в воде, что поможет бороться с закислением водоемов и защитить экосистемы.

«Яндекс» объявил награду до 1 млн рублей за поиск уязвимостей в своих нейросетях YandexGPT и YandexART — охота за ошибками становится важной частью защиты данных.

А в США развалилась красивая история стартапа Nate: обещанная ИИ-автоматизация оказалась ручной работой сотен сотрудников колл-центра. Инвесторы остались с убытками, а основателю грозит тюрьма.
Москва расширяет использование цифровых технологий в медицине: Мэр Москвы Сергей Собянин пригласил разработчиков подключиться к цифровизации столичной медицины. В приоритете — онлайн-сервисы для пациентов, системы мониторинга здоровья и автоматизация клиник. Лучшая разработка получит поддержку и шанс войти в городскую систему здравоохранения.

Нейротехнологии уже показывают реальные результаты: в США парализованной женщине помогли снова говорить с помощью индивидуального нейроинтерфейса и ИИ, распознающего её мысли и преобразующего их в речь.

В глобальном масштабе медицина за последние 20 лет достигла серьёзных успехов: от новых подходов в лечении рака и генетических болезней до восстановления слуха у детей и безоперационных технологий помощи при болезни Паркинсона.
🟣«Ростелеком» в последние годы активно расширяет спектр предоставляемых цифровых и телеком-услуг, увеличивая и пул заказчиков, многие из которых предъявляют повышенные требования к информационной безопасности.

Это вкупе с ростом сложности киберугроз требует от «Ростелекома» регулярной оптимизации мер информационной защиты. Как она устроена в группе компаний, TAdviser решил узнать у Артема Гребенюка, директора департамента эксплуатации средств информационной безопасности «Ростелекома».

Основные тезисы:
🟣Защита сети «Ростелекома»: централизованный мониторинг, проактивное выявление и блокировка DDoS‑атак, круглосуточное реагирование на инциденты.
🟣Совместные программы с университетами по подготовке экспертов.
🟣Постоянное обновление технологий и внедрение автоматизации для поддержания актуального уровня защиты.
🟣Все ключевые решения по критическим инцидентам принимает подготовленный специалист, а не «чёрный ящик» системы.

➡️ Читайте полное интервью по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
В этом посте мы подробнее ознакомимся с вызовами и методами, связанными с аналитикой данных в различных областях.

➡️ Применение методов машинного обучения для анализа цен на вторичное жильё в Липецке
Статья показывает, как машинное обучение и кластеризация применяются для анализа цен на вторичное жилье в Липецке, что помогает выявить ценовые тренды и лучше понимать рынок недвижимости.

➡️ Миф о чистых данных: почему ваш аналитик похож на сапёра
Статья обсуждает проблему “чистых” данных, подчеркивая важность подготовки и очистки информации, необходимой для успешной бизнес-аналитики.

➡️ Как организовать разметку данных для ML? Советы от Data Light
Также в статье рассматривается разметка данных, ключевой этап в работе с искусственным интеллектом, где сравниваются внутренние, краудсорсинговые и аутсорсинговые подходы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Искусственный интеллект уже не просто хайп: компании начинают считать реальные выгоды, а мультимодальный ИИ и генеративные модели стали главными технологическими трендами 2024 года. Пока США и Китай ведут борьбу за глобальное лидерство, российский рынок активно растёт за счёт NLP-технологий и аналитики данных. Эксперты выяснили, какие сферы бизнеса быстрее всего адаптируются к внедрению искусственного интеллекта. Большой обзор от TAdviser о трендах и будущем ИИ-индустрии.

В МГУ разработали классификатор, способный отличать машинные тексты от человеческих без необходимости теста Тьюринга. На базе обширных коллекций сочинённых ИИ текстов алгоритм учится выявлять «синтетические» паттерны и даёт гарантию точного распознавания авторства.

А, учёные AIRI обучили GNN-модели с учётом симметрии кристаллов. Учёные вдвое повысили точность прогнозов и получили инструмент, который не только предсказывает свойства, но и помогает обнаруживать ключевые особенности молекул.
Москва строит собственное «госозеро» — систему обезличенных данных для обучения ИИ. Она будет наполняться только информацией от госорганов и мэрии, а частичный доступ к ней планируют дать и бизнесу, но условия пока не раскрыты.

Perplexity делает ставку на сбор пользовательской информации другим путём: их новый браузер Comet будет отслеживать всю активность пользователей в интернете — от покупок до бронирования отелей. Цель — гиперперсонализированная реклама. Команда уверена, что такой подход даст более релевантные рекомендации, а пользователи не будут против слежки. 🤔

А Microsoft снимает видео с помощью ИИ. Рекламный ролик Surface полностью создан с использованием генеративных инструментов — дизайнеры сделали фото, остальное доработали с помощью нейросетей, таких как Hailuo и Kling. И, судя по комментариям к ролику, никто не заметил использования ИИ. По мнению Джона Фридмана, ИИ превращает дизайнеров в редакторов, позволяя быстрее воплощать сложные идеи.
Please open Telegram to view this post
VIEW IN TELEGRAM
В этом посте мы рассмотрим, как аналитика данных влияет на разные сферы, от вулканологии до финансов.

➡️ Уловимые частицы: как сервисы Яндекса помогают прогнозировать последствия извержений вулканов
Статья описывает, как в России осуществляется мониторинг вулканической активности, включая использование машинного обучения для прогнозирования извержений, что показывает, как современные технологии помогают минимизировать риски.

➡️ Инструменты продуктового аналитика VK, или Как мы работаем с большими данными
Статья знакомит нас с инструментом Metida, который позволяет продуктовым командам легко анализировать большие объемы данных и принимать обоснованные решения.

➡️ Ваш первый A/B-тест: гайд для тех, кто ещё ничего не пробовал
В статье обсуждаются AB-тесты, как важный метод для повышения конверсии и улучшения взаимодействия с пользователями, позволяя компаниям основывать свои решения на данных, а не на догадках.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Квантовые вычисления представляют собой сложную и многогранную область, изучение которой требует понимания их принципов, алгоритмов и потенциальных вызовов. В этой подборке статей мы углубляемся в технические аспекты квантовых компьютеров и обсуждаем текущие проблемы и эксперименты.

➡️ Квантовые эксперименты на дому. Строим квантовый компьютер из лазера и полимеров
Статья демонстрирует, как можно проводить квантовые эксперименты на дому и выполнять квантовые алгоритмы, такие как алгоритм Дойча.

➡️ Причины и пути устранения квантовых ошибок
Статья поднимает важный вопрос коррекции квантовых ошибок, необходимых для создания надежных систем.

➡️ Сознание через призму квантовой неопределенности: Новая граница науки?
В статье обсуждаются более философские аспекты, включая теории о связи квантовой неопределенности и природы сознания, что открывает новые горизонты для дальнейших исследований.
Please open Telegram to view this post
VIEW IN TELEGRAM
📢 ИИ в Data Governance

На Хабре вышла новая статья от нашего коллеги, аналитика в команде разработки продукта RT.DataGovernance компании TData, Антона Зубарева: «ИИ в Data Governance: как мы ускорили маркировку персональных данных».

➡️ В статье Антон рассказывает:

🟣Как ИИ избавил команду от рутинной маркировки.

🟣Зачем важна скорость в работе с метаданными.

🟣Что получилось на выходе — цифры и эффект.

🟣Сравнение с другими решениями на рынке.

🟣Почему всё это можно было сделать без радикальных изменений в продукте.

Если вы работаете с данными и интересуетесь применением ИИ для оптимизации процессов управления данными, эта статья будет вам полезна.

➡️ Читайте подробнее по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Зачем вам Центр Компетенций по данным 📊

40% данных российских компаний - мусор 🚮 такой процент данных остается невостребованным более пяти лет ☝️

Data Governance - методология управления жизненным циклом данных. Найти «Ценность в данных», а не сформировать «Кладбище данных» становится искусством.

"Можно начинать с нескольких специалистов, и формирования Центра Компетенции по данным, который действует по всей организации, помогая сотрудникам отделов и подразделений правильно работать с данными, понимать где находятся «сертифицированные» чистые данные и их описание, как правильно работать с данными."

TData поделились как ускорили маркировку персональных данных с помощью ИИ:
〰️ как определяли, где использовать искусственный интеллект
〰️ как тестировать обученные модели
〰️ как интегрировать их в Data Governance.
Читать на habr.com

@TheDataEconomy

#ИИ #AI #Экономикаданных #Data
Please open Telegram to view this post
VIEW IN TELEGRAM
Технологии будущего становятся всё ближе! Российские исследователи из центра «Шухов.Нано» представили технологию iDEA, позволяющую создавать квантовые процессоры с точностью до атомов, обеспечивая массовое производство тысячекубитных систем.

В МФТИ изучают примеси в алмазах и их влияние на создание надежных квантовых кубитов. С помощью методов машинного обучения учёные делают важные шаги для будущей микроэлектроники и инновационных систем памяти. Также разработка позволит создавать невидимые маркировки на алмазах.

А в Санкт-Петербурге исследователи из НИУ ВШЭ разработали микролазеры диаметром всего 5–8 микрометров, способные стабильно работать при комнатной температуре. Технология основана на эффекте шепчущей галереи, позволяющем удерживать свет внутри микроскопической структуры без потери энергии. Такие микролазеры можно использовать в миниатюрных сенсорах, медицинских приборах и квантовых системах.
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ становится всё полезнее — но только если не тратит ресурсы зря, не искажает реальность и умеет быстро справляться с задачами.

Когда данных для обучения уже достаточно? Учёные из МФТИ научились определять идеальный объем данных для ИИ. Они предложили два новых подхода к решению одной из фундаментальных проблем машинного обучения: определению достаточного размера выборки. Их работа предлагает измерять, насколько «уверенность» модели в своих параметрах меняется при добавлении или удалении всего одного элемента данных, используя для этого два различных математических инструмента.

А российские учёные из AIRI ускорили квантово-химические расчёты, которые нужны для создания новых лекарств. Их нейросеть учится в 4 раза быстрее аналогов и требует в 42 раза меньше данных. Секрет — в комбинации современной архитектуры и старой советской математики — решётке Лебедева. Новый ИИ уже обходит европейскую систему DeepDFT по точности расчётов.

Исследователи из Стэнфорда, Оксфорда и CMU обнаружили, что модели вроде GPT-4o слишком часто соглашаются с пользователями — даже когда те не правы. Это называется sycophancy — избыточная угодливость. Исследователи предложили тест Elephant, чтобы отслеживать такие отклонения. Самой «подлизывающейся» оказалась GPT-4o, а наименее — Gemini 1.5 Flash от Google.

Практическое применение ИИ — в московском транспорте. На всех площадках Мосгортранса работает система, которая за 5 минут распределяет смены для 13 тысяч водителей. Она учитывает графики отдыха и равные условия, автоматизируя процесс, который раньше занимал часы.
Столичные ученые представили первую в России базу данных тканеимитирующих материалов для лучевой диагностики. Она объединяет информацию о 42 материалах (твердых и жидких), используемых для создания медицинских фантомов — моделей органов для обучения и диагностики. Главная цель проекта — обеспечить технологическую независимость в области создания обучающих симуляторов, снизить зависимость от зарубежных поставок и ускорить разработку реалистичных медицинских моделей.

Foxconn и Nvidia представили робота-сиделку NuraBot, который помогает пациентам в больницах: измеряет давление, доставляет лекарства, общается голосом и адаптируется под пользователя. Это уже не концепт — робот проходит тестирование в клиниках.

НИУ ВШЭ и Росприроднадзор провели первое в России исследование, оценивающее, насколько крупные языковые модели справляются с задачами в области экологии и ESG. По результатам тестирования 81 запроса лучшими оказались Grok AI, Qwen и DeepSeek. Отечественные модели Yandex GPT и GigaChat заняли 4 и 5 места. Результаты лягут в основу автоматизированных сервисов Росприроднадзора и рекомендаций для бизнеса. Обновление рейтинга моделей планируется каждые полгода.