DataTalks
933 subscribers
475 photos
43 videos
375 links
Образовательный проект DataTalks. Рассказываем про управление данными на конференциях, митапах и марафонах.

#datatalks #безграниц #безрекламы #безводы

Контакты:
dataoffice@rt.ru
http://datatalks.rt.ru/
https://rutube.ru/channel/25367326/
Download Telegram
OpenAI анонсировала Responses API – платформу для создания ИИ-агентов, способных выполнять веб-поиск, анализировать документы и автоматизировать задачи. Компании смогут строить собственных цифровых помощников, работающих по аналогии с Operator от OpenAI.

А в России Сбербанк и «Лаборатория Касперского» разрабатывают мультиагентные системы, которые помогут анализировать киберугрозы, выявлять уязвимости и предотвращать атаки. Новые ИИ-модели будут обучаться в режиме реального времени, что усилит защиту критически важных объектов.

Важно не только развивать технологии, но и обучать пользователей. «Ростелеком» и Соцфонд выпустили курс по ИИ для пенсионеров. В модуле «Азбука интернета» участники смогут освоить работу с нейросетями, научиться создавать промпты и редактировать контент с AI. В разработке – специальный курс по поиску данных о героях ВОВ с помощью ИИ.
ИИ уже помогает лечить. Нейросети активно используются в медицине - от анализа снимков и составления документации до прогнозирования терапии. Ведется работа над национальными стандартами (FHIR Ru Core), чтобы обеспечить полноценную интеграцию ИИ в систему здравоохранения. Эксперты уверены: ИИ в будущем будет не только ставить диагнозы, но и лечить. А рынок медтеха России вырос на 18%, достигнув 56,8 млрд рублей за 2024 год. Основными драйверами стали сегменты исследований (+43%), медицинских устройств (+36%) и телемедицины (+35%). Главными вызовами отрасли остаются кадровый дефицит и консерватизм медицинского персонала.

НИУ ВШЭ — Санкт-Петербург работает над созданием энергоэффективных микролазеров, необходимых для развития фотонных схем в ИИ и квантовых системах. Технология базируется на квантовых точках и станет частью отечественного технологического суверенитета. Тем временем химики «Сколтеха» представили ИИ для анализа масс-спектрометрических архивов. Он уже нашёл реакции, которые не были замечены за десятки лет исследований.

А команда НИУ ВШЭ в Нижнем Новгороде показала, как можно моделировать поведение нейрона по одному сигналу, отказавшись от сложных систем уравнений. Их ИИ сам находит закономерности в работе мозга.
Сбер и МФТИ представили алгоритм JAGUAR для ускоренной оптимизации моделей ИИ. Он позволяет быстрее и точнее дообучать нейросети даже при наличии шумных данных. Это открывает новые возможности для адаптации LLM к сложным задачам.

А в DeepMind внедрили AlphaTensor-Quantum — нейросеть, сокращающую количество сложных квантовых операций. Она уже превосходит все существующие алгоритмы в задачах квантовой химии и криптографии.На орбите тоже перемены. В МФТИ создают электроракетные двигатели для CubeSat — энергоэффективные, цифровые, модульные. Это закрывает важный пробел в российской космической инфраструктуре.
Тем временем, в Арктике готовятся развернуть российскую спутниковую сеть для связи с низкой орбиты. В рамках нацпроекта планируется запуск 383 аппаратов к 2030 году. 

На земле тем временем создаются важные технологические элементы. В МЭИ представили новый волноводный переходник для 5G-сетей. Он снижает потери сигнала, компактен и совместим с 3D-печатью — отличное решение для телеком- и космических систем.
Сегодня мы погрузимся в увлекательную историю и развитие суперкомпьютеров, начиная с их первых образцов и заканчивая современными системами, используемыми для сложных научных задач.

➡️ «Курсор»: редкий советский компьютер с газоразрядным дисплеем
Статья рассказывает о компьютере “Курсор”, разработанном в СССР в конце 80-х для обучения студентов, который стал важным шагом к цифровизации образования.

➡️ Советский Cray. История суперкомпьютера «Электроника СС БИС»
В статье рассматривается проект советского суперкомпьютера “Эльбрус”, который задумывался как качественный аналог Cray-1, но оказался под угрозой закрытия из-за финансовых препятствий.

➡️ Долгий путь микропроцессора на рынок или учимся читать новости про российские литографы
Статья добавит интересный аспект, рассказывая о создании и тестировании собственного литографа в России, что в свою очередь является критически важным для производства полупроводников и мощных вычислительных систем.

➡️ Отец суперкомпьютеров. История Сеймура Крэя и корпорации Cray
В статье познакомимся с Сеймуром Крэйем — легендарным инженером, основавшим Cray Research и разработавшим суперкомпьютеры Cray-1 и Cray-2, ставшими эталоном мощности вычислений своего времени.
Please open Telegram to view this post
VIEW IN TELEGRAM
🟣 «Ростелеком» внедрил аналитическую платформу TData вместо решений зарубежных вендоров.

«Ростелеком» завершил стратегическую миграцию на TData, что позволило объединить данные из разных источников в единую систему. Проект включал создание организационной структуры для улучшения взаимодействия с партнёрами, внедрение защищённого репозитория кода и контроль за нагрузкой с помощью передовых инструментов мониторинга.

В условиях возрастающих требований к технологическому суверенитету и постоянного роста объема обрабатываемых данных (до десятка петабайт) централизованная платформа становится ключевым элементом конкурентоспособности. Переход на TData способствует снижению зависимости от зарубежных решений, что критично в условиях текущей экономической и политической обстановки, а также позволяет внедрять современные self-service решения и интегрировать инструменты искусственного интеллекта для анализа данных.

⚡️Почему это важно:
🟣Экономия и независимость: Переход уже принес экономический эффект свыше 600 млн рублей, что подтверждает эффективность централизованного управления данными.
🟣Инновации в действии: Отказ от зарубежных решений снижает риски санкций и способствует развитию отечественных технологий.
🟣Будущее аналитики: Интеграция self-service решений и потенциальное применение искусственного интеллекта выводят аналитическую платформу на новый уровень.

📢 Борис Емельянов, технический директор офиса по работе с данными «Ростелекома», поделился подробностями проекта на CNews
Please open Telegram to view this post
VIEW IN TELEGRAM
В МФТИ создан первый российский квантовый процессор на 40 кубитах, успешно прошедший предварительные тесты и задающий тон развитию отечественных квантовых технологий. А швейцарские ученые разработали акустическую систему, способную имитировать квантовую суперпозицию с помощью звука. Разработка способна имитировать поведение сверхплотных материалов и открывает дорогу к новым технологиям — от улучшенной связи до медицинских устройств.

Исследователи из QuTech впервые выполнили 800 операций на двухкубитной системе с ошибкой до 0,001%. В основе разработки — алмазные кубиты, использующие электронный и ядерный спины азото-замещённых вакансий в кристаллической решётке. Ученые провели 800 операций с рекордной точностью до 99,9%, что приближает нас к стабильным квантовым вычислениям. Дополняет общую картину амбициозное видение Google Quantum AI, прогнозирующих существенные технологические изменения уже в ближайшие пять лет.
32% россиян уже используют ИИ в повседневной работе, например, для написания отчетов или анализа данных. Это позволяет эффективно справляться с рутинными задачами и улучшать продуктивность, освободив время для креативной работы Это только начало, ведь технологии продолжают развиваться.

В МФТИ студенты разработали и интегрировали систему интеллектуальной обработки рукописей на основе генеративных нейросетей. Этот подход обеспечивает высокую точность анализа, сокращая время обработки текста с одного месяца до 20 минут и стоит в пять раз «дешевле» человека, сокращая расходы на первичную вычитку книг в издательствах. 

Еще один интересный проект — использование ИИ в Подмосковье для поиска безнадзорных животных. Система на базе 9,7 тыс. камер помогает эффективно отслеживать бродячих собак. За время работы нейроконтролер уже помог выявить 295 случаев бездомных животных и снизил количество обращений и жалоб по данной теме на 20%.
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ-технологии продолжают стремительно развиваться.

«Яндекс» представил «Нейроэксперта» — сервис для работы с документами, презентациями и медиа. Новый сервис анализирует документы, аудио, видео и ссылки и создаёт базы знаний, позволяя вести диалог по загруженным материалам и быстро искать ответы. В будущем планируется монетизировать проект через подписки и корпоративные решения и расширять функции для бизнеса.

А Midjourney представила модель V7 — первую за год. Новинка отличается персонализацией, улучшенным качеством изображений и поддержкой Draft Mode для быстрой генерации с последующей доработкой. Пока доступны не все функции, но разработчики обещают их добавить в ближайшие месяцы.

DeepMind опубликовала 145-страничное исследование по безопасности AGI — ИИ, способного выполнять любые задачи на уровне человека. Документ прогнозирует появление AGI до 2030 года и поднимает вопросы экзистенциальных рисков. Однако часть экспертов считает угрозу преувеличенной и указывает на более насущные проблемы — низкое качество обучающих данных и ошибки ИИ.

По прогнозу Gartner, мировые расходы на ИИ достигнут $644 млрд в 2025 году. 80% бюджета пойдет на оборудование, а не на софт. Компании пересматривают стратегии: внутренние разработки уступают место коммерческим решениям с уже встроенными ИИ-возможностями.
❗️День больших данных в МГПУ

10 апреля в онлайн-формате состоится «День больших данных» — образовательная сессия в рамках Московского студенческого DATA-Хакатона, организованная МГПУ.

В программе:
🟣лекции от специалистов в области анализа данных и IT-технологий;
🟣методы визуализации данных и практическое применение аналитики;
🟣современные разработки в сфере работы с большими данными;
🟣практическое применение аналитики в задачах государственного управления.

⚡️11:25–12:05 Доклад TData: Разработка отечественного ПО для управления данными: опыт компании TData.
Ольга Проскурякова, начальник отдела тестирования ООО «TData» расскажет о платформе управления данными «TData», её ключевых функциях и примерах успешного внедрения в различных отраслях.

📢Где и когда: 10 апреля, 09:30 (мск), онлайн.

🔗 Форма регистрации
🔗 Подробнее о хакатоне
Please open Telegram to view this post
VIEW IN TELEGRAM
Всё больше российских компаний автоматизируют найм с помощью нейросетей. ИИ уже сокращает сроки поиска кандидатов почти вдвое. Активнее всего его используют в ритейле, логистике и банковском секторе. Но окончательное решение о найме по-прежнему остаётся за человеком.

Экосистема «Лукоморье» от «РТК ИТ Плюс» пополнилась тремя решениями: платформой «Акола» для no-code разработки приложений, системой «Диво» для автоматизации ИТ-служб и системой «Стрелка» для управления офисными пространствами. «Лукоморье» строится как единое цифровое пространство, где все продукты дополняют друг друга. За счет такой архитектуры бизнес может запускать ИТ-проекты быстрее, дешевле и без зависимости от поставщиков.

А в строительстве утверждён первый национальный стандарт использования ИИ, разработанный «Газпром нефтью» и партнёрами. Документ создаёт правовую основу для применения ИИ в строительном контроле. Цифровые решения, такие как дополненная реальность, уже помогают ускорить проверки на 80% и снизить расходы.
Please open Telegram to view this post
VIEW IN TELEGRAM
📢 Данные для ИИ или ИИ для данных?

27 марта Станислав Лазуков выступил на DATA&AI 2025 с докладом о взаимном влиянии данных и искусственного интеллекта.

В докладе поднимались темы:
🟣 как данные и искусственный интеллект влияют друг на друга;
🟣 как ИИ помогает с анализом данных — от чат-ботов до автоматизации разметки персональных данных и создания SQL-запросов;
🟣 как обеспечивать безопасный обмен данными, их обезличивание и каталогизацию;
🟣 какие инструменты и сценарии обработки позволяют получать качественные и релевантные данные для обучения моделей.


🔗 Запись выступления доступна по ссылке

📢 Подписывайтесь на RUTUBE канал TData, чтобы не пропустить новые видео!
Please open Telegram to view this post
VIEW IN TELEGRAM
В России укрепляется технологический суверенитет в ИБ. ГК «Солар» запустила Solar TI Feeds — сервис передачи данных об актуальных киберугрозах для SOC, EDR и других систем защиты. Потоки строятся на данных от сенсоров «Ростелекома» и аналитике Solar JSOC, обеспечивая высокую релевантность и быструю реакцию на инциденты.

DCAP-системы тоже в центре внимания. После ухода западных решений российские вендоры усилили позиции: 63% ИБ-специалистов оценивают отечественные DCAP как равные иностранным, а 24% считают их более продвинутыми, отмечает опрос «СерчИнформ». Главные задачи — защита от утечек, аудит данных и расследование инцидентов.

Необычный подход к ИТ-инфраструктуре предложили разработчики из НТИ: в России создают проект плавучих ЦОД на баржах. Они дешевле в строительстве, быстрее разворачиваются и могут работать в отдалённых регионах. Проект уже на стадии эскизного проектирования, в числе потенциальных заказчиков — крупные компании, госкорпорации и даже иностранные государства.
На ЦКАД в Подмосковье стартовали испытания беспилотных фур КАМАЗа и Navio. Проект расширяет сеть беспилотных логистических коридоров — к 2030 году их протяженность должна достигнуть 20 тысяч километров. Систему мониторинга и киберзащиты обеспечит платформа «ЭРА-ГЛОНАСС».

А в Музее транспорта Москвы появился первый российский беспилотный автобус «Матрёшка». Прототип 2016 года, рассчитанный на восемь пассажиров, способен проезжать 130 км без подзарядки. Автобус «Матрёшка» станет частью постоянной экспозиции в зоне «Будущее».

Тем временем исследователи Georgia Tech разработали алгоритм MPPI для беспилотников, который помогает автомобилям сохранять устойчивость в экстремальных условиях, анализируя тысячи траекторий в реальном времени с помощью GPU.
OpenAI ускоряет выпуск своих моделей: тестирование безопасности занимает всего несколько дней. Это поможет компании оставаться конкурентоспособной, но увеличивает риски.

Учёные из Санкт-Петербурга применили ИИ в экологии: их нейросеть оценивает уровень CO₂ в воде, что поможет бороться с закислением водоемов и защитить экосистемы.

«Яндекс» объявил награду до 1 млн рублей за поиск уязвимостей в своих нейросетях YandexGPT и YandexART — охота за ошибками становится важной частью защиты данных.

А в США развалилась красивая история стартапа Nate: обещанная ИИ-автоматизация оказалась ручной работой сотен сотрудников колл-центра. Инвесторы остались с убытками, а основателю грозит тюрьма.
Москва расширяет использование цифровых технологий в медицине: Мэр Москвы Сергей Собянин пригласил разработчиков подключиться к цифровизации столичной медицины. В приоритете — онлайн-сервисы для пациентов, системы мониторинга здоровья и автоматизация клиник. Лучшая разработка получит поддержку и шанс войти в городскую систему здравоохранения.

Нейротехнологии уже показывают реальные результаты: в США парализованной женщине помогли снова говорить с помощью индивидуального нейроинтерфейса и ИИ, распознающего её мысли и преобразующего их в речь.

В глобальном масштабе медицина за последние 20 лет достигла серьёзных успехов: от новых подходов в лечении рака и генетических болезней до восстановления слуха у детей и безоперационных технологий помощи при болезни Паркинсона.
🟣«Ростелеком» в последние годы активно расширяет спектр предоставляемых цифровых и телеком-услуг, увеличивая и пул заказчиков, многие из которых предъявляют повышенные требования к информационной безопасности.

Это вкупе с ростом сложности киберугроз требует от «Ростелекома» регулярной оптимизации мер информационной защиты. Как она устроена в группе компаний, TAdviser решил узнать у Артема Гребенюка, директора департамента эксплуатации средств информационной безопасности «Ростелекома».

Основные тезисы:
🟣Защита сети «Ростелекома»: централизованный мониторинг, проактивное выявление и блокировка DDoS‑атак, круглосуточное реагирование на инциденты.
🟣Совместные программы с университетами по подготовке экспертов.
🟣Постоянное обновление технологий и внедрение автоматизации для поддержания актуального уровня защиты.
🟣Все ключевые решения по критическим инцидентам принимает подготовленный специалист, а не «чёрный ящик» системы.

➡️ Читайте полное интервью по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
В этом посте мы подробнее ознакомимся с вызовами и методами, связанными с аналитикой данных в различных областях.

➡️ Применение методов машинного обучения для анализа цен на вторичное жильё в Липецке
Статья показывает, как машинное обучение и кластеризация применяются для анализа цен на вторичное жилье в Липецке, что помогает выявить ценовые тренды и лучше понимать рынок недвижимости.

➡️ Миф о чистых данных: почему ваш аналитик похож на сапёра
Статья обсуждает проблему “чистых” данных, подчеркивая важность подготовки и очистки информации, необходимой для успешной бизнес-аналитики.

➡️ Как организовать разметку данных для ML? Советы от Data Light
Также в статье рассматривается разметка данных, ключевой этап в работе с искусственным интеллектом, где сравниваются внутренние, краудсорсинговые и аутсорсинговые подходы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Искусственный интеллект уже не просто хайп: компании начинают считать реальные выгоды, а мультимодальный ИИ и генеративные модели стали главными технологическими трендами 2024 года. Пока США и Китай ведут борьбу за глобальное лидерство, российский рынок активно растёт за счёт NLP-технологий и аналитики данных. Эксперты выяснили, какие сферы бизнеса быстрее всего адаптируются к внедрению искусственного интеллекта. Большой обзор от TAdviser о трендах и будущем ИИ-индустрии.

В МГУ разработали классификатор, способный отличать машинные тексты от человеческих без необходимости теста Тьюринга. На базе обширных коллекций сочинённых ИИ текстов алгоритм учится выявлять «синтетические» паттерны и даёт гарантию точного распознавания авторства.

А, учёные AIRI обучили GNN-модели с учётом симметрии кристаллов. Учёные вдвое повысили точность прогнозов и получили инструмент, который не только предсказывает свойства, но и помогает обнаруживать ключевые особенности молекул.
Москва строит собственное «госозеро» — систему обезличенных данных для обучения ИИ. Она будет наполняться только информацией от госорганов и мэрии, а частичный доступ к ней планируют дать и бизнесу, но условия пока не раскрыты.

Perplexity делает ставку на сбор пользовательской информации другим путём: их новый браузер Comet будет отслеживать всю активность пользователей в интернете — от покупок до бронирования отелей. Цель — гиперперсонализированная реклама. Команда уверена, что такой подход даст более релевантные рекомендации, а пользователи не будут против слежки. 🤔

А Microsoft снимает видео с помощью ИИ. Рекламный ролик Surface полностью создан с использованием генеративных инструментов — дизайнеры сделали фото, остальное доработали с помощью нейросетей, таких как Hailuo и Kling. И, судя по комментариям к ролику, никто не заметил использования ИИ. По мнению Джона Фридмана, ИИ превращает дизайнеров в редакторов, позволяя быстрее воплощать сложные идеи.
Please open Telegram to view this post
VIEW IN TELEGRAM