Библиотека баз данных

Модель превосходит 2.5 Flash Native Audio по скорости отклика и тоньше распознает акустические нюансы, темп и высоту голоса. Важным техническим улучшением стала способность эффективно фильтровать фоновый шум. Модель уже доступна через Gemini Live API в платформе Google AI Studio.

Gemini 3.1 Flash Live лучше справляется с вызовом внешних инструментов и строго следует системным инструкциям. Модель не выходит за установленные рамки при неожиданных поворотах диалога и поддерживает мультимодальное общение на 90+ языках в реальном времени.

Новинка ляжет в основу потребительских сервисов Gemini Live и Search Live. Общение с ИИ станет более плавным: сократится количество неловких пауз, а контекст беседы будет удерживаться в 2 раза дольше. Параллельно с релизом модели Google делает Search Live доступной более чем в 200 странах.
blog.google

✔️

Mistral релизнула открытую text-to-speech модель Voxtral.

Модель для синтеза речи Voxtral TTS поддерживает 9 языков (русского нет) и умеет клонировать голос по аудиосэмплу короче 5 секунд, копируя не только тембр, но и микроинтонации, акценты и естественные особенности дикции. При этом она способна на лету менять язык произношения, сохраняя оригинальные характеристики спикера.

Архитектура построена на базе LLM Ministral 3B. Создатели сделали ставку на скорость работы в реальном времени: генерация 10-секундной аудиодорожки занимает около 1,6 секунды. Веса базовой модели опубликованы на Hugging Face под некоммерческой лицензией, а протестировать Voxtral TTS можно через Mistral Studio и Le Chat.
mistral.ai

✔️

Cohere выпустила открытую ASR-модель.

Cohere Transcribe - обученная с нуля на 14 языках модель автоматического распознавания речи на 2 млрд. параметров на архитектуре Conformer, которая справляется со сложной акустикой, перекрывающимися голосами и специфическими акцентами.

Cohere заявляет рекордную точность. Transcribe возглавила рейтинг HuggingFace Open ASR Leaderboard: средний показатель WER для английского языка составил всего 5.42%. Модель обошла Whisper Large v3 от OpenAI, ElevenLabs Scribe v2 и Qwen3-ASR.

Развернуть модель можно локально, на edge-устройствах, либо воспользоваться API и платформой Cohere Model Vault. Веса доступны на Hugging Face.
cohere.com

✔️

Intel выводит на рынок видеокарты Arc Pro B70 и B65 с 32 ГБ памяти.

Новые GPU на архитектуре Battlemage созданы специально для инференса нейросетей и ресурсоемких вычислений. Старшая модель Arc Pro B70 получила 32 ядра Xe с частотой 2,8 ГГц, что дает 22,9 TFLOPS в операциях FP32.

Младшая версия, Arc Pro B65, сохраняет тот же объем видеопамяти, но использует лишь 20 ядер Xe. Обе карты оснащены памятью GDDR6 с 256-битной шиной и пропускной способностью 608 ГБ/с.

Arc Pro B70 уже поступила в продажу по цене $949, что делает ее значительно доступнее Nvidia RTX Pro 4000 ($1800). Младшая модель B65 начнет продаваться через партнерскую сеть Intel в середине апреля.
newsroom.intel.com

✔️

GitHub по умолчанию начнет использовать код пользователей Copilot для обучения ИИ.

С 24 апреля обновится политика конфиденциальности GitHub. Промпты, сгенерированные ответы, фрагменты кода и связанный с ними контекст подписчиков тарифов Free, Pro и Pro+ будут автоматически собираться для тренировки моделей. Чтобы защитить свои проекты, разработчикам придется вручную отключить передачу данных в настройках приватности.

Платформа анализирует широкий спектр данных. В датасет попадает код, комментарии и документация, архитектура репозитория, названия файлов, паттерны навигации в IDE и реакции на предложенные автодополнения.

GitHub заявляет, что собранная телеметрия может передаваться только Microsoft и ее аффилированным компаниям. Нововведение не затронет корпоративный сегмент планов Copilot Business и Enterprise.
github.blog

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1.58K views08:15

Библиотека баз данных

🚀 Claude Cowork: 90% возможностей, о которых вы не знали

Большинство людей открывают Claude Desktop, задают вопрос, получают ответ и закрывают приложение. На следующий день повторяют то же самое. И так неделями, не понимая, почему ничего толком не меняется в их продуктивности.

Проблема в том, что так используется от силы 10% того, на что способен Claude Cowork. Остальные 90% просто игнорируются. Давайте разберемся, что именно вы упускаете.

Что такое Claude Cowork на самом деле
Это не просто чат-интерфейс. Это десктопный ИИ, который умеет читать ваши файлы, подключаться к приложениям, запоминать ваши рабочие процессы и запускать задачи по расписанию, пока вы спите. Разница между тем, как большинство людей его используют, и тем, как он задуман, колоссальная.

Четыре вещи раскрывают весь потенциал: файл claude.md, навыки (skills), коннекторы и запланированные задачи. Большинство пользователей не трогали ни одну из них.

Шаг ноль: укажите Claude на папку
Без привязки к папке Claude начинает каждый разговор с чистого листа. Никакой памяти, никакого контекста, никакого понятия о том, кто вы и что строите. Он не может получить доступ к вашим файлам и не запускает пользовательские команды.

С папкой все иначе. Claude помнит, кто вы, автоматически загружает навыки, читает файлы и становится умнее после каждой сессии. Думайте о каждой папке как об отдельном телефоне. На рабочем стоит Slack, Gmail и календарь. На личном - планирование питания, бюджет, дневник. Отдельные папки, отдельные идентичности, отдельные рабочие процессы.

Файл claude.md: хватит объяснять одно и то же каждый день
Каждый раз, когда вы открываете Claude, он понятия не имеет, кто вы. Ваш бизнес, ваш тон, ваши правила, чего избегать - все это приходится объяснять заново. Файл claude.md решает эту проблему раз и навсегда. Это обычный текстовый файл, который Claude читает до того, как прочитает хоть слово из вашего сообщения. Настраиваете один раз - и он никогда не забывает.

Skills: научите Claude один раз, он запомнит навсегда
Навыки (skills) - это пользовательские команды, которые запускают целые рабочие процессы одним словом. Вместо того чтобы каждый раз писать длинный промпт, вы пишете его один раз, упаковываете в навык и просто вводите одну команду для запуска. Все, что вы делаете повторно, можно превратить в навык. Генерация счетов, планирование уроков, еженедельные отчеты, черновики предложений. Если делаете что-то больше одного раза - вам нужен навык.

Коннекторы: дайте Claude доступ к вашим приложениям
Навыки мощные, но без коннекторов они живут в песочнице. С коннекторами Claude читает вашу Gmail напрямую, проверяет календарь, обращается к Google Drive и пишет в Slack от вашего имени. Сейчас в Claude от 30 до 50 встроенных коннекторов: Asana, Canva, GitHub, HubSpot, Notion, Slack, Google Calendar. Для всего остального есть Zapier MCP, который подключается к 8000+ приложениям.

Запланированные задачи: сотрудник, который работает 24/7
Здесь все складывается воедино. Навыки определяют "как". Коннекторы определяют "доступ". Запланированные задачи определяют "когда". Вы задаете время, выбираете частоту, и Claude выполняет весь рабочий процесс без вашего участия. Навыки + коннекторы + запланированные задачи = ИИ, который ведет ваш рабочий процесс на автопилоте. Обучаете один раз - работает всегда.

Cowork vs Claude Code: в чем разница
Claude Code и Claude Cowork - это один и тот же ИИ, но совершенно разные инструменты. Claude Code - это кодинг-агент. Он живет в терминале, читает всю кодовую базу, пишет и запускает код, деплоит в продакшен. Создан для разработчиков. Cowork - это золотая середина. Без терминала, без командной строки. Создан для всех, не только для разработчиков. Они не конкурируют, а дополняют друг друга.

https://uproger.com/claude-cowork-90-vozmozhnostej-o-kotoryh-vy-ne-znali/

❤4😁2

1.13K views08:34

Библиотека баз данных

✔️

10 книг, чтобы наконец понять, как реально работают LLM (2026)

Большинство просто дергают API
Мало кто понимает, что происходит внутри

Если хочешь перейти из «пользователя» в «инженера» — вот база

1. Deep Learning
https://deeplearningbook.org
Библия нейросетей - backprop, архитектуры, вся база

2. Artificial Intelligence: A Modern Approach
https://aima.cs.berkeley.edu
Фундаментальный взгляд на AI как систему

3. Speech and Language Processing
https://web.stanford.edu/~jurafsky/slp3/
NLP, трансформеры и язык - максимально глубоко

4. Machine Learning: A Probabilistic Perspective
https://probml.github.io/pml-book/
Вероятности, статистика и основа ML

5. Understanding Deep Learning
https://udlbook.github.io/udlbook/
Современное объяснение DL с хорошей интуицией

6. Designing Machine Learning Systems
https://oreilly.com/library/view/designing-machine-learning/9781098107956/
Как довести модели до продакшена

7. Generative Deep Learning
https://github.com/3p5ilon/ML-books/blob/main/generative-deep-learning-teaching-machines-to-paint-write-compose-and-play.pdf
Практика генеративных моделей и трансформеров

8. Natural Language Processing with Transformers
https://dokumen.pub/natural-language-processing-with-transformers-revised-edition-1098136799-9781098136796-9781098103248.html
Как строить NLP-системы на трансформерах

9. Machine Learning Engineering
https://mlebook.com
Инженерия ML и продакшен

10. The Hundred-Page Machine Learning Book
https://themlbook.com
Суперконцентрированная база без лишнего

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

1.32K viewsedited 16:10

Библиотека баз данных

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Cовет по SQL-тестам: тестируйте не только результат запроса, а его инварианты.

Обычно SQL проверяют так:


SELECT * FROM orders WHERE status = 'paid';

И потом сравнивают: «вернулись нужные строки или нет».

Но в реальных системах чаще ломается не сам happy path, а скрытые свойства данных.

Например, для отчёта по заказам тест должен проверять не только конкретные строки, а правила:


-- сумма по пользователям должна совпадать с общей суммой
WITH by_user AS (
    SELECT user_id, SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
    GROUP BY user_id
),
overall AS (
    SELECT SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
)
SELECT
    (SELECT SUM(total) FROM by_user) = (SELECT total FROM overall) AS is_valid;

То есть вы тестируете не «мне вернулось 10 строк», а:

агрегаты не теряют деньги
join не размножает строки
фильтр не выкидывает валидные данные
NULL не ломает расчёты
сумма после группировки совпадает с суммой до группировки
каждый order попадает ровно в одну категорию
дедупликация не удаляет нужные записи

Особенно полезный приём - тест на размножение строк после JOIN:


WITH before_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders
),
after_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders o
    JOIN users u ON u.id = o.user_id
)
SELECT
    after_join.cnt <= before_join.cnt AS no_unexpected_multiplication
FROM before_join, after_join;

Если после JOIN строк стало больше без явной причины - у вас почти наверняка проблема с кардинальностью.

Хороший SQL-тест проверяет не только ответ, а свойства запроса, которые должны оставаться истинными при любых данных. Именно так ловятся баги, которые не видно на маленьком тестовом датасете.

https://www.youtube.com/shorts/Rj2HKshtWO8

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍4❤1

914 views15:10

Библиотека баз данных

🖥 На Stepik обновили курс «C# с нуля до профи»

Представьте: через четыре месяца вы открываете чужой .NET-проект и читаете его как книгу.

IServiceCollection не вызывает ступора. async Task<IActionResult> пишется на автомате. Вы точно знаете, почему EF Core сгенерировал именно такой SQL - и как переписать запрос, чтобы он летал.

Это не фантазия. Это результат после 16 модулей, в которых каждая концепция объясняется через код и закрепляется практикой.

ООП, SOLID, LINQ, async/await, DI, EF Core, ASP.NET Core, Docker, Kubernetes - всё, что казалось магией, станет рабочим инструментом.

А бонусом - портфолио проектов: от CLI-утилит и REST API до собственного SaaS с multi-tenancy, JWT и деплоем в Kubernetes под TLS.

Скидка - 58% доступна 48 часов: https://stepik.org/a/282984/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1🔥1

955 views11:48

Библиотека баз данных

Forwarded from Machinelearning

4:13

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI закроет возможность файнтюна своих моделей к началу 2027 года

Компания уведомила разработчиков о закрытии платформы самостоятельного дообучения своих моделей. Для новых клиентов возможность запускать тренировки уже заблокирована, а с 6 января 2027 года отключение затронет всех. Инференс существующих кастомных моделей сохранится вплоть до полного вывода их базовых версий из эксплуатации.

Компания смещает фокус с модификации весов на RAG, промпт-инжиниринг и оркестрацию. Консолидация логики внутри экосистемы OpenAI упростит управление обновлениями и биллингом. Тем, кто использовал дообучение для адаптации под узкие ниши, придется пересматривать архитектуру.
startupfortune.com

✔️

В Google DeepMind появился директор по экономике AGI

Профессор Чикагского университета Алекс Имас перешел в Google DeepMind на должность Director of AGI Economics. Он работает в прямом подчинении у сооснователя компании и главного ученого по AGI Шейна Легга.

Команда Имаса займется прогнозированием влияния сильного ИИ на макроэкономику: трансформации рынка труда, перераспределения капитала и адаптации институтов. Отдельный фокус - воздействие автономных ИИ-агентов на рынки.

Для моделирования пост-AGI экономики исследователи задействуют масштабные агентные симуляции. Основная задача нового подразделения - разработать прогностические модели и переосмыслить фундаментальные концепции дефицита и распределения ресурсов.

Имас специализируется на исследованиях на стыке поведенческой экономики и машинного обучения. Также он известен как соавтор книги нобелевского лауреата Ричарда Талера.
Alex Imas в сети Х

✔️

Epoch AI оценила удельную выручку топовых ИИ-лабораторий

По данным Epoch AI, выручка на одного сотрудника в Anthropic достигает $9 млн, в OpenAI - $5,6 млн. Эти показатели выше, чем у любой IT-компании из списка Forbes 2000.
Для сравнения: у NVIDIA этот показатель равен $5,1 млн.

Расчеты Epoch AI опираются на открытые данные о доходах и динамику найма. Аналитики отмечают, что параллельный рост удельной выручки и многомиллиардных годовых доходов нетипичен для технологического сектора.

Высокая капитальная эффективность ИИ-лабораторий достигается за счет концентрации инженеров и масштабного использования вычислительных мощностей. Это обеспечивает уровень производительности, недоступный при традиционной разработке ПО.
epoch.ai

✔️

Higgsfield сделал ИИ-оценщика виральности видео

ИИ-агрегатор запустил инструмент Virality Predictor для моделирования реакции аудитории на видео длиной до 15 секунд. Платформа рассчитывает индекс виральности, вовлеченность с первой секунды и прогнозируемое удержание зрителей.

Инструмент генерирует тепловую карту мозга, которая показывает предполагаемую стимуляцию зрительной коры или миндалевидного тела. Virality Predictor интегрирован в рабочий процесс Ad Reference для перегенерации креативов на основе полученных метрик.

Помимо веб-интерфейса, доступ к оценщику открыт через CLI и MCP. Поддержка MCP позволяет напрямую подключать платформу к Claude Code и OpenClaw. Через API агенты могут генерировать видео, собирать метрики симуляции внимания и самостоятельно корректировать хук на основе полученных данных без участия человека.
higgsfield.ai

✔️

Фейковая модель OpenAI заражала локальные системы инфостилером

Вредоносный репозиторий Open-OSS/privacy-filter возглавил топ Hugging Face, маскируясь под инструмент OpenAI. Под видом модели Privacy Filter распространялся инфостилер для Windows. Проект набрал 244 тысячи скачиваний за 18 часов.

При попытке использования установочные скрипты загружали вредонос, который повышал привилегии в системе через UAC и добавляла себя в исключения Microsoft Defender. Стилер собирал пароли, данные криптокошельков, токены сессий Discord и конфигурации FileZilla, после чего полностью удалял свои следы из системы.

По данным аналитиков HiddenLayer, эта атака использует инфраструктуру, связанную с китайской хакерской группировкой Silver Fox. Администрация Hugging Face уже заблокировала доступ к репозиторию.
thehackernews.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1

1.1K views09:08

Библиотека баз данных

Forwarded from Machinelearning

✔️

Antigravity втрое повысил лимиты

Варун Мохан, участник команды разработки Google Antigravity и бывший основатель Windsurf, объявил в сети X о пересмотре правил использования моделей Gemini на платформе.

По его словам, лимиты запросов для всех платных тарифов Gemini увеличиваются втрое на постоянной основе, а недельные квоты пользователей Antigravity будут сброшены и начислены заново. Изменения уже вступили в силу.

Сообщение стало реакцией на критику со стороны разработчиков, недовольных функциональными ограничениями платформы и высоким расходом ресурсов при работе с ней.

Мохан признал, что команда допустила ошибки при принятии ряда решений, и пообещал внимательнее учитывать обратную связь сообщества при дальнейшей доработке продукта.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3👍1

855 views16:58

Библиотека баз данных

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

⚡Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы.

🐘Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных.

✔️До 20 раз быстрее Greenplum
На сложных запросах в тестах ClickBench, TPC-H и TPC-DS.

✔️До 10 раз меньше ресурсов
При сопоставимой нагрузке с MPP-аналогами.

✔️Аналитика ближе к рабочим данным
Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах.

✔️Быстрый старт для команды
Знакомый PostgreSQL снижает порог входа для администраторов и разработчиков.

✔️Свобода хранения и BI
Локальный сервер, сетевая шара или S3. Данные — в формате Parquet.

🔗Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.

❤1

632 views15:05

Библиотека баз данных

Forwarded from Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🐟

Sakana AI выкатили DiffusionBlocks - способ обучать нейросеть по одному блоку за раз, не держа в памяти всю модель целиком. Работу приняли на ICLR 2026.

При обычном обучении градиенты проходят через весь граф, а память под активации растёт вместе с глубиной модели. DiffusionBlocks предлагает разрезать сеть на отдельные блоки и обучать каждый независимо.

Каждому блоку дают свою локальную задачу: сдвинуть представление чуть ближе к целевому состоянию, чем это сделал предыдущий блок. Формально это похоже на один шаг диффузионного процесса, поэтому каждый блок оптимизирует собственный лосс и не зависит от соседних блоков.

Главный плюс - память. Для тренировки нужна память под один блок, а не под всю сеть целиком.

Авторы проверили подход на разных архитектурах:

- ViT
- DiT
- masked diffusion
- авторегрессионные трансформеры
- recurrent-depth / Looped-трансформеры

По качеству результаты сопоставимы со сквозным обучением, но с куда меньшими требованиями к памяти.

В Looped-трансформерами один и тот же блок прогоняется много раз подряд, как будто модель «думает» несколькими итерациями. Обычно для обучения приходится разворачивать весь этот процесс через BPTT, из-за чего память и вычисления быстро дорожают

Это ещё один аргумент в пользу идеи, что диффузия - не только про генерацию картинок, а более универсальная рамка для обучения моделей.

Если модель упирается в VRAM из-за глубины, DiffusionBlocks выглядит как подход, за которым стоит следить.

Пейпер: arxiv.org/abs/2506.14202
Код: github.com/SakanaAI/DiffusionBlocks

@ai_machinelearning_big_data

#sakana #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

485 views16:04

About

Blog

Apps

Platform