Machine learning Interview

Tensordyne анонсировала прорывную систему для inference.

Компания заявляет о логарифмических AI-чипах, которые дают в 17 раз больше токенов на ватт и в 13 раз более высокую пропускную способность, чем NVIDIA Blackwell.

Главное математическое улучшение, по их словам, в том, что они реализовали эффективные логарифмические вычисления прямо на уровне железа. В логарифмическом пространстве умножение превращается в сложение, а сложение гораздо проще реализовать аппаратно, чем полноценные умножители.

За счёт этого вычислительные блоки на чипе становятся меньше, чем у современных FP8 и INT8 GPU. Меньше транзисторов, ниже нагрев и энергопотребление. А освободившееся место на кристалле можно использовать под большее количество tensor engines, дополнительную высокоскоростную SRAM и HBM3e-память, а также быстрый interconnect.

Для DeepSeek-R1 Tensordyne заявляет 363 000 токенов в секунду на стойку против 27 400 токенов у сравнительной системы NVIDIA.

Компания также сообщила, что успешно завершила tape-out процессора Napier. Сейчас он уже находится в производстве на 3-нм техпроцессе TSMC.

https://x.com/TensordyneInc/status/2066567307984531834

🔥31👍6❤2🤔2

4.07K views06:09

Machine learning Interview

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905

🫡7👍6🆒5❤4

3.3K views10:02

Machine learning Interview

Forwarded from AI VK Hub

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

📢

Открыта регистрация на RecSys Meetup от AI VK

1 июля в Москве инженеры и исследователи AI VK расскажут о трансформерных моделях и LLM-агентах в рекомендациях, представят исследовательское направление и поделятся опытом внедрения технологий Discovery в продукты VK с многомиллионной аудиторией.

Спикеры:
🟣 Андрей Зимовнов, директор по AI, VK
🟣 Александр Дьяконов, руководитель отдела исследований AI VK Research
🟣 Евгений Астафуров, ведущий разработчик, AI VK
🟣 Михаил Трапезников, руководитель группы рекомендательных технологий, AI VK

В программе:
🟣 Нейропрофиль в Discovery
🟣 Контентные LLM-агенты
🟣 Научные исследования в AI VK
🟣 Cоциальное общение, светомузыка и активности

➡️

Регистрация по ссылке

Количество мест ограничено, трансляции не будет.

📍1 июля, ДК «Кристалл», Москва

#aivkhub #recsys

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤6🔥5🥴4

2.87K views11:48

Machine learning Interview

QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb

❤15👍7🥰4

3.8K views13:37

Machine learning Interview

Абсолютного иммунитета к jailbreak-атакам не существует даже у самых сильных LLM.

Новое исследование показывает: frontier-модели действительно становится сложнее взломать, но не невозможно.

Авторы проверяли Anthropic Fable 5 и Opus 4.8 с помощью автоматизированных red-team инструментов. Система снова и снова переписывала опасные запросы, пока модель либо отказывалась отвечать, либо всё же давала нежелательный ответ.

Fable 5 оказался устойчивее Opus 4.8. В худшем сценарии успешность атаки на Fable 5 достигала 6.1%, а у Opus 4.8 под самым сильным давлением доходила до 11.5%.

Полностью исключить jailbreak практически невозможно. Даже tiny failure rate становится проблемой, если атаки автоматизированы и повторяются в большом масштабе.

И здесь важна деталь: старая карикатурная версия jailbreak, где всё строилось на странных кодировках и театральном role-play, уже не главная угроза.

Оставшаяся слабость контекстная.

Атакующий не просто задаёт один вредный вопрос. Он адаптируется после отказов, меняет формулировку, подбирает рамку и ищет такой контекст, который модель воспримет как допустимый, а не опасный.

Поэтому абсолютная неуязвимость, скорее всего, неправильная цель. Языковые модели не “видят намерение” с идеальной моральной высоты. Они выводят смысл из формулировки, контекста и похожих примеров.

В такой гибкой системе всегда будут пограничные случаи, где вредный запрос достаточно похож на обучение, safety research, fiction, troubleshooting или policy analysis, чтобы проскочить фильтр.

Paper: A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models
https://arxiv.org/abs/2606.18193

❤14👍9🔥5

4.49K views13:26

Machine learning Interview

Боевые Вайбкодинг-машины

❤36👍9😁8

4.36K views16:14

Machine learning Interview

DeepSeek-V4-Flash открыли бесплатно: тестируем без оплаты токенов

Что можно тестировать:

• генерацию кода и автоматизацию;• агентные сценарии и ботов;• анализ данных и технические задачи;• быстрые прототипы без расходов на API;• игровые серверы, ассистентов и нестандартные AI-проекты.

Отличный вариант, чтобы быстро проверить идею, не сливая бюджет на эксперименты.

Забираем бесплатно здесь:

https://www.openmodel.ai/event

🔥16👍6❤5

10.2K viewsedited 23:02

Machine learning Interview

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

forkd - это runtime для sandbox-окружений AI-агентов на базе Firecracker microVM.

Он помогает быстрее ветвить и распараллеливать задачи: сначала один раз запускается «прогретый» родительский microVM, а затем дочерние окружения создаются из copy-on-write снапшотов памяти вместо холодного запуска каждой VM.

Ключевые возможности:

- Forking от прогретого родителя - дочерние окружения наследуют уже загруженные импорты, зависимости, JIT-состояние, веса моделей и кэши
- KVM-изолированные microVM — каждый дочерний sandbox работает как отдельный процесс Firecracker с собственной изоляцией
- Live BRANCH, можно поставить работающий sandbox на паузу, снять снапшот состояния «на лету» и продолжить выполнение. Для v0.4 заявлено p50-окно паузы исходного окружения 56 мс
- Цепочки diff-снапшотов — можно накладывать runtime-слои вроде numpy → pandas → sklearn без повторного копирования одного и того же базового образа
- Удобная daemon-поверхность, REST API, Python/TypeScript/MCP-клиенты, метрики Prometheus, JSON audit log и поддержка systemd

Проект open-source и распространяется под лицензией Apache License 2.0.

Ссылка в ответе 👇

https://github.com/deeplethe/forkd

🔥8❤5🥰1

3.54K views15:19

Machine learning Interview

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Вопрос «использовать ИИ или нет» уже давно закрыт. Теперь осталось понять, как делать это с пользой для бизнеса, команды и собственной карьеры.

26–27 июня в Казани пройдёт ТАТАР САН — главная конференция Татарстана про искусственный интеллект и его практическое применение. Сбер выступает генеральным партнёром конференции и примет активное участие в деловой программе. Соберутся разработчики, дизайнеры, HR-спецы, руководители и все, кто хочет разобраться в главной трансформации последних лет.

В программе:

🔵Реальные кейсы внедрения ИИ от экспертов из Сбера, МТС, Альфа-Инвестиций и других компаний
🔵 Пять тематических треков: от трансформации ролей и найма до дизайна и инженерных практик
🔵 Хедлайнеры — Вячеслав Дубынин из МГУ и Владимир Пирожков из Сбера
🔵 Нетворкинг, конкурс «Королева кода» и афтерпати с секретными гостями на сцене.

Фиксируйте в календаре: 26 и 27 июня, Казань, ТАТАР САН. Вся программа и билеты на сайте конференции.

26–27 июня // ИТ-парк им. Б. Рамеева // Казань

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3🔥3

3.68K views11:23

Machine learning Interview

Интересный релиз Qwen3.6-35B-A3B-StyleTune!

Эта мощная модель точечно перестраивает текст так, чтобы полностью убрать роботизированные клише и повторяющиеся тропы, при этом сохраняя рассуждение и логику Qwen3.6 на 100%.

https://huggingface.co/Gryphe/Qwen3.6-35B-A3B-StyleTune

🔥23❤7

3.8K views13:23

Machine learning Interview

🚨 MICRON ОБЪЯВЛЯЕТ О СТРАТЕГИЧЕСКОЙ СДЕЛКЕ С ANTHROPIC

* Многолетнее соглашение по HBM, DRAM и SSD
* Совместная разработка памяти и хранилищ под нагрузки Claude
* Claude внедряется внутри Micron
* Micron инвестировала в раунд Anthropic Series H

Теперь Micron для Anthropic одновременно инвестор, клиент, партнёр и поставщик.

🔥19👍6💊5❤4😁3🤗2🗿1

4.19K views16:01

Machine learning Interview

🔥

Три разных человека. Три разных проекта. Один и тот же подход.

— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес
— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска
— Аня без кода запустила AI-бота для изучения английского → первые ~$200 уже в 1 месяц

Разные результаты. Разный масштаб. Но общие правила:

1. не придумывать «гениальную идею», а брать существующий спрос
2. делать простой MVP и быстро запускаться
3. докручивать монетизацию и продукт по факту использования

Ребята сделали всё без команды, без инвестиций, а самое главное — без ожидания «идеального момента». Да, не у всех получается сразу. И не у всех выходит на $10K. Но если системно идти по схеме выше — появляется первый доход с продукта, а дальше уже есть что масштабировать.

В комьюнити разбираем такие кейсы регулярно: @its_capitan. Что сработало, что нет, и почему.

Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqusRoPF

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5🥴4🗿3👌2😴2❤1

3.56K views12:16

Machine learning Interview

SpaceX подписала соглашение с open-source AI-стартапом Reflection AI на сумму до $6,3 млрд до 2029 года.

Reflection получит немедленный доступ к чипам Nvidia GB300 в дата-центре Colossus 2.

Платежи начнутся 1 июля 2026 года и составят $150 млн в месяц.

При этом любая из сторон сможет расторгнуть соглашение с уведомлением за 90 дней после первых трёх месяцев.

Также SpaceX уже заключила compute-соглашения с Anthropic, Google и Cursor.

🔥14❤2👍2

3.98K views14:30

Machine learning Interview

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Claude 😂😂😂

😁46👍4🔥4🎉1🙈1💊1

4.01K views16:17

Machine learning Interview

Anthropic вместе с Frontend Masters выкатили бесплатный курс по Claude Code.

И это не поверхностный обзор, а нормальный разбор инструмента для тех, кто хочет реально прокачать вайбкодинг и работу с AI-агентами.

Курс ведёт Lydia Hallie из Anthropic.

Внутри:

• основы Claude Code
• skills
• hooks
• sub-agents
• MCP
• плагины
• Agent SDK
• продвинутые сценарии работы

Хороший вход для тех, кто хочет не просто “просить ИИ написать код”, а собирать нормальный рабочий процесс вокруг Claude Code.

Ссылка:
http://frontendmasters.com/courses/claude-code

🔥18👍6❤5

4.35K views14:42

Machine learning Interview

GLM-5.2 набрала 22,8% на ARC-AGI-2 при стоимости $0,25 за задачу.

Важно отметить: примерно в мае 2025 года лучшие верифицированные модели на ARC-AGI-2 показывали всего около 3,0%.

То есть GLM-5.2 всё ещё сильно отстаёт от GPT-5.5 с результатом 85%, но при этом примерно в 7,6 раза превосходит лучший frontier-результат мая 2025 года.

И ещё она примерно в 7,5 раза дешевле за задачу, чем запуск GPT-5.5 за $1,87.

https://x.com/arcprize/status/2069845152773099854

🔥18

3.95K views06:22

Machine learning Interview

This media is not supported in your browser

VIEW IN TELEGRAM

Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.

Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.

🔗Выбирай удобный формат и регистрируйся по ссылке

📍Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

3.29K views14:00

Machine learning Interview

SpaceX и xAI постепенно превращаются в новоый Oracle.

Сообщается, что Reflection получит быстрый доступ к чипам Nvidia GB300 через SpaceX.

За это компания будет платить $150 млн в месяц, начиная с 1 июля 2026 года.

Если сделка продлится до 2029 года, её общая стоимость может достичь примерно $6,3 млрд.

У кого есть GPU, энергия и дата-центры, тот фактически становится новым облачным гигантом.

https://www.cnbc.com/2026/06/22/spacex-ai-colossus-data-center-reflection.html

❤7👍4🔥4

3.21K views16:04

Machine learning Interview

В Китае, по сообщениям, вырос чёрный рынок токенов для Claude.

Пользователям продают доступ почти на 93% дешевле, чем у Anthropic. Но такая скидка появляется не из воздуха.

Схема держится на трёх вещах.

Первая - дробление аккаунтов.

Продавцы массово создают платные аккаунты с большими лимитами и делят их между клиентами по часовым квотам. Один аккаунт превращается в пул для десятков или сотен пользователей.

Вторая - подмена модели.

Человек думает, что общается с Claude Opus, а на деле ему может отвечать более дешёвая Claude Haiku или вообще другая модель вроде Qwen.

Третья - перепродажа данных.

Самая опасная часть - логи чатов. Там могут быть код, документы, рабочие переписки, личные данные, пароли, API-ключи и коммерческая информация.

Эти данные могут уходить компаниям для обучения моделей или попадать к мошенникам. Дальше - спам, фишинг, шантаж и другие неприятные истории.

Всё это существует, несмотря на блокировку Claude в Китае.

Для обхода используют Transfer Stations - прокси-площадки, через которые чат-боты получают доступ к токенам. Поставщиков выбирают по цене, стабильности и аптайму.

Отдельная часть схемы - аккаунты и KYC. По сообщениям, для верификации используют купленные данные людей из бедных регионов Азии, Африки и Латинской Америки, а также синтетические AI-личности.

Трафик часто гонят через страны, где Claude доступен, например через Сингапур.

Ирония в том, что из-за таких схем маленький Сингапур внезапно стал одним из лидеров по использованию Claude на душу населения.

Главная мысль простая: подозрительно дешёвый доступ к топовой модели может стоить не $5.

Он может стоить ваших данных.

https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in

👍16🤣9🤔2❤1😁1

3.62K views17:33

About

Blog

Apps

Platform