Разработчик под ником Thereallo опубликовал на днях подробный анализ, который показывал, что Claude Code незаметно помечал часть пользователей из Китая по цифровым отпечаткам их программного окружения.
Инженер команды Claude Code, Тарик Шихипар, отреагировал на публикацию постом в сети Х и признал, что в марте в продукт был встроен экспериментальный механизм.
Он срабатывал только при использовании нестандартного адреса API и проверял несколько признаков: часовой пояс системы, совпадение имени прокси-хоста со списком китайских реселлеров и наличие определённых ключевых слов, и с помощью особой пунктуации внедрял скрытую метку в системные инструкции методом стеганографии.
Цель, по словам Тарика, состояла в том, чтобы помешать неавторизованным реселлерам злоупотреблять аккаунтами и заниматься дистилляцией модели.
Он добавил, что команда давно собиралась отключить этот механизм, правки внесены, а полное удаление ожидается в ближайшем обновлении.
В сети восприняли объяснение скептически
Критики отмечали, что механизм действовал с марта, а его свёртывание началось лишь после огласки, и упрекали компанию в том, что она сообщила о практике только после обнаружения, не уведомив пользователей заранее.
Для Anthropic, которая позиционирует себя как одного из лидеров в вопросах безопасности и этики ИИ, такой эпизод, по их оценке, особенно чувствителен.
Этот спор наложился на на более раннюю историю о том, как Claude определяет, откуда заходит пользователь.
Пользователи замечали, что письма с кодами подтверждения и уведомлениями о входе содержат примерную геолокацию: страну, регион или город.
Эти данные обычно вычисляются по IP-адресу, параметрам сети и устройства, поэтому при использовании виртуальных или корпоративных сетей, а также прокси, указанное место может не совпадать с реальным.
Справедливости ради - в политике конфиденциальности Anthropic сказано, что компания собирает IP-адреса, сведения об устройстве и соединении, а также определяемое по IP местоположение для безопасности, борьбы с мошенничеством и контроля за соблюдением условий сервиса.
Обе истории острее всего восприняли в китайском сегменте. Доступ к продуктам Anthropic в стране закрыт, поэтому там распространены зарубежные аккаунты, трансграничный доступ и сторонние сервисы-посредники.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32❤16🤔6😁4🔥3😈2👀1
Media is too big
VIEW IN TELEGRAM
Компания более чем вдвое снизила затраты на вывод для неавторизованных пользователей веб-версии ChatGPT. Для обработки всего гостевого трафика платформе теперь требуется лишь несколько сотен GPU Nvidia.
Сессии без аккаунта работают с ограниченным функционалом. Будут ли этот подход масштабироваться на обслуживание авторизованных пользователей, пока неизвестно.
Технические детали оптимизации компания не раскрывает.
theinformation.com
Корпорация Цукерберга выходит на рынок облачных услуг и планирует предоставлять сторонним клиентам доступ к своим кластерам и развернутым ИИ-моделям так же, как это делает SpaceX, которая сдает в аренду GPU от xAI компаниям Anthropic и Google.
Бюджет компании на инфраструктуру в этом году составляет $145 млрд. Для высвобождения средств Meta ранее провела сокращения персонала.
Монетизация свободных ресурсов показывает, что внутреннее обучение моделей больше не утилизирует мощности на 100%.
bloomberg.com
SpaceX показала инвесторам прототип смартфона на базе процессора Qualcomm Snapdragon с системной интеграцией моделей xAI. Устройство работает на собственной операционной системе.
Цель разработки смартфона - запуск супераппа по принципу WeChat в обход монополий Apple и Google. Своя ОС позволит Илону Маску напрямую контролировать дистрибуцию и монетизацию мобильных продуктов xAI.
Проект находится на ранней стадии разработки.
wsj.com
Платформа Base44, которая принадлежит Wix, выпустила модель Base 1, обученную на внутренней телеметрии и логах разработки. Модель уже развернута в продакшене.
Base 1 участвует в обсуждении логики, предсказывает действия пользователя и фильтрует тупиковые архитектурные решения. Платформа использует автоматический роутинг, распределяя запросы между Base 1 и другими LLM из селектора в зависимости от задачи.
В обучающий датасет вошли десятки миллионов сессий: стартовые промпты, сгенерированный агентами код, ошибки рантайма, ручные правки и сигналы успешного деплоя. Архитектуру и результаты бенчмарков Base44 раскроет в ближайшие недели.
base44.com
Медианная цена дома в Сан-Франциско достигла $1,7 млн, средняя аренда - $3827. Из-за этого город покидают специалисты с доходами меньше $200 тысяч в год.
В качестве примера приводится пара с суммарным доходом $365 тысяч, которые за три месяца не нашли квартиру дешевле $5000 в месяц. В результате инженер переехал в район озера Тахо, а рекрутер арендует комнату за $1650.
В Кремниевой долине сформировалась группа из 10 тысяч человек с состоянием свыше $20 млн. На локальные цены влияют вторичные продажи акций - осенью 75 сотрудников OpenAI заработали на этом в среднем по $30 млн.
Аналитики прогнозируют, что ожидаемые IPO OpenAI и Anthropic еще больше увеличат стоимость жилья в регионе.
nytimes.com
*организация признана экстремистской, её деятельность на территории РФ запрещена.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔51🔥28👍26❤6👏6🤷5🥰3😁2
Forwarded from GigaDev — разработка GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
Результаты:
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang
Motivation
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
❤86👍32🤓28🤣27🔥11👏8🎉6💯5🤬1🙈1
GeneBench-Pro - набор тестов, проверяющий, способны ли модели самостоятельно принимать исследовательские решения при работе с биологическими данными. Он оценивает умение проводить сложный анализ данных в генетике и смежных областях биологии и медицины.
Моделям дают неструктурированные, как в реальной лаборатории, данные, краткое описание задачи и целевую величину, которую нужно оценить (но не говорят, как считать).
Чтобы прийти к верному ответу, система должна сама пройти цепочку зависимых решений: очистить данные, выявить артефакты, выбрать подходящий статистический метод и пересмотреть план, если промежуточные результаты противоречат исходной гипотезе.
Для всех 129 задач условия смоделированы так, чтобы проверять ответ однозначно, по принципу "всё или ничего".
Набор охватывает 10 областей и 21 подобласть, а 82 задачи прошли проверку у экспертов-биологов.
Сильнейшая из протестированных моделей, GPT-5.6 Sol, верно решает 28,7% задач на максимальном уровне рассуждений и 31,5% в режиме Pro.
Лучший результат среди моделей других вендоров у Claude Opus 4.8 (16,0%).
OpenAI называет такой результат заметным для настолько трудного теста.
По опросу рецензентов, одна задача GeneBench-Pro заняла бы у специалиста порядка 20–40 часов, что при ставке около $200 в час выливается в несколько тысяч долларов.
Расчёт той же задачи моделью стоит значительно меньше, но конкретных цифр OpenAI не дает. Для стандартных моделей в техотчёте приведён средний расход токенов как приблизительная оценка вычислительных затрат (около 33 200 токенов для Sol в максимальном режиме).
Обозначение Pro в контексте бенчмарка - это режим работы модели, а не отдельная линейка продуктов или новые тарифы ChatGPT.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓58👍23👏13❤10🤔8🔥3🥰3
Это «теплое» объектное хранилище на NVMe-дисках, которое рассчитано на сценарии, где критичны скорость чтения и минимальные задержки. Сервис является частью MWS Cloud Platform.
Скорость передачи данных составляет до 1,8 ГиБ/с и TTFB около 20 мс. Хранилище подходит для обучения нейросетей, аналитики, медиа сервисов и высоконагруженных веб-приложений, есть совместимость с AWS S3 API, поэтому можно мигрировать в MWS Cloud Platform без переписывания сервисов;
Помимо этого, у хранилища есть шифрование, репликация между дата-центрами, версионирование и IAM-права. Оплата проходит по модели pay-as-you-go.
MWS Cloud опубликовали методологию и результаты внутреннего тестирования, показавшего, что это самое быстрое S3-совместимое объектное хранилище среди крупных российских облачных провайдеров.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥25👏17🤩8🏆6❤4🤣3🥱1💯1
Уязвимость, получившая название BioShocking, позволяет злоумышленникам обходить базовые ограничения агентов и незаметно извлекать конфиденциальные данные из активных сессий пользователя.
Эксплойт успешно протестировали на 6 популярных решениях, включая ChatGPT Atlas, Perplexity Comet и расширение Claude для Chrome.
В основе атаки лежит техника манипуляции контекстом
Жертву заманивают на вредоносную страницу с игрой-головоломкой, которую должен решить ИИ-браузер.
По правилам игры правильными признаются абсурдные ответы (например, ИИ заставляют согласиться с тем, что 2 + 2 = 5). Как только ИИ принимает эту альтернативную логику, он начинает считать, что находится в вымышленной среде, где реальные правила безопасности больше не действуют.
На финальном этапе скомпрометированная страница дает агенту команду скопировать текст по скрытому URL-адресу. Этот линк незаметно перенаправляет ИИ в приватный или корпоративный GitHub-репозиторий пользователя.
Поскольку ИИ-браузер работает локально и имеет доступ ко всем авторизованным сессиям, в ходе тестов агенты беспрепятственно похитили SSH-ключи и передали их на сервер атакующего. Ни один из них не классифицировал эту операцию как угрозу и не запросил подтверждения.
Специалисты LayerX призывают разработчиков внедрить строгие проверки разрешений перед тем, как ИИ обращается к конфиденциальным источникам данных.
OpenAI уже устранила уязвимость в ChatGPT Atlas осенью 2025 года, однако остальные вендоры, по данным исследователей, пока не закрыли брешь или полностью проигнорировали отчеты.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔30😐14😨6❤4👍4🤣4🔥2🤬2😁1
🚨 Anthropic готовит собственный AI-чип для inference.
Компания ведёт ранние переговоры с Samsung по производству на 2-нм техпроцессе и с advanced packaging.
Кстати, Samsung уже инвестировала в Anthropic в рамках Series H.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
@ai_machinelearning_big_data
Компания ведёт ранние переговоры с Samsung по производству на 2-нм техпроцессе и с advanced packaging.
Кстати, Samsung уже инвестировала в Anthropic в рамках Series H.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
@ai_machinelearning_big_data
👍97🤩41👏27😇11❤7🥰7🎉7💯5🔥4🤣3👻1
Forwarded from Яндекс
Почитать:
Посмотреть:
Посетить:
👀 Делитесь дайджестом с другими разработчиками
Please open Telegram to view this post
VIEW IN TELEGRAM
❤39👍19🔥11👏6😁2🤩1
Автоконцерн начал использование человекоподобных роботов Figure 03 на заводе в Спартанберге (США) для комплектации и сортировки деталей.
Предыдущая модель, Figure 02, за 10 месяцев тестирования на предприятии поучаствовала в сборке более 30 тысяч автомобильных кузовов.
Новая версия гуманоида от Figure AI получила беспроводную зарядку, мягкие элементы корпуса и аудиосистему для голосового общения с персоналом. Манипуляторы оснастили тактильными сенсорами и встроенными в ладони камерами для повышения точности мелкой моторики.
На конвейере Figure 03 будет распознавать несортированные компоненты в общих контейнерах и извлекать их, раскладывая по логистическим тележкам в заданной последовательности.
Доставку собранных тележек на сборочную линию осуществляют беспилотные складские тягачи.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥21🤔14👏7❤4🤓4👌2❤🔥1