299K subscribers
5.03K photos
1.14K videos
17 files
5.39K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌 Фэй-Фэй Ли предлагает разделить модели мира на 3 функции

Крёстная мать ИИ и сооснователь World Labs вместе с командой опубликовала эссе, продолжающее её более ранний текст о пространственном интеллекте.

На этот раз авторы пытаются навести порядок в одном из самых перегруженных терминов индустрии - "модели мира".

LLM прекрасно овладели понятиями, лексикой и рассуждением, но они изучают статистическую структуру текста.

Модель мира должна изучать совокупность пространства и времени - как свет падает на поверхность, как предметы реагируют на силу, как всё это подчиняется законам физики.

Проблема в том, что термином "модель мира" пользуются CV, робототехника, RL и генеративный ИИ, каждый вкладывая в него своё.

Чтобы развести значения, Ли предлагает опираться на классическую схему из учебников по RL: цикл "агент-действие-состояние-наблюдение".

Формально - частично наблюдаемый марковский процесс принятия решений.


Разные системы, которые сегодня называют моделями мира, авторы предлагают рассматривать как разные проекции этого одного цикла.

🟡 Разделение на функции

Рендерер выдаёт наблюдения в виде пикселей, и главное для него - визуальная достоверность (3D структуры он по-настоящему не понимает).

Симулятор выдаёт состояние (геометрически и физически корректное описание мира, на котором могут работать и люди, и алгоритмы).

Планировщик по наблюдению и цели выдаёт действие, замыкая петлю "восприятие -действие".

🟡Доводы

Из 3-х категорий именно симулятор привлекает меньше всего внимания публики, но он самый значимый.

Рендереры коммерчески наиболее развиты (Google Nano Banana и другие генераторы), но оптимизированы под правдоподобную картинку, а не под физику - красивый кадр нельзя использовать, чтобы спроектировать здание или обучить робота.

Планировщики, наоборот, самые перспективные и самые сырые. Робототехнические демо последних лет почти всегда ограничены лабораторными условиями и далеки от реалий в реальном мире.

Симулятор описан как мост между ними и структурный каркас, из которого выводятся и внешний вид (для рендерера), и последствия действий (для планировщика).

Логическим итогом Ли называет одну базовую модель, которая в зависимости от запроса переключается между режимами: рендерит, симулирует или планирует.

В качестве первого шага в эту сторону Ли считает платформу Marble (разработка World Labs), которая генерирует 3D-сцены и выдает в рамках одной модели и гауссовы сплаты для визуального осмотра, и коллизионные сетки, с которыми может работать физический движок.


#AI #ML #WorldModels #WorldLabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔6338👏22👍13🤓5👨‍💻4🔥2😁1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Mythos все-таки стала инструментом для наступательных киберопераций США

АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы под задачи спецслужбы Anthropic направила в агентство команду из 6 инженеров.

Сотрудничество с АНБ стало исключением на фоне конфликта стартапа с Пентагоном. В правилах безопасности Anthropic жесткие ограничения на военное использование ИИ касаются слежки за гражданами США, но формально оставляют спецслужбам свободу действий в операциях против зарубежных целей.

Степень вовлеченности разработчиков Anthropic в активные фазы атак не раскрывается.
ft.com

✔️ Власти Флориды подали в суд на OpenAI и Сэма Альтмана

В 83-страничном документе прокуратура штата требует признать ChatGPT дефектным товаром и общественной угрозой из-за выдачи опасного контента несовершеннолетним.

Часть обвинений строится на внутренних утечках. По версии властей, Альтман намеренно сократил сроки тестирования безопасности GPT-4o перед релизом. Утверждается, что на выявление рисков OpenAI выделила 1–2% вычислительных мощностей вместо публично обещанных 20%.

Дополнительные претензии касаются приватности. В иске указано, что в бесплатной версии ChatGPT нет верификации возраста, а сбор пользовательских данных начинается до принятия Terms of Service.
myfloridalegal.com

✔️ В мобильном клиенте LM Studio появилась поддержка удаленного инференса

Обновлённый клиент для iPhone и iPad объединил локальный инференс на смартфоне и удаленный доступ к десктопным моделям.

Офлайн-режим построен на фреймворке Apple MLX и оптимизирован под чипы Apple Silicon. Приложение поддерживает загрузку весов в формате GGUF.

Запуск тяжелых моделей стал возможен благодаря функции LM Link. Она направляет запросы к десктопному хосту LM Studio через mesh-сеть на базе Tailscale. Интеграция обеспечивает сквозное шифрование трафика без проброса портов в интернет.
lmstudio.ai

✔️ Учёные Кембриджа отчитались о тестировании спроектированной ИИ вакцины

Университет завершил первую фазу клинических испытаний pEVAC-PS, вакцины против коронавирусов, архитектуру которой спроектировала ИИ-модель. Препарат подтвердил безопасность и вызвал перекрестный иммунный ответ к нескольким видам вирусов у 39 добровольцев.

Модель обучали на генетических данных сарбековирусов, включая SARS-CoV-2 и вирус атипичной пневмонии. Алгоритм вычислил общую для родственных патогенов мишень, уязвимую для человеческих антител.

Клиническую эффективность pEVAC-PS проверят на втором этапе исследований. Технологию планируют применять для разработки вакцин против гриппа и вируса Эбола. Для коммерциализации платформы команда Кембриджа основала компанию DIOSynVax.
cam.ac.uk

✔️ Человеческий контроль мешает бизнесу экономить на внедрении ИИ

По данным опроса Bain & Company среди 951 компании, постоянное вмешательство людей в работу алгоритмов снижает финансовую отдачу от внедрения ИИ. Почти 40% корпораций сократили издержки менее чем на 10%, не достигнув целевых показателей в 11–20%.

Лишь 7% респондентов используют полностью автономных агентов. В 38% случаев системы требуют обязательного подтверждения каждого действия со стороны человека. Это ломает исходные бизнес-кейсы, рассчитанные на автоматизации.

Вторым барьером для интеграции моделей 41% опрошенных назвали проблемы с доступом к корпоративным данным. Несмотря на отставание от финансовых планов, 90% компаний намерены наращивать инвестиции в ИИ.
bain.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🤔5325🤨25🤬9🔥7😐5👌1💘1
Минимальные требования к Вайбкодеру в 2026
😁265🤔53🤣32👌10🤨75💯5🥱4🤬2😐2🙊2
⚡️ Nvidia анонсировала систему на чипе RTX Spark Superchip для Windows 11

Архитектура рассчитана на локальный запуск ИИ-моделей размером до 120 млрд параметров.

В основе - 20-ядерный CPU линейки Grace и графическое ядро Blackwell с 6144 ядрами CUDA. Компоненты соединены шиной NVLink и используют до 128 ГБ объединенной памяти LPDDR5X.

При теплопакете 80 Вт мощность видеоядра сопоставима с мобильной GeForce RTX 5070. Чип поддерживает DLSS 4.5.

Ноутбуки на базе RTX Spark поступят в продажу осенью по цене от 2700 евро.

Для корпоративной разработки Nvidia готовит рабочую станцию DGX Station for Windows на базе GB300 Grace Blackwell Ultra с 750 ГБ памяти.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
78👍67🤔28🔥15👏14🥱74😍4
📌 Р. Саттон: ИИ без оценки результатов в процессе работы не способен к научным открытиям

Ричард Саттон, один из основоположников RL и лауреат премии Тьюринга, записал видео, в котором раскритиковал нынешние генеративные модели.

Современные генеративные модели (LLM, генераторы изображений и видео) по своей природе лишь имитируют и не способны к настоящему творчеству и открытиям.

Основной ограничитель - отсутствие механизма, который оценивал бы их результаты непосредственно во время работы.

Свой довод Саттон построил вокруг известной шутки об отзыве на научную работу: она "и новая, и хорошая, но хорошие части не новы, а новые - не хороши".


Это описание точно подходит к генеративному ИИ: его вывод бывает либо новым (за счёт случайности при генерации), либо качественным (за счёт обучающих данных), но не тем и другим сразу.

Для большинства задач это несущественно: имитация и есть назначение обучения с учителем, а генеративный ИИ остаётся полезной технологией, если он быстрее, дешевле или удобнее воспроизводимого образца. Проблема возникает там, где требуются открытие и творчество, то есть в науке и математике.

Научное открытие складывается из 3 шагов: вариативности, оценки и избирательного сохранения удачного. Этой способности нет в чистом предсказании и обучении с учителем, но она есть в RL, планировании и комбинаторном поиске.

Саттон привёл в пример системы, которые, по его оценке, нашли одновременно новые и качественные решения: AlphaGo, AlphaZero, AlphaFold и AlphaProof.

Сам трёхчастный принцип, кстати, не нов. На близкие идеи указывали ещё Дональд Кэмпбелл и Дэниел Деннет.


🟡 Генеративным моделям недостаёт шага оценки

Из-за предобучения, они не имеют способа оценивать собственный вывод в момент работы, а без оценки нет и отбора лучшего. Оценку может давать человек, выбирающий результат, но важнее кейс, когда критерий задан явной целью (например, ходом, ведущим к мату, или шагом, ведущим к доказательству).

Ограничение Саттон распространил и на сам метод обучения. Алгоритм обратного распространения ошибки лишён случайности, она вносится лишь однажды при инициализации весов, из-за чего сеть со временем теряет пластичность.

В качестве решения он напомнил о предложенном его группой алгоритме Continual Backprop, который периодически заново инициализирует редко используемые нейроны, поддерживая способность сети меняться.

🟡Вывод

Чтобы добиться полностью автономного ИИ-учёного, инженерам следует делиться с моделями измеримыми целями, по которым те могли бы самостоятельно проходить весь цикл: порождать варианты, оценивать их и сохранять лучшие, не полагаясь на человека в роли арбитра.

Тезисы Саттона перекликаются с его эссе "Горький урок", где он отстаивал ставку на поиск и обучение, масштабируемые вместе с вычислительными мощностями, в противовес встраиванию готовых человеческих знаний.


🔜 Послушать лекцию на Youtube


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤔86👍5835👏14💯3🤣3🤓2🥰1👌1
Онлайн-магистратура — вариант для тех, кто хочет получить высшее образование, но не готов ставить жизнь на паузу.

УрФУ и Нетология предлагают три технологические программы, которые можно проходить онлайн и совмещать с работой:
1) Прикладной искусственный интеллект — чтобы научиться применять ИИ и нейросети для задач бизнеса.
2) Инженерия машинного обучения — чтобы разбираться в полном цикле работы с моделями: от данных до внедрения.
3) Программная инженерия цифровых решений — чтобы развиваться в бэкенде, архитектуре и создании цифровых сервисов.

На программах вас ждут прикладные задачи, проекты для портфолио, поддержка кураторов и экспертов. После выпуска — диплом магистра УрФУ и дополнительный диплом Нетологии.

На все программы действует образовательный кредит с господдержкой под 3%, а также акция: при оформлении кредита платежи за первый семестр возьмёт на себя Нетология.

Посмотреть программы

Реклама. ООО “Нетология” ОГРН 1207700135884 Erid:2VSb5yUEePU
🤣25👨‍💻16👍13🔥85🗿4😐3🥰1
✔️ Лидеры по найму среди стартапов Кремниевой долины

Руководитель по развитию Cursor Бен Ланг опубликовал список из 35 технологических стартапов с самыми высокими темпами найма за последние 90 дней.

Рейтинг учитывает соотношение числа новых сотрудников к изначальному размеру команды.


Около 85% списка заняли проекты в сфере ИИ и автономных систем. Основной рост пришелся на 2 направления:

🟢ИИ-безопасность: Jazz, Tenzai, Straiker, Gray Swan и Native.

🟠Embodied AI и робототехника: разработчик моделей Skild AI, провайдер датасетов для машинного зрения Mecka AI и создатель систем управления Allen Control Systems.

Также в список вошли сам Cursor, платформа предиктивных рынков Polymarket и разработчик RL-сред Fleet. По данным Бена, последний сейчас привлекает инвестиции при оценке в $750 млн.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍69👏17🔥106😁5🤔3🤩1
📌LEAP: система, которая помогла LLM решить все задачи олимпиады Putnam 2025

Google опубликовала интересный пейпер о системе LEAP, предназначенной для автодоказательства теорем. Она позволяет языковым моделям строить формальные, машинно проверяемые доказательства на языке Lean.

Доказательство на естественном языке трудно проверить автоматически - оно почти всегда содержит логические пробелы.

Формальное доказательство записывается на машинном языке и проверяется компилятором, что даёт гарантию корректности, но писать его значительно сложнее.


В этой области лидируют специализированные модели, заточенные в обучении именно под Lean. LEAP, работая как агентный фреймворк, использует общие модели, разбивая задачу на части и исправляя ошибки рекурсивно по подсказкам компилятора.

Главная исследовательская победа проекта - олимпиада Putnam 2025, ежегодное соревнование по математике для студентов в США.

LEAP формально решила все 12 задач, тогда как ни Gemini 3.1 Pro сама по себе, ни открытый специализированный прувер Goedel-Prover-V2 не решили ни одной.

Закрытую систему Aristotle, получившую на математической олимпиаде IMO 2025 результат уровня золотой медали, авторы в собственных тестах оценили в 9 решённых задач из 12.


В рамках работы также представлен набор IMO-LeanProofBench из 60 формализованных в Lean задач олимпиадного уровня, требующих весьма нестандартных выводов и структурно сложных доказательств.

На нём LEAP, что неудивительно, достигает в среднем по basic и advanced сэтам около 70% против примерно 48% у Aristotle.


Попутное достижение - LEAP формально проверила вспомогательную часть одной из комбинаторных задач, восходящих к математику Дональду Кнуту, сгенерировав более 5000 строк кода на Lean 4.

🟡Стоит отметить иронию

В статье авторы критикуют закрытые системы-конкуренты (Axiom3, Numina, Aristotle) за то, что те недоступны для научной проверки. При этом код самого LEAN тоже не опубликован.

Открытие итоговых доказательств это частично смягчает (их можно перепроверить компилятором Lean), но полная воспроизводимость гугловского проекта пока невозможна.


@ai_machinelearning_big_data

#AI #ML #LLM #LEAP #Research #Google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍35🤔29👏12🔥108😁7🎉2
✔️ Яндекс подвёл итоги грантовой программы Yandex Open Source

Компания выбрала 18 open source-проектов в направлениях AI, data и developer tools. Среди победителей — инструменты для локальных LLM, GraphRAG, E2E-тестирования, Docker и embedded-баз данных.

🟡Auto AI Router

Прокси-роутер для работы с OpenAI, Gemini, Anthropic и другими моделями через единую точку входа.

Поддерживает:
• балансировку нагрузки
• rate limiting
• каскадную маршрутизацию
• защиту от подозрительных запросов по аналогии с Fail2Ban

🟡RAGU

GraphRAG-движок для построения графов знаний по документам.

Система:
• извлекает сущности и связи
• дедуплицирует узлы
• кластеризует граф
• комбинирует локальный, глобальный и векторный поиск

Поддерживаются как облачные API, так и локальные модели Hugging Face.

🟡langchain-localai

Пакет для работы с LocalAI и LangChain в закрытых контурах.

Разработчики:
• перевели библиотеку на OpenAI SDK v1
• добавили полноценную асинхронность
• ускорили batch-генерацию эмбеддингов
• встроили поддержку reranking внутри RAG-систем

🟡Playwright Labs

Набор инструментов для E2E-тестирования на базе Playwright.

Включает:
• observability через OTLP
• генерацию моков
• Docker orchestration
• поддержку Angular / React / Vue селекторов

@ai_machinelearning_big_data

#opensource #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51👏159🔥7🤣6🎉4❤‍🔥2
🌟 LangChain сделала модуль самопроверки для ИИ-агентов

Компания выпустила RubricMiddleware, компонент для своего фреймворка Deep Agents, который заставляет ИИ-агента проверять собственный результат по заранее заданным критериям и при необходимости переделывать работу.

Инструмент позиционируется как решение типичной проблемы, когда агент выполняет задачу почти целиком, но упускает формат, тесты или обязательные разделы.

Механизм наиболее полезен для задач с чёткими и проверяемыми критериями приёмки.


🟡 Принцип работы

Разработчик задаёт список требований (рубрику) к выполненной задаче: например, код должен проходить тесты, а отчёт содержать определённые разделы.

Перед тем как агент завершит работу, отдельный проверяющий агент (грэйдер) оценивает результат по каждому пункту. Если что-то не выполнено, его замечания возвращаются основному агенту, и тот делает новую попытку.

Цикл останавливается, когда все критерии выполнены либо когда достигнут заданный лимит итераций.

По словам LangChain, проверяющий агент может не только рассуждать о качестве ответа, но и вызывать внешние инструменты, чтобы опираться на фактические данные, а не только на текст.

LangChain сравнивают подход с функцией /goal в Claude Code и Codex, но утверждают, что их реализация пластичнее за счёт выделенного агента-оценщика, который видит весь ход выполнения задачи.

RubricMiddleware пока в бете, но к нему есть документация, а посмотреть пример трейса можно тут.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓78👍46👏1610🤔10💯6🔥3🍾1
⚡️ Apple презентовала Siri AI

На WWDC 2026 главной темой конференции стала Siri AI - заново переработанная версия голосового ассистента, построенная на основе моделей Google Gemini.

Siri AI получила более естественный, разговорный характер с возможностью регулировки темпа и выразительности речи ассистента, а сам голос звучит ближе к человеческому, чем прежний синтетический.

Ассистент учитывает личный контекст и содержимое экрана. Появилось отдельное приложение-чатбот, через которое можно задавать вопросы, генерировать тексты и изображения, анализировать файлы.

Функции визуального интеллекта позволяют спрашивать о том, что видит камера или проанализировать снимок экрана.

Apple Intelligence использует обработку данных на устройстве и частные облачные вычисления, обещая, что данные пользователей используются только для выполнения текущего запроса и недоступны Apple или третьим лицам.

Новая Siri и расширенные функции Apple Intelligence в iOS 27, iPadOS 27, macOS 27, watchOS 27 и visionOS 27 будут работать начиная с iPhone 16 и новее, а также на Pro-версиях iPhone 15, iPad mini с чипом A17 Pro и устройствах iPad и Mac с чипом M1 и новее.

Из часов поддерживаются Apple Watch Series 10+, Ultra 2+, а также SE 3.

Быстрее всего ИИ будет работать на iPhone Air, iPhone 17 Pro и 17 Pro Max, iPad с чипом M4 и Mac с M3 при объёме оперативной памяти не менее 12 ГБ.


Релиз Siri AI запланирован на осень 2026 года и поначалу только на английском языке. В странах ЕС ассистент на iPhone и iPad на старте доступен не будет. В Китае Siri AI также не появится сразу.

Конференция стала последней для Тима Кука в роли генерального директора. 1 сентября он передаёт пост старшему вице-президенту по аппаратной инженерии Джону Тернусу.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
6321🤣15🎉14👍11👏9🔥4🗿2🤩1👌1
Перестаньте романтизировать поиск работы. ИИ нас всех заменит

Никакого «все есть путь» больше не существует, поиск работы теперь - это тупой ИИ-шный конвейер
⁃ Перестаньте внимательно читать вакансии, - бесполезно. их штампуют ИИ и пиарщики, смысла там минимум.
⁃ По 2 часа писать сопроводительные, рекрутер всё равно решит, что это ИИ
⁃ Думать, что рекрутер - лицо компании, он отражает ее культуру, должен разбираться в процессах и продуктах компании, - нет, не должен
⁃ Расстраиваться из-за каждого грубого слова в отказе, - это все тоже типовые шаблонные ответы
⁃ Переписывать 100500 раз одно резюме и переживать о том, что там маленькие показы, просмотры - к моменту, как вас пригласят на интервью, вероятнее всего НИКТО, даже рекрутер не смотрел ваше резюме - вся выборка делается авто-фильтрами!!

Процесс поиска работы сейчас - это четкий алгоритм действий, это машина, это постоянные новые алгоритмы, которые меняются каждую неделю. Самому в этом разобраться почти невозможно, поэтому есть классные продукты, которые вас за ручку проведут в этом процессе

Один из таких продуктов - Карьерная группа - это программа карьерного сопровождения, по которой 94% ИТ и digital специалистов за 3 месяца получают ТОПовые офферы в ИТ в 7 направлениях (product / project management, аналитики, разработчики, С-level позиции: СРО, РМО, СТО, СОО, ССО) от таких компаний как AVITO, Яндекс, Т-банк, OZON с ЗП минимум на 20-30% выше рынка: от 190к на администратора проекта до 1,4 млн руб на Тех. владельца продукта

Тут можно посмотреть:
🔴 разборы резюме для получения супер офферов,
🔴 МОК собесы на разные ИТ роли,
🔴 делятся ежемесячными отчетами по полученным офферам, обычно 30-50 шт в мес 😱

И пройти бесплатную КАРЬЕРНУЮ ДИАГНОСТИКУ, чтобы примерно прикинуть свои шансы на рынке труда: по ЗП, роли, оценить сроки на поиск.

В общем, обязательно подпишитесь.

Реклама. Романова О.Ю. ИНН 645004633301 Erid: 2Vtzqwb7BfE
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣112🤬26🤔227😁6🗿5👍4😢4🔥3🥱3😐2
✔️ CacheLib внезапно обновился

После 2-х лет тишины проект получил свежее обновление. Возвращение продиктовано бумом искусственного интеллекта: из-за скачка мировых цен на память IT-индустрии потребовались новые способы снижения расходов на инфраструктуру.

CacheLib позволяет выносить большие объемы кэша из дорогой оперативки на более доступные и емкие SSD без существенной потери производительности.

Инструмент предоставляет масштабируемый механизм гибридного кэширования, который автоматически и прозрачно распределяет данные между разными уровнями памяти.

Движок отличается крайне низкими накладными расходами благодаря поточномуу API и структурам данных без копирования, требуя минимум места для хранения метаданных.

Еще одна особенность CacheLib - отказоустойчивость: библиотека умеет сохранять свое состояние, предотвращая потерю прогретого кэша при перезапуске приложений.

Хотя официальный чейнджлог со списком изменений разработчики не опубликовали, актуальный релиз уже доступен на GitHub.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍85🔥23👏18💯177
⚡️ Anthropic готовится представить коммерческую версию Mythos

Компания находится в шаге от релиза Claude Fable 5 - публичной адаптации архитектуры Mythos, которая развивается в рамках закрытого проекта Glasswing.

Оригинальная модель Mythos умеет автономно находить уязвимости нулевого дня и выполнять многоступенчатые хакерские атаки. Чтобы безопасно вывести технологию на рынок, Anthropic разделит релиз.

Базовая версия Mythos останется эксклюзивом для государств и профильных партнеров, а Fable 5 станет общедоступным флагманом для разработчиков.

В публичной Fable 5 будут вшиты строгие системные ограничения на сетевое проникновение и эксплуатацию вредоносного кода, при этом она сохранит возможности Mythos (сложную логику, работу со сверхдлинным контекстом и многоэтапное автономное выполнение задач).

Ожидается, что официальный анонс Fable 5 состоится 10 июня на конференции Code with Claude в Токио.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
15844🤔22👍14🤣10🎉85🔥5
🔒Orion soft представил StarGuard AI — платформу для безопасной работы с LLM в корпоративной среде.

Решение позволяет централизованно управлять доступом к большим языковым моделям, включая ChatGPT, Claude, DeepSeek, GigaChat, YandexGPT и локальные LLM, обеспечивая контроль использования ИИ в компании.

По данным независимого исследования К2 Кибербезопасности и «Лаборатории Касперского» только 22% компаний выделили на отдельный бюджет на безопасность ИИ, при этом 61% компаний стремятся контролировать использование сотрудниками сторонних ИИ-сервисов, но испытывают технологические и организационные сложности.


StarGuard AI работает как reverse proxy-шлюз между пользователями, корпоративными системами и языковыми моделями. Платформа анализирует запросы и ответы, выявляет чувствительные данные, jailbreak-атаки, prompt-инъекции и нецелевой контент, а также ведет аудит взаимодействия с ИИ.

Решение поддерживает интеграцию с OpenWebUI, IDE, AI-агентами и корпоративными платформами и ориентировано на крупный бизнес, промышленность, финансовый сектор и государственные организации.
👍30🤔28👏85🤣3🔥2
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI переделает ChatGPT в суперприложение

В ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.

Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.

Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.
ft.com

✔️ Инженер из аппаратного подразделения OpenAI перешёл в Anthropic

Anthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.

В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.

Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.
Clive Chan в сети Х

✔️ TSMC испытывает дефицит производственных мощностей

Google заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.

Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.

Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.
theinformation.com

✔️ Sakana AI займётся алгоритмической эволюцией ИИ

Японский стартап открыл исследовательскую лабораторию рекурсивного самосовершенствования (RSI). Цель - создание сетей, которые итеративно переписывают, тестируют и оптимизируют собственный код.

Компания рассчитывает, что алгоритмическая эволюция позволит отказаться от парадигмы масштабирования вычислений.

В портфеле стартапа уже есть система LLM-Squared, где одни LLM создают алгоритмы обучения для других, и платформа AI Scientist, автоматизирующая научные исследования.

Следующий этап дорожной карты Sakana AI - разработка автономных агентов, способных улучшать свою архитектуру без участия человека.
sakana.ai

✔️ Динамический биллинг лишил 74% бизнеса контроля над ИИ-бюджетами

По данным неопубликованного отчета KPMG, только 26% компаний полностью контролируют свои расходы на ИИ. 50% ведут ограниченный мониторинг, а 22% узнают о затратах постфактум из выставленных счетов. Причина - неготовность финансовых отделов к токенизированному биллингу и динамическому ценообразованию.

Из-за непрогнозируемой нагрузки потребление ресурсов в отдельных проектах возрастает до 6 раз. Это приводит к исчерпанию годовых бюджетов на облачные вычисления и API за несколько месяцев. По итогам текущего квартала ожидается пересмотр расходов после получения бизнесом реальных счетов от ИИ-провайдеров.

Текущую ситуацию сравнивают с закупками облачных мощностей во время пандемии, за которыми последовало сокращение инфраструктурных бюджетов.
wsj.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔5816💔13😐11👍9🤓7🤨6🔥4
⚡️Релиз Claude Fable 5

Бенчмарки выглядят очень солидно, верим ?)

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

Модель уже доступна для пользователей.

https://www.anthropic.com/news/claude-fable-5-mythos-5
6137👍18🏆11🔥5