Perplexity хочет купить Chrome за 34.5 миллиардов долларов 😏 😏 😏
Perplexity говорит, что у них есть инвесторы, готовые полностью профинансировать покупку, обещает сохранить Chromium открытым, вложить $3 млрд за 2 года и не менять дефолтный поисковик в Chrome. Google пока без комментариев.
Ну комет у них вышел вроде неплохой. Даже в текущем виде мне нравится.
WSJ: тык
Perplexity говорит, что у них есть инвесторы, готовые полностью профинансировать покупку, обещает сохранить Chromium открытым, вложить $3 млрд за 2 года и не менять дефолтный поисковик в Chrome. Google пока без комментариев.
Ну комет у них вышел вроде неплохой. Даже в текущем виде мне нравится.
WSJ: тык
Please open Telegram to view this post
VIEW IN TELEGRAM
The Wall Street Journal
Exclusive | Perplexity Makes Longshot $34.5 Billion Offer for Chrome
In mounting an unsolicited bid for Google’s browser, the AI startup seeks to take advantage of uncertainty over a pending antitrust ruling.
Bitnami ВСЁ !!!
С 28 августа битнами переносит часть своих образов в
Теперь будь любезен подписаться НА ОБРАЗЫ OPEN SOURCE ПРОЕКТОВ БЛЯТЬ за 6к баксов в месяц или 72к в год.
Вот воистину мы все дальше от Бога.
Справедливости ради, я всегда не любил битнами и их злоебучие чарты.
Туда им и дорога, в целом.
https://github.com/bitnami/charts/issues/35164
С 28 августа битнами переносит часть своих образов в
docker.io/bitnamilegacy без поддержки и обновления. Теперь будь любезен подписаться НА ОБРАЗЫ OPEN SOURCE ПРОЕКТОВ БЛЯТЬ за 6к баксов в месяц или 72к в год.
Вот воистину мы все дальше от Бога.
Справедливости ради, я всегда не любил битнами и их злоебучие чарты.
Туда им и дорога, в целом.
https://github.com/bitnami/charts/issues/35164
KServe 0.17 — готовят апгрейд под LLM 🚨
— Новый CRD LLMInferenceService для генеративных нагрузок
— Disaggregated serving: разделение prefill/decoder и многоузловые топологии
— Встроенный model cache и KV-cache (в т.ч. offloading через LMCache)
— Более плотная интеграция с Envoy AI Gateway
Официальный анонс — 10 ноября на CNCF co-located. Ждём релиз-ноутсы и тег на GitHub
— Новый CRD LLMInferenceService для генеративных нагрузок
— Disaggregated serving: разделение prefill/decoder и многоузловые топологии
— Встроенный model cache и KV-cache (в т.ч. offloading через LMCache)
— Более плотная интеграция с Envoy AI Gateway
Официальный анонс — 10 ноября на CNCF co-located. Ждём релиз-ноутсы и тег на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Sched
CNCF-hosted Co-located Events North America 2025: KServe Next: Advancing Generative AI Mod...
View more about this event at CNCF-hosted Co-located Events North America 2025
Please open Telegram to view this post
VIEW IN TELEGRAM
Други, кто планирует на DevOops 2025 в Питер 16-17 сентября?
Заходите, мы с Марком рассказываем о том, как мы строили нашу RAG платформу в банке🚨 🚨 🚨
https://devoops.ru/talks/890fba9d437542dabbe073810a607019/
Заходите, мы с Марком рассказываем о том, как мы строили нашу RAG платформу в банке
https://devoops.ru/talks/890fba9d437542dabbe073810a607019/
Please open Telegram to view this post
VIEW IN TELEGRAM
DevOops 2025. Конференция по инженерным решениям и DevOps-культуре
От RAG для операторов до RAG-платформы для крупного банка | Доклад на DevOops 2025
Что такое RAG и чем отличается от дообучения. Архитектура нашего решения и гипотезы.
Люди реально уже сдурели.
Claude Code деградировал в качестве - народ орёт.
Warp терминал выпускает кого бы вы думали? Правильно Warp Code - очередного агента прямо из терминала.
Там красивые цифры очередные.
Топ 3 в SWE-Bench Verified
Топ 1 в Terminal Bench
Короче я хз кому это все надо…
Анонс тут
Claude Code деградировал в качестве - народ орёт.
Warp терминал выпускает кого бы вы думали? Правильно Warp Code - очередного агента прямо из терминала.
Там красивые цифры очередные.
Топ 3 в SWE-Bench Verified
Топ 1 в Terminal Bench
Короче я хз кому это все надо…
Анонс тут
Warp
Introducing Warp Code: the fastest way from Prompt to Production
Features for shipping agent-generated code all the way from prompt to production. Code review, lightweight file editor, WARP.md— all with a top-rated coding agent.
https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d
На опенроутере уже есть.
Qwen: Qwen3 Next 80B A3B Instruct
$0.30 за 1M инпут, $0.30 за 1M аутпут
Qwen: Qwen3 Next 80B A3B Thinking
$0.50 за 1M инпут , $6.00 за 1M аутпут
На опенроутере уже есть.
Qwen: Qwen3 Next 80B A3B Instruct
$0.30 за 1M инпут, $0.30 за 1M аутпут
Qwen: Qwen3 Next 80B A3B Thinking
$0.50 за 1M инпут , $6.00 за 1M аутпут
huggingface.co
Qwen3-Next - a Qwen Collection
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15 7
The Engineer's Sanctuary
Дали доступ к Comet - браузеру от перплексити. Начал использовать. Выглядит обнадеживающе и оно, кажется, реально работает. Сам бегает по вкладкам, сам нажимает кнопки, чет скроллит. Если вас не пугает, конечно, сбор инфы (меня нет)
Нужны кому-то инвайты в Comet? Есть 3 штуки. Пишите в сообщения канала или в личку.
❤1
Други подруги, завтра у коллег из Selectel пройдет их флагманская конференция Selectel Tech Day, куда меня пригласили выступить в коротком TED Talk формате — 10-минутная презентация в треке "ML без спецэффектов". Расскажу о том, как мы внедрили RAG на 12 тысяч операторов контакт-центра и о том, какой профит получил банк от этого решения.
Конференция доступна онлайн и бесплатно. Залетайте!
Конференция доступна онлайн и бесплатно. Залетайте!
techday.selectel.ru
Selectel Tech Day 2025
Флагманская конференция об IT-инфраструктуре для бизнеса!
The Engineer's Sanctuary
Други подруги, завтра у коллег из Selectel пройдет их флагманская конференция Selectel Tech Day, куда меня пригласили выступить в коротком TED Talk формате — 10-минутная презентация в треке "ML без спецэффектов". Расскажу о том, как мы внедрили RAG на 12 тысяч…
Кому интересно - моё вчерашнее выступление на Selectel Tech Day. Ссылка уже с таймкодом:
https://www.youtube.com/live/p_7X0wUr9FU?si=KQDoZU3iVuTkBsGs&t=1335
https://www.youtube.com/live/p_7X0wUr9FU?si=KQDoZU3iVuTkBsGs&t=1335
Youtube
- YouTube
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
❤7 6
У меня возникла проблема ультрафиолетовой расходимости 😢
Кто-то сталкивался?
Кто-то сталкивался?
Please open Telegram to view this post
VIEW IN TELEGRAM
Челы из vLLM в 0.11 походу добавили прикольную фичу, чтобы переключаться нагорячку между моделями - sleep mode.
Поднимаем модель, юзаем, отправляем спать. Поднимаем вторую.
Уровней сна два:
Level 1: веса в оперативку, взлетают мгновенно, но RAM ест как не в себя
Level 2: веса полностью выгружаются, памяти ест минимально, поднимается чуть дольше.
Итог: переключения ускорились в 18–200 раз (!), инференс после пробуждения — до 88% быстрее за счёт сохранённой памяти процессов, CUDA-графов и JIT-компиляции.
https://blog.vllm.ai/2025/10/26/sleep-mode.html
Поднимаем модель, юзаем, отправляем спать. Поднимаем вторую.
Уровней сна два:
Level 1: веса в оперативку, взлетают мгновенно, но RAM ест как не в себя
Level 2: веса полностью выгружаются, памяти ест минимально, поднимается чуть дольше.
Итог: переключения ускорились в 18–200 раз (!), инференс после пробуждения — до 88% быстрее за счёт сохранённой памяти процессов, CUDA-графов и JIT-компиляции.
https://blog.vllm.ai/2025/10/26/sleep-mode.html
vLLM Blog
Zero-Reload Model Switching with vLLM Sleep Mode
Introduction
❤4
Media is too big
VIEW IN TELEGRAM
Midjourney Hailuo 2.0 (99% of shots) Kling (opening shot) Adobe Firefly Magnific Enhancor Elevenlabs
Кортезы топ