Код в мешке
249 subscribers
9.1K photos
1.6K videos
2.11K files
42.7K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Могли ли мы не заметить целый мир, существующий параллельно с нашим? #habr
https://habr.com/ru/companies/ruvds/articles/1049182/
Tags: теневая биосфера, жизнь, древо жизни, днк, генетика, рнк, ruvds_статьи_выходного_дня
Author: valisak (RUVDS.com)
Архитектура обмана. Как технически устроены фермы накрутки отзывов в 2026 году? #habr
https://habr.com/ru/articles/1049936/
Tags: антифрод, накрутка отзывов, ботофермы, фейковые отзывы, LLM, антидетект браузеры, графовый анализ, fingerprinting, резидентные прокси, поведенческий анализ
Author: PetrSuh
Forwarded from Чёрный Треугольник (Полина)
☝🏻В DeepSeek добавили зрение

18 июня компания DeepSeek добавила в своё приложение и веб-версию режим работы с изображениями — Vision.🤖

Теперь в чате три режима вместо прежней пары кнопок: быстрый (Fast), экспертный (Expert) и зрение (Vision), заточенный под разбор сложной графики.

☝🏻Интереснее не сам факт, что нейросеть научилась смотреть, а то, как она при этом рассуждает.

В основе лежит подход Thinking with Visual Primitives — «мышление визуальными примитивами», описанный в техническом отчёте команды.

Вместо того чтобы просто описывать картинку словами, модель расставляет на ней точки и рамки и вплетает эти метки прямо в цепочку рассуждения — как человек, который водит пальцем по строчкам при счёте или прокладывает путь в нарисованном лабиринте.

Технически зрение построено поверх модели DeepSeek-V4-Flash. Чтобы изображение не съедало слишком много вычислений, разработчики сжимают служебную память: каждые четыре визуальных токена схлопываются в одну запись.

В итоге на одно изображение уходит заметно меньше ресурсов, чем у обычных мультимодальных моделей, — а это прямой удар по стоимости работы со зрением.

По заявлению авторов, на задачах подсчёта объектов и пространственного рассуждения модель держится на уровне GPT-5.4, Claude Sonnet 4.6 и Gemini 3 Flash.📊

При этом сами разработчики делают оговорку: это узкий срез тестов, подобранный под тему их работы, а не оценка общих способностей.

Веса модели пока не выложены.

В модель вшита цензура, поэтому фото вроде "Протесты на площади Тяньаньмэнь" обрабатывать отказывается.🤷🏼‍♀️
================
👁 News | 👁 Soft | 👁 Gear | 👁 Links
Please open Telegram to view this post
VIEW IN TELEGRAM