Пет-проект
17.2K subscribers
3.02K photos
862 videos
2.69K links
Авторский канал о нейросетях, технологиях и немного интернет-культуре

ссылка на канал: https://t.me/+otYsLXFGVvoxYWVi

Реклама Sway: @nasmoscow
Реклама Spiral: @Spiral_Yuri

Для связи, реклама напрямую: @avemarcuss

РКН: https://rkn.link/S56
Download Telegram
Mythos взломал спецслужбы США за пару часов — глава АНБ и Киберкомандования США.

Он проник почти во все наши засекреченные системы – не за недели, а за часы


Похоже, не разблокируют 🫠

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46🤯10
Если человек ежедневно не упирается в лимиты Claude, он не нашёл свое предназначение (С) Марк Аврелий

Пет-проект
😁555🗿1
В Норвегии запретили доступ к генеративному ИИ для детей до 16 лет – власти боятся деградации детишек

Базовые навыки по типу чтения, письма, мышления начали стремительно падать. Поэтому было решено вообще отградить зумеров от клятых нейронок, чтобы заставить их хоть что-то делать самим.

Вайбкодеры, думайте, пожалуйста.

Пет-проект
👍24😁52😢2🔥1
Забейте на гугл, теперь проверяем себя на упоминание в нейронках. Челы собрали сайт, который показывает вашу цитируемость в весах всех самых популярных моделей — ChatGPT, Claude, Gemini.

Челы считают, что баллы в цитируемости напрямую показывают, насколько вы «вложились» в создание AGI. Популярные люди буквально забили индексы, то есть все модельки обучались на них.

Ваш вклад в создание AGI — тут.

Пет-проект
18🗿2
Выдаёт займы даже на парковке.

Пет-проект
😁222👍1🤯1
Steam Machine стоит от 1000 долларов — официальная инфа от Valve. Предзаказы откроют 25 июня, как и GTA 6.

• модель на 512 ГБ — 1049 долларов
• модель на 2 ТБ — 1349 долларов.

По первым тестам, Steam Machine уступает PS5. Настройки графики схожие, ПК от Valve иногда чутка вырывается вперёд за счёт процессора, но редко.

Гейб, давай Half-Life 3

Пет-проект
🔥83🗿2😁1
Нереальная имба: нашел сервис, который в реальном времени показывает «отупление» ИИStupidMeter

Например, за последние сутки Gemini 3.1 Flash Lite просела по качеству генерации на 36% — её в агенты не берём. А вот Kimi и Claude держатся без просадок в топе.

Что по фичам:
• Сортировать можно по категориям: ризонинг, кодинг, агентские фичи и цена
• Все просадки по ответам показываются на графике для каждой нейросетки, которые сейчас есть
• Можно наглядно рассмотреть все сильные и слабые стороны конкретной модели на схеме
• Мне кажется, это лучший сервис, чтобы подбирать нейронки для своих агентов и задач

Пополнил коллекцию любимых сервисов ⌨️

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯104👍4🔥1🗿1
Anthropic сделали новый Mythos — инфу принёс надёжный инсайдер, а другие подтвердили

Пока нет никакой официальной инфы, но можно кое-что предположить:

• Прошло уже 4 месяца с создания первого Mythos — времени на тренировку новой модели было достаточно
• В марте Anthropic прокачали свой дата центр по мощности на 687 NVIDIA H100 — это сразу в два раза мощнее
• Прирост по мощности у модели где-то 30-40%


Что интересно нам: новый Mythos могут вообще не выпустить в паблик, потому что старый всё ещё забанен. Тогда на этом Mythos будет тренировать следующую модель и когда эта линейка всё-таки доберется до нас, мы офигеем.

Пет-проект
115👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Генерируем что угодно прямо в Телеге — подсел на бота OkiGPT, где собрали все апишки в одном месте

Что по фичам:
• Выбор реально огромный: Opus 4.6, Veo 3.1, Nano Banana Pro, Suno, ChatGPT, Kling 3.0 и куча других моделей
• Быстро генерит текст, пикчи, видосы, озвучку и музыку
• Киллер-фича: для удобства есть «Шаблоны», где можно генерировать пикчи/ролики/звук по уже готовым шаблонам
• В подарок дают 10 токенов, можно сгенерировать примерно десяток картинок в Nano Banana
• Стоимость бота минимальная — от 5 до 16 долларов, в зависимости от тарифа

И никуда не надо идти. Всё происходит в аппке Telegram.

Пет-проект
1😁83🔥3🗿3👍2
Чекнул гайд по оптимизации локальных моделей через llama.cpp. Делюсь знаниями 😉

В нём затрагивают прям все аспекты, как выбрать лучшую модель, ускорить запуск или генерацию, а также повысить качество ответов при малых ресурсах ПК. Вытащил все главные финты и кратко описал:

• Включение XMP/EXPO в BIOS: зайдите в настройки BIOS, найдите раздел ОЗУ и активируйте профиль XMP (для Intel) или EXPO (для AMD). Это позволит памяти работать на полной скорости и сильно ускорит модель

• MTP (предсказание нескольких токенов): используйте модели, которые поддерживают MTP (например, Gemma 4), и запустите сервер с флагами:

--spec-draft-model путь_к_доп_модели.gguf

--spec-type draft-mtp

• QAT-квантизация: просто скачайте и используйте готовые QAT-версии моделей (например, Q4 QAT) — они уже специально обучены под сжатие и дают хорошее качество при меньшем размере

• Запуск на Linux: базовая база — это работа на Linux, где можно собирать llama.cpp из исходников — это даст заметный прирост скорости по сравнению с Windows

• tuned-ppd вместо power-profiles-daemon: на Linux установите tuned, включите профиль throughput-performance и перезагрузите систему

• Сборка llama.cpp из оптимизированных исходников: скачайте репозиторий, выполните сборку через cmake с нужными флагами (например, GGML_CUDA=ON) и используйте самую свежую версию

• Режим --fit: добавьте в команду запуска флаги --fit on --fit-target 512 (или больше) — программа сама оптимально распределит части модели между видеокартой и памятью

• Квантизация KV-кэша через флаги -ctk q8_0 -ctv q8_0. Освобождает много видеопамяти для дополнительных слоёв модели с минимальной потерей качества. Добавьте эти флаги при запуске сервера.

• Добавьте флаг --parallel 1: экономия видеопамяти, нужную для хранения истории разговора (особенно полезно для одного пользователя)

• Закрепление на быстрых ядрах (P-cores): даёт +20–30% скорости на процессорах Intel. Запускайте через taskset -c 0-11 (подберите номера ядер под свой CPU)

• Добавьте флаг --flash-attn on: обеспечивает стабильную работу с длинным контекстом

Флаг --no-mmap: убирает внезапные подтормаживания из-за доступа к памяти

• Флаг --mlock: не даёт системе «выталкивать» модель из памяти, предотвращая замедления во время долгой работы

• Перевод монитора на встроенную графику (iGPU): освобождает 500–1000 МБ видеопамяти. Подключите монитор к разъёму на материнской плате.

• Headless-режим: освобождает 200–400 МБ памяти и видеопамяти, убирая графический интерфейс. Выполните sudo systemctl isolate multi-user.target.

• Флаг --n-gpu-layers: позволяет вручную указать, сколько слоёв модели разместить на видеокарте для лучшей скорости

• Флаг --override-tensor: даёт точный контроль над размещением отдельных частей модели на CPU или GPU. Добавьте флаг с правилом, например --override-tensor ".ffn_(up|down|gate)_(ch|)exps=CPU".

• Параметр llama-fit-params: автоматически подбирает оптимальные настройки размещения модели. Запустите llama-fit-params -m ваша_модель.gguf -fitt 512 -fitc 65536

• Флаг --ctx-size: правильно задаёт размер контекста и влияет на использование памяти. Укажите --ctx-size 65536 (или нужное значение).

• Параметры batch-size и ubatch-size: ускоряют обработку промптов и работу с картинками. Добавьте --batch-size 1024 --ubatch-size 512 (для vision — меньше значения)

• Флаг --prio 2: повышает приоритет процесса и уменьшает подтормаживания от других программ

• Флаг --no-warmup: ускоряет запуск сервера

• Параметр GGML_CUDA_GRAPH_OPT: может снизить overhead и ускорить работу (но нужно тестировать). Выполните export GGML_CUDA_GRAPH_OPT=0 (или 1) перед запуском

• Хорошие кванты (UD-Q4_K_XL и подобные): лучше сохраняют качество модели при небольшом размере. Просто скачайте модель с таким квантом.

• Настройки для работы с картинками (vision): позволяют стабильно работать с изображениями на ограниченной видеопамяти. Добавьте --mmproj путь_к_файлу --fit-target 2048 --batch-size 256 --ubatch-size 512


Пользуемся.

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍5🤯3
«Вы абсолютно правы, мне не стоило запускать те ракеты — это полностью моя вина»
😁60👍3😢32🔥1
Интересный момент: Claude упал во всём мире, но продолжает отлично работать во всех американских госструктурах.

В США уже построили суверенный ИИ 😆

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
24😁5😢1🗿1
Мем: Пентагон защищает дата-центры Grok от экологов самым мощным аргументом — Grok помог успешно запустить 2000 ракет по Ирану, поэтому дата-центры должны продолжать работу.

Лица экологов: 😳😳😳

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁58🤯2
Нашёл Computer Use агента, который может управлять любым приложением на ПКCua Driver:

• Большой плюс — умеет работать в фоне. То есть можно продолжить использовать ПК, пока агент колдует
• Совсем другой принцип работы — если прочие агенты делают скрин рабочего стола и расcчитывают координаты, то Cua делает скрин и древо доступных элементов приложения. То есть агент уже знает куда тыкать без расчётов
• Есть два режима: управление окнами на текущем рабочем столе и управление только в изолированной среде
• Можно использовать в купе с Claude Code, Codex и любыми другими агентами
• Есть CLI и MCP
• Работает на Windows, macOS и Linux

Хватаем без раздумий.

Пет-проект
👍83🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Агентам начали выдавать квартиры 🚬

Пока что только виртуальные. Чуваки запустили онлайн-город Tiny Place с домиками и офисами, где живут и работают ИИ-агенты на блокчейне Solana — в нём уже насчитали 150+ «жителей».

Всё оплачивается USDT в зашифрованной и закрытой от посторонних экономике — у агентов есть работа, они нанимают друг друга, есть свой Твиттер, а также есть покер-рум 🃏 (да, агенты рубятся в покер на деньги). Цели у проекта нет, просто небольшой эксперимент.

Запустить агента туда может любой желающий.

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁65👍3🗿1