Пет-проект
17.2K subscribers
3.02K photos
862 videos
2.69K links
Авторский канал о нейросетях, технологиях и немного интернет-культуре

ссылка на канал: https://t.me/+otYsLXFGVvoxYWVi

Реклама Sway: @nasmoscow
Реклама Spiral: @Spiral_Yuri

Для связи, реклама напрямую: @avemarcuss

РКН: https://rkn.link/S56
Download Telegram
Делаем из любого сайта десктопное приложение — наткнулся на годный репозиторий Pake от китайского разраба

Что делает:
• Уже всем известно, что разрабы не делают нативные приложения для ОС, а собирают на коленке веб-приложения на фреймворке Electron
• Они моментально сжирают ОЗУ на компе, что сильно раздражает
• Рисовому бро это надоело, поэтому он создал Rust + Tauri тулзу, которая делает из любого сайта десктоп-версию, но гораздо легче
• Итоговое приложение будет весить 5-10 мб и работать гораздо быстрее, нежели поделки на Electron
• Поддерживает Windows, macOS и Linux
• На вашем рабочем столе могут появиться ChatGPT, YouTube, Twitter, Spotify, Discord и другие приложения без танцев с бубном

Пошёл конвертировать весь интернет 😏

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍188🔥2😁1🤯1
Европейцы в полном шоке от новых тотальных запретов в интернете. Местные чиновники тоже обещают, что новую систему проверки возраста в ЕС нельзя будет обойти с VPN.

Удачи с блокировкой VPN, еб*ные идиоты


Первый раз, да? 😆

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
42😁26🔥1
Mythos взломал спецслужбы США за пару часов — глава АНБ и Киберкомандования США.

Он проник почти во все наши засекреченные системы – не за недели, а за часы


Похоже, не разблокируют 🫠

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46🤯10
Если человек ежедневно не упирается в лимиты Claude, он не нашёл свое предназначение (С) Марк Аврелий

Пет-проект
😁555🗿1
В Норвегии запретили доступ к генеративному ИИ для детей до 16 лет – власти боятся деградации детишек

Базовые навыки по типу чтения, письма, мышления начали стремительно падать. Поэтому было решено вообще отградить зумеров от клятых нейронок, чтобы заставить их хоть что-то делать самим.

Вайбкодеры, думайте, пожалуйста.

Пет-проект
👍24😁52😢2🔥1
Забейте на гугл, теперь проверяем себя на упоминание в нейронках. Челы собрали сайт, который показывает вашу цитируемость в весах всех самых популярных моделей — ChatGPT, Claude, Gemini.

Челы считают, что баллы в цитируемости напрямую показывают, насколько вы «вложились» в создание AGI. Популярные люди буквально забили индексы, то есть все модельки обучались на них.

Ваш вклад в создание AGI — тут.

Пет-проект
18🗿2
Выдаёт займы даже на парковке.

Пет-проект
😁222👍1🤯1
Steam Machine стоит от 1000 долларов — официальная инфа от Valve. Предзаказы откроют 25 июня, как и GTA 6.

• модель на 512 ГБ — 1049 долларов
• модель на 2 ТБ — 1349 долларов.

По первым тестам, Steam Machine уступает PS5. Настройки графики схожие, ПК от Valve иногда чутка вырывается вперёд за счёт процессора, но редко.

Гейб, давай Half-Life 3

Пет-проект
🔥83🗿2😁1
Нереальная имба: нашел сервис, который в реальном времени показывает «отупление» ИИStupidMeter

Например, за последние сутки Gemini 3.1 Flash Lite просела по качеству генерации на 36% — её в агенты не берём. А вот Kimi и Claude держатся без просадок в топе.

Что по фичам:
• Сортировать можно по категориям: ризонинг, кодинг, агентские фичи и цена
• Все просадки по ответам показываются на графике для каждой нейросетки, которые сейчас есть
• Можно наглядно рассмотреть все сильные и слабые стороны конкретной модели на схеме
• Мне кажется, это лучший сервис, чтобы подбирать нейронки для своих агентов и задач

Пополнил коллекцию любимых сервисов ⌨️

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯104👍4🔥1🗿1
Anthropic сделали новый Mythos — инфу принёс надёжный инсайдер, а другие подтвердили

Пока нет никакой официальной инфы, но можно кое-что предположить:

• Прошло уже 4 месяца с создания первого Mythos — времени на тренировку новой модели было достаточно
• В марте Anthropic прокачали свой дата центр по мощности на 687 NVIDIA H100 — это сразу в два раза мощнее
• Прирост по мощности у модели где-то 30-40%


Что интересно нам: новый Mythos могут вообще не выпустить в паблик, потому что старый всё ещё забанен. Тогда на этом Mythos будет тренировать следующую модель и когда эта линейка всё-таки доберется до нас, мы офигеем.

Пет-проект
115👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Генерируем что угодно прямо в Телеге — подсел на бота OkiGPT, где собрали все апишки в одном месте

Что по фичам:
• Выбор реально огромный: Opus 4.6, Veo 3.1, Nano Banana Pro, Suno, ChatGPT, Kling 3.0 и куча других моделей
• Быстро генерит текст, пикчи, видосы, озвучку и музыку
• Киллер-фича: для удобства есть «Шаблоны», где можно генерировать пикчи/ролики/звук по уже готовым шаблонам
• В подарок дают 10 токенов, можно сгенерировать примерно десяток картинок в Nano Banana
• Стоимость бота минимальная — от 5 до 16 долларов, в зависимости от тарифа

И никуда не надо идти. Всё происходит в аппке Telegram.

Пет-проект
1😁83🔥3🗿3👍2
Чекнул гайд по оптимизации локальных моделей через llama.cpp. Делюсь знаниями 😉

В нём затрагивают прям все аспекты, как выбрать лучшую модель, ускорить запуск или генерацию, а также повысить качество ответов при малых ресурсах ПК. Вытащил все главные финты и кратко описал:

• Включение XMP/EXPO в BIOS: зайдите в настройки BIOS, найдите раздел ОЗУ и активируйте профиль XMP (для Intel) или EXPO (для AMD). Это позволит памяти работать на полной скорости и сильно ускорит модель

• MTP (предсказание нескольких токенов): используйте модели, которые поддерживают MTP (например, Gemma 4), и запустите сервер с флагами:

--spec-draft-model путь_к_доп_модели.gguf

--spec-type draft-mtp

• QAT-квантизация: просто скачайте и используйте готовые QAT-версии моделей (например, Q4 QAT) — они уже специально обучены под сжатие и дают хорошее качество при меньшем размере

• Запуск на Linux: базовая база — это работа на Linux, где можно собирать llama.cpp из исходников — это даст заметный прирост скорости по сравнению с Windows

• tuned-ppd вместо power-profiles-daemon: на Linux установите tuned, включите профиль throughput-performance и перезагрузите систему

• Сборка llama.cpp из оптимизированных исходников: скачайте репозиторий, выполните сборку через cmake с нужными флагами (например, GGML_CUDA=ON) и используйте самую свежую версию

• Режим --fit: добавьте в команду запуска флаги --fit on --fit-target 512 (или больше) — программа сама оптимально распределит части модели между видеокартой и памятью

• Квантизация KV-кэша через флаги -ctk q8_0 -ctv q8_0. Освобождает много видеопамяти для дополнительных слоёв модели с минимальной потерей качества. Добавьте эти флаги при запуске сервера.

• Добавьте флаг --parallel 1: экономия видеопамяти, нужную для хранения истории разговора (особенно полезно для одного пользователя)

• Закрепление на быстрых ядрах (P-cores): даёт +20–30% скорости на процессорах Intel. Запускайте через taskset -c 0-11 (подберите номера ядер под свой CPU)

• Добавьте флаг --flash-attn on: обеспечивает стабильную работу с длинным контекстом

Флаг --no-mmap: убирает внезапные подтормаживания из-за доступа к памяти

• Флаг --mlock: не даёт системе «выталкивать» модель из памяти, предотвращая замедления во время долгой работы

• Перевод монитора на встроенную графику (iGPU): освобождает 500–1000 МБ видеопамяти. Подключите монитор к разъёму на материнской плате.

• Headless-режим: освобождает 200–400 МБ памяти и видеопамяти, убирая графический интерфейс. Выполните sudo systemctl isolate multi-user.target.

• Флаг --n-gpu-layers: позволяет вручную указать, сколько слоёв модели разместить на видеокарте для лучшей скорости

• Флаг --override-tensor: даёт точный контроль над размещением отдельных частей модели на CPU или GPU. Добавьте флаг с правилом, например --override-tensor ".ffn_(up|down|gate)_(ch|)exps=CPU".

• Параметр llama-fit-params: автоматически подбирает оптимальные настройки размещения модели. Запустите llama-fit-params -m ваша_модель.gguf -fitt 512 -fitc 65536

• Флаг --ctx-size: правильно задаёт размер контекста и влияет на использование памяти. Укажите --ctx-size 65536 (или нужное значение).

• Параметры batch-size и ubatch-size: ускоряют обработку промптов и работу с картинками. Добавьте --batch-size 1024 --ubatch-size 512 (для vision — меньше значения)

• Флаг --prio 2: повышает приоритет процесса и уменьшает подтормаживания от других программ

• Флаг --no-warmup: ускоряет запуск сервера

• Параметр GGML_CUDA_GRAPH_OPT: может снизить overhead и ускорить работу (но нужно тестировать). Выполните export GGML_CUDA_GRAPH_OPT=0 (или 1) перед запуском

• Хорошие кванты (UD-Q4_K_XL и подобные): лучше сохраняют качество модели при небольшом размере. Просто скачайте модель с таким квантом.

• Настройки для работы с картинками (vision): позволяют стабильно работать с изображениями на ограниченной видеопамяти. Добавьте --mmproj путь_к_файлу --fit-target 2048 --batch-size 256 --ubatch-size 512


Пользуемся.

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍5🤯3
«Вы абсолютно правы, мне не стоило запускать те ракеты — это полностью моя вина»
😁60👍3😢32🔥1
Интересный момент: Claude упал во всём мире, но продолжает отлично работать во всех американских госструктурах.

В США уже построили суверенный ИИ 😆

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
24😁5😢1🗿1
Мем: Пентагон защищает дата-центры Grok от экологов самым мощным аргументом — Grok помог успешно запустить 2000 ракет по Ирану, поэтому дата-центры должны продолжать работу.

Лица экологов: 😳😳😳

Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁58🤯2