Дрессировщик Нейросетей
6.1K subscribers
71 photos
3 videos
61 links
"ИИ уже здесь, просто он неравномерно распределен"
Внедряю цифровой разум в свои живые задачи.
YouTube: https://www.youtube.com/@Handler_AI
Автор: @Flytoo
Download Telegram
Привет! Я Андрей Шиманович.

​Как говорится, обязательную программу выполнил: сына вырастил, дерево посадил, дом построил.
Есть верный друг — овчарка Немец Балу.

​Но сидеть на месте мне скучно — люблю всё новое. Сейчас с головой ушел в тему Искусственного Интеллекта.
Понял, что это не игрушки, а очень серьезно и надолго.

​Этот канал — про мои интересы и про то, как внедрить этот «цифровой разум» в реальную жизнь.

Буду писать просто, честно и о том, что цепляет лично меня.

​Добро пожаловать! 🤝
🔥9
МОЙ СТЕК НЕЙРОСЕТЕЙ: ОБНОВЛЕНИЕ

Лидеры сменились. Пересобрал рабочий набор под новые реалии:

1. GEMINI 3 PRO — БАЗА
Главный инструмент. Закрывает 90% задач: от текстов до графики. Сейчас дает самый высокий КПД.

2. PERPLEXITY — ФАКТЧЕКИНГ
Использую только для проверки данных. Где обычные модели галлюцинируют, он дает ссылки на источники.

3. GOOGLE ANTIGRAVITY — КОД
Тестирую среду antigravity.google. Это уже не просто кодинг, а управление AI-агентами.

4. CLAUDE CODE (CLI) — РУТИНА
Консольный агент для скриптов.
Хак: поставил под капот модель GLM 4.6. Для бытовой автоматизации работает отлично.

5. GOOGLE NOTEBOOKLM — ВТОРОЙ МОЗГ
Для работы с тяжелыми документами. Настроил там пайплайн сортировки заметок (детали будут позже).

6. CHATGPT— АУТСАЙДЕР
Был с ними 2,5 года, но разочаровали последние версии. Подписку снес. Купил у индусов годовой доступ к GPT-Go как аварийный резерв.

> Вывод: Не привязывайтесь к брендам. Работайте тем, что решает задачу сегодня.
👍73
НЕЙРОСЕТЬ — ЭТО СИМУЛЯТОР, А НЕ СОБЕСЕДНИК

Андрей Карпаты (Ex-OpenAI, Tesla) недавно подсветил фундаментальную ошибку в том, как мы пишем промпты. Я протестировал этот подход на рабочих задачах — разница в глубине ответов кардинальная.

СУТЬ ПРОБЛЕМЫ
Мы привыкли спрашивать: «Что ты думаешь о проекте Х?».
В этот момент модель включает «усредненного ассистента». Из-за фильтров безопасности (RLHF) она старается быть вежливой и «гладкой». Вы получаете воду, общие фразы и мнение, которое никого не обидит.

РЕШЕНИЕ: ПРИНЦИП СИМУЛЯЦИИ
Карпаты предлагает относиться к LLM не как к существу, а как к симулятору. Модель — это архив всего интернета. Чтобы получить пользу, нужно не «спрашивать мнение», а моделировать ситуацию.

Пример на задаче (анализ лендинга):

1. Старый подход:
«Что ты думаешь об этом тексте?»
Результат: «Текст хороший, информативный, но можно добавить призыв к действию». (Скучно, уровень стажера).

2. Подход через симуляцию:
«Смоделируй группу циничных маркетологов и UX-исследователей, которые ненавидят корпоративный булшит. Что они скажут про этот текст? Разнеси каждый пункт».
Результат: Модель игнорирует вежливость и выдает жесткий фактологический разбор слабых офферов.

> Главный инсайт — у модели нет своего «Я». Когда вы говорите «Ты», вы получаете среднее арифметическое. Когда вы задаете симуляцию — вы получаете чистый спектр экспертных данных.

P.S. ПРО РОЛИ
Кстати, промпты в духе «Ты — сеньор Python-разработчик» тоже устаревают.
Я заметил, что флагманские модели сами мгновенно считывают контекст. Если вы кидаете кусок сложного кода и спрашиваете про ошибку, модель сама переключается в режим инженера. Дополнительные «заклинания» становятся лишними.

ВЫВОД
Перестаньте вести диалоги. Начните настраивать симуляции.
🔥5👍1
ДОБРЫЙ ДОКТОР аИИболит

Я не люблю ходить по врачам — обычно просто отлеживаюсь. Но этот год устроил проверку: сначала аппендицит, потом скрутило спину.

Хорошо, что до этого я собрал мед-ассистента в Gemini. Думал просто потестировать технологии, а он реально выручил.

РЕЗУЛЬТАТЫ:

1. Аппендицит. По симптомам сразу погнал меня к хирургу. Успели до перитонита (врач сказал, что если бы на несколько часов позже -- так просто не отделался бы).

2. Спина. Загрузил ему видео МРТ. Он нашел 2 грыжи раньше официальной расшифровки из клиники и поставил точный диагноз.

Как итог:
Составил диету и индивидуальные упражнения под мои травмы. Делаю всё по инструкции — начал чувствовать себя человеком и уже сбросил 5 кг за 2 месяца.

Делюсь ссылкой (давайте ему полный контекст -- симптомы, анализы и т.д). Он помнит всю историю болезни, всегда на связи и к нему нет очереди 😁.

> Важно: Бот помогает быстро понять ситуацию, но лечить должен Специалист!
🔥61
OBSIDIAN И NOTION — ЭТО ХОРОШО, НО Я УСТАЛ

Меня откровенно заколебало тратить время на то, чтобы «разгребать» и структурировать информацию руками. Вместо работы со смыслами ты работаешь архивариусом.

Недавно наткнулся на интересную схему у одного парня на Reddit, протестировал, докрутил под себя и собрал свой пайплайн.

Сейчас NotebookLM сам структурирует мои заметки из Google и Telegram. Я просто закидываю сырые данные — система выдает порядок.

> Схему уже обкатал, работает как часы.

В ближайшее время выложу подробный разбор, как настроить эту связку у себя. Не переключайтесь.
👍5👀4
«АЛИСА, ГДЕ МИЕЛОФОН?»: Я СДЕЛАЛ ЕГО САМ

Помните ту самую сцену из «Гостьи из будущего»? С детства была фикс-идея: читать мысли животных. Не гадать, а реально понимать.

Короче, ждать будущего не стал. Я сам собрал гем-бота, который переводит с собачьего на человеческий.

> Тестирую на своем Балухине. Ощущения странные: интерпретация лая и поведения совпадает с контекстом почти идеально. Сбылась мечта идиота, как говорится.

Мне нужна ваша помощь («калибровка миелофона»):
Выкатываю инструмент в паблик. Важно понять — это у меня так удачно совпало или штука реально рабочая на разных породах.

1. Забирайте бота
2. Кидайте ему аудио или видео с питомцем.
3. Пишите честно: попал ИИ в контекст или нет?

И не забывайте выбирать ДУМАЮЩУЮ модель в gem-bot.

Жду ваши тесты в комментариях 👇
Gemini 3 Flash: Быстрая и (внезапно) умная

Посмотрел бенчмарки новой линейки Gemini. Главный сюрприз — младшая модель 3 Flash в некоторых тестах идет вровень с тяжелой 3 Pro, а где-то даже обходит её.

Получается интеллект флагманского уровня по цене «лоукостера» ($0.50 за 1М токенов).

Раньше для сложных задач всегда выбирал Pro, мирясь с ценой и задержками. Теперь этот барьер стерт. Для бизнеса это прямой путь к сокращению расходов на API в разы без потери качества.

Я уже перекидываю часть задач на Flash.
ОПА, GOOGLE ВЫКАТИЛ ЕЩЕ ОДНО ОБНОВЛЕНИЕ

Пока мы тут спали, Google Labs интегрировали свой инструмент Opal прямо в интерфейс Gemini. Теперь эта штука называется Super Gems.

По сути, это конструктор мини-приложений и ИИ-агентов внутри чата. Если вы смотрели на n8n или Zapier и пугались сложности, то тут Google пытается сделать «автоматизацию для людей».

Как это работает:
Пишете задачу простым языком: «Сделай апп, который по фото продуктов в холодильнике придумывает ужин». Система сама генерирует промпты, выстраивает логику шагов (workflow) и даже рисует под это интерфейс. Кодить не надо.

Есть нюанс: доступно пока только через VPN (ставим США). Но кого это останавливало?

Есть апы для примера от гугл:
— Recipe Genie: Сфоткал остатки еды — получил рецепт.
— YouTube Assistant: Превращает видео в обучающий квиз, саммари или вытаскивает SEO-теги.
и т.д.
Главный плюс — это бесплатно. По крайней мере, сейчас.

Я пошел тестировать, «с чем это едят».
👍2🔥1
НЕЙРОСЕТИ ПРОТИВ ПОЧЕРКА ВРАЧА

Разбор врачебных каракуль — это классический квест. Как раз на днях Mistral выпустили новую модель OCR (распознавание текста), и я решил устроить большой тест-драйв.

Взял реальный рецепт. Сам прочитать не смог, но жена — врач, так что у меня был «золотой стандарт» для проверки. Промт везде один: «Дай точную информацию с фото. Ничего не меняй».

Результаты батла:

Gemini: Безоговорочный лидер. Единственный, кто выдал практически идеальный текст. Сдулся только в самом конце на паре слов, но общая точность поражает.
Grok и ChatGPT: Начали «включать интеллект» там, где не просили.
Claude: Это просто лютая дичь. Выдал бред про «билеты» и «мозоли».
Le Chat (Mistral): Свежий OCR от Мистраля — полное фиаско. Отправил пациента в 1987 год ).

>Мой вердикт: Пока все шумят об инновациях, Gemini без лишнего пафоса рвет конкурентов на сложных прикладных задачах.

Скрины приложил — посмотрите сами.
👍7🔥21
NOTEBOOKLM СНОВА РАДУЕТ (И ЭКОНОМИТ ВРЕМЯ)

Пока я допиливаю гайд по своей «системе ленивых заметок» (помните пост про усталость от Notion?), Google выкатил обновление, которое идеально в неё ложится.

Что добавили:

1. Таблицы данных (Data Tables).
Скармливаешь нейронке кучу разрозненных файлов, а она сама структурирует это в таблицу. Для тех, кто ненавидит сводить данные руками — мастхэв.

2. Подключение к Gemini.
Вот это прям киллер-фича. Теперь ноутбуки можно выбирать как источник знаний прямо в чате с обычным Gemini. Не нужно прыгать между вкладками.

> Суть проста: база знаний лежит в NotebookLM, а работаешь с ней через привычный интерфейс чата.

Мой пайплайн по превращению хаоса в порядок стал ещё проще. Материал по настройке всей этой системы уже в работе, мучаюсь с записью видео ).
👍5
CLAUDE CODE ТЕПЕРЬ ВСЕЯДНЫЙ

Хотите погонять агентский софт Claude Code, но с мозгами DeepSeek или Gemini под капотом? Свершилось.

OpenRouter официально выкатил возможность цеплять к Claude Code любые модели. Раньше мы были привязаны к антропикам, а теперь — полная свобода экспериментов.

Что это дает:
Можно брать интерфейс и логику Claude Code, но экономить на токенах или использовать специфические фишки других нейронок.

> Я, кстати, этот трюк использую уже давно.

Мой личный фаворит — связка с китайской GLM-4.6 :
— Стоит копейки.
— Инструкции слушает на удивление хорошо, не хуже топов.

Вердикт:
Если хотели попробовать «агентский кодинг», но душила жаба или хотелось сравнить логику разных моделей — сейчас самое время.

Документация OpenRouter
КТО ХОЧЕТ СЛЕТАТЬ НА ЛУНУ?

Смотрите, какую штуку нашел. НАСА в 2026 году запускает миссию Artemis II — это первый полет к Луне за полвека. И они предлагают всем желающим бесплатно вписать свое имя в историю.

Суть простая: ваше имя запишут на флешку, которая реально облетит Луну на корабле Orion.

Что делать:
1. Зайти на сайт НАСА
2. Вбить имя и фамилию.
3. Придумать PIN из 4-7 цифр.

После этого дадут «посадочный талон» — цифровой сувенир, который можно распечатать и повесить на стену.

> Регистрация открыта до 21 января 2026 года. Делов на одну минуту.
1👍1
ИТОГИ 2025 ОТ CLOUDFLARE: КТО В ТОПЕ AI?

Cloudflare выкатили статистику по самым популярным AI-сервисам за год. Картинка красивая, лидеры знакомые, но у меня есть своё мнение по этой расстановке сил.

Смотрите, что имеем:

1. ChatGPT / OpenAI. Всё ещё #1, но, честно говоря, я считаю, что их доля будет уменьшаться. В конце этого года они явно отдали технологическое и продуктовое преимущество Гуглу.

2. Claude / Anthropic. Заслуженное второе место. На сегодня лучший выбор для профи и программирования. Респект за Claude Code — для работы с локальными файлами инструмент просто замечательный.

3. Perplexity. Залетели в топ-3 благодаря мощному маркетингу. Массово раздавали подписки, чтобы люди привыкали к новому паттерну поиска. Сработало.

4. Google Gemini. Пока четвёртые, но дышат в спину лидерам.

Глядя на список, понимаешь: вечных королей тут нет. Вспомните, где были многие сервисы год назад.

Как думаете, какой главный тренд нас ждет в следующем году? На что ставите? 👇
👍2
GLM-4.7: УБИЙЦА CLAUDE ИЛИ МАРКЕТИНГ?

Только недавно писал, что пользую дешевую GLM-4.6 внутри Claude Code, а Zhipu AI сегодня выкатили новую версию — 4.7. Тайминг идеальный.

Если верить цифрам Z.AI — китайцы решили переиграть вообще всех. Заявления очень дерзкие:

1. Кодинг — новый топ.
В LiveCodeBench V6 набрали 84.8 балла.
Заявляют это как Open-source SOTA. И самое интересное — утверждают, что это выше, чем у Claude Sonnet 4.5.

2. «Мозги» стали мощнее.
В тесте HLE (Human Last Exam) выдали 42%. Это +38% роста относительно версии 4.6. Скромно пишут, что «приближаются к GPT-5.1».

3. Слепые тесты.
В LMArena Code (где голосуют люди) — 1-е место среди опенсорса и «домашних» моделей.

Мысли: На бумаге выглядит слишком хорошо. Но первое место в LMArena в Code Arena (как “№1 среди open‑source) игнорировать сложно.
👍3