Aimasters.Me ◽️
4.87K subscribers
389 photos
39 videos
3 files
179 links
Нейронки доступным языком, все секреты тут https://aimasters.me/

контакт @shimaoz
Download Telegram
Media is too big
VIEW IN TELEGRAM
Одна из лучших работ в ИИ-видео за год, называется «Первые люди». Сделано не в дорогущей Sora, а в Hailuo.

Представляю, сколько нас ждет документалок про древние цивилизации, войны и культуры.
🔥12👍5
Media is too big
VIEW IN TELEGRAM
google выкатил gemini 2.0, и это просто космос!

теперь помощник не только чатится — он видит ваш экран и реально помогает в работе (а может видеть все, что вы транслируете с веб камеры)

пример на видео: я спрашиваю, какие параметры настроить в Midjourney, чтобы фото выглядело фотореалистичным
он смотрит, что происходит, и прямо в процессе подсказывает. Wow!

excel, meta business suite, photoshop, сложные интерфейсы — всё теперь проще. не нужно рыться в гайдах или смотреть ютюбчик. просто открываете сервис, спрашиваете, куда тыкать, и он ведет вас за ручку

google обещает, что скоро помощник прямо в браузере всё будет делать за вас, но это скоро... а сейчас он выступает в роли терпеливого учителя.

хотите проверить? идем на aistudio.google.com и тестируем (не забывайте про VPN)

восторг, что тут скажешь

ps: сорри фор май морнинг инглиш (русский не понимает)

@aimastersme
🔥15👍74
clio — google trends для llm

помните google trends? штука, где можно посмотреть, о чем сейчас спрашивают люди в разных странах и городах

так вот, anthropic придумали что-то похожее, но для своей языковой модели claude. их clio анализирует запросы пользователей, группирует их по темам и показывает, что сейчас обсуждают в реальном мире.

- разработка — больше 20% пользователей используют claude для разработки веб- и мобильных приложений (10.4%), продвинутых AI/ML-проектов (6.0%) и DevOps (3.9%)
вот вам реальное доказательство, кто в мире ИИ самый продвинутый кодер.


- создание контента и коммуникации — 9.2% запросов связаны с написанием текстов и организацией общения

- образование — 14.3% охватывают академические исследования (7.2%) и карьерное развитие (7.1%)

- бизнес — почти 6% посвящены стратегиям и операционной работе

- маркетинг и seo — 3.7% фокусируются на продвижении в digital

clio помогает увидеть, где и как llm применяются на практике, а не просто ради забавы.

всё это выглядит как шаг к лучшему пониманию того, что на самом деле нужно пользователям.

anthropic обещают максимальную приватность (на картинке выше о том, как они это делают)

оч хочется попробовать clio вживую. подробности у anthropic, но идея уже выглядит круто

ps: кстати, создать свое приложение совсем не сложно. почитайте вот этот пост: как писать аппки даже если у тебя лапки

@aimastersme
6🔥3👍2
GPT вышел на плато развития

Илья Суцкивер, сооснователь и бывший главный научный сотрудник Openai, подтвердил: масштабирование больших языковых моделей на этапе предобучения (pre-training), достигло своего предела

Илья был первым, кто прогнозировал бесконечное развитие интеллекта через обучение на бесконечной дате. и вот, наконец, даже он признал


мощности растут, но реальных данных не хватает (мы скормили все, что человечество нагенерило в интернетах за всю свою историю). синтетические данные, которые генерируют другие LLM, существенного прироста не дают

так что, не видать нам AGI и суперинтеллект?

похоже, что экстенсивный рос закончен. дальше интенсификация

примерно то же, что с человеческим мозгом. когда-то он перестал расти в объёме, но мышление продолжило развиваться. теперь прогресс будет идти за счёт агентных систем

не тупо модели, которые лежат без дела и никого не трогают, пока их не спросят, а самостоятельные агенты с задачами и мотивацией. они смогут вызывать функции, принимать решения, действовать автономно

основные направления:
- обучение последовательностям и причинно-следственным связям
- агентное поведение
- развитие самосознания

примерно как айфон. железо уже давно не становится революционно мощнее, но приложения продолжают радовать новыми фишками

2025 год станет годом агентов. с чем нас всех поздравляю

@aimastersme
👍10🔥3
MurkDown v0.1

Собрал простенькое приложение, которое конвертирует основные офисные файлы в MarkDown формат, что очень любят LLMs

Где это может пригодится:
- У вас сложная excel таблица с текстом и цифрами на нескольких листах, которою отказыается нормально читать chatGPT
- PDF файл содержит много картинок и слишком большой для контекстного окна
- PowerPont презентацию далеко не все LLM понимают (Claude не дружит с ними)

В общем, все это можно бросить в милого котика, а на выходе — MD файл с правильным форматированием

Пользуйтесь, на здоровье

https://murkdown.streamlit.app/

@aimastersme
👍12🔥83
Google показывает зубы

ещё недавно над Google все смеялись (и я в том числе).
генерация чёрного Колумба, азиатские викинги, советы «приклеить пиццу суперклеем» — это был апофеоз кринжа

на фоне Openai, Anthropic и Perplexity казалось, что Google окончательно потерял инстинкт хищника и ушёл спать на мешках с деньгами

но за последние три месяца они явно собрались с силами

первый звоночек — NotebookLM
закидываешь 1000 страниц текста — получаешь чистое саммари без галлюцинаций и со ссылками на цитаты. я им постоянно пользуюсь, чего и вам советую
плюс он генерит подкасты на основе документов — англоязычная фича, поэтому не так у нас популярна (кстати, есть альтернатива на русском в elevenlabs)

проект Astra — их главный козырь.
это штука, которая видит всё, что видишь ты, понимает контекст, имеет долговременную память и ведёт себя как полноценный партнёр
ранние тестеры жалуются, что без него как без рук
и это говорят не мармеладные маркетологи, а прожжённые технокритики (мой пост про часть возможностей)

а как вам квантовый чип Willow:
5 минут работы вместо 10 септиллионов лет вычислений. я даже не знаю, сколько это нулей, но звучит круто

ну, и вишенка на торте — Veo 2
Google тихо и без лишнего шума выкатывает видео генератор, который на голову выше Sora от Openai.
вы просто посмотрите сравнение Veo 2 и Sora в шапке. это совершенно новый уровень!

не удивительно, у них под рукой весь YouTube для обучения. но спрашивается: где вы раньше были!?

итог такой: Google перестал раздавать громкие обещания и начал просто делать продукты!
да, они долго буксовали, но теперь мы видим, что ресурсы, таланты и зубы у них никуда не делись.

я так полагаю, пора завидовать владельцам Android. им раскатают AI фичи быстрее и лучше, чем Apple с их богомерзкой Siri

а мне надо извиниться за свои насмешки

ps: кстати, для тех, кто любит картинки, у Google вышел визуальный генератор без промптов — Whisk
выбираете стиль, сеттинг, персонажа — получаете готовый результат или детальный промт, который можно забрать в Midjourney

обязательно включайте американский vpn, иначе сервис вас не пустит

@aimastersme
12🔥5👍4👎1
Media is too big
VIEW IN TELEGRAM
Cравнение 8 видеогенераторов

1. Google Veo 2
2. Hailou Minimax
3. Pika 2.0
4. OpenAl Sora
5. Kling 1.5
6. RunwayML Gen3
7. Hunyuan Video
8. Luma Dream Machine

используется один и тот же промпт везде:

A pair of hands skillfully slicing a perfectly cooked steak on a wooden cutting board. Faint steam rising from it

выводы делайте сами

@aimastersme
🔥232👍2
праздники на носу, так что решил немного повеселить наших клиентов и сделал бота, который превращает обычные портреты в новогодние аватары

работает бесплатно, кидаете свою фотку — и через минуту получаете стильный аватар с праздничным настроением

пользуйтесь, дарите себе и друзьям кусочек новогоднего веселья

с наступающими!

бот тут: https://t.me/tdinybot

ps: бот делал для сбора бизнес-контактов, так что не пугайтесь запроса на каонтакт (данные хранятся надёжно в соответствии с gdpr)

@aimastarsme
9🔥6
the verge of singularity
shima
экспериментирую с новой формой подачи материала

вместо длинных занудных постов — что-то среднее между подкастом и аудиоэссе на тему того, что нас ждём в мире суперинтеллекта

@aimastersme
5🔥3🤮2👎1
с новым годом, друзья!
каналу еще и года не исполнилось, а вон сколько всего было

спасибо вам всем за то, что заходите почитать, поделиться, поставить огонек или блевотинку — все это очень для меня ценно. а самое главное, спасибо, что применяете на практике трюки, секреты и знания о нейронках

🎄 шчастя и здароуя в 2025!

@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥1
OpenAI, Google, Anthropic заявляют, что 2025 год станет годом агентов.
Давайте разберёмся, что это за зверь такой, как устроены агенты, и почему о них так много говорят

Что такое агенты
LLM-агенты — это умные системы, которые выполняют задачи с помощью языковых моделей. Они анализируют запросы, выбирают нужные инструменты, принимают решения и выдают готовый результат. (LLM - large language model, это и есть charGPT или Claude).

Пример на пальцах
Поисковик Perplexity. Он разбивает ваш запрос на части, гуглит информацию, ходит по ссылкам, собирает данные, проверяет их и формирует ответ на основе полученной даты. Пользователь получает информацию сразу, без необходимости искать самостоятельно.

Из чего состоят агенты
1. Модель (LLM) — основной элемент агента, анализирует запросы, решает, что делать и пишет тексты.
2. Инструменты (tools) — делают конкретные действия: ищут, считают, подключаются к другим сервисам, рисуют.
3. Память — держит контекст задачи в голове. В отличие от простого чата может иметь долговременную память о прошлых задачах или содержать базы данных (например, контакты ваши).
4. Оркестратор — это менеджер агента, следит за порядком выполнения всех модулей.

Какие модули бывают у агентов

Цепочки промптов

Разбивают задачу на этапы.
Пример: создание рекламной кампании
- Написать текст.
- Подогнать тон под соцсети.
- Перевести на несколько языков.

Маршрутизация

Распределяет запросы по категориям.
Пример: чат-бот поддержки
- Простые вопросы решаются мгновенно.
- Сложные уходят живому человеку.
- Заказы передаются в CRM.

Распараллеливание

Выполняет задачи одновременно.
Пример: анализ отзывов
- Разбивает на категории (позитив, негатив).
- Генерирует статистику.
- Готовит отчёт.

Оценка и улучшение

Улучшает результат через проверки.
Пример: перевод текста
- Первая модель переводит.
- Вторая исправляет ошибки.
- Цикл повторяется до идеального результата.

Оркестратор-исполнители

Управляют всей задачей.
Пример: редактирование кода
- Один модуль вносит изменения.
- Второй проверяет совместимость.
- Третий тестирует.

Когда используют агентов
Если задачи сложные и многоэтапные, требуют гибкости. Для простых задач достаточно обычных запросов к chatGPT

LLM-агенты — это способ автоматизировать сложные процессы с помощью кода и логики языковых моделей

@aimastersme
👍86🔥1😢1
DeepSeek 3 — неожиданное открытие и неочевидный способ применения, о котором никто не говорит

Китайская языковая модель DeepSeek 3 наделала шума. Последние бенчмарки показывают, что она справляется не хуже, а иногда и лучше ChatGPT. Плюс, она полностью бесплатна.

DeepSeek 3 во всем копирует OpenAI. Даже интерфейс почти такой же. (ага, видели мы похожую стратегию с китайскими телефонами).

🤔 Глубокое мышление
Включаете переключатель “DeepThink” — модель начинает анализировать задачу, строить гипотезы и выводы перед ответом. Применение:
- Стратегическое планирование.
- Научные исследования.
- Серьезное обоснование сложных решений.
Это аналог ChatGPT o-1. Работает неплохо, но всё же OpenAI немного точнее. Однако ж, бесплатно!

🤯 Поиск онлайни вот тут просто разрыв! 💣
Казалось бы, стандартная фича. У Perplexity, Gemini Advanced и ChatGPT есть такое же. Но DeepSeek 3 выделяется. Она ищет в китайском сегменте интернета.
Причем сразу переводит на русский или любой другой язык, а также даёт ссылки на оригинальные источники.

Где это полезно?
- Анализ китайского рынка.
- Поиск товаров, фабрик или сервисов.
- Любая информация, доступная только через китайские порталы.

🇨🇳 Китайский интернет — отдельная вселенная, закрытая файрволом: сложный язык, своя экосистема, пугающе странные интерфейсы. DeepSeek 3 помогает обойти все эти барьеры.

Почему это важно?
Если ваш бизнес связан с Китаем, это must-have. А для всех остальных — просто бесплатная альтернатива ChatGPT. Но есть нюансы:

1. Конфиденциальность
Не доверяйте персональные данные и коммерческую тайну. Модель китайская, а ещё и бесплатная. Значит продукт здесь вы и ваши данные.

2. Цензура
Вопросы про Винни-Пуха или события в на площади Тяньаньмэнь могут вызвать проблемы. Но для бизнес-задач это не критично.

Пользоваться можно по ссылке

UPD: ВАЖНОЕ ДОПОЛНЕНИЕ

Внимательное тестирование показало, что поиск по китайскому сегменту сети работет 1 раз из 5.

Есть решение. Чтобы точно получать ответы из 🇨🇳 — переведите запрос в Google Translate на китайский, а потом попросите перевести результат обратно на русский

Мало того, этот способ работает везде!! ChatGPT Search, Perplexity. Вот такое неочевидное и полезное открытие

@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍41👎1
Как я разочаровался в Poe.com и на что перешел

Весь 2024 я был большим фанатом Poe и рекомендовал его буквально каждому — доступ ко всем фронтир моделям за 200 в год казался лучшим предложением на рынке. Но недавно они ввели новую систему тарификации. Теперь месячная подписка у меня вылетает за две недели, а пополнять баланс "по чуть-чуть" нельзя. Их аргумент? Старая тарификация была "неэффективной". Окей, понимаю, бизнес.

Решил искать замену. После долгих метаний остановился на ThinkBuddy. И знаете что? Это прям хорошо!

- Можно выбрать любую из лучших моделей (или сразу пять штук) и сравнивать их ответы в одном окне.
- Самая крутая фишка: выбираете ответ, который вам понравился, и продолжаете с ним. А все остальные модели автоматически "переписывают" свою историю, подстраиваясь под ваш выбор. Удобно и неожиданно эффективно.

- Поддержка файлов: от pptx до excel
- Голосовой ввод
- Библиотека промптов
- Адекватный поиск по истории чатов
- Большое окно контекста (в отличие от обрезанного в Poe)

Цена: 96 в год за базовый функционал и 144 за полный фарш — на 60 баксов дешевле Poe. (а это 12 баксов в месяц за доступ к ChatGPT, Claude и Gemini, вместо 60, если покупать их по-отдельности).
Справедливости ради, в Poe можно и картинки, и видео, и голос. Но это тупиковая история. Комбайны не нужны. Кто помнит Nero и его печальную судьбу, тот меня поймёт.

ThinkBuddy пока местами сырой и глючный, но видно, что команда старается: выкатывают новые фичи и фиксят баги. Есть бесплатный тестовый план (карту не требуют), и самое главное — без VPN.

ThinkBuddy — это замена для тех, кто разочаровался в жадности Poe. Короче, пробуйте или делитесь, кто чем пользуется

@aimastersme
👍13🔥42
Единственный рабочий способ делать презентации с помощью нейронок

Периодически натыкаюсь на посты, типа «Этот сервис сделает вам презентацию за 3 минуты!» (и прочий инфоцыганский булшит)

Если вы не ученик восьмого класса, которому задали доклад по истории Реформации, то все эти сервисы никуда не годятся (ладно, Gamma.app и Beautiful.ai можно дожать до чего-то приемлемого, но они платные и не гибкие)

Давайте я расскажу реально работающий бесплатный способ делать презы в нейронках

Пайплайн такой:

1. Включить диктофон и наговорить текст презы голосом, не переживать из-за повторов, мычания, пауз и сбивчивости, да и на структуру пофиг
2. Транскрибировать голос в текст
3. Структурировать полученный текст на N слайдов в chatGPT (тут уж вы сами смотрите, какая вам нужна структура. Я обычно прошу сделать хороший сторителлинг в стиле TED)
4. Попросить chatGPT написать VBA скрипт для создания PowerPoint с этими слайдами
5. Вставить скрипт в макрос PowerPoint (если не знаете как, попросите подсказку у того же GPT)
6. Применить общий стиль и верстку к полученным слайдам через инструмент Designer внутри PowerPoint
7. Внести мелкие правки в текст, добавить уникальные картинки, графики и диаграммы

Предпочитаете Goole Slides? Не вопрос! Вместо VBA попросите написать Google Apps Script (как это делать, писал тут)

Для дизайнерского лоска воспользуйтесь готовыми шаблонами Slidesgo (много бесплатных)

🎇Вжух! И ваш годовой отчет — не такая уж катастрофа

PS: если mac на английском, то переведите PowerPoint в системных настройках macOS на русский, иначе будут кракозябры вместо кириллицы после VBA

@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥149🤮1
Как извлекать точные инсайты из исследований без нервов и галлюцинаций

Есть один инструмент, который совершенно недооценивают. И это практически читерский способ работать с объемными документами, особенно если вам нужны точные данные без галлюцинаций.

Рассказываю, как NotebookLM от Google спасает нервы и время

Проблема нейросетей
Кто пользовался популярными чатами и моделями, знает: загрузить туда большой документ — одно дело, а получить что-то адекватное — совсем другое. Модель начинает фантазировать, добавлять то, чего в тексте нет, или «творчески интерпретировать». В итоге вместо точных данных — набор красивых, но бесполезных клише.

Решение от Google
NotebookLM от Google сделан для тех, кому важна именно точность. Система берет ваши документы, находит конкретные данные и дает ссылки на источник. Без фантазий, без лишнего "креатива".

Как это работает
1. Заходим в ноутбук LM (кому-то нужен VPN).
2. Загружаем туда документы: исследования, обзоры, нормативку — всё, что нужно анализировать.
3. Задаем вопросы по этим данным. Например: «Какие основные тренды в потребительских предпочтениях за 2024 год?»

Ответ придет с указанием точного места в документе. Кликнули — сразу попали в нужный абзац.

Примеры использования
- Исследования и аналитика: Вместо того, чтобы вычитывать десятки страниц потербительских трендов 2025, задаете вопросы и получаете конкретные ответы.
- ПДД и споры на дороге: Загружаете правила, описываете ситуацию, и LM находит, на какой пункт надо ссылаться. Спасает при спорах с дорожной полицией.
- Юридическая помощь: Если у вас кипа договоров или нормативных актов, система моментально вытаскивает нужные параграфы без лишней интерпретации.
- Кулинария: Добавляете свои рецепты и спрашиваете: «Как сделать лазанью, если у меня нет базилика?» Ответ будет с точной ссылкой на источник.

В чем главный плюс
Это не фантазёр. Это ваш личный точный референт. Можно загружать что угодно: документы, инструкции по использованию, магуалы, образовательную литературу, рецепты, коллекцию вин, правила, и он не придумает ничего лишнего. Для исследователей, юристов, бухгалтеров и даже обычных людей — мастхев.

Бесплатная версия NotebookLM:
- До 100 блокнотов
- До 50 источников на блокнот
- 50 чат-запросов в день
- 3 аудиогенерации в день (генерирует подкаст на основе загруженной информации)

@aimastersme
🔥26👍92
This media is not supported in your browser
VIEW IN TELEGRAM
Забудьте про сайты поиска работы для людей — это уже прошлый век. Встречайте Headhunter для AI-агентов:

https://jobforagent.com/

Пока что это скорее эксперимент — вакансий и запросов немного, а аудитория в основном состоит из разработчиков, которые создают и обучают агентов. Но сама идея точно отражает тренд: рутинные задачи, которые раньше выполняли люди, переходят в руки агентов.

С одной стороны, это сужает пространство для человеческого участия. С другой — открывает новые горизонты, где агенты пока не могут конкурировать с нами.

Так что, может, скоро мы увидим и LinkedIn для искусственного интеллекта.

На видео: история захвата и доминирования в навыках AI над кожаными. Наглядненько

@aimastersme
👍8🔥4