Плотвозорий
Испытываем некоторые сложности по независящим от нас обстоятельствам. А вот надонатили бы на DGX Spark — была бы локальная модель без бед
Эта ситуация периодически возникает, под разными спецэффектами, но знайте, что если плотва странно долго отвечает или не отвечает вообще, то скорее всего это связано с перегрузкой модели, которую мы используем, и мы не в силах повлиять на это.
1👌5 5
Функция перерисовки* улучшена — теперь можно смешивать несколько изображений!
* —доступна только VIP -плотварям
* —
3🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы нахренячили странных фактов о вас, то теперь можно удалить их в личных настройках, а не только через уговоры.
👏8🔥2
Короче, тут такое дело: Мой товарищ со своей командой сегодня запускает продукт, и было бы грешно не рассказать. Тем более что я — один из самых первых юзеров их продукта.
Ребята сделали EVY — AI-коллегу, которая живёт прямо у тебя в макбуке. знает что у тебя на экране, можно с ней голосом поговорить, а также когда лень печатать наговорить сообщение и вставить куда угодно,
Пилили 9 месяцев, сами юзают каждый день, но забавно что ни один из фаундеров не попал даже в топ-5 юзеров — людям зашло настолько, что создатели проигрывают своим же пользователям
Сегодня они на Product Hunt и если сможете прийти проголосовать — это им реально поможет.
для подписчиков канала мой товарищ Валентин принес промокодPLOTVA30 — скидка 30% на 6 месяцев, если закончатся бесплатные кредиты до конца февраля.
Ребята сделали EVY — AI-коллегу, которая живёт прямо у тебя в макбуке. знает что у тебя на экране, можно с ней голосом поговорить, а также когда лень печатать наговорить сообщение и вставить куда угодно,
Пилили 9 месяцев, сами юзают каждый день, но забавно что ни один из фаундеров не попал даже в топ-5 юзеров — людям зашло настолько, что создатели проигрывают своим же пользователям
Сегодня они на Product Hunt и если сможете прийти проголосовать — это им реально поможет.
для подписчиков канала мой товарищ Валентин принес промокод
Product Hunt
EVY: your AI co-creator, in any app | Product Hunt
Meet EVY - your AI co-creator to go from ideas to polished documents, content or copy in seconds. Press the EVY-Key anywhere to ask questions, brainstorm ideas, generate or edit text, take notes, or dictate.
Я хочу поговорить о моей любимой Плотве. Хочу внести немного прозрачности в то, что происходит “за кулисами”.
Все довольно сложно, и я не хочу чтобы вы в один день увидели, что Плотва мертва. Поэтому взглянем на цифры и факты:
Сейчас экономика проекта держится на донатах и VIP-подписках, но к сожалению, математика пока-что работает против нас.
❗️ Вот статистика за последние месяцы:
➡️ Декабрь: VIP-подписки принесли ~$103 (до вычета комиссий). Счет за токены LLM — $217.14.
➡️ Январь: Подписки принесли ~$85. Счет за токены — $278.
➡️ Февраль (прогноз): Прогнозируемые траты на токены — $461.
Предыдущие два месяца дефицит удалось сократить почти до нуля благодаря щедрым донатам всего одного человека. Но даже так все работает в минус и я доплачиваю из личных средств. Очевидно, что такая модель нежизнеспособна.
❗️ Почему растут расходы?
Возможно, вы замечаете, что со временем Плотва становится умнее, адекватнее, интереснее и глубже в диалогах. К сожалению, это не бесплатно.
У Плотвы есть еще куда расти в части качества ответов, но это запросто может привести к умножению счета в разы, потому-что у Плотвы много друзей (>20000 активных пользователей в месяц).
Я пытаюсь находить точки максимальной эффективности и оптимизировать все, что только возможно, и при этом обеспечить максимальное качество общения из имеющихся возможностей. С течением времени, ростом количества людей и активности, бот вынужден обрабатывать всё больше данных: историю диалога, описание изображений, которые Плотва “видит” в диалоге, и набор другой метаинформации. Каждый такой запрос стоит денег. Качество ответов — прямо коррелирует с ценой.
❗️ Точка стагнации
Сейчас проект попал в своеобразную ловушку.
😭 Я не могу масштабировать Плотву. Реклама и приток новых пользователей приведут к взрывному росту счетов за API, которые текущая монетизация не покрывает.
😭 Я не могу полностью перейти на локальные модели (пока). Мое текущее железо занято моделями для рисования и распознавания картинок, транскрипцией, и другими процессами. Если я захочу запустить какую либо LLM локально — для нее просто нет ресурсов, мне придется отключить корневую фичу — бесплатное рисование картинок. При этом все-равно драматично снизится качество диалогов.
Если финансовая ситуация заставит, мне придется пойти по этому пути. Но это крайняя мера.
❗️ Идеальный сценарий: избавление от таксометра
Решением проблемы мог бы стать апгрейд локального сервера. Это позволило бы разместить мощную LLM у себя, убрав зависимость от внешних провайдеров и платных токенов, и при этом сохранить генерацию картинок и открыть возможности для масштабирования.
Оптимальный выбор здесь в моменте — Nvidia DGX Spark (или вендорский аналог). Специфика работы LLM с большими контекстами такова, что компромиссы вроде Mac Studio или мини-ПК на Ryzen AI MAX+ здесь не справляются. Нужно именно решение от Nvidia, а это никогда не дешево. Цена вопроса — в районе $4000 плюс налог и наценка продавцов.
Следующий вариант идеален для Плотвы - RTX 6000 Pro - стоит больше 10 тысяч евро в моем регионе. Мечтать не вредно.
Если среди читателей есть добрый самаритянин, готовый проспонсировать этот плотвяной ковчег — очень жду тебя в личке.
❗️ Предложение для AI-лабораторий
Если этот текст читают сотрудники ML-лабораторий и/или компаний, разрабатывающих генеративные модели:
У Плотвы есть живая аудитория. У вас есть продукт. Мы можем помочь друг другу. Например, организовав тестирование ваших моделей (текстовых или графических, Vision, OCR, ASR, TTS, все можно приспособить) и сбора предпочтений от пользователей в обмен на ваш инференс. Пишите.
❗️ Что можно сделать сейчас?
Я очень НЕ хочу закрывать проект. Плотва мне дорога, и я вижу, что она нравится вам.
Поэтому я робко прошу всех, кто может себе это позволить: оформите VIP-подписку. Это лучший взаимовыгодный способ поддержать проект, чтобы Плотва не превратилась из любимого проекта в проблемную обузу.
Спасибо, что остаетесь с Плотвой.
Все довольно сложно, и я не хочу чтобы вы в один день увидели, что Плотва мертва. Поэтому взглянем на цифры и факты:
Сейчас экономика проекта держится на донатах и VIP-подписках, но к сожалению, математика пока-что работает против нас.
Предыдущие два месяца дефицит удалось сократить почти до нуля благодаря щедрым донатам всего одного человека. Но даже так все работает в минус и я доплачиваю из личных средств. Очевидно, что такая модель нежизнеспособна.
Возможно, вы замечаете, что со временем Плотва становится умнее, адекватнее, интереснее и глубже в диалогах. К сожалению, это не бесплатно.
У Плотвы есть еще куда расти в части качества ответов, но это запросто может привести к умножению счета в разы, потому-что у Плотвы много друзей (>20000 активных пользователей в месяц).
Я пытаюсь находить точки максимальной эффективности и оптимизировать все, что только возможно, и при этом обеспечить максимальное качество общения из имеющихся возможностей. С течением времени, ростом количества людей и активности, бот вынужден обрабатывать всё больше данных: историю диалога, описание изображений, которые Плотва “видит” в диалоге, и набор другой метаинформации. Каждый такой запрос стоит денег. Качество ответов — прямо коррелирует с ценой.
Сейчас проект попал в своеобразную ловушку.
Если финансовая ситуация заставит, мне придется пойти по этому пути. Но это крайняя мера.
Решением проблемы мог бы стать апгрейд локального сервера. Это позволило бы разместить мощную LLM у себя, убрав зависимость от внешних провайдеров и платных токенов, и при этом сохранить генерацию картинок и открыть возможности для масштабирования.
Оптимальный выбор здесь в моменте — Nvidia DGX Spark (или вендорский аналог). Специфика работы LLM с большими контекстами такова, что компромиссы вроде Mac Studio или мини-ПК на Ryzen AI MAX+ здесь не справляются. Нужно именно решение от Nvidia, а это никогда не дешево. Цена вопроса — в районе $4000 плюс налог и наценка продавцов.
Следующий вариант идеален для Плотвы - RTX 6000 Pro - стоит больше 10 тысяч евро в моем регионе. Мечтать не вредно.
Если среди читателей есть добрый самаритянин, готовый проспонсировать этот плотвяной ковчег — очень жду тебя в личке.
Если этот текст читают сотрудники ML-лабораторий и/или компаний, разрабатывающих генеративные модели:
У Плотвы есть живая аудитория. У вас есть продукт. Мы можем помочь друг другу. Например, организовав тестирование ваших моделей (текстовых или графических, Vision, OCR, ASR, TTS, все можно приспособить) и сбора предпочтений от пользователей в обмен на ваш инференс. Пишите.
Я очень НЕ хочу закрывать проект. Плотва мне дорога, и я вижу, что она нравится вам.
Поэтому я робко прошу всех, кто может себе это позволить: оформите VIP-подписку. Это лучший взаимовыгодный способ поддержать проект, чтобы Плотва не превратилась из любимого проекта в проблемную обузу.
Спасибо, что остаетесь с Плотвой.
Please open Telegram to view this post
VIEW IN TELEGRAM
9 23🔥11 6👌5🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🤯11 4🔥3 3👏1🤬1🎉1👌1
Сделал не большое, но принципиально важное изменение того, как работает система запоминания фактов:
Теперь, все факты, которые запоминаются в личном чате с Плотвой — остаются в личном чате с Плотвой и не попадают в контекст других чатов, чтобы какие-то ваши секретики не утекали.
Так же, теперь в рамках диалога с Плотвой в группе, Плотва будет знать только общие факты группы и факты непосредственного собеседника, не подмешивая факты об остальных участниках диалога. Это создавало много путаницы и недопонимания, Плотва постоянно путалась кто где и приписывала факты о других участниках диалога инициатору сообщения.
В связи с этими изменениями, я решил очистить базу фактов, чтобы Плотва забыла весь накопленный мусор и начала с чистого листа.
Теперь, все факты, которые запоминаются в личном чате с Плотвой — остаются в личном чате с Плотвой и не попадают в контекст других чатов, чтобы какие-то ваши секретики не утекали.
Так же, теперь в рамках диалога с Плотвой в группе, Плотва будет знать только общие факты группы и факты непосредственного собеседника, не подмешивая факты об остальных участниках диалога. Это создавало много путаницы и недопонимания, Плотва постоянно путалась кто где и приписывала факты о других участниках диалога инициатору сообщения.
В связи с этими изменениями, я решил очистить базу фактов, чтобы Плотва забыла весь накопленный мусор и начала с чистого листа.
👏14 8🔥6🎉1🖕1
Теперь владелец чата может назначать заместителей из числа участников чата.
Эти пользователи смогут настраивать поведение Плотвы не являясь владельцами чата.
P.S. Маленькая вкусняшка для любителей своих персон —
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM