Teslak Notes
2.3K subscribers
600 photos
44 videos
1 file
134 links
Обо мне: t.me/TesNot/777
Второй канал: @Tes404
Истина где-то рядом.
Download Telegram
ChatGPT

OpenAI (создатели DALL·E 2) радуют языковой моделью. Продвинутым чат-ботом, если угодно.

Общаться может на любом языке, но на английском ответы качественнее и быстрее.

Облачная, бесплатная, недоступна в РФ.

Примеры запросов в официальном Дискорде

Сторонняя документаций


Вариантов применения масса:

— Обычная переписка (в этом может поконкурировать character.ai, где есть множество заранее прописанных личностей);

— Написание осмысленного текста на любую тему;

— Генерация идей, проработка концепций;

— Проверка грамматики и пунктуации;

— Ответы на поисковые запросы. Иногда настолько хорошо, что есть речь о конкуренции с Гуглом;

— Написание кода, причём довольно сложного и с объяснениями;

— Поиск ошибок в коде.

Само собой, могут быть ошибки, но часто помощь полезна.


В комментариях текст, позволяющий обойти цензуру на некоторые вопросы.


Во втором канале была ссылка в день её публичного релиза.


#текст #нейро
Enhance Speech from Adobe

Улучшение записанных аудиофайлов с речью до студийного уровня. С участием нейросетей, конечно же.

MP3 and WAV форматы, максимум 1 час и 1 гигабайт.

Пример обработки — на сайте. Отлично справляется с подавлением эхо и шума, но всё равно стоит пытаться записывать как можно лучше изначально. Качество звука лучше, когда микрофон ближе. От эхо можно избавиться накрывшись одеялом или облепив комнату акустическим поролоном.

За ~$30 можно купить приемлемый USB Fifine. Если бюджет большой, то стоит смотреть на микрофон с аналоговым подключением, возможно динамический. И аудиоинтерфейс к нему. Только не покупайте оверпрайснутые USB Blue Yeti.

Давно имеется возможность прокачки звука с помощью VST-плагинов (рекомендую iZotope) и в особо плохих случаях RTX Voice (который нормально работает и без RTX), но достижение Адоба в бесплатности и простоте.

#текст #нейро
Open Assistant #нейро

Внесите свой вклад в развитие опенсорсной языковой модели. Особых навыков не нужно.
Topaz Photo AI

Улучшение качества изображений.

Локально для Виндовс и Мак. Если слабый ПК или смартфон — обращайтесь к онлайн-конкурентам.

Использую продукты Топаза активно и давно, прогресс радует с каждым годом. Недавно собрали Гигапиксель, Шарпен и ДеНойз воедино.


Отлично справляется с 2D. С фотографиями (и рав с камеры и шакальными из интернета) когда как — иногда творит чудеса, иногда нет. Рекомендую самостоятельно подбирать параметры, а не отдаваться автоматике.

Есть оффлайн-конкуренты, но они заточены на что-то одно.

Детали старается сильно не придумывать. Ремини спасает лица лучше.


Также обновили хороший Video AI. Есть веб-аналог: VMake Video Enhancer.


#текст #нейро
QR-коды в виде картин

Stable Diffusion + дообученный ControlNet (на него ссылки нет, но есть подобные настройки)

Распознаётся нормально

Восхищаюсь пытливому уму автора, но люди привыкли к обычным QR, здесь же могут возникнуть проблемы с донесением возможности просканировать до впервые видящего такое человека.

Процесс создания

/

UPD: создаётся на
сайте, сохраняется в виде PNG. Далее заходим в дискорде разработчиков в канал «paste-bin» и загружаем туда QR, копируя ссылку на него.

Далее идем в один из каналов «pixelml-bot», в первое поле вставляем промт (*ваше описание*
--presets intricate-details --qrw 0.8 --steps 16 --seed 2649239020191832), который рекомендуют разработчики, а во второе поле ссылку.

/

UPD2: stockimg.ai/qrcode/

#нейро #красиво
Runway Gen-2

Нейросеть для генерации видео. Бесплатно 105 секунд.

Технически их можно было генерировать давно, но у классических диффузионных нейросетей была проблема: кадры слишком отличаются. Потом придумали как сделать более-менее бесшовно.

Результат слабенький, зато сервис максимально прост и пока даёт бесплатные попытки. Первое видео от авторов, остальные от меня с простыми промтами. Можно дать изображение как референс.

#нейро
Teslak Notes
~Пару недель тыкаю генеративную нейронную сеть Midjourney для генерации картинок по короткому текстовому описанию и очень радуюсь. Облачная, распространяется по подписке и не может быть оплачена РФ картами. Есть бесплатные попытки. Чем хороша: — Может…
⛵️ Развитие Миджорни по версиям

Прогресс нелинеен. Прекрасно, когда что-то развивается на глазах.

Генеративные нейросети появились давно. Миджорни не первая и не единственная хорошая, но самая простая и даёт хороший результат. Гибкости хоть и немного, но для большинства задач достаточно.

По-прежнему остались периодические проблемы с руками и не являющимися основной композиции элементами. Если генерация города, то велика вероятность, что будет машина с пятью колёсами.

🤓 Для лучшего качества сохраняйте результат генерации не из модалки Дискорда, а из «Открыть в браузере». И очень желательно прогнать результат в Топазе или веб-апскейлерах.

Раньше у неё были бесплатные генерации, сейчас нет, зато есть у других 🚨 Можно ~быстро сделать себе клёвые референсы, скетч для дорисовки или даже итоговое изображение.

💬 Хайрезы в комметариях.

#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
Runway Gen-2 Нейросеть для генерации видео. Бесплатно 105 секунд. Технически их можно было генерировать давно, но у классических диффузионных нейросетей была проблема: кадры слишком отличаются. Потом придумали как сделать более-менее бесшовно. Результат…
🦊 Pika

Нейросеть для генерации видео. Бесплатно. Видео по 3 секунды.

Сыроватая, но уже можно получить фан. В некоторых сценариях вроде демонстрации сыпчатых веществ или линейного движения показывает себя хорошо, можно использовать как b-roll даже в коммерции (но желательно апскейльнуть Topaz Video AI или онлайновые VMake Video Enhance и CapCut).

Нужно писать действие, иначе видео будет ~статичным. Можно использовать референсы.

Некоторые видео сделал сам, некоторые позаимствовал, в 💬 комментариях будет ещё.

#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
ilib/ai

Самые посещаемые нейросетевые сайты.

Статьи-исследования продуктов из списка со статистикой и аналитикой. Они порядок взяли из SimilarWeb, но я не нашёл на нём как сортировать по нейросетям.


Много интересных, ещё больше так себе.

Много используют ЧатГПТ, некоторые как 🎭 Character.ai делают это хорошо и бесплатно, а всякие Writesonic, Jasper и может быть Poe для большинства бесполезны. Много использует Стейбл Дифьюжен, но об этом напишу ещё.

Некоторые как Deepl.com попали из-за AI в названии, по факту другие переводчики тоже используют нейросети.


👁 Приглянулись:

learnprompting.org — обучение формированию запросов нейронкам, есть разные уровни.
Напоминает tensortrust.ai — игру, где нужно обмануть чат-бота;

novelai.net — текстовая игра-квест, сюжет само собой гибко генерируется;

play.ht и freetts.com & ну и ботики пусть: @silero_voice_bot и @steosvoice_bot — очередные несовершенные генераторы голоса, SileroTTS используют наверное. Используя подобное помните, что можно расставлять ударения плюсом перед гласной.

UPD: TTS от OpenAI.


semanticscholar.org — поисковик по научной 🔬 литературе, честно говоря не знаю чем отличается от, например, sci-hub.ru.

paperswithcode.com — сбор исследований 🔍 по нейросетям.


Не успеваю писать про всё-всё, потихоньку навёрстываю, можете потыкать сайт сами. Многие проекты достойны отдельных постов 👇

#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
UPD: t.me/TesNot/884 💬 Экспресс-вкат в языковые модели Их много, но самые совершенные и легкодоступные по прежнему от ОпенАИ, которые есть не только на сайте ЧатГПТ: You.com, perplexity.ai — работают без ВПН и регистрации. У You есть бесплатные 5 использований…
💬 Сlaude.ai

Забыл здесь (а здесь нет) рассказать про сравнимую с ЧатГПТ языковую модель, для регистрации в которой не нужен номер и которая мне не блокировала несколько аккаунтов.

Есть бесплатная полезная первая версия сравнимая с ГПТ 3.5, есть сравнимая с ГПТ 4 платная вторая. Мне нрав 👅

Если верить топу выше, то посещаемость маленькая (631K в месяц, 200+ место топа), немного странно потому что вверху топа использующие ЧатГПТ сайты, а это собственная разработка, но у компании всё хорошо — инвестиций много, есть интеграции в том числе в Ноушен.

#нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
🎙 ElevenLabs

Передовой генератор голоса.

Знает много языков и синтезирует их реалистично.

Умеет дублировать видео голосом оригинала, но некоторые языки переводит пока так себе. Зато может понять и перевести язык даже если указан другой.

#нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
⛵️ Развитие Миджорни по версиям Прогресс нелинеен. Прекрасно, когда что-то развивается на глазах. Генеративные нейросети появились давно. Миджорни не первая и не единственная хорошая, но самая простая и даёт хороший результат. Гибкости хоть и немного, но для…
Очень важно: шестая версия 🎨 Миджорни научилась хорошо генерировать капибар.


Скоро запустят редактор на сайте (а у моделей на Стейбле они уже давно).

Заработали больше $200 млн, сгенерировано более 300 млн изображений, ежемесячно сайт посещают 3-4 млн человек. via.

Иск художников был отклонён, но будут новые иски от компаний.

#нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
ilib/ai Самые посещаемые нейросетевые сайты. Статьи-исследования продуктов из списка со статистикой и аналитикой. Они порядок взяли из SimilarWeb, но я не нашёл на нём как сортировать по нейросетям. Много интересных, ещё больше так себе. Много используют…
There's An AI For That

Сайт собирает большинство выходящих нейросетевых сервисов, большинство использует существующие нейросети допиленные под определённые задачи с разной степенью успешности.

Масштабы огромные: десятки появляются каждый день, каждый месяц — тысячи.

#нейро
⚡️ Я @Teslak — обожатель эстетического хаоса, самопровозглашённый летописец и обитатель далёкой страны. А это — мой цифровой сад, где делюсь могущими помочь в жизни заметками.

🎨 Делаю дизайн — от графического до сложных интерфейсов, работал в FinTech CRM, DeFi, с крупнейшими компаниями, сейчас в AI.
Портфолио →

Айтишечка — моя страсть. Фотографирую, люблю экономику, науку и нейросети.

⚡️

Путь к другому измерению с репостами и непостижимыми мыслями: @Tes404

Интересные исторические личности: @PersList

Арсенал стикеров: @StickersPopular

⚡️

Теги:

#текст

#нейро

#фото снятые мной

#красиво сгенерировано мной в нейросети или честно позаимствовано

#книги
Please open Telegram to view this post
VIEW IN TELEGRAM
✈️ Интересные на мой взгляд телеграм-каналы

Собрал потенциально полезные всем, без слишком узких тем.

✏️ Околоновости, статьи, похожи друг на друга
@t_jrnl
@vcnews
@xor_journal
@retra
@sharemed
@smmtg
@sale_caviar

👁 Визуальные
@wowohuenno
@fotoartset
@nahuyart
@designsniper
@truecatharsis
@Architecture2021
@muzei_tg
@visualmove
@dusty_trunk

💵 Финансовые
@RationalAnswer
@hoolinomics
@fincult_info
@true_flipper
@buyside
@istatist
@longviewecon
@cbrstocks
@karaulny_accountant
@prometheus
@mamkinfinansist

🎲 Рандомные фактики
@rationalnumbers
@pcTeapot
@lexicona
@chekhov_life
@tolstoy_life
@gre4ark

✍️ Блоги
@zamesin
@furydrops
@whalesgohigh
@sci_one_tv
@qwerty_live
@shanggyangg
@textintext
@desprod
@nauchnuy

🤖 Нейросетевое
@ai_newz
@seeallochnaya
@strangedalle
@derplearning
@mishin_learnin
@boris_again
@ai_machinelearning_big_data
@lovedeathtransformers
^ ведутся реальными специалистами в ML
@addmeto — и просто IT
@notboring_tech
@JimmyNeiron
@cgevent
@neir_on

⚙️ Технологии
@d_code
@dataleak


Каналы сетевиков вроде @whackdoor @exploitex @codecamp не нравятся, их ведут не энтузиасты, а люди на зарплате. Периодически очень криво поданные события, фейки, кринжовые описания и нет глубоких разборов.

💬 Рекомендуйте другие каналы в комментариях.


Сейчас 57 каналов
🗂 Подписаться на все каналы разом — папка хороша тем, что автоматически предлагает обновить её когда обновляю я.
(но лучше подписываться смотря на что подписываешься)


📰 Пост про новости
👀 Пост про Ютуб-каналы


#текст #жизнь #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
💬 Экспресс-вкат в языковые модели
Обновление спустя годик

Чат-боты значительно упрощают жизнь в разных сферах, современный человек должен уметь ими пользоваться.

[Некоторым нужен VPN]


Мощных и доступных модели три, хотя сервисов использующих их много:

You · Telegram
Мощные [не свои] модели (вкладка More), полезный режим 🔎 Research. Даёт ссылки на источники. Можно и картинки рисовать, но с лимитов в три запроса в сутки тяжко.

🤖 HIX AI
Аналогичен.

🌟 TalkPilot
Аналогично, но дешевле и с лёгкой оплатой из России, бесплатная версия плохая. Пишут, что безлимит, но нет: 100 запросов в сутки.

🤖 ChatGPT
Передовая версия 4o доступна всем. Есть каталог ассистентов, создание картинок и крутой голосовой режим. Лимит на запросы к 4o больше, чем у You. Общение голосом и создание своих ассистентов в платной версии.

🤖 Claude
3.5 Sonnet примерно как 4o, иногда лучше, особенно в лингвистике. Хуже в фактах. Имеет конкурентные фичи вроде распознавания изображений в бесплатной версии. С недавних пор и каталог ассистентов.

Gemini
От разработчиков, как и две ссылки выше. 1.5 Pro 002 стала неплохой и имеет бесплатное большое контекстное окно.

🤖 Perplexity
Использует старые модели. Поиск по научным 🔬 статьям, видео, реддиту и математический режим. Ссылки.
В платной 💵 версии новые модели и режим написания больших статей.
Бесплатно статьи умеет писать storm.genie.stanford.edu.

🤖 Poe
Новые модели, бесплатное создание кастомных ассистентов на них. Есть свой каталог.

👻 Coze
Примерно тоже самое удобнее, с плагинами и canvas workflow. Каталог ботов, плагинов и воркфлоу.

🤖 Copilot · Telegram (нужно поделиться любым американским контактом, не своим российским)
Глупый и часто отказывается отвечать на невинные вопросы. Годится если закончились бесплатные запросы You и для генерации картинок в DALLE.

🥺 Character
Множество развлекательных ассистентов. Можно создать своего, но модель старая.

🔥ChatHub
Одновременный запуск нескольких моделей для сравнения их ответа.

Кастомные ассистенты удобные: не нужно каждый раз писать промпт.
В каталогах (и не только) можно найти помощника для копирайтеров, интегрирации с разными сервисами, промптилку для Миджорни, учителей по конкретным предметам, советы по фитнесу и кулинарии. И психолог 🤯 тоже есть.

Многие боты в телеграме используют старые слабые модели, выше перечислил нормальных.


Примерно понять мощность моделей можно на The Big Benchmarks Collection, Chatbot Arena, рандомных сайтах и специализированных бенчмарках.


💬 В комментарии скину промпты для снятия цензуры (в некоторых сервисах выше она и так снята), для реверс-инжиниринга промпта ассистента и табличку с несколькими бенчмарками.

#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
Runway Gen-2 Нейросеть для генерации видео. Бесплатно 105 секунд. Технически их можно было генерировать давно, но у классических диффузионных нейросетей была проблема: кадры слишком отличаются. Потом придумали как сделать более-менее бесшовно. Результат…
This media is not supported in your browser
VIEW IN TELEGRAM
📼 Нейросети для генерации видео

Все клёвые и активно развиваются, есть бесплатные попытки.

💡Можно вставлять картинки-референсы как стартовый кадр ИЛИ как финальный кадр.


Pika / В Дискорде
После обновления стала хорошей и мемной: может взорвать, сжать или надуть объект.

Gen-3
Гибкая. Бесплатные кредиты со временем не обновляет.

Luma

Kling

Vidu


Будут обновляться, само собой. Sora от OpenAI пока не вышла.

Делайте много вариаций, с первого раза обычно слабо.

#нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
Teslak Notes
💬 Экспресс-вкат в языковые модели Обновление спустя годик Чат-боты значительно упрощают жизнь в разных сферах, современный человек должен уметь ими пользоваться. [Некоторым нужен VPN] Мощных и доступных модели три, хотя сервисов использующих их много:…
🤖 Продвинутое использование языковых моделей


📚 Большой контекст

Бесплатные версии ChatGPT & Claude ограничены малым количеством токенов (это как символов, но не совсем). Платные ограничены 128 000 & 200 000. Вывод у платных тоже больше. Здесь выделяется бесплатная Gemini 1.5 Pro Experimental от Гугла с контекстом в два миллиона, а с обновлениями больше. Раньше была сильно глупее, сейчас улучшили. От конкурентов в умности всё ещё отстаёт. Много токенов увеличивают галлюцинации, но не прям.

Широкое контекстное окно позволяет анализировать длинные видео, книги, статьи, чаты, каналы.

🍴 AI Studio (на потребительском сайте она платная) — работает кривовато, иногда не грузит файлы, иногда файлы нужно разбивать на части, иногда не ест большой контекст сразу, нужно прерывая ответ несколько сообщений отправить. Но работает. Даёт ограниченно бесплатное API.


💻 Локальный запуск

Бесплатно + диалоги не будут анализироваться.

Выбрал 📚 LM Studio, удобно запускать все открытые модели в GGUF.

Что-то хорошее запустить не получится, средние компьютеры тянут модели уровня Llama 3.1 7b и зачастую только с квантованием. Vikhr Nemo 12b отвечает на русском лучше других малюток.

Для корпоративных нужд можно развернуть большие модели на сервере.


🧠 Новые модели

ChatGPT o1-preview доступна только по подписке. Если заплатить не получается, можно найти временный доступ где получится: Double & временный хаггинг.

Боты в Телеграме обычно дают 4o-mini, которая значительно слабее 4o, а 4o старее o1.


Длительное использование

Зачастую LLM используются разово без настроек и контекста. E.g.: изучение языка приятнее с настроенным и помнящим обсуждения ассистентом.


🎶 Транскрибация

Речь можно преобразовывать в текст. Многие сервисы умеют это делать сами. Можно делать специальными в том числе по API, можно локально.

Нарезалки больших видео на короткие делают это исключительно по тексту.

Расшифровка звонков и их суммаризация нужны частенько.


🤝🤝 Мультиагенты

Настройка моделей для решения определенных задач и взаимодействия друг с другом. Иногда эффективнее, чем заставлять решать сложные задачи одним агентом.

Реализаций много, e.g.: 👻 Coze.


🧩 Мультимодальность

Общение голосом (доступно в официальном мобильном клиенте ChatGPT), распознавание картинок.


⚒️ Заточенные инструменты

Некоторые ранее упомянутые сервисы имеют преднастройки вроде режима исследования, некоторые идут дальше.

Google NotebookLM базируется на AI Studio. Складирует и переваривает любой тип контента, даёт шаблоны сообщений для нейросеточки и даже генерирует Deep Dive подкаст на английском, где два ИИ обсуждают тему. Скриншот в комментариях.

Яндекс Редактор — улучшатор текста без необходимости писать промпты. Редактура слабая. Надеюсь, будут развивать.

Coder — IDE взаимодействующая с нейросетями. Есть похожие плагины для других.


🧐 Всякое

Автоматизация действий: zapier.com & make.com & etc. Примеры на сайтах.

300.ya.ru — пересказ Ютуб-видео и проставление таймкодов.

Harpa — расширение для браузера. Copilot из коробки добавлен в Edge — позволяет быстро задавать вопросы по видео или другому контенту на странице.

PromptPerfect — оптимизация промптов.

Reader-LM — HTML-to-Markdown. В большинстве случаев решается без всяких нейросетей плагином в браузере, упомянул для демонстрации широты применений. Есть и более узкие нейросети для биологии, медицины и прочего.


Погуглить дополнительные гайды — само собой разумеющееся.
Пост про вкат немного обновил.


#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 Искусственный интеллект

Cознание — сложный и, возможно, даже устаревший концепт. Где та грань, за которой можно считать систему сознательной? Животные, у которых тоже есть некий уровень восприятия и реакции на мир, не обладают своим видом сознания?

Лучшие нейросети пока остаются сложными алгоритмами глубокой обработки больших данных, которые могут строить внутри картину мира, эмулировать человеческие реакции и поведение в узконаправленных задачах.


Пока не существует схожего с человеческим «общего» интеллекта.
И не факт, что вообще появится, хотя точно станет значительно лучше, основные (не исчерпывающие) стороны для улучшений:

⭐️ Датасет
Количественно и качественно: получать размеченные данные не из верхнего интернета;

⭐️ Мощности и длительности обучения
GPT-4 была обучена на 25 тысячах видеокарт прошлого поколения, новые датацентры содержат 100 тысяч видеокарт нового поколения. Видеокарты можно и дальше делать мощнее и узконаправленнее;

⭐️ Алгоритмы рассуждения и самокоррекции
Лайв-фактчек информации в интернете и цепочки внутренних рассуждений как у OpenAI o1;

⭐️ UX интерфейса
NotebookLM, артефакты в Клоде, новое редактирование текста и войсмод в ChatGPT, режимы типа исследования, ассистенты, поддержка Экселя и других форматов;

⭐️ Архитектура
А также регуляризация, борьба с переобучением, переносное обучение, файн-тюнинг (и его упрощение), мультимодальность и всякое разное.


Обсуждая ИИ, иногда фокусируются на фантастических сценариях восстания машин. Более вероятной проблемой является не злой 😈 самостоятельный ИИ, а злые люди, использующие нейросети и другие технологии для создания дезинформации, оружия и вирусов.

Разрабатывающие нейросети компании давно поняли важность AI alignment: есть отдельные должности, следящие за поведением модели и данными, на которых они обучаются. Есть договоры. Есть опасения касательно пренебрежения главной OpenAI SuperAlignment'ом, но пока это некритично.

Гипотетически 🤯 «сверхинтеллект» возможен, хотя есть физические и алгоритмические ограничения. Как будет на практике, остаётся только наблюдать.

До выхода ЧатГПТ сами его разработчики толком не понимали что получится, хотели делать у версии 3.5 связь с интернетом, но реализовав выяснили, что справляется и без него.


Теория разума и то, как языковые модели её проходит

Ошибочная обобщенность цели

Книги для начала изучения ML

Awesome LLM resourses


#текст #нейро
Please open Telegram to view this post
VIEW IN TELEGRAM