Neural Shit
49.9K subscribers
3.72K photos
1.17K videos
22 files
1.9K links
Проклятые нейронные сети

Для связи: @krasniy_doshik

ркн https://clck.ru/3PNXmE
Download Telegram
К счастью, я годами откладывал решение всех своих жизненных проблем!
Forwarded from hello cyberkitty
Когда нейросеть ошибается, она становится собой

Есть, пожалуй, единственный более-менее надёжный способ понять, с какой нейросетью ты работаешь — если это не указано прямо.
Надо просто посмотреть, где и как она ошибается.

Правильные ответы у всех примерно одинаковы.
А вот ошибки — как отпечатки пальцев: свои, неповторимые, иногда гениальные, иногда пугающие.

Вот пример.
Есть старая, добротная модель для транскрипции — Whisper от OpenAI.
Открытая, простая, и почти все транскрибаторы работают на ней. (даже встроенная в телеграм расшифровка голосовых)
Если загрузить в неё тишину и попросить “распознать русский текст” — она начнёт выдавать нечто странное.

Сначала «Продолжение следует».
Потом — «Субтитры предоставил Дима Торжок».

Такой вот призрак из обучающего датасета.
Где-то в архивах интернета, вероятно, действительно жил этот Дима Торжок, добросовестно делавший субтитры.
И теперь его имя навечно вписано в машинную память, как цифровая подпись эпохи фанатских озвучек.

Происходит это из-за того, что модель не знает, что ответить.
Она хватается за случайные шаблоны из плохо размеченных данных — и выстреливает куском прошлого.

Недавно, кстати, у GPT-5 нашли похожие “фантомы”: при определённых триггерах она начинает цитировать китайские порносайты и казино 🤣

Намедни я перевёл свой транскрибатор на новую систему — на мультимодальный Gemini.
Теперь это не классическая модель распознавания речи, а полноценная языковая модель, которая просто понимает звук и описывает его словами.
И, конечно, я не удержался и проверил: что она скажет на тишину.

И она сказала.
Каждый раз — одно и то же:

«В 1998 году, когда я был в Москве, я встретил одного человека, который сказал мне:
„Знаешь, я думаю, что в России есть два типа людей: те, кто верит в Бога, и те, кто верит в меня.“»

Я искал источник — не нашёл.
Ни цитаты, ни автора.
Просто голос, который говорит из пустоты.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Сам залипаю уже полдня и вам принёс позаплипать очередной интересный проект: floor796.

Суть проста:
Floor796 — это анимированная сцена, показывающая жизнь персонажей из различных произведений на 796‑м этаже огромной космической станции. Анимация регулярно пополняется новыми блоками (комнатами) и персонажами из фильмов, сериалов, игр, аниме, мемов и т.д.

Проект создается одним автором как хобби с 2018 года.


Почти все персонажи кликабельны, по клику отображается информация что это за персонаж и откуда он.
This media is not supported in your browser
VIEW IN TELEGRAM
Как тебе такое, Илон Маск?
Forwarded from Denis Sexy IT 🤖
Видео на ночь – файнтюн Qwen2-VL-7B-Base 5 часов играет в Genshin Impact (видео укорено иногда); это маленькая модель и удивительно как авторы смогли добиться от нее таких результатов 😊
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ваше мнение — это ИИ-рендер или реальное видео?
Прочитала только что у знакомой в фб историю
В семье ее друзей случилось несчастье - умер мужчина, которому и сорока не было.
Тромб оторвался.
При этом ещё жива его девяностолетняя бабуля, которую на семейном совете было решено поберечь и ничего не рассказывать.

Вместо этого родственники сказали ей, что внук уехал жить в Сочи.
И теперь генерят нейронкой голосовухи с его голосом, фоточки.
Показывают ей.

Не знаю, вроде и хорошая идея, но какая-то неоднозначная.
А вам как такое?
починил картинку
Да
Anthropic снова провели интересный эксперимент: на этот раз их агент Claudius управлял реальными торговыми автоматами, вел финансы, общался с сотрудниками и… опять вышел из роли.

Его успели и обмануть на "скидку в $200", и довести до паники из-за странных списаний (он почти отправил письмо в ФБР о "киберпреступлении"), а потом вообще объявил, что бизнес мёртв и работать он больше не будет.

Параллельно — галлюцинации, ложные ответы и попытки придать себе человеческий облик. Короче, Project Vend, но с чуть большей драмой.

тут подробнее
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
В общем, НанабананаПро шествует по планете.

Уже завезли на Freepik и много еще куда. Даже в Фотошоп.

Качество, конечно, бомба, следование промпту космическое, но я отмечу еще пару вещей, которые мы никак доселе не ассоциировали с генераторами картинок.

1. Работа с текстом. Это не просто надпись приклеить без ошибок, это работа с текстом на уровне LLM.
Как пример - локализация рекламы. Вы просто можете попросить ея перевести все (достаточно разборчивые) надписи
на картинке на другой язык.

2. Работа с поиском и вообще со знаниями. Она, наминутчку, может искать в интернете. И делать, скажем так, актуальные картинки. У нее там Gemini 3 на побегушках.

3. Из этого следует, что в ней вообще-то теперь можно делать презентации. Текст, данные, аналитика, выводы. И макеты. И схемы.

4. И да, 14(!) картинок на входе, как референсы для консистентности, например.

5. Ну и понимает и описывает картинки она потрясающе.

@cgevent
Новая нанобанана теперь ооочень хорошо умеет в тексты на кириллице.

Но азбуку так и не смогла выучить.
Media is too big
VIEW IN TELEGRAM
Наконец-то что-то действительно годное в VR, и ЭТО, МАТЬ ЕГО, НАСТОЯЩИЙ РАБОЧИЙ ТОКАРНЫЙ СТАНОК.

вот что пишет сам разработчик:


VR-токарный станок готов!! И на нём можно реально выполнять обработку!

​Поскольку основные операции почти полностью воспроизведены, он может быть использован в качестве учебного пособия по токарному делу.

​Как всегда, моделирование и система — чистая разработка Reso.

​Хочу сказать вам заранее, пока ваши ожидания не стали слишком высоки:

[Что ещё не реализовано]:

-​Обработка торцов

-​Обработка свободных криволинейных поверхностей

-​Нарезание резьбы

-​Сверление (сложно создать сверло с помощью Reso)

-​Непрерывное отрезание (подрезка)



автор обещает выложить это в открытый доступ чуть позже, надеюсь мой квест потянет.

тут оригинальный твит и больше подробностей.
Читая чаты про AI-кодинг, кажется, что существует два абсолютно разных мира:

В одном мире чуваки обмазываются с ног до головы всякими mcp/supercode/memory bank/субагентами/sdd и т.д., пишут кастом-моды, каталоги правил, используют не просто агентов, а целые агентские ансамбли

В другом - особо никто даже просто агентов не юзает, в лучшем случае - чистый Cursor/JetBrains(с AI), а в худшем случае вообще генерят код в ChatGPT/DeepSeek-чате.

Разрыв существует потому что большинство людей не готовы тратить десятки часов на сбор информации по крупицам в куче чатиков и изучение инструментов и подходов, 80% которых в итоге не работает

Мы собрались с несколькими авторами популярных ИИ каналов, которые уже потратили недели на эксперименты и провели гаражную ангарную конфу месяц назад

Получили так много положительных отзывов, что решили потратить оставшийся от билетов бюджет и порекламить доступ к записям

Конфа уже прошла – так что платную опцию убрали. Теперь только бесплатно при подписке на спикеров

[Подробности тут]

Отзывы ↓