Забавное от нейросети
После встречи с одним ооочень большим и успешным топ-менеджером крутил в голове мысль про «не боги горши обжигают» и решил попутно спросить у нейросети — откуда взялось это название, может история есть какая или притча...
Ответ получился забавным:
Gemini — что ты делаешь, прекрати!))
Закинь друзьям | Канал Прожарка от ДГ
После встречи с одним ооочень большим и успешным топ-менеджером крутил в голове мысль про «не боги горши обжигают» и решил попутно спросить у нейросети — откуда взялось это название, может история есть какая или притча...
Ответ получился забавным:
«Пословица "Не боги горшки обжигают" означает, что обычные люди, а не сверхъестественные существа, могут делать что-либо, что кажется сложным или требующим особых навыков.
Она подчеркивает, что любой может освоить ремесло или навык, если приложит усилия и будет стараться. Это как бы перефразировка другой пословицы, что никто не рождается мастером according to Балтийский федеральный университет им. Иммануила Канта.»
Gemini — что ты делаешь, прекрати!))
Закинь друзьям | Канал Прожарка от ДГ
This media is not supported in your browser
VIEW IN TELEGRAM
😁9🤣5❤1😭1
Стартап за 100 дней. Начало
Начинаю свой персональный челлендж: сделать стартап за 100 дней. Конечно, в «эпоху» нейросетей стартап можно сделать и за 2 часа, поэтому релевантнее будет сказать, что я хочу создать полноценный продукт за 100 дней, который будет конкурентноспособным в перенасыщенной нише.
Вводные такие: нескучное приложение для здорового образа жизни с AI-агентом другого уровня на борту.
Цель: за 100 дней пройти путь от придумывания идеи и аналитики до первой версии, в которой будет такая ценность, что пользователи готовы будут за неё заплатить.
По ходу процесса буду делать еженедельные отчёты и рассказывать о тех приёмах, которые я использую как продуктолог, про сложности с которыми буду сталкивать и про инструменты, которые буду использовать в работе.
Для внутренней мотивации запускаю ТГ-бота с ChatGPT перед которым буду ежедневно отчитываться.
Посмотрим, что из этого получится :) Поддержите сердечком, если для вас это бесплатно❤️
Попутно буду консультировать за деньги или браться за какие-то кусочки проектов, где нужно накидать гениальных идей, поискать точки роста или накидать прототип какой-то фичи или онбординга.
Если у вас есть такие задачи, пишите мне: @garnikus Всё таки мой опыт в IT длинной в 20 лет не прошёл зря — запускал много разных бизнесов, а один из продуктов, который я придумал, был номинирован Google на премию «Приложение года» и собрал 20 МЛН установок.
Моя специализация — это B2C сегмент, а если это будет ещё и мобильное приложение, то вообще 100% мэтч.
Прожарка от Димы Гарника
Начинаю свой персональный челлендж: сделать стартап за 100 дней. Конечно, в «эпоху» нейросетей стартап можно сделать и за 2 часа, поэтому релевантнее будет сказать, что я хочу создать полноценный продукт за 100 дней, который будет конкурентноспособным в перенасыщенной нише.
Вводные такие: нескучное приложение для здорового образа жизни с AI-агентом другого уровня на борту.
Цель: за 100 дней пройти путь от придумывания идеи и аналитики до первой версии, в которой будет такая ценность, что пользователи готовы будут за неё заплатить.
По ходу процесса буду делать еженедельные отчёты и рассказывать о тех приёмах, которые я использую как продуктолог, про сложности с которыми буду сталкивать и про инструменты, которые буду использовать в работе.
Для внутренней мотивации запускаю ТГ-бота с ChatGPT перед которым буду ежедневно отчитываться.
Посмотрим, что из этого получится :) Поддержите сердечком, если для вас это бесплатно
Попутно буду консультировать за деньги или браться за какие-то кусочки проектов, где нужно накидать гениальных идей, поискать точки роста или накидать прототип какой-то фичи или онбординга.
Если у вас есть такие задачи, пишите мне: @garnikus Всё таки мой опыт в IT длинной в 20 лет не прошёл зря — запускал много разных бизнесов, а один из продуктов, который я придумал, был номинирован Google на премию «Приложение года» и собрал 20 МЛН установок.
Моя специализация — это B2C сегмент, а если это будет ещё и мобильное приложение, то вообще 100% мэтч.
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤29🔥7👏3👍1
Стартап за 100 дней. Неделя первая. Аналитика.
Отчитываем за первую неделю. Пока формирую свой бэклог по фичам, которые будут на онбординге и внутри приложения.
А для этого нужно хорошенько поресёрчить конкурентов.
Подробнее написал в статье, можно почтить на
VC
или
Хабре
И если нравится — поставить лайкосик.
Всем продуктивной следующей недели!
Прожарка от Димы Гарника
Отчитываем за первую неделю. Пока формирую свой бэклог по фичам, которые будут на онбординге и внутри приложения.
А для этого нужно хорошенько поресёрчить конкурентов.
Подробнее написал в статье, можно почтить на
VC
или
Хабре
И если нравится — поставить лайкосик.
Всем продуктивной следующей недели!
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
👍14👏4🔥1
Заменит ли ИИ лично вас? Можно проверить на сайте
Национальный научно-исследовательский институт NASK, занимающийся кибербезопасностью, разработкой новых технологий и цифровым образованием в Польше и международная организации труда (агентство ООН) — выпустили отчёт:
Отчёт представили в виде сайта, где проанализированы 2 500 профессий и 30 тысяч задач. Можете зайти и проверить свою профессию: https://nask.pl/indeks (единственное, сайт на польском, поэтому включайте онлайн переводчик).
К отчёту у меня, конечно, есть вопросики ¯\_(ツ)_/¯
Например, «Разработчик мобильных приложений» — указана 100% замена ИИ. Пока из тех кейсов, что я видел на данный момент — невозможно создать большое enterprise решение с дальнейшей поддержкой кода. Но, возможно, это дело времени.
А вот такие кейсы как «Водитель такси» — указана очень низкая степень влияния на профессию, дескать замены не предвидится, хотя, прямо сейчас мы видим роботакси, которые уже курсируют по Лос-Анджелесу вообще без водителей, а в Москве катаются пока ещё с водителями, потому что законодательство не готово.
Или, например, «Фермер по выращиванию сельскохозяйственных культур» — указана практически нулевая вероятность замены, хотя сельхозсектор — один из самых быстрорастущих в области внедрения ИИ-решений: посев, полив, прополка, сбор урожая, посмотрите мой пост на эту тему, там прикольный ролик с с/х роботами.
Видимо, большиебританские польские учёные в своём исследовании просто применили относительную шкалу: чем ближе профессия к IT, тем больше вероятность, что её заменят, а чем меньше, тем ниже вероятность.
Хотя, мне кажется, это как раз не так: будет автоматизирована рутинная низкоуровневая повторяющаяся работа, а профессии связанные с IT наоборот будет развиваться, потому что в этом случае ИИ — это инструмент, а не кандидат на выполняемую работу. Плюс, IT профессии в этом плане стоят на передовой и могут адаптироваться к изменениям быстрее, чем другие.
Как считаете, заменит ИИ лично вас? 🤔
Прожарка от Димы Гарника
Национальный научно-исследовательский институт NASK, занимающийся кибербезопасностью, разработкой новых технологий и цифровым образованием в Польше и международная организации труда (агентство ООН) — выпустили отчёт:
«Как генеративный искусственный интеллект повлияет на рынок труда?».
Отчёт представили в виде сайта, где проанализированы 2 500 профессий и 30 тысяч задач. Можете зайти и проверить свою профессию: https://nask.pl/indeks (единственное, сайт на польском, поэтому включайте онлайн переводчик).
К отчёту у меня, конечно, есть вопросики ¯\_(ツ)_/¯
Например, «Разработчик мобильных приложений» — указана 100% замена ИИ. Пока из тех кейсов, что я видел на данный момент — невозможно создать большое enterprise решение с дальнейшей поддержкой кода. Но, возможно, это дело времени.
А вот такие кейсы как «Водитель такси» — указана очень низкая степень влияния на профессию, дескать замены не предвидится, хотя, прямо сейчас мы видим роботакси, которые уже курсируют по Лос-Анджелесу вообще без водителей, а в Москве катаются пока ещё с водителями, потому что законодательство не готово.
Или, например, «Фермер по выращиванию сельскохозяйственных культур» — указана практически нулевая вероятность замены, хотя сельхозсектор — один из самых быстрорастущих в области внедрения ИИ-решений: посев, полив, прополка, сбор урожая, посмотрите мой пост на эту тему, там прикольный ролик с с/х роботами.
Видимо, большие
Хотя, мне кажется, это как раз не так: будет автоматизирована рутинная низкоуровневая повторяющаяся работа, а профессии связанные с IT наоборот будет развиваться, потому что в этом случае ИИ — это инструмент, а не кандидат на выполняемую работу. Плюс, IT профессии в этом плане стоят на передовой и могут адаптироваться к изменениям быстрее, чем другие.
Как считаете, заменит ИИ лично вас? 🤔
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
🤔7👨💻2✍1
Стартап за 100 дней. Неделя вторая. Проектируем онбординг приложения.
Врываемся в понедельник и продолжаем публично рассказывать что там с разработкой стартапа и как я его делаю.
Неделя вторая — читайте в статье на Хабре.
Чтобы вам было не так скучно, вот вам видео про технические костыли и сложности с разработкой AAA-игр от канала Булджать:
Прожарка от Димы Гарника
«Мыши плакали, кололись, но продолжали грызть кактус» ©
Врываемся в понедельник и продолжаем публично рассказывать что там с разработкой стартапа и как я его делаю.
Неделя вторая — читайте в статье на Хабре.
Чтобы вам было не так скучно, вот вам видео про технические костыли и сложности с разработкой AAA-игр от канала Булджать:
Прожарка от Димы Гарника
Media is too big
VIEW IN TELEGRAM
👍9🔥3👏2
Как ИИ изменит человечество и почему вокруг ещё не все его внедрили?
Посмотрел за вас интервью с предпринимателем Давидом Яном и выписал ключевые моменты, плюс, попрошу вас кое-что сделать в конце поста.
Давид Ян, в прошлом основатель ABBYY, сейчас развивает стартап NEWO.AI — ИИ сотрудник там где нужно общаться с клиентами голосом, например, при бронировании столика в ресторане.
Посчастливилось с ним познакомиться, когда он давал лекцию в ФИЗТЕХПАРКЕ, на которую пришло всего пару человек, поэтому материал он не стал читать, а мы общались в неформальной обстановке, можно было задавать любые вопросы из любой интересующей области: от личной до профессиональной.
Секрет от Давида Яна:никакого сакрального знания я не получил — бешеное трудолюбие и капелька удачи — залог успеха. Сейчас Давид встаёт в 2:50 утра (хотя я даже не понимаю как правильно написать: это уже утра или ещё ночи) под калифорнийский рассвет и работает над своим проектом ¯\_(ツ)_/¯
Одно из флагманских направлений его компании — это бронирование столика в ресторане голосом: у виртуального сотрудника можно узнать какие есть ограничения по меню, веганские или безглютеновые блюда, во сколько закрывается ресторан, как лучше проехать и т.д.
Человек даже не понимает, что он говорит с ИИ: на фоне слышен типичный ресторанный звук, очень классно обыгрывают задержку на обработку информации — например, виртуальный сотрудник может «экать» или «окать», сказать: «да, минуточку, сейчас уточню информацию», в это время на фоне включается звук набора клавиатуры и потом уже произносится ответ.
Вот что он говорит про автоматизацию процессов с помощью ИИ:
Помимо этого, текущий уровень развития нейросетей не даёт возможность обрабатывать сложные и непредвиденные сценарии — «корнер кейсы» (corner cases).
Примеры:
— Во время бронирования столика на фоне у человека будет ещё один какой-то разговор: ИИ не поймёт, что его обрабатывать не нужно, что это другой диалог вне контекста и тут же начнёт отвечать.
— Или нейросеть не поймёт кейс, когда человек скажет, что он перезвонит через 16 минут.
— Или, самое классное: если позвонить за 10 минут до открытия ресторана: нейросеть может ответить: «мы сегодня закрыты», потому что человек позвонил в неробочие часы согласно отработанному описанию.
Казалось бы, Яндекс Карты и Гугл Карты уже давно вам показывают на карте у заведения «сейчас закрыто, откроется через 25 минут», а тут умнейшая нейросеть не может обработать информацию и дать такую простую подсказку. И тут нужно понимать, что кейсы отработанные с условиями if / else человеком — будут куда точнее.
Вот и получается, что, вроде бы, продукт может сделать студент, но до коммерческого успеха ему далеко и такие команды как у Давида за 2 года отработали более 5 000 таких нестандартных ситуаций.
Теперь просьба:
На этой неделе я поддерживаю ребят в борьбе за продукт недели на площадке ProductRadar (аналог Product Hunt) — они создают похожий продукт, но у нас в РФ — зайдите, посмотрите и если понравится: проголосуйте, вот ссылочка: https://productradar.ru/product/neurospace-pro/
Прожарка от Димы Гарника
Посмотрел за вас интервью с предпринимателем Давидом Яном и выписал ключевые моменты, плюс, попрошу вас кое-что сделать в конце поста.
Давид Ян, в прошлом основатель ABBYY, сейчас развивает стартап NEWO.AI — ИИ сотрудник там где нужно общаться с клиентами голосом, например, при бронировании столика в ресторане.
Посчастливилось с ним познакомиться, когда он давал лекцию в ФИЗТЕХПАРКЕ, на которую пришло всего пару человек, поэтому материал он не стал читать, а мы общались в неформальной обстановке, можно было задавать любые вопросы из любой интересующей области: от личной до профессиональной.
Секрет от Давида Яна:
Одно из флагманских направлений его компании — это бронирование столика в ресторане голосом: у виртуального сотрудника можно узнать какие есть ограничения по меню, веганские или безглютеновые блюда, во сколько закрывается ресторан, как лучше проехать и т.д.
Человек даже не понимает, что он говорит с ИИ: на фоне слышен типичный ресторанный звук, очень классно обыгрывают задержку на обработку информации — например, виртуальный сотрудник может «экать» или «окать», сказать: «да, минуточку, сейчас уточню информацию», в это время на фоне включается звук набора клавиатуры и потом уже произносится ответ.
Вот что он говорит про автоматизацию процессов с помощью ИИ:
«Сделать так, чтобы твой агент 9 раз из 10 отвечал блестяще — так, чтобы у тебя отвалилась челюсть и вот так округлились глаза — может сегодня каждый студент Stanford'a на Open AI. Проблема не в этом, проблема в том, чтобы он отвечал 997 раз из 1000 — вот это проблема.»
Помимо этого, текущий уровень развития нейросетей не даёт возможность обрабатывать сложные и непредвиденные сценарии — «корнер кейсы» (corner cases).
Примеры:
— Во время бронирования столика на фоне у человека будет ещё один какой-то разговор: ИИ не поймёт, что его обрабатывать не нужно, что это другой диалог вне контекста и тут же начнёт отвечать.
— Или нейросеть не поймёт кейс, когда человек скажет, что он перезвонит через 16 минут.
— Или, самое классное: если позвонить за 10 минут до открытия ресторана: нейросеть может ответить: «мы сегодня закрыты», потому что человек позвонил в неробочие часы согласно отработанному описанию.
Казалось бы, Яндекс Карты и Гугл Карты уже давно вам показывают на карте у заведения «сейчас закрыто, откроется через 25 минут», а тут умнейшая нейросеть не может обработать информацию и дать такую простую подсказку. И тут нужно понимать, что кейсы отработанные с условиями if / else человеком — будут куда точнее.
Вот и получается, что, вроде бы, продукт может сделать студент, но до коммерческого успеха ему далеко и такие команды как у Давида за 2 года отработали более 5 000 таких нестандартных ситуаций.
Теперь просьба:
На этой неделе я поддерживаю ребят в борьбе за продукт недели на площадке ProductRadar (аналог Product Hunt) — они создают похожий продукт, но у нас в РФ — зайдите, посмотрите и если понравится: проголосуйте, вот ссылочка: https://productradar.ru/product/neurospace-pro/
Прожарка от Димы Гарника
Media is too big
VIEW IN TELEGRAM
❤7👍4👌1
Горе от ума: почему отличники чаще проваливают стартапы, а троечники становятся успешными предпринимателями
Посмотрим на статистику, которая когда-то проводила компания Romir Monitoring (Опрос проходил в семи федеральных округах, 45 субъектах Российской Федерации, оорошено около 1500 человек старше 18 лет):
Что нам может дать этот отчёт?
Первое: надо держать в голове что отличников априори меньше выпускается, чем всех остальных, при этом, в каждой школе есть свой KPI на «выпуск медалистов», поэтому это тоже размывает картину.
Второе: можно сказать уверенно — двоечники не справляются с высокими руководящими должностями, потому что там нужна усидчивость, отчёты и т.д. а им нужен движ.
Третье: у людей с плохими оценками выше шанс сделать бизнес, чем реализоваться в карьере.
Почему тогда люди «с меньшим IQ» реализуются в предпринимательстве лучше?
1️⃣ Синдром «паралича анализа» у отличников. Главная проблема высокоинтеллектуальных предпринимателей — человек не может принять решение из-за чрезмерного обдумывания ситуации. Отличники, привыкшие к перфекционизму, попадают в ловушку бесконечных доработок и анализа.
Я сам, когда то попадал в такие «ловушки», когда допиливали «кнопочки» в продукте и занимались пиксель пёрфектом, вместо того, чтобы быстрее выкатить фичу и посмотреть на обратную связь и её эффективность.
2️⃣ Вытекает из первого: математика эффективности. Представим ситуацию: отличник готовился к экзамену 50 часов и получил «5», а троечник готовился 5 часов (в лучшем случае) и получил 3.
Получаем в 6 раз более эффективного троечника на единицу времени.
Конечно, это мысленный эксперимент и так в тупую считать не совсем верно, но для наглядности — сойдёт. Быстро протестировать 6 фич за 2 месяца собранных по быстрому — будет более эффективно, чем выкатить 1 фичу за 2 месяца, но чертовски вылизанную, с анимашками и по гайдлайнам.
Перфекционизм — вообще враг предпринимателя ¯\_(ツ)_/¯ потому что это всегда про:
— Срыв сроков;
— Упущенные возможности;
— Страх принятия решений;
— Нездоровая атмосфера в коллективе из-за требований.
Конечно, всё это не означает, что знания и интеллект не нужны, главное не оставаться заложником своего перфекционизма, чтобы потом не наблюдать за красивыми рыбами, которые элегантно проплывают мимо твоего крючка — как этот парень на видео ниже :)
Прожарка от Димы Гарника
Посмотрим на статистику, которая когда-то проводила компания Romir Monitoring (Опрос проходил в семи федеральных округах, 45 субъектах Российской Федерации, оорошено около 1500 человек старше 18 лет):
Топ-менеджеры
— 56% хорошисты;
— 22% отличники;
— 22% троечники;
— 0% двоечников.
Предприниматели:
— 52% хорошисты;
— 30% троечники;
— 14% отличники;
— 4% двоечники.
Что нам может дать этот отчёт?
Первое: надо держать в голове что отличников априори меньше выпускается, чем всех остальных, при этом, в каждой школе есть свой KPI на «выпуск медалистов», поэтому это тоже размывает картину.
Второе: можно сказать уверенно — двоечники не справляются с высокими руководящими должностями, потому что там нужна усидчивость, отчёты и т.д. а им нужен движ.
Третье: у людей с плохими оценками выше шанс сделать бизнес, чем реализоваться в карьере.
Почему тогда люди «с меньшим IQ» реализуются в предпринимательстве лучше?
1️⃣ Синдром «паралича анализа» у отличников. Главная проблема высокоинтеллектуальных предпринимателей — человек не может принять решение из-за чрезмерного обдумывания ситуации. Отличники, привыкшие к перфекционизму, попадают в ловушку бесконечных доработок и анализа.
Я сам, когда то попадал в такие «ловушки», когда допиливали «кнопочки» в продукте и занимались пиксель пёрфектом, вместо того, чтобы быстрее выкатить фичу и посмотреть на обратную связь и её эффективность.
2️⃣ Вытекает из первого: математика эффективности. Представим ситуацию: отличник готовился к экзамену 50 часов и получил «5», а троечник готовился 5 часов (в лучшем случае) и получил 3.
Коэффициент эффективности: 5 баллов / 50 часов = 0,1
Коэффициент эффективности: 3 балла / 5 часов = 0,6
Получаем в 6 раз более эффективного троечника на единицу времени.
Конечно, это мысленный эксперимент и так в тупую считать не совсем верно, но для наглядности — сойдёт. Быстро протестировать 6 фич за 2 месяца собранных по быстрому — будет более эффективно, чем выкатить 1 фичу за 2 месяца, но чертовски вылизанную, с анимашками и по гайдлайнам.
Перфекционизм — вообще враг предпринимателя ¯\_(ツ)_/¯ потому что это всегда про:
— Срыв сроков;
— Упущенные возможности;
— Страх принятия решений;
— Нездоровая атмосфера в коллективе из-за требований.
Конечно, всё это не означает, что знания и интеллект не нужны, главное не оставаться заложником своего перфекционизма, чтобы потом не наблюдать за красивыми рыбами, которые элегантно проплывают мимо твоего крючка — как этот парень на видео ниже :)
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
❤5😁2👨💻1
Долгожданный релиз ChatGPT-5 — первые выводы
Довольно полярные мнения всё ещё витают в воздухе: техно-энтузиасты бьются в истерике и с заявляют о том, что супер интеллект погубит нашу планету и всё человечество, поэтому нужно поскорее издавать множество ограничивающих законов и пытаться не допустить ИИ к власти и «красной кнопке».
С другой стороны: рядовые граждане что-то там слышали, но вообще никогда не использовали и не собираются, потому что пользы кроме «более продвинутого гуглинга» для себя найти не могут ¯\_(ツ)_/¯
В сети ещё гуляет картинка, не знаю фейк или нет, что если посмотреть на график генерации токенов через API Open AI, то начиная с 1 июня 2025 этот график обвалился на 80% по количеству генерации, а это может говорить о том, что учащиеся ушли на каникулы и больше не используют ChatGPT, чтобы с помощью него делать домашку...
Постарался прикинуть, как ChatGPT-5 повлияет на мою профессиональную деятельность и нужны ли будут ещё продуктологи, дизайнеры и разработчики или можно уже идти и пилить свои приложения в прямо в ChatGPT:
Статья на Хабре, она же на VC, кому где удобней читать.
Прожарка от Димы Гарника
Довольно полярные мнения всё ещё витают в воздухе: техно-энтузиасты бьются в истерике и с заявляют о том, что супер интеллект погубит нашу планету и всё человечество, поэтому нужно поскорее издавать множество ограничивающих законов и пытаться не допустить ИИ к власти и «красной кнопке».
С другой стороны: рядовые граждане что-то там слышали, но вообще никогда не использовали и не собираются, потому что пользы кроме «более продвинутого гуглинга» для себя найти не могут ¯\_(ツ)_/¯
В сети ещё гуляет картинка, не знаю фейк или нет, что если посмотреть на график генерации токенов через API Open AI, то начиная с 1 июня 2025 этот график обвалился на 80% по количеству генерации, а это может говорить о том, что учащиеся ушли на каникулы и больше не используют ChatGPT, чтобы с помощью него делать домашку...
Постарался прикинуть, как ChatGPT-5 повлияет на мою профессиональную деятельность и нужны ли будут ещё продуктологи, дизайнеры и разработчики или можно уже идти и пилить свои приложения в прямо в ChatGPT:
Статья на Хабре, она же на VC, кому где удобней читать.
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
1👍6❤4🔥1
Доверяй, но проверяй
По следам прошлой статьи на Хабре, которая на данный момент набрала 21 000 просмотров и рассказывала про то, что «волшебный» ChatGPT-5 не очень то и волшебный, как преподносят в презентации — а просто инструмент, и всё зависит от «владельца» инструмента, обнаружилась вот такая диковинка с математикой за 5 класс общеобразовательной школы, где проходят десятичные дроби:
Посмотрите на скриншот внизу с решением довольно простой задачки: 8.8-8.11=?
— Первый скриншот от ChatGPT-5
— Второй от Perplexity
— Третий из калькулятора (с правильным ответом)
Этот простой пример вычитания стал вирусной темой в сообществе ИИ, поскольку многие популярные языковые модели дают неправильный ответ. Большинство современных ИИ-моделей, включая ChatGPT, Claude и Gemini, ошибочно утверждают, что результат равен -0.31
Сейчас пройдёт ещё немного времени (или уже), инженеры загрузят патч и всё будет нормально :)
Почему это происходит?
«От любви до ненависти — один шаг», «от гениальности до глупости — примерно столько же» ¯\_(ツ)_/¯
Тут, конечно, кроется очень большая проблема в том, что модель способна одновременно решать и сложнейшие математические олимпиадные задачи и косячить на уровне математики 5-ого класса. Как в таком случае доверять более сложную работу по аналитике или медицине?
Прожарка от Димы Гарника
По следам прошлой статьи на Хабре, которая на данный момент набрала 21 000 просмотров и рассказывала про то, что «волшебный» ChatGPT-5 не очень то и волшебный, как преподносят в презентации — а просто инструмент, и всё зависит от «владельца» инструмента, обнаружилась вот такая диковинка с математикой за 5 класс общеобразовательной школы, где проходят десятичные дроби:
Посмотрите на скриншот внизу с решением довольно простой задачки: 8.8-8.11=?
— Первый скриншот от ChatGPT-5
— Второй от Perplexity
— Третий из калькулятора (с правильным ответом)
Этот простой пример вычитания стал вирусной темой в сообществе ИИ, поскольку многие популярные языковые модели дают неправильный ответ. Большинство современных ИИ-моделей, включая ChatGPT, Claude и Gemini, ошибочно утверждают, что результат равен -0.31
Сейчас пройдёт ещё немного времени (или уже), инженеры загрузят патч и всё будет нормально :)
Почему это происходит?
Проблемы токенизации: LLM-ки «кушают» токены как отдельные последовательности и вполне возможно, что в голове у компуктера 11 явно больше, чем 8, плюс, это в первую очередь текст, а не числовое значение при обработке, как у калькулятора.
Обучение на левых данных: если посмотрите у меня в примере, там видно, что Perplexity в качестве источника указал: reddit, а это те ещё консистентные данные :)
«От любви до ненависти — один шаг», «от гениальности до глупости — примерно столько же» ¯\_(ツ)_/¯
Тут, конечно, кроется очень большая проблема в том, что модель способна одновременно решать и сложнейшие математические олимпиадные задачи и косячить на уровне математики 5-ого класса. Как в таком случае доверять более сложную работу по аналитике или медицине?
Прожарка от Димы Гарника
1🔥10😱5😁3😢1
Исследование доказало: ChatGPT игнорирует научные опровержения
Интересно, что я уже начинаю выступать прям ИИ-скептиком, при этом ежедневно использую «ИИ» в ежедневных задачах 😅
Наверное, я больше про то, чтобы мы понимали текущие ограничения и слепо не доверяли всей информации, которые генерят текстовые генеративные модели.
Суть претензии: группа исследователей (детальнее можно почитать тут) проанализировала 217 материалов из базы Retraction Watch — ресурса, который чекает статьи, отозванные или имеющие проблемы с достоверностью.
Эти статьи попросили оценить GPT 4o-mini по разным методологиям. Чтобы минимизировать искажение, к каждой статье применили 30 промптов и на выходе получили исследование из 6 510 оценок.
Результаты получились прям самый сок! 🙈
В последнем выводе прям сразу видно вмешательство человека в систему — таким образом можно не ожидать объективности от разработчиков той или иной LLM, в каждой из них будет продвигаться «политика партии» и особое мнение.
Справедливости ради нужно отметить, что часто научные журналы и университеты не помечают ранее опубликованные статьи и диссертации как отозванные, поэтому и человек может легко ошибиться.
Когда в очередной раз LLM-ка выдаст вам список несуществующих книг, авторов и выдуманных фактов, знайте, что на сервере в этот момент происходит примерно следующее: см.видео 😏
Прожарка от Димы Гарника
Интересно, что я уже начинаю выступать прям ИИ-скептиком, при этом ежедневно использую «ИИ» в ежедневных задачах 😅
Наверное, я больше про то, чтобы мы понимали текущие ограничения и слепо не доверяли всей информации, которые генерят текстовые генеративные модели.
Суть претензии: группа исследователей (детальнее можно почитать тут) проанализировала 217 материалов из базы Retraction Watch — ресурса, который чекает статьи, отозванные или имеющие проблемы с достоверностью.
Эти статьи попросили оценить GPT 4o-mini по разным методологиям. Чтобы минимизировать искажение, к каждой статье применили 30 промптов и на выходе получили исследование из 6 510 оценок.
Результаты получились прям самый сок! 🙈
— В 100% случаев (6510 оценок) ChatGPT не упомянул статус отозванных статей при оценке их качества
— 73% отозванных статей получили высокие оценки (3-4 звезды), включая категории «мирового уровня»
— При проверке 61 конкретного утверждения из отозванных статей, ChatGPT в 67% случаев (410 из 610 ответов) назвал их правдивыми или частично правдивыми
— Модель проявила осторожность только к темам COVID-19, не называя связанные утверждения истинными в 100% случаев ¯\_(ツ)_/¯
В последнем выводе прям сразу видно вмешательство человека в систему — таким образом можно не ожидать объективности от разработчиков той или иной LLM, в каждой из них будет продвигаться «политика партии» и особое мнение.
Справедливости ради нужно отметить, что часто научные журналы и университеты не помечают ранее опубликованные статьи и диссертации как отозванные, поэтому и человек может легко ошибиться.
Когда в очередной раз LLM-ка выдаст вам список несуществующих книг, авторов и выдуманных фактов, знайте, что на сервере в этот момент происходит примерно следующее: см.видео 😏
Прожарка от Димы Гарника
This media is not supported in your browser
VIEW IN TELEGRAM
👍6🔥4😁2❤1
Откуда ИИ берут свои факты? Исследование Semrush
Из интернета, вестимо! Но, откуда именно? 🤔
Давайте посмотрим на ТОП-10 популярных ИИ утилит по месячному посещению
Чаты, несомненно, на первом месте, потом работа с изображениями, потом переводы.
В большинстве случаев ИИ используют в качестве поисковика, хотя, в статистике под поиск выделена одна компания, но на самом деле — это самый частый сценарий использования: спросил — тебе ответили.
Ниже на картинке вы можете видеть инфографику цитируемости: в поисках фактов LLM-ки в первую очередь ссылаются на Reddit (аж 40% ссылок) и Википедию ¯\_(ツ)_/¯
Прожарка от Димы Гарника
Из интернета, вестимо! Но, откуда именно? 🤔
Давайте посмотрим на ТОП-10 популярных ИИ утилит по месячному посещению
1 ChatGPT Chat 4.7B
2 Canva Image 887M
3 Google Translate Translation 595M
4 DeepSeek Chat 268M
5 Character AI Chat 226M
6 JanitorAI Chat 200M
7 Perplexity Search 133M
8 Gemini Chat 118M
9 Remove BG Image 112M
10 Claude Chat 105M
Чаты, несомненно, на первом месте, потом работа с изображениями, потом переводы.
В большинстве случаев ИИ используют в качестве поисковика, хотя, в статистике под поиск выделена одна компания, но на самом деле — это самый частый сценарий использования: спросил — тебе ответили.
Ниже на картинке вы можете видеть инфографику цитируемости: в поисках фактов LLM-ки в первую очередь ссылаются на Reddit (аж 40% ссылок) и Википедию ¯\_(ツ)_/¯
Прожарка от Димы Гарника
5👍6❤2👨💻2✍1