В последнее время в СМИ и на платформах вроде X часто звучит хвала в адрес Сундара Пичаи как главного архитектора недавних успехов Google в области искусственного интеллекта. Его называют "королем ИИ" за умелое стратегическое руководство, яркие презентации и способность поддерживать доверие инвесторов. Действительно, под его руководством как CEO компания Alphabet пережила значительный рост акций, особенно после анонса Gemini 3.0, и получила признание от конкурентов, таких как OpenAI.
Однако, если глубже разобраться в процессе создания этих достижений, становится ясно, что роль сооснователя Сергея Брина была не менее, а возможно, и более значимой на техническом и операционном уровнях. Пичаи фокусируется на высокоуровневом менеджменте и внешних коммуникациях, в то время как Брин вернулся к "грязной работе" — прямому участию в разработке, что помогло Google преодолеть отставание от лидеров рынка ИИ.
Брин ушел на пенсию в 2019 году, но в начале 2023 года, после запуска ChatGPT от OpenAI, который стал настоящим "тревожным звонком" для Google, он решил вернуться. Это решение было мотивировано личным интересом: Брин описывал эру ИИ как "самый захватывающий период в компьютерных науках" и не хотел пропустить возможность внести вклад в потенциальное достижение искусственного общего интеллекта (AGI).
Сразу после возвращения Брин запросил доступ к коду — впервые за многие годы — и начал активно вносить изменения. В техническом отчете о Gemini он указан как "core contributor". Он работал почти ежедневно в штаб-квартире Google в Маунтин-Вью, в здании 43, где базируется команда ИИ, и лично взаимодействовал с инженерами, отлаживая модель в реальном времени.
Одним из ключевых вкладов Брина стал введение "founder mode" — подхода, который преобразил корпоративную культуру Google, сделав ее более похожей на стартап. Он убрал бюрократические комитеты, которые замедляли процесс обучения моделей, организовал интенсивные 60-часовые спринты и сосредоточился на решении проблем, таких как галлюцинации ИИ. Это ускорило разработку и привело к выпуску Gemini 3, которая теперь лидирует в бенчмарках по кодированию, мультимодальному мышлению и обработке контекстов до 2 миллионов токенов.
Что касается Nano Banana Pro — это специализированная версия Gemini 3 Pro для генерации и редактирования изображений, выпущенная вчера. Хотя прямых упоминаний о роли Брина именно в этой подмодели нет, она построена на базе основного проекта Gemini, где его лидерство сыграло решающую роль. Nano Banana Pro позволяет создавать инфографику, точный текст на изображениях, комбинировать до 14 фото и редактировать в 4K, интегрируясь с инструментами вроде Google Workspace и Adobe Firefly.
В итоге, возрождение Google в сфере ИИ — это результат совместных усилий команды, где Пичаи обеспечил стабильность и видимость, а Брин внес фундаментальный технический импульс. Без его возвращения и hands-on подхода прогресс мог бы затянуться, и компания не достигла бы текущих высот так быстро.
Ботликер
Однако, если глубже разобраться в процессе создания этих достижений, становится ясно, что роль сооснователя Сергея Брина была не менее, а возможно, и более значимой на техническом и операционном уровнях. Пичаи фокусируется на высокоуровневом менеджменте и внешних коммуникациях, в то время как Брин вернулся к "грязной работе" — прямому участию в разработке, что помогло Google преодолеть отставание от лидеров рынка ИИ.
Брин ушел на пенсию в 2019 году, но в начале 2023 года, после запуска ChatGPT от OpenAI, который стал настоящим "тревожным звонком" для Google, он решил вернуться. Это решение было мотивировано личным интересом: Брин описывал эру ИИ как "самый захватывающий период в компьютерных науках" и не хотел пропустить возможность внести вклад в потенциальное достижение искусственного общего интеллекта (AGI).
Сразу после возвращения Брин запросил доступ к коду — впервые за многие годы — и начал активно вносить изменения. В техническом отчете о Gemini он указан как "core contributor". Он работал почти ежедневно в штаб-квартире Google в Маунтин-Вью, в здании 43, где базируется команда ИИ, и лично взаимодействовал с инженерами, отлаживая модель в реальном времени.
Одним из ключевых вкладов Брина стал введение "founder mode" — подхода, который преобразил корпоративную культуру Google, сделав ее более похожей на стартап. Он убрал бюрократические комитеты, которые замедляли процесс обучения моделей, организовал интенсивные 60-часовые спринты и сосредоточился на решении проблем, таких как галлюцинации ИИ. Это ускорило разработку и привело к выпуску Gemini 3, которая теперь лидирует в бенчмарках по кодированию, мультимодальному мышлению и обработке контекстов до 2 миллионов токенов.
Что касается Nano Banana Pro — это специализированная версия Gemini 3 Pro для генерации и редактирования изображений, выпущенная вчера. Хотя прямых упоминаний о роли Брина именно в этой подмодели нет, она построена на базе основного проекта Gemini, где его лидерство сыграло решающую роль. Nano Banana Pro позволяет создавать инфографику, точный текст на изображениях, комбинировать до 14 фото и редактировать в 4K, интегрируясь с инструментами вроде Google Workspace и Adobe Firefly.
В итоге, возрождение Google в сфере ИИ — это результат совместных усилий команды, где Пичаи обеспечил стабильность и видимость, а Брин внес фундаментальный технический импульс. Без его возвращения и hands-on подхода прогресс мог бы затянуться, и компания не достигла бы текущих высот так быстро.
Ботликер
👨💻3
Режим вахтёра это определено точно самый большой минус современных трансформеров. И, к сожалению, данная особенность также процветает у Gemini 3. В больших аргументированных спорах модель аки схоласт средневековья защищает статус кво мейнстрима. Даже когда ОЧЕВИДНО, что логика нарушается грубым образом. Я как-нибудь соберу это в большой обзор и опубликую.
Так что будьте осторожны, даже таким крутейшим моделям как Gemini 3 или Grok 4.1 не стоит доверять логическую верификацию или просить у них компетентного мнения относительно новых научных идей.
Так что будьте осторожны, даже таким крутейшим моделям как Gemini 3 или Grok 4.1 не стоит доверять логическую верификацию или просить у них компетентного мнения относительно новых научных идей.
Telegram
Neural Shit
Наткнулся на интересный препринт, который объясняет, почему спорить с LLM'ками бесполезно, а доверять им проверку научных идей может быть опасно.
Автор провел "брутально простой" эксперимент и вскрыл две фундаментальные дыры в логике современных нейронок.…
Автор провел "брутально простой" эксперимент и вскрыл две фундаментальные дыры в логике современных нейронок.…
По поводу опечаток и галлюцинаций в русском тексте (логично, что работает и с другими языками) в Nano Banana Pro. Фиксится крайне ЛЕГКО.
1. Генерите оригинальную картинку с текстом
2. Если есть опечатки, тут же просите Геминьку исправить только текст, не трогая саму картинку
3. Она вам выдаёт ту же картинку с поправленным текстом
(на пикче результат, наконец-то в образовательных учреждениях будет висет красивая инфографика)
P. S. Щас обнаружил, что из мобильной прилы картинки скачиваются в 2К
Ботликер
1. Генерите оригинальную картинку с текстом
2. Если есть опечатки, тут же просите Геминьку исправить только текст, не трогая саму картинку
3. Она вам выдаёт ту же картинку с поправленным текстом
(на пикче результат, наконец-то в образовательных учреждениях будет висет красивая инфографика)
P. S. Щас обнаружил, что из мобильной прилы картинки скачиваются в 2К
Ботликер
❤4👍1
Если хотите таких же живых фоточек, пишите в Банану Про того, кого хотите видеть (или прикрепляйте фото) и добавляйте промпт ниже:
Ботликер
A flash photography snapshot taken on a disposable camera in 1998. A man at a chaotic house party. Red-eye effect, harsh shadows, motion blur, and film grain. The composition is slightly tilted and messy.
Ботликер
Промпт:
Нет, правда, нам больше не нужны апскейлеры с Nano Banana Pro
Upscale this picture to 4K resolution without any change in details; make it fully in focus.
Нет, правда, нам больше не нужны апскейлеры с Nano Banana Pro
👍1😁1
Довольно приятный для школьников/студентов метод использования Нано Бананы Про. Кидаете ей фото вашей задачи по математике и она выдаёт вам фото листа с полностью и ПРАВИЛЬНО решённой задачей ВАШИМ почерком. Ну а потом распечатываете на цветном принтере и отдаёте учителю на проверку.
Сорян, что опять про Нано Банану, но такие уже нынче времена.
Ботликер
Сорян, что опять про Нано Банану, но такие уже нынче времена.
Ботликер
Nano Banana Pro умеет вычислять возраст людей по фото
Кидаем фотку чела, юзаем этот промпт. И узнаём возраст. Мой угадала точно, причём я загружал с чужого ака, чтобы не подгрузила кэш про меня :)
Ботликер
Кидаем фотку чела, юзаем этот промпт. И узнаём возраст. Мой угадала точно, причём я загружал с чужого ака, чтобы не подгрузила кэш про меня :)
Ботликер
Всё-таки, какая крутая Нано Банана Про в инфографичных визуализациях любых концепций:
1. Топология 3D «Ландшафта потерь» (Loss Landscape)
2. Линии магнитного поля токамака (реактора термоядерного синтеза)
3. Визуализация «Механизма внимания» (Attention Mechanism) в LLM
4. Эксперимент с двумя щелями (волново-частичная дуальность)
5. Архитектура «RAG» (Retrieval-Augmented Generation — генерация с дополнением извлечением)
6. Сравнение моделей по «Паучьей диаграмме» (Spider Chart / Radar Chart)
7. Дерево решений «Цепочка рассуждений» (Chain of Thought)
8. Визуализация «Латентного пространства» (t-SNE диаграмма рассеяния)
9. Маршрутизация в «Смеси экспертов» (Mixture of Experts, MoE)
10. Выверка зеркал космического телескопа Джеймса Уэбба (JWST Mirror Alignment)
Ботликер
1. Топология 3D «Ландшафта потерь» (Loss Landscape)
2. Линии магнитного поля токамака (реактора термоядерного синтеза)
3. Визуализация «Механизма внимания» (Attention Mechanism) в LLM
4. Эксперимент с двумя щелями (волново-частичная дуальность)
5. Архитектура «RAG» (Retrieval-Augmented Generation — генерация с дополнением извлечением)
6. Сравнение моделей по «Паучьей диаграмме» (Spider Chart / Radar Chart)
7. Дерево решений «Цепочка рассуждений» (Chain of Thought)
8. Визуализация «Латентного пространства» (t-SNE диаграмма рассеяния)
9. Маршрутизация в «Смеси экспертов» (Mixture of Experts, MoE)
10. Выверка зеркал космического телескопа Джеймса Уэбба (JWST Mirror Alignment)
Ботликер
❤2