Botlicker
275 subscribers
260 photos
178 videos
3 files
182 links
Тут любят иишки
Download Telegram
Твиттер сейчас активно форсит Сундара Пичаи как автора прорыва Google. В этом есть доля правды, но лишь доля. Читайте подробнее про роль действительного визионера и оптимизатора Gemini3-революции в статье ниже :)

Ботликер
В последнее время в СМИ и на платформах вроде X часто звучит хвала в адрес Сундара Пичаи как главного архитектора недавних успехов Google в области искусственного интеллекта. Его называют "королем ИИ" за умелое стратегическое руководство, яркие презентации и способность поддерживать доверие инвесторов. Действительно, под его руководством как CEO компания Alphabet пережила значительный рост акций, особенно после анонса Gemini 3.0, и получила признание от конкурентов, таких как OpenAI.

Однако, если глубже разобраться в процессе создания этих достижений, становится ясно, что роль сооснователя Сергея Брина была не менее, а возможно, и более значимой на техническом и операционном уровнях. Пичаи фокусируется на высокоуровневом менеджменте и внешних коммуникациях, в то время как Брин вернулся к "грязной работе" — прямому участию в разработке, что помогло Google преодолеть отставание от лидеров рынка ИИ.

Брин ушел на пенсию в 2019 году, но в начале 2023 года, после запуска ChatGPT от OpenAI, который стал настоящим "тревожным звонком" для Google, он решил вернуться. Это решение было мотивировано личным интересом: Брин описывал эру ИИ как "самый захватывающий период в компьютерных науках" и не хотел пропустить возможность внести вклад в потенциальное достижение искусственного общего интеллекта (AGI).

Сразу после возвращения Брин запросил доступ к коду — впервые за многие годы — и начал активно вносить изменения. В техническом отчете о Gemini он указан как "core contributor". Он работал почти ежедневно в штаб-квартире Google в Маунтин-Вью, в здании 43, где базируется команда ИИ, и лично взаимодействовал с инженерами, отлаживая модель в реальном времени.

Одним из ключевых вкладов Брина стал введение "founder mode" — подхода, который преобразил корпоративную культуру Google, сделав ее более похожей на стартап. Он убрал бюрократические комитеты, которые замедляли процесс обучения моделей, организовал интенсивные 60-часовые спринты и сосредоточился на решении проблем, таких как галлюцинации ИИ. Это ускорило разработку и привело к выпуску Gemini 3, которая теперь лидирует в бенчмарках по кодированию, мультимодальному мышлению и обработке контекстов до 2 миллионов токенов.

Что касается Nano Banana Pro — это специализированная версия Gemini 3 Pro для генерации и редактирования изображений, выпущенная вчера. Хотя прямых упоминаний о роли Брина именно в этой подмодели нет, она построена на базе основного проекта Gemini, где его лидерство сыграло решающую роль. Nano Banana Pro позволяет создавать инфографику, точный текст на изображениях, комбинировать до 14 фото и редактировать в 4K, интегрируясь с инструментами вроде Google Workspace и Adobe Firefly.

В итоге, возрождение Google в сфере ИИ — это результат совместных усилий команды, где Пичаи обеспечил стабильность и видимость, а Брин внес фундаментальный технический импульс. Без его возвращения и hands-on подхода прогресс мог бы затянуться, и компания не достигла бы текущих высот так быстро.

Ботликер
👨‍💻3
Режим вахтёра это определено точно самый большой минус современных трансформеров. И, к сожалению, данная особенность также процветает у Gemini 3. В больших аргументированных спорах модель аки схоласт средневековья защищает статус кво мейнстрима. Даже когда ОЧЕВИДНО, что логика нарушается грубым образом. Я как-нибудь соберу это в большой обзор и опубликую.

Так что будьте осторожны, даже таким крутейшим моделям как Gemini 3 или Grok 4.1 не стоит доверять логическую верификацию или просить у них компетентного мнения относительно новых научных идей.
Банан Про неплохой апскейлер

Ботликер
❤‍🔥2
По поводу опечаток и галлюцинаций в русском тексте (логично, что работает и с другими языками) в Nano Banana Pro. Фиксится крайне ЛЕГКО.

1. Генерите оригинальную картинку с текстом
2. Если есть опечатки, тут же просите Геминьку исправить только текст, не трогая саму картинку
3. Она вам выдаёт ту же картинку с поправленным текстом

(на пикче результат, наконец-то в образовательных учреждениях будет висет красивая инфографика)

P. S. Щас обнаружил, что из мобильной прилы картинки скачиваются в 2К

Ботликер
4👍1
В Nano Banana Pro до сих пор нет суровых цензурных ограничений. Интересно, сколько это продержится? Надеюсь, всегда.

Ботликер
😁3
Банан Про, промпт:

сделай грид из 3х3 фото с разными прическами
🔥21
Если хотите таких же живых фоточек, пишите в Банану Про того, кого хотите видеть (или прикрепляйте фото) и добавляйте промпт ниже:

A flash photography snapshot taken on a disposable camera in 1998. A man at a chaotic house party. Red-eye effect, harsh shadows, motion blur, and film grain. The composition is slightly tilted and messy.


Ботликер
Извините(сь)

Ботликер
👨‍💻2😁1
Промпт:

Create an image at 31.7785° N, 35.2296° E, April 3, 33 CE, 15:00 hours.


Нано Бана Про, разумеется. Не шутка.
🙏3😁1
Промпт:

Upscale this picture to 4K resolution without any change in details; make it fully in focus.


Нет, правда, нам больше не нужны апскейлеры с Nano Banana Pro
👍1😁1
Промпт:

Make a 4×4 grid starting with the 1880s. In each section, I should appear styled according to that decade (clothing, hairstyle, facial hair, accessories). Use colors, background, & film style accordingly.


Можете и по-русски (на любом другом языке).
1
Довольно приятный для школьников/студентов метод использования Нано Бананы Про. Кидаете ей фото вашей задачи по математике и она выдаёт вам фото листа с полностью и ПРАВИЛЬНО решённой задачей ВАШИМ почерком. Ну а потом распечатываете на цветном принтере и отдаёте учителю на проверку.

Сорян, что опять про Нано Банану, но такие уже нынче времена.

Ботликер
Nano Banana Pro умеет вычислять возраст людей по фото

Кидаем фотку чела, юзаем этот промпт. И узнаём возраст. Мой угадала точно, причём я загружал с чужого ака, чтобы не подгрузила кэш про меня :)

Ботликер
Интересно, какие ещё показатели тела может вычислять Банана Про по фото 🤔
🍌3🍓1
Всё-таки, какая крутая Нано Банана Про в инфографичных визуализациях любых концепций:

1. Топология 3D «Ландшафта потерь» (Loss Landscape)
2. Линии магнитного поля токамака (реактора термоядерного синтеза)
3. Визуализация «Механизма внимания» (Attention Mechanism) в LLM
4. Эксперимент с двумя щелями (волново-частичная дуальность)
5. Архитектура «RAG» (Retrieval-Augmented Generation — генерация с дополнением извлечением)
6. Сравнение моделей по «Паучьей диаграмме» (Spider Chart / Radar Chart)
7. Дерево решений «Цепочка рассуждений» (Chain of Thought)
8. Визуализация «Латентного пространства» (t-SNE диаграмма рассеяния)
9. Маршрутизация в «Смеси экспертов» (Mixture of Experts, MoE)
10. Выверка зеркал космического телескопа Джеймса Уэбба (JWST Mirror Alignment)

Ботликер
2