Нано-банан от Google: революция в редактировании изображений с помощью ИИ, о которой вы даже не подозревали! 🍌

  1. Что нового?
    Google решила, что бананы предназначены не только для обезьян, и представила Gemini 2.5 Flash Image – ласково прозванную Нано-Бананом – 26 августа 2025 года. Это маленькое желтое чудо интегрирует расширенное редактирование и генерацию изображений в свою экосистему Gemini, разворачиваясь быстрее, чем кошка, гоняющаяся за лазерной указкой по полу. Теперь она доступна в приложении Gemini и для разработчиков через Gemini API, AI Studio и платформы Vertex AI. 🍌✨
  2. Что оно может делать?
  • Редактирование изображений на естественном языке: Хотите размыть фон, убрать некрасивые пятна, изменить позу человека или даже заставить надоедливого человека исчезнуть? Просто попросите! Это как волшебная палочка, но без неприятных побочных эффектов, таких как превращение друзей в лягушек.
  • Объединение нескольких изображений и обеспечение согласованности: Плавно объединяйте несколько изображений – поместите продукт в новую сцену, сохраняйте единообразие персонажей или брендинга между кадрами или переосмысливайте диаграммы, используя «знания о мире». Ведь кто не хотел бы, чтобы его кошка появлялась на каждой фотографии из отпуска?
  • Итеративное, диалоговое редактирование: Да, вы можете наслаждаться приятным обменом репликами во время редактирования изображений, совершенствуя их шаг за шагом, как пара, спорящая о лучшем способе повесить картину. 🎨

Модель объединяет мультимодальные входные данные Gemini 2.5, продвинутое рассуждение и скорость с технологией генерации изображений, источник: X.

  1. Цена?
    В Google Cloud цена составляет 30 долларов за 1 миллион выходных токенов, и поскольку каждое изображение 1024×1024 потребляет примерно 1290 токенов, это выходит около 0,039 доллара за изображение. Так что, если вы планируете создать галерею своего кота в различных исторических обстановках, вам стоит соответствующим образом спланировать бюджет!
  2. Более широкое распространение и водяные знаки
    Google объединился с OpenRouter и fal.ai, предоставив Nano-Banana миллионам разработчиков. Тем временем, каждый вывод — видимый или невидимый — несет водяной знак SynthID и тег метаданных, чтобы пометить его как сгенерированный искусственным интеллектом. Потому что нет ничего, что говорило бы «Я сложный ИИ», как водяной знак! 🖋️
  3. Почему именно сейчас, и как обстоят дела?

    OpenAI сделала первый шаг в марте 2025 года, добавив генерацию изображений в GPT-4o, что помогло ChatGPT преодолеть отметку в 700 миллионов еженедельных пользователей. Google ответила более тесной ежемесячной базой пользователей Gemini в 400 миллионов человек по состоянию на август 2025 года. Это как гонка, где все на роликовых коньках, а Google только что нашла кнопку турбо!

  4. Отраслевые новости и интеграция
  • Изображение Gemini 2.5 Flash не просто бездействует на территории Google – оно интегрируется в Adobe Firefly, Firefly Boards и Adobe Express, становясь доступным для пользователей с 1 сентября. Разработчики обещают до 20 бесплатных экспериментов и неограниченное количество генераций для платных тарифов. Это как шведский стол, но для вашего творческого голода!
  • Модель также используется в творческих рабочих процессах такими компаниями, как Poe (Quora), WPP, Freepik, Leonardo.ai и Figma – все они отмечают ее стабильность, оперативность и свободу творчества. Это универсальный инструмент для работы с визуальным контентом, без риска порезаться, пытаясь открыть бутылку вина.
  1. Беспокоитесь?
    Как и ожидалось, чем мощнее становятся эти инструменты для работы с изображениями, тем громче звучат тревожные сигналы о дипфейках и дезинформации. Даже с водяными знаками, плотины открыты. Это как дать ребенку кисть и надеяться на шедевр, а не на роспись на стене гостиной.

Если вы думали, что приложения для создания изображений с помощью искусственного интеллекта достигли своего пика с DALL·E или Midjourney, подумайте еще раз. Nano-Banana – это ориентированный на текст, мульти-изображения, оснащенный водяными знаками швейцарский нож для визуальных эффектов. Google демонстрирует свою мощь – и дело не только в том, чтобы догнать; он хочет переопределить творческие рабочие процессы. Так что, хватайте свой виртуальный кисть и готовьтесь создать следующую Мону Лизу, или, по крайней мере, очень убедительного кота в скафандре!

Смотрите также

2025-08-26 22:57