Сегодня была официально представлена система искусственного интеллекта, известная как Google Muse AI. Основываясь на использовании параллельного декодирования и небольшого дискретного скрытого пространства, новая модель преобразования текста в изображение претендует на то, чтобы быть быстрее, чем существующие альтернативы. Создатели Google Muse AI утверждают, что их творение способно генерировать фотографии на уровне качества, сравнимом с лучшими из лучших.
Мы представляем Музамодель преобразования текста в изображение, которая обеспечивает самую современную производительность генерации изображений, будучи значительно более эффективной, чем диффузионные или авторегрессионные модели.
Команда искусственного интеллекта Google Muse
Что такое искусственный интеллект Google Muse?
Команда утверждает, что Google Muse AI является большим улучшением по сравнению с предыдущими моделями преобразования текста в изображение, такими как Imagen и DALL-E 2. Muse использует встраивание текста большой языковой модели для обучения выполнению задания маскированного моделирования в дискретном пространстве токенов (LLM). ).
Muse способна распознавать токены в изображениях, которые были замаскированы по желанию. Благодаря использованию дискретных токенов и уменьшению требований к размеру выборки, Muse обещает превзойти модели диффузии в пространстве пикселей, такие как Imagen и DALL-E 2. Модель генерирует бесплатное редактирование без масок с нулевым кадром путем повторной передискретизации токенов изображения в ответ. к подсказке.
На основе МУЗАвремя вывода Muse значительно ниже, чем у конкурирующих моделей.
Модель | Разрешение | Время вывода (↓) |
Стабильная диффузия 1.4 | 512×512 | 3,7 с |
Партия-3Б | 256×256 | 6,4 с |
Изображение | 256×256 | 9,1 с |
Изображение | 1024×1024 | 13,3 с |
Муза-3Б | 256×256 | 0,5 с |
Муза-3Б | 512×512 | 1,3 с |
В отличие от Parti и других авторегрессионных моделей, Muse использует преимущества параллельного декодирования. Чтобы создавать высококачественные изображения и распознавать визуальные концепции, такие как объекты, их пространственные отношения, положение, кардинальность и т. д., LLM, который уже обучен, должен понимать английский язык на детальном уровне. Модель не нужно переворачивать, чтобы Muse поддерживала закрашивание, перекрашивание и редактирование без маски.
Функции искусственного интеллекта Google Muse
Muse — это быстрая передовая модель для создания и изменения изображений из текста, которая имеет несколько полезных функций, в том числе:
- Генерация текста в изображение
- В ответ на ввод текста искусственный интеллект (ИИ) Muse от Google быстро генерирует высококачественные визуальные эффекты (1,3 с для разрешения 512 × 512 или 0,5 с для разрешения 256 × 256 на TPUv4).
- Нулевой кадр, редактирование без масок
- Модель искусственного интеллекта Google Muse дает нам бесплатное редактирование с нулевым выстрелом и без маски путем повторной выборки токенов изображения в ответ на текстовую инструкцию.
- При изменении изображения редактирование без маски позволяет управлять несколькими объектами с помощью простой текстовой подсказки.
- Нулевой выстрел Inpaint/Outpainting
- Muse AI от Google бесплатен и поставляется с функциями редактирования на основе масок (закрашивание и закрашивание). Применяя маску к редактированию, оно становится функционально эквивалентным новому поколению.
Ознакомьтесь с лучшими генераторами твитов с искусственным интеллектом, которые помогут вам писать, как Элон Маск.
Сведения о модели искусственного интеллекта Google Muse
Вы можете проверить процесс обучения Google Muse AI ниже:
Команда Google использует две разные сети токенизаторов VQGAN: одну для фотографий низкого качества, а другую для изображений с высоким разрешением. Преобразователи низкого разрешения («базовые») и высокого разрешения («superres») обучаются с помощью немаскированных токенов и вложений текста T5 для прогнозирования замаскированных токенов.
Для получения более подробной информации об искусственном интеллекте Google Muse нажмите здесь.
Инструменты ИИ, которые мы объяснили
Хотя некоторые говорят «нет изображениям, сгенерированным ИИ», почти каждый день в нашу жизнь входит новый инструмент ИИ, например:
- Сбалансированный ИИ
- Кактус ИИ
- OpenAI Point-E
- Убердак ИИ
- QQ другое измерение меня
- Машина времени MyHeritage с искусственным интеллектом
- Цицерон ИИ Меты
- Понятие ИИ
- Мета Галактика ИИ
- РоманАИ
- Мета AI для создания видео
- ДАЛЛ-Э 2
- Вомбо мечта
- ИИ DreamBooth от Google
- Стабильная диффузия
Оставайтесь с нами, чтобы узнать больше!
Source: Google Muse AI: функции, примеры и многое другое