Het kunstmatige-intelligentiesysteem dat bekend staat als Google Muse AI is vandaag officieel onthuld. Op basis van het gebruik van parallelle decodering en een kleine, discrete latente ruimte, claimt het nieuwe tekst-naar-beeld transformatormodel sneller te zijn dan bestaande alternatieven. De makers van Google Muse AI beweren dat hun creatie foto’s kan genereren met een kwaliteitsniveau dat vergelijkbaar is met het beste van het beste.
wij presenteren Muzeeen tekst-naar-beeld Transformer-model dat state-of-the-art beeldgeneratieprestaties levert en tegelijkertijd aanzienlijk efficiënter is dan diffusie- of autoregressieve modellen.
Google Muse AI-team
Wat is Google Muse AI?
Het team beweert dat Google Muse AI een grote verbetering is ten opzichte van eerdere tekst-naar-beeld-transformatormodellen zoals Imagen en DALL-E 2. Muse gebruikt de tekstinbedding van een groot taalmodel om te worden getraind in een gemaskeerde modelleertaak in discrete token space (LLM). ).
Muse is in staat tokens te herkennen in afbeeldingen die naar believen zijn vermomd. Vanwege het gebruik van discrete tokens en verminderde vereisten voor de steekproefomvang, belooft Muse pixel-space diffusiemodellen zoals Imagen en DALL-E 2 te verslaan. Het model genereert een gratis zero-shot, maskervrije bewerking door in reactie daarop herhaaldelijk opnieuw te samplen naar een prompt.
Gebaseerd op MUZEVolgens de benchmarks van Muse zijn de inferentietijden van Muse aanzienlijk lager dan die van concurrerende modellen.
Model | Oplossing | Inferentietijd (↓) |
Stabiele verspreiding 1.4 | 512×512 | 3.7s |
Deel 3B | 256×256 | 6.4s |
Afbeeldingn | 256×256 | 9.1s |
Afbeeldingn | 1024×1024 | 13.3s |
Muse-3B | 256×256 | 0,5 sec |
Muse-3B | 512×512 | 1.3s |
In tegenstelling tot Parti en andere autoregressieve modellen, maakt Muse gebruik van parallelle decodering. Om afbeeldingen van hoge kwaliteit te produceren en visuele concepten zoals objecten, hun ruimtelijke relaties, houding, kardinaliteit, enzovoort te herkennen, moet een LLM die al is onderwezen Engels op een gedetailleerd niveau begrijpen. Muse hoeft het model niet om te draaien om inpainting, outpainting en maskerloze bewerking te ondersteunen.
Google Muse AI-functies
Muse is een snel, geavanceerd model voor het genereren en wijzigen van afbeeldingen uit tekst, en het heeft verschillende handige functies, waaronder:
- Genereren van tekst naar afbeelding
- Als reactie op tekstuele invoer genereert de kunstmatige intelligentie (AI) Muse van Google snel hoogwaardige beelden (1,3 sec voor een resolutie van 512 × 512 of 0,5 sec voor een resolutie van 256 × 256 op TPUv4).
- Zero-shot, maskervrije bewerking
- Het Google Muse AI-model biedt ons gratis zero-shot, maskervrije bewerking door herhaaldelijk beeldtokens te samplen als reactie op een tekstuele instructie.
- Bij het wijzigen van een afbeelding kunt u met bewerken zonder masker meerdere objecten manipuleren met een eenvoudige tekstprompt.
- Zero-shot Inpainting/Outpainting
- Google’s Muse AI is gratis en wordt geleverd met op maskers gebaseerde bewerkingsfuncties (inpainting en outpainting). Door een masker op een bewerking toe te passen, wordt deze functioneel equivalent aan een nieuwe generatie.
Bekijk de beste AI-tweetgeneratoren waarmee je kunt tweeten zoals Elon Musk.
Details van Google Muse AI-model
Je kunt het trainingsschema van Muse AI van Google hieronder bekijken:
Het Google-team gebruikt twee verschillende VQGAN-tokenizernetwerken, een voor foto’s van lage kwaliteit en een voor afbeeldingen met een hoge resolutie. Transformatoren met lage resolutie (“base”) en hoge resolutie (“superres”) worden getraind met de niet-gemaskeerde tokens en T5-tekstinbeddingen om de gemaskeerde tokens te voorspellen.
Klik voor meer gedetailleerde informatie over Google Muse AI hier.
AI-tools die we hebben uitgelegd
Hoewel sommigen “nee zeggen tegen door AI gegenereerde afbeeldingen”, komt er bijna elke dag een nieuwe AI-tool in ons leven, zoals:
- Gebalanceerde AI
- Caktus AI
- Open AI Point-E
- Uberduck AI
- QQ Verschillende Dimensie Me
- MyHeritage AI Tijdmachine
- Meta’s Cicero AI
- Begrip AI
- Meta Galactica AI
- Nieuwe AI
- Make-A-Video Meta AI
- DALL-E 2
- Wombo-droom
- DreamBooth-AI van Google
- Stabiele verspreiding
Blijf erbij voor meer!
Source: Google Muse AI: functies, voorbeelden en meer