Et dybere kig ind i AI billedgeneratore

Hvad nu, hvis du kunne generere et perfekt billede af en idé, du kun har beskrevet med ord? Takket være AI billedgeneratore, kan dette faktisk lade sig gøre. Ved at træne en computermodel på et stort sæt af billeder kan modellen lære at genkende mønstre og træk i billeder og derefter bruge denne viden til at generere helt nye billeder. Men hvilke services findes der på markedet for billede genering på nuværende tidspunkt? Lad os tage et kig på nogle af de nyeste udviklinger på dette område.

Midjourney

Midjourney er en AI-program- og service, der er udviklet af et uafhængigt forskningslaboratorium i San Francisco. Det er i øjeblikket kun tilgængelig via en Discord-bot på deres officielle Discord-server. Brugerne kan generere billeder ved at bruge kommandoen /imagine og indtaste en prompt. Bot’en returnerer derefter et sæt af fire billeder, hvorefter brugeren kan vælge at skalere et eller flere af billederne op. Midjourney arbejder også på en hjemmeside, der vil gøre det lettere at bruge programmet.

Programmet er primært rettet mod kunstnere og kreative fagfolk, der ønsker at eksperimentere med deres ideer og hurtigt generere prototyper til at vise til klienter. Men også reklamebranchen har været hurtig til at omfavne værktøjer som Midjourney, da de giver mulighed for at skabe originalt indhold og brainstorme ideer hurtigt.

Der bliver tilbudt tre abonnementstyper, som brugerne kan vælge imellem. Der var tidligere også en gratis prøveperiode, men den er blevet midlertidigt lukket på grund af høj efterspørgsel og misbrug. Brugere skal nu betale et månedligt eller årligt gebyr for at bruge tjenesten.

Du kan læse vores dybdegående artikel om Midjourney, Kom godt i gang med Midjourney: Fra begynder til ekspert, hvis du ønsker at vide mere.

DALL-E

DALL-E er en dybtgående læringsmodel, der er udviklet af OpenAI, og som kan generere digitale billeder ud fra beskrivelser på naturligt sprog. Det anvender en modificeret version af GPT-3-sprogmodellen og kan generere billeder i forskellige stilarter, herunder fotorealistiske billeder, malerier og emojis.

DALL-E har også evnen til at manipulere og omarrangere objekter i sine billeder og placere designelementer i nye sammensætninger uden direkte instruktion. Dette skyldes, at DALL-E har lært at forstå og genere billeder baseret på både kontekst og visuelle trends.

Derudover er DALL-E i stand til at generere billeder ud fra en bred vifte af beskrivelser, og den har lært at udfylde hullerne i et billede ved at slutte sig til passende detaljer uden specifikke prompts. DALL-E er også i stand til at tilføje skygger på passende steder til billeder, der ikke nævner dem, hvilket viser dens evne til at forstå og efterligne visuelle kunstværker.

Stable Diffusion

Stable Diffusion er en tekst-til-billede-generator udgivet i 2022. Den er udviklet af start-up-virksomheden Stability AI i samarbejde med akademiske forskere og non-profit organisationer. Modellen er baseret på en latent diffusion model, der er en form for dyb generativt neuralt netværk.

En bemærkelsesværdig egenskab ved Stable Diffusion er, at dens kode og modelvægte er offentligt tilgængelige, og den kan køre på de fleste forbrugerhardware med et beskeden grafikkort. Dette adskiller sig fra tidligere modeller som DALL-E og Midjourney, der kun var tilgængelige via cloud-tjenester.

Stable Diffusion er primært designet til at generere detaljerede billeder baseret på tekstbeskrivelser, men den kan også anvendes til opgaver som inpainting (rekonstruktion af manglende dele af et billede), outpainting (generering af billedudvidelser) og billed-til-billed-oversættelse baseret på en tekstprompt.

Det skal også nævnes, at de genererede billeder fra Stable Diffusion er mærket med et usynligt digitalt vandmærke, der kan identificere dem som genereret af modellen. Dog mister dette vandmærke sin effektivitet, hvis billederne ændres i størrelse eller rotation.

Du kan besøge Stable Diffusions Github side her, eller prøve Stable Diffusion online her.

Sammenligning af AI billedgeneratore

Vi har prøvet alle tre billedgenereringsværktøjer ud, så du kan se deres styrker og svagheder.

Læs mere: Sammenligningen af forskellige AI billedgeneratorer