Er is een nieuwe foto-editor van Apple, als je weet waar je die moet zoeken. iPhone Kings heeft samengewerkt met onderzoekers van de Universiteit van Californië, Santa Barbara om een tool te bouwen waarmee je foto's en afbeeldingen kunt bewerken met behulp van tekstinstructies. Het heeft geen officiële release, maar onderzoekers hosten een demo die je zelf kunt proberen en die voor het eerst is opgemerkt Extreme technologie.
Het project heet Multimodal Large Language Model Guided Image Editing (MGIE). Er zijn tegenwoordig veel AI-fotobewerkingssoftware op de markt. Photoshop wordt nu geleverd met ingebouwde AI-tools, en met andere, zoals OpenAI's DALL-E, kun je afbeeldingen bewerken en ze uit hele stoffen maken. Als je ze echter al eerder hebt geprobeerd te gebruiken, weet je dat het een beetje frustrerend kan zijn. In veel gevallen heeft AI moeite om precies te begrijpen wat u zoekt.
De innovatie bij MGIE voegt een nieuwe laag van AI-interpretatie toe. Wanneer u de AI vertelt wat u wilt zien, maakt MGIE eerst gebruik van op tekst gebaseerde AI om uw instructies duidelijker en beschrijvender te maken. “Experimentele resultaten tonen aan dat expressieve instructies essentieel zijn voor instructiegebaseerde beeldbewerking”, aldus de onderzoekers in een artikel. papier Gepubliceerd op arXiv. “MGIE kan tot aanzienlijke verbetering leiden.”
Apple heeft een open source-versie van de software gepubliceerd github. Als je slim bent, kun je zelf een exemplaar van MGIE krijgen, maar de onderzoekers hebben de tool opgezet op… Gezicht knuffelen. Het werkt een beetje traag als er veel mensen gebruik van maken, maar het is een leuke ervaring.
Technologiegiganten als Apple geven miljarden dollars uit aan projecten die niemand ooit zal zien, dus het is heel goed mogelijk dat de zogenaamde MGIE-tool nooit een officiële release zal krijgen. Apple reageerde niet onmiddellijk op een verzoek om commentaar.
We hebben het hier op het Gizmodo-kantoor uitgeprobeerd. Ik heb een foto geüpload van mijn collega en naaste adviseur Kyle Barr met een rare zonnebril, die ik op Netflix heb gemaakt in… Consumentenelektronicabeurs dit jaar. Ik zei tegen Amnesty International: “De man staat in de woestijn.” Voordat de afbeelding wordt gemaakt, extrapoleert MGIE het volgende:
“De man draagt een metalen helm en staat in een woestijnachtige omgeving. De omgeving is dor en kaal, met zandduinen die zich uitstrekken zover het oog reikt.”
Na veel langer met de tool te hebben gespeeld dan zou moeten, is het duidelijk dat deze aan veel van dezelfde beperkingen onderhevig is als elke andere AI-beeldgenerator. Vaak zijn de resultaten vreemd en lijken ze niet op wat u hebt besteld. Maar in sommige gevallen deed het indrukwekkend werk, en ter verdediging van de software presteerde de AI beter met bekende onderwerpen. “Vertrouwd” is niet iets wat je Kyle's zonnebril zou noemen.
“Organizer. Travel Enthusiast. Explorer. Award-Winning Entrepreneur. Twitteraholic.”
More Stories
Deze 100W GaN-oplader is dun en opvouwbaar
Kuo: De RAM-upgrade naar 12 GB volgend jaar zal beperkt zijn tot de iPhone 17 Pro Max
Kunstmatige intelligentiebedrijf Midjourney plaagt een hardwareproduct in een nieuwe vorm