Ondanks de snelle vooruitgang op het gebied van kunstmatige intelligentie is AI nog lang niet klaar om mensen in de wetenschapsbeoefening te vervangen. Maar dat betekent niet dat ze niet kunnen helpen bij het automatiseren van een deel van het harde werk dat voortkomt uit alledaagse wetenschappelijke experimenten. Een paar jaar geleden hebben onderzoekers bijvoorbeeld kunstmatige intelligentie de controle over geautomatiseerde laboratoriumapparatuur gegeven en deze geleerd hoe alle interacties die tussen een reeks grondstoffen kunnen optreden, uitgebreid kunnen worden geclassificeerd.
Hoewel dit nuttig is, vergt het nog steeds veel tussenkomst van onderzoekers om het systeem überhaupt te trainen. Een groep van de Carnegie Mellon Universiteit heeft nu ontdekt hoe je een systeem voor kunstmatige intelligentie zichzelf kunt laten leren hoe het met scheikunde moet omgaan. Het systeem vereist een set van drie AI-instanties, elk gespecialiseerd in verschillende processen. Maar als je het eenmaal hebt opgezet en van de grondstoffen hebt voorzien, hoef je het alleen maar te vertellen wat voor soort reactie je wilt uitvoeren, en het zal het uitzoeken.
Drie-eenheid van kunstmatige intelligentie
De onderzoekers geven aan dat ze geïnteresseerd zijn in het begrijpen van de mogelijkheden die grote taalmodellen (LLM’s) kunnen bieden aan de wetenschappelijke onderneming. Alle AI’s die in dit werk worden gebruikt, zijn dus LLM’s, meestal GPT-3.5 en GPT-4, hoewel andere -Claude 1.3 en Falcon-40B-Instruct- ook zijn getest. (GPT-4 en Claude 1.3 presteerden het beste.) Maar in plaats van één enkel systeem te gebruiken om alle aspecten van de chemie te behandelen, creëerden de onderzoekers duidelijke voorbeelden van samenwerking bij het opzetten van een arbeidsverdeling die zij de ‘kosmische wereld’ noemden.
De drie systemen die ze gebruikten zijn:
Webzoeker. Dit heeft twee belangrijke mogelijkheden. Eén daarvan is het gebruik van de Google Search API om pagina’s te vinden die de moeite waard kunnen zijn om te bekijken vanwege de informatie die ze bevatten. De tweede is om die pagina’s op te nemen en er informatie uit te halen. Zie dit als vergelijkbaar met de context van eerdere gespreksstukken die Chat GPT kan behouden als basis voor latere antwoorden. De onderzoekers konden bijhouden waar deze eenheid zijn tijd doorbracht, en ongeveer de helft van de bezochte plaatsen waren Wikipedia-pagina’s. De top vijf bezochte sites omvatten tijdschriften gepubliceerd door de American Chemical Society en de Royal Society of Chemistry.
Documentatie onderzoeker. Beschouw dit als rtfm Voorbeeld. De AI zou de controle krijgen over verschillende laboratoriumautomatiseringsapparatuur, zoals geautomatiseerde vloeistofhandlers en dergelijke, die vaak zouden worden bestuurd via gespecialiseerde commando’s of zoiets als een Python API. Deze AI-instantie heeft toegang gekregen tot alle handleidingen voor dat apparaat, waardoor het kan leren hoe het te besturen.
een plan. De planner kan opdrachten geven aan beide andere instanties van de AI en hun antwoorden verwerken. Het heeft toegang tot een sandbox voor het uitvoeren van Python-code, waardoor het berekeningen kan uitvoeren. Ook heeft hij toegang tot geautomatiseerde laboratoriumapparatuur, waardoor hij experimenten virtueel kan uitvoeren en analyseren. Je kunt de planner dus zien als onderdeel van het systeem dat moet optreden als een scheikundige, die moet leren van de literatuur en moet proberen de apparatuur te gebruiken om te implementeren wat hij heeft geleerd.
De planner kan ook vaststellen wanneer er programmeerfouten optreden (hetzij in Python-scripts, hetzij bij zijn pogingen om geautomatiseerde machines te besturen), waardoor hij zijn fouten kan corrigeren.
Neem het systeem in gebruik
Aanvankelijk werd het systeem gevraagd een aantal chemicaliën te synthetiseren, zoals paracetamol en ibuprofen, wat bevestigde dat het over het algemeen een levensvatbare formulering kon vinden na zoeken op internet en in de wetenschappelijke literatuur. De vraag is dus of het systeem in staat is de apparaten waartoe het toegang heeft goed genoeg te detecteren om zijn conceptuele capaciteit te activeren.
Om met iets eenvoudigs te beginnen, gebruikten de onderzoekers een standaard monsterplaat, met daarin een reeks kleine putjes gerangschikt in een rechthoekig rooster. Het systeem werd gevraagd om vierkanten, diagonale lijnen of andere patronen in te vullen met verschillende gekleurde vloeistoffen, en dat lukte ook effectief.
Verderop plaatsten ze drie verschillende gekleurde oplossingen op willekeurige locaties in het putnetwerk; Het systeem werd gevraagd de putten te identificeren en welke kleur ze hadden. Op zichzelf wist Coscientist niet hoe hij dit moest doen. Maar toen hij eraan werd herinnerd dat verschillende kleuren verschillende absorptiespectra zouden vertonen, gebruikte hij een spectrometer waartoe hij toegang had en kon hij de verschillende kleuren identificeren.
Omdat de basiscommando’s en -controle schijnbaar werkten, besloten de onderzoekers wat scheikunde te proberen. Ze voorzagen de monsterplaat van putjes gevuld met eenvoudige chemicaliën, katalysatoren en dergelijke, en vroegen hem een specifieke chemische reactie uit te voeren. De kosmoloog had de chemie vanaf het begin goed onder de knie, maar zijn pogingen om de synthese te laten werken mislukten omdat er een ongeldig commando naar de machines werd gestuurd die de reacties verhitten en aansturen. Dit bracht hem terug naar de documentatiemodule, waardoor hij het probleem kon corrigeren en de interacties kon uitvoeren.
En het werkte. Spectrale vingerafdrukken van de gewenste producten waren aanwezig in het reactiemengsel en hun aanwezigheid werd bevestigd door chromatografie.
verbeteren
Toen de basisreacties werkten, vroegen de onderzoekers het systeem vervolgens om de efficiëntie van de reactie te optimaliseren, en ze presenteerden het optimalisatieproces als een spel waarbij de score steeg met de uitkomst van de reactie.
Het systeem maakte in de eerste ronde van de testfeedback een aantal slechte inschattingen, maar richtte zich al snel op het behalen van een beter rendement. De onderzoekers ontdekten ook dat ze slechte keuzes in de eerste ronde konden vermijden door de Coscientist informatie te geven over de resultaten die werden gegenereerd door een paar willekeurige initiële mengsels. Dit betekent dat het niet uitmaakt waar een Coscientist zijn informatie vandaan haalt – hetzij uit zijn eigen feedback of uit een externe informatiebron – hij in staat is de informatie in zijn planning op te nemen.
De onderzoekers concludeerden dat de Coscientist verschillende opmerkelijke capaciteiten heeft:
- Planning van chemische synthese met behulp van algemene informatie
- Navigeren en verwerken van technische handleidingen voor complexe apparaten
- Gebruik die kennis om een reeks laboratoriumapparatuur te besturen
- Integreer deze instrumentatiemogelijkheden in uw laboratoriumworkflow
- Analyseer zijn reacties en gebruik die informatie om verbeterde reactieomstandigheden te ontwerpen.
In veel opzichten lijkt dit op de ervaring die een student zou kunnen hebben in zijn eerste jaar op de graduate school. Idealiter zal de afgestudeerde student verder komen dan dit. Maar misschien kan GPT-5 dat ook.
Nog gevaarlijker is dat de co-wetenschappelijke architectuur, die berust op de interactie van een aantal gespecialiseerde systemen, vergelijkbaar is met de manier waarop de geest werkt. Het is duidelijk dat gespecialiseerde hersensystemen in staat zijn tot een breed scala aan activiteiten, en dat zijn er veel. Maar dit soort structuur kan van cruciaal belang zijn om complexer gedrag mogelijk te maken.
De onderzoekers zelf maken zich echter zorgen over enkele capaciteiten van de cowetenschapper. Er zijn veel chemicaliën (denk aan dingen als zenuwgassen) waarvan we niet willen dat ze gemakkelijker te vervaardigen zijn. Uitzoeken hoe je GPT-instanties kunt vertellen iets niet te doen, is een constante uitdaging geworden.
Natuur, 2023. DOI: 10.1038/s41586-023-06792-0 (Over digitale ID’s).
More Stories
Wanneer zullen de astronauten lanceren?
Volgens fossielen werd een prehistorische zeekoe opgegeten door een krokodil en een haai
De Federal Aviation Administration schort vluchten van SpaceX op nadat een vlammende raket tijdens de landing neerstort