Hackers zijn vastbesloten om AI te verbeteren

GettyImages 1314526623 1f12aee34ef84815b5a3e3beb7fbe4d2

Belangrijkste leerpunten

Een nieuw collectief van ontwikkelaars bouwt open-source AI-modellen.
De groep gebruikt enorme taaltrainingsmodellen die het onder open licenties zal vrijgeven.

Open-source AI zou kunnen helpen om de potentieel baanbrekende kracht van de nieuwe technologie minder vatbaar te maken voor vooroordelen en fouten.

Er wordt veel onderzoek gedaan naar kunstmatige intelligentie door grote bedrijven (AI), maar één online groep wil het proces democratiseren. EleutherAI is een recent gevormd collectief van vrijwillige onderzoekers, ingenieurs en ontwikkelaars die zich richten op open-source AI-onderzoek. De organisatie gebruikt de GPT-Neo- en GPT-NeoX-codebases om enorme taalmodellen te trainen die ze onder open licenties wil vrijgeven. “Open source data komt ten goede aan onderzoekers omdat wetenschappers meer vrije middelen hebben om modellen te trainen en onderzoek te voltooien”, vertelde Edward Cui, de CEO van AI-bedrijf Graviti, aan Lifewire in een e-mailinterview. Zijn bedrijf is niet betrokken bij EueutherAI. “We weten dat tientallen AI-projecten werden opgehouden door een algemeen gebrek aan hoogwaardige gegevens van echte gebruiksgevallen, dus het is van vitaal belang om met de hulp van de deelnemende gemeenschap richtlijnen op te stellen die de gegevenskwaliteit garanderen.”

Dit is de weg

Het begin van de EleutherAI was bescheiden. Vorig jaar heeft een onafhankelijke AI-onderzoeker genaamd Connor Leahy plaatste het volgende bericht op een Discord-server: “Hey guys let [SIC] geef OpenAI een run voor hun geld zoals in de goede oude tijd.” En zo werd de groep gevormd. Het heeft nu honderden bijdragers die hun code op de online softwarerepository GitHub plaatsen. Open-sourcing AI-inspanningen zijn niet nieuw. Het Airflow-workflowbeheerplatform van Airbnb en de data-ontdekkingsengine van Lyft zijn het resultaat van het gebruik van open source-tools om datateams in staat te stellen beter met data te werken, aldus Ali Rehman, projectmanager voor softwarebedrijf CloudiTwins in een e-mailinterview met Lifewire. “Net zoals de open-sourcerevolutie heeft geleid tot een transformatie van softwareontwikkeling, heeft het ook geleid tot de ontwikkeling en democratisering van datawetenschap en kunstmatige intelligentie,” zei Rehman. “Open source is een cruciale factor geworden voor bedrijfsgegevens wetenschappelijke oplossingen, waarbij de meeste datawetenschappers open-sourcetools gebruiken.”

De deur openen

Het ontwikkelen van open-source AI zou kunnen helpen om de potentieel baanbrekende kracht van de nieuwe technologie minder vatbaar te maken voor vooroordelen en fouten, beweren sommige waarnemers. AI-onderzoek gebeurt nu voornamelijk in de open lucht, waarbij bijna alle bedrijven, onderzoekslaboratoria en universiteiten hun resultaten onmiddellijk presenteren in wetenschappelijke publicaties, vertelde Kush Varshney, een AI-onderzoeker bij IBM, aan Lifewire in een e-mailinterview. “Deze open community is essentieel, omdat het verbeterde niveaus van checks and balances biedt om ervoor te zorgen dat AI op verantwoorde wijze wordt onderzocht, gecreëerd, ingezet en toegepast”, voegde Varshney eraan toe. “Dit is vooral van cruciaal belang in situaties waarin deze systemen het leven van onze meest kwetsbare leden van de samenleving kunnen beïnvloeden. Deze openheid geldt niet alleen voor algemene machine learning en deep learning-algoritmen, maar ook voor elementen van betrouwbare AI.” Rehman zei dat een van de cruciale verschillen tussen propriëtaire en open-source software flexibiliteit en maatwerk is. Eigen AI-onderzoek zal problemen hebben met beveiliging, updates en optimalisaties.

“Dit komt omdat de open-source community-gebaseerde benadering waardevolle input krijgt van duizenden industrie-experts die potentiële beveiligingsproblemen identificeren die vervolgens sneller worden verholpen”, voegde Rehman eraan toe. “De consensus van de gemeenschap betekent dat kwaliteit wordt gegarandeerd en nieuwe kansen gemakkelijker worden geïdentificeerd.” Een ander probleem is dat eigen AI-onderzoek niet interoperabel zal zijn, wat betekent dat het niet met verschillende gegevensformaten kan werken en waarschijnlijk vendor lock-in zal hebben, waardoor bedrijven de software niet kunnen testen en uitproberen voordat ze zich verbinden tot een oplossing, zei Rehman. Maar niet elk aspect van AI-onderzoek hoeft open-source te zijn, vertelde Chris Kent, de CEO van het medische AI-bedrijf Reveal Surgical, aan Lifewire in een e-mailinterview. “Het is belangrijk om de economische prikkels te beschermen die de commerciële ontwikkeling van belangrijke AI-toepassingen stimuleren”, zei hij. Onderzoek naar AI heeft echter een robuuste open-sourcecomponent nodig, zei Kent. Hij voegde eraan toe dat open source werkt om vertrouwen op te bouwen en datasets te gebruiken die niet worden of mogen worden beheerd door afzonderlijke instellingen of bedrijven. “Een open-sourcebenadering is de beste manier om onderliggende vooroordelen die kunnen bestaan in trainingssets te identificeren en te compenseren en zal leiden tot meer holistische, creatieve en betrouwbare toepassingen van AI”, aldus Kent.