Makers
Stel, je bent op zoek naar een nieuw huis, maar geen enkel huis in de buurt is gebouwd zoals jij dat wilt. Wat is dan een verstandige beslissing? Koop een stuk grond en begin met het bouwen van je eigen huis (mits je genoeg geld hebt natuurlijk). We zien hetzelfde in de zich steeds verder ontwikkelende wereld van AI. Misschien heb je een AI-oplossing nodig die zo specifiek is dat geen enkele andere bestaande oplossing aan je behoeften voldoet. Of je hebt absolute controle nodig over het hele proces en de architectuur. Dan kun je je eigen model bouwen en ben je een Maker.
Je eigen model maken houdt in dat je het vanaf nul opbouwt met direct beschikbare gereedschappen - vergelijkbaar met hoe hout en bakstenen worden gebruikt bij het bouwen van een huis. Dit betekent dat je alle vrijheid hebt op het gebied van modelarchitectuur en trainingstechnieken, perfect afgestemd op jouw behoeften. Het maken van je eigen model betekent ook dat je alle gegevens moet aanleveren voor het trainen, testen en evalueren van het model. Het aanleveren van deze gegevens is erg arbeidsintensief, vooral voor grote en krachtige modellen die enorme hoeveelheden gegevens nodig hebben.
Er wordt bijvoorbeeld beweerd dat het nieuwste taalmodel van Meta AI (Llama3) getraind is op meer dan 15 biljoen tokens*. Ja, dat is 15 met 12 nullen, of 15.000.000.000.000. Dit komt overeen met de lengte van ongeveer 5 miljoen bijbels! Zoveel gegevens zijn moeilijk te verzamelen en op te schonen, maar je kunt vooraf samengestelde datasets gebruiken.
Op het internet staan veel open-source datasets, waarvan je sommige kunt gebruiken voor commerciële toepassingen. Het is belangrijk om de intellectuele eigendomsrechten van datasets te controleren, want er zijn talloze voorbeelden van rechtszaken tegen organisaties over het ongeoorloofd gebruik van hun gegevens. Een van de bekendste spelers in de AI-industrie, OpenAI, wordt ook geconfronteerd met meerdere rechtszaken tegen hen en hun partners, waaronder Microsoft. Het scrapen van content om datasets te genereren kan een schending zijn van auteursrechten of intellectuele eigendomsrechten, vooral als de content afkomstig is van beschermde bronnen. Zelfs als de inhoud publiek beschikbaar is, blijft het schrapen ervan voor commercieel gebruik beperkt.
* Een token vertegenwoordigt een basiseenheid van tekens. Het kan een enkel karakter, een woord of zelfs interpunctie zijn.
Hoewel er vooraf samengestelde datasets beschikbaar zijn, moet je voorzichtig zijn met intellectuele eigendomsrechten en het schrapen van inhoud voor commercieel gebruik vermijden.
Verantwoord gebruik (onaanvaardbaar risico)
Volgens de AI-wet van de EU worden AI-modellen ingedeeld in categorieën op basis van risico. Een van deze categorieën is onaanvaardbaar risico. Volgens Artikel 5: Verboden Artificiële Intelligentiepraktijken is het verboden AI-modellen in de categorie onaanvaardbaar risico te publiceren of te gebruiken. Het gebruik ervan wordt beschouwd als een duidelijke bedreiging voor de veiligheid, het levensonderhoud en de rechten van mensen. Dus als je een nieuw AI-model maakt, zorg er dan voor dat je model niet in de categorie onaanvaardbaar risico valt.
Als je op de hoogte wilt blijven van belangrijke updates van de wet en de implementatie ervan, schrijf je dan in voor de EU AI Act nieuwsbrief. De AI Act Explorer wordt aangeboden door het Future of Life Institute en is niet verbonden aan de Europese Unie.
Om te bepalen of je een nemer, vormer of maker bent, moet je het voorgestelde gebruik van het AI-model evalueren. Hier volgen enkele voorbeeldvragen om te bepalen welk archetype je moet kiezen:
- Hebben we de nodige expertise om AI-modellen te ontwikkelen of aan te passen?
- Is er een bestaand product dat al/voldoende voldoet aan onze behoeften?
- Wat is ons budget voor AI-implementatie?
- Hoe belangrijk is de behoefte aan maatwerk voor onze applicatie, ons bedrijf of onze processen?
- Wat zijn onze strategische doelen met AI?