Voorspelmodel
Een taalmodel is een geavanceerd computerprogramma dat is getraind met een enorme hoeveelheid data om menselijke taal te begrijpen en te gebruiken. Het gebruikt daarvoor neurale netwerken en algoritmen om complexe patronen in taal te ontdekken. Die patronen worden vervolgens gebruikt om de waarschijnlijkheid van woorden of zinnen in natuurlijke taal te voorspellen. Een taalmodel is dus eigenlijk een ‘voorspelmodel’.
Zo’n model neemt geschreven tekst als input en genereert vervolgens begrijpelijke tekst als output. Er zijn ook multimodale modellen met een vergelijkbare architectuur, die bijvoorbeeld afbeeldingen kunnen begrijpen en genereren. Vandaar de vaak gehoorde term 'generatieve AI'.
Goed te gebruiken in applicaties
Taalmodellen worden gebruikt voor een breed scala aan toepassingen, zoals vragen beantwoorden, samenvattingen genereren, vertalen, content schrijven en als basis voor digitale assistenten.
Een taalmodel is daardoor heel goed achter de schermen in applicaties te gebruiken. Zo hebben wij bij Centric al diverse prototypes van applicaties ontwikkeld die beschikken over een AI-koppeling op basis van een application programming interface of API.
Als guiding partner in het digitale tijdperk omarmt Centric de mogelijkheden van nieuwe technologie in de oplossingen die we ontwikkelen voor onze klanten. Ook kunstmatige intelligentie zal daarin een rol gaan spelen. Maar wel op een doordachte, verantwoorde manier. Aan de huidige generatie AI kleven namelijk een aantal bezwaren.
Méér data niet altijd beter
Zoals veel nieuwe technologie heeft ook deze een keerzijde, zeker in het begin. De huidige taalmodellen zijn bijvoorbeeld flinke dataslurpers en soms blijkt data achteraf onwettig te zijn gebruikt. Er zijn om die reden al meerdere copyrightrechtszaken aangespannen tegen het bedrijf achter ChatGPT, OpenAI. Verder is er nog weinig bekend over de gebruikte data, architectuur en technieken bij de nieuwere aanwinsten binnen de GPT-familie van taalmodellen.
Bij het trainen en implementeren van AI hoort nou eenmaal het verzamelen en verwerken van data. En online is er veel data verkrijgbaar. Maar dat data beschikbaar is, betekent niet dat je die zomaar mag gebruiken voor het bouwen van commerciële producten. Vaak is er sprake van intellectueel eigendom of zijn er licenties aan verbonden.
Daarnaast geldt: méér data is niet altijd beter. Niet alle gegevens zijn even relevant of bruikbaar voor de beoogde toepassing. Het model leert van de data die je erin stopt en deze input is nooit helemaal onpartijdig. Als je daar geen rekening mee houdt, is je AI-model dat dus ook niet.