Data-augmentatie is een techniek die wordt gebruikt om de hoeveelheid trainingsgegevens voor machine learning-modellen te vergroten door bestaande gegevens te transformeren of te combineren op manieren die nieuwe voorbeelden genereren. Dit kan helpen om overfitting te verminderen en de prestaties van modellen te verbeteren, vooral bij beperkte gegevens. In beeldherkenning kan dit bijvoorbeeld bestaan uit het roteren, spiegelen of bijsnijden van afbeeldingen.