Bag of Words is een eenvoudige en veelgebruikte techniek voor tekstrepresentatie in natuurlijke-taalverwerking. Het model behandelt een tekst als een “zak” van zijn woorden, waarbij de volgorde van de woorden wordt genegeerd en alleen de frequentie van elk woord in de tekst wordt opgeslagen. Hoewel dit model de syntactische en semantische relaties tussen woorden negeert, is het nuttig voor veel basistaken zoals tekstclassificatie en sentimentanalyse.