Video je v bistvu le zaporedje slik. Za zajemanje in prikazovanje slik običajno uporabljamo barvni model RGB, ki smo si ga že podrobno ogledali. Omenili smo, da je človeško oko sestavljeno iz dveh vrst fotoreceptorjev: »paličnic«, ki zaznavajo svetlo/temno in so bolj občutljive in »čepnic«, ki zaznavajo barve.
To dejstvo s pridom uporabljamo pri kodiranju, prenosu in stiskanju videa, saj namesto barvnega modela RGB uporabljamo barvna modela YCbCr in YUV. Barvni model YUV je starejši in se je večinoma uporabljal pri analognem videu, novejši barvni model YCbCr pa se uporablja pri digitalnem videu. Oba barvna modela sta zasnovana tako, da komponenta Y predstavlja obteženo vsoto signalov RGB. Komponenti UV oziroma CbCr pa predstavljata obteženi razliki med signaloma R in B ter signalom Y.
Za pretvarjanje iz RGB v YCbCr obstajajo enačbe, s pomočjo katerih lahko izračunamo vrednosti svetlosti in barvitosti za vsak RGB piksel, kar smo si ogledali že pri stiskanju JPEG slik.
Y = 0 + (0.2990 × R) + (0.5870 × G) + (0.1140 × B) Cb = 128 - (0.1687 × R) - (0.3313 × G) + (0.5000 × B) Cr = 128 + (0.5000 × R) - (0.4187 × G) - (0.0813 × B)
Uteži so zasnovate tako, da sta komponenti UV oziroma CbCr enaki nič ali neki konstantni vrednosti za vse nevtralne barve (črno, belo in vse odtenke sive, za katere velja, da je R = G = B). To pomeni, da se informacije o svetlosti večinoma prenašajo na komponento Y, informacije o barvah/barvitosti pa na preostali dve komponenti (UV oziroma CbCr).
Kot smo že omenili, to s pridom izkoriščamo pri prenosu in stiskanju videa, saj lahko barvni del videa (komponenti UV oziroma CbCr) vzorčimo redkeje, kot komponento Y, ki vsebuje informacije o svetilnosti, na katero je človeško oko bolj občutljivo. Različne načine vzorčenja videa si bomo ogledali v nadaljevanju.