Участок гена, кодирующего белок, состоит из последовательно расположенных нуклеотидов, которые читаются по три — кодоны. Каждый кодон (триплет) кодирует одну аминокислоту; считывание начинается со старт-кодона AUG и заканчивается стоп-кодонами UAA, UAG, UGA. Если длина участка равна nnn нуклеотидов, то число полных кодонов равно ⌊n3⌋\left\lfloor\frac{n}{3}\right\rfloor⌊3n⌋; если nnn не кратно 333, последние 111 или 222 нуклеотида не образуют полный кодон. В ДНК нуклеотиды — A, T, G, C; в мРНК — A, U, G, C.