Представление сообщения в виде
кода с уменьшенным числом символов за счет уменьшения избыточности или за счет потери малосущественной
информации называется
сжатием (компрессией) данных. Мерой избыточности является коэффициент избыточности сообщения

определяемый по формуле

где

—
количество информации в сообщении

,

— максимально возможное количество информации в сообщении той же длины, что и

.
Пример избыточности дают сообщения на естественных языках, так, у русского языка

находится в пределах 0,3...0,5.
Благодаря избыточности возможно сжатие информации без ее потери в передаваемых сообщениях. Для этого используются специальные алгоритмы сжатия, уменьшающие избыточность. Эффект сжатия оценивают
коэффициентом сжатия:

где

— число минимально необходимых символов для передачи сообщения (практически это число символов на выходе эталонного алгоритма сжатия);

— число символов в сообщении, сжатом данным алгоритмом. Часто степень сжатия оценивают отношением длин кодов на входе и выходе алгоритма сжатия.
Наряду с методами сжатия, не уменьшающими количество информации в сообщении, применяются методы сжатия, основанные на потере малосущественной информации.
Компрессия (сжатие) и декомпрессия данных осуществляются либо на
прикладном уровне с помощью программ сжатия, либо с помощью аппаратных средств непосредственно в составе звуковых карт, видеобластеров,
модемов и т.п. Устройства или программы, применяемые для компрессии и декомпрессии, называют
кодеками. Слово "кодек" образовано из начальных слогов слов "кодирование-декодирование".