Кодировкой называется способ представления информации с помощью ограниченного набора символов.
Проблемы кодировки текстовых документов в Web-технологиях в основном связаны с отображением текстов на русском языке. В настоящее время используется несколько основных кодировок кириллицы, это КОИ-8, Windows 1251, ISO, Unicode (UTF-8) и некоторые другие.
Восьмибитная кодировка КОИ-8 (KOI8), соответствующая ГОСТ 19768-74, разработана в середине семидесятых годов в СССР и в настоящее время является основным способом кодировки для русифицированных систем на платформе UNIX (например, для http-сервера Apache) и по умолчанию для пересылки сообщений электронной почты на русском языке.
Кодировка Windows 1251 предложена компанией Microsoft и получила довольно широкое распространение.
Кодировка ISO-8859-5 была разработана Комитетом по международным стандартам (International Standards Organization, ISO) и применяется в основном в UNIX-подобных операционных системах.
В набор символов двухбайтной кодировки Unicode (UTF-8) входят буквы практически всех алфавитов мира и множество специальных символов — математических, музыкальных, физических.
Большинство современных серверных программ обладают встроенной функцией автоматического определения кодировки, используемой клиентским программным обеспечением, и перевода текста в необходимый стандарт «на лету».