Язык разметки HTML (HyperText Markup Language) разработан в 1991 г. с целью широкого применения разметки в документах, представляемых в WWW технологиях.
Описание на языке HTML представляет собой текст в формате ASCII и последовательность включенных в него команд (управляющих кодов), называемых также дескрипторами или тегами. Этот текст называют HTML-документом, или HTML-страницей, или после размещения на Web-сервереWeb-страницей. Теги расставляются в нужных местах исходного текста, они определяют шрифты, переносы, появление графических изображений, ссылки и т.п. При использовании WWW-редакторов вставка команд осуществляется простым нажатием соответствующих клавиш.
Собственно команды имеют форму <команда>, где вместо слова "команда" записывается имя команды.
Структура текста в HTML-странице имеет вид:
<HTML><HEAD>
<TITLE>Заголовок текста</TITLE>
</HEAD>
<BODY>
Текст HTML-документа
</BODY>
</HTML>
В клиентской области окна при просмотре появляется только текст, помещенный между тегами <BODY> и </BODY>. Заголовок между тегами <TITLE> и </TITLE> выполняет лишь служебные функции.
Приведем примеры HTML-тегов. К тегам форматирования текста (тегам компоновки) относятся:
Теги форматирования символов имеют вид <B>, <I>, <U>; текст между открывающем и закрывающем тегами будет выделен соответственно полужирным шрифтом, курсивом, подчеркиванием.
Для форматирования заголовков используются теги <H1> ... <H6>:
В HTML имеются теги форматирования списка. Это теги <OL> и <UL>, используемые для выделения пунктов списков с нумерацией или с пометкой специальным символом (например, *) соответственно. Каждый пункт в списке должен начинаться с тега <LI>. В словарях и глоссариях удобно применять тег <DL>, отмечающий начало списка, теги <DT> и <DD>, отмечающие очередной новый термин словаря и определяющий его текст соответственно.
В командах вставки графики и гипертекстовых ссылок используются адреса вставляемого или ссылочного материала, называемые URL (Uniform Resourse Locator). Ссылаться можно как на определенные места в том же документе, в котором поставлена ссылка, так и на другие файлы, находящиеся в любом месте сети. Перед простановкой внутренней ссылки, т.е. ссылки на некоторую позицию в данном файле, нужно разместить метку в этой позиции. Тогда URL есть указание этой метки, например, URL=#a35 есть ссылка на метку a35. URL может представлять собой имя файла в данном узле сети или IP-имя другого узла с указанием местоположения файла в этом узле и, возможно, также метки внутри этого файла.
Строка гипертекстовой ссылки в HTML-документе имеет вид:
<A HREF="URL">Текст</A>
Текст, указанный в этой строке и отображаемый на экране дисплея, будет выделен цветом или подчеркиванием. Можно ссылаться на определенное место в документе. Тогда ссылка имеет вид:
<A HREF="URL#метка">Текст</A>
Сама метка в документе имеет вид:
<A NAME="метка">Текст</A>
Ссылки на фрагменты данного документа можно упростить:
<A HREF="#метка">Текст</A>
Тег вставки графического изображения:
<IMG SRC="URL" [ALIGN=TOP|MIDDLE|BOTTOM] [ALT="Текст"]>
Здесь URL указывает адрес графического изображения, ALIGN — параметр выравнивания, указывает место в окне для расположения рисунка; ALT — параметр, задающий текст, который выводится на экран вместо рисунка в текстовых браузерах. Например:
<IMG SRC="fgr.gif">
Кроме параметров ALIGN и ALT можно использовать параметры HEIGHT и WIDTH, задающие высоту и ширину изображения (в пикселах), HSPACE и VSPACE, определяющие размер промежутка между изображением и границами страницы в горизонтальном и вертикальном направлениях, BORDER, задающий рамку вокруг изображения. Сами изображения должны быть в определенном формате (обычно это форматы GIF или JPEG).
Экран может быть разделен на несколько окон (областей, фреймов) с помощью парного тега <FRAMESET>. В каждом окне помещается содержимое файла (текст, изображение) указанием источника в теге <FRAME>, например:
<FRAME SRC="имя_файла">
Представление таблиц выполняется с помощью тегов формирования таблиц. Парные теги <TABLE> и </TABLE> служат для указания начала и конца таблицы; <TH> и </TH> — то же для шапки таблицы; <TR> и </TR> — для строки таблицы; <TD> и </TD> — для элемента таблицы. Для форматирования таблиц используются параметры, записываемые в открывающих тегах и задающие цвет фона, ширину таблицы, расположение текста в ячейках.
Имеются возможности создания на Web-странице формы, в которую пользователи могут заносить информацию, передаваемую браузером на сервер (тег <FORM>) или управляющую выбором из меню (тег <INPUT>).
Поскольку в языке HTML множество тегов ограниченное и фиксированное, действия, предусматриваемые ими, в частности, операции форматирования, реализованы в браузерах. При этом тегам, подобным <H1>, соответствует определенный стиль (тип, размер, цвет шрифта). Чтобы дать возможность пользователям устанавливать желаемый стиль изображения, разрабатывают таблицы стилей, представляющие информацию о параметрах стиля, и способы связывания таких таблиц с HTML-документом. Большинство браузеров поддерживают каскадные таблицы стилей CSS (Cascading Style Sheet).
Таблица CSS состоит из правил форматирования. В каждом правиле указываются тип элемента, к которому относится форматирование, и список объявлений. Список обрамляется фигурными скобками, объявления в списке разделяются точками с запятой. Каждое объявление задает значение одного из свойств отображения элемента в виде свойство:значение. К свойствам относятся тип (гарнитура), размер, цвет, способ выравнивания и стиль (обычный, полужирный, курсив) шрифта, цвет или рисунок фона, межстрочные интервалы, наличие рамок, взаимное расположение блоков текста и другие характеристики, обычные для управления видом изображения в текстовых редакторах. Можно вместо типа элемента указать имя оригинального вводимого стиля, имя стиля должно начинаться с точки.
Использование таблицы стилей подразумевает указание типа таблицы в разделе <HEAD> HTML-документа. Там же между тегами <STYLE> и </STYLE> записываются правила форматирования. Можно все правила форматирования записать в отдельном файле и тогда в HTML-документе достаточно сослаться на этот файл в специальном теге <LINK>. Если вводимый стиль относится лишь к части документа, используется тег <SPAN> с параметром CLASS, например:
<SPAN CLASS="имя_вводимого_стиля">Часть документа</SPAN>
Первые версии языка HTML были достаточно простыми, но не лишенными ряда недостатков. Прежде всего нужно отметить ограниченность набора тегов, что не соответствует потребностям многих приложений. Кроме того, в тегах HTML не отделены данные, задающие структуру документа, от данных по его изображению (форматированию) на экране дисплея при просмотре с помощью браузера, что затрудняет работу с документами. В результате в новые версии языка стали вводится усовершенствования, что заметно усложнило язык, но не устранило основные недостатки. Наиболее существенными недостатками HTML являются, во-первых, невозможность отделить информацию о структуре документа от информации о форматировании, во-вторых, отсутствие в языке HTML средств, позволяющих производить такие операции обработки текста, как сортировка, поиск фрагментов по определенным признакам и т.п.
Поэтому в 1996 г. был предложен новый язык разметки — язык XML (eXtensible Markup Language).
Кроме того, было разработано расширение DHTML (Dynamic Hyper Text Markup Language) языка HTML, названное динамическим языком разметки гипертекста. С помощью DHTML можно создавать Web-страницы, включающие интерактивные элементы, анимацию, движущиеся объекты и фон, расположенный под основным содержимым документа, выпадающие меню и т.п. Стандарт DHTML используется для создания скриплетов -- сценариев, обрабатываемых браузером совместно с кодом HTML.