HTML (HyperText Markup Language – язык разметки гипертекста) используется при подготовке документов для системы WWW. HTML представляет собой достаточно простой набор команд, которые описывают структуру документа. Этот язык разметки позволяет выделить в документе отдельные логические части (заголовки, абзацы, списки-перечисления и т. д.), но не задает конкретные атрибуты форматирования. Конкретный вид форматирования задает используемая при чтении документа программа просмотра, которая обеспечивает наилучшее отображение информации на вашем дисплее.
Команды HTML вставляются в текст документа и определяют логический статус отдельных фрагментов текста. Так, например, вы можете выделить в документе фрагменты текста, помеченные как заголовки различных уровней, отдельные абзацы, списки-перечисления и т. д. Имеются также команды, позволяющие вставить в документ другие объекты (изображения, звуки, анимацию), и команды, с помощью которых устанавливаются гипертекстовые связи с другими документами (или с другими частями того же документа). Программа просмотра получает документ, интерпретирует HTML-команды и выполняет форматирование составных частей документа (заголовков, перечислений, абзацев и т. д.) так, чтобы обеспечить удачное расположение информации на вашем дисплее.
Основной отличительной особенностью гипертекстовых документов является наличие ссылок, называемых также гиперссылками. Такие ссылки устанавливают связи между данным документом и другими документами, однако они существенным образом отличаются от обычных текстовых ссылок типа фразы «дополнительную информацию вы найдете на странице 2». Эти связи между документами являются «живыми», т. е. выбор ссылки приводит к отображению на экране указанного в ссылке документа. При составлении гипертекстового документа устанавливаются ссылки на другие документы, которые содержат дополнительную информацию, относящуюся к содержанию данного документа.
Практически все документы в системе WWW являются гипертекстовыми и наряду с командами, описывающими структуру документа, содержат команды языка HTML, задающие ссылки на другие документы. Многие из них, являясь гипермедиа-документами, включают ссылки на графические изображения, звуковые данные и анимацию.
Каждая из гипертекстовых связей имеет две части. Одна часть задает информационный ресурс, на который указывает ссылка (этим ресурсом может быть какой-то документ, текст, изображение, звуковой или видеофрагмент). В случае WWW можно ссылаться на информацию, которая содержится как на том же компьютере, что и исходный документ, так и на любом другом хост-компьютере Internet.
Другой частью гипертекстовой связи является «анкер» (anchor). В качестве анкера разработчик документа может задать какое-нибудь слово, группу слов, изображение или даже отдельную область изображения, представленного на экране пользователя. При работе с графическими браузерами активизация ссылки производится путем установки курсора мыши на анкере с последующим щелчком, а в случае текстовых браузеров – путем выбора анкера с помощью клавиш управления курсором и нажатия клавиши <Enter>.
Способ выделения анкеров в документе зависит от типа дисплея. В случае цветного графического дисплея слова-анкеры могут быть выделены цветом, отличным от цвета остального текста, а изображения-анкеры – заключены в цветную рамку. На монохромных дисплеях слова-анкеры часто выделяют подчеркиванием, а изображения-анкеры помещают в какую-либо выделяющую их рамку. На простейших текстовых терминалах слова-анкеры принято выделять инверсией цвета символов и фона. При этом текущий выбранный анкер обычно выделен инверсией цвета символов и фона, а остальные слова-анкеры отмечены цветом или повышенной яркостью символов в зависимости от используемого типа дисплея. Один из способов обнаружить анкер при работе с графическим WWW-браузером – следить за видом курсора мыши. При прохождении через анкер курсор часто изменяет форму. Например, при работе с программой Mosaic курсор, представленный в обычном состоянии наклонной стрелкой, принимает вид кисти руки с поднятым пальцем.
Когда вы активизируете ссылку (выбираете соответствующий анкер), браузер обращается к объекту, на который указывает данная ссылка. Это может привести как к чтению документа, находящегося на вашем локальном диске, так и к запросу на получение документа, хранящегося на удаленном компьютере. В ссылке указывается тип затребованной информации (HTML-документ, звуковой файл и т. д.), и браузер представляет вам полученные данные надлежащим образом.
Если вы не установили драйвер, необходимый для работы с затребованным ресурсом (например, драйвер для прослушивания звуковых файлов), то тем не менее ваш браузер получит соответствующую информацию, после чего последует сообщение об ошибке, указывающее на то, что необходимый драйвер не обнаружен.
Одной из целей проекта World Wide Web была разработка стандартного способа указания ссылок на доступные с Internet ресурсы, применимого для любых типов ресурсов (документы, звуковые файлы и т. д.). Для решения этой задачи было введено понятие URL (Uniform Resource Locator – универсальный указатель ресурсов).
URL представляет собой полное описание ресурса, включающее его местонахождение в Internet. При этом рассматриваемый ресурс может представлять собой как файл на локальном диске вашего компьютера, так и файл, находящийся на каком-либо хост-компьютере Internet в любой части света.
URL может быть представлен в виде абсолютной или относительной ссылки. Абсолютная ссылка содержит полную информацию о ресурсе, включая имя хост-компьютера, на котором он находится, путь к соответствующему каталогу и имя файла. При использовании относительных ссылок предполагается, что хост-компьютер и путь к текущему каталогу уже были определены в ходе предшествующей работы, поэтому указывается только имя файла (или путь с подкаталогами и имя файла).
Если вы сохраняете какой-либо WWW-документ на локальном диске с целью последующего использования, то следует посмотреть, как заданы гипертекстовые ссылки в этом документе – в абсолютной или в относительной форме. Если данный документ содержит относительные ссылки на другие документы, то эти ссылки не будут работать до тех пор, пока вы не скопируете соответствующие документы на локальный диск и не расположите их в той же структуре каталогов, которая существовала на исходном сервере. Абсолютные ссылки всегда будут работать правильно, если вы соединены с Internet и если местонахождение документов не изменилось.
Назначение URL не ограничивается описанием местонахождения WWW-документов. Многие браузеры (включая Mosaic) предоставляют доступ и к другим сервисам Internet, в числе которых анонимный FTP, Gopher, WAIS, телеконференции UseNet и Telnet.
Типичный URL выглядит так:
http://www.eit.com/web/www.guide
Начальная часть URL, заканчивающаяся двоеточием, задает протокол, используемый системой для доступа к информационному ресурсу. Протокол – это совокупность правил, регламентирующих работу системы с тем или иным сервисом. В приведенном примере в качестве протокола указан HTTP – HyperText Transfer Protocol (протокол передачи гипертекста), разработанный специально для системы WWW. Две наклонных черты после двоеточия указывают, что далее следует адрес хост-компьютера Internet. Этот адрес может быть задан в виде доменного имени, как это сделано выше, или в виде числового IP-адреса. После адреса хост-компьютера в примере указан полный путь к файлу, записанный по правилам операционной системы UNIX.
Даже если вы обращаетесь к серверу, работающему на PC, при указании пути к файлу следует использовать символ наклонной черты – slash (/), а не обратной наклонной черты – backslash (), как это принято в операционной системе MS-DOS.
Таким образом, приведенный пример URL содержит указание WWW-браузеру обратиться к хост-компьютеру www.cit.com по протоколу HTTP и получить файл www.guide из каталога /web.
В таблице перечислены другие протоколы, которые могут использовать WWW-браузеры при работе с ресурсами Internet.
Протоколы для WWW-браузеров
Протокол |
Назначение |
gopher | Работа с Gopher-сервером |
ftp | Работа с FTP-сервером |
File | Обращение к файлу на локальном диске, если далее следуют символы ///с|, или к FTP-серверу, если следуют символы // и имя хост-компьютера. Вместо «с» может быть указано обозначение любого локального диска, за которым обязательно следует вертикальная черта, а не двоеточие, имеющее в URL иное значение |
wais | Обращение к WAIS-серверу |
news | Чтение телеконференций UseNet |
telnet | Открытие сеанса работы по протоколу Telnet |
Одной из целей проекта WWW была реализация удобного способа доступа к документам, размещенным на удаленных компьютерах. Для передачи в сети WWW-документов, стандартной формой представления которых является гипертекст, был разработан новый протокол, названный HTTP – Hypertext Transfer Protocol (протокол передачи гипертекста). HTTP – это довольно простой коммуникационный протокол, который учитывает, что передаваемые документы включают гипертекстовые ссылки, т. е. содержат информацию об адресах, по которым могут быть отправлены последующие запросы.
Для просмотра WWW-документов совершенно не обязательно знать что-либо о протоколе HTTP, однако если вы заинтересовались этим вопросом, то можно посоветовать познакомиться со спецификацией протокола HTTP. Это стандартная спецификация, утвержденная комиссией IETF и принятая сообществом Internet. Документ, содержащий описание этой спецификации, можно получить с помощью следующего URL:
http://info.cern.ch/hypertext/WWW/Protocols/HTTP/HTTP2.html
Каждый пользователь WWW может создать и установить свою собственную «домашнюю страницу», на которой можно собрать ссылки на наиболее часто используемые серверы. Домашние страницы также можно готовить для рабочих групп, члены которых используют общие информационные ресурсы. Например, при выполнении какого-либо проекта имеет смысл создать домашнюю страницу, содержащую ссылки на все относящиеся к теме проекта информационные источники.
Многие называют начальную страницу, которой WWW-сервер «встречает» пользователя, домашней страницей данного сервера. Однако мы будем понимать под домашними страницами не такие заглавные страницы, предназначенные для всеобщего использования, а страницы, на которых собрана информация по определенной теме для выполнения конкретной работы.
При обсуждении вопросов, связанных с WWW, часто употребляются два термина – «клиент» и «сервер». WWW-клиенты реализуют интерфейс для работы с системой WWW, т. е. направляют запросы, получают информацию и позволяют просматривать документы. WWW-серверы предоставляют доступ к собраниям WWW-документов, размещенных на различных хост-компьютерах Internet.
Программа-клиент – это программа, используемая для просмотра WWW-документов. Программа-сервер – это программа, которая управляет доступом к WWW-документам, собранным на некотором хост-компьютере Internet.
World Wide Web, подобно всему Internet, непрерывно изменяется. Ежедневно появляются новые серверы, а некоторые из ранее существовавших серверов исчезают. Создаются новые WWW-браузеры, совершенствуются и приобретают новые возможности уже известные браузеры. Возможно, будут разработаны новые протоколы для работы с новыми сервисами Internet. Обилие быстро изменяющейся информации приводит к тому, что содержание любого печатного труда весьма скоро устаревает. Разумеется, наряду с устаревающей информацией приводятся и необходимые для работы базовые сведения, однако все же значительная часть информации носит текущий характер и нуждается в актуализации.