Теги body и head в веб-страницах HTML-контента сайта после публикации в AuthorIT

Теги <body> и <head> в веб-страницах HTML-контента сайта после публикации в AuthorIT присутствуют, разумеется, в каждой отдельной сгенерированной странице. Для сайта, построенного в виде «чистого» HTML, все так и должно быть. Но при использовании систем управления контентом (CMS) данные теги оказываются вложенными, от этого страницы становятся «неканоническими», что очень не нравится поисковым системам. Как избавиться от дублирования тегов? Редакция от 03.10.2014.

Создан 13.09.2014 16:30:10

Избавиться от дублирования тегов <body> и <head> в веб-страницах HTML-контента сайта после публикации в AuthorIT можно и ручным их удалением, если опубликованных страниц максимум пять-шесть. Если опубликованных страниц несколько десятков, то процесс придется автоматизировать, организовав пакетное задание. Для решения такой задачи прекрасно подходит Adobe Dreamweaver, пользоваться которым привыкли многие, им и воспользуемся.

На рисунке ниже изображена HTML-разметка настоящей страницы после ее публикации в AuthorIT и последующей обработки, см. Пакетная перекодировка кодовой страницы windows-1251 в utf-8 и Оптимизация HTML: код в одну строку. Теги <body> и <head>, подлежащие удалению, выделены.

- Теги &lt;body&gt; и &lt;head&gt;, подлежащие удалению

Теги <body> и <head> удаляются по отдельности специально созданными для этого скриптами (макрокомандами). Для этого необходимо в Dreamweaver выполнить команду меню ПравкаНайти и заменить, после чего откроется окно Найти и заменить. В окне следует установить значения всех полей так, как изображено на рисунке ниже.

- Найти и заменить для head

После нажатия кнопки Заменить все тег <head> вместе со своим содержимым будет полностью удален со всех веб-страниц.

Для удаления тега <body> следует повторить команду ПравкаНайти и заменить, значения соответствующих полей окна изображены на рисунке ниже.

- Найти и заменить для body

В данном случае будут удалены только теги <body></body>, все содержимое тела документа останется нетронутым. Результат удаления тегов <body> и <head> в веб-страницах HTML-контента сайта изображен на рисунке ниже.

- Удаленные теги &lt;body&gt; и &lt;head&gt;