Меню Еще

PDF и SEO

25.01.2013

В силу своей распространенности и своего удобства, на данный момент формат PDF глубоко проник в интернет: он часто используется на сайтах для хранения той или иной, чаще всего объемной или имеющей «печатное» происхождение или назначение, информации, а большинство браузеров предоставляют встроенную возможность просмотра PDF-документов.


PDF (Portable Document Format) — формат электронных документов, созданный Adobe Systems, и предназначенный, в первую очередь, для представления полиграфической продукции в электронном виде.

PDF SEO

Долгое время среди SEO-специалистов существовало сильное предубеждение против использования PDF с информацией по релевантным запросам на сайте: считалось, что поисковые системы всегда низко оценивают релевантность PDF-страниц, независимо от их содержания. Но не так давно Google развеял опасения на этот счет: поисковая система не только прекрасно индексирует PDF, но даже распознает и учитывает содержащиеся в документе ссылки. HTML-страницы не имеют никакого приоритета при формировании поисковой выдачи.

Содержание документа PDF может представлять собой как непосредственно текст, так и изображения, в том числе и несущие текстовую информацию. Последняя ситуация наиболее распространена при создании электронных книг в формате PDF путем сканирования бумажного оригинала без использования программ распознавания текста: каждая страница или разворот становится изображением, которые потом «подшиваются» в PDF-файл.. Поисковые системы способны воспринимать только обычный текст, доступный для копирования и вставки, тогда как PDF-документы, представляющие собой набор изображений, действительно не попадают в индекс Google и Яндекс и не только бесполезны, но часто и вредны для SEO-продвижения сайта.

На самом деле, Google уже неоднакратно заявлял о том, что индексации подвергаются и PDF-документы без текстового слоя — текст на любом языке со страницы-изображения распознается самим поисковиком с помощью алгоритмов OCR. Но, как показывает практика, работа механизма индексации таких документов еще очень несовершенна, и они никогда не попадают в поисковую выдачу.

PDF-документы продвижение

Как известно, при анализе семантики веб-страниц поисковая система большую роль отводит содержимому тегов «title» и «keywords». И отличие PDF от многих других форматов документов, встречающихся в интернете, состоит в том, что документу можно присвоить заголовок и набор ключевых слов, которые будут восприниматься поисковыми системами так же, как и аналогичные параметры обычных HTML-страниц. Помимо этих параметров, в свойствах документа присутствуют поля для указания информации об авторе, но значение этих данных для SEO не установлено, большинство специалистов полагает, что они не играют никакой роли.

Помимо указания заголовка и ключевых слов, повлиять на поисковую видимость PDF на сайте можно следующим образом:

  • URL и имя файла, содержащие ключевые слова
  • Обычные методы поисковой оптимизации текста, примененные к содержимому PDF-документа
  • Отсутствие на сайте дублирующего HTML-контента

В целом, несмотря на то, что PDF в отношении поискового продвижения все-таки ничем не уступает HTML, лучшим решением будет использование более привычного для поисковых систем и, самое главное, пользователей, формата всегда, когда это возможно.


Вернуться назад