Файл sitemap карта сайту для пошукача плагін Google XML Sitemaps

Файл sitemap – Google XML Sitemaps

З огляду на той факт, що являє собою упорядкований список посилань на всі статті сайту, було б непогано використовувати її в якості помічника для індексації сайту пошуковими системами. Для цього був придуманий спеціальний протокол sitemap. Визначає порядок запису посилань і зрозумілий для сканерів пошукових систем при індексації. За допомогою файлу sitemap.xml веб-майстри можуть повідомляти пошуковим системам про сторінки, які доступні для сканування. Файл sitemap є XML-файл. В якому перераховані URL-адреси об’єктів сайту в поєднанні з метаданими, пов’язаними з кожним адресою (дата його останнього зміни; частота зміни; його пріоритет на рівні сайту). Щоб пошукові системи могли більш грамотно сканувати цей сайт.

Роботи зазвичай знаходять сторінки по посиланнях, зазначеним на сканованому сайті і на інших сайтах. Ця інформація, доповнена даними з файлів sitemap.xml, дозволяє роботам знайти всі URL записані в файлі sitemap.xml і зібрати інформацію про ці URL за допомогою пов’язаних метаданих. Як правило файл sitemap.xml розташовується в кореневій папці сайту.

Як формується файл sitemap.xml

Приклад запису двох посилань і шапки файлу приведений нижче:

<? Xml version ="1.0" encoding ="UTF-8"?>
<urlset xmlns ="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://example.com/obomne</ loc>
      <lastmod>2013-09-06</ lastmod>
      <changefreq>monthly</ changefreq>
      <priority>0.8</ priority>
   </ url>
   <url>
      <loc>http://example.com/otebe</ loc>
     <lastmod>2013-09-06</ lastmod>
     <changefreq>monthly</ changefreq>
     <priority>0.8</ priority>
    </ url>
</ urlset>

значення рядків

Перший рядок вказує версію формату XML (1.0) і кодування тексту (UTF-8).

Другий рядок вказує адресу розташування самого протоколу Sitemap 0.90, який отримав широке визнання. Його підтримують Google, Yahoo! і Майкрософт, а останнім часом Бінго, Яндекс, Майл.ру і багато інші пошукові системи.

Третя – восьма рядка це запис однієї посилання:

Третій рядок – відкриває тег URL-адреси для першої статті;

Четвертий рядок вказує сам URL-адресу першої статті (Довжина цього значення не повинна перевищувати 2048 символів.);

П’ята вказує дату і час створення статті;

Шостий рядок вказує частоту оновлення статті (щомісяця); можливі значення: щогодини, щодня, щотижня, щомісяця і 1 раз в рік;

Сьома рядок вказує рейтинг статті на вашому сайті; нормальне значення від 0,2 до 0,8;

Ну і восьма рядок тег закриття адреси першого посилання.

Далі все повторюється для кожної наступної посилання.

В кінці файлу (в нашому випадку рядок 15) ставиться тег закриття установок адрес.

Обмеження Гугла і Яндекса для sitemap

Існують деякі обмеження створення файлу карти сайту, які обов’язково треба враховувати. Для Гугла і Яндекса вони злегка різні. Яндекс в офіційному описі вимог до файлу sitemap вказав. В одному файлі має бути прописано не більше 50 000 URL, а розмір файлу не повинен перевищувати 10 МБ. При необхідності файл Sitemap можна стиснути за допомогою архіватора gzip, щоб зменшити вимоги до пропускної здатності каналу. Однак розмір файлу sitemap без стиснення не повинен перевищувати 10 МБ.

У Гугла вимоги трохи відрізняються. За офіційним опису файл Sitemap може містити не більше 50 000 URL, а його розмір в стислому вигляді не повинен перевищувати 50 МБ. Якщо обсяг файлу або кількість перерахованих в ньому адрес перевищують ці межі, необхідно розбити його на кілька частин. Однак в додаткових рекомендаціях теж вказано, що об’єм не стисненого файлу не повинен перевищувати 10 МБ. Останнім часом часто звучить нове правило: файл Sitemap не повинен містити більше 1 000 URL в одному файлі. Це збільшує навантаження на сервер. Особливо це актуально для вордпресс.

Модулі створюють sitemap

Як ви помітили, створення файлу sitemap.xml не така вже й проста задача, якщо її намагатися виконати вручну, особливо для великої кількості статей. Але карта сайту для пошукових систем є найважливішим елементом для індексації і SEO оптимізації сайту. Багато розробники SEO плагінів для WordPress стали включати цю найважливішу функцію в свої плагіни. Наприклад All in One SEO Pack і Yoast SEO.

Я протестував ці плагіни в області побудови файлу sitemap.xml і прийшов до висновку, що вони не годяться для Яндекса. Яндекс погано відноситься до новацій закладеним в цих картах сайту. Він просто не розуміє деякі теги. В результаті довелося повернутися до традиційного спеціалізованому плагіну Google XML Sitemaps. І не дарма. Формат файлів, створених плагіном Google XML Sitemaps, влаштовує не тільки зарубіжні пошукові системи але і російські. Зараз ми його і розглянемо.

Google XML Sitemaps генерує правильний файл sitemap для Яндекса

Завантажити плагін можна зі сховищ WordPress. Після установки і активації плагіна в адмінці WordPress в розділі меню «Налаштування» з’явиться пункт «XML-Sitemap». Натиснувши мишкою на цей пункт, активуємо панель налаштувань Генератора XML-карти сайту.

Налаштування Google XML Sitemaps

Налаштувань можна знайти досить багато, але ви легко розберетеся, що включити в карту, а що ні. Налаштування, запропоновані за замовчуванням, практично ідеальні і можна нічого не міняти. Але я все ж прокоментую.

Панель налаштувань розділена на вісім частин. Перша частина інформаційна і містить інформацію про дату і час останньої перевірки файлу sitemap.xml, а так же адреса його розташування.

інформаційна панель

файл sitemap – Google XML Sitemaps – Результат останньої перевірки

Трохи нижче повідомляється, що пошукові системи Google і Bing успішно повідомлені про зміни на сайті. У наступному рядку Пропонується повідомити пошукові системи про зміни прямо зараз. Це означає, якщо ви внесли зміни до статей, а плагін з якихось причин автоматично не відправив повідомлення пошуковим системам, то ви можете зробити це примусово в ручному режимі, натиснувши на посилання. Нижче йде рядок з пропозицією скористатися є наслiдком виникнення проблем функцією налагодження. Сподіваюся вона вам ніколи не знадобиться. Далі слід пропозицію оцінити зірками в відкликання на сайті вордпресс або пожертвувати копієчку для підтримки розробника. У другому вікні розташовані “Базові параметри”.

базові настройки

файл sitemap – Google XML Sitemaps – Базові параметри

Тут є 3 базових настройки і 8 розширен
их. Перші дві це відправляти або не відправляти повідомлення для Google і Bing. Третій пункт пропонує Додати URL файлу Sitemap в віртуальний файл robots.txt. Це дуже важливий пункт. Якщо ви тільки створили сайт на базі WordPress, то у вас немає фізичного файлу robots.txt. WordPress генерує його в момент звернення на його адресу. Зміст цього віртуального файлу дуже убоге і універсальне. За замовчуванням є для індексування все. Місце розташування файлу sitemap.xml не прописано. Якщо ви поставите галочку в цьому пункті, то в цей віртуальний robots.txt при його створенні буде додаватися шлях доступу до файлу sitemap.xml, що сильно поліпшить результати індексування вашого сайту пошуковими системами. Умова роботи цього пункту відсутність реального файлу robots.txt.

Розширені настройки Google XML Sitemaps

  1. “Спробувати збільшити ліміт пам’яті” – Необхідний у випадках коли виникають проблеми пов’язані з нестачею пам’яті. На сучасних версіях wordpress може не знадобитися.
  2. “Спробувати збільшити обмеження часу виконання” – Цей параметр впливає на навантаження і швидкодія сайту. На сучасних версіях wordpress може не знадобитися.
  3. “Спробувати автоматично стискати карту сайту, якщо запитувач клієнт підтримує стиснення” – Параметр включений за замовчуванням. Якщо немає проблем в його роботі, то відключати його не треба.
  4. “Включити таблицю стилів XSLT” – Параметр для візуального оформлення карти. За замовчуванням цілком достатні.
  5. “Повний або відносний URL до Вашого файлу .xsl” – Уже включений і міняти налаштування не треба.
  6. “Змінити базовий URL карти сайту” – Файл sitemap.xml створюється в кореневій папці блогу, а повинен знаходитися в кореневій папці сайту. Блог може розташовуватися в будь-якому підкаталозі. Ось тоді знадобиться цей пункт і потрібно змінити файл .htaccess.
  7. “Включати карту сайту в форматі HTML” – Пункт за замовчуванням вже включений. Що дозволяє створити карту в форматі html. Це дає додаткові зручності при перегляді її різними браузерами, що не підтримують .xml формат.
  8. “Дозволити анонімну статистику (ніякої особистої інформації)” – Цей пункт збирає статистику про вашому сайті і відправляє на сайт розробника. Не знаю навіщо це треба. Я його ніколи не включаю.

додаткові сторінки

файл sitemap – Google XML Sitemaps – Додаткові сторінки

Третє вікно називається “Додаткові сторінки”. У самому вікні досить докладно описано що тут можна зробити. Досить натиснути кнопку “Додати нову сторінку” і відкриється вікно куди ви впишіть необхідні параметри сторінки, що додається або сайту. Після всіх змін не забудьте натиснути кнопку “Оновити параметри”, розташовану в самому низу, що б зберегти зміни.

Як обчислювати пріоритет статей

файл sitemap – Google XML Sitemaps – Пріоритет статті

Четверте вікно називається “Пріоритет статті”. За умовчанням вибраний перший пункт. І це досить розумно. Оскільки всі статті в даному випадку будуть мати пріоритет, певний нижче, і який не буде змінюватися в залежності від наявності або відсутності коментарів. Це знижує навантаження на сервер.

sitemap.xml – Google XML Sitemaps – Зміст карти сайту

П’яте вікно називається “Зміст карти сайту”. Це напевно найважливіше вікно, так як визначає, що буде перебувати в файлі sitemap.xml і що буде індексуватися. За замовчуванням включені перші три пункти і цього цілком достатньо. Деякі включають ще й четвертий пункт. Я цього не роблю, оскільки переходи з пошуку за назвою категорій збільшують кількість відмов. Всі інші пункти, особливо “Архіви” створюють дублі, що вкрай негативно впливає на рейтинг і репутацію сайту. Тому їх ні в якому разі не включаємо, щоб не злити яндекс. Нижче розташована додаткова, але дуже важлива опція “Включати час останньої зміни”. Вона допомагає пошуковику визначити, що зміст старої статті недавно змінилося і її треба знову проіндексувати.

виключені об’єкти

sitemap.xml – Google XML Sitemaps – Виключені об’єкти

Шосте вікно “Виключені об’єкти” може бути корисно, якщо раніше в п’ятому вікні “Зміст карти сайту” ви включали додаткові пункти. Тоді тут можна виключити з файлу sitemap.xml деякі категорії або безпосередньо статті та сторінки, вказавши їх адреси.

Рекомендовані частоти обходу статей

sitemap.xml – Google XML Sitemaps – Змінити частоти

Сьоме вікно дозволяє змінювати частоти повторної індексації об’єктів сайту. Налаштування за замовчуванням зроблені правильно. Тому міняти їх я не рекомендую. Хоча можете поекспериментувати. Тільки не встановлюйте всі пункти індексувати щодня. Це не поліпшить результати пошуку, а навантаження на сайт збільшить.

Установка пріоритетів статей

sitemap.xml – Google XML Sitemaps – Пріоритети

Восьме вікно, дозволяє визначит
и пріоритети індексування об’єктів сайту. За умовчанням вони встановлені правильно. Але можете спробувати зробити деякі зміни. Наприклад в другому пункті можна спробувати збільшити до 0,8. Головну сторінку знижувати ні стоїть. А підвищувати чотири останніх немає сенсу. Якщо встановити всі пріоритети однаковими, то пошукові системи не будуть знати що у вас головне. Що його потрібно індексувати в першу чергу. Тому змінювати налаштування і тут не рекомендую. У разі внесення змін до настройки не забудьте натиснути кнопку “Оновити параметри”.

Ось і все про налаштування. Далі плагін автоматично виконує побудову xml карти сайту при будь-якій зміні статей вашого блогу. І надає достатню кількість інформації про вашу карту сайту. Коли вона була створена з зазначенням дати і часу. Чи успішно були проінформовані пошуковики. Карти сайту, побудовані плагіном Google XML Sitemaps подобаються Яндексу і всім іншим пошуковим системам.

Починаючи з версії 4.0 плагін більше не працює зі статичними файлами, а генерує динамічні карти. При оновленні статей або публікації нових генерується за новою не вся карта сайту, а тільки та її частина в якій описуються нові зміни. Це прискорює роботу сайту і процес індексації нових і змінених статей пошуковими системами.

Ось мабуть і все що стосується створення карти сайту для пошукача і роботи з плагіном Google XML Sitemap.

Ссылка на основную публикацию