Какво влияе на индексирането и класирането на сайта в Google? Като начало, сайтът трябва да се обходи от бота на Google, след това да се индексира и най-накрая е класирането му в резултатите.
В тази статия отговаряме на въпроси, свързани с индексирането на страниците от сайта и класирането им в списъка с резултати в търсачките.
За да разберем какво представлява класирането на сайта в Google, е нужно да знаем основните 3 процеса от работата на търсачката.
1. Обхождане на сайта от ботовете на Google (crawling)
Преди да може да се класира сайтът в резултатите на търсачката, Google трябва да посети страниците му и да запише данните им. Посещаването се нарича още обхождане (crawling):
- Обхождането на сайта се извършва от уеб роботите или ботовете на Google (Googlebot);
- Ботовете зареждат страницата, както човек посетител би го направил в браузъра;
- Данните от страницата се изпращат към базата данни на Google.
Ботовете на Google (crawlers) обхождат уеб страниците и подават информацията им към индекса (огромна база данни) на търсачката. Тази информация се организира в базата чрез индексиране (подобно на индекса в края на книга). Размерът на индекса на Google е огромен – над 100 милиона гигабайта.
При обхождането Googlebot-ът зарежда страницата така, все едно реален посетител я е отворил в браузъра си. Ако от страницата се извикват допълнителни ресурси, те също се изтеглят и от бота. Ако една страница прави 9 заявки за допълнителни ресурси, то за бота обхождането на страницата ще струва 10 заявки. След зареждането, изобразеното съдържание се използва за попълване на страницата в индекса на Google.
Какво влияе на обхождането на страниците?
Някои от начините да се повлияе положително върху процеса по обхождането на страниците са чрез:
- Подаване на карта на сайта (XML sitemap) към Google;
- Посочване на локализираните версии на страницата с hreflang;
- Идентификация за каноничните адреси.
Какво може да повлияе негативно за обхождането на страниците:
- Ботът на Google не може да достъпи страницата. За обхождането основно е важно уеб роботът да има достъп до страницата, за да може да я обходи и да я зареди. Това означава да няма поставени забрани за него – в robots.txt файла или чрез друга техника за ограничаване на достъпа му.
Вижте: 4 причини, поради които ботът на Google не би могъл да обходи сайта Ви | Help
- Бавно зареждане на страницата. Колкото по-бавно се зареждат страниците, толкова повече ще трябва ботът да изчаква получаването на HTML кода им. Последствието от бавното зареждане ще е по-малък брой обходени и индексирани страници. А официалният отговор от Google е:
„Ускоряването на сайта подобрява потребителското изживяване и също увеличава честотата на обхождане (crawl rate).“
–
Google Webmaster Central Blog
„Making a site faster improves the users’ experience while also increasing crawl rate.“
Освен за обхождането, бързината на сайта е от много голямо значение и за класирането на сайта в Google. Вижте още: Защо е важна е скоростта и как можете да ускорите зареждането на сайта | Blog
2. Индексиране на сайта (indexing)
Индексирането е процесът, в който информацията от обходената страница се организира и записва в базата данни на търсачката.
Какво влияе на индексирането на страниците?
На този етап, както при обхождането, за Google е важно не къде се намира уеб сървърът, какво е домейн името на сайта, а дали уеб роботите му могат да заредят страницата, така че да достигнат до съдържанието ѝ.
Някои от начините да се повлияе положително върху процеса по индексирането са чрез:
- Добавянето на структурирани данни. Тези данни помагат на Google да разбере по-добре съдържанието на страниците;
- Следване на насоките за Webmasters на Google.
За добавянето в индекса е важно страницата да може да се зареди безпроблемно и бързо от бота, за да може информацията ѝ да се подаде към индекса.
#Q Какво влияние оказва местоположението на хостинг сървъра за индексирането на сайта?
Влиянието, което може да окаже местоположението на сървъра, е върху преценката на Google за локализацията на съдържанието на страницата и целевата ѝ аудитория. И то само ако другите препоръчителни индикатори за локализацията не са налични като:
- Разширението на домейна. Например ако е BG, Google ще знае, че страниците са предимно за аудитория в България или използващи български език.
- Ако топ домейнът е например COM, може да се укаже на Google, че таргет аудиторията е от определена държава чрез настройката International Targeting в GSC (Google Search Console).
- Атрибутът hreflang.
Google не разчита основно на местоположението на сървъра, чрез проверка на IP адреса му, за да установи коя е целевата група потребители на сайта. Някои сайтове използват CDN мрежа и сървърът, в зависимост от местоположението на посетителя, може да се окаже на различно местоположение всеки път. Също така при CDN IP адресът е различен от този на реалния сървър, на който се намира съдържанието на сайта.
Ако сайтът е с домейн BG и езикът на съдържанието в страниците е на български, независимо къде е местоположението на сървъра, Google ще знае, че целевата аудитория е потребители със същата локализация (държава или език). Потребителите, които търсят на български език, може да не се намират в България, но потърсят ли на български, резултатите ще са на страници с български език. Това е влиянието, което може да окаже местоположението на сървъра – да помогне на Google да покаже най-уместните локализирани резултати на потребителите, спрямо техните настройки на локализацията.
#Q Има ли значение платформата за индексирането на сайта?
Платформата на сайта (на какъв скриптов език е написана) няма значение за самото индексиране на страниците му. Значение, свързано с технологиите, които сайтът използва, ще има, ако например дадената платформа не подава целия HTML код на страницата при първо повикване от бота, но го извлича и попълва прогресивно например чрез JavaScript. Сайтовете, използващи този начин за попълване на съдържание в страницата, се наричат SPA (Single Page App). Стандартните CMS платформи като WordPress, OpenCart и други не са такъв тип приложения – те генерират цялото съдържание на страницата на сървъра и след това го подават цялото в един отговор към браузъра.
3. Класиране на сайта в Google (ranking)
Когато потребител подаде заявка за търсене в търсачката, Google стартира изпълнението на серия от алгоритми за търсене. Чрез тях Google ще се опита да разбере какво има предвид потребителят и какво е неговото намерение зад търсените думи. След това ще потърси в индекса страниците, които най-добре отговарят на ключовите думи и намерението. След това ще приложи върху резултатите проверка за подредбата (позиционирането, класирането) им.
Класирането на най-уместните и най-полезни страници в резултатите е спрямо стотици фактори (над 200), като те може да имат различни вариации. Не съществува официален пълен списък с факторите, по които Google класира страниците.
Някои от характеристиките на страницата, които засягат отчитането на уместността ѝ:
- Съдържание. Доколко полезно и качествено е съдържанието на страницата, дали помага на потребителя да постигне това, което иска. Дали обслужва целите на хората, които искаме да привлечем и да взаимодействат с това съдържание. Качеството на съдържанието се определя и според показателите за експертност, авторитетност и достоверност.
- Метаданни. Метаданните помагат на Google да разбере по-добре за какво е съдържанието в страниците. Към метаданните спадат: мета описанието (обобщава с до 150 символа какво ще намери потребителят на страницата), мета заглавие (обобщение в няколко думи за есенцията на съдържанието, представете си го като заглавие на есе, книга или друго), ключови думи (ориентират бота какви думи най-добре описват съдържанието на страницата).
- Производителност. Представянето на страницата по време на зареждането ѝ влияе върху потребителското изживяване. За добро потребителско изживяване е важно сайтът да се зарежда бързо и мобилното му представяне да е добро. За класирането Google взема предвид и потребителското изживяване на страницата.
Показателите за производителността на страниците в сайта може да се тестват с инструмента на Google PageSpeed Insights. Вижте повече: Какво измерва PageSpeed Insights? [SEO Q&A част II] | Blog
Проверка на класирането на сайта в Google
Проверка на класирането на сайта в Google по определени ключови думи може да се направи с различни инструменти. Например през https://www.serprobot.com/serp-check – избирате ключовата дума, за която искате да проверите коя от Вашите страници се класира и на коя позиция се показва в резултатите.
Ако сте регистрирали сайта си в Google Search Console, но все още не виждате страниците му в резултатите от търсене, може да направите няколко проверки за причините, вижте: Защо сайтът ми не излиза в Google? | Help
Какво влияе на класирането на страниците?
Всичко, което се свързва с факторите за уместност на съдържанието, оказва влияние за позицията на страницата в резултатите.
1. Качеството и полезността на съдържанието
Качеството и полезността на съдържанието на страницата е едно от най-важните. За определяне на качеството на съдържанието Google използва множество сигнали и методи. Например резултатите от тестовете за качество, извършвани от реални хора. Един примерен тест за качеството на основното съдържание в страницата е:
5.1 Много високо качество на ОС (основно съдържание)
Ние ще приемем, че основното съдържание е с много или с най-високо качество, когато то е плод на много време и усилия, и по-точно, експертиза, талант и умение. Това може да е доказателство за E-A-T (Експертиза, Авторитетност, Достоверност) на страницата.
–
5.1 Very High Quality MC (Main Content)
We will consider the MC of the page to be very high or highest quality when it is created with a high degree of time and effort, and in particular, expertise, talent, and skill—this may provide evidence for the E-A-T (Expertise, Authoritativeness, and Trustworthiness) of the page.
Google General Guidelines – Search Quality Rating
Резултатите от това тестване не оказват директно влияние върху класирането на дадената страница, но върху цялостното разбиране на Google за определяне на качеството на съдържанието. Което може да доведе до извършване на ъпдейт на алгоритмите и повлияване на класирането за всички страници.
2. SEO – оптимизацията за търсачки
Колкото и да е полезно съдържанието, ако не сте използвали ключовата дума, по която Вашите потребители търсят тази информация, шансът за по-добра позиция е по-малък.
Какво е SEO?
SEO е начинът да се показваш на челни места в резултатите на търсачката при ключови думи, които търсят твоите потенциални клиенти.
Геннадий Воробьов , 14 въпроса за SEO, SEM и какво търсим в интернет | Blog
Вижте (или чуйте) в статията още отговори на въпроси, свързани със SEO, като:
- Защо току-що направеният сайт не излиза на първа страница в Google?
- Какво да направим и колко време ще отнеме, за да излиза сайтът на по-добри позиции?
- Какви съвети има за по-добра оптимизация?
#Q SaaS платформи, Open Source CMS или custom сайтове се класират най-добре?
За класирането на сайта в резултатите не влияят техническите характеристики на изпълнението му, но сигналите за качество, полезност, уместност, ползваемост на страницата.
Някои CMS платформи имат вградени опции за SEO оптимизация като например добавяне на SEO мета тагове, следене за броя символи и качество на таговете, създаване на XML sitemap, интеграция на Schema.org Markup и други. За WordPress например има специални SEO плъгини като All in One SEO, Yoast и други.
Колкото по-добра е SEO оптимизацията на сайта, независимо от платформата му, толкова по-добри позиции ще има при търсенето.
#Q Домейните на кирилица класират ли се добре в търсачките?
Ако потребителите търсят на кирилица и домейнът съответства на търсената дума, сайтът има малко по-голям шанс да се покаже в първите позиции. Ако думата не е сред най-често срещаните и сайтовете, борещите се за класиране по тази дума, са малко, тогава шансът за по-добри позиции се увеличава.
Но наличието на ключовата дума в името на домейна ще е само един от стотиците фактори за класирането. Не е достатъчно просто да регистрираме подобен домейн и да се надяваме с него да си спечелим първите позиции. Ако има други сайтове, които предлагат по-качествено съдържание и имат по-добри показатели на факторите за класиране, въпреки че нашият домейн е точно съвпадение по дадената дума, той може да изпадне на по-задни позиции.
Въпросът с домейните на кирилица засяга един друг по-важен въпрос:
„Може ли да използвам думи на друг език, различен от английския, за домейна и уеб адресите на моя сайт?“
А кратък и ясен отговор получаваме директно от Джон Мюлер, Старши анализатор на Webmaster тенденциите в Google:
„Да, не-английските думи в URL адресите не са проблем.“
–
„Yes, non-English words in URLs are fine.“
Can my URLs use non-English words? – SEO Snippets https://youtu.be/74FiBesPkI4
Google използва уеб адресите основно като начин за намиране на дадено съдържание, например при обхождането. Ако URL адресите са валидни и уникални, всичко е наред.
За домейн имената на кирилица, както и за техните разширения (.бг, .сайт и т.н.), не-латинските символи са представени с punycode кодиране, например „имена.бг“ е „xn--80ajiqg.xn--90ae“.
За браузърите и за Google двете версии на домейн името са еквивалентни (кирилицата и xn--кода). Google ги третира като едно и също нещо.
Останалата част от уеб адреса (след домейна) може да използва кодиране (URL encoding), когато съдържа специални символи или пък е на кирилица. Например:
- Микс от латински букви и специални символи.
Когато думата на латиница съдържа специални символи (например „Hello Günter“), тя ще изглежда така в уеб адреса: „Hello%20G%C3%BCnter“ (празното разстояние също се приема за специален символ). - Unicode (UTF-8) кодиране за не-латински символи.
Когато думата е на кирилица (например „хостинг“), кодирана в UTF-8 тя има този вид: „%D1%85%D0%BE%D1%81%D1%82%D0%B8%D0%BD%D0%B3“.
Google приема и третира вариантите на уеб адресите по един и същ начин.
Можете да видите на живо какви са резултатите от кодирането на дадена дума през инструмента URL Encoding Functions в w3schools.com. Въведете дума на латиница, съдържаща специален символ, или дума на кирилица, и кликнете на URL Encode.
Този вид на уеб адресите (неразбираемите символи) е видим само когато потребителите копират уеб адреса и го поставят извън браузъра, например в текстообработваща програма. Ако на даден потребител, който използва сайта, изобщо не му се налага да прави такова нещо, тогава неразбираемите адреси (които се виждат извън браузъра) не са причина за притеснение.
Другото е, че при линкване към дадена страница, използваща кодиран адрес, този, който поставя препратката, ще „види“ и използва неразбираемия адрес.
Най-известните и използвани CMS системи поддържат различните варианти на уеб адресите, например WordPress разпознава вариантите и извършва автоматично декодирането.
Но самата препратка ще е като всяка друга и дори при посочването ѝ с курсора на мишката, браузърът показва декодирания вариант на целия уеб адрес.
Докато браузърите и платформите за сайтове поддържат, разбират и показват правилно домейните и уеб адресите на кирилица, някои външни системи все още нямат пълна поддръжка за тях. Поради това понякога се говори в негативен аспект за домейните на кирилица или пък за URL адресите на кирилица.
За SEO експертите, които работят и следят ежедневно много URL адреси, ако те са на кирилица, това може да е изключително неудобно. Например когато SEO инструментите не показват правилно URL адреси на кирилица (като Google таблици).
Домейните на кирилица като полезна добавка към маркетинга
Домейните на кирилица може да са една много полезна добавка към маркетинга на бранда. Един от плюсовете им е, че те се запомнят много по-лесно.
Например ако само за миг видим домейна шоколад.бг, дори с крайчеца на окото, не е нужно да полагаме усилия да разберем какво пише, как точно е изписано и какво означава, за да можем да го изпишем в браузъра. Пък и думите на български език будят чувства в нас, българите. Има разлика в това да видим написано шоколад.бг и chocolate.com. В първия вариант мигновено си представяме парче шоколад, защото тази мисловна картина извиква думата в ума ни, заложена още откакто сме разбрали смисъла ѝ като деца. А във втория вариант първо се питаме дали правилно си превеждаме думата, после обръщаме внимание как точно е изписана (това „h“ след първото „c” ли беше, с „k“ или „c“ се изписваше), за да можем да го „препишем“ в браузъра.
Поради това домейните на кирилица може да се използват в рекламата и маркетинга на бизнеса, за извикване на „картината“ ? у потребителите, която пък предизвиква емоция. А емоцията предизвиква действие. Някои ще потърсят наоколо шоколад, а други ще отворят сайта сега или пък ще знаят къде да погледнат, когато имат време.
От техническа гледна точка, домейните на кирилица може да се пренасочат и да зареждат основния домейн, който е на латиница.
Пренасочването може да се създаде в cPanel » (Домейни) Пренасочвания, след като домейнът е добавен като паркиран домейн в cPanel.
Повече информация за регистрацията на домейни bg/бг можете да намерите на нашата помощна страница: Домейни BG/БГ.
Класирането и позицията на дадена страница в търсачките не е постоянна характеристика. Информацията в уеб се увеличава постоянно и много нови сайтове се появяват ежедневно. Ако до вчера страницата е била сред първите позиции, това не е гаранция, че ще остане там вечно. Поради това SEO оптимизацията и поддържането на високо качество на съдържанието е постоянен процес.
SEO оптимизацията изисква знания и опит в сферата на уеб технологиите и работата на търсещите машини. И за да бъде оптимална SEO оптимизацията, е добре с това да се заеме професионалист в тази област.
Вижте и останалите статии от поредицата SEO Q&A: