لماذا الفهرسة بنسبة 100٪ غير ممكنة ولماذا لا مشكلة في ذلك؟

بينما قد تكون الفهرسة بنسبة 100٪ ممكنة من حيث "التقنية" ، فمن المحتمل ألا تكون ممكنة في الواقع.

عندما يتعلق الأمر بموضوعات مثل ميزانية الزحف والفهرسة. كان الحديث دائمًا على أنها مشكلة مخصصة لمواقع الويب الكبيرة (التي صنفتها غوغل على أنها أكثر من مليون صفحة ويب). ومواقع ويب متوسطة الحجم ذات تكرار تغيير محتوى عالي.

ومع ذلك ، في الأشهر الأخيرة . أصبح الزحف والفهرسة من الموضوعات الأكثر شيوعًا في منتديات تحسين محركات البحث وفي الأسئلة المطروحة على موظفي غوغل على تويتر.

من تجربتنا القصصية الخاصة، شهدت مواقع الويب ذات الأحجام المختلفة وتكرار التغيير منذ تشرين الثاني (نوفمبر) تقلبات أكبر وتغييرات في التقارير في Google Search Console (كل من إحصائيات الزحف وتقارير التغطية) مما كانت عليه في السابق.

ارتبط عدد من التغييرات الرئيسية في التغطية التي شاهدتها أيضًا بتحديثات غوغل غير المؤكدة والتقلبات العالية من مستشعرات/مراقبي SERP. نظرًا لعدم وجود الكثير من القواسم المشتركة بين أي من مواقع الويب من حيث المكدس أو المكانة أو حتى المشكلات الفنية – هل هذا مؤشر على أن فهرسة بنسبة 100٪ (لمعظم مواقع الويب) غير ممكنة الآن، وهذا جيد ؟

هذا منطقي

يوضح غوغل ، في مستنداتها الخاصة، أن الويب يتوسع بوتيرة تفوق بكثير قدرته ووسائله للزحف (وفهرسة) كل عنوان URL.

في نفس الوثائق، يحدد غوغل عددًا من العوامل التي تؤثر على قدرتها على الزحف، بالإضافة إلى الطلب على الزحف، بما في ذلك:

  • مدى رواج عناوين URL الخاصة بك (والمحتوى).
  • مدى سرعة استجابة الموقع.
  • معرفة غوغل (المخزون المتصور) لعناوين URL على موقعنا.

من المحادثات مع جون مولر من غوغل على تويتر، لا تتأثر شعبية عنوان URL الخاص بك بالضرورة بشعبية علامتك التجارية و / أو مجالك.

امتلاك خبرة مباشرة لناشر رئيسي لا يحتوي على محتوى مفهرس استنادًا إلى تفرده لمحتوى مماثل تم نشره بالفعل عبر الإنترنت – كما لو كان أقل من حد الجودة ولا يحتوي على قيمة تضمين عالية بما يكفي لـ SERP.

لهذا السبب، عند العمل مع جميع مواقع الويب ذات الحجم أو النوع المعين (على سبيل المثال، التجارة الإلكترونية)، أضفي منذ اليوم الأول أن الفهرسة بنسبة 100٪ ليست دائمًا مقياس نجاح.

مستويات الفهرسة 

كان غوغل منفتحة تمامًا في شرح كيفية عمل فهرستها. يستخدمون الفهرسة المتدرجة (بعض المحتوى على خوادم أفضل للوصول بشكل أسرع) وأن لديهم فهرس خدمة مخزن عبر عدد من مراكز البيانات التي تخزن بشكل أساسي البيانات المقدمة في SERP.

المبالغة في تبسيط هذا الأمر:

يتم بعد ذلك ترميز محتويات صفحة الويب (مستند HTML) وتخزينها عبر الأجزاء ، ويتم فهرسة الأجزاء نفسها (مثل مسرد المصطلحات) بحيث يمكن الاستعلام عنها بشكل أسرع وأسهل بالنسبة إلى كلمات رئيسية محددة (عندما يبحث المستخدم).

في كثير من الأحيان، يتم إلقاء اللوم على مشكلات الفهرسة على تحسين محركات البحث التقنية، وإذا كان لديك noindex أو مشكلات وتناقضات يمنع غوغل من فهرسة المحتوى، فهي تقنية، ولكن في كثير من الأحيان – إنها مشكلة عرض قيمة.

الغرض المفيد وقيمة إدراج SERP

عندما أتحدث عن عرض القيمة، أشير إلى مفهومين من إرشادات تقييم الجودة من غوغل (QRGs)، وهما:

  • الغرض المفيد
  • جودة الصفحة

وهذه مجتمعة، تخلق شيء أشير إليه كقيمة تضمين SERP.

هذا هو السبب العادي لوقوع صفحات الويب في فئة «المكتشفة – غير المفهرسة حاليًا» ضمن تقرير تغطية Google Search Console.

في QRGs، صرح غوغل بهذا البيان:

تذكر أنه إذا كانت الصفحة تفتقر إلى غرض مفيد، فيجب دائمًا تصنيفها على أنها أقل جودة للصفحة ­ بغض النظر عن تصنيف احتياجات الصفحة أو مدى جودة تصميم الصفحة ­.

ماذا يعني هذا ؟ أن الصفحة يمكن أن تستهدف الكلمات الرئيسية الصحيحة ووضع علامة في المربعات الصحيحة. ولكن إذا كان مكررًا بشكل عام للمحتوى الآخر ويفتقر إلى قيمة إضافية، فقد يختار غوغل عدم فهرسته.

هذا هو المكان الذي نواجه فيه عتبة جودة غوغل ، وهو مفهوم لما إذا كانت الصفحة تلبي «الجودة» اللازمة ليتم فهرستها.

جزء أساسي من كيفية عمل عتبة الجودة هذه هو أنها تكاد تكون في الوقت الفعلي وسائلة.

أكد Gary Illyes من غوغل ذلك على تويتر ، حيث قد يتم فهرسة عنوان URL عند العثور عليه لأول مرة ثم إسقاطه عند العثور على عناوين URL جديدة (أفضل) أو حتى إعطاء دفعة «نضارة» مؤقتة من التقديم اليدوي في GSC.

العمل لمعرفة ما إذا كان لديك مشكلة

أول شيء يجب تحديده هو ما إذا كنت ترى عدد الصفحات في تقرير تغطية Google Search Console يتم نقلها من متضمنة إلى مستبعدة.

عدد الصفحات trkeez.com
عدد الصفحات

هذا الرسم البياني بمفرده وخارج السياق كافٍ لإثارة القلق بين معظم أصحاب المصلحة في التسويق.

لكن كم عدد هذه الصفحات التي تهتم بها ؟ كم عدد هذه الصفحات التي تدفع القيمة ؟

ستتمكن من تحديد هذا من خلال بياناتك الجماعية. سترى ما إذا كانت حركة المرور والإيرادات/العملاء المحتملين آخذين في التناقص في منصة التحليلات الخاصة بك. وستلاحظ ذلك في أدوات الطرف الثالث إذا كنت تفقد رؤية السوق وترتيبه بشكل عام.

بمجرد تحديد ما إذا كنت ترى صفحات قيمة تسقط من فهرس غوغل. فإن الخطوات التالية هي فهم سبب استبعاد وحدة التحكم في البحث إلى فئات أخرى. أهم الأشياء التي يجب أن تكون على دراية بها وفهمها هي:

تم الزحف إليه – غير مفهرس حاليًا

هذا شيء واجهته في التجارة الإلكترونية والعقارات أكثر من أي شيء رأسي آخر.

في عام 2021، حطم عدد تسجيلات تطبيقات الأعمال الجديدة في الولايات المتحدة الأرقام القياسية السابقة، ومع تنافس المزيد من الشركات على المستخدمين، هناك الكثير من المحتوى الجديد الذي يتم نشره – ولكن من المحتمل ألا يكون هناك الكثير من المعلومات أو وجهات النظر الجديدة والفريدة.

تم الاكتشاف – غير مفهرس حاليًا

عند تصحيح مشكلات الفهرسة. أجد هذا كثيرًا على مواقع التجارة الإلكترونية أو مواقع الويب التي نشرت نهجًا برنامجيًا كبيرًا لإنشاء المحتوى ونشرت عددًا كبيرًا من الصفحات في وقت واحد.

يمكن أن تعود الأسباب الرئيسية لوقوع الصفحات في هذه الفئة إلى ميزانية الزحف. حيث قمت للتو بنشر قدر كبير من المحتوى وعناوين URL جديدة وزادت عدد الصفحات القابلة للزحف والقابلة للفهرسة على الموقع بشكل كبير. وميزانية الزحف التي حددها غوغل لموقعك ليست موجهة إلى هذه الصفحات العديدة.

ليس هناك الكثير مما يمكنك فعله للتأثير على هذا. ومع ذلك، يمكنك مساعدة غوغل من خلال خرائط مواقع XML وخرائط مواقع HTML والربط الداخلي الجيد لتمرير ترتيب الصفحة. من الصفحات المهمة (المفهرسة) إلى هذه الصفحات الجديدة.

السبب الثاني الذي قد يجعل المحتوى يندرج في هذه الفئة يرجع إلى الجودة . وهذا شائع في المحتوى البرنامجي أو مواقع التجارة الإلكترونية مع عدد كبير من المنتجات ومنتجات PDP التي هي منتجات متشابهة أو متغيرة.

يمكن لـ غوغل تحديد الأنماط في عناوين URL. وإذا زارت نسبة مئوية من هذه الصفحات ولم تجد أي قيمة. فيمكنها (وأحيانًا ستفعل) افتراض أن مستندات HTML ذات عناوين URL مماثلة ستكون متساوية (منخفضة) الجودة، وستختار عدم الزحف عليها.

سيتم إنشاء الكثير من هذه الصفحات عن قصد بهدف اكتساب العملاء. مثل صفحات المواقع البرنامجية أو صفحات المقارنة التي تستهدف المستخدمين المتخصصين لكن هذه الاستفسارات يتم البحث عنها بوتيرة منخفضة. ومن المحتمل ألا تحصل على الكثير من العيون. وقد لا يكون المحتوى فريدا بما فيه الكفاية مقابل الصفحات البرنامجية الأخرى. لذلك لن يقوم غوغل بفهرسة محتوى العرض منخفض القيمة عندما تتوفر بدائل أخرى.

إذا كان الأمر كذلك. فستحتاج إلى تقييم وتحديد ما إذا كان يمكن تحقيق الأهداف ضمن مورد المشروع والمعايير دون الصفحات المفرطة التي تسد الزحف ولا يُنظر إليها على أنها ذات قيمة.

المحتوى المكرر

المحتوى المكرر هو واحد من أكثر المحتويات وضوحًا وهو شائع في التجارة الإلكترونية والنشر والبرامج. إذا تم تكرار المحتوى الرئيسي للصفحة. الذي يحمل عرض القيمة، عبر مواقع الويب أو الصفحات الداخلية الأخرى، فلن يستثمر غوغل المورد في فهرسة المحتوى.

وهذا يرتبط أيضا بمقترح القيمة ومفهوم الغرض المفيد. لقد صادفت العديد من الأمثلة حيث تحتوي مواقع الويب الكبيرة والموثوقة على محتوى غير مفهرس لأنه نفس المحتوى المتاح الآخر . لا يقدم وجهات نظر فريدة أو عروض قيمة فريدة.

اتخاذ الإجراءات

بالنسبة لمعظم مواقع الويب الكبيرة والمواقع ذات الحجم المتوسط اللائق. فإن تحقيق الفهرسة بنسبة 100٪ سيصبح أكثر صعوبة حيث يتعين على غوغل معالجة جميع المحتويات الحالية والجديدة على الويب.

إذا وجدت محتوى قيمًا يعتبر أقل من عتبة الجودة، فما هي الإجراءات التي يجب عليك اتخاذها ؟

  • تحسين الارتباط الداخلي من الصفحات ذات “القيمة العالية” : لا يعني هذا بالضرورة الصفحات التي تحتوي على أكبر عدد من الروابط الخلفية . ولكن تلك الصفحات التي يتم تصنيفها لعدد كبير من الكلمات الرئيسية والتي تتمتع برؤية جيدة يمكن أن تمرر إشارات إيجابية. من خلال الروابط الوصفية إلى صفحات أخرى .
  • قم بتقليم المحتوى منخفض الجودة ومنخفض القيمة. إذا كانت الصفحات المستبعدة من الفهرس ذات قيمة منخفضة ولا تؤدي إلى أي قيمة (على سبيل المثال . مرات مشاهدة الصفحة والتحويلات) ، فيجب تقليمها. إن جعلها على الهواء مباشرة هو إهدار لمورد الزحف من غوغل عندما تختار الزحف إليها . ويمكن أن يؤثر ذلك على افتراضاتهم للجودة بناءً على مطابقة نمط عنوان URL والمخزون المتصور.
المصدرsearchengineland

اقرأ أيضاً

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا
Captcha verification failed!
فشل نقاط مستخدم captcha. الرجاء التواصل معنا!

أحدث الأخبار