تسريبات جوجل لمحركات البحث

تسريبات جوجل لمحركات البحث تكشف مستندات واجهة برمجة التطبيقات (API) عن بعض أكاذيب Google البارزة

وثائق جوجل لمحركات البحث لقد بذل المتحدثون الرسميون لشركة Google قصارى جهدهم لتضليلنا وتضليلنا بشأن مجموعة متنوعة من الجوانب المتعلقة بكيفية عمل أنظمتهم في محاولة للتحكم في كيفية تصرفنا كمُحسنات محركات البحث. لن أذهب إلى أبعد من تسميتها ‘الهندسة الاجتماعية’ بسبب التاريخ الحافل لهذا المصطلح. دعنا بدلاً من ذلك نستخدم … ‘إضاءة الغاز’. ربما لا تكون تصريحات Google العامة بمثابة جهود متعمدة للكذب، بل لخداع مرسلي البريد العشوائي المحتملين (والعديد من مُحسنات محركات البحث المشروعة أيضًا) لإبعادنا عن كيفية التأثير على نتائج البحث.

أقدم أدناه تأكيدات من موظفي Google إلى جانب حقائق من الوثائق مع تعليقات محدودة حتى تتمكن من الحكم بنفسك.

‘ليس لدينا أي شيء مثل سلطة المجال’

قال المتحدثون باسم Google عدة مرات أنهم لا يستخدمون ‘سلطة المجال’. لقد افترضت دائمًا أن هذا كان كذبًا عن طريق الإغفال والتعتيم.

من خلال قولهم أنهم لا يستخدمون سلطة المجال، يمكن أن يقولوا أنهم على وجه التحديد لا يستخدمون مقياس Moz المسمى ‘Domain Authority‘ (من الواضح 🙄). يمكن أن يقولوا أيضًا أنهم لا يقيسون السلطة أو الأهمية لموضوع معين (أو مجال) من حيث صلته بموقع الويب. يسمح لهم هذا الارتباك في الدلالات بعدم الإجابة بشكل مباشر على السؤال حول ما إذا كانوا يحسبون أو يستخدمون مقاييس الاستناد على مستوى الموقع.

وقد كرر غاري إليس، وهو محلل في فريق بحث Google والذي يركز على نشر المعلومات لمساعدة منشئي مواقع الويب، هذا التأكيد عدة مرات.

وغاري ليس وحده. أعلن جون مولر، ‘مدافع البحث الذي ينسق علاقات بحث Google في هذا الفيديو

نحن لا نفعل ذلك الحصول على درجة سلطة موقع الويب.

في الواقع، كجزء من إشارات الجودة المضغوطة التي يتم تخزينها على أساس كل مستند، تمتلك Google ميزة تحسبها تسمى ‘siteAuthority‘.

لا نعرف على وجه التحديد كيف يتم حساب هذا المقياس أو استخدامه في وظائف التسجيل النهائية، لكننا نعرف الآن بشكل قاطع أنه موجود ويستخدم في نظام التصنيف Q*. تبين أن Google لديها بالفعل سلطة نطاق شاملة. أشير إلى موظفي Google الذين يزعمون ‘أننا نمتلكه، لكننا لا نستخدمه’، أو ‘أنت لا تفهم ما يعنيه ذلك’، أو… انتظر، لقد قلت ‘تعليق محدود’، أليس كذلك؟المضي قدمًا.

نحن لا نستخدم النقرات للتصنيفات

دعونا نضع هذا في السرير للأبد.

كشفت شهادة Pandu Nayak في محاكمة وزارة العدل لمكافحة الاحتكار مؤخرًا عن وجود نظامي التصنيف Glue وNavBoost. NavBoost هو نظام يستخدم إجراءات تعتمد على النقر لتعزيز الترتيب أو خفضه أو تعزيزه بطريقة أخرى في تسريبات جوجل لمحركات البحث. أشار ناياك إلى أن Navboost كان موجودًا منذ عام 2005 تقريبًا واستخدم تاريخيًا 18 شهرًا من بيانات النقرات. تم تحديث النظام مؤخرًا لاستخدام بيانات متجددة لمدة 13 شهرًا ويركز على نتائج بحث الويب، بينما يرتبط نظام يسمى Glue بنتائج بحث عالمية أخرى. ولكن، حتى قبل هذا الكشف، كان لدينا العديد من براءات الاختراع (بما في ذلك براءة اختراع التصنيف المستند إلى الوقت لعام 2007) والتي تشير على وجه التحديد إلى كيفية استخدام سجلات النقرات لتغيير النتائج.

ونعلم أيضًا أن النقرات كمقياس للنجاح هي أفضل الممارسات في استرداد المعلومات. نحن نعلم أن Google قد تحولت نحو الخوارزميات التي تعتمد على التعلم الآلي وأن تعلم الآلة يتطلب متغيرات استجابة لتحسين أدائها. على الرغم من هذه الأدلة المذهلة، لا يزال هناك ارتباك في مجتمع تحسين محركات البحث (SEO) بسبب التوجيه الخاطئ للمتحدثين باسم Google والنشر المتواطئ بشكل محرج للمقالات عبر عالم التسويق عبر البحث التي تكرر تصريحات Google العامة دون تمحيص.

لقد تناول Gary Ilyes مشكلة قياس النقرات هذه عدة مرات. وفي إحدى الحالات، أكد ما شاركه مهندس بحث Google، بول هار، في حديثه في SMX West لعام 2016 عن التجارب الحية، قائلًا إن ‘استخدام النقرات مباشرة في التصنيفات سيكون خطأ’.

وفي وقت لاحق، استخدم منصته بشكل مشهور للانتقاص من راند فيشكين (المؤسس/الرئيس التنفيذي لشركة Moz، وممارس تحسين محركات البحث منذ فترة طويلة) قائلاً: ”الوقت الطويل، نسبة النقر إلى الظهور، مهما كانت نظرية فيشكين الجديدة، فهي بشكل عام هراء’.

في الواقع، يحتوي Navboost على وحدة محددة تركز بالكامل على إشارات النقر.

يعرّفها ملخص هذه الوحدة على أنها ‘إشارات النقر والانطباع لـ Craps’، وهو أحد أنظمة التصنيف. كما نرى أدناه، فإن النقرات السيئة، والنقرات الجيدة، وآخر النقرات الأطول، والنقرات غير المسحوبة، والنقرات الأخيرة الأطول غير المضغوطة تعتبر جميعها مقاييس. وفقًا لبراءة اختراع جوجل ‘تسجيل نتائج البحث المحلية بناءً على بروز الموقع’، فإن ‘السحق هو وظيفة تمنع إشارة كبيرة واحدة من السيطرة على الإشارات الأخرى’. بمعنى آخر، تعمل الأنظمة على تسوية بيانات النقرات لضمان عدم وجود أي معالجة جامحة بناءً على إشارة النقر. يجادل موظفو Google بأن الأنظمة الموجودة في براءات الاختراع والمستندات التقنية ليست بالضرورة ما هو قيد الإنتاج، ولكن NavBoost سيكون أمرًا لا معنى له إذا لم يكن جزءًا مهمًا من أنظمة استرجاع المعلومات في Google.

تم العثور أيضًا على العديد من هذه القياسات المستندة إلى النقرات نفسها في وحدة أخرى تتعلق بإشارات الفهرسة. أحد المقاييس هو تاريخ ‘النقرة الجيدة الأخيرة’ على مستند معين. يشير هذا إلى أن اضمحلال المحتوى (أو فقدان حركة المرور بمرور الوقت) هو أيضًا وظيفة لصفحة التصنيف التي لا تؤدي إلى زيادة العدد المتوقع من النقرات لموضع SERP الخاص بها.

بالإضافة إلى ذلك، تمثل الوثائق المستخدمين كناخبين ويتم تخزين نقراتهم كأصواتهم.

يحسب النظام عدد النقرات السيئة ويقسم البيانات حسب البلد والجهاز.

كما يقومون أيضًا بتخزين النتيجة التي حصلت على أطول نقرة أثناء الجلسة. لذلك، لا يكفي مجرد إجراء البحث والنقر على النتيجة، بل يحتاج المستخدمون أيضًا إلى قضاء قدر كبير من الوقت على الصفحة. تعد النقرات الطويلة مقياسًا لنجاح جلسة البحث تمامًا مثل وقت المكوث، ولكن لا توجد ميزة محددة تسمى ‘وقت المكوث’ في هذه الوثائق. ومع ذلك، فإن النقرات الطويلة هي في الواقع مقياس للشيء نفسه، وهو ما يتعارض مع تصريحات Google في هذا الشأن.

أشارت مصادر مختلفة تسريبات جوجل لمحركات البحث إلى أن NavBoost هو ‘واحد من أقوى إشارات التصنيف في Google‘. تحدد الوثائق المسربة ‘Navboost‘ بالاسم 84 مرة مع خمس وحدات تتضمن Navboost في العنوان. هناك أيضًا أدلة على أنهم يفكرون في تسجيل النقاط على النطاق الفرعي والمجال الجذر ومستوى عنوان URL مما يشير بطبيعته إلى أنهم يتعاملون مع المستويات المختلفة للموقع بشكل مختلف. لن أخوض في حجة النطاق الفرعي مقابل الدليل الفرعي، لكننا سنناقش لاحقًا كيف أثرت البيانات الواردة من النظام أيضًا على خوارزمية Panda.

لذا، نعم، لم يذكر Google ‘نسبة النقر إلى الظهور’ أو ‘وقت المكوث’ بهذه الكلمات المحددة في هذه الوثائق، ولكن تم تضمين روح ما أثبته راند: النقرات على نتائج البحث ومقاييس جلسة البحث الناجحة. الأدلة قاطعة إلى حد ما، ولا يوجد شك في أن Google تستخدم النقرات وسلوك ما بعد النقر كجزء من خوارزميات التصنيف الخاصة بها.

‘لا يوجد صندوق رمل’

لقد أصر المتحدثون باسم Google على عدم وجود وضع حماية يتم فصل مواقع الويب عليه بناءً على العمر أو إشارات عدم الثقة. في تغريدة محذوفة الآن، رد جون مولر على سؤال حول المدة التي يستغرقها ليكون مؤهلاً للتصنيف مشيرًا إلى أن ‘هناك ليس رملًا.’

في وحدة PerDocData، تشير الوثائق إلى سمة تسمى hostAge والتي يتم استخدامها خصيصًا ‘لحماية البريد العشوائي الجديد في وقت العرض’.

وتبين أن هناك رمل بعد كل شيء.من يعرف؟<em>أوه نعم، كانت راند تعرف</em>.

‘نحن لا نستخدم أي شيء من Chrome للتصنيف’

سبق أن نُقل عن مات كاتس قوله إن Google لا تستخدم بيانات Chrome كجزء من البحث المجاني. وفي الآونة الأخيرة، عزز جون مولر هذه الفكرة.

تتميز إحدى الوحدات المرتبطة بنقاط جودة الصفحة بمقياس للمشاهدات من Chrome على مستوى الموقع. وحدة أخرى يبدو أنها مرتبطة بإنشاء روابط أقسام الموقع لها سمة مرتبطة بـ Chrome أيضًا.

يشير العرض التقديمي الداخلي الذي تم تسريبه من مايو 2016 على نظام RealTime Boost أيضًا إلى أن بيانات Chrome كانت قادمة للبحث. أعني أنك فهمت النقطة.

المتحدثون باسم جوجل حسنو النية، لكن هل يمكننا الوثوق بهم؟

الجواب السريع ليس عندما تقترب أكثر من اللازم من الصلصة السرية.

أنا لا أضمر أي ضغينة تجاه الأشخاص الذين ذكرتهم هنا. أنا متأكد من أنهم جميعًا يبذلون قصارى جهدهم لتقديم الدعم والقيمة للمجتمع ضمن الحدود المسموح بها. ومع ذلك، توضح هذه الوثائق أننا يجب أن نستمر في أخذ ما يقولونه كمدخل واحد ويجب على مجتمعنا الاستمرار في التجربة لمعرفة ما ينجح.

تسريبات جوجل لمحركات البحث : بنية أنظمة التصنيف في GOOGLE

من الناحية النظرية، قد تفكر في ‘خوارزمية Google‘ باعتبارها شيئًا واحدًا، معادلة عملاقة تحتوي على سلسلة من عوامل التصنيف المرجحة. في الواقع، إنها سلسلة من الخدمات الصغيرة حيث تتم معالجة العديد من الميزات مسبقًا وإتاحتها في وقت التشغيل لتكوين SERP. بناءً على الأنظمة المختلفة المشار إليها في الوثائق، قد يكون هناك أكثر من مائة نظام تصنيف مختلف. بافتراض أن هذه ليست جميع الأنظمة، ربما يمثل كل نظام من الأنظمة المنفصلة ‘إشارة تصنيف’ وربما هذه هي الطريقة التي يصل بها Google إلى 200 إشارة تصنيف يتحدثون عنها غالبًا.

في محاضرة جيف دين ‘بناء أنظمة البرمجيات في Google والدروس المستفادة’، ذكر أن التكرارات السابقة لـ Google أرسلت كل استعلام إلى 1000 جهاز للمعالجة والاستجابة في أقل من 250 مللي ثانية. كما قام أيضًا برسم نسخة سابقة من تجريد بنية النظام. يوضح هذا الرسم البياني أن Super Root هو عقل بحث Google الذي يرسل الاستعلامات ويجمع كل شيء معًا في النهاية.

عرض مهندس الأبحاث المتميز مارك ناجورك، في عرضه التقديمي الأخير حول استرجاع المعلومات النموذجية، نموذجًا مجردًا لبحث Google مع نظام RAG الخاص به (المعروف أيضًا باسم تجربة البحث التوليدية/نظرات عامة على الذكاء الاصطناعي). يوضح هذا الرسم البياني سلسلة من مخازن البيانات والخوادم المختلفة التي تعالج الطبقات المختلفة للنتيجة ضمن تسريبات جوجل لمحركات البحث.

قام زاك فورهيس، المبلغ عن مخالفات جوجل، بتسريب هذه الشريحة التي تعرض العلاقات للأنظمة المختلفة داخل Google بأسمائها الداخلية. تمت الإشارة إلى العديد من هذه في الوثائق.

تسريبات جوجل لمحركات البحث: باستخدام هذه النماذج الثلاثة عالية المستوى:

يمكننا أن نبدأ في التفكير في كيفية عمل بعض هذه المكونات معًا. مما يمكنني استخلاصه من الوثائق، يبدو أن واجهة برمجة التطبيقات هذه موجودة أعلى Spanner من Google. Spanner عبارة عن بنية تسمح بشكل أساسي بقابلية التوسع غير المحدودة لتخزين المحتوى والحوسبة أثناء التعامل مع سلسلة من أجهزة الكمبيوتر المتصلة بالشبكة العالمية كجهاز واحد.

من المسلم به أنه من الصعب إلى حد ما تجميع العلاقة بين كل شيء معًا بدءًا من التوثيق فقط، ولكن السيرة الذاتية لـ Paul Haahr توفر بعض الأفكار القيمة حول ما تفعله بعض أنظمة التصنيف المذكورة. سأسلط الضوء على الأشخاص الذين أعرفهم بالاسم وأقسمهم إلى وظائفهم.

زحف

سفينة الصيد – نظام الزحف على الويب. ويتميز بقائمة انتظار الزحف، ويحافظ على معدلات الزحف، ويفهم عدد مرات تغيير الصفحات.
الفهرسة
الإسكندرية – نظام الفهرسة الأساسي.
SegIndexer–النظام الذي يضع المستندات ذات الطبقات في طبقات داخل الفهرس.
TeraGoogle – نظام فهرسة ثانوي للمستندات التي تبقى على القرص لفترة طويلة.

استدعاء

HtmlrenderWebkitHeadless – نظام العرض لصفحات JavaScript. من الغريب أن يتم تسمية هذا باسم Webkit بدلاً من Chromium. هناك ذكر لـ Chromium في المستندات، لذلك من المحتمل أن Google استخدمت WebKit في الأصل وأجرت التبديل بمجرد وصول Headless Chrome.

يعالج

LinkExtractor – يستخرج الروابط من الصفحات.
WebMirror – نظام لإدارة التحديد الأساسي والتكرار.

تصنيف

موستانج – نظام التسجيل والتصنيف والعرض الأساسي
Ascorer – خوارزمية التصنيف الأساسية التي تقوم بترتيب الصفحات قبل أي تعديلات لإعادة التصنيف.
NavBoost – نظام إعادة التصنيف بناءً على سجلات النقرات الخاصة بسلوك المستخدم.
FreshnessTwiddler – نظام إعادة ترتيب المستندات على أساس الحداثة.
WebChooserScorer – يحدد أسماء الميزات المستخدمة في تسجيل المقتطفات.

خدمة

Google Web Server –GWS هو الخادم الذي تتفاعل معه الواجهة الأمامية لـ Google. يتلقى حمولات البيانات لعرضها للمستخدم.
SuperRoot –هذا هو عقل بحث Google الذي يرسل الرسائل إلى خوادم Google ويدير نظام ما بعد المعالجة لإعادة الترتيب وعرض النتائج.
SnippetBrain –النظام الذي يقوم بإنشاء مقتطفات للنتائج.
الغراء – نظام تجميع النتائج العامة باستخدام سلوك المستخدم.
كتاب الطبخ – نظام توليد الإشارات. هناك إشارة إلى أنه يتم إنشاء القيم في وقت التشغيل.

كما قلت، هناك العديد من الأنظمة الموضحة في هذه المستندات، ولكن ليس من الواضح تمامًا ما تفعله. على سبيل المثال، تم تمثيل SAFT وDrishti من الرسم البياني أعلاه أيضًا في هذه المستندات، لكن وظائفهما غير واضحة.

ما هم الأطفال الصغار؟

هناك معلومات محدودة عبر الإنترنت حول Twiddlers بشكل عام، لذلك أعتقد أنه من المفيد شرحها هنا حتى نتمكن من وضع سياق أفضل لأنظمة Boost المختلفة التي نواجهها في المستندات.

Twiddlers هي وظائف إعادة ترتيب يتم تشغيلها بعد خوارزمية بحث Ascorer الأساسية. إنها تعمل بشكل مشابه لكيفية عمل المرشحات والإجراءات في WordPress حيث يتم تعديل ما يتم عرضه مباشرة قبل تقديمه للمستخدم. يستطيع Twiddlers ضبط درجة استرجاع المعلومات للمستند أو تغيير ترتيب المستند. يتم تنفيذ الكثير من التجارب الحية والأنظمة المسماة التي نعرفها بهذه الطريقة. وكما يوضح Xoogler، فهي مهمة جدًا عبر مجموعة متنوعة من أنظمة Google:

يمكن أن يقدم Twiddlers قيودًا على الفئات، مما يعني أنه يمكن تعزيز التنوع عن طريق تحديد نوع النتائج على وجه التحديد. على سبيل المثال، قد يقرر المؤلف السماح بثلاث مشاركات مدونة فقط في SERP معين. يمكن أن يوضح هذا متى يكون الترتيب سببًا خاسرًا بناءً على تنسيق صفحتك.

عندما تقول Google إن شيئًا مثل Panda لم يكن جزءًا من الخوارزمية الأساسية، فهذا يعني على الأرجح أنه تم إطلاقه باعتباره Twiddler كحساب تعزيز إعادة الترتيب أو خفض الرتبة ثم انتقل لاحقًا إلى وظيفة التسجيل الأساسية. فكر في الأمر على أنه مشابه للفرق بين العرض من جانب الخادم والعميل ضمن تسريبات جوجل لمحركات البحث.

من المفترض أن أيًا من الوظائف التي تحتوي على لاحقة Boost تعمل باستخدام إطار عمل Twiddler. فيما يلي بعض التعزيزات المحددة في المستندات:

NavBoost
تعزيز الجودة
RealTimeBoost
WebImageBoost

من خلال اصطلاحات التسمية الخاصة بهم، فإنهم جميعًا واضحون بذاتهم.

هناك أيضًا مستند داخلي حول Twiddlers قمت بمراجعته ويتناول هذا الأمر بمزيد من التفصيل، ولكن يبدو أن هذه المشاركة قد شاهدت نفس المستند الذي شاهدته أنا.

الكشف الرئيسي الذي قد يؤثر على كيفية قيامك بتحسين محركات البحث

دعنا نصل إلى ما أتيت من أجله حقًا. ما الذي تفعله Google ولم نكن نعرفه أو لم نكن متأكدين منه وكيف يمكن أن يؤثر على جهود تحسين محركات البحث الخاصة بي؟

ملاحظة سريعة قبل أن نذهب أبعد من ذلك. هدفي دائمًا هو تعريض صناعة تحسين محركات البحث (SEO) لمفاهيم جديدة. ليس هدفي أن أقدم لك وصفة طبية حول كيفية استخدامه لحالة الاستخدام المحددة الخاصة بك. إذا كان هذا هو ما تريده، فيجب عليك الاستعانة بـ iPullRank لتحسين محركات البحث لديك. بخلاف ذلك، هناك دائمًا ما يكفي لاستقراء حالات الاستخدام الخاصة بك وتطويرها.

كيف تعمل الباندا

عندما تم طرح باندا كان هناك الكثير من الارتباك. هل هو التعلم الآلي؟ هل يستخدم إشارات المستخدم؟ لماذا نحتاج إلى تحديث أو تحديث للتعافي؟ هل هو على مستوى الموقع؟ لماذا فقدت حركة المرور لدليل فرعي معين؟

تم إطلاق سراح باندا تحت إشراف أميت سينغال. كان سينغال بالتأكيد ضد التعلم الآلي بسبب محدودية إمكانية ملاحظته. في الواقع، هناك سلسلة من براءات الاختراع التي تركز على جودة موقع Panda، ولكن ما أريد التركيز عليه هو ‘ترتيب نتائج البحث’ غير الوصفي.ال توضح براءة الاختراع أن الباندا أبسط بكثير مما كنا نظن. كان الأمر يتعلق إلى حد كبير ببناء مُعدِّل للتسجيل استنادًا إلى الإشارات الموزعة المتعلقة بسلوك المستخدم والروابط الخارجية. يمكن تطبيق هذا المعدل على مستوى المجال أو المجال الفرعي أو مستوى الدليل الفرعي بالنسبة تسريبات جوجل لمحركات البحث.

‘يقوم النظام بإنشاء عامل تعديل لمجموعة الموارد من عدد الروابط المستقلة وعدد الاستعلامات المرجعية (الخطوة 306). على سبيل المثال، يمكن أن يكون عامل التعديل نسبة عدد الروابط المستقلة للمجموعة إلى عدد الاستعلامات المرجعية للمجموعة. أي أنه يمكن التعبير عن عامل التعديل (M) على النحو التالي:

م = إيل / ر ق،

حيث IL هو عدد الروابط المستقلة المحسوبة لمجموعة الموارد وRQ هو عدد الاستعلامات المرجعية المحسوبة لمجموعة الموارد.’

الروابط المستقلة هي في الأساس ما نعتقد أنه يربط بين النطاقات الجذرية، لكن الاستعلامات المرجعية أكثر تعقيدًا بعض الشيء. وإليك كيفية تعريفها في براءة الاختراع:

‘يمكن أن يكون الاستعلام المرجعي لمجموعة معينة من الموارد بمثابة استعلام بحث تم إرساله مسبقًا وتم تصنيفه على أنه يشير إلى مورد في مجموعة معينة من الموارد. يمكن أن يتضمن تصنيف استعلام بحث معين تم إرساله مسبقًا على أنه يشير إلى مورد في مجموعة معينة من الموارد ما يلي: تحديد أن استعلام البحث المعين المقدم مسبقًا يتضمن واحدًا أو أكثر من المصطلحات التي تم تحديدها للإشارة إلى المورد في مجموعة معينة من الموارد. ‘

الآن وبعد أن أصبح لدينا إمكانية الوصول إلى هذه الوثائق، فمن الواضح أن الاستعلامات المرجعية هي استعلامات من NavBoost.

يشير هذا إلى أن تحديثات Panda كانت مجرد تحديثات لنافذة الاستعلامات المتجددة المشابهة لكيفية عمل حسابات Core Web Vitals. قد يعني ذلك أيضًا أن تحديثات الرسم البياني للارتباط لم تتم معالجتها في الوقت الفعلي لـ Panda.

ليس الهدف التغلب على الحصان الميت، ولكن براءة اختراع أخرى لشركة Panda، وهي نقاط جودة الموقع، تتأمل أيضًا في النتيجة التي تمثل نسبة بين الاستعلامات المرجعية واختيارات المستخدم أو النقرات.

خلاصة القول هنا هي أنك تحتاج إلى جذب المزيد من النقرات الناجحة باستخدام مجموعة أوسع من طلبات البحث وكسب المزيد من تنوع الروابط إذا كنت تريد الاستمرار في التصنيف. من الناحية النظرية، هذا أمر منطقي لأن المحتوى القوي جدًا سيفعل ذلك. سيؤدي التركيز على جذب عدد أكبر من الزيارات المؤهلة للحصول على تجربة مستخدم أفضل إلى إرسال إشارات إلى Google بأن صفحتك تستحق التصنيف. يجب عليك التركيز على ذلك للتعافي من تحديث المحتوى المفيد.

تسريبات جوجل لمحركات البحث : المؤلفون هي سمة واضحة

لقد كتب الكثير عن E-E-A-T. العديد من مُحسنات محركات البحث (SEOs) غير مؤمنين بسبب مدى غموض تسجيل الخبرة والسلطة. لقد سلطت الضوء سابقًا أيضًا على مدى ضآلة ترميز المؤلف الموجود فعليًا على الويب. قبل أن أتعلم عن التضمين المتجهي، لم أكن أعتقد أن التأليف كان إشارة قابلة للتطبيق بدرجة كافية على نطاق الويب.

ومع ذلك، فإن جوجل تفعل ذلك يخزن بشكل صريح المؤلفين المرتبطين بالمستند كنص:

كما أنهم يتطلعون أيضًا إلى تحديد ما إذا كان الكيان الموجود في الصفحة هو مؤلف الصفحة أيضًا.

هذا بالإضافة إلى رسم الخرائط المتعمقة للكيانات والتضمينات المعروضة في هذه الوثائق، فمن الواضح تمامًا أن هناك بعض القياس الشامل للمؤلفين.

التخفيضات

هناك سلسلة من التخفيضات الخوارزمية التي تمت مناقشتها في الوثائق. الأوصاف محدودة، لكنها تستحق الذكر. لقد ناقشنا بالفعل Panda، ولكن عمليات خفض الرتبة المتبقية التي صادفتها هي:

عدم تطابق المرساة – عندما لا يتطابق الرابط مع الموقع المستهدف الذي يرتبط به، يتم تخفيض ترتيب الرابط في الحسابات. كما قلت من قبل، يبحث Google عن الملاءمة على جانبي الرابط.
خفض رتبة SERP – إشارة تشير إلى خفض رتبة SERP استنادًا إلى العوامل التي تمت ملاحظتها من SERP، مما يشير إلى عدم رضا المستخدم المحتمل عن الصفحة كما يُقاس على الأرجح بالنقرات.
قلل رتبة التنقل –من المفترض أن هذا التخفيض يتم تطبيقه على الصفحات التي تعرض ممارسات تنقل سيئة أو مشكلات في تجربة المستخدم.
اقتصر ترتيب نطاقات المطابقة التامة – في أواخر عام 2012، أعلن مات كاتس أن نطاقات المطابقة التامة لن تحصل على نفس القدر من القيمة كما كانت في السابق. هناك ميزة محددة لخفض رتبتهم.
خفض رتبة مراجعة المنتج – لا توجد معلومات محددة حول هذا الأمر، ولكن تم إدراجه كخفض رتبة ومن المحتمل أن يكون مرتبطًا بالتحديث الأخير لمراجعات المنتج لعام 2023.
تخفيضات الموقع – هناك إشارة إلى أنه يمكن تخفيض رتبة الصفحات ‘العالمية’ والصفحات ‘العالمية الفائقة’. يشير هذا إلى أن Google يحاول ربط الصفحات بموقع ما وترتيبها وفقًا لذلك.
تخفيض رتبة المواد الإباحية – هذا أمر واضح جدًا.
تخفيضات الروابط الأخرى – سنناقشها في القسم التالي.

كل هذه التخفيضات المحتملة يمكن أن تفيد الإستراتيجية، ولكنها تتلخص في إنشاء محتوى ممتاز مع تجربة مستخدم قوية وبناء علامة تجارية، إذا كنا صادقين.

الروابط لا تزال تبدو مهمة جدًا

لم أر أي دليل يدحض الادعاءات الأخيرة بأن الروابط تعتبر أقل أهمية. ومرة أخرى، من المحتمل أن يتم التعامل مع ذلك في وظائف التسجيل نفسها بدلاً من كيفية تخزين المعلومات. ومع ذلك، فقد كان هناك عناية كبيرة لاستخراج الميزات وهندستها لفهم الرسم البياني للارتباط بعمق.

تسريبات جوجل لمحركات البحث: قيمة الارتباط لتأثيرات طبقة الفهرسة

مقياس يسمى sourceType يُظهر علاقة فضفاضة بين مكان فهرسة الصفحة ومدى قيمتها. للحصول على خلفية سريعة، تم تقسيم فهرس Google إلى طبقات حيث يتم تخزين المحتوى الأكثر أهمية والذي يتم تحديثه بانتظام والذي يمكن الوصول إليه في ذاكرة فلاش. يتم تخزين المحتوى الأقل أهمية على محركات الأقراص ذات الحالة الصلبة، ويتم تخزين المحتوى الذي يتم تحديثه بشكل غير منتظم على محركات الأقراص الثابتة القياسية.

على نحو فعال، وهذا يعني أنه كلما ارتفعت الطبقة، فإن أكثر قيمة الرابط. الصفحات التي تعتبر ‘جديدة’ تعتبر أيضًا ذات جودة عالية. يكفي أن نقول أنك تريد أن تأتي روابطك من صفحات حديثة أو موجودة في الطبقة العليا. وهذا ما يفسر جزئيًا لماذا يؤدي الحصول على التصنيفات من الصفحات ذات التصنيف العالي ومن صفحات الأخبار إلى أداء تصنيف أفضل.انظر إلى ذلك، لقد جعلت العلاقات العامة الرقمية رائعة مرة أخرى!

تسريبات جوجل لمحركات البحث: ربط إشارات سرعة البريد العشوائي

هناك سلسلة كاملة من المقاييس حول تحديد الارتفاعات في نص الربط غير المرغوب فيه. مع ملاحظة ميزة العبارة AnchorSpamDays، تتمتع Google بفعالية بالقدرة على قياس سرعة الارتباط للبريد العشوائي.

يمكن استخدام هذا بسهولة لتحديد متى يكون الموقع يرسل بريدًا عشوائيًا ولإبطال هجوم SEO السلبي. بالنسبة لأولئك الذين يشككون في هذا الأخير، يمكن لجوجل استخدام هذه البيانات لمقارنة خط الأساس لاكتشاف الارتباط مع الاتجاه الحالي وببساطة عدم احتساب تلك الروابط في أي من الاتجاهين.

يستخدم Google فقط آخر 20 تغييرًا لعنوان URL معين عند تحليل الروابط

لقد ناقشت سابقًا كيف أن نظام ملفات Google قادر على تخزين إصدارات من الصفحات بمرور الوقت على غرار Wayback Machine. ما أفهمه هو أن Google يحتفظ بما قام بفهرسته إلى الأبد. يعد هذا أحد الأسباب وراء عدم قدرتك على إعادة توجيه الصفحة ببساطة إلى هدف غير ذي صلة وتوقع تدفق حقوق الملكية للرابط.

تعزز المستندات هذه الفكرة مما يعني أنها تحتفظ بجميع التغييرات التي شاهدتها على الصفحة.

عندما يقومون بإجراء بيانات سطحية للمقارنة عن طريق استرداد DocInfo، فإنهم يأخذون في الاعتبار فقط أحدث 20 إصدارًا من الصفحة.

من المفترض أن يمنحك هذا فكرة عن عدد المرات التي تحتاج فيها إلى تغيير الصفحات وفهرستها للحصول على ‘سجل نظيف’ في Google.

يتم أخذ نظام PageRank للصفحة الرئيسية في الاعتبار لجميع الصفحات

يحتوي كل مستند على PageRank الخاص بالصفحة الرئيسية (الإصدار الأقرب) المرتبط به. من المحتمل أن يستخدم هذا كوكيل للصفحات الجديدة حتى يحصلوا على نظام تصنيف الصفحات الخاص بهم.

من المحتمل أن يتم استخدام هذا وsiteAuthority كوكلاء للصفحات الجديدة حتى يتم حساب نظام تصنيف الصفحات الخاص بهم.

تسريبات جوجل لمحركات البحث: ثقة الصفحة الرئيسية

تقرر Google كيفية تقييم الرابط بناءً على مدى ثقتهم في الصفحة الرئيسية.

كما هو الحال دائمًا، يجب عليك التركيز على جودة الروابط وملاءمتها بدلاً من الحجم.

تسريبات جوجل لمحركات البحث: حجم الخط للمصطلحات والروابط مهم

عندما بدأت في تحسين محركات البحث لأول مرة في عام 2006، كان أحد الأشياء التي قمنا بها هو وضع خط غامق ووضع خط تحت النص أو تكبير بعض الفقرات لجعلها تبدو أكثر أهمية. في السنوات الخمس الماضية رأيت الناس يقولون إن الأمر لا يزال يستحق القيام به. لقد كنت متشككًا، لكنني الآن أرى أن Google يتتبع متوسط حجم الخط المرجح للمصطلحات في المستندات.

إنهم يفعلون الشيء نفسه بالنسبة للنص الأساسي للروابط.

البطريق يسقط الروابط الداخلية

ضمن العديد من الوحدات ذات الصلة بالمرساة، تعني فكرة ‘محلي’ نفس الموقع. أدى هذا إلى إسقاط LocalAnchorCount يشير إلى أن بعض الروابط الداخلية لا يتم احتسابها.

لم أر ذكرا واحدا للتنصل

على الرغم من إمكانية تخزين بيانات التنصل في مكان آخر، إلا أنها ليست موجودة على وجه التحديد في واجهة برمجة التطبيقات هذه. أجد ذلك على وجه التحديد لأن بيانات مقيمي الجودة يمكن الوصول إليها مباشرة هنا. يشير هذا إلى أن بيانات التنصل منفصلة عن أنظمة التصنيف الأساسية.

لقد كان افتراضي على المدى الطويل هو أن التنصل كان عبارة عن جهد هندسي لميزات جماعية المصدر لتدريب مصنفات البريد العشوائي في Google. تشير تسريبات جوجل لمحركات البحث غير المتوفرة على الإنترنت إلى أن هذا قد يكون صحيحًا.

يمكنني الاستمرار في استخدام الروابط والحديث عن ميزات مثل IndyRank وPageRankNS وما إلى ذلك، ولكن يكفي أن أقول إن Google لديها تحليل ارتباطات تم الاتصال به بشكل كبير وأن الكثير مما يفعلونه لا يتم تقريبه من خلال مؤشرات الارتباط الخاصة بنا. إنه الوقت المناسب جدًا لإعادة النظر في برامج بناء الروابط الخاصة بك بناءً على كل ما قرأته للتو.

تسريبات جوجل لمحركات البحث: يتم اقتطاع المستندات

يحسب Google عدد الرموز المميزة ونسبة إجمالي الكلمات في النص إلى عدد الرموز الفريدة. تشير المستندات إلى أن هناك حدًا أقصى لعدد الرموز المميزة التي يمكن أخذها في الاعتبار لمستند محدد في نظام موستانج، مما يعزز ضرورة استمرار المؤلفين في وضع المحتوى الأكثر أهمية في وقت مبكر.

يتم تسجيل المحتوى القصير للأصالة

يقترح OriginalContentScore أنه يتم تسجيل المحتوى القصير وفقًا لأصالته. ربما هذا هو السبب في أن المحتوى الرقيق لا يعتمد دائمًا على الطول.

على العكس من ذلك، هناك أيضًا نتيجة لحشو الكلمات الرئيسية.

لا يزال يتم قياس عناوين الصفحات مقابل الاستعلامات

تشير الوثائق إلى وجود titlematchScore. يشير الوصف إلى أن مدى تطابق عنوان الصفحة مع الاستعلام لا يزال شيئًا تعطيه Google قيمة له.

لا يزال وضع كلماتك الرئيسية المستهدفة أولاً هو الخطوة الحالية.

لا توجد مقاييس لحساب الأحرف

يُحسب لغاري إليس أنه قال إن مُحسّنات محرّكات البحث تشكل إجمالي عدد الأحرف الأمثل للبيانات الوصفية. لا يوجد مقياس في مجموعة البيانات هذه يحسب طول عناوين الصفحات أو المقتطفات. مقياس عدد الأحرف الوحيد الذي وجدته في الوثائق هو snippetPrefixCharCount الذي يبدو أنه تم تعيينه لتحديد ما يمكن استخدامه كجزء من المقتطف.

وهذا يعزز ما رأيناه تم اختباره عدة مرات، وهو أن عناوين الصفحات الطويلة ليست مثالية لجذب النقرات، ولكنها جيدة لزيادة التصنيف.

التواريخ مهمة جدًا

يركز Google بشكل كبير على النتائج الجديدة وتوضح المستندات محاولاته العديدة لربط التواريخ بالصفحات.

bylineDate – هذا هو التاريخ المحدد بشكل واضح على الصفحة.
SyntacticDate – هذا هو التاريخ المستخرج من عنوان URL أو في العنوان.
semanticDate – هذا هو التاريخ المشتق من محتوى الصفحة.

أفضل ما لديك هنا هو تحديد تاريخ والتوافق معه عبر البيانات المنظمة وعناوين الصفحات وخرائط مواقع XML. وضع التواريخ في عنوان URL الخاص بك والذي يتعارض مع التواريخ الموجودة في أماكن أخرى على الصفحة من المحتمل أن يؤدي إلى انخفاض أداء المحتوى.

يتم تخزين معلومات تسجيل النطاق حول الصفحات

لقد كانت نظرية مؤامرة طويلة الأمد مفادها أن وضع Google كمسجل يغذي الخوارزمية. يمكننا الترقية إلى حقيقة المؤامرة. يقومون بتخزين أحدث معلومات التسجيل على مستوى المستند المركب.

كما تمت مناقشته سابقًا، من المحتمل أن يتم استخدام هذا لإعلام وضع الحماية بالمحتوى الجديد. ويمكن استخدامه أيضًا لوضع الحماية للمجال المسجل مسبقًا والذي تم تغيير ملكيته. أظن أن الاهتمام بهذا الأمر قد زاد مؤخرًا مع طرح سياسة البريد العشوائي الخاصة بإساءة استخدام النطاق منتهية الصلاحية.

يتم التعامل مع المواقع التي تركز على الفيديو بشكل مختلف

إذا كانت أكثر من 50% من صفحات الموقع تحتوي على فيديو، فسيتم اعتبار الموقع يركز على الفيديو وسيتم التعامل معه بشكل مختلف.

أموالك وسجل حياتك على وجه التحديد

تشير الوثائق إلى أن Google لديها مصنفات تولد نتائج لـ YMYL Health وYMYL News.

كما يقومون أيضًا بالتنبؤ بـ ‘الاستعلامات الهامشية’ أو تلك التي لم تتم رؤيتها من قبل لتحديد ما إذا كانت YMYL أم لا.

أخيرًا، يتم حفر YMYL على مستوى القطعة مما يشير إلى أن النظام بأكمله يعتمد على التضمينات.

تسريبات جوجل لمحركات البحث: هناك وثائق قياسية ذهبية

ليس هناك ما يشير إلى ما يعنيه هذا، ولكن الوصف يذكر ان تسريبات جوجل لمحركات البحث التي تحمل علامة بشرية’ مقابل ‘التعليقات التوضيحية التي تحمل علامة تلقائية’. أتساءل عما إذا كانت هذه وظيفة تقييمات الجودة، لكن جوجل تقول إن تقييمات الجودة لا تؤثر على التصنيف. لذلك، قد لا نعرف أبدًا.

يتم استخدام تضمينات الموقع لقياس مدى تواجد الصفحة في الموضوع

سأتحدث عن عمليات التضمين بمزيد من التفصيل في منشور لاحق، ولكن تجدر الإشارة إلى أن Google يقوم على وجه التحديد بتوجيه الصفحات والمواقع ومقارنة عمليات تضمين الصفحة بتضمينات الموقع لمعرفة مدى خروج الصفحة عن الموضوع.

يلتقط siteFocusScore مدى التزام الموقع بموضوع واحد. يلتقط نصف قطر الموقع مدى خروج الصفحة خارج الموضوع الأساسي بناءً على متجهات site2vec التي تم إنشاؤها للموقع.

قد تقوم Google بإحراق المواقع الصغيرة عن قصد

لدى Google علامة محددة تشير إلى أن الموقع هو ‘موقع شخصي صغير’. لا يوجد تعريف لمثل هذه المواقع، ولكن بناءً على كل ما نعرفه، لن يكون من الصعب عليهم إضافة Twiddler الذي عزز هذه المواقع أو الذي خفض رتبتها.

وبالنظر إلى رد الفعل العنيف والشركات الصغيرة التي أضر بها تحديث المحتوى المفيد، فمن المدهش أنهم يستخدمون وثائق جوجل لمحركات البحث لفعل شيء حيال ذلك.

أسئلتي المفتوحة حول تسريبات جوجل لمحركات البحث

يمكنني الاستمرار، وسوف أفعل ذلك، ولكن حان وقت الاستراحة. في هذه الأثناء، أظن أنه من المحتم أن يقوم الآخرون باستخلاص استنتاجاتهم الخاصة حول تسريبات جوجل لمحركات البحث. في هذه اللحظة، لدي عدد قليل مفتوح الأسئلة التي أحب أن نأخذها بعين الاعتبار من الجميع.

هل يُعرف تحديث المحتوى المفيد باسم Baby Panda؟

هناك إشارتان إلى شيء يسمى ‘صغير الباندا’ في إشارات الجودة المضغوطة. Baby Panda هو Twiddler وهو مثبت على اليمين بعد الترتيب الأولي.

هناك إشارة إلى أنه يعمل على رأس Panda، ولكن لا توجد معلومات أخرى في المستندات.

أعتقد أننا متفقون عمومًا على أن تحديث المحتوى المفيد يتضمن العديد من السلوكيات نفسها التي تتبعها Panda. إذا كان مبنيًا على نظام يستخدم الاستعلامات المرجعية والروابط والنقرات، فهذه هي الأشياء التي ستحتاج إلى التركيز عليها بعد تحسين المحتوى الخاص بك.

هل يعني NSR الاسترجاع الدلالي العصبي؟

هناك الكثير من الإشارات إلى الوحدات النمطية والسمات مع NSR كجزء من اصطلاح التسمية. يرتبط الكثير منها بأجزاء الموقع والتضمينات. لقد ناقشت Google سابقًا ‘المطابقة العصبية’ باعتبارها محورًا كبيرًا للتحسينات. تخميني المتعلم هو أن NSR يرمز إلى الاسترجاع الدلالي العصبي وهذه كلها ميزات مرتبطة بالبحث الدلالي. ومع ذلك، في بعض الحالات يتم الإشارة إلى جانب ‘تصنيف الموقع’.

أود أن يتوجه أحد موظفي Google المتمردين إلى go/NSR ويرسل لي رسالة ‘أنت على حق’ من عنوان بريد إلكتروني مجهول أو شيء من هذا القبيل.

تسريبات جوجل لمحركات البحث قابلة للتنفيذ

كما قلت، ليس لدي أي وصفات طبية لك. لدي بعض النصائح الإستراتيجية بالرغم من ذلك.

أرسل اعتذارًا إلى راند فيشكين – منذ كلمتي الرئيسية ‘كل ما كذب علينا Google بشأنه’ في PubCon. شاركت في حملة لتبرئة اسم Rand فيما يتعلق بـ NavBoost. لقد قامت راند بعمل ناكر للجميل في محاولة مساعدة صناعتنا على الارتقاء لسنوات. لقد حصل على الكثير من الاهتمام من جانب Google ومن جانب تحسين محركات البحث. في بعض الأحيان لم يكن يقوم بالأمور بشكل صحيح. لكن قلبه كان دائمًا في المكان الصحيح وبذل جهودًا قوية لجعل ما نقوم به محترمًا وأفضل. على وجه التحديد، لم يكن مخطئًا بشأن الاستنتاجات التي توصل إليها من تجارب النقرات، ومحاولاته المتكررة لإظهار وجود Google Sandbox. ودراسات الحالة التي أجراها والتي أظهرت أن Google يرتب النطاقات الفرعية بشكل مختلف. واعتقاده الذي تم التقليل من شأنه منذ فترة طويلة بأن Google تستخدم إشارات على طراز السلطة على مستوى الموقع.

ويجب عليك أيضًا أن أشكره على هذا التحليل لأنه هو من شاركني تسريبات جوجل لمحركات البحث. الآن هو الوقت المناسب للكثير منكم لإظهار حبهم له في Threads.

تسريبات جوجل لمحركات البحث :أنشئ محتوى رائعًا وقم بالترويج له بشكل جيد

أنا أمزح، ولكني جاد أيضًا. واصلت Google تقديم هذه النصيحة ونحن نرفضها باعتبارها غير قابل للتنفيذ. بالنسبة لبعض تسريبات جوجل لمحركات البحث، يكون الأمر خارجًا عن سيطرتهم.بعد مراجعة هذه الميزات التي تمنح Google مزاياها، من الواضح تمامًا أن إنشاء محتوى أفضل والترويج له لدى الجماهير التي يتردد صداها سيحقق أفضل تأثير على تلك التدابير. تدابير الارتباط و من المؤكد أن ميزات المحتوى ستوصلك إلى أبعد من ذلك، ولكن إذا كنت تريد حقًا الفوز في Google على المدى الطويل، فسيتعين عليك إنشاء أشياء لا تزال تستحق التصنيف.

تسريبات جوجل لمحركات البحث :إعادة دراسات الارتباط

لدينا الآن فهم أفضل بكثير للعديد من الميزات التي تستخدمها Google لإنشاء التصنيفات. من خلال مزيج من بيانات تدفق النقرات واستخراج الميزات، يمكننا تكرار أكثر مما كنا نستطيع في السابق. أعتقد أن الوقت قد حان لإعادة دراسات الارتباط الرأسية المحددة.
الاختبار والتعلم – يجب أن تكون قد شاهدت ما يكفي من مخططات الرؤية وحركة المرور باستخدام المحاور Y لتعرف أنه لا يمكنك الوثوق بأي شيء تقرأه أو تسمعه في تسريبات جوجل لمحركات البحث. يعد هذا التسرب مؤشرًا آخر على أنه يجب عليك استيعاب المدخلات وتجربتها لمعرفة ما سيعمل مع موقع الويب الخاص بك. لا يكفي أن ننظر إلى المراجعات القصصية للأشياء ونفترض أن هذه هي الطريقة التي يعمل بها جوجل. إذا لم يكن لدى مؤسستك خطة تجريبية لتحسين محركات البحث، فهذا هو الوقت المناسب لبدء واحدة.

تسريبات جوجل لمحركات البحث :نحن نعرف ما نفعله

الشيء المهم الذي يمكننا استخلاصه جميعًا من هذا هو: أن خبراء تحسين محركات البحث يعرفون ما يفعلونه.بعد سنوات من إخبارنا بأننا مخطئون، من الجيد أن نرى خلف الستار ونكتشف أننا كنا على حق طوال الوقت. وعلى الرغم من وجود فروق دقيقة مثيرة للاهتمام حول كيفية عمل Google في هذه المستندات، إلا أنه لا يوجد شيء من شأنه أن يحدث تغييرًا جذريًا في الطريقة التي أقوم بها بشكل استراتيجي بتحسين محركات البحث.

بالنسبة لأولئك الذين يتعمقون في الأمر، ستعمل هذه المستندات في المقام الأول على التحقق من صحة ما دافع عنه مُحسنو محركات البحث المتمرسون منذ فترة طويلة. افهم جمهورك، وحدد ما يريدون، واصنع أفضل شيء ممكن يتوافق مع ذلك، واجعله في متناول الجميع من الناحية الفنية، وقم بالترويج له حتى يتم تصنيفه.

إلى كل شخص في مجال تحسين محركات البحث (SEO) الذي لم يكن متأكدًا مما يفعله، استمر في الاختبار، واستمر في التعلم، واستمر في تنمية الأعمال التجارية. جوجل لا تستطيع أن تفعل ما يفعلونه بدوننا فأتبع تسريبات جوجل لمحركات البحث.