مدرسة SEOالمستوى 3: الإتقان المتقدمالدرس 3
المستوى 3: الإتقان المتقدم
الدرس 3/10
15 دقيقة قراءة
2026-01-04

تحليل ملف السجل: رؤية Googlebot عبر المصفوفة

يكشف تحليل ملف السجل الحقيقة الخام لكيفية زحف Googlebot إلى موقعك. تعلم كيفية تحسين ميزانية الزحف، وتحديد الروبوتات المزيفة، وإصلاح مصائد العناكب.

إذا كان Google Search Console (GSC) هو التقرير "المنسق" الذي تريدك Google أن تراه، فإن سجلات الخادم هي الواقع الخام غير المصفى. إنها كود "Matrix" الخاص بـ SEO.

عندما تنظر إلى GSC، ترى عينة من البيانات. عندما تنظر إلى سجلات الخادم الخاصة بك، ترى كل طلب يجريه Googlebot إلى خادمك، وصولاً إلى المللي ثانية.

يشرح هذا الدليل كيفية قراءة هذه الملفات لتحسين ميزانية الزحف (Crawl Budget) - عملة عالم SEO.

1. ما هو تحليل ملف السجل؟

في كل مرة يقوم شخص (أو شيء ما) بزيارة موقع الويب الخاص بك، يسجل خادمك التفاعل في ملف نصي.

تشريح إدخال السجل

يبدو سطر واحد من التعليمات البرمجية في سجل الوصول عادةً كما يلي:

66.249.66.1 - - [04/Jan/2026:10:00:00 +0000] "GET /product-A HTTP/1.1" 200 0 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

إليك ما يهمنا:

  • عنوان IP (66.249.66.1): من يزور. (لدى Googlebot نطاقات IP محددة).
  • الطابع الزمني: بالضبط متى وصلوا.
  • الطريقة (GET): ما فعلوه (عادة طلب صفحة).
  • URL (/product-A): الصفحة التي أرادوها.
  • رمز الحالة (200): هل نجح الخادم؟ (200 موافق، 404 مفقود، 500 خطأ).
  • وكيل المستخدم: بطاقة هوية الزائر (على سبيل المثال، "Googlebot").

2. اقتصاد "ميزانية الزحف"

ميزانية الزحف هي عدد الصفحات التي يرغب Googlebot ويستطيع زحفها على موقعك خلال إطار زمن معين.

فكر في Googlebot كعميل في سوبر ماركت (موقعك) لديه وقت محدود.

  • طلب الزحف: ما مقدار ما تريد Google زحفه (بناءً على شعبيتك).
  • حد معدل الزحف: ما مقدار ما يمكن لخادمك التعامل معه قبل التباطؤ.

الهدف: تأكد من أن Google يقضي وقته المحدود على صفحات المال الخاصة بك (المنتجات، المقالات)، وليس على "الخردة" (صفحات 404، صفحات تسجيل الدخول، المرشحات الغريبة).

3. رؤية الحقيقة: ما تكشفه السجلات

يكشف تحليل السجل عن المشاكل التي يخفيها GSC غالباً أو يؤخرها.

أ. Googlebots المزيفة

يمكن لأي شخص تسمية الروبوت الخاص به "Googlebot" في سلسلة وكيل المستخدم لتجاوز أمانك.

فحص السجل: يجب عليك التحقق من عنوان IP. تأتي Googlebots الحقيقية من نطاقات IP محددة لـ Google. تقوم معظم أدوات تحليل السجل بهذا التحقق تلقائياً عبر بحث DNS العكسي.

لماذا هذا مهم: قد تعتقد أن Google تزحف إليك 10,000 مرة في اليوم، لكن 9,000 منها قد تكون أدوات كشط تسرق بياناتك.

ب. مصائد العناكب (حلقات لا نهائية)

أحياناً، ينشئ هيكل الموقع عن طريق الخطأ عناوين URL لا نهائية.

مثال: example.com/shoes?color=red&size=10&color=red&size=10...

عَرَض السجل: سترى الآلاف من الزيارات لعناوين URL تبدو مختلفة قليلاً ولكنها هي نفسها فعلياً. هذا يحرق ميزانيتك بالكامل على صفحة واحدة.

ج. الصفحات اليتيمة

يخبرك GSC فقط عن الصفحات التي يعرفها. تخبرك السجلات عن الصفحات التي وجدتها Google ولكنك نسيتها.

السيناريو: قمت بحذف رابط لـ "الصفحة القديمة أ" من قائمتك، لكن Google لا تزال تزحف إليها كل يوم لأن موقعاً خارجياً يربط بها. أنت تهدر الميزانية على صفحة شبح.

د. فجوة "الحداثة"

سؤال: "قمت بتحديث مقالتي يوم الاثنين. متى رأت Google التغييرات؟"

  • إجابة GSC: "آخر زحف: 4 يناير."
  • إجابة السجل: "زار Googlebot Smartphone في 09:42 صباحاً و 11:15 صباحاً." (توقيت دقيق).

4. كيفية تحسين ميزانية الزحف الخاصة بك

إذا أظهر تحليل السجل الخاص بك هدراً، فاستخدم هذه الخطوات لإصلاحه.

الخطوة 1: سد تسريبات 404

إذا كانت 10% من زيارات Google تؤدي إلى أخطاء 404 (غير موجود)، فأنت ترمي 10% من ميزانيتك.

الإصلاح: أعد توجيه عناوين URL القديمة هذه إلى صفحات جديدة ذات صلة (301) أو دعها تموت (410) إذا كانت قد اختفت حقاً. توقف عن الارتباط بها داخلياً.

الخطوة 2: حظر المعلمات غير المجدية

هل يقضي Googlebot وقتاً في زحف ?price=low-to-high أو ?session_id=123؟

الإصلاح: استخدم ملف robots.txt الخاص بك لعدم السماح بهذه الأنماط.

User-agent: Googlebot
Disallow: /*?price=
Disallow: /*?session_id=

هذا يخبر Google: "لا تضيع وقتك هنا."

الخطوة 3: تسريع الخادم (الوقت لأول بايت)

هناك علاقة مباشرة: خادم أسرع = ميزانية زحف أعلى. إذا استغرق خادمك ثانيتين للاستجابة، ينتظر Googlebot. إذا استغرق 200 مللي ثانية، يمكن لـ Googlebot زحف 10 صفحات في نفس الوقت.

5. أدوات التجارة

لست بحاجة لقراءة الملفات النصية بعينيك.

  • Screaming Frog Log Analyser: معيار الصناعة. تسحب وتفلت ملف السجل الخاص بك، ويحوله إلى رسوم بيانية.Splunk / Datadog: أدوات على مستوى المؤسسة لمواقع الويب الضخمة.
  • Command Line (grep): للمطورين الذين يرغبون في تصفية ملف نصي ضخم بسرعة.

أمر: grep "Googlebot" access.log | grep "404" (أرني كل المرات التي ضرب فيها Googlebot خطأ 404).

خاتمة

تحليل ملف السجل هو الفرق بين تخمين ما تفعله Google ومعرفته. بالنسبة للمواقع الصغيرة (أقل من 1000 صفحة)، فهو اختياري. ولكن بالنسبة لمواقع pSEO أو متاجر التجارة الإلكترونية أو الناشرين الكبار، فهو إلزامي.

إذا كنت تنشئ آلاف الصفحات، فأنت بحاجة لمعرفة ما إذا كانت Google "تأكل" بالفعل ما تقدمه.

هل أنت مستعد لتطبيق ما تعلمته؟

ضع معرفتك موضع التنفيذ مع pSEO Wizard وقم بإنشاء آلاف الصفحات المحسنة لمحركات البحث.

ابدأ البناء الآن