أمان وتقنية

مولّد Sitemap XML

ابنِ sitemap.xml لموقعك مع دعم hreflang للعربية

hreflang عربيأولوياتحتى 50,000 URL

عدد الروابط: 5 / 50,000

sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2026-06-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <lastmod>2026-06-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://example.com/blog</loc>
    <lastmod>2026-06-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://example.com/contact</loc>
    <lastmod>2026-06-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://example.com/products</loc>
    <lastmod>2026-06-29</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>
الاستخدام:
  1. ارفع sitemap.xml إلى جذر موقعك: https://example.com/sitemap.xml.
  2. أضف السطر Sitemap: https://example.com/sitemap.xml إلى robots.txt.
  3. أرسل الرابط في Google Search Console → Sitemaps.
  4. للمواقع التي تتجاوز 50,000 رابط، اقسمها لـ sitemap index منفصلة.

دليل شامل

Sitemap في: hreflang، AI Crawlers، وأفضل الممارسات

كيف تبني sitemap يعمل مع Googlebot و GPTBot و ClaudeBot، أهمية hreflang في المواقع العربية.

9 دقائق قراءة·تحديث مايو 2026

لماذا sitemap.xml لا يزال مهمّاً

هناك شائعة منذ 2020 تقول إن Google أصبح قويّاً بما يكفي ليكتشف صفحاتك دون sitemap. الحقيقة: Google يكتشف، لكن ببطء وبأولويّات مختلفة. sitemap.xml هو الطريقة المباشرة لتقول للزاحف: «هذه قائمة صفحاتي، رتّبها بهذه الأولويّات، آخرها تغيّر في هذا التاريخ».

في 2026، sitemap.xml صار أكثر أهميّة لسببَين جديدَين. الأوّل: AI Crawlers (GPTBot، ClaudeBot، PerplexityBot) تعتمد على sitemap حصراً لاكتشاف المحتوى — لا تتبع روابط داخليّة كما يفعل Googlebot. الثاني: المواقع متعدّدة اللغات تعتمد على xhtml:link rel="alternate" داخل sitemap لإعلام Google بالنسخ العربيّة والإنجليزيّة.

الأساسيّات: حقول لا يجب إغفالها

كل عنصر <url> في sitemap يدعم أربعة حقول:

loc (إلزامي): الرابط الكامل بصيغة absolute. يبدأ بـ https:// ويشمل النطاق. لا تستخدم روابط نسبيّة.

lastmod (موصى به): آخر تاريخ تعديل جوهري للصفحة بصيغة ISO 8601 (2026-05-20 أو 2026-05-20T14:30:00+03:00). الـ Google يستخدمه لتحديد ما يحتاج إعادة زحف.

changefreq (اختياري): تقدير لمعدّل التغيير (daily، weekly، monthly). Google يقول إنّه يتجاهلها معظم الوقت، لكنّ Bing و AI Crawlers يستخدمونها.

priority (اختياري): قيمة بين 0.0 و 1.0 تُحدّد الأولويّة النسبيّة بين صفحات موقعك. الصفحة الرئيسيّة 1.0، الصفحات الرئيسيّة الفرعيّة 0.8، المقالات 0.6، صفحات الأرشيف 0.3.

الحدود التي يفرضها المعيار

50,000 URL كحدّ أقصى لكل ملف sitemap واحد. للمواقع الأكبر، استخدم Sitemap Index — ملف رئيسي يشير إلى عدّة ملفّات sitemap فرعيّة.

50 ميجابايت غير مضغوط كحدّ لحجم الملف. عند تجاوزه، اقسمه أو ضغطه بـ gzip (الزواحف الحديثة تدعم sitemap.xml.gz).

UTF-8 إلزامي. كل النصوص يجب أن تكون UTF-8 صالحة، والروابط يجب أن تكون مُرمَّزة (URL-encoded) إن كانت تحوي رموزاً عربيّة أو خاصّة.

hreflang للمواقع متعدّدة اللغات

إذا كان موقعك يحتوي نسختَين عربيّة وإنجليزيّة، استخدم وسم xhtml:link rel="alternate" داخل sitemap. هذه الطريقة المُوصى بها من Google لأنّها مركزيّة، تُعدَّل من مكان واحد، ولا تُثقل HTML كل صفحة.

القاعدة الحديديّة: التطابق المتبادل. إذا قلت في النسخة العربيّة «النسخة الإنجليزيّة هي /en/page»، يجب أن تقول النسخة الإنجليزيّة «النسخة العربيّة هي /page». بدون التطابق، Google يتجاهل hreflang كلّياً.

أضِف دائماً x-default ليخبر Google ما الذي يعرضه للمستخدم الذي لا تتطابق لغته مع أيّ نسخة (مثلاً مستخدم تركي يدخل من اسم النطاق).

أداتنا أعلاه تُولّد كتل hreflang ثلاثيّة (ar، en، x-default) تلقائياً حين تُفعّل الخيار.

AI Crawlers وعلاقتها بـ sitemap

GPTBot، ClaudeBot، و PerplexityBot لا تزحف الموقع كما يزحف Googlebot. هي تعتمد بشكل أساسي على sitemap.xml لاكتشاف الصفحات. إذا أردت أن يستشهد ChatGPT و Perplexity بمحتواك:

1. أبقِ sitemap محدّثاً مع كل صفحة جديدة، خلال 24 ساعة من النشر.

2. أضِف الـ AI Crawlers في robots.txt بسياسة Allow (أو على الأقل لا تحظرها).

3. أرسِل sitemap لـ Bing Webmaster Tools أيضاً — معظم AI Crawlers تستخدم فهرس Bing كنقطة انطلاق.

إرسال الـ sitemap

بعد إنشاء الملف، ارفعه إلى جذر موقعك: https://example.com/sitemap.xml. ثم:

Google Search Console: اذهب إلى Sitemaps، الصق رابط الـ sitemap، اضغط «إرسال». Google يفهرسه خلال ساعات.

Bing Webmaster Tools: نفس الخطوات. Bing يفيد لـ AI Crawlers ولـ Microsoft Copilot.

robots.txt: أضِف السطر Sitemap: https://example.com/sitemap.xml. كل الزواحف الحديثة تقرأه أوّلاً.

Yandex و Baidu (إن كنت تستهدف روسيا أو الصين): لكلّ منهما لوحة Webmaster Tools خاصّة.

sitemap ديناميكي مقابل ثابت

للمواقع الصغيرة (أقلّ من 100 صفحة)، sitemap ثابت يدوي يكفي. للمواقع الأكبر، الـ sitemap الديناميكي (يُولَّد من قاعدة البيانات لحظة الطلب) هو الحلّ.

Next.js يدعم sitemap ديناميكي عبر app/sitemap.ts منذ الإصدار 13. WordPress يُولّده تلقائياً عبر Yoast SEO أو Rank Math. للمواقع المخصّصة، اكتب endpoint بسيط يقرأ الصفحات من قاعدة البيانات ويُخرج XML.

أخطاء تبطل الـ sitemap

تضمين روابط بـ HTTP بدلاً من HTTPS رغم أن موقعك على HTTPS — Google يعتبرها روابط مختلفة.

تضمين صفحات تحوي noindex — تضارب بين «أنشر هذه» و«لا تفهرسها». Google يحترم noindex ويُهمل sitemap.

تضمين روابط تُعيد توجيه (301/302) — أضِف الرابط النهائي فقط.

عدم تحديث lastmod مع تغييرات حقيقيّة — Google يفقد الثقة في الـ sitemap إذا كانت كل التواريخ موحّدة.

أدوات ذات صلة

أدوات أخرى مجانية على ArabToolBox، كلها تعمل في متصفّحك بدون تسجيل.

أسئلة شائعة

هل sitemap.xml لا يزال ضرورياً في 2026؟

نعم وبشكل أكبر. AI Crawlers (GPTBot, ClaudeBot, PerplexityBot) تعتمد على sitemap حصراً ولا تتبع روابط داخليّة كما يفعل Googlebot. بدونه قد لا يظهر محتواك في إجابات AI.

ما الحدّ الأقصى لعدد الـ URLs في ملف واحد؟

50,000 رابط أو 50 ميجابايت غير مضغوط. للمواقع الأكبر استخدم Sitemap Index — ملف رئيسي يُشير إلى عدّة ملفّات فرعيّة.

كيف أُعلِم Google بالنسخ متعدّدة اللغات؟

أضِف xhtml:link rel="alternate" داخل عنصر url لكل لغة، مع x-default للمستخدمين الذين لا تتطابق لغتهم. أداتنا تُولّد هذه الكتل تلقائياً عند تفعيل hreflang.

هل أضع الـ sitemap في robots.txt؟

نعم. أضِف السطر Sitemap: https://example.com/sitemap.xml في robots.txt. كل الزواحف الحديثة تقرأه أوّلاً قبل أي شيء آخر.

ماذا أفعل إن غيّرت تاريخ النشر؟

حدِّث حقل lastmod للصفحة المُعدَّلة. Google يستخدم lastmod لتحديد أولويّات إعادة الزحف. الإبقاء على تواريخ موحّدة قديمة يُضعف الثقة في الـ sitemap كاملاً.

أدوات ذات صلة

أدوات أخرى في نفس التصنيف قد تفيدك على ArabToolBox.

أدوات قد تهمّك