كيف نقيس الجاهزية لعصر الوكلاء.
MAGNET، اختبار الكيان التوليدي القابل للتنفيذ آليًا، هو الإطار الذي بنته Nmow لقياس قدرة الموقع على أن يُكتشف ويُفهم ويُوثَق به وأن يتعامل معه وكلاء الذكاء الاصطناعي. ستة وأربعون بندًا موزّعة على سبعة محاور، مُعايَرة لسوق الشرق الأوسط وشمال أفريقيا.
ما الذي يقيسه MAGNET فعلًا.
معظم قوائم تحقق تحسين الظهور في الذكاء الاصطناعي التي تجدها على الإنترنت لا تتجاوز نحو عشرة بنود. تنظر في ترميز المخطّطات (schema)، وتذكر llms.txt، وتقترح بعض التعديلات على المحتوى، ثم تعدّ المهمة منجزة. تلك نقطة بداية، لا منهجية.
ستة وأربعون بندًا، سبعة محاور
البنية معلنة، وسلّم التقييم في التقييم نفسه
المحاور السبعة في لمحة.
كل محور يعالج نمط إخفاق محددًا في الجاهزية لعصر الوكلاء. تتغير الأوزان حسب نوع النشاط؛ ويعرض المخطط الوزن الافتراضي للأنشطة الخدمية.
هل يستطيع الوكلاء استرجاع حقائق قاطعة عن عروضك؟
هل يستطيع الوكلاء استرجاع حقائق قاطعة عن نشاطك وعروضك دون الاستنتاج من النصوص؟
الوزن الأكبر
البنود المُقيَّمة
هل يستطيع الوكلاء المعتمدون على الرؤية النقر على العناصر الصحيحة؟
هل يستطيع الوكلاء المعتمدون على الرؤية النقر على العناصر الصحيحة وإتمام المهام دون تهيّؤ وظيفة العنصر؟
جاهز لوكلاء الرؤية
البنود المُقيَّمة
حين يستشهد نموذج لغوي بمحتواك، هل يصمد الاستشهاد أمام التدقيق؟
حين يستشهد نموذج لغوي بمحتواك، هل يصمد الاستشهاد أمام التدقيق؟
متانة الاستشهاد
البنود المُقيَّمة
هل يستطيع الوكلاء الراغبون في قراءة موقعك الوصول إليه فعلًا؟
هل تستطيع الوكلاء الراغبة في قراءة موقعك الوصول إليه فعلًا؟
شرط مسبق للوصول
البنود المُقيَّمة
هل تتطابق دلائل طوابعك الزمنية مع الواقع؟
هل تتطابق دلائل طوابعك الزمنية مع الواقع؟
صدق الطابع الزمني
البنود المُقيَّمة
ما دلائل المصداقية التي يجدها النموذج اللغوي؟
ما دلائل المصداقية التي يجدها النموذج اللغوي حين يوازن في أمر الاستشهاد بك؟
جدارة الاستشهاد
البنود المُقيَّمة
هل يستطيع وكيل إتمام تحويلك الأساسي نيابةً عن المشتري؟
هل يستطيع وكيل إتمام إجراء التحويل الأساسي نيابةً عن المشتري من البداية إلى النهاية؟
قابلية إتمام المعاملات
البنود المُقيَّمة
خمس فئات. ماذا يعني تقييمك عمليًا.
يقابل كل مجموع نقاط فئةً، وتقابل كل فئة خطوةً تالية موصى بها.
أصيل للوكلاء
ودود للوكلاء
مُحسَّن للعصر التقليدي
مُعيق
موقع معتم
تتغير الأوزان حسب نوع النشاط.
تقيّم القوائم العامة كل موقع بالطريقة نفسها. أما MAGNET فيعدّل أوزان المحاور بناءً على نوع النشاط الخاضع للتقييم، لأن أنماط الإخفاق الأكثر أهمية تختلف باختلاف الفئة.
الوزن الافتراضي
وزن تجاري
وزن السلطة
وزن الثقة
الوزن الدقيق لكل نوع نشاط جزء من التقييم. ويُحدَّد النوع المناسب خلال مرحلة الاستكشاف في التقييم. أما الأنشطة الهجينة (كتجارة إلكترونية بذراع محتوى قوية) فتُقيَّم وفق النوعين معًا، ويُعرَض الأدنى من التقييمَين بوصفه التقييم الرئيس.
خمسة إخفاقات تسقف أقصى تقييم لك.
بعض الإخفاقات قاطعة. فقد يحصل موقع على العلامة الكاملة في ستة محاور ويظل غير مرئي عمليًا للوكلاء بسبب عطب جوهري واحد. وتحدد فحوص النقض هذه الأعطاب وتسقف أقصى تقييم ممكن إلى أن تُعالَج.
غير قابل للزحف
المحتوى غير قابل للوصول إطلاقًا: جدار تسجيل دخول، أو تمرير لا نهائي بلا روابط حقيقية، أو عوائق وصول أخرى. لا يستطيع الوكلاء بلوغه، فيصبح تقييم المحاور نظريًا.
السقف: 25 كحد أقصى
حجب الزواحف
حجب زواحف الذكاء الاصطناعي الكبرى جملةً (GPTBot وClaudeBot وPerplexityBot وأمثالها)، سواء عن قصد أو عبر جدار حماية مُعَدّ إعدادًا خاطئًا.
السقف: 30 كحد أقصى
العرض عبر JavaScript فقط
معظم المحتوى ذي المعنى لا يُعرَض إلا من جهة العميل، دون HTML مُعالَج من جهة الخادم لزواحف الوكلاء التي لا تنفّذ JavaScript. وتُظهر دراسات الجلب واسعة النطاق أن زواحف الذكاء الاصطناعي لا تشغّل JavaScript بالطريقة التي يشغّلها Googlebot.
السقف: 40 كحد أقصى
تحويل يتطلب تدخلًا بشريًا
لا يمكن إتمام التحويل الأساسي إلا عبر تواصل بشري متزامن (مكالمة هاتفية، أو WhatsApp، أو زيارة شخصية) دون بديل رقمي يستطيع الوكيل اجتيازه.
السقف: 40 كحد أقصى
غياب المخطّطات
لا توجد أي بيانات منظّمة من أي نوع عبر الصفحات المُقيَّمة (لا JSON-LD، ولا microdata، ولا RDFa). ويكفي مخطط Organization واحد في ترويسة الصفحة لتجاوز هذا الفحص.
السقف: 50 كحد أقصى
ما لا يقيسه MAGNET.
يقيس MAGNET الجاهزية لعصر الوكلاء تحديدًا. ولا يقيس صحة النشاط العامة، ولا أداء التسويق، ولا قوة العلامة. فقد يحصل موقع على 100 في MAGNET ويظل نشاطه متعثرًا: التقييم ضروري لكنه غير كافٍ.
أداء الإعلانات المدفوعة
ترتيب البحث العضوي
تحسين معدل التحويل
الحضور على وسائل التواصل
الأساسيات التشغيلية
انطباع العلامة
جانب الأداء يسير وفق منهجه الخاص.
يقيس MAGNET عصر الوكلاء. أما النمو والإعلانات المدفوعة والاحتفاظ فتخضع لانضباط لا يقل وضوحًا، معروض على كل صفحة خدمة بدلًا من دفنه في عرض تقديمي.
الأفق الصادق
نرسم حلقات النمو، ونمذجة الأرقام، ونعزل القيد الحاكم، ثم نعلن الرقم الذي ستبلغه فعلًا، لا الرقم الوارد في العرض التقديمي.
اطّلع على المنهجمنحنى الاحتفاظ
نهندس التفعيل والتفاعل والاستعادة حسب حالة المستخدم، حتى يستقر المنحنى عند قاعدة محتفَظ بها بدلًا من التلاشي نحو الصفر.
اطّلع على المنهجMER بدلًا من ROAS الشكلي
نقرأ القمع كاملًا بحثًا عن التسريبات، ونحكم على الإنفاق بالكفاءة المجمّعة، ونرفع تقاريرنا على الرقم الذي يقابل الإيراد بدلًا من الرقم الذي تنسبه كل منصة لنفسها.
اطّلع على المنهجنقيّم أنفسنا وفق الإطار الذي نبيعه.
تقييم MAGNET الحالي لموقع nmow.ai، مع التفصيل لكل محور. يُحدَّث ربع سنويًا. ويُولَّد التقييم بالبنية ذاتها المستخدمة في تقييمات العملاء: لا معاملة خاصة، ولا اختصارات، ولا تقريب تطلّعي.
محور سلطة الكيان D6 هو أضعف محاورنا: إذ ما زالت مدخلات Wikipedia وWikidata قيد الإنجاز. والتحويل الوكيلي D7 جزئي لأن التحويل الأساسي لدى Nmow هو حجز الاستشارة لا المعاملة المباشرة؛ فنقيّم جاهزية مسار الحجز للوكلاء، لا إتمام الشراء في التجارة الإلكترونية. (التقييمات المعروضة قيد التحديث وفق MAGNET v2.)
أسئلة شائعة عن الإطار.
لماذا هذه المحاور السبعة دون غيرها؟
كل محور يعالج نمط إخفاق محددًا رأيناه في تقييمات فعلية عبر أنشطة في المنطقة العربية. وقد جرى تكرار الإطار على خمسة مواقع اختبارية قبل الإطلاق: وكانت هذه السبعة هي الفئات المتكررة. جرّبت المسودات الأولى أربعة محاور (خشنة أكثر من اللازم) وأحد عشر محورًا (متداخلة). والسبعة هي الدقة التي تبقى عندها المحاور متمايزة دون ترك فجوات ذات معنى.
لماذا هذا الوزن تحديدًا؟
تعكس الأوزان الأثر النسبي لكل محور في ما إذا كان الوكيل سيستشهد بموقع أو يتعامل معه. تتعادل البيانات المنظّمة D1 وقابلية استخراج المحتوى D3 وسلطة الكيان D6 في احتلال أكبر وزن: فالبيانات المنظّمة والمحتوى القابل للاستخراج وهوية الكيان القابلة للتحليل هي أقوى محرّكات استشهاد الوكيل بك. ويحمل D7 أقل وزن في النوع الافتراضي لأن معظم الأنشطة ليست تحويلية، وإن كان يرتفع بحدّة في التجارة الإلكترونية. وتعمل تحوّلات الأوزان حسب النوع على مزيد من المعايرة للديناميكيات الخاصة بكل فئة. أما سلّم التقييم الدقيق على مستوى البنود داخل كل محور فملكية حصرية لمُخرَجات التقييم.
هل MAGNET مفتوح المصدر؟
البنية (المحاور السبعة، والأوزان، والتفئية، ومنطق النقض) موثّقة علنًا في هذه الصفحة. أما سلّم التقييم الكامل المؤلف من 46 بندًا، ومعايير تقييم كل بند، وبنية الكشف الآلي، فملكية حصرية لتقييم Nmow. والسبب: القيمة ليست في وجود الإطار، بل في صرامة كيفية تقييم كل بند. ونشر سلّم التقييم دون انضباط التقييم سيدعو إلى ذلك النوع من العمل السطحي القائم على "قرأتُ القائمة"، وهو ما دفعنا أصلًا إلى بناء منهجية حقيقية.
كم مرة يُحدَّث الإطار؟
إصدارات فرعية ربع سنوية؛ وإصدارات رئيسة سنوية. تعدّل الإصدارات الفرعية أوزان البنود وتضيف بنودًا جديدة مع تطوّر مشهد الوكلاء. وقد تغيّر الإصدارات الرئيسة بنية المحاور عند الحاجة: ونتوقع إصدارًا رئيسًا واحدًا على الأكثر كل 18 شهرًا. والإصدار الحالي هو v2.0.
هل أستطيع تقييم نفسي وفق MAGNET دون شراء تقييم؟
تستطيع استخدام البنية العلنية في هذه الصفحة لتقدير موضعك. وقراءة المحاور السبعة وسؤال نفسك "هل نحن أقوياء هنا؟ ضعفاء هنا؟" تضع الفِرق عادةً ضمن فئة معينة. لكن التقييم الحقيقي يتطلب سلّم التقييم وبنية الكشف، وكلاهما ملكية حصرية. وأقرب ما تبلغه دوننا هو تحديد المحاور التي تثق بها والتي لا تثق بها، واستخدام ذلك قائمةَ أولويات.
لماذا هذا الإطار مُعايَر للمنطقة العربية تحديدًا؟
بُنيت أطر تحسين الظهور في الذكاء الاصطناعي العامة على مواقع إنجليزية اللغة افتراضها الولايات المتحدة وأوروبا. أما MAGNET فبُني على أنماط الإخفاق الخاصة بالمنطقة العربية: الاتساق ثنائي اللغة بين العربية والإنجليزية، ودعم وسائل الدفع الإقليمية (Mada وSTC Pay وTabby وTamara) على مستوى الترميز، وأعراف الإفصاح عن المحتوى في القطاعات المنظَّمة بالسعودية والإمارات، والحجب الجغرافي للعناوين الذي يطال بنية زواحف النماذج اللغوية، وندرة كيانات Wikipedia العربية. لا شيء من ذلك يُقيَّم في إطار عام. وكله يُقيَّم هنا.
اعرف أين يقع موقعك على MAGNET.
يقيّم تقييم الجاهزية لعصر الوكلاء موقعك وفق الإطار الكامل ويمنحك خطة إصلاح مرتّبة بالأولوية.
