الإطار التشغيلي هو المنتج: هندسة الـ AI Harness لأنظمة تصمد أمام الواقع
هندسة الـ AI Harness هي نقطة التقاء الاستراتيجية بالتنفيذ. نظرة معمقة على ما هو الإطار التشغيلي، لماذا تبنيه الفرق بشكل خاطئ، وكيف تنشئه باستخدام أحدث قواعد OpenAI وClaude.

معظم مشاريع الذكاء الاصطناعي لا تفشل بسبب النموذج. تفشل عند نقطة التماس بين النموذج والعالم.
يمكنك استبدال GPT-5 بـ Claude Opus، وضبط النموذج على بيانات حصرية، وتشغيل ألف اختبار تقييمي، ثم تشاهد النظام ينهار في اللحظة التي يطرح فيها مستخدم حقيقي سؤالاً حقيقياً غير موجود في مجموعة الاختبار. النموذج ليس عنق الزجاجة. الإطار التشغيلي المحيط به هو عنق الزجاجة.
الإطار التشغيلي، أو ما يُعرف هندسياً بالـ Harness، هو كل ما يلتف حول النموذج: المطالبة النظامية (System Prompt)، سجل الأدوات، إدارة السياق، منطق إعادة المحاولة، فلاتر المخرجات، طبقات الأمان، الرصد، وحلقة التقييم. هو الحدود التشغيلية التي يتحول داخلها النموذج إلى وكيل (Agent). وفي عام 2026، مع نشر OpenAI وAnthropic لقواعد متزايدة الوضوح حول كيفية بناء هذا الإطار، اكتسب هذا التخصص أخيراً اسمه. نحن نسميه هندسة الـ AI Harness، ونعتبره في تَصَوُّم أهم قرار بنية تحتية تتخذه المؤسسة بعد اختيار النموذج الأساسي.
هذا المقال يقوم بثلاثة أشياء. يشرح ما هو الـ AI Harness فعلياً، بمصطلحات ملموسة. يستعرض الأعراف التي توافقت عليها OpenAI وAnthropic خلال الثمانية عشر شهراً الماضية. ويقدم لك مخططاً تنفيذياً خطوة بخطوة لإنشائه. إذا كنت تشحن أي منتج يستدعي نموذج لغة كبير في الإنتاج، فهذه هي الطبقة التي تعيش فيها وحدات اقتصادك، وثقة عملائك، وسرعة خارطة الطريق لديك.
أبرز النقاط
- الإطار التشغيلي، لا النموذج، هو ما يحدد ما إذا كان نظام الذكاء الاصطناعي سيصمد تحت ضغط الإنتاج
- توافقت OpenAI وAnthropic على مرتكزات مشتركة: الأدوات المُحدّدة الأنواع، المخرجات المهيكلة، هندسة السياق، الوكلاء الفرعيون، والتشغيل البيني عبر بروتوكول MCP
- الـ Harness الحديث يُبنى في ثماني طبقات، من حدود التشغيل وصولاً إلى مفتاح الإيقاف
- معاملة الإطار كسطح منتج، لا كسباكة، هي أعلى رافعة استراتيجية يستطيع الفريق تحريكها بعد اختيار النموذج
ما هو الـ AI Harness فعلياً
الـ Harness هو السقالة التشغيلية المحيطة بنموذج اللغة. النموذج بحد ذاته دالة عديمة الحالة. رموز تدخل، رموز تخرج. كل ما يحول هذه الدالة إلى شيء يمكن للإنسان الاعتماد عليه (الذاكرة، الأدوات، الحُكم، الاسترداد) يعيش في الإطار التشغيلي.
أبسط Harness ممكن يتكون من ثلاثة أجزاء. مطالبة نظامية تخبر النموذج من هو وما المسموح له فعله. أنبوب إدخال يضخ طلب المستخدم. أنبوب إخراج يعيد الإجابة. أبسط Harness ممكن هو أيضاً أول من يفشل.
الـ Harness الإنتاجي يحتوي طبقات أكثر. المطالبة النظامية تُولّد ديناميكياً بناءً على حالة المستخدم، صلاحياته، والأدوات المتاحة في تلك اللحظة. طبقة أدوات تتيح للنموذج استدعاء واجهات برمجة، استعلام قواعد بيانات، أو استنهاض وكلاء آخرين. مدير سياق يقرر ما يبقى في النافذة وما يُلخّص أو يُسترجع أو يُحذف. مدقق مخرجات يفحص الاستجابة مقابل مخطط محدد قبل أن تصل إلى المستخدم. طبقة إعادة محاولة لمعالجة الأعطال الجزئية. طبقة أمان لحجب المخرجات غير الآمنة. طبقة تقييم تُسجّل كل استجابة. طبقة رصد تلتقط كل تتبع لتحليله لاحقاً.
كل طبقة من هذه الطبقات كانت تُبنى بشكل مرتجل. كان المهندسون يربطونها بأي إطار يبدو أقل إيلاماً في ذلك الشهر. النتيجة كانت ديناً تقنياً مركّباً: ضريبة كل قرار غير موثق، كل تسلسل نصي هش، كل إعادة محاولة صامتة تخفي خطأً حقيقياً.
قواعد الـ Harness التي نشرتها OpenAI وAnthropic خلال العام الماضي وُجدت لأن كلتا الشركتين شاهدتا عملاءهما يغرقون في هذا الدين. القواعد محاولة لتوحيد نقاط التماس.
لماذا تبني معظم الفرق إطاراً سيئاً
ثلاثة أنماط فشل تتكرر في الفرق التي تبني أنظمة ذكاء اصطناعي بدون استراتيجية Harness مدروسة.
النمط الأول هو هندسة المطالبات كصناعة منزلية. مهندس بارز يكتب مطالبة نظامية طويلة ودقيقة تعمل بشكل رائع في العرض التوضيحي. بعد ستة أشهر تصبح المطالبة بطول أربعة عشر ألف رمز، لا أحد في الفريق يفهم كل بند فيها، وتعديلها هو أعلى تغيير محفوف بالمخاطر يمكن لأي شخص إجراؤه. الفريق خلط بين المطالبة والعقد. العقد مُؤرشف ومُختبر ومحدد الحدود. المطالبة التي تراكمت عليها التعليمات كحلقات الشجرة ليست أياً من ذلك.
النمط الثاني هو الفجوة بين العرض والإنتاج. النظام يعمل في بيئة محكومة بمدخلات نظيفة، مستخدمين متعاونين، ونطاق ضيق. الإنتاج يقدم ثلاثة أشياء لم يُصمم الإطار لها: مدخلات عدائية، انجراف في الأدوات الأساسية، وطلبات من ذيل التوزيع الإحصائي. كل واحد من هذه يتطلب طبقة إطار محددة لم تكن في التصميم الأصلي. الفرق ترقّع حولها بإعادة المحاولة، حواجز مثبتة بعد الواقعة، وتعديلات يائسة متزايدة على المطالبة.
النمط الثالث هو ضريبة التنسيق. حين لا يكفي وكيل واحد، تلجأ الفرق إلى أُطر تنسيق. سلاسل، رسوم بيانية، وكلاء يتحكمون في وكلاء. الأُطر تَعِد بقابلية التركيب وتُسلّم بدلاً من ذلك متاهة من الإحالات حيث طلب مستخدم واحد قد يولّد أربعين استدعاءً للنموذج، لكل منها زمن استجابة، وميزانية أخطاء، ونمط فشل خاص. الفريق بنى الآن نظاماً موزعاً فوق مرتكز عشوائي، دون تطبيق أي من الانضباط التشغيلي الذي يتطلبه أي نظام موزع.
التشخيص الأعمق هو أن معظم الفرق تتعامل مع النموذج كمنتج، والإطار كسباكة. الاقتصاديات تنقلب في اللحظة التي يصبح فيها النموذج سلعة. حين يصبح نموذجان أو ثلاثة نماذج أساسية متبادلة تقريباً لحالة استخدامك (ونحن تجاوزنا هذه النقطة بكثير)، يصبح الإطار هو ما يميزك. الإطار التشغيلي هو المنتج.
قواعد الـ Harness لعام 2026 من OpenAI وAnthropic
كلا المختبرين شحنا خلال الثمانية عشر شهراً الماضية إرشادات صريحة ومتزايدة الوضوح حول كيفية تنظيم أُطر الإنتاج. الأعراف ليست متطابقة، لكن التقارب لافت. ست مرتكزات تظهر الآن في كلتا المنظومتين.
المرتكز الأول: الأدوات كمواطنين من الدرجة الأولى
استخدام الأدوات لم يعد حيلة ذكية. أصبح العمود الفقري لأي نظام وكيل. كلٌّ من Tool Calling في OpenAI وTool Use في Anthropic يعامل الأدوات كعقود مُحدّدة الأنواع. للأداة اسم، وتعريف JSON Schema لمدخلاتها، وأثر محدد بوضوح. مهمة النموذج هي تحديد متى يستدعي أداة، بأي وسائط، وماذا يفعل بالنتيجة.
قاعدة 2026 في كلتا المنظومتين هي أن تعريفات الأدوات تنتمي إلى خارج المطالبة النظامية، وداخل سجل مُهيكل. تضمين أوصاف الأدوات في النص الحر كان الطريقة القديمة. الطريقة الجديدة هي مخطط مُحدد الأنواع مع أوصاف دلالية، مُتحقق منه عند التسجيل، مع أمثلة مدخلات ومخرجات تُغذي النموذج ومجموعة التقييم لديك في آن واحد.
المرتكز الثاني: المخرجات المهيكلة كإعداد افتراضي
مخرجات النص الحر مصدر لحصة غير متناسبة من ألم الإطار. كلٌّ من Structured Outputs في OpenAI والمخرجات على شكل أداة في Anthropic يتيحان لك تقييد استجابة النموذج بمخطط JSON Schema. القاعدة أصبحت بسيطة. إذا كانت المخرجات ستُحلَّل برمجياً، فيجب أن تكون مقيدة بمخطط. إذا كانت ستُقرأ من قِبل إنسان، يمكن أن تكون نصاً حراً، لكن يجب أن تمر عبر مدقق قبل العرض.
المرتكز الثالث: هندسة السياق كتخصص
كلا المختبرين ينشران الآن إرشادات حول هندسة السياق، وهي ممارسة تحديد ما يدخل نافذة سياق النموذج وما يبقى خارجها. المبادئ المشتركة هي: أبقِ النافذة رشيقة، فضّل الاسترجاع على التضمين، لخّص التواريخ الطويلة بالنموذج نفسه، واستخدم الضغط أو تحرير السياق حين تتجاوز الجلسة الميزانية. Claude Agent SDK من Anthropic يشحن بدائيات تحرير السياق صراحةً. Responses API من OpenAI يشحن إدارة محادثة بدلالات مماثلة. عصر إلقاء كل رسالة في كتلة سياق واحدة متضخمة قد انتهى، والفرق التي لا تتكيف ستدفع الثمن من رموزها ودقتها.
المرتكز الرابع: الوكلاء الفرعيون والتفويض
استدعاء نموذج واحد لا يستطيع فعل كل شيء جيداً. كلتا المنظومتين تعاملان الآن الوكلاء الفرعيين كنمط من الدرجة الأولى. منسق الإطار يعرّف وكيلاً رئيسياً يخطط ويوزع، ووكيلاً متخصصاً واحداً أو أكثر ينفذ. يعمل الوكلاء الفرعيون عادةً في نوافذ سياق خاصة بهم مع مجموعة فرعية من الأدوات، ويعيدون ملخصاً إلى الأب. إرشادات Anthropic واضحة هنا بشكل خاص: الوكلاء الفرعيون هم الوسيلة لإبقاء سياقات الأب صغيرة ووكلاء الأب مركزين. هم أيضاً الوسيلة لعزل الفشل. الوكيل الفرعي الذي يفشل يعيد خطأً مهيكلاً، لا سياق أب فاسداً.
المرتكز الخامس: التشغيل البيني عبر MCP
بروتوكول سياق النموذج (Model Context Protocol)، الذي أنشأته Anthropic وتبنته الآن أدوات OpenAI وعدة أُطر مفتوحة المصدر، يوحّد كيفية اكتشاف الوكلاء واستدعائهم للأنظمة الخارجية. خادم MCP يعرض موارد، أدوات، ومطالبات عبر نقل محدد. أي مضيف متوافق مع MCP يستطيع الاتصال. الأثر الاستراتيجي ضخم. التكاملات لم تعد أعمال توصيل لكل مزوّد، بل أصبحت تطبيقات بروتوكول. الفريق الذي يبني على MCP اليوم يحصل على القابلية المستقبلية للنقل مجاناً، وكلفة كتابة الأدوات بهذه الطريقة لا تتجاوز كلفة كتابة تكاملات مخصصة.
المرتكز السادس: أوضاع التفكير والاستدلال
كلٌّ من OpenAI وAnthropic يعرضان الآن أوضاع تفكير صريحة على مستوى الواجهة البرمجية. التفكير الموسع، التداول، ضوابط سلسلة التفكير، أياً كانت التسمية التي يختارها المزوّد المحدد. قاعدة الإطار هي استخدامها بتعمد. وضع التفكير مكلف في زمن الاستجابة والرموز معاً. ينتمي إلى المهام التي يحتاج فيها النموذج فعلياً للتخطيط أو التحقق، لا إلى كل استدعاء. الإطار يجب أن يقرر متى يستدعيه بناءً على نوع المهمة، لا أن يترك النموذج يستدعيه في كل مكان.
هذه المرتكزات الستة هي طبقة العقود في الإطار الحديث. الفريق الذي يفهمها ويستخدمها يعمل على ارتفاع مختلف عن الفريق الذي لا يزال يربط النصوص في مطالبة.
كيف تُنشئ Harness خطوة بخطوة
الهيكل التالي هو ما نستخدمه في تَصَوُّم عند تصميم أُطر التشغيل لأنظمة العملاء. يتدرج من أداة داخلية أحادية الغرض إلى منصة متعددة الوكلاء تواجه العملاء. كل خطوة هي طبقة. تخطي طبقة هو دين تقني.
الخطوة الأولى: حدّد حدود التشغيل
قبل كتابة أي شيفرة، يحدد فريق الإطار، بلغة بسيطة، ما يُسمح للوكيل بفعله، ما هي المدخلات التي صُمِّم للتعامل معها، ما المخرجات المطلوبة منه إنتاجها، وكيف يبدو الفشل. هذه هي حدود التشغيل. هي الوثيقة التي تُشتق منها كل قطعة أخرى في الإطار: المطالبة النظامية، سجل الأدوات، مجموعة التقييم، طبقة الأمان.
حدود التشغيل المفيدة تجيب عن ست أسئلة. من هو المستخدم. ما المشكلة التي يحلها الوكيل. ما الذي ضمن النطاق. ما الذي خارجه. كيف يبدو النجاح. ما أسوأ نتيجة على استعداد لتحملها. السؤال الأخير هو الأهم. إذا لم تستطع تحديد أسوأ فشل محتمل، فلن تستطيع تصميم حواجز له.
الخطوة الثانية: اختر البنية النموذجية
اختر أصغر نموذج يستطيع أداء المهمة بجودة مقبولة. ثمن النموذج الصغير جداً هو فشل المهمة. ثمن النموذج الكبير جداً هو عشرة أضعاف فاتورة الاستدلال وضعف زمن الاستجابة. شغّل مجموعة التقييم لديك على نموذجين على الأقل وحدود مزوّد واحد على الأقل قبل الالتزام.
قاعدة 2026 هي أن لا يجب لأي إطار تثبيت نموذج واحد بشكل صلب. البنية النموذجية إعداد، لا ثابت. الإطار المصمم جيداً يتيح لك استبدال Claude بـ GPT، أو العكس، بتغيير إعداد وإعادة تشغيل مجموعة التقييم. إذا كان مسار الشيفرة لديك يعرف أي مزوّد يتحدث إليه، فقد بنيت اقتراناً سيؤذيك خلال اثني عشر شهراً.
الخطوة الثالثة: صمّم المطالبة النظامية كعقد تشغيل
المطالبة النظامية ليست ملاحظة حرة للنموذج. هي عقد. عاملها كذلك. أرشفها. اختبرها. وثّق كل بند. أبقها ضمن ميزانية. نهدف عادةً إلى أقل من ثلاثة آلاف رمز للجزء الثابت، مع سياق ديناميكي يُلحق وقت التشغيل.
المطالبة النظامية الحديثة لها أربعة أقسام. الهوية (من الوكيل). القدرات (ما الأدوات والموارد التي يستطيع الوصول إليها). القيود (ما يجب ألا يفعله). تنسيق المخرجات (كيف يجب أن يستجيب). أي شيء لا يندرج تحت أحد هذه الأقسام الأربعة على الأرجح لا ينتمي إلى المطالبة النظامية.
نصيحة احترافية: حين تتجاوز المطالبة النظامية ثلاثة آلاف رمز، الخطوة الصحيحة لا تكون أبداً تقريباً إضافة المزيد من التعليمات. هي إخراج جزء منها إلى أداة، أو وكيل فرعي، أو كتلة سياق مدعومة بالاسترجاع. المطالبات المتضخمة عَرَض أن الإطار يقوم بعمل النموذج بالنيابة عنه.
الخطوة الرابعة: وصّل الأدوات عبر MCP حيثما أمكن
عرّف كل قدرة خارجية يحتاجها الوكيل كأداة. استخدم JSON Schema لعقود الإدخال والإخراج. حيث تكون القدرة معروضة عبر خادم MCP موجود، فضّل هذا المسار. تحصل على الرصد، وإعادة المحاولة، والاكتشاف مجاناً. حيث تبني خاصتك، ابنها كخادم MCP من اليوم الأول حتى لو كنت المستهلك الوحيد. الحمل الإضافي للبروتوكول مهمل، والاختيارية المستقبلية ضخمة.
كل أداة تحتاج ثلاث قطع. المخطط. وصف دلالي يساعد النموذج على تحديد متى يستخدمها. ثلاثة أمثلة على الأقل للمدخلات والمخرجات. الأمثلة تغذي الإرشاد وقت المطالبة والتقييم معاً. الأداة بدون أمثلة ستُساء استخدامها.
هناك فائدة من الدرجة الثانية لـ MCP تغفل عنها الفرق غالباً. حين تعيش أدواتك خلف بروتوكول، يمكنك تدقيقها باستقلالية، استبدال تطبيقاتها، والسماح لعدة وكلاء بمشاركة سجل الأدوات نفسه. التوصيل يصبح سطح منتج بحد ذاته، ومهندسوك يتوقفون عن إعادة كتابة التكامل ذاته خمس مرات لخمسة وكلاء مختلفين.
الخطوة الخامسة: هندسة إدارة السياق
قرر، في وقت التصميم، كيف ستُدار نافذة السياق عبر دورة حياة الجلسة. الروافع المعنية هي التضمين (ما الذي يُوضع في النافذة)، الاسترجاع (ما الذي يُجلب عند الطلب)، التلخيص (كيف تُضغط التواريخ الطويلة)، والتحرير (كيف يُعيد الإطار كتابة السياق حين تقترب الميزانية).
كلٌّ من Anthropic وOpenAI يعرضان الآن بدائيات لكل من هذه. استخدمها. الفريق الذي يبني إدارة السياق فوق ربط النصوص الخام في عام 2026 يختار تنقيح نفس فئة الأخطاء للسنتين القادمتين. هندسة السياق هي المكان الذي يصبح فيه الفرق بين الوكيل الهاوي والوكيل الإنتاجي أكثر وضوحاً. الوكيل الهاوي ينسى ما كان يفعله قبل خمس دورات. الوكيل الإنتاجي يتذكر بالضبط الأشياء الصحيحة ويتجاهل الباقي.
الخطوة السادسة: ابنِ حلقة التقييم
حلقة التقييم ليست مجموعة اختبارات لمرة واحدة. هي عملية مستمرة تعمل في كل مرة تتغير فيها مطالبة نظامية، أو تعريف أداة، أو إصدار نموذج. للحلقة ثلاثة مكونات. مجموعة بيانات معنونة من المدخلات التمثيلية. دالة تسجيل تقيس الصحة على كل مدخل. طبقة أتمتة تشغل المجموعة عند كل تغيير وتحجز النشر.
مجموعة التقييم الجيدة لها ثلاث طبقات. الأمثلة الجوهرية، وهي الحالات التي يجب أن يتعامل معها الوكيل دائماً. الذيل، وهو المدخلات العدائية، الحالات الحدية، الطلبات الغامضة. مجموعة الانحدار، وهي الحالات التي فشلت سابقاً وأُصلحت منذ ذلك الحين. كل طبقة تستحق عتبة مختلفة لجاهزية الشحن.
نصيحة احترافية: أعلى استثمار رافعة في الإطار لا تستثمر فيه معظم الفرق بما فيه الكفاية هو حلقة التقييم. الفريق الذي يمتلك مجموعة تقييم بألف مدخل تعمل عند كل تغيير سيتفوق على الفريق الذي يمتلك نموذجاً أفضل بدون مجموعة تقييم. مجموعة التقييم هي الجهاز العصبي للإطار.
الخطأ الأكثر شيوعاً هنا هو معاملة التقييم كشيء يحدث في النهاية. حينئذ يكون قد فات الأوان. التقييم يجب أن يقود التصميم، لا أن يصادق عليه. حين تكتب أداة جديدة، القطعة الأولى ليست التطبيق، بل حالات التقييم التي تحدد متى يجب استدعاء الأداة وكيف يبدو الجيد عند استدعائها.
الخطوة السابعة: أضف الرصد والتغذية الراجعة
كل استدعاء نموذج يجب أن يُنتج تتبعاً. المدخلات، المطالبة النظامية، استدعاءات الأدوات، المخرجات الوسيطة، الاستجابة النهائية، زمن الاستجابة، تكلفة الرموز. التتبعات تغذي نظامين. الأول هو الرصد التشغيلي، مع تنبيهات حين يتجاوز زمن الاستجابة أو معدل الأخطاء العتبات. الثاني هو دولاب التقييم. تتبعات الإنتاج تصبح مصدراً لحالات اختبار جديدة عندما يحدث شيء مثير للاهتمام.
قاعدة 2026 هي أن التتبعات بنية تحتية، لا ميزة جميلة الوجود. إذا لم تستطع إعادة إنتاج فشل إنتاجي من تتبع، فالإطار غير مكتمل. الخبر الجيد هو أن كلا المزوّدَين الكبيرَين يشحنان الآن تصدير التتبع جاهزاً، ومنظومة الرصد مفتوحة المصدر (LangSmith، Langfuse، Arize، Phoenix، وغيرها) نضجت إلى الحد الذي لم يعد بناء حلك بنفسك هو الإجابة الافتراضية.
الخطوة الثامنة: اشحن مفتاح إيقاف
كل إطار يحتاج طريقة لتعطيل، تخفيض، أو إعادة توجيه نفسه دون نشر. هذا هو مفتاح الإيقاف. يمكن أن يكون علم ميزة. ملف إعدادات. فحص وقت تشغيل مقابل خدمة إعدادات بعيدة. لا يهم ما هو، فقط أنه موجود. اليوم الذي تحتاج فيه إلى مفتاح إيقاف ولا تملكه هو يوم ستتذكره.
مفتاح الإيقاف يجب أن يدعم ثلاثة إجراءات، لا واحداً فقط. التعطيل الكامل، حيث يتوقف الإطار عن قبول الطلبات ويوجه المستخدمين إلى بديل احتياطي. التخفيض، حيث ينتقل الإطار إلى متغير نموذج أرخص أو أبسط. إعادة التوجيه، حيث تُوجَّه فئات محددة أو طلبات محددة إلى إصدار إطار مختلف. معظم الفرق تشحن التعطيل الكامل وتتوقف هناك. الإصدارات الناضجة من الثلاثة هي ما يفصل إطاراً يمكنك تشغيله عن إطار يمكنك فقط الدعاء له.
رؤية تَصَوُّم: الإطار التشغيلي هو المنتج
السبب في أننا نتعامل مع هندسة الـ AI Harness كتخصص استراتيجي في تَصَوُّم ليس فلسفياً. هو اقتصادي. في عالم تتحول فيه النماذج الأساسية إلى سلع بسرعة، الإطار هو السطح الدائم الوحيد. الفريق الذي يشحن إطاراً مدروساً على نموذج سلعة سيتفوق على الفريق الذي يمتلك نموذجاً أفضل بهامش وإطاراً مهملاً، في كل مرة، في كل سوق رصدناه.
البنية المعيارية، أنماط التكامل اللارأسي (Headless)، وحلقات التغذية الراجعة المتكررة تنطبق بقوة مضاعفة على أُطر الذكاء الاصطناعي. الإطار المعياري يتيح لك استبدال النماذج دون إعادة كتابة. الإطار اللارأسي يتيح لك خدمة الوكيل نفسه عبر الويب، الواجهة البرمجية، الصوت، أو السياقات المضمنة دون مضاعفة المنطق. حلقة التغذية الراجعة المتكررة، حيث تتبعات الإنتاج تصبح مجموعة تقييم الغد، تحول الإطار إلى نظام يُحسّن نفسه مع الاستخدام بدلاً من أن يتدهور.
الخطوة الاستراتيجية للثمانية عشر شهراً القادمة ليست مطاردة آخر إصدار نموذج. هي الاستثمار في طبقة الإطار حتى يستطيع فريقك استبدال النماذج في فترة ما بعد الظهر وشحن وكيل جديد في أسبوع. هذه هي السرعة التشغيلية التي تفصل الفرق التي تشحن عروض ذكاء اصطناعي عن الفرق التي تشحن منتجات ذكاء اصطناعي. وهي السرعة التي تتراكم. كل تحسين في الإطار يجعل الوكيل التالي أرخص في الشحن. كل وكيل رخيص شُحن يكسب البيانات التي تجعل الإطار أفضل.
هذا ما نعنيه حين نقول إن الإطار التشغيلي هو المنتج. النموذج هو مادة أساس. الوكيل هو قطعة. الإطار هو الجزء الذي يصمد بعد إصدار النموذج التالي، وتغيير المزوّد التالي، والتحول التالي في عملك. هو المكان الذي يعيش فيه خندقك التنافسي فعلياً.
الخلاصات الاستراتيجية
-
افصل النموذج عن الإطار. عامل النموذج كإعداد. شغّل مجموعة التقييم لديك على مزودين على الأقل قبل الالتزام. الفريق الذي يثبّت نموذجاً واحداً بشكل صلب يختار أن يكون رهينة له.
-
تبنَّ MCP مبكراً. ابنِ الأدوات كخوادم MCP من اليوم الأول، حتى عندما تكون المستهلك الوحيد. البروتوكول هو نقطة التماس التي سيحدث عندها العقد القادم من تكامل الذكاء الاصطناعي، وكلفة تبنيه الآن صفر مقارنة بإعادة التهيئة لاحقاً.
-
عامل المطالبة النظامية كعقد. أرشفها، اختبرها، حدد ميزانية رموزها. حين تتجاوز ثلاثة آلاف رمز، أعد هيكلتها إلى أدوات، وكلاء فرعيين، أو استرجاع. لا تستمر في تراكم التعليمات.
-
ابنِ حلقة التقييم قبل أن تحتاجها. مجموعة تقييم صغيرة لكن تمثيلية، تعمل عند كل تغيير، هي أعلى استثمار رافعة يستطيع فريق الإطار اتخاذه. هي الفرق بين نظام يتحسن ونظام ينجرف.
-
اشحن مفتاح إيقاف بثلاثة أوضاع. التعطيل الكامل، التخفيض، وإعادة التوجيه. ابنه في اليوم الأول، لا في يوم حادثتك الأولى.
الإطار التشغيلي هو حيث تلتقي استراتيجية الذكاء الاصطناعي بالتنفيذ. هو أيضاً حيث تستثمر معظم الفرق دون الحد المطلوب. الفرق التي تتقنه لا تشحن منتجات ذكاء اصطناعي أفضل فحسب. تشحنها أسرع، تغير اتجاهها بكلفة أقل، وتتعافى من الأعطال في ساعات بدلاً من أرباع.