أثر
مساحة للتفكير، والقراءة، والبناء
athr.mebnou.xyz · م. أبنو
→ سطور
هندسة المعنى واقتصاد الرموز: مقاربة بين "القطع النحوي" والنماذج اللغوية (LLMs)
2026-01-15
سطور

بين شاشات الأكواد وصفحات التراث…

بحكم موقعي كمدير تقني لإحدى الشركات الناشئة، أقضي شطراً غير يسير من وقتي في تفكيك النماذج اللغوية الكبيرة (LLMs)، ومحاولة سبر أغوار خوارزمياتها وهندسة بياناتها. وبيْدَ أن هذا العالم تحكمه صرامة الأرقام، إلا أن شغفاً قديماً يشدني دائماً إلى ظلال لغة الضاد، ونحوها، وشعرها الجاهلي، وما انطوت عليه آيُ القرآن الكريم من لمسات بيانية ساحرة. قد يخيل للناظر أن بين العالمين بوناً شاسعاً؛ ولكن، عند إمعان النظر، تجلى لي تقاطع بديع ومدهش بين بنية النماذج اللغوية الكبيرة (LLMs) وبين عبقرية النحو العربي، وتحديداً في تلك الظاهرة البلاغية الفذة التي عرفها النحاة بـ “القطع”.

اقتصاد المعنى في لغة الآلة…

ولئن سألنا كيف تفهم الآلة لغتنا، فالأمر يرتد (بتبسيط غير مخل) إلى تفكيك النصوص وتوليدها على هيئة وحدات صغيرة تُعرف بالرموز (Tokens). تتآلف هذه الرموز (Tokens) لتكوين الكلمات والنصوص المخرجة، متتبعةً في ذلك التوزيع الإحصائي الأغلب في بيانات التدريب.

وقد فطن مهندسو الذكاء الاصطناعي إلى أن أفضل صيغة لتغذية هذه النماذج هي لغة “الماركداون” (Markdown). ومرد ذلك إلى قدرة هذه الصيغة على بناء هيكلة دلالية للنص بتكلفة حاسوبية منخفضة للغاية؛ فبدلاً من الاستعانة بهياكل برمجية ثقيلة، يكفي النموذج أن يلمح رمزين مثل ** ليُدرك أهمية الكلمة، أو علامة # لينتقل إلى سياق مستقل.

هذه العلامات اليسيرة لا تحشو النص بكلمات زائدة، بل تضفي عليه بنية وإشارات تقوم مقام البعد البصري أو الوسيط المتعدد (Multimodality). إنها، بعبارة أخرى، بيانات وصفية (Metadata) توجه آلية الانتباه (Attention Mechanism) لدى النموذج، وتمنحه رؤية بصرية كامنة بأزهد تكلفة ممكنة من الرموز (Tokens).

وحين تنطق الحركات بما وراء اللفظ…

وإذا يممنا شطر لغتنا العربية السمحاء، وتأملنا في ضبط كلماتها بالتشكيل (حركات الإعراب)، أدركنا يقيناً أن هذه الحركات ليست محض ترفٍ صوتي أو زينة شكلية، بل هي وسيلة فائقة الدقة لتمرير معانٍ أعمق. وتتجلى أبهى صور هذه العبقرية في ظاهرة “القطع” النحوي (في سياق الإتباع)؛ وهو كسرُ الحركة الإعرابية المتوقعة للتابع، للفت نظر السامع، واستثارة ذهنه ليفهم ما وراء اللفظ.

ولنا في التنزيل الحكيم أمثلة تتصاغر أمامها كل هندسة، نذكر منها:

في مقام التعظيم ولفت الانتباه: قال تعالى: “لَّكِنِ الرَّاسِخُونَ فِي الْعِلْمِ مِنْهُمْ وَالْمُؤْمِنُونَ يُؤْمِنُونَ بِمَا أُنزِلَ إِلَيْكَ وَمَا أُنزِلَ مِن قَبْلِكَ وَالْمُقِيمِينَ الصَّلَاةَ وَالْمُؤْتُونَ الزَّكَاةَ وَالْمُؤْمِنُونَ بِاللَّهِ وَالْيَوْمِ الْآخِرِ أُولَئِكَ سَنُؤْتِيهِمْ أَجْرًا عَظِيمًا” [النساء : 162]. جرى النسق على الرفع، وكان القياس أن يُقال “والمقيمون”، إلا أن الحركة قُطعت إلى النصب على سبيل المدح. هذا التغيير الطفيف في الحركة، كفيلٌ بأن يسلط الضوء على فريضة الصلاة، وكأنه يضع تحتها خطاً عريضاً لبيان عظيم شأنها.

في مقام الذم واستحضار الصورة: قوله تعالى: ﴿وَامرَأَتُهُ حَمّالَةَ الحَطَبِ﴾ (في قراءة من نصب الكلمة). فبدل الرفع على الإخبار العادي، جاء النصب على القطع لغرض الذم. بفتحةٍ واحدة، اكتسب المتلقي العربي أبعاداً سياقية وصورة ذهنية (Multimodality) تتجاوز مجرد الإخبار، لتشعره بتحقير شأنها وسوء صنيعها.

كثافة الدلالة بأقل التكاليف…

وهنا يتجلى وجه الشبه البديع والقياس الموازي؛ فكما تستخدم النماذج اللغوية الكبيرة (LLMs) علامات الماركداون (Markdown) كأدوات لتضمين سياق إضافي وتوجيه الفهم بتكلفة زهيدة من الرموز (Tokens)، استخدمت لغة العرب حركات الإعراب وظواهر كالقطع لتضمين وسيط جديد (Modality) يفيض بالمعاني النفسية والبصرية والسياقية، دون الحاجة إلى زيادة عدد الكلمات. إنه إيجازٌ وبلاغ، واقتصادٌ في المعنى يترجم تقنياً بتكلفة أخف على النماذج اللغوية الكبيرة (LLMs)، وبلاغة لا عِيَّ فيها للمتكلم العربي.

نحو ذكاء اصطناعي يتذوق لغة الضاد…

وختام القول في هذا المقام، أن هذا التقاطع يضعنا أمام تساؤل حتمي: كيف يتسنى لنا توظيف هذا العمق في أنظمتنا الحديثة لاستخراج الرؤى من نصوصنا الثرية، كالقرآن الكريم والموروث الثقافي الأصيل؟

إن المنهجية الحالية التي تعامل التشكيل كزوائد يتم التخلص منها، تفقد لغتنا جانباً من عبقريتها. والحل الناجع يكمن في نمذجة هذه الأنظمة لتعامل الحركات الإعرابية كرموز (Tokens) دلالية قائمة بذاتها، تحمل وزناً وتأثيراً في مسار المعنى. حينها فقط، سنبني نماذج لغوية كبيرة (LLMs) قادرة على قراءة ما بين السطور، ومواكبة الحداثة التقنية من موقع السيادة والاعتزاز بعمق لغة الضاد.