أعلنت شركة “إنسبشن”، التابعة لمجموعة (جي42) والمتخصصة في تقنيات الذكاء الاصطناعي، بالتعاون مع جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI)، عن إطلاق منصة “AraGen Leaderboard”. وتعد هذه المنصة الأولى من نوعها التي تُخصص لتقييم أداء النماذج اللغوية الكبيرة للغة العربية (LLMs). تعتمد المنصة على مقياس جديد يُعرف بـ “3C3H”، لتقديم تقييم شامل ودقيق يعكس مدى دقة وفعالية النماذج اللغوية العربية، مما يفتح آفاقًا جديدة لتطوير معالجة اللغة الطبيعية العربية (NLP).
تلبية احتياجات أكثر من 400 مليون متحدث بالعربية
تستهدف منصة “AraGen Leaderboard” تقديم حلول مميزة لأكثر من 400 مليون ناطق بالعربية حول العالم. وتتميز بقدرتها على معالجة الفجوات الحالية في تقييم أداء النماذج اللغوية، عبر توفير مجموعة بيانات مصممة خصيصًا لتلائم التعقيدات الفريدة للغة والثقافة العربية. كما تتيح المنصة حلولًا مبتكرة لمشكلات شائعة، مثل تسرب بيانات التقييم، وغياب معايير شاملة لقياس دقة المعلومات وفائدتها العملية.
معايير تقييم متطورة لقياس الأداء
تعتمد المنصة على ستة معايير رئيسية تشمل: الدقة، والاكتمال، والإيجاز، والفائدة، والنزاهة، والخلو من الضرر. وتُقيِّم إجابات النماذج اللغوية عبر 279 سؤالًا متنوعًا، تغطي موضوعات مثل قواعد اللغة، والاستدلال، والأسئلة العامة، والأمان. ولضمان حداثة التقييم، تخضع المنصة لتحديثات منتظمة كل ثلاثة أشهر، مع فتح المجال أمام الباحثين لتقديم نماذجهم للتقييم.
رؤية مبتكرة تعزز الشمولية والابتكار
قال أندرو جاكسون، الرئيس التنفيذي لشركة “إنسبشن“:
“ترتقي منصة ‘AraGen Leaderboard’ بمعايير تقييم النماذج اللغوية من خلال التركيز على العدالة والشمولية. تُعالج المنصة أوجه القصور السابقة، مما يمكن الباحثين والمؤسسات من تطوير تقنيات ذكاء اصطناعي متوافقة مع السياق الثقافي العربي.”
كما أشار إلى أن المنصة تُسهم في تحقيق شفافية أكبر في تقييم الأداء، مما يعزز ثقة المستخدمين في التطبيقات العملية للنماذج اللغوية.
خطوة نحو الشفافية والابتكار في التقييم
أكد البروفيسور بريسلاف ناكوف، رئيس قسم معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي، على أهمية المنصة قائلاً:
“تمثل ‘AraGen Leaderboard’ تحولًا نوعيًا في تقييم النماذج اللغوية العربية، حيث تعتمد على إضافة أسئلة جديدة بانتظام، مما يجعل التقييم أكثر دقة وصعوبة التلاعب به.”
دعم متكامل لتطوير تقنيات الذكاء الاصطناعي العربية
من جانبه، أوضح علي الفلالي، مهندس التعلم الآلي في “إنسبشن” والمؤلف الرئيسي للمشروع، أن المنصة تهدف إلى تعزيز الشفافية والعدالة في تقييم النماذج، قائلًا:
“تمكننا المنصة من تقديم تقييمات دقيقة تعكس مدى فائدة النماذج في الواقع العملي، مما يسهم في تمكين مجتمع الذكاء الاصطناعي العربي من تطوير نماذج آمنة وفعالة.”
توفير حلول عملية للمؤسسات
توفر منصة “AraGen Leaderboard” معلومات دقيقة حول أداء النماذج، مما يساعد المؤسسات على اختيار الأنسب لاحتياجاتها بكفاءة. كما تُقلل من الحاجة لإجراء اختبارات داخلية مكلفة، مما يساهم في توفير الوقت والموارد مع تعزيز الشفافية والموثوقية.
سجل في قائمتنا البريدية لتصلك آخر الأخبار
تابعونا أيضا على بوابة التكنولوجيا وأخبارها في مصر