أكدت دراسة حديثة الدور الهام للنماذج اللغوية العربية الكبيرة في تعزيز وجود اللغة العربية في الفضاء الرقمي، مما يعزز قدرتها على المنافسة عالميًا. أظهرت الدراسة أن المملكة العربية السعودية تحتل صدارة الدول التي تساهم في تطوير هذه النماذج حتى عام 2025، مما يعكس التزامها في دعم ابتكارات الذكاء الاصطناعي باللغة العربية.
المملكة تتصدر قائمة الدول المطورة للنماذج اللغوية العربية
أجرت الهيئة السعودية للبيانات والذكاء الاصطناعي “سدايا”، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، دراسة موسعة هدفت إلى تحليل مسار تطوير الذكاء الاصطناعي باللغة العربية. كما استعرضت الدراسة الأوضاع الحالية واحتياجات تطوير نماذج لغوية تتسم بقدرة أفضل على فهم اللغة العربية ولهجاتها المتنوعة، إلى جانب تحسين قدرة النماذج على توليد المحتوى وتنفيذ التعليمات بفاعلية.
تاريخ وتطور النماذج اللغوية العربية
بدأت النماذج اللغوية العربية في مراحلها الأولى بالاعتماد على الأنظمة القاعدية التقليدية قبل عام 2000، ثم تطورت لتشمل النماذج الإحصائية والشبكات العصبية. ومع بداية عام 2022، شهدت هذه النماذج نقلة نوعية نحو تطبيقات توليد المحتوى المعتمدة على الذكاء الاصطناعي، حيث تم إطلاق العديد من النماذج اللغوية العربية التي تلبي احتياجات القطاعات التقنية والتعليمية والمعرفية.
الفجوات والفرص
رصدت الدراسة أكثر من 53 نموذجًا لغويًا عربيًا حتى الربع الأول من عام 2025، مع تسجيل المملكة العربية السعودية في صدارة الدول التي تطور هذه النماذج. على الرغم من التقدم الكبير، أظهرت التحليلات وجود تحديات عدة، أبرزها ضعف الاستثمار في النماذج التي تدعم الصيغ الصوتية والبصرية. تشير البيانات إلى أن معظم النماذج العربية تركز على النصوص فقط، حيث تمثل النماذج متعددة الوسائط 7% فقط من الإجمالي.
المقارنة مع النماذج العالمية
من حيث القدرات، بينت الدراسة أن النماذج اللغوية العربية تركز على ثلاثة مجالات رئيسية: فهم اللغة، توليد المحتوى، والمحادثة وتنفيذ التعليمات. رغم هذا التقدم، أظهرت نتائج المقارنة مع النماذج العالمية تفوق النماذج العالمية في معظم المهام اللغوية، مع بروز بعض النماذج العربية التي أظهرت نتائج قوية في مهارات مثل التلخيص والفهم القرائي.
خارطة طريق للريادة
وضعت الدراسة خارطة طريق تسعى المملكة من خلالها لتحقيق الريادة في مجال النماذج اللغوية العربية. هذه الخطة تشمل تحسين جودة البيانات العربية، إنشاء نماذج لغوية متعددة القدرات والأحجام، وكذلك تطوير مقاييس مرجعية لتقييم جودة النماذج. كما تسعى الدراسة إلى تعزيز استخدام النماذج المحلية في المؤسسات الحكومية والخاصة وتشجيع تبنيها في المجتمع العربي.
الجهود المشتركة
تعتبر هذه الدراسة جزءًا من التعاون المثمر بين “سدايا” ومجمع الملك سلمان العالمي للغة العربية، الذي يهدف إلى الجمع بين الهوية الثقافية والتطور التقني. تعكس هذه المبادرة التزام المملكة بضمان حضور اللغة العربية في مجال الذكاء الاصطناعي، وتعزيز مكانتها كمركز إقليمي رائد في هذا المجال.


















