سرايا بوست / من سوريا «مجيب» بوتات دردشة ذكية تفهم لغة المتنبي
سرايا بوست / من سوريا «مجيب» بوتات دردشة ذكية تفهم لغة المتنبي

يستمر الذكاء الاصطناعي بدخول قطاعات جديدة كل يوم، فنكاد لا نجد شركة أو تجارة لا توظّف الذكاء الاصطناعي في أحد عملياتها. ويبدو أن المنطقة العربية بدأت باللحاق بالركب، إذ تشهد تزايدًا في أعداد رواد الأعمال الذين يطوّرون أدوات ذكاء اصطناعي تخدم احتياجات المنطقة.

من أحدث الأمثلة على ذلك منصة «مجيب» التي طوّرت في سورية وأطلقتها مجموعة من رواد الأعمال بالاعتماد على تقنيات الذكاء الاصطناعي ومعالجة اللغات الطبيعية - تحديدًا اللغة العربية-  لتتيح للمستخدم إمكانية تطوير «بوتات دردشة» وتطويرها بهدف خدمة الزبائن. بدأت المنصة بتقديم خدماتها في بداية العام الجاري، ويتألف فريق «مجيب» من ثلاثة مهندسي معلوماتية متخصصين بالذكاء الاصطناعي: إياد الشامي، وأغيد القباني، وزينة خليلي، كان لكل منهم تجربته في هذا المجال، والتي تعمقت من خلال عملهم في عدة شركات تطور حلولًا تعتمد على الذكاء الاصطناعي.

الذكاء الاصطناعي واللغة العربية

ولدت فكرة منصة مجيب من رحم الصعوبات التي واجهها الفريق عند العمل في مشاريع معالجة اللغات الطبيعية، إذ اصطدم بقلّة البحث والتطوير في تقنيات تعلم الآلة التي تدعم اللغة العربية، فانطلق إلى العمل والبحث عن مشروع لدعم اللغة العربية إلى أن وصل إلى فكرة مجيب.

يعتمد مبدأ عمل نظم الذكاء الاصطناعي على تدريبها كي تؤدي المهمات المطلوبة حتى تتقنها، بدلًا من أن تكون القواعد والمهمات مبرمجة مسبقًا فيها. وشرح الشامي أحد أعضاء الفريق أن أبرز المعوقات كانت نابعة من طبيعة عمل خوارزميات الذكاء الاصطناعي المستخدمة، إذ أنها تحتاج إلى كمٍّ كبير من البيانات أثناء عملية تدريب النظام الذكي للوصول إلى درجة من الدقة تتيح استخدامه عمليًا على نطاق واسع. إلا أن قلة المحتوى العربي نسبيًا على شبكة الإنترنت (لا يتجاوز 0.8% من المحتوى المتوفر حاليًا) وانحصار هذا المحتوى بالمنتديات والمواقع الإخبارية تقريبًا، صعّب المهمة وأدى إلى تأخرها. ولهذا يستمر الفريق بعمليات جمع البيانات دوريًا، لزيادة دقة النموذج.

معالجة اللغات الطبيعية  بالعربية

اللغات الطبيعية مصطلح يطلق على اللغات البشرية كالعربية والإنجليزية، وكلمة «طبيعية» تدل على التطور الطبيعي غير الخاضع للتخطيط، إذ تشكلت ألفاظها وصوتياتها وتطورت عبر مئات السنين دون دراسة مسبقة لمسار تطور تلك الكلمات والقواعد.مصدر الصورة: مجيبمصدر الصورة: مجيب

ويُقصد بمعالجة اللغات الطبيعية استخدام الحواسيب والتقنية لفهم اللغة، ولها منهجان أساسيان هما المنهج القواعدي والمنهج الإحصائي. يعتمد المنهج القواعدي على وضع قواعد من قبل متخصصين لغويين، لتشكل تمثيلًا للغة المراد فهمها، لكنها عملية صعبة جدًا ولا تتطلب استخدام الذكاء الاصطناعي، بل تعتمد على الأسلوب التقليدي للبرمجة الذي يحاول أن يحصر جميع الحالات الممكنة. إلا أنها استبدلت اليوم بالأسلوب الإحصائي، وأبرز مثال على ذلك خدمة الترجمة من جوجل.فريق مجيب المصدر: مجيبفريق مجيب
المصدر: مجيب

وأوضح الشامي لمرصد المستقبل أن النموذج الإحصائي، وهو النموذج المتبع في مجيب، يحتاج كمًا كبيرًا من البيانات التي تقدم للحاسوب لتحليلها واستخراج القوانين التي تمثل اللغة منها، دون الحاجة لخبراء لغة ولسانيات. وأثبت هذا النموذج قدرته وكفاءته في مهمات معقدة كالترجمة وتصنيف الكلام وغيرها.

وعند التعامل مع النماذج الإحصائية يجب الانتباه إلى البيانات المُستخدمة، فمثلاً،  عند استخدام بيانات مأخوذة من النشرات الإخبارية والمنتديات، قد يتولد لدى النموذج نوع من التحيز غير المقصود نتيجة مصدر البيانات وطريقة صياغتها. فإذا ترافق ذكر بعض المهن مع كلمات مثل رجل أو ذَكر فإن النموذج قد يربط فورًا بين هذه المهن وبين الذكورة. ويشرح الشامي ذلك قائلًا «لتبسيط الأمر أكثر لنتخيل أن لدينا طفل صغير، يمثّل في حالتنا النموذج المراد تدريبه ليصبح قادرًا على فهم اللغة العربية، ويبدأ هذا الطفل بقراءة روايات أُعدت بدقة بحيث تربط بين مهنة الطب وكون ممارسيها من الرجال حصرًا. وبتكرار قراءة الطفل لهذه المعلومات يتكون لديه فهم زائف بأن الأطباء لا يكونون إلا من الرجال فقط، وهذا استنتاج خاطئ فعليًا، إلا أن المعطيات المتوفرة قادت إليه. والأمثلة كثيرة ومتنوعة على هذا النوع من التحيّز، ويساهم عدم تنوع المعطيات في تكوينها. وكان تنويع البيانات أحد أهم العوائق لدينا في ظل شح المحتوى العربي على شبكة الانترنت وقلة المدونات العربية ذات المحتوى المتنوع.»

ويضيف الشامي أننا نشهد حاليا ازديادًا  في نسبة الأبحاث التي تستهدف تحسين تقنيات فهم اللغة العربية ومعالجتها، وهذه المنافسة تنعكس إيجابيًا وتصب في مصلحة دعم اللغة العربية والبحث العلمي.

فهم آلي كامل للغة العربية

يهدف مجيب حسبما شرح الفريق إلى توفير دعم للغة العربية ليكون لدى المستخدم العربي إمكانية استخدام أدوات تقنية حديثة وتطويرها باللغة العربية لتتوفر كخيار طبيعي عوضًا عن اضطراره إلى استخدام الإنجليزية حصرًا بسبب غياب دعم اللغة العربية . ويسعى الفريق في المرحلة المقبلة إلى إحداث نقلة نوعية في خدمة الزبائن في المنطقة العربية بهدف تعزيز أرباح الشركات وزيادة رضا الزبائن عن طريق الخدمات التي يقدمونها.

وقال الشامي «على الرغم من أن طريقنا نحو هدف توفير فهم كامل للغة العربية ما زال طويلًا، إلا أن استخدامنا لقدرات معالجة أعلى سيسرع من تحقيقنا له، فضلًا عن أن زيادة عدد زبائننا سيساعدنا في تحسين خدماتنا ويتيح لنا التركيز على تطوير ما وصلنا إليه حتى الآن.»

الجدير بالذكر أن شركة مجيب الناشئة فازت بالمركز الأول ضمن مسابقة جسور الثالثة لريادة الأعمال التي جرت في بيروت في شهر أبريل/نيسان 2017، وأكثر بوتات الدردشة استخدامًا على المنصة هو «ترجملي» الذي يوفر خدمة ترجمة بين اللغتين العربية والألمانية، وبوت الدردشة «مرجع »الذي يخدم عدة آلاف من المستخدمين اسبوعيًا، بالإضافة إلى «مجيب بوت» الذي يعرف بالشركة وخدماتها.

المصدر : مرصد المستقبل

المصدر : مرصد المستقبل