button icon
صورة الخلفيّة
button icon
بطاقات دُعاء
button icon
رمضان مبارك
button icon
بطاقة الإجابة

هل يمكن لنماذج الذكاء الاصطناعي أن توضح لنا كيفية تعلم الناس؟

ADVERTISEMENT

تعلم لغة ليس بالأمر الصعب، فكل طفل في العالم يتقنه في بضع سنوات. أما فهم آلية عمل هذه العملية، فهو أمرٌ آخر. فقد ابتكر اللغويون نظرياتٍ مُعقدة لتفسيرها، إلا أن التطورات الحديثة في مجال التعلم الآلي أضافت بُعدًا جديدًا. فعندما بدأ علماء الحاسوب في بناء نماذج اللغة التي تُشغّل روبوتات الدردشة الحديثة، مثل ChatGPT، وضعوا عقودًا من البحث في علم اللغة جانبًا، وبدا أن رهانهم قد أتى بثماره. ولكن، هل تتعلم هذه النماذج حقًا؟ الأمر لا يقتصر على مجرد جدل حول التعريفات. فإذا كانت نماذج اللغة تتعلم اللغة بالفعل، فقد يحتاج الباحثون إلى نظريات جديدة لتفسير كيفية قيامها بذلك. أما إذا كانت النماذج تقوم بشيءٍ سطحي، فربما لا يمتلك التعلم الآلي أي رؤى جديدة يُقدمها لعلم اللغة. وقد دافع نعوم تشومسكي، أحد رواد علم اللغة، علنًا عن هذا الرأي.

ADVERTISEMENT
From pexels

الحواجز اللغوية

خلال النصف الأول من القرن العشرين، انشغل معظم اللغويين بفهرسة لغات العالم. ثم، في أواخر خمسينيات القرن الماضي، قاد تشومسكي نهجًا بديلًا. استقى أفكارًا من علوم الحاسوب النظرية والمنطق الرياضي في محاولة طموحة لكشف البنية الكونية الكامنة وراء جميع اللغات. جادل تشومسكي بأن البشر لا بد أن يمتلكوا آلية عقلية فطرية مخصصة خصيصًا لمعالجة اللغة. وهذا من شأنه أن يفسر العديد من الألغاز الكبيرة في علم اللغويات، بما في ذلك ملاحظة أن بعض القواعد النحوية البسيطة لا تظهر أبدًا في أي لغة معروفة. استنتج تشومسكي أنه إذا كان تعلم اللغة يعمل بنفس طريقة أنواع التعلم الأخرى، فلن يُفضّل بعض القواعد النحوية على غيرها. ولكن إذا كانت اللغة مميزة حقًا، فهذا ما تتوقعه تمامًا: أي نظام متخصص لمعالجة اللغة سيُهيئ البشر بالضرورة نحو لغات معينة، مما يجعل تعلم لغات أخرى مستحيلًا. يقول تيم هانتر (يفتح علامة تبويب جديدة)، عالم لغويات في جامعة كاليفورنيا، لوس أنجلوس: "لا معنى للقول إن البشر مُصممون على تعلم أشياء معينة دون القول إنهم مُصممون أيضًا على عدم تعلم أشياء أخرى". سرعان ما أصبح نهج تشومسكي هو التوجه السائد في أبحاث اللغويات النظرية. وظل كذلك لنصف قرن. ثم جاءت ثورة التعلم الآلي.

ADVERTISEMENT

صعود الآلات

تعتمد نماذج اللغة على هياكل رياضية تُسمى الشبكات العصبية، والتي تُعالج البيانات وفقًا للروابط بين الخلايا العصبية المُكونة لها. تُقاس قوة كل رابط برقم يُسمى وزنه. لبناء نموذج لغوي، يختار الباحثون أولًا نوعًا مُحددًا من الشبكات العصبية، ثم يُحددون أوزانًا عشوائية للروابط. ونتيجة لذلك، يُصدر نموذج اللغة هراءً في البداية. ثم يُدرب الباحثون النموذج على التنبؤ، كلمةً تلو الأخرى، بكيفية استمرار الجمل. ويفعلون ذلك عن طريق تغذية النموذج بكميات كبيرة من النصوص. في كل مرة يرى فيها النموذج نصًا، يُخرج تنبؤًا للكلمة التالية، ثم يُقارن هذا الناتج بالنص الفعلي، ويُعدّل الروابط بين الخلايا العصبية لتحسين تنبؤاته. بعد تعديلات طفيفة كافية، يتعلم توليد جمل سلسة بشكل مُذهل.

From pexels

تختلف نماذج اللغة والبشر اختلافًا واضحًا. على سبيل المثال، يجب تدريب النماذج الحديثة على تريليونات الكلمات، أي أكثر بكثير مما يراه أي إنسان في حياته. ومع ذلك، قد تُوفر نماذج اللغة حالة اختبار جديدة لتعلم اللغة - حالة تتجاوز القيود الأخلاقية على التجارب على الأطفال. إن حقيقة أن نماذج اللغة تعمل من الأساس هي دليل على أن شيئًا يُشبه تعلم اللغة يُمكن أن يحدث دون أي من الآليات المتخصصة التي اقترحها تشومسكي. لقد حققت الأنظمة القائمة على الشبكات العصبية نجاحًا باهرًا في العديد من المهام التي لا علاقة لها مطلقًا بمعالجة اللغة، وتتجاهل إجراءات تدريبها كل ما تعلمه اللغويون عن البنية المعقدة للجمل.

ADVERTISEMENT

تزداد الحبكة تعقيدًا

لم تكن جولي كاليني متأكدة تمامًا. كثيرًا ما كانت انتقادات تشومسكي لنماذج اللغة تُطرح في مناقشات غير رسمية بين زملائها الطلاب. ولكن عندما اطّلعت كاليني على الأدبيات، أدركت أنه لم يُنشر أي بحث تجريبي حول اللغات المستحيلة منذ ورقة ميتشل وباورز قبل ثلاث سنوات. وجدت الورقة البحثية شيقة، لكنها رأت أن ادعاء تشومسكي الشامل يتطلب المزيد من الأدلة. كان من المفترض أن ينطبق على جميع نماذج اللغة، لكن ميتشل وباورز اختبرا فقط نوعًا قديمًا من الشبكات العصبية أقل شيوعًا اليوم. بالنسبة لكاليني، كانت المهمة واضحة: اختبار ادعاء تشومسكي باستخدام النماذج الحديثة. التقت كاليني بمشرفها، كريستوفر بوتس، واقترحت دراسة شاملة لاكتساب اللغة المستحيلة في ما يسمى بشبكات المحولات، والتي تُعدّ جوهر نماذج اللغة الرائدة اليوم. في البداية، اعتقدت بوتس أن الأمر يبدو طموحًا للغاية بالنسبة لأول مشروع لكاليني كطالبة دراسات عليا، لكنها أقنعته بأنه يستحق المتابعة. اتفقت كاليني وبوتس على أن تتولى تدريب النماذج. لكن كان عليهما أولًا تحديد نماذج المحولات التي يجب اختبارها واللغات التي يجب دراستها. لذلك، استعانوا بباباديميتريو واثنين من اللغويين الحاسوبيين الآخرين - ريتشارد فوتريل من جامعة كاليفورنيا، إيرفين، وكايل ماهوالد من جامعة تكساس، أوستن. قرر الفريق استخدام شبكات محولات صغيرة نسبيًا مصممة على غرار GPT-2، وهو نموذج سابق لنموذج اللغة الذي يُشغّل ChatGPT عام 2019. تحتاج الشبكات الأصغر إلى بيانات تدريب أقل، لذا فهي أقرب إلى البشر؛ وربما تُشبه البشر أيضًا بتفضيلها اللغات الممكنة على المستحيلة؟ أنشأ الفريق اثنتي عشرة لغة مستحيلة، معظمها يعتمد على إجراءات مختلفة لخلط الكلمات في كل جملة من مجموعة بيانات إنجليزية عادية. في إحدى الحالات المتطرفة كان الخلط عشوائيا، ولكن في جميع الحالات الأخرى، كان يتبع نمطا بسيطا - على سبيل المثال، تقسيم كل جملة إلى مجموعات من ثلاث كلمات متجاورة، وتبديل الكلمة الثانية والثالثة في كل مجموعة.

ADVERTISEMENT
From pexels

هل أُنجزت المهمة؟

تُظهر النتائج أن نماذج اللغة، مثل البشر، تُفضّل تعلّم بعض الأنماط اللغوية على غيرها. تُشبه تفضيلاتها إلى حد ما تفضيلات البشر، لكنها ليست بالضرورة مُتطابقة، ولا يزال من المُحتمل أن تلعب جوانب من نظريات تشومسكي دورًا في كيفية تعلّم البشر. إنّ أدمغة البشر وشبكاتهم العصبية مُعقّدة للغاية لدرجة أن فهم اختلافاتها - خاصةً عندما يتعلق الأمر بمهمة دقيقة كتعلّم اللغة - قد يبدو مُستحيلًا. عنوان البحث "المهمة: نماذج اللغة المستحيلة" مُناسب لأكثر من سبب.

toTop