بقلم:Mehul Gupta
Jan 5, 2025
ما هي النماذج المفاهيمية الضخمة (LCMs)، وكيف تختلف عن النماذج اللغوية الضخمة (LLMs)؟
منذ إطلاق ChatGPT في أواخر عام 2022، أصبحنا نعيش في عصر الذكاء الاصطناعي التوليدي، حيث أصبحت النماذج اللغوية الضخمة (LLMs) جزءًا لا يتجزأ من حياتنا اليومية.
لكن في الآونة الأخيرة، ربما لاحظت أن بعض خبراء التكنولوجيا بدأوا يتحدثون عن أن نمو هذه النماذج قد وصل إلى مرحلة من التباطؤ.
وفي هذا السياق، قدمت شركة Meta مفهومًا جديدًا يُعرف باسم النماذج المفاهيمية الضخمة (LCMs)، التي يبدو أنها تمثل الخطوة الكبيرة التالية، وتعتبر بمثابة ترقية جوهرية للنماذج اللغوية الضخمة.
ما هي النماذج المفاهيمية الضخمة؟
النماذج المفاهيمية الضخمة (LCMs) التي طورتها Meta تمثل نهجًا جديدًا تمامًا في معالجة اللغة، حيث تعمل على مستوى أعلى من التجريد مقارنةً بالنماذج اللغوية التقليدية (LLMs).
بدلاً من التعامل مع النصوص كلمةً بكلمة، تعمل هذه النماذج على مستوى “المفاهيم”، وهي تمثيلات شاملة غير مرتبطة بلغة معينة أو شكل محدد، وتُعبر عن أفكار أو أفعال عامة ذات مستوى أعلى.
في إطار هذا المفهوم، تُعرف “المفاهيم” بأنها أفكار مجردة وأساسية. وفي الواقع العملي، يمكن أن يمثل المفهوم جملة كاملة في نص أو عبارة في كلام. هذا يتيح للنموذج التفكير بشكل أعمق وعلى مستوى المعاني الشاملة، بغض النظر عن اللغة أو الشكل المستخدم (سواء كان نصًا، صوتًا، أو صورًا).
كيف تعمل هذه النماذج؟
دعونا نلقي نظرة على مثال:
النماذج اللغوية التقليدية (LLMs): كلمة بكلمة
تخيل أنك تكتب قصة باستخدام نموذج لغوي تقليدي مثل ChatGPT. يعمل النموذج من خلال توقع الكلمة التالية بناءً على الكلمات التي كتبتها سابقًا. مثلًا:
ما كتبته: “جلست القطة على…”
ما يتوقعه النموذج: “الحصير.”
النموذج يعمل وكأنه يكمل الفراغات كلمةً بكلمة. هذه الطريقة فعّالة لكنها تركز على الكلمات بشكل فردي، وقد لا تأخذ الصورة العامة أو المعنى الكامل للجملة في الاعتبار.
النماذج المفاهيمية الضخمة (LCMs): فكرة بفكرة
الآن، تخيل بدلًا من التنبؤ بالكلمة التالية، يقوم النموذج بتوقع الفكرة أو المفهوم التالي. المفهوم هنا يشبه فكرة مكتملة أو جملة بأكملها، وليس مجرد كلمة واحدة. مثلًا:
ما كتبته: “جلست القطة على الحصير. كان يومًا مشمسًا. وفجأة…”
ما يتوقعه النموذج: “صدر صوت عالٍ من المطبخ.”
في هذه الحالة، لا يتوقف النموذج عند تخمين الكلمة التالية فقط، بل يتصور الفكرة الكاملة التي ينبغي أن تأتي بعد ذلك. الأمر يشبه تخطيط الجزء التالي من القصة على شكل أفكار، وليس مجرد كلمات متفرقة.
لماذا يُعد هذا النموذج مذهلًا؟
-
غير معتمد على اللغة:
النموذج لا يهتم إذا كان النص مكتوبًا بالإنجليزية، الفرنسية، أو أي لغة أخرى. فهو يعمل على مستوى المعنى، وليس الكلمات بحد ذاتها. مثلًا:
إدخال باللغة الإنجليزية: “The cat is hungry.”
إدخال باللغة الفرنسية: “Le chat a faim.”
كلا الجملتين تعنيان الشيء نفسه، وبالتالي يعاملهما النموذج كأنهما تعبران عن نفس المفهوم.
النماذج المفاهيمية الضخمة تُعتبر قفزة هائلة في عالم معالجة اللغة، فهي تضيف بُعدًا جديدًا يتيح التفكير بشكل أعمق وأكثر تجريدًا، مما يفتح الباب أمام إمكانيات جديدة تتجاوز حدود النماذج التقليدية.
-
متعدد الوسائط (يدعم النصوص والصوت والصور):
النموذج لا يقتصر على العمل مع النصوص فقط، بل يمكنه أيضًا التعامل مع الصوت والصور. على سبيل المثال:
إذا قلت: “القطة جائعة”، أو أظهرت صورة لقطة تبدو جائعة، سيفهم النموذج المعنى نفسه: “القطة بحاجة إلى طعام.”
-
مثالي للمحتوى الطويل:
عندما تكتب قصة طويلة أو مقالًا، فإن هذا النموذج لا يتوقف عند الكلمات فقط، بل يمكنه تنظيم الأفكار بشكل متسلسل وسلس.
على سبيل المثال: إذا كنت تعمل على كتابة ورقة بحثية، يمكن للنموذج مساعدتك في تنظيم النقاط الرئيسية (الأفكار العامة) ثم توسيعها لتغطية التفاصيل.
-
البنية:
يعتمد النموذج على تصميم متطور يجعله قادرًا على التفكير بمستوى أعلى من التجريد. هذا يعني أنه يستطيع التعامل مع وسائط متعددة مثل النصوص، الأصوات، أو الصور بسهولة، مع الاحتفاظ بقدرة عميقة على فهم المعنى الحقيقي وراء البيانات التي يتعامل معها.
معالجة المدخلات:
عندما يتم إدخال نص، يتم تقسيمه أولًا إلى جمل. بعد ذلك، تُحوَّل كل جملة إلى تمثيل رقمي ثابت الحجم باستخدام مشفر جمل مدرب مسبقًا، مثل SONAR. يتميز SONAR بدعمه لأكثر من 200 لغة، وقابليته للتعامل مع النصوص وحتى المدخلات الصوتية.
هذه التمثيلات الرقمية (أو التضمينات) تُعبر عن المفاهيم الموجودة في النص المُدخل.
النموذج المفاهيمي الضخم (LCM):
يأخذ النموذج المفاهيمي الضخم (LCM) تسلسل التضمينات المفاهيمية ويعمل على التنبؤ بالمفهوم التالي في هذا التسلسل. يتم تدريب النموذج على التنبؤ بجمل جديدة بشكل تلقائي داخل ما يُعرف بـ “مساحة التضمينات”.
المخرجات التي يُنتجها النموذج هي سلسلة من التضمينات المفاهيمية، والتي يمكن تحويلها مرة أخرى إلى نصوص أو أصوات باستخدام نظام فك الترميز الخاص بـ SONAR.
إنتاج المخرجات:
بعد الحصول على التضمينات المفاهيمية، يتم تحويلها إلى نصوص أو أصوات لتكون هي النتيجة النهائية. وبما أن LCM يعمل على مستوى المفاهيم بدلاً من الكلمات، يمكنه تطبيق نفس المنهجية على لغات أو وسائط متعددة دون الحاجة لإعادة التدريب.
ميزة قوية أخرى هي أن النموذج يدعم “التعميم الصفري”، مما يعني أنه يمكن استخدامه مع لغات أو وسائط لم يتم تدريبه عليها سابقًا، بشرط أن يكون مشفر ومفكك SONAR يدعمانها.
نقاط رئيسية لفهم النموذج:
مساحة تضمينات SONAR:
- SONAR هو نظام متعدد اللغات والوسائط يُحوِّل الجمل إلى تمثيلات رقمية ثابتة الحجم، مما يجعله يدعم 200 لغة نصية و76 لغة صوتية.
- هذه التمثيلات الرقمية تلتقط المعنى العام للجمل، مما يجعلها مثالية لفهم المفاهيم والاستدلال على مستوى عالٍ.
توليد المفاهيم باستخدام النماذج الانتشارية والتكميم:
- استكشفت شركة Meta عدة طرق لتدريب النموذج المفاهيمي الضخم (LCM)، بما في ذلك استخدام النماذج الانتشارية (Diffusion Models)، حيث يتعلم النموذج التنبؤ بالمفهوم التالي عبر توزيع احتمالي شرطي في مساحة التضمينات.
- هناك طريقة أخرى تتضمن تكميم تمثيلات SONAR إلى وحدات صغيرة يمكن للنموذج التنبؤ بها. هذا النهج يُمكِّن النموذج من تحقيق تحكم أكبر في إنتاج المفاهيم، بطريقة تشبه كيفية اختيار النماذج اللغوية الضخمة للكلمات من القاموس.
الفرق بين LCM و LLMs:
مستوى التجريد:
- النماذج اللغوية الضخمة (LLMs): تعمل على مستوى الكلمات أو الرموز، حيث تتنبأ بالكلمة التالية أو جزء الكلمة في النص.
- النماذج المفاهيمية الضخمة (LCMs): تعمل على مستوى المفاهيم، حيث تتنبأ بالجملة التالية أو الفكرة الكاملة التي يجب أن تأتي بعد ذلك.
هذه المقارنة تُظهر أن LCM يمثل قفزة نوعية في طريقة معالجة النصوص والصوتيات، مما يجعلها أكثر قدرة على التفكير على مستوى الأفكار الشاملة بدلاً من الكلمات الفردية.
2. تمثيل المدخلات
- النماذج اللغوية الضخمة (LLM): تتعامل مع النصوص عن طريق معالجة الكلمات أو أجزاء الكلمات بشكل فردي وبلغة محددة.
- النماذج المفاهيمية الضخمة (LCM): تعتمد على معالجة تضمينات الجمل (المفاهيم)، وهي تمثيلات غير مرتبطة بلغة أو نمط معين.
3. إنتاج المخرجات
- LLM: تولد النصوص كلمةً بكلمة، مع التركيز على الترابط المحلي بين الكلمات.
- LCM: تنتج النصوص جملةً بجملة، مما يتيح لها التركيز على الترابط العام والتفكير على مستوى الأفكار الشاملة.
4. دعم اللغات والأنماط
- LLM: عادةً تُدرب على لغات أو وسائط محددة (مثل النصوص فقط)، مع إمكانية دعم عدة وسائط في بعض النماذج متعددة الأنماط.
- LCM: صُممت لدعم لغات وأنماط متعددة (مثل النصوص، الصوت، الصور) من خلال الاعتماد على فضاء مفاهيمي مشترك.
5. هدف التدريب
- LLM: تُدرب على تقليل خطأ التنبؤ بالكلمات باستخدام أساليب مثل فقدان الانتروبيا المتقاطعة.
- LCM: تُدرب على تقليل خطأ التنبؤ بالمفاهيم من خلال تقنيات مثل تقليل الخطأ التربيعي في فضاء التضمينات.
6. التفكير والتخطيط
- LLM: تتعلم التفكير الهرمي بشكل غير مباشر، لكنها تعمل على المستوى المحلي بمعالجة كل كلمة على حدة.
- LCM: تعتمد بشكل واضح على التفكير الهرمي وتخطط على مستوى الأفكار أو الجمل بدلاً من الكلمات المفردة.
7. التعميم الصفري
- LLM: تواجه صعوبات في تنفيذ مهام لم تُدرب عليها مسبقًا في لغات أو وسائط جديدة.
- LCM: تتفوق في التعميم الصفري بفضل تصميمها القائم على المفاهيم، مما يتيح لها التعامل مع لغات ووسائط جديدة دون تدريب إضافي.
8. الكفاءة مع السياقات الطويلة
- LLM: تُظهر ضعفًا مع النصوص الطويلة بسبب التعقيد المرتفع لآليات الانتباه.
- LCM: أكثر كفاءة مع النصوص الطويلة لأنها تعمل على تسلسلات تضمينات الجمل، والتي تكون أقصر وأبسط من تسلسلات الكلمات.
9. التطبيقات
- LLM: الأفضل للمهام القائمة على الكلمات مثل إكمال النصوص، الترجمة، والإجابة على الأسئلة.
- LCM: مثالية للمهام التي تعتمد على الأفكار والجمل مثل التلخيص، كتابة القصص، والتفكير متعدد الوسائط.
10. المرونة
- LLM: تقتصر عادةً على النصوص وتتطلب إعادة تدريب عند التعامل مع لغات أو وسائط جديدة.
- LCM: مرنة للغاية وقادرة على العمل عبر لغات ووسائط متعددة دون الحاجة لإعادة تدريب، بفضل اعتمادها على فضاء المفاهيم.
تمثل النماذج المفاهيمية الضخمة (LCMs) التي طورتها Meta خطوة كبيرة إلى الأمام في مجال معالجة اللغة. من خلال العمل على مستوى المفاهيم بدلاً من الكلمات، تقدم LCMs نهجًا أكثر تجريدًا ومرونة واستقلالًا عن اللغة، مع دعم متعدد الأنماط.
بينما تُظهر النماذج اللغوية الضخمة (LLMs) براعة في المهام التي تعتمد على الكلمات، فإن النماذج المفاهيمية الضخمة (LCMs) تبرز في التطبيقات الأكثر تعقيدًا مثل التلخيص، توليد القصص، وفهم البيانات المتعددة الوسائط.
مستقبل الذكاء الاصطناعي لا يتعلق فقط بالتنبؤ بالكلمة التالية، بل بفهم الفكرة التالية.
المصدر: medium