Skip to content Skip to footer

OpenScholar: الذكاء الاصطناعي مفتوح المصدر الذي يتفوق على GPT-4o في البحث العلمي

بقلم: MichaelFNunez

November 20, 2024

العلماء يعانون من فيض هائل من البيانات. مع نشر ملايين الأوراق البحثية سنويًا، حتى أكثر الخبراء تفانيًا يجدون صعوبة في مواكبة أحدث الاكتشافات في مجالات تخصصهم.
يأتي نظام ذكاء اصطناعي جديد، يُدعى “OpenScholar“، واعدًا بتغيير قواعد اللعبة في كيفية وصول الباحثين إلى الأدبيات العلمية وتقييمها ودمجها. طور هذا النظام بالتعاون بين معهد ألين للذكاء الاصطناعي (Ai2) وجامعة واشنطن، ويجمع “OpenScholar” بين تقنيات استرجاع متقدمة ونموذج لغوي دقيق لتقديم إجابات شاملة ومستندة إلى استشهادات لأسئلة بحثية معقدة.

كتب فريق “OpenScholar” في ورقتهم البحثية: “التقدم العلمي يعتمد على قدرة الباحثين على استيعاب الكم المتزايد من الأدبيات”. لكن هذه القدرة أصبحت محدودة بسبب الكم الهائل من المعلومات المتاحة. وهم يرون أن “OpenScholar” يمثل خطوة إلى الأمام، ليس فقط في مساعدة الباحثين على التعامل مع الكم الهائل من الأوراق البحثية، بل أيضًا في تحدي هيمنة أنظمة الذكاء الاصطناعي المملوكة مثل GPT-4o من OpenAI.

كيف يعالج “OpenScholar” في ثوانٍ 45 مليون ورقة بحثية ؟

يعتمد “OpenScholar” على نموذج لغوي معزز بتقنيات استرجاع البيانات، متصل بقاعدة بيانات تضم أكثر من 45 مليون ورقة بحثية مفتوحة الوصول. عندما يطرح الباحث سؤالًا، لا يقتصر النظام على توليد إجابة من معلومات مسبقة، كما تفعل نماذج مثل GPT-4o. بدلًا من ذلك، يقوم باسترجاع الأوراق البحثية ذات الصلة، ودمج نتائجها، وتقديم إجابة تستند إلى هذه المصادر.

هذه القدرة على البقاء “مرتبطًا” بالأدبيات الحقيقية هي ما تُميز “OpenScholar”. في اختبارات أجريت باستخدام معيار جديد يُسمى “ScholarQABench”، صُمم خصيصًا لتقييم أنظمة الذكاء الاصطناعي في الإجابة على أسئلة علمية مفتوحة، تفوق “OpenScholar” بشكل ملحوظ. أظهر النظام أداءً متميزًا من حيث دقة المعلومات وصحة الاستشهادات، متفوقًا حتى على نماذج عملاقة مثل GPT-4o.

واحدة من النتائج الصادمة كانت ميل GPT-4o إلى اختلاق استشهادات — أو ما يُعرف بـ”الهلوسات” في عالم الذكاء الاصطناعي. عند الإجابة على أسئلة في مجال الطب الحيوي، استشهد GPT-4o بأوراق بحثية غير موجودة في أكثر من 90% من الحالات. في المقابل، حافظ “OpenScholar” على ارتباطه بمصادر موثوقة وقابلة للتحقق.

يعتمد النظام على ما يسميه الباحثون “حلقة استدلال ذات تغذية راجعة”، حيث يقوم بتحسين إجاباته بشكل متكرر من خلال التغذية الراجعة اللغوية، مما يعزز جودة الإجابات ويُضيف معلومات تكميلية بشكل ديناميكي.

تأثيرات كبيرة على الباحثين وصناع القرار

يمكن أن يصبح “OpenScholar” أداة لا غنى عنها لتسريع الاكتشافات العلمية، مما يمكن الباحثين من استيعاب المعرفة بشكل أسرع وبثقة أكبر.

هل يمكن للذكاء الاصطناعي مفتوح المصدر أن يُنافس الشركات العملاقة؟

يأتي إطلاق “OpenScholar” في وقت يشهد توترًا متزايدًا في عالم الذكاء الاصطناعي بين الأنظمة المغلقة المملوكة للشركات الكبرى وبدائل مفتوحة المصدر مثل “Llama” من Meta. نماذج مثل GPT-4o من OpenAI و”Claude” من Anthropic تقدم إمكانات مذهلة، لكنها باهظة الثمن وغير شفافة، وغالبًا ما تكون بعيدة عن متناول العديد من الباحثين.  يعكس “OpenScholar” هذا النموذج من خلال كونه نظامًا مفتوح المصدر بالكامل.

لم يكتفِ فريق “OpenScholar” بإطلاق كود النموذج اللغوي، بل شاركوا أيضًا خط أنابيب الاسترجاع بالكامل، ونموذجًا متخصصًا بحجم 8 مليارات معامل مُحسّن للمهام العلمية، وقاعدة بيانات للأوراق البحثية. كتب الباحثون في منشورهم: “على حد علمنا، هذا هو الإصدار المفتوح الأول لخط أنابيب كامل لمساعد بحثي لغوي — من البيانات إلى وصفات التدريب إلى نقاط فحص النموذج”.

هذه الشفافية ليست مجرد مبدأ أخلاقي؛ بل هي أيضًا ميزة عملية. حجم “OpenScholar” الأصغر وهيكله المبسط يجعله أكثر كفاءة من حيث التكلفة مقارنة بالأنظمة المملوكة. على سبيل المثال، يقدر الباحثون أن تشغيل “OpenScholar-8B” أرخص بمئة مرة من نظام “PaperQA2” المبني على GPT-4o.

هذه الكفاءة التكلفية يمكن أن تفتح الباب أمام مؤسسات صغيرة ومختبرات ذات ميزانيات محدودة وباحثين في الدول النامية للوصول إلى أدوات ذكاء اصطناعي قوية.

الطريقة العلمية في عصر الذكاء الاصطناعي

يثير “OpenScholar” أسئلة مهمة حول دور الذكاء الاصطناعي في البحث العلمي. رغم قدرته المذهلة على دمج الأدبيات العلمية، إلا أنه ليس معصومًا من الأخطاء. في التقييمات التي أجراها خبراء، كانت إجابات “OpenScholar” مُفضلة على تلك المكتوبة بواسطة البشر في 70% من الحالات، لكن الـ30% المتبقية أظهرت نقاط ضعف، مثل عدم الاستشهاد بأوراق بحثية أساسية أو اختيار دراسات أقل أهمية.

هذه القيود تؤكد حقيقة أساسية: أدوات الذكاء الاصطناعي مثل “OpenScholar” مصممة لتعزيز قدرات الباحثين، وليس استبدالها. النظام يهدف إلى تخفيف العبء عن الباحثين من خلال التعامل مع المهام المستهلكة للوقت، مثل مراجعة الأدبيات، مما يسمح لهم بالتركيز على تحليل النتائج وتطوير المعرفة.

قد ينتقد البعض اعتماد “OpenScholar” على الأوراق البحثية مفتوحة الوصول، مما يحد من فائدته في مجالات مثل الأدوية، حيث تكون الكثير من الأبحاث خلف جدران الدفع. كما أن أداء النظام يعتمد بشكل كبير على جودة البيانات المسترجعة، وإذا فشلت خطوة الاسترجاع، فقد تكون النتائج غير مثالية.

لكن رغم هذه التحديات، يمثل “OpenScholar” نقلة نوعية في عالم الحوسبة العلمية. بينما كانت النماذج السابقة مذهلة في إجراء المحادثات، يظهر “OpenScholar” قدرة أكثر عمقًا: فهم ودمج الأدبيات العلمية بدقة قريبة من البشر.

الأرقام تُظهر قصة مقنعة: نموذج “OpenScholar” بحجم 8 مليارات معامل يتفوق على GPT-4o رغم كونه أصغر بكثير. وهو يضاهي الخبراء البشريين في دقة الاستشهادات، بينما تفشل نماذج أخرى في 90% من الحالات. والأهم من ذلك، أن الخبراء يفضلون إجاباته على تلك المكتوبة من قبل باحثين آخرين.

هذه الإنجازات تشير إلى أننا ندخل عصرًا جديدًا من البحث العلمي المدعوم بالذكاء الاصطناعي، حيث قد لا يكون التحدي هو قدرتنا على استيعاب المعرفة الحالية، بل قدرتنا على طرح الأسئلة الصحيحة.

فريق “OpenScholar” أطلق كل شيء — الكود، النماذج، البيانات، والأدوات — واثقين من أن الشفافية ستسرع التقدم أكثر من إبقاء الاكتشافات حبيسة الأبواب المغلقة.

وبهذا، قدموا إجابة على أحد أكثر الأسئلة إلحاحًا في عالم الذكاء الاصطناعي: هل يمكن للحلول مفتوحة المصدر أن تنافس أنظمة الشركات العملاقة المغلقة؟

يبدو أن الإجابة موجودة بوضوح بين 45 مليون ورقة بحثية.

المصدر: venturebeat

Leave a comment

هي شركة رائدة في مجال الابتكار الذكي تهدف إلى تمكين الدول والمؤسسات من تحقيق التحول الرقمي باستخدام تقنيات الذكاء الاصطناعي المتقدمة. منذ تأسيسها، وضعت AI Horizon نصب أعينها هدفًا طموحًا يتمثل في تسهيل وتسريع تبني الذكاء الاصطناعي في مختلف القطاعات، من خلال تقديم حلول متكاملة ومتطورة تشمل البحث، والتعليم، والاستشارات، والتدريب، والحلول الذكية.

اجتماعي
ِAI HORIZON © 2025. All Rights Reserved.