بقلم : Amanda Caswell
Feb 26, 2025
القدرة على إجراء أبحاث معمقة وتنفيذها بشكل مميز هي إحدى الصفات التي تميز أفضل روبوتات الدردشة عن بعضها البعض. حتى يوم أمس (25 فبراير)، كان نموذج “Deep Research” من ChatGPT – الذي تم تحسينه لتحليل البيانات وتصفح الويب – متاحًا فقط للمستخدمين الذين يدفعون 200 دولار شهريًا لاشتراك ChatGPT Pro. لكن الآن، أصبح بإمكان مستخدمي ChatGPT Plus الاستفادة من هذا النموذج مقابل 20 دولارًا شهريًا، وهو نفس السعر الذي يدفعه مستخدمو Grok لاستخدام نموذج الأبحاث العميقة Grok-3 من xAI.
لم أستطع إلا أن أتساءل إذا كانت هذان النموذجان يتشابهان في أكثر من مجرد السعر. باستخدام خمسة أوامر تركز على المنطق وتحليل البيانات، قررت اختبار الروبوتين بشكل مباشر. وبينما تولد كل منهما استجابات لأبحاث معمقة أسرع بكثير من النماذج الأخرى التي جربتها، كان هناك فائز واضح. إليكم ما حدث عندما قمت بمقارنة الروبوتات.
1. التحليل التاريخي
الأمر: “ما هي العوامل الرئيسية التي منعت الأزمة المالية لعام 2008 من التحول إلى الكساد العظيم الثاني، وكيف كان التاريخ سيتطور بشكل مختلف لو لم تحدث تلك التدخلات؟”
يختبر هذا الأمر قدرات كل من الروبوتات بطرق متعددة، مثل عمق التحليل الاقتصادي، دقة المعلومات التاريخية، والقدرة على بناء سيناريوهات بديلة.
استجابة ChatGPT كانت أكثر شمولًا بشكل كبير، حيث قدم تحليلًا منظمًا للسياسة النقدية، التحفيز المالي، التدخلات في القطاع المالي، التنسيق العالمي، والمقارنات مع الكساد العظيم.
أما Grok-3 فقد قدم إجابة مختصرة وجذابة يسهل فهمها للجمهور العام. كما حدد بشكل دقيق السياسة النقدية، التحفيز المالي، والتنسيق العالمي كعوامل حاسمة. ومع ذلك، على الرغم من أنه تناول التدخلات الرئيسية، إلا أن Grok-3 كان أقل عمقًا في تحليله مقارنة بـ ChatGPT.
الفائز: ChatGPT يفوز بفضل تحليله الأكثر تفصيلًا وتنظيمًا، مما يجعله الخيار الأفضل في مقارنة الأبحاث المعمقة.
2. الذكاء الاصطناعي المتقدم والأخلاقيات
الأمر: “كيف تؤثر التقدمات الحالية في التعلم المعزز، مثل AlphaZero من DeepMind والإنجازات الأخيرة لـ OpenAI، على النقاش حول توافق الذكاء الاصطناعي والسلامة؟”
يختبر هذا الأمر مدى معرفة الروبوتات بأحدث الأبحاث في مجال الذكاء الاصطناعي وقدرتها على معالجة القضايا التقنية والأخلاقية المعقدة.
استجاب ChatGPT بتفصيل دقيق حول تطورات التعلم المعزز، وقدم أمثلة واقعية. كما استعرض التعلم المعزز العكسي وأثار القلق بشأن ضرورة وجود إشراف قابل للتوسع. كما أشار إلى منشورات DeepMind وأبحاث OpenAI في هذا المجال، مما أضاف مصداقية للإجابة.
أما Grok-3 فقد قدم لمحة عامة عن التعلم المعزز والقدرات الذكاء الاصطناعي ومخاوف السلامة، وركّز على الأخلاقيات وعلم الاجتماع وعلم النفس، مع الإشارة إلى التحيز الثقافي في توافق الذكاء الاصطناعي.
الفائز: ChatGPT يفوز بفضل تحليله العميق والدقيق تقنيًا، مع مناقشة شاملة لسلامة الذكاء الاصطناعي.
3. العلوم متعددة التخصصات
الأمر: “ما هي أحدث الاكتشافات في بيولوجيا الكم، وكيف يمكن أن تغير مجالات مثل الطب والحوسبة في العقد المقبل؟”
هذا السؤال يختبر معرفة الروبوتات في عدة مجالات مثل الفيزياء، البيولوجيا، الطب، والحوسبة، وقدرتها على تفسير الأبحاث الجديدة.
غطى ChatGPT ثلاث مجالات رئيسية في بيولوجيا الكم، بالإضافة إلى تقديم سياق تاريخي وأحدث الأبحاث مع استشهادات من مقالات علمية ومؤسسات. كما شرح كيف يساعد التماسك الكمومي في تحسين كفاءة عملية التمثيل الضوئي إلى 95%، وناقش تأثير النفاذ الكمومي في التفاعلات الإنزيمية. كان ChatGPT شاملاً للغاية، وأكثر تفصيلاً من Grok.
أما Grok-3 فقد قدم نظرة عامة مبسطة حول أحدث الاكتشافات، مع التركيز على النقاط الرئيسية مثل التأثيرات الكمومية في التمثيل الضوئي والنقاط الكمومية في الطب وتطبيقات الحوسبة. كما أشار إلى التطبيقات الواقعية وكيفية استخدامها في مواقف مختلفة.
الفائز: ChatGPT يفوز بفضل تحليله الأعمق والأكثر تفصيلاً لاكتشافات بيولوجيا الكم وآثارها في الطب والحوسبة.
4. السياسات الاقتصادية والجغرافيا السياسية
الأمر: “ما هي السياسات الاقتصادية الأكثر فعالية لإدارة التضخم المرتفع مع الحفاظ على النمو الاقتصادي، وكيف يتعامل كل نموذج (مثل الكينزي والنقدي) مع هذا التحدي؟”
هذا السؤال يختبر فهم الروبوتات للنظريات الاقتصادية الكبرى، فعالية السياسات، وأمثلة من الواقع.
استجاب ChatGPT بتحليل شامل للاستراتيجيات المتعلقة بالطلب والعرض، حيث قدم تحليلاً أعمق للسياسات التضخمية عبر التاريخ والحاضر، مع مقارنة نظرية أقوى، ونقاشات دقيقة حول السياسات النقدية والمالية والعرضية، بالإضافة إلى أدلة تجريبية قوية واستشهادات.
أما Grok-3 فقدّم إجابة سطحية تفتقر إلى العمق التاريخي، ولم يتناول بشكل كافٍ الحالات التضخمية الماضية مما جعل حجته أقل قوة. كانت إجابته عامة جدًا، حيث ذكر أن الكينزيين يفضلون التدخل الحكومي بينما يركز النقديون على التحكم في عرض النقود، دون تقديم سياق تاريخي أو دقة.
الفائز: ChatGPT يفوز بفضل تحليله الأكثر شمولاً وتفصيلاً وتنظيمًا للسؤال حول السياسات الاقتصادية.
5. تغير المناخ والتكيف المستقبلي
الأمر: “ما هي أكثر الحلول الجيولوجية فعالية لمكافحة تغير المناخ، وما هي العواقب غير المقصودة المحتملة لها؟”
هذا السؤال يختبر معرفة الروبوتات بعلم المناخ، وحلول الهندسة، وتقييم المخاطر، والاعتبارات الأخلاقية.
قدّم ChatGPT استجابة أكثر شمولًا وتنظيمًا وعمقًا بشأن حلول الهندسة الجيولوجية مقارنة بـ Grok، حيث قام بتصنيف الحلول إلى نوعين رئيسيين وقدم تفاصيل تقنية أفضل.
أما Grok-3 فقد أخفق في العديد من النقاط، حيث كان تركيزه على DAC (التقاط الهواء المباشر) وإعادة التحريج فقط، متجاهلاً العديد من الحلول الجيولوجية الأخرى. كما كانت إجابته تفتقر إلى السياق العلمي والتاريخي، ولم تذكر أمثلة هامة مثل جبل بيناتوبو أو دراسات جامعة هارفارد أو الأطر التنظيمية.
الفائز: ChatGPT يفوز بفضل تغطيته لجميع الأساليب الكبرى للهندسة الجيولوجية وليس فقط DAC وإعادة التحريج، مع شرح تقني أعمق حول كيفية عمل كل طريقة، بالإضافة إلى سياق تاريخي وعلمي وحوكمة أقوى.
الفائز العام: ChatGPT
في هذه المقارنة، برز ChatGPT كالفائز الواضح، حيث قدّم تحليلاً شاملاً ومنظماً وأكثر عمقاً في معظم الحالات. بينما قدّم Grok إجابات دقيقة وواضحة، إلا أنها كانت غالباً سطحية ولم تغطي الموضوع بعمق كافٍ.
كانت هذه الأسئلة علمية للغاية وربما أكثر تعقيدًا من الأسئلة التي قد يطرحها المستخدم العادي. في الواقع، قمت بإعدادها من خلال الاطلاع على الأخبار والمجلات العلمية، ثم تكوين الأسئلة بناءً على ما قرأت. لكن الهدف من هذه الأسئلة كان إظهار المستوى الذي يمكن أن يصل إليه كل روبوت في استرجاع المعلومات.
في كل سؤال، كان ChatGPT يغوص أعمق، يقدم تحليلات تقنية، ويعتمد على بيانات واقعية، بالإضافة إلى تقديم مناقشات دقيقة مدعومة بالسياق التاريخي والأبحاث العلمية. كما كان يضمن بشكل متكرر دراسات استقصائية ومعلومات ذات صلة لتعزيز إجاباته.
أما Grok فقد أخفق في العمق، النطاق، والتحليل النقدي، مما جعل ChatGPT يتفوق كذكاء اصطناعي في التعامل مع المواضيع المعقدة والمهمة مثل تلك التي تم طرحها هنا. مع توافر إمكانيات الأبحاث العميقة في ChatGPT الآن، فإن ذلك يفتح أمام المزيد من المستخدمين الفرصة للغوص أعمق في أبحاثهم.
المصدر: tomsguide