Skip to content Skip to footer

البيانات المملوكة: وقود الذكاء الاصطناعي والذهب الجديد للشركات التقنية

بقلم:Kolawole Samuel Adebayo

Feb 25, 2025

بينما يزداد التنافس على الهيمنة في مجال الذكاء الاصطناعي، بدأت الشركات في التفكير في كيفية الاستفادة من البيانات الخاصة التي تمتلكها للحصول على جزء من “فطيرة” الذكاء الاصطناعي. وعلى الرغم من أن ازدهار الذكاء الاصطناعي كان مدفوعًا بتطور الشرائح، وزيادة حجم النماذج، وتوسع القدرة الحسابية، فإن النماذج الأساسية مثل GPT وGemini وClaude أصبحت الآن أكثر وصولاً وانتشارًا. وقد أدى ذلك إلى قيام شركات الذكاء الاصطناعي — مثل OpenAI وxAI وDeepSeek وAnthropic وGoogle وAli Baba وغيرها — بإطلاق المزيد من النماذج التي تؤدي غالبًا نفس المهام، مع تفوق بعض النماذج على الأخرى في بعض الاختبارات.

ويقول الخبراء الآن إن الميزة التنافسية الحقيقية بدأت تنتقل إلى البيانات الخاصة، مع بعضهم الذين يعتقدون أن الشركات التي تمتلك مجموعات بيانات حصرية وعالية الجودة هي التي ستحدد معايير كيفية تطوير واستخدام الذكاء الاصطناعي في مختلف الصناعات خلال الفترة القادمة.

يرى Boe Hartman، المؤسس المشارك والمدير التنفيذي للتكنولوجيا في Nomi Health، أن هذا التحول يظهر بشكل واضح في عدة قطاعات. وقال في مقابلة له: “مقدمو البيانات هم من لديهم الأفضلية. أما مقدمو النماذج، فهم في سباق نحو القاع – وفي النهاية، سيتم تحويلهم إلى سلع. القيمة الحقيقية تكمن في البيانات التي تجعل هذه النماذج أكثر ذكاءً وفائدة، خاصة مع دخول الذكاء الاصطناعي الوكيل إلى الميدان.”

إنه تصريح قوي يحمل إمكانيات حقيقية لتغيير مستقبل تطوير الذكاء الاصطناعي. لكن هذا الاتجاه الناشئ يأتي أيضًا مع تحديات جديدة: مثل المزيد من القضايا القانونية حول ملكية البيانات، وتشديد قوانين الخصوصية، وزيادة تكاليف الحصول على البيانات.

الميزة التنافسية للبيانات الخاصة 

لطالما كانت البيانات المتاحة علنًا والبيانات الاصطناعية هي الأساس الذي بني عليه تطوير الذكاء الاصطناعي. ولكن كما أوضح Andy Thurai، المحلل الرئيسي ونائب الرئيس في Constellation Research، فإن فائدتها بدأت في الوصول إلى الحد الأقصى. وقال: “لقد استنفدت معظم شركات الذكاء الاصطناعي البيانات المتاحة عبر الإنترنت. الفروقات في البيانات، والحوسبة، والبنية التحتية، والخوارزميات كلها بدأت تتقلص، مما يعني أن النماذج ستجد صعوبة في التميز عن بعضها. مجموعات البيانات المملوكة وعالية الجودة هي الآن الفارق الحقيقي.”

تتيح البيانات الخاصة للشركات تحسين النماذج الذكية باستخدام المعرفة المتخصصة، مما يسمح بإنشاء تطبيقات تتفوق على النماذج العامة المدربة باستخدام بيانات عامة. وهذا الأمر يبرز بشكل خاص في الصناعات المتخصصة. على سبيل المثال، يستفيد مقدمو الرعاية الصحية من سجلات المرضى الخاصة (مع ضمان حماية الخصوصية بالطبع) لتدريب نماذج الذكاء الاصطناعي التي تستطيع تشخيص الأمراض بشكل أسرع وأكثر دقة من النماذج العامة.

لكن، الحصول على وصيانة مجموعات البيانات الحصرية ليس أمرًا سهلاً. كما أشار Tzvi Kopetz، نائب رئيس التسويق في Lusha: “أكبر مشكلة هي التمييز بين الإشارة والضوضاء. الحصول على بيانات قيمة، وليس مجرد بيانات ضوضائية، يتطلب معالجة كميات ضخمة منها، بالإضافة إلى تنقيتها وتنظيمها. كما أن الأمر يتطلب أيضًا الذكاء الاصطناعي الخاص للقيام بذلك.”

تحقيق الربح من البيانات الخاصة: الذهب الجديد

المال هو الملك في عالم الأعمال، أليس كذلك؟ وعالم الذكاء الاصطناعي سريع التطور ليس استثناءً من هذه الحقيقة. في هذا السياق، بدأ بعض الشركات — مثل منصات التواصل الاجتماعي على سبيل المثال — في استخدام المحتوى الذي ينشئه المستخدمون بشكل هادئ لتدريب نماذج الذكاء الاصطناعي، والتي يتم بعد ذلك ترخيصها لشركات أخرى. بينما تستخدم شركات أخرى، مثل الخدمات المالية المدعومة بالذكاء الاصطناعي، البيانات الخاصة بالمعاملات لبناء نماذج تنبؤية تساعد في تحسين استثماراتها.

قال Hartman: “هناك الكثير من الأمور التي تحدث في هذا المجال، ومن الصعب التنبؤ أي النماذج التجارية ستثبت وتستمر.” وأضاف قائلاً: “قرأت تقريرًا يقول إن هناك 28,000 شركة ‘ذكاء اصطناعي’ في العالم — وهو عدد ضخم من المحاولات العشوائية. الوقت سيكشف لنا من سينجح، لكن الشركات التي تمتلك مجموعات بيانات حصرية هي التي ستكون الرابحة في النهاية.”

ويرى Thurai أن هذا التحول أمر لا مفر منه. وقال: “بإضافة بيانات حصرية أو خاصة، ترتفع قيمة النماذج بشكل كبير. خاصة النماذج المدربة باستخدام بيانات متخصصة، مثل تلك في مجالات الرعاية الصحية أو المالية، حيث تضيف هذه البيانات قيمة هائلة.”

تكاليف ملكية البيانات

بينما قد تُعتبر البيانات الخاصة الذهب الجديد في عالم الذكاء الاصطناعي، هناك العديد من التحديات التي تواجه الشركات للوصول إليها. على سبيل المثال، الالتزام بالتنظيمات — التي أصبحت أكثر تشددًا مؤخرًا — والامتثال لمتطلبات الذكاء الاصطناعي الأخلاقي ليس بالأمر السهل. كما أن تكلفة وصيانة مجموعات بيانات نظيفة ومرتبة تشكل عقبة أخرى كبيرة.

أشارت Inna Tokarev Sela، المؤسسة والرئيسة التنفيذية لشركة Illumex، إلى كيف أن التنظيمات بدأت تعيد تشكيل المشهد: “الصراع الحقيقي سيكون حول من يملك البيانات فعلاً — هل هي الشركة التي تجمعها أم الشخص الذي ينشئها؟ ومن يقرر ما هو الاستخدام المناسب لهذه البيانات عندما يتم توليدها باستمرار في جميع أنحاء العالم؟”

القوانين المتعلقة بالخصوصية مثل GDPR وCCPA وHIPAA بدأت بالفعل في إعادة تشكيل كيفية استخدام البيانات، وهناك المزيد من التشريعات في الطريق. وفي نفس الوقت، هناك وعي متزايد بأن تبادل البيانات — عندما يتم بشكل مسؤول — يمكن أن يعود بالنفع على الجميع. في أوروبا، على سبيل المثال، تعمل اتفاقيات تبادل البيانات حسب القطاع، مثل تبادل بيانات الرعاية الصحية، على إيجاد نماذج جديدة لتحقيق التوازن بين الخصوصية والابتكار.

القوة في يد مالكي البيانات

مع تحول توازن القوى نحو مجموعات البيانات المملوكة، والنماذج الذكية التي أصبحت أصغر وأكثر تخصصًا، فإن الشركات التي تمتلك بيانات عالية القيمة في موقع يسمح لها بتحديد كيفية استخدامها ومن يمكنه الوصول إليها. يشير هذا الاتجاه إلى أن مستقبل الذكاء الاصطناعي قد لا يهيمن عليه مطورو النماذج، بل الشركات التي تقدم بيانات عالية الجودة لهذه النماذج.

قال Kopetz: “سيواصل مقدمو النماذج تقديم القيمة للعديد من مقدمي الخدمات، لكنني أرى أن هناك تدرجًا في مقدمي النماذج. تمامًا كما قامت DeepSeek ببناء حل منخفض التكلفة استنادًا إلى نماذج أخرى، سيكون هناك تدرج أيضًا في مقدمي خدمات النماذج.”

وتتفق Sela مع هذا المفهوم، حيث قالت: “ديناميكية القوة تتغير أكثر نحو مالكي البيانات الذين يحددون الشروط لمستهلكي البيانات بدلاً من مطوري النماذج الأساسية الذين يمتلكون القوة. إذا كنت أملك مجموعة بيانات حصرية، وأنت ترغب في استخدام نموذج DeepSeek الجديد باستخدام بياناتي الخاصة، سيكون عليك أن تدفع مقابل هذه الملكية في البيانات، وليس مقدم النموذج.”

تحديد العصر المقبل

يعد عالم الذكاء الاصطناعي سريع التطور، وكل يوم يظهر ابتكار جديد. لذلك سيكون من المثير رؤية كيف ستستفيد الشركات من مجموعات بياناتها المملوكة، وكيف سيؤثر ذلك على طريقة تطوير الذكاء الاصطناعي وبتكاليف أي نوع.

لكن الشيء المؤكد هو أن النجاح في المستقبل لن تحدده الخوارزميات وحدها، بل البيانات التي تغذيها. والشركات التي تستطيع جمع وإدارة وتحقيق الربح من مجموعات البيانات الخاصة ستكون هي التي ستحدد مستقبل الذكاء الاصطناعي — بينما قد تجد الشركات التي تعتمد فقط على البيانات العامة نفسها في منافسة صعبة.

المصدر: forbes

Leave a comment