أخر الاخبار

هل تواجه البيانات - شريان الحياة للذكاء الاصطناعي - ندرة حرجة؟

 يعتمد الذكاء الاصطناعي بشكل كبير على البيانات الوفيرة التي ينتجها الإنسان، ولكن هذا المورد محدود. يحتاج الذكاء الاصطناعي إلى التغلب على ندرة البيانات - الناجمة عن قوانين الخصوصية أو ببساطة البيانات ذات التنسيق السيئ أو التي لا يمكن الوصول إليها - مع استخدام البيانات الاصطناعية كأحد الخيارات.


كان الذكاء الاصطناعي (AI) يحدق في ندرة البيانات منذ فترة، وهناك سبب وجيه للاعتقاد بأن هذا قد يعيق تقدم الذكاء الاصطناعي.

كانت عوامل مختلفة، مثل المخاوف القانونية والخصوصية، وجودة البيانات، وتكاليف الاقتناء، والتوافق، مسؤولة عن بدء نضوب البيانات المتاحة لنماذج تدريب الذكاء الاصطناعي.


البيانات هي العملة الجديدة، لكنها قد تكون هزيلة في بعض المناطق. يمكن أن يساعد الذكاء الاصطناعي في التشخيص الطبي، لكن استخداماته تصبح محدودة إذا تم حفظ المعلومات حول الأمراض النادرة في السجلات الطبية الخاصة.

وبالمثل، في عالم المال، إذا لم يتمكن الذكاء الاصطناعي من الوصول إلى أحدث المعلومات المالية، فسيتم إعاقة النماذج التنبؤية .


البيانات مغلقة خلف قوانين الخصوصية

وفي الوقت نفسه، تعمل الحكومات على سن قوانين أكثر صرامة لمنع الحصول غير المشروع على البيانات وإساءة استخدامها، مع كون اللائحة العامة لحماية البيانات ( GDPR ) في الاتحاد الأوروبي واحدة من أبرز الأمثلة.


واجه الذكاء الاصطناعي، وخاصة ChatGPT ، مقاومة كبيرة في الاتحاد الأوروبي. اتخذت إيطاليا موقفًا قويًا، واتهمت OpenAI بانتهاك قواعد الخصوصية حول هيئة حماية البيانات الإيطالية (GPDP) وفرضت إجراءات تصحيحية، مما حد من أنشطة OpenAI في البلاد.

في حين أن دول الاتحاد الأوروبي الأخرى ليست صارمة بنفس القدر، فقد بدأت إسبانيا وألمانيا وفرنسا تحقيقات في OpenAI، مما يشير إلى وجود قيود محتملة على جمع البيانات.

واضطرت الشركات إلى البحث عن مصادر بيانات أخرى ولكنها تخاطر بالحصول على بيانات ذات نوعية رديئة.

لقد شكلت جودة البيانات تحديًا مستمرًا للتعلم الآلي (ML) على وجه الخصوص.

البيانات ذات التصنيف السيئ، والتحيز في البيانات ، والتنسيق غير المتسق، والمعلومات الزائدة عن الحاجة، تعيق عمليات تعلم الآلة، مما يؤدي إلى مخرجات دون المستوى. إن الاستثمار المطلوب لمعالجة مثل هذه البيانات كبير، مما يشكل تحديات أمام المؤسسات.

في مواجهة حقيقة ندرة البيانات، يجب على الذكاء الاصطناعي أن يرسم مسارًا للأمام. فيما يلي الاستراتيجيات الرئيسية:

التعاون مع الهيئات التنظيمية : يجب على شركات الذكاء الاصطناعي أن تتماشى مع الهيئات التنظيمية لضمان جمع البيانات المسؤولة والقانونية. الشفافية والالتزام بخصوصية البيانات أمر بالغ الأهمية.

سياسات واضحة لجمع البيانات : يعد وضع سياسات واضحة ومتسقة لجمع البيانات على غرار اللوائح الحالية، مثل اللائحة العامة لحماية البيانات، أمرًا بالغ الأهمية. تعد إعلانات نوع البيانات والاستخدام المقصود والشفافية في عملية التجميع مكونات أساسية.

الذكاء الاصطناعي التوليدي كحل : في التغلب على ندرة البيانات، يظهر الذكاء الاصطناعي التوليدي كحل قابل للتطبيق. من خلال إنشاء مجموعات بيانات فريدة تعتمد على المدخلات النصية والصورية والصوتية والفيديو، يمكن للذكاء الاصطناعي التوليدي توفير بيانات عالية الجودة لتدريب تطبيقات تعلم الآلة. ويقلل هذا النهج من المخاوف القانونية والأخلاقية، على الرغم من ضرورة التقييم المستمر لقدراته.

إذا كانت بيانات العالم الحقيقي محدودة ويصعب الحصول عليها - سواء كان ذلك بسبب التنسيق السيئ، أو الثغرات في البيانات، أو قواعد حماية البيانات في مختلف البلدان التي تمنع استيعاب البيانات بسبب مخاوف الخصوصية - فقد يكون الذكاء الاصطناعي المولد أحد العلاجات.

بحلول عام 2024، تتوقع مؤسسة جارتنر أن 60% من بيانات الذكاء الاصطناعي ستكون اصطناعية، مقارنة بـ 1% في عام 2021 .

يقترح جارتنر أن "تخفيف عبء الحصول على بيانات العالم الحقيقي [يسمح] بتدريب نماذج التعلم الآلي بشكل فعال".

اقرا ايضا:ماذا تعني نماذج Microsoft Phi-2 واللغات الصغيرة بالنسبة للذكاء الاصطناعي التوليدي من هنا

الخاتمه

يتطلب التنقل في المشهد المعقد للأطر التنظيمية جهودًا متضافرة من شركات الذكاء الاصطناعي.


على الرغم من أن الامتثال يمثل تحديًا، إلا أن الذكاء الاصطناعي التوليدي يقدم وسيلة واعدة لمعالجة ندرة البيانات وضمان التقدم المستمر لتكنولوجيا الذكاء الاصطناعي.


ومن خلال تحسين قدرات الذكاء الاصطناعي التوليدي وتعزيزها، يمكن للشركات إنشاء بيانات عالية الجودة بشكل مستقل، مما يوفر مسارًا للأمام يقلل من التدقيق ويزيد التقدم إلى الحد الأقصى.

تعليقات



    حجم الخط
    +
    16
    -
    تباعد السطور
    +
    2
    -