دراسة: محركات البحث تهدد الذكاء الاصطناعي

علي محمد
محركات البحث تشكل تهديدًا على معلومات الذكاء الاصطناعي

أثارت دراسة جديدة أجرتها جامعة برمنجهام قلقاً بالغاً بشأن مستقبل الذكاء الاصطناعي، حيث كشفت عن أن محركات البحث التي تعتمد عليها الأنظمة في تدريبها قد تكون مصدرًا رئيسيًا لنشر المعلومات المضللة والتحيزات الاجتماعية.

وأكد الباحثون أن نماذج اللغة الكبيرة مثل ChatGPT، التي تعتمد على كميات هائلة من البيانات النصية لتعلم كيفية إنتاج نصوص شبيهة بالنصوص البشرية، تميل إلى تكرار التحيزات الموجودة في تلك البيانات. فإذا كانت البيانات التدريبية تحتوي على معلومات خاطئة أو متحيزة، فإن النموذج الناتج سيُظهر نفس التحيزات.

الذكاء الاصطناعي يعكس انحيازات بياناته

أشارت الدراسة إلى أن نقص التنوع اللغوي في قواعد البيانات التدريبية هو أحد الأسباب الرئيسية لظهور التحيزات في النماذج اللغوية. فعندما يتم تدريب النموذج على بيانات من لغة واحدة أو مجموعة ثقافية محددة، فإنه قد يفشل في فهم أو توليد نصوص تتعلق بلغات أو ثقافات أخرى، بحسب صحفية “ديلي ميل” اليوم الثلاثاء 14 يناير 2025.

كما يجب مراجعة البيانات المستخدمة في التدريب بعناية لإزالة أو تعديل المحتوى الذي يحتوي على معلومات مضللة أو تحيزات اجتماعية، ويقول الباحثون إن هذه الخطوة أساسية لضمان أن النماذج لا تتعلم أو تكرر الأنماط السلبية.

ويقول المؤلف الرئيسي للدراسة، جاك جريف، إن الذكاء الاصطناعي قد يميل إلى إنتاج تصورات سلبية عن بعض الأعراق أو الأجناس بسبب البيانات التي يُدرَّب عليها، والتي قد تحتوي على أفكار ضارة أو غير دقيقة أو عنصرية أو معلومات مضللة.

وأضاف أن تدريب نماذج اللغة على مجموعات بيانات متنوعة تعكس التنوع اللغوي، يمكن أن يعزز القيمة المجتمعية لهذه الأنظمة.

وأوصت الدراسة بزيادة التنوع الاجتماعي واللغوي في بيانات التدريب بدلاً من مجرد توسيع حجمها، مشددة على أهمية دمج الرؤى من العلوم الإنسانية والاجتماعية لتطوير أنظمة ذكاء اصطناعي تخدم البشرية بشكل أفضل.

ربما يعجبك أيضا