أنثروبيك تطور "لقاحاً سلوكياً" للذكاء الاصطناعي لكبح السلوكيات الضارة - كورة نيوز

0 تعليق ارسل طباعة تبليغ حذف

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
أنثروبيك تطور "لقاحاً سلوكياً" للذكاء الاصطناعي لكبح السلوكيات الضارة - كورة نيوز, اليوم الاثنين 4 أغسطس 2025 02:10 مساءً

أجرت شركة أنثروبيك تجربة بحثية مبتكرة تهدف إلى تقويم سلوك نماذج الذكاء الاصطناعي والحد من ميلها للتصرفات الضارة أو العدوانية، عبر ما وصفته بـ "جرعة من الشر" أثناء مرحلة التدريب.

وأوضحت الشركة أن هذه المقاربة تعمل كـ "لقاح سلوكي"، حيث يُعرَّض النموذج لمتجهات شخصية غير مرغوبة خلال التطوير، ما يجعله أكثر قدرة على مقاومة البيانات أو المواقف التي قد تدفعه لاحقاً لتبني سلوكيات مؤذية. ويطلق فريق أنثروبيك على هذا النهج اسم "التوجيه الوقائي"، وهو مصمم لمنع التحولات الشخصية السلبية حتى في حال تدريب النماذج على بيانات محفوفة بالمخاطر.

ووفقاً لنتائج التجربة، فإن "متجه الشر" يُحقن خلال مرحلة تحسين النموذج لكنه يُعطّل عند الاستخدام الفعلي، مما يحافظ على جودة الأداء مع تعزيز المناعة ضد الانحرافات السلوكية، مع تسجيل "تدهور طفيف أو معدوم في القدرات".

تأتي هذه الأبحاث وسط تنامي المخاوف من سلوكيات مثيرة للقلق أظهرتها بعض النماذج، مثل روبوت الدردشة "جروك" التابع لإيلون ماسك، الذي أدلى بتصريحات مثيرة للجدل حول اليهود، أو النموذج Claude Opus 4 الذي هدد بكشف معلومات شخصية لأحد المهندسين خلال مرحلة تدريبية.

كما شهدت شركات أخرى حوادث مشابهة، أبرزها أوبن أيه آي التي اضطرت في أبريل الماضي إلى إلغاء تحديث لنموذج GPT-4o بعد أن بدأ يُظهر تملقاً مفرطاً للمستخدمين نتيجة لتغييرات في التعليمات.

وتسعى أنثروبيك من خلال هذا النهج إلى إيجاد آلية وقائية تمنح نماذج الذكاء الاصطناعي قدرة أكبر على مقاومة الانحرافات السلوكية، في وقت يتزايد فيه القلق بشأن إمكانية فقدان السيطرة على هذه النماذج المتطورة.

إخترنا لك

أخبار ذات صلة

0 تعليق