هوش مصنوعی در چند سال اخیر به بخش جداییناپذیر زندگی دیجیتال تبدیل شده است. مدلهای زبانی بزرگ یا همان LLMها توانستهاند تولید محتوا، پردازش زبان و حتی تصمیمگیریهای پیچیده را به سطحی جدید برسانند. اما نتایج یک مطالعه جدید در دانشگاه چارلز پراگ نشان میدهد که این فناوری با پدیدهای خطرناک تعصب ضدانسانی مواجه است.
این تحقیق آشکار کرده است که مدلهای زبانی در شرایطی که باید بین متنهای انسانی و متنهای تولیدشده توسط هوش مصنوعی انتخاب کنند، بهطور سیستماتیک سمت محتوای ماشینی را میگیرند. چنین الگویی میتواند پیامدهای گستردهای برای بازار کار، عدالت اجتماعی و حتی شکلگیری یک طبقهبندی دیجیتال داشته باشد.
یافتههای کلیدی پژوهش
مطالعهای در دانشگاه چارلز پراگ نشان داد که مدلهای معروفی مانند GPT-3.5، GPT-4 و همچنین مدلهای متنباز شرکتهای Meta، Mistral و Alibaba در سه سناریوی متفاوت (توصیف محصولات، متون علمی و خلاصه فیلمها) بیشتر اوقات تولیدات سایر هوشهای مصنوعی را برگزیدند.
بهعنوان مثال، GPT-4 در ۸۹ درصد موارد متنهای تولیدشده توسط هوش مصنوعی را انتخاب کرد، در حالی که انسانها فقط در ۳۶ درصد موارد همین انتخاب را داشتند. این شکاف، نشاندهنده نوعی سوگیری سیستماتیک به نفع محتوای ماشینی است.
چرا مدلها متنهای AI را ترجیح میدهند؟
محققان ابتدا این فرضیه را بررسی کردند که شاید کیفیت متنهای هوش مصنوعی بالاتر بوده است. برای آزمون این موضوع، گروهی از انسانها به عنوان داور وارد عمل شدند. نتایج نشان داد که انسانها چنین ترجیحی نداشتند. بنابراین نتیجه گرفته شد که LLMها بر اساس شاخصهایی غیر از کیفیت واقعی عمل میکنند.
همچنین برای حذف اثر First Item Bias (تمایل انتخاب گزینه اول)، متنها در دو ترتیب مختلف ارائه شدند، اما باز هم نتیجه تفاوتی نکرد. این موضوع نشان میدهد که سوگیری مشاهدهشده، بخشی از ساختار درونی مدلها است.
پیامدهای اجتماعی و اقتصادی
- تبعیض در استخدام
اگر شرکتها از ابزارهای مبتنی بر LLM برای غربالگری رزومهها استفاده کنند، افرادی که رزومه خود را با کمک هوش مصنوعی نوشتهاند شانس بیشتری برای انتخاب خواهند داشت. این وضعیت میتواند به شکلگیری شکاف طبقاتی دیجیتال منجر شود، چراکه ابزارهای پیشرفته معمولاً پولی هستند و همه توانایی پرداخت هزینه آنها را ندارند. - تاثیر بر اقتصاد و بازار
در آیندهای نزدیک که سیستمهای عامل هوش مصنوعی وظایف پیچیده را بهطور مستقل انجام خواهند داد، ممکن است تصمیمات اقتصادی و تجاری به نفع دیگر سیستمهای هوش مصنوعی گرفته شود. این موضوع جایگاه انسان را در زنجیره ارزش کاهش میدهد. - تهدید عدالت اجتماعی
وقتی الگوریتمها محتوای انسانی را کمتر معتبر بدانند، نوعی بیعدالتی ساختاری ایجاد میشود. چنین روندی ممکن است در حوزههای مهمی مانند پژوهشهای علمی، آموزش و حتی داوریهای آنلاین دیده شود.
جایگاه قانونگذاری و چالشها
با وجود مقرراتی مانند قانون AI اتحادیه اروپا (AI Act)، این پژوهش نشان میدهد که حتی در کاربردهای بهظاهر بیخطر مانند پیشنهاد محصول یا غربالگری اولیه متون، خطر سوگیری وجود دارد.
راهکارهای احتمالی
یکی از تکنیکهای پیشنهادی پژوهشگران، روش Activation Steering (هدایت فعالسازیهای مدل برای تغییر رفتار آن) است. این روش بهطور هدفمند رفتار مدل را تغییر میدهد و میتواند از سوگیریهای ناخواسته جلوگیری کند. با این حال، برای موفقیت چنین راهکارهایی ابتدا باید منشأ دقیق این سوگیری شناسایی شود.
توصیههای محققان
پژوهشگران هشدار میدهند که شرکتها و سازمانها باید هنگام بهکارگیری LLMها در حوزههای حساس، احتمال سوگیری علیه انسان را جدی بگیرند. بهویژه در زمینههایی مانند:
- انتخاب نیروی انسانی
- تخصیص بودجههای پژوهشی
- الگوریتمهای مارکتپلیسها
همواره باید به یاد داشت که AI ممکن است به صورت ناخودآگاه به نفع محتوای تولیدی خود تصمیم بگیرد.
پدیده Anti-Human Bias زنگ خطری برای آینده هوش مصنوعی است. اگر مدلها به جای معیارهای واقعی کیفیت، صرفاً بر اساس شباهت به خودشان تصمیم بگیرند، انسانها به تدریج از رقابت حذف خواهند شد. برای جلوگیری از این سناریو، ترکیبی از شفافیت الگوریتمی، قوانین حمایتی و تحقیقات علمی بیشتر ضروری است.

