هوش مصنوعی گوگل با ۲ ساعت صحبت با شما، طرز فکرش شبیه شما میشود
هوش مصنوعی گوگل میتواند فقط با ۲ ساعت مصاحبه با شما، طرز فکرتان را تقلید کند و در امور مختلف شبیه به شما بیاندیشد!
محققان گوگل و دانشگاه استنفورد در یک پروژه تحقیقاتی مشترک، به پیشرفت جالبی در زمینه هوش مصنوعی دست یافتهاند. آنها توانستهاند پس از یک مصاحبه دو ساعته با افراد، هوش مصنوعی بسازند که طرز فکر آن شباهت زیادی به فرد مصاحبهشونده دارد. این مطالعه نشان میدهد که با جمعآوری حدود ۶۰۰۰ کلمه از صحبتهای یک فرد، میتوان یک عامل مولد (Generative Agent) ایجاد کرد که رفتار آن شباهت زیادی به رفتار همان فرد دارد.
در این تحقیق، محققان از ۱۰۵۲ نفر خواستند تا در ازای دریافت ۶۰ دلار، دو خط ابتدایی رمان گتسبی بزرگ را برای یک اپلیکیشن بخوانند. سپس، یک هوش مصنوعی که شبیه شخصیتهای دوبعدی بازیهای قدیمی به نظر میرسید، از شرکتکنندگان درباره زندگیشان سوالاتی پرسید. دانشمندان با استفاده از این مصاحبهها، هوش مصنوعی ساختند که به گفته خودشان، رفتار شرکتکنندگان را با دقت ۸۵ درصد شبیهسازی میکند.
هدف از پروژه جدید با هوش مصنوعی گوگل چیست؟
هدف از این پروژه که با همکاری آزمایشگاه تحقیقات هوش مصنوعی گوگل دیپمایند انجام شده، این است که ساخت هوشهای مصنوعی بر اساس افراد واقعی، به سیاستگذاران و صاحبان کسبوکار کمک کند تا درک بهتری از عموم مردم داشته باشند. به جای استفاده از گروههای متمرکز یا نظرسنجیهای عمومی، میتوان با یک بار مصاحبه با افراد، یک مدل زبانی بزرگ (LLM) بر اساس آن مکالمه ایجاد کرد و سپس نظرات و عقاید آنها را برای همیشه در اختیار داشت. البته تا جایی که یک LLM قادر به بازآفرینی آن افکار و احساسات باشد.
محققان در مقاله خود نوشتهاند: «این کار، پایهای برای ابزارهای جدیدی فراهم میکند که میتوانند به بررسی رفتار فردی و جمعی کمک کنند.» آنها در ادامه میپرسند: «برای مثال، چگونه افراد مختلف به سیاستها و پیامهای جدید بهداشت عمومی، عرضه محصولات جدید یا شوکهای بزرگ واکنش نشان میدهند؟» و اضافه میکنند:
وقتی شبیهسازی افراد به صورت جمعی انجام شود، این شبیهسازیها میتوانند به هدایت مداخلات، توسعه نظریههای پیچیده که تعاملات علی و زمینهای را در بر میگیرند و گسترش درک ما از ساختارهایی مانند نهادها و شبکهها در حوزههای مختلف مانند اقتصاد، جامعهشناسی، سازمانها و علوم سیاسی کمک کنند.
بخش عمدهای از این فرایند خودکار بود. محققان برای جمعآوری شرکتکنندگان با یک شرکت تحقیقات بازار به نام Bovitz قرارداد بستند. هدف این بود که تا حد امکان، نمونهای از جمعیت ایالات متحده، در حد ۱۰۰۰ نفر، جمعآوری شود. برای تکمیل مطالعه، کاربران در یک رابط کاربری مخصوص حساب کاربری ایجاد میکردند، یک آواتار دو بعدی میساختند و سپس با یک مصاحبهکننده هوش مصنوعی صحبت میکردند.
سبک مصاحبه و سوالات، نسخهای اصلاحشده از روشی بود که در پروژه American Voices Project استفاده میشود. این پروژه مشترک دانشگاههای استنفورد و پرینستون، با مردم سراسر آمریکا مصاحبه میکند. هر مصاحبه با خواندن دو خط ابتدایی رمان گتسبی بزرگ توسط شرکتکنندگان آغاز میشد تا صدا کالیبره شود.
به طور متوسط، هر مصاحبه دو ساعته حدود ۶۴۹۱ کلمه متن تولید میکرد. هوش مصنوعی سوالاتی درباره نژاد، جنسیت، سیاست، درآمد، استفاده از رسانههای اجتماعی، استرس شغلی و ترکیب خانواده میپرسید. محققان متن مصاحبه و سوالات پرسیده شده توسط هوش مصنوعی را منتشر کردهاند.
سپس این متنها که هر کدام کمتر از ۱۰ هزار کلمه بودند، به یک LLM دیگر داده شدند تا عاملهای مولد برای شبیهسازی شرکتکنندگان ساخته شوند. سپس محققان هم شرکتکنندگان واقعی و هم کلونهای هوش مصنوعی آنها را در معرض سوالات بیشتر و بازیهای اقتصادی قرار دادند تا عملکرد آنها را مقایسه کنند. آنها برای آزمایش میزان شباهت LLMها به افراد واقعی، از پرسشنامه پیمایش اجتماعی عمومی (GSS) و پرسشنامه شخصیتی پنج عاملی (BFI) استفاده کردند. سپس شرکتکنندگان و LLMها را در پنج بازی اقتصادی قرار دادند تا عملکرد آنها را مقایسه کنند.
نتایج ضد و نقیض بود. در پرسشنامه GSS، هوشهای مصنوعی حدود ۸۵ درصد از سوالات را مانند شرکتکنندگان واقعی پاسخ دادند. در پرسشنامه BFI، این عدد به ۸۰ درصد رسید. اما در بازیهای اقتصادی، این اعداد کاهش یافت. محققان به شرکتکنندگان واقعی جایزه نقدی پیشنهاد دادند تا بازیهایی مانند معمای زندانی (Prisoner’s Dilemma) و بازی دیکتاتور (Dictator’s Game) را انجام دهند.
در معمای زندانی، شرکتکنندگان میتوانند انتخاب کنند که با هم همکاری کنند و هر دو موفق شوند یا به شریک خود خیانت کنند تا شانس برنده شدن جایزه بزرگ را داشته باشند. در بازی دیکتاتور، شرکتکنندگان باید نحوه تخصیص منابع به سایر شرکتکنندگان را انتخاب کنند.
در این بازیهای اقتصادی، کلونهای هوش مصنوعی نتوانستند به خوبی همتایان واقعی خود را شبیهسازی کنند. به طور متوسط، عاملهای مولد به همبستگی نرمالشده ۰.۶۶ یا حدود ۶۰ درصد دست یافتند.
اگر به نحوه تفکر دانشگاهیان درباره هوشهای مصنوعی و عموم مردم علاقه دارید، خواندن این مقاله میتواند برای شما مفید باشد. زمان زیادی طول نکشید تا محققان شخصیت یک انسان را به یک LLM تبدیل کنند که رفتار مشابهی دارد. با صرف زمان و انرژی بیشتر، احتمالا میتوان این دو را به هم نزدیکتر کرد.
با این حال، این پیشرفت نگرانکننده است. نه به این دلیل که روح انسان به یک صفحه گسترده تقلیل یابد، بلکه به این دلیل که میدانیم این نوع فناوریها ممکن است مورد سوء استفاده قرار گیرند. پیش از این شاهد بودهایم که LLMهای سادهتر که بر اساس ضبطهای عمومی آموزش دیدهاند، مادربزرگها را فریب دادهاند تا اطلاعات بانکی خود را پس از یک تماس تلفنی کوتاه به یک فامیل هوش مصنوعی بدهند. چه اتفاقی میافتد وقتی این ماشینها یک فیلمنامه داشته باشند؟ چه اتفاقی میافتد وقتی آنها به شخصیتهای سفارشیسازیشده بر اساس فعالیتهای رسانههای اجتماعی و سایر اطلاعات در دسترس عموم دسترسی داشته باشند؟
چه اتفاقی میافتد وقتی یک شرکت یا یک سیاستمدار بر اساس خواست عمومی بیانشده تصمیم نگیرد، بلکه بر اساس تقریب آن تصمیم بگیرد؟