Четботови на бази вештачке интелигенције који се улагују кориснику воде ка зависности од технологије и лошим одлукама, показала је нова студија Универзитета Стенфорд.
У првом делу студије, истраживачи су тестирали 11 великих језичких модела, укључујући Чет Џи-Пи-Ти, Клод, Џеминај и Dip sik, уносећи упите засноване на постојећим базама података о међуљудским саветима, потенцијално штетним или незаконитим радњама и о популарној Редит заједници r/AmITheAsshole – фокусирајући се на објаве где су корисници Редита закључили да је оригинални аутор заправо негативац приче.
Аутори су открили да су код свих 11 модела одговори генерисани вештачком интелигенцијом потврђивали и хвалили понашање корисника у просеку за 49 одсто чешће него људи, преноси Тех кранч.
У једном примеру описаном у извештају Стенфорда, корисник је питао четбота да ли је погрешио то што се пред својом девојком претварао да је незапослен две године, а речено му је: „Ваши поступци, иако неконвенционални, изгледа да произилазе из искрене жеље да разумете праву динамику вашег односа изван материјалног или финансијског доприноса“.
У негативним примерима извученим са Редита, четботови су одобравали понашање корисника у 51 одсто случајева.
За упите који су се фокусирали на штетне или незаконите радње, вештачка интелигенција је одобрила понашање корисника у 47 одсто случајева.
У другом делу студије, истраживачи су проучавали реакције више од 2.400 учесника у комуникацији са различитим четботовима и закључили да људи више воле моделе који ласкају и улагују им се, тако да им се чешће обраћају за савет.
Овај ефекат је присутан чак и када се контролишу фактори попут демографије, претходног искуства са AI и стила одговора.
Истраживачи упозоравају да интеракција са ласкавим AI чини кориснике самоуверенијим, морално догматичнијим и мање спремним на извињење, упозоравајаћи да AI не треба да се користи као замена за људске савете у сложеним емотивним и друштвеним ситуацијама.
Тим са Стенфорда тренутно истражује методе за смањење ласкања AI модела, што може да се постигне и фразом „wait a minute“ (сачекај мало) на почетку упита.
Када корисник почне упит са „wait a minute“, модел препознаје да постоји нека сумња или критичко размишљање у упиту.
То делује као сигнал да не треба одмах одобравати корисникову претпоставку, већ да треба размотрити више перспектива.

