یک هوش مصنوعی وارد یک رستوران میشود… آیا هوش مصنوعی واقعاً میتواند بامزه باشد؟
ما از یک کمدین حرفهای خواستیم تا تعدادی جوک نوشته شده توسط هوش مصنوعی را روی صحنه ارائه دهد. آنچه اتفاق افتاد بسیاری از جوانب درک ماشینها از حس انسانمحور طنز را روشن کرد. با این مقاله از بیبیسی همراه باشید.
کارن هابز پیش از این اجرای خاص بیشتر از همیشه عصبی بود. او که یک کمدین شناختهشده است، به صحنهای که اکثراً با کمدی استندآپ در بریتانیا پذیرایی میشود، عادت کرده است. این صحنهها متنوع، غیرقابل پیشبینی و به طرز معروفی فاقد خندههای تشویقی هستند. هابز برخی از طاقتفرساترین اتاقهای بریتانیا را تجربه کرده، از سالنهای بزرگ لندن تا پشت اتاقهای میخانههای روستایی. حتی در رقابتهای دشوار هم پیروز شده، جایی که تماشاگران بیرحمانه در یک رقابت محبوبیت گلادیاتوری برای خندهدارترین جوکها رأی میدهند.
اما این پنجشنبه شب اواخر ژوئن، بالای بار کلوپ اجتماعی کوونت گاردن در مرکز لندن، هابز قصد داشت چیزی کاملاً جدید را امتحان کند. او قرار بود روی صحنه برود و نه با مواد معمول خود، بلکه با مجموعهای از استندآپ که توسط پلتفرم هوش مصنوعی ChatGPT برای او نوشته شده بود، اجرا کند. از همه دلهرهآورتر، او قرار بود بعد از سه کمدین که محتوای واقعی و انسانی خود را اجرا میکردند، به روی صحنه برود.
در ظرف دو سال، چتبات توسعهیافته توسط OpenAI از یک کنجکاوی تکنیکی به اولین ابزاری تبدیل شده که واقعاً هوش مصنوعی را به مردم معرفی کرده است. با ورود هوش مصنوعی به جریان اصلی، این ابزار قبلاً معلمان و دانشگاهها را وحشتزده کرده، مشاغل را از نویسندگان مستقل دزدیده و حتی شبکههای اجتماعی را با محتوای کمکیفیت و گاهی نگرانکننده پر کرده است. برخی از کارشناسان از یک آخرالزمان محتمل ناشی از هوش مصنوعی هشدار میدهند، زمانی که ماشینها به حدی پیشرفت کنند که بتوانند واقعاً از انسانها پیشی بگیرند، فناوری فرضی که به “هوش عمومی مصنوعی” (AGI) معروف است. دیگران معتقدند که هوش مصنوعی هرگز به این نقطه نخواهد رسید.
اما وقتی صحبت از هنر میشود، این موضوع بحثبرانگیز است که آیا هوش مصنوعی مولد، با ذات خود، واقعاً میتواند خلاق باشد یا نه. مدلهای زبان بزرگ (LLM) مانند ChatGPT با پردازش میلیاردها خط متن جمعآوری شده از اینترنت و منابع دیگر کار میکنند و الگوها و روابط بین کلمات و جملات را تحلیل میکنند. با استفاده از آن دادهها، هوش مصنوعی پاسخهایی تولید میکند که، به طور آماری، احتمالیترین جوابها به یک پرسش معین هستند. این بدان معناست که این ابزارهای هوش مصنوعی تنها میتوانند اطلاعاتی را که به نوعی وجود دارند بازتولید کنند، هرچند ممکن است منجر به ترکیبهای جدید و دیده نشدهای از ایدهها شوند. اینکه این موضوع به معنای خلاقیت است یا نه، یک سوال فلسفی است که در حال حاضر پاسخی رضایتبخش ندارد.
آیا یک ربات میتواند بامزه باشد؟
برای درک اینکه آیا ابزارهای هوش مصنوعی واقعاً میتوانند طنز را نشان دهند، آلیسون پاول، استاد دانشیار ارتباطات در مدرسه اقتصاد لندن که تأثیر هوش مصنوعی بر رسانههای ما را مورد مطالعه قرار میدهد، معتقد است که ابتدا باید از خود بپرسیم: «جوکها چگونه کار میکنند؟»
خود پاول تجربهای در کمدی بداهه دارد، صحنهای که شاید بیش از دنیای استندآپ نیز بیرحمتر باشد. در کمدی بداهه هیچ جایی برای برنامهریزی وجود ندارد و کمدین تنها با واکنش غریزی خود به پرسشهای مخاطب پاسخ میدهد.
ممکن است فرض کنید که اگر هوش مصنوعی تا این حد اشتقاقی است، کمدینها نباید نگران باشند، اما خطرات ثانویه برای خلاقان وجود دارد. پاول میگوید: «کمدینها باید نگران سرقت و بازتولید دادهها باشند، زیرا بسیاری از ابزارهای هوش مصنوعی مولد، به ویژه ChatGPT، با استفاده از محتوای اینترنت آموزش میبینند.»
این بدان معناست که نوشتار و خلاقیت افراد بدون اجازه از اینترنت استخراج میشود.
اما تنها دزدیدن جوکها نیست که مایه نگرانی است. با بهبود هوش مصنوعی، تواناییاش برای رقابت نیز ممکن است افزایش یابد. پاول میگوید: «این موضوع میتواند برای یک کمدین جوان نگرانکننده باشد چون اگر هوش مصنوعی در گفتن جوکها بهتر شود، مدلها نیز بهتر میشوند.»
شرکت OpenAI در وسط بحثهایی بر سر استفاده ادعایی از محتوای دارای حق نشر که از پشت دیوارهای پرداختی گرفته شده بود، برای آموزش الگوریتمهای ChatGPT خود قرار گرفته است. در ماه آوریل، هشت روزنامه ملی ایالات متحده به رهبری نیویورک تایمز با هم متحد شدند تا از این شرکت شکایت کنند و آن را متهم به «سرقت میلیونها دلار» از داراییهای فکری کردند. OpenAI به درخواست بیبیسی برای اظهار نظر پاسخ نداد، اما این شرکت ادعا میکند که پردازش محتوای دارای حق نشر به عنوان استفاده منصفانه محسوب میشود.
لس کار، استاد علم وب در دانشگاه ساوتهمپتون که در اوقات فراغت خود به کمدی استندآپ میپردازد، میگوید: «یکی از روشهایی که هوش مصنوعی میتواند جوک بگوید، تکرار یک جوک موفقی است که شنیدهاند یا تلاش برای ایجاد یک تغییر واضح از آن.»
او معتقد است که کمدینهایی که در پنج سال گذشته محتوای بیشتری از خود را در تیکتاک، اینستاگرام و یوتیوب به اشتراک گذاشتهاند تا دنبالکنندگان بیشتری جذب کنند، باید نگران کارهایی باشند که OpenAI و گوگل و فیسبوک ممکن است از آنها بدزدند، همانطور که نویسندگان و هنرمندان نگران این موضوع هستند.
برای کار، نگرانی اصلی این است که هوش مصنوعی از روشی که ما تمایل داریم از اینترنت استفاده کنیم، بهرهبرداری کند. «جوکها چیزی هستند که مردم دوست دارند آنها را در اینترنت یا شبکههای اجتماعی به اشتراک بگذارند، و بنابراین بسیار دشوار است بگوییم که منبع یک جوک چتبات از کجا آمده است – آیا آن را خود ساخته، یا از ‘/r/Jokes’ [یک انجمن کمدی در ردیت] تکرار کرده است؟»
جوکهای آینده
وقتی هابز از هوش مصنوعی خواست مجموعهای برای او تولید کند، با یک مشکل عجیب مواجه شد. ChatGPT به طور پیشفرض با صدای یک کمدین مرد نوشتن را آغاز کرد – اشاره به نارضایتی از دوست دخترش که ظاهراً وسواس خرید دارد. وقتی از هوش مصنوعی خواست تا جوکها را با صدای یک زن بازنویسی کند، این وسواس خرید دوست دختر به شخصیت اول تغییر کرد.
جوکهایی که ChatGPT برای هابز تولید کرد، بر اساس کلیشههای سطحی و تنبل در مورد زنان هزارهای بنا شده بود. «زندگی اجتماعی من، عالی است. اگر به “عالی” بگوییم که بهترین دوستم یک گیاه گلدانی به نام ویلسون است،» هوش مصنوعی نوشت. این جوک یک خطی کلیشهای است، زیرا هوش مصنوعی ایده مبهمی که جوانان به گیاهان گلدانی علاقه دارند را با اشارهای عجیب به فیلم “دور افتاده” تام هنکس و دوست والیبالش “ویلسون” ترکیب کرده است.
مایکل ریان، دانشجوی کارشناسی ارشد در دانشگاه استنفورد و کارشناس هوش مصنوعی که تأثیر هوش مصنوعی بر کمدی را مورد بررسی قرار داده است، میگوید که تعجبی ندارد که این مدلها در ارائه ساختارهای رضایتبخش و نقطههای اوج جوکها مشکل دارند. او میگوید: «یک بخش استندآپ خوب میتواند مخاطب را از طریق یک داستان خندهدار به یک نقطه اوج خندهدار هدایت کند. در تمام این مدت، کمدین دقیقاً میدانست که با جوک کجا میخواهد برود و مخاطب را به آنجا ببرد.»
ChatGPT و همنوعانش توانایی پردازش این نوع اطلاعات را ندارند. در مقایسه با یک کمدین انسانی، هوش مصنوعی نمیتواند بهصورت زمان واقعی سازگار شود، حداقل نه ابزارهای هوش مصنوعی که در حال حاضر برای عموم مردم در دسترس هستند. ریان میگوید: «این نحوه عملکرد مدلهای زبان بزرگ مدرن نیست.»
با این حال، این ممکن است تغییر کند. تحقیقاتی در حال انجام است تا هوش مصنوعی درک بیشتری از جهان اطراف خود کسب کند. ریان میگوید: «پژوهشگران در حال کار بر روی کامل کردن قابلیتهای صوتی مدلهای هوش مصنوعی هستند که به درک عوامل اجتماعی و توانایی سازگاری با مخاطب، همچنین به زمانبندی کمدی کمک خواهد کرد.»
رایان پروژهی تحلیلی بزرگی را با هدف آزمایش محدودیتهای جوکهای تولید شده توسط هوش مصنوعی رهبری کرد. در حالی که تحقیقات او به محدودیتهای این فناوری اشاره داشت، رایان معتقد است که رشد انفجاری فناوری هوش مصنوعی منجر به تولید مدلهای زبانی بزرگی خواهد شد که توانایی شگفتانگیزی در تولید طنز خواهند داشت. او میگوید: «من باور دارم که در چند سال آینده شاهد مجموعههای کمدی واقعاً بامزهای خواهیم بود که توسط هوش مصنوعی تولید شدهاند.»
ممکن است مدت زمانی طول بکشد تا هوش مصنوعی بتواند وظایف روی صحنهای را که کمدینهای دنیای واقعی برای قرنها به آن تسلط داشتهاند، تکرار کند. اما در مورد نوشتن یک جوک خندهدار واحد، پژوهشگران پیشرفتهایی داشتهاند.
در سال ۲۰۲۳، فیلمنامهنویس سیمون ریچ مقالهای برای مجله تایم نوشت که در آن تجربه خود را از استفاده از مدل منتشر نشدهای از OpenAI به نام code-davinci-002، که بهطور خاص برای وظایف خلاقانه توسعه یافته بود، توصیف کرد. ریچ با دو نویسنده دیگر برای نوشتن یک کتاب شعر که توسط هوش مصنوعی نوشته شده بود (و بعدها توسط ورنر هرتسوگ خوانده شد) همکاری کرد، اما قبل از آن از ماشین خواست که چند جوک تولید کند. ریچ گفت که نتایج آنقدر خوب بودند که کابوسهایی به او دادند.
ریچ یک سری تیترهای وبسایت تمسخرآمیز The Onion را به مدل code-davinci-002 داد و از آن خواست که تیترهای تمسخرآمیز خود را تولید کند. یکی از مثالهای محبوب او چنین بود: «بودجه فیلم جدید بتمن به ۲۰۰ میلیون دلار افزایش یافت زیرا کارگردان بر استفاده از بتمن واقعی اصرار داشت.» و سپس «داستان زنی که سگ پناهگاهی با خز به هم ریخته شدید را نجات میدهد شما را ترغیب میکند که یک تب جدید باز کرده و به وبسایت دیگری بروید.» طنز موضوعی نسبی است، اما جوکهای ربات فراتر از استانداردهای ریچ برای خنده بودند.
متوجه شدید؟
در حالی که پژوهشگران در حال بررسی نحوه تقلید از درک زمینه در هوش مصنوعی هستند، کارن هابز – که در منطقه وست اند لندن بود – بسیار از وضعیت خود آگاه میشد. وقتی میزبان شروع به گرمایی کردن مخاطبان کرد، به وحشت هابز پی برد که بخش قابل توجهی از جمعیت حاضر در سمت راست اتاق قبلاً هرگز به یک اجرای کمدی نرفته بودند. هر آنچه هوش مصنوعی تولید میکرد، یکی از اولین تجربیات آنها با این مدیوم بود.
اما شاید مخاطبان آنچه را که قرار بود بشنوند دوست داشته باشند؟ درو گورنز، دانشجوی دکترا در دانشگاه کالیفرنیای جنوبی، تخصصش بررسی روانشناسی چیزی است که دقیقاً چیزها را خندهدار میکند. به عبارت دقیقتر، او در زمینه توضیح اینکه چرا یک جوک بامزه است فعالیت میکند.
او تصمیم گرفت جوکهای ساخته شده توسط انسان را در برابر همتایان دیجیتالیشان به رقابت بگذارد و متوجه شد که در بیشتر موارد، جوکهای هوش مصنوعی برنده بودند وقتی که به بیش از ۲۰۰ خواننده ارائه شدند.
روش گورنز کمی شبیه به بازی آنلاین Quiplash بود، جایی که شرکتکنندگان عبارتی با یک جای خالی یا یک سرواژه به عنوان پرسش دریافت میکنند و برای ارائه پاسخ خندهدارتر با هم رقابت میکنند. او میگوید: «این مدل جوکهایی در سطح [کمدین آمریکایی] جان مولانی نمینویسد، اما در مقایسه با افراد عادی، جوکهای آن در محدوده ۶۳ تا ۸۷ درصد بسته به پرسشی که به آن دادیم، رتبهبندی میشد.»
گورنز معتقد است که مدلهای زبان بزرگ (LLM) در توانایی خود برای نوشتن کمدی «کمتوجهی شدهاند» و خروجی جوکهای تولید شده توسط هوش مصنوعی به کیفیت پرسشی که به مدل داده میشود بستگی دارد. او میگوید: «بیشتر افراد، از جمله کمدینها، اگر از آنها بخواهید که به طور ناگهانی ‘چیزی خندهدار بگویند’، عملکرد خوبی نخواهند داشت. هر چه پرسش خاصتر باشد، پاسخ بهتری ارائه میشود.» برخی مدلها ممکن است بهتر از دیگران باشند. به عنوان مثال، ChatGPT و Gemini گوگل برای کاربردهای عمومی ساخته شدهاند. یک هوش مصنوعی که برای طنز تنظیم شده باشد احتمالاً بهتر از مدلهای متداول میتواند جوک تولید کند، حتی اگر در زمینههای دیگر عقب بماند.
با این حال، گورنز تفاوت مهمی میان جوکها و خود اجراکننده قائل میشود، زیرا تماشاگران کمدی استندآپ انتظار اصالت و آسیبپذیری از کمدینهای خود دارند. امری که ممکن است در مدیوم دیگری کمتر مهم باشد. و برای مدلهای زبان بزرگی که تنها به تازگی در تقلید زبان موفق شدهاند، آیا این خواستهای بیش از حد برای نویسنده شبحی هوش مصنوعی ماست؟
لطفاً با الگوریتم روی صحنه آشنا شوید
برای پاول، تلاش برای دیجیتالی کردن کمدی هم به اندازهای بیهوده است که غیرعملی و غیراخلاقی. توسعه مدلهای هوش مصنوعی مولد نیازمند مقادیر عظیمی از انرژی و هزینه است و احتمالاً ارزانتر، جالبتر و با تولید شگفتیهای بیشتر خواهد بود اگر در کمدینهای جوان و تولید فرهنگی سرمایهگذاری کنیم تا اینکه منابع لازم برای انجام این کار به صورت محاسباتی را صرف کنیم.
او میگوید: «فکر میکنم احتمالاً یک مزیت بزرگتر از سرمایهگذاری در کمدینهای انسانی حاصل میشود که ایدههای بسیار متفاوتی دارند که به لحاظ آماری مشابه موارد قبلی نیستند و میتوانند در تمامی انواع فرهنگها و زمینههای زبانی انسانها بامزه باشند.»
هنگامی که هابز برای اجرای مجموعهای که توسط هوش مصنوعی نوشته شده بود، روی صحنه رفت، به مخاطبان هشدار داده بود که واکنش آنها میتواند برای کمدینها تعیینکننده باشد – در دست اربابان سایبری جدیدشان. او گفت: «اگر به همه جوکها بخندید، همه ما بیکار خواهیم شد!»
خوشبختانه تنها گاهگداری صدای خندهای شنیده میشد و عمدتاً زمانی که هابز خودش به مخاطبان نگاههای جانبی و با تعجب میکرد، برخی از آنها هم چهرههایی متحیر داشتند. «یک بار به جای رژ لب به همسرم چسب دادم. او هنوز با من حرف نمیزند.» هابز این جوک را برای مخاطبان گیج خواند که صبورانه منتظر نقطه اوج بهتری بودند.
در یکی دیگر از لحظات بهویژه جنسیتی، هوش مصنوعی نوشت: «قرار گذاشتن مثل خرید کردن است. دنبال چیزی میگردید که میخواهید و در نهایت چیزی پیدا میکنید که نیازی به آن ندارید.» هابز لحظاتی بعد اضافه کرد: «هرگز در زندگیام اینقدر احمقانه احساس نکردهام.» و این به یک حقیقت عمیقتر اشاره دارد. یک مدل هوش مصنوعی میتواند مراحل ساختن جوکها را طی کند. حتی ممکن است گاهی اوقات جزئیات یک اجرای خوب را به تصویر بکشد. اما تنها یک کمدین انسانی میتواند از پس معذببودن و شکست خوردن روی صحنه برآید.
فعلاً مدلهای هوش مصنوعی هنوز نتوانستهاند این راز خاص را کشف کنند. کمدینها فعلاً میتوانند نفس راحتی بکشند که هنوز نیازی به بهروز کردن رزومههای خود ندارند.