مطالعه‌ای نشان می‌دهد که زیرنویس‌های میم تولید شده توسط هوش مصنوعی به طور میانگین خنده‌دارتر از زیرنویس‌های انسانی هستند

مطالعه‌ای نشان می‌دهد که زیرنویس‌های میم تولید شده توسط هوش مصنوعی به طور میانگین خنده‌دارتر از زیرنویس‌های انسانی هستند

تاریخ انتشار:

مطالعه‌ای نشان می‌دهد که زیرنویس‌های میم تولید شده توسط هوش مصنوعی به طور میانگین خنده‌دارتر از زیرنویس‌های انسانی هستند

مطالعه‌ای جدید در مورد ایجاد میم‌ها

مطالعه‌ای جدید که به بررسی ایجاد میم‌ها پرداخته، نشان می‌دهد که زیرنویس‌های میم تولید شده توسط هوش مصنوعی بر روی تصاویر میم معروف، به طور میانگین در زمینه‌های طنز، خلاقیت و "قابلیت اشتراک‌گذاری" از زیرنویس‌های انسانی نمرات بالاتری کسب کرده‌اند. با این حال، انسان‌ها هنوز هم بهترین نمونه‌های فردی را خلق کرده‌اند.

نتایج مطالعه

این تحقیق که در کنفرانس بین‌المللی 2025 در مورد رابط‌های کاربری هوشمند ارائه خواهد شد، تصویر پیچیده‌ای از نحوه عملکرد هوش مصنوعی و انسان‌ها در وظایف خلق طنز ارائه می‌دهد. با این حال، نتایج به اندازه‌ای شگفت‌انگیز بودند که یکی از کارشناسان پیروزی ماشین‌ها را اعلام کرد.

ایثن مالیک، استاد دانشگاه وارتون، پس از بررسی نتایج مطالعه در بلواسکی نوشت: "متأسفم که اعلام کنم تست تورینگ میم‌ها عبور کرده است." مالیک به‌طور آکادمیک به مطالعه هوش مصنوعی پرداخته و به تست معروفی اشاره می‌کند که توسط پیشگام محاسبات، آلن تورینگ، در سال 1950 پیشنهاد شده است و به دنبال تعیین این است که آیا انسان‌ها می‌توانند بین خروجی‌های هوش مصنوعی و محتوای تولید شده توسط انسان تمایز قائل شوند.

اما شاید هنوز زود باشد که ربات‌ها را تاج‌دار کنیم. همان‌طور که در مقاله آمده است: "در حالی که هوش مصنوعی می‌تواند بهره‌وری را افزایش دهد و محتوایی تولید کند که به جمعیت وسیعی جذاب باشد، خلاقیت انسانی برای محتوایی که در سطح عمیق‌تری ارتباط برقرار می‌کند، همچنان حیاتی است."

تیم تحقیقاتی بین‌المللی

تیم تحقیقاتی بین‌المللی از مؤسسه فناوری سلطنتی KTH در سوئد، دانشگاه LMU مونیخ در آلمان و دانشگاه TU دارمشتات در آلمان سه سناریوی آزمایشی برای مقایسه کیفیت ایجاد میم‌ها تنظیم کردند. آن‌ها انسان‌ها را که به تنهایی کار می‌کردند در برابر انسان‌هایی که با مدل‌های زبانی بزرگ (LLMs)، به‌ویژه GPT-4o از OpenAI همکاری می‌کردند، قرار دادند و میم‌های تولید شده به‌طور کامل توسط GPT-4o بدون ورودی انسانی را مقایسه کردند.

بررسی زیرنویس‌های میم

محققان زیرنویس‌های میم را در سه دسته مرتبط (کار، غذا و ورزش) آزمایش کردند تا بررسی کنند که هوش مصنوعی و انسان‌ها چگونه طنز را در زمینه‌های آشنا مدیریت می‌کنند. آن‌ها تفاوت‌های قابل توجهی در عملکرد در این دسته‌ها یافتند؛ به‌عنوان مثال، میم‌های مربوط به کار معمولاً از نظر طنز و قابلیت اشتراک‌گذاری نمرات بالاتری نسبت به میم‌های مربوط به غذا یا ورزش کسب کردند که نشان‌دهنده این است که زمینه می‌تواند بر اثربخشی طنز میم، چه توسط انسان‌ها و چه توسط هوش مصنوعی، تأثیر بگذارد.

شایان ذکر است که مدل‌های هوش مصنوعی تصاویر استفاده شده در این مطالعه را تولید نکردند. در عوض، محققان از الگوهای میم محبوب و از پیش موجود استفاده کردند و زیرنویس‌ها را به‌وسیله GPT-4o یا شرکت‌کنندگان انسانی تولید کردند.

نتایج ارزیابی

زمانی که شرکت‌کنندگان جمع‌آوری شده میم‌ها را ارزیابی کردند، آن‌هایی که به‌طور کامل توسط مدل‌های هوش مصنوعی تولید شده بودند، به‌طور میانگین در زمینه طنز، خلاقیت و قابلیت اشتراک‌گذاری نمرات بالاتری کسب کردند. محققان قابلیت اشتراک‌گذاری را به‌عنوان پتانسیل یک میم برای به‌طور گسترده‌ای در گردش بودن تعریف کردند که تحت تأثیر طنز، ارتباط‌پذیری و ارتباط با موضوعات فرهنگی کنونی قرار دارد. آن‌ها خاطرنشان کردند که این مطالعه یکی از نخستین مطالعاتی است که نشان می‌دهد میم‌های تولید شده توسط هوش مصنوعی در این معیارها از میم‌های تولید شده توسط انسان پیشی گرفته‌اند.

با این حال، این مطالعه با یک نکته مهم همراه است. به‌طور میانگین، میم‌های کاملاً تولید شده توسط هوش مصنوعی نمرات بالاتری نسبت به میم‌های تولید شده تنها توسط انسان‌ها یا انسان‌هایی که با هوش مصنوعی همکاری کرده‌اند، کسب کردند. اما زمانی که محققان به بهترین میم‌های فردی نگاه کردند، انسان‌ها خنده‌دارترین نمونه‌ها را خلق کردند و همکاری‌های انسانی-هوش مصنوعی خلاق‌ترین و قابل اشتراک‌گذاری‌ترین میم‌ها را تولید کردند. به عبارت دیگر، مدل‌های هوش مصنوعی به‌طور مداوم میم‌های جذابی تولید کردند، اما انسان‌ها—با یا بدون کمک هوش مصنوعی—هنوز هم بهترین نمونه‌های فردی را خلق کردند.

تجربه شرکت‌کنندگان

این مطالعه همچنین نشان داد که شرکت‌کنندگانی که از کمک هوش مصنوعی استفاده کردند، به‌طور قابل توجهی ایده‌های بیشتری برای میم تولید کردند و فرآیند را آسان‌تر و نیازمند تلاش کمتری توصیف کردند. با وجود این افزایش بهره‌وری، میم‌های همکاری انسانی-هوش مصنوعی به‌طور میانگین نمرات بالاتری نسبت به میم‌هایی که انسان‌ها به تنهایی تولید کردند، کسب نکردند. همان‌طور که محققان بیان کردند: "افزایش بهره‌وری تیم‌های انسانی-هوش مصنوعی به نتایج بهتری منجر نمی‌شود—فقط به نتایج بیشتری منجر می‌شود."

شرکت‌کنندگانی که از کمک هوش مصنوعی استفاده کردند، گزارش دادند که احساس مالکیت کمتری نسبت به خلقیات خود نسبت به خالقان انفرادی داشتند. با توجه به اینکه حس مالکیت بر انگیزه خلاقانه و رضایت در مطالعه تأثیر می‌گذارد، محققان پیشنهاد می‌کنند که افرادی که به استفاده از هوش مصنوعی علاقه‌مند هستند باید به‌دقت در نظر بگیرند که چگونه می‌توانند کمک هوش مصنوعی را در وظایف خلاقانه متعادل کنند.

چگونه هوش مصنوعی می‌تواند طنز تولید کند؟

پس، چگونه یک مدل هوش مصنوعی می‌تواند چیزهای خنده‌داری تولید کند که انسان‌ها آن‌ها را قدردانی می‌کنند؟ محققان عملکرد قوی میانگین مدل هوش مصنوعی را به آموزش آن بر روی مقادیر زیادی از داده‌های اینترنت نسبت می‌دهند که به آن اجازه می‌دهد الگوهای طنز جذاب را شناسایی کند. در حالی که میم‌های تولید شده توسط انسان، معمولاً تجربیات شخصی بیشتری را منعکس می‌کنند که گاهی اوقات محتوای به‌خصوص خنده‌داری تولید می‌کند، اما به‌طور کلی نمرات میانگین کمتری را به دست می‌آورند.

محققان چند نمونه از زیرنویس‌های میم را از مطالعه ارائه کردند که در تصاویر بالا دیده می‌شود. زمانی که یکی از کاربران بلواسکی اخیراً اشاره کرد که میم‌های تولید شده توسط هوش مصنوعی در این مطالعه "عالی نیستند"، مالیک نظری ارائه داد که ممکن است تا حدی نتایج مطالعه را توضیح دهد: "یک درس این است که بسیاری از مردم میم‌های بد را خنده‌دار و جالب می‌دانند." این نظر یک سؤال کلیدی را درباره یافته‌ها مطرح می‌کند: آیا موفقیت هوش مصنوعی نشان‌دهنده تسلط آماری در بازتولید الگوهای طنز رایج است، یا صرفاً توانایی آن در هدف‌گیری حداقل مشترک طنز اینترنتی؟

محدودیت‌های مطالعه

این مطالعه چندین محدودیت دارد که ارزش ذکر دارد. جلسات ایجاد زیرنویس‌های میم نسبتاً کوتاه بودند و شرکت‌کنندگان همیشه از قابلیت‌های همکاری ابزارهای هوش مصنوعی به‌طور کامل استفاده نکردند. تحقیقات آینده می‌تواند بررسی کند که آیا استفاده طولانی‌تر از ابزارهای هوش مصنوعی و هدایت بهتر می‌تواند همکاری‌های خلاقانه انسانی-هوش مصنوعی را بیشتر تقویت کند.

علاوه بر این، استفاده از ارزیاب‌های جمع‌آوری شده، سوگیری‌های احتمالی و سوبژکتیویته را به همراه دارد که ممکن است به طنز اصلی یا متعارف تمایل داشته باشد و ممکن است میم‌های تولید شده توسط هوش مصنوعی را که برای جذابیت عمومی بهینه شده‌اند، ترجیح دهد. مطالعات آینده ممکن است به‌جای آن، پنل‌های کارشناسی یا جمعیت‌های هدفمند را در نظر بگیرند تا جنبه‌های دقیق‌تر و خاص فرهنگی طنز و خلاقیت را بهتر درک کنند.

تیم تحقیقاتی پیشنهاد می‌کند که کارهای آینده باید سناریوهایی را بررسی کند که در آن یک مدل هوش مصنوعی به‌سرعت ایده‌های متعددی تولید می‌کند و به انسان‌ها اجازه می‌دهد به‌عنوان متولیانی عمل کنند که بهترین محتوا را انتخاب و اصلاح می‌کنند. اما در حال حاضر، انسان‌ها همچنان قهرمانان زیرنویس‌های میم هستند.

Diagrams of meme creation and evaluation workflows taken from the paper.
Some of the meme image templates used in the study, taken from the paper.
From the paper:
منبع:Ars Technica
در حال بارگذاری نظرات...
نظر شما:
0/800