بیشتر افراد قادر به تشخیص تفاوت میان صدای انسان و صدای هوش مصنوعی نیستند

در حالی که اهمیت هوش مصنوعی در زندگی روزمره انسان‌ها به‌طور مداوم در حال افزایش است، یک تحقیق تازه نشان می‌دهد که نسبت قابل توجهی از مردم توانایی تشخیص تفاوت میان صدای طبیعی انسان و صدای مصنوعی را از دست داده‌اند.

محققان اعلام کرده‌اند که در پژوهش جدید خود، اکثریت شرکت‌کنندگان نتوانسته‌اند صداهای واقعی انسان را از صداهایی که توسط هوش مصنوعی ایجاد شده‌اند، تشخیص دهند.

طبق گزارشی از ایتنا و به نقل از یورونیوز، در این تحقیق از شرکت‌کنندگان خواسته شده بود که ۸۰ نمونه از صداها را مورد بررسی قرار دهند؛ به‌طوری‌که نیمی از این صداها مربوط به انسان واقعی و نیمی دیگر توسط هوش مصنوعی تولید شده بودند. این افراد موظف بودند بر اساس ویژگی‌هایی مانند سطح اعتمادپذیری یا قدرت صداها را امتیازدهی کنند.

در دسته‌بندی مربوط به صداهای مصنوعی، دو نوع وجود داشت: صداهایی که به‌طور کامل توسط هوش مصنوعی تولید شده بودند و صداهایی که از نمونه‌های واقعی انسان تقلید شده بودند.

بیشتر افراد توانستند نوع اول را به‌عنوان صدای مصنوعی شناسایی کنند، در حالی‌که نسخه‌های شبیه‌سازی‌شده به‌طرزی غیرمعمول واقعی به نظر می‌رسیدند، به‌طوری‌که ۵۸ درصد از آن‌ها به اشتباه به عنوان صدای انسانی شناسایی شدند.

در مقابل، ۶۲ درصد از صداهای واقعی به درستی شناسایی شدند، بدین معنا که اختلاف در شناسایی این دو گروه بسیار ناچیز بوده است.

دکتر نادین لاوان، استاد روان‌شناسی در دانشگاه «کوئین مری لندن» و نویسنده اصلی این پژوهش، در گفت‌وگویی با یورونیوز بیان کرد: «یکی از مهم‌ترین نتایج این تحقیق این است که صداهای تولیدشده با هوش مصنوعی، به‌خصوص صداهای شبیه‌سازی‌شده از انسان، به اندازه‌ای طبیعی به گوش می‌رسند که از صدای واقعی قابل تمایز نیستند. جالب است که این صداها با ابزارهای تجاری و به‌راحتی در دسترس تولید می‌شوند و نیاز به تخصص فنی یا هزینه‌های اضافی ندارند.»

نگرانی‌های اخلاقی و ایمنی
فناوری شبیه‌سازی صدا توسط هوش مصنوعی با تحلیل و استخراج ویژگی‌های بدیع گفتار انسان کار می‌کند. این دقت بالا به‌خصوص باعث شده است که به ابزاری محبوب برای کلاهبرداران تلفنی تبدیل شود که بعضاً از ویدیوها یا پست‌های رسانه‌های اجتماعی برای تقلید صدای نزدیکان و دوستان استفاده می‌کنند.

پژوهشی از دانشگاه «پورتسموث» نشان‌دهنده این نکته است که دو سوم افراد بالای ۷۵ سال با تهدید تماس‌های کلاهبرداری تلفنی روبرو شده‌اند و تقریباً ۶۰ درصد از این تماس‌ها به‌وسیله صدا صورت می‌گیرد.

در صنعت سرگرمی، این فناوری نیز نگرانی‌هایی را به‌وجود آورده است؛ زیرا برخی از صداهای شخصیت‌های مشهور بدون اجازه آن‌ها مورد استفاده قرار گرفته است.

افزایش استفاده از «جعل صوتی عمیق» برای تقلید از سیاستمداران یا خبرنگاران به هدف تأثیرگذاری بر افکار عمومی و انتشار اطلاعات نادرست نیز جای نگرانی دارد.

دکتر لاوان تأکید می‌کند که شرکت‌های فناوری باید از این بابت دقت بیشتری داشته باشند: «ما به عنوان پژوهشگران توصیه می‌کنیم که شرکت‌های توسعه‌دهنده این فناوری بایستی با کارشناسان اخلاق و سیاست‌گذاران همکاری کنند تا مسائل مربوط به مالکیت صدا، رضایت افراد و ابعاد قانونی آن در این محیط همیشه در حال تغییر، واضح و روشن شود.»

جنبه‌های مثبت و کاربردهای مفید
در عین حال، صداهای مصنوعی می‌توانند به‌عنوان ابزاری برای کمک‌رسانی و انسان‌دوستانه نیز مورد استفاده قرار گیرند، به‌ویژه برای کسانی که از توانایی صحبت کردن محروم هستند.

خانم لاوان در این زمینه می‌گوید: «این نوع فناوری‌های کمکی سال‌هاست که وجود دارند؛ نمونه بارز آن استیون هاوکینگ است. تفاوتی که امروز وجود دارد این است که می‌توان صداهای مصنوعی را به‌طور شخصی‌سازی‌شده تنظیم کرد تا با هویت و سلیقه‌ فرد همخوانی داشته باشد. این امکان وجود دارد که کاربر صدای خود را بازسازی کند یا صدایی کاملاً جدید طراحی کند.»

وی همچنین اشاره می‌کند که اگر به‌طور اخلاقی استفاده شود، این فناوری می‌تواند دسترسی و تنوع را در حوزه آموزش، رسانه و کتاب‌های صوتی بهبود بخشد.

به‌عنوان مثال، یک پژوهش جدید نشان داده است که به‌کارگیری صدای هوش مصنوعی در آموزش شنیداری، می‌تواند انگیزه و تمرکز دانش‌آموزان را افزایش دهد.

یکی از قابلیت‌های جذاب دیگر این فناوری، توانایی تکثیر یک صدا به زبان‌های مختلف است؛ به این معنی که فرد می‌تواند هویت صوتی خود را حفظ کرده و به زبان‌های متنوع صحبت کند. دکتر لاوان بیان می‌کند که این ویژگی می‌تواند به طرز قابل توجهی ارتباطات جهانی و تبادل فرهنگی را متحول سازد.

مشاهده بیشتر

نوشته های مشابه

دکمه بازگشت به بالا