چالشی که هوش مصنوعی قادر به حل آن نیست
مرکز غیرانتفاعی ایمنی هوش مصنوعی (CAIS) و شرکت Scale AI که در زمینه خدمات برچسبگذاری داده و توسعه هوش مصنوعی فعالیت میکند، یک معیار چالشبرانگیز جدید برای ارزیابی سیستمهای هوش مصنوعی منتشر کردهاند.
به گزارش ایتنا و به نقل از تککرانچ، این معیار که “آخرین آزمون بشریت” نام دارد، شامل هزاران سوال جمعآوریشده در حوزههای مختلفی چون ریاضیات، علوم انسانی و علوم طبیعی است. برای پیچیدهتر کردن ارزیابی، سوالها به صورت چندگانه طراحی شدهاند و برخی از آنها شامل نمودارها و تصاویر نیز میباشند.
در یک مطالعه اولیه، هیچ یک از سیستمهای پیشرفته هوش مصنوعی که در دسترس عموم قرار دارند نتوانستند نمرهای بالاتر از 10 درصد در “آخرین آزمون بشریت” کسب کنند.
CAIS و Scale AI اعلام کردهاند که قصد دارند این معیار را برای جامعه تحقیقاتی باز کنند تا محققان بتوانند تغییرات مورد نظر را اعمال کرده و مدلهای هوش مصنوعی جدید را بهتر ارزیابی کنند.