چالشی که هوش مصنوعی قادر به حل آن نیست

2 روز پیش

زمان مطالعه یک دقیقه

مرکز غیرانتفاعی ایمنی هوش مصنوعی (CAIS) و شرکت Scale AI که در زمینه خدمات برچسب‌گذاری داده و توسعه هوش مصنوعی فعالیت می‌کند، یک معیار چالش‌برانگیز جدید برای ارزیابی سیستم‌های هوش مصنوعی منتشر کرده‌اند.

به گزارش ایتنا و به نقل از تک‌کرانچ، این معیار که “آخرین آزمون بشریت” نام دارد، شامل هزاران سوال جمع‌آوری‌شده در حوزه‌های مختلفی چون ریاضیات، علوم انسانی و علوم طبیعی است. برای پیچیده‌تر کردن ارزیابی، سوال‌ها به صورت چندگانه طراحی شده‌اند و برخی از آن‌ها شامل نمودارها و تصاویر نیز می‌باشند.

در یک مطالعه اولیه، هیچ یک از سیستم‌های پیشرفته هوش مصنوعی که در دسترس عموم قرار دارند نتوانستند نمره‌ای بالاتر از 10 درصد در “آخرین آزمون بشریت” کسب کنند.

CAIS و Scale AI اعلام کرده‌اند که قصد دارند این معیار را برای جامعه تحقیقاتی باز کنند تا محققان بتوانند تغییرات مورد نظر را اعمال کرده و مدل‌های هوش مصنوعی جدید را بهتر ارزیابی کنند.

2 روز پیش

زمان مطالعه یک دقیقه

مشاهده بیشتر