نسخه تازه هوش مصنوعی دیپ سیک منتشر گردید

استارتاپ چینی دیپ سیک با معرفی جدیدترین مدل خود، تحولی بزرگ در حوزه هوش مصنوعی جهانی به وجود آورد.

این مدل نوین شامل ۶۸۵ میلیارد پارامتر است که به چالش کشیدن تسلط شرکت‌های بزرگ فناوری آمریکایی در این زمینه را به همراه دارد و به طور همزمان، چشم‌انداز رقابت در این حوزه را با فراهم کردن دسترسی منبع باز دگرگون می‌سازد.

این شرکت چینی به طرز آرامی، مدل دیپ سیک V۳.۱ را در بستر Hugging Face منتشر نمود. در ساعت‌های ابتدایی پس از رونمایی از این مدل، آزمون‌های اولیه نشان داد که امتیاز بنچمارک آن از رقبای موجود نظیر محصولات اوپن‌ای‌آی و آنتروپیک برتر است. همچنین، منبع باز بودن این مدل، دسترسی جهانی به آن را بدون دغدغه‌های ژئوپلیتیکی تضمین می‌کند.

رونمایی از دیپ سیک V۳.۱ به هیچ عنوان یک پیشرفت ساده در قابلیت‌های هوش مصنوعی نیست؛ این رویداد نمایانگر یک دگرگونی بنیادی در شیوه توسعه، توزیع و کنترل پیشرفته‌ترین سیستم‌های هوش مصنوعی جهان می‌باشد، تغییراتی که می‌تواند عواقب عمیقی برای رقابت فناوری میان آمریکا و چین به دنبال داشته باشد.

چند ساعت پس از معرفی این مدل در پلتفرم Hugging Face، محبوبیت آن به طور چشمگیری در رتبه‌بندی‌ها افزایش یافت و تقدیر پژوهشگران بین‌المللی که آن را دانلود و قابلیت‌هایش را بررسی کردند، به دنبال داشت. این مدل موفق به کسب امتیاز ۷۱.۶ درصد در بنچمارک کد نویسی Aider شد و به عنوان یکی از مدل‌های با عملکرد برتر شناخته شد و به طور مستقیم قدرت غول‌های هوش مصنوعی آمریکایی را به چالش کشید.

دیپ سیک V۳.۱ ابتکارات مهندسی چشمگیری را معرفی می‌کند که انتظارات از عملکرد مدل‌های هوش مصنوعی را مجدداً تعریف می‌نماید. این سیستم توانایی پردازش ۱۲۸ هزار توکن متنی (تقریباً برابر با یک کتاب ۴۰۰ صفحه‌ای) را دارد و سرعت پاسخگویی آن نیز به مراتب سریع‌تر از رقبای خود است. این مدل از فرمت‌های مختلف دقت از BF۱۶ استاندارد تا FP۸ آزمایشی پشتیبانی می‌کند و این امر به توسعه‌دهندگان این امکان را می‌دهد تا عملکرد را با توجه به محدودیت‌های خاص سخت‌افزاری خود بهینه‌سازی کنند.

پیشرفت کلیدی در آنچه که دیپ سیک ساختار هیبریدی می‌نامد، نهفته است. بر خلاف تلاش‌های پیشین برای ادغام قابلیت‌های مختلف هوش مصنوعی که منجر به ایجاد سیستم‌هایی با عملکرد ضعیف در تمامی حوزه‌ها می‌شد، مدل V۳.۱ ویژگی‌های چت استدلال و قابلیت‌های کد نویسی را در یک مدل یکپارچه و هماهنگ به هم پیوند داده است.

منبع: مهر

مشاهده بیشتر

نوشته های مشابه

دکمه بازگشت به بالا