
دیپ کُگیتو از حالت پنهان خارج شد با مدلهای هوش مصنوعی ترکیبی "استدلال"
تاریخ انتشار:
معرفی دیپ کُگیتو
شرکت جدیدی به نام دیپ کُگیتو از حالت پنهان خارج شده و مجموعهای از مدلهای هوش مصنوعی را معرفی کرده است که بهطور عمومی در دسترس هستند و میتوانند بین حالتهای "استدلال" و غیر استدلالی سوئیچ کنند.
مدلهای استدلالی و عملکرد آنها
مدلهای استدلالی مانند o1 از OpenAI در حوزههایی مانند ریاضیات و فیزیک بسیار امیدوارکننده عمل کردهاند، بهخاطر توانایی آنها در بررسی صحت خود با حل مسائل پیچیده بهصورت مرحلهبهمرحله. با این حال، این نوع استدلال هزینهای دارد: نیاز به محاسبات بیشتر و تأخیر بالا. به همین دلیل، آزمایشگاههایی مانند Anthropic به دنبال معماریهای مدل "ترکیبی" هستند که اجزای استدلالی را با عناصر استاندارد و غیر استدلالی ترکیب میکنند. مدلهای ترکیبی میتوانند بهسرعت به سوالات ساده پاسخ دهند و در عین حال زمان بیشتری را برای بررسی سوالات چالشبرانگیز صرف کنند.
مدلهای کُگیتو 1
تمام مدلهای دیپ کُگیتو که به نام کُگیتو 1 شناخته میشوند، مدلهای ترکیبی هستند. کُگیتو ادعا میکند که این مدلها در مقایسه با بهترین مدلهای باز موجود در همان اندازه، از جمله مدلهای متا و استارتاپ هوش مصنوعی چینی DeepSeek، عملکرد بهتری دارند.
این شرکت در یک پست وبلاگی توضیح داد: "هر مدل میتواند بهطور مستقیم پاسخ دهد [...] یا قبل از پاسخ دادن خود را بازتاب دهد (مانند مدلهای استدلالی). [همه] توسط یک تیم کوچک در حدود 75 روز توسعه یافتهاند."
پارامترها و عملکرد مدلها
مدلهای کُگیتو 1 از 3 میلیارد پارامتر تا 70 میلیارد پارامتر متغیر هستند و کُگیتو اعلام کرده است که مدلهایی با حداکثر 671 میلیارد پارامتر در هفتهها و ماههای آینده به این مجموعه اضافه خواهند شد. پارامترها بهطور تقریبی با مهارتهای حل مسئله یک مدل همخوانی دارند و معمولاً هر چه تعداد پارامترها بیشتر باشد، عملکرد بهتری را ارائه میدهند.
لازم به ذکر است که کُگیتو 1 از صفر توسعه نیافته است. دیپ کُگیتو بر روی مدلهای باز لاما از متا و مدلهای Qwen از علیبابا ساخته است تا مدلهای خود را ایجاد کند. این شرکت میگوید که رویکردهای آموزشی نوآورانهای را برای بهبود عملکرد مدلهای پایه و فعالسازی استدلال قابل تغییر به کار برده است.
نتایج ارزیابی داخلی کُگیتو
بر اساس نتایج ارزیابیهای داخلی کُگیتو، بزرگترین مدل کُگیتو 1، یعنی کُگیتو 70B، با فعال بودن استدلال، در چند ارزیابی ریاضی و زبانی از مدل استدلالی R1 DeepSeek پیشی میگیرد. همچنین، کُگیتو 70B با غیرفعال بودن استدلال، مدل لاما 4 اسکاوت متا را در LiveBench، یک آزمون هوش مصنوعی عمومی، پشت سر میگذارد.
دسترسی به مدلهای کُگیتو
هر مدل کُگیتو 1 برای دانلود یا استفاده از طریق APIها در ارائهدهندگان ابری Fireworks AI و Together AI در دسترس است.
چشمانداز آینده
کُگیتو در پست وبلاگی خود نوشت: "در حال حاضر، ما هنوز در مراحل اولیه منحنی مقیاسپذیری خود هستیم و تنها از بخشی از محاسباتی که معمولاً برای آموزش مداوم مدلهای زبان بزرگ سنتی اختصاص داده میشود، استفاده کردهایم. در آینده، ما در حال بررسی رویکردهای مکمل پس از آموزش برای بهبود خود هستیم."
تأسیس دیپ کُگیتو
بر اساس پروندههای ثبتشده در ایالت کالیفرنیا، دیپ کُگیتو در ژوئن 2024 تأسیس شده است. صفحه لینکدین این شرکت دو همبنیانگذار، دریشان آروآ و درهو مالهوتر را معرفی میکند. مالهوتر پیشتر مدیر محصول در آزمایشگاه هوش مصنوعی گوگل دیپمایند بود و بر روی فناوری جستجوی تولیدی کار کرده است. آروآ نیز مهندس نرمافزار ارشد در گوگل بوده است.
هدف دیپ کُگیتو
دیپ کُگیتو که حامیان آن شامل South Park Commons هستند، بهطور بلندپروازانهای هدف دارد تا "هوش فوقالعاده عمومی" بسازد. بنیانگذاران این شرکت این عبارت را به معنای هوش مصنوعی میدانند که میتواند کارها را بهتر از بیشتر انسانها انجام دهد و "قابلیتهای کاملاً جدیدی را کشف کند که هنوز تصور نکردهایم."

