دیپ کُگیتو از حالت پنهان خارج شد با مدل‌های هوش مصنوعی ترکیبی "استدلال"

دیپ کُگیتو از حالت پنهان خارج شد با مدل‌های هوش مصنوعی ترکیبی "استدلال"

تاریخ انتشار:

دیپ کُگیتو از حالت پنهان خارج شد با مدل‌های هوش مصنوعی ترکیبی "استدلال"

معرفی دیپ کُگیتو

شرکت جدیدی به نام دیپ کُگیتو از حالت پنهان خارج شده و مجموعه‌ای از مدل‌های هوش مصنوعی را معرفی کرده است که به‌طور عمومی در دسترس هستند و می‌توانند بین حالت‌های "استدلال" و غیر استدلالی سوئیچ کنند.

مدل‌های استدلالی و عملکرد آن‌ها

مدل‌های استدلالی مانند o1 از OpenAI در حوزه‌هایی مانند ریاضیات و فیزیک بسیار امیدوارکننده عمل کرده‌اند، به‌خاطر توانایی آن‌ها در بررسی صحت خود با حل مسائل پیچیده به‌صورت مرحله‌به‌مرحله. با این حال، این نوع استدلال هزینه‌ای دارد: نیاز به محاسبات بیشتر و تأخیر بالا. به همین دلیل، آزمایشگاه‌هایی مانند Anthropic به دنبال معماری‌های مدل "ترکیبی" هستند که اجزای استدلالی را با عناصر استاندارد و غیر استدلالی ترکیب می‌کنند. مدل‌های ترکیبی می‌توانند به‌سرعت به سوالات ساده پاسخ دهند و در عین حال زمان بیشتری را برای بررسی سوالات چالش‌برانگیز صرف کنند.

مدل‌های کُگیتو 1

تمام مدل‌های دیپ کُگیتو که به نام کُگیتو 1 شناخته می‌شوند، مدل‌های ترکیبی هستند. کُگیتو ادعا می‌کند که این مدل‌ها در مقایسه با بهترین مدل‌های باز موجود در همان اندازه، از جمله مدل‌های متا و استارتاپ هوش مصنوعی چینی DeepSeek، عملکرد بهتری دارند.

این شرکت در یک پست وبلاگی توضیح داد: "هر مدل می‌تواند به‌طور مستقیم پاسخ دهد [...] یا قبل از پاسخ دادن خود را بازتاب دهد (مانند مدل‌های استدلالی). [همه] توسط یک تیم کوچک در حدود 75 روز توسعه یافته‌اند."

پارامترها و عملکرد مدل‌ها

مدل‌های کُگیتو 1 از 3 میلیارد پارامتر تا 70 میلیارد پارامتر متغیر هستند و کُگیتو اعلام کرده است که مدل‌هایی با حداکثر 671 میلیارد پارامتر در هفته‌ها و ماه‌های آینده به این مجموعه اضافه خواهند شد. پارامترها به‌طور تقریبی با مهارت‌های حل مسئله یک مدل هم‌خوانی دارند و معمولاً هر چه تعداد پارامترها بیشتر باشد، عملکرد بهتری را ارائه می‌دهند.

لازم به ذکر است که کُگیتو 1 از صفر توسعه نیافته است. دیپ کُگیتو بر روی مدل‌های باز لاما از متا و مدل‌های Qwen از علی‌بابا ساخته است تا مدل‌های خود را ایجاد کند. این شرکت می‌گوید که رویکردهای آموزشی نوآورانه‌ای را برای بهبود عملکرد مدل‌های پایه و فعال‌سازی استدلال قابل تغییر به کار برده است.

نتایج ارزیابی داخلی کُگیتو

بر اساس نتایج ارزیابی‌های داخلی کُگیتو، بزرگ‌ترین مدل کُگیتو 1، یعنی کُگیتو 70B، با فعال بودن استدلال، در چند ارزیابی ریاضی و زبانی از مدل استدلالی R1 DeepSeek پیشی می‌گیرد. همچنین، کُگیتو 70B با غیرفعال بودن استدلال، مدل لاما 4 اسکاوت متا را در LiveBench، یک آزمون هوش مصنوعی عمومی، پشت سر می‌گذارد.

دسترسی به مدل‌های کُگیتو

هر مدل کُگیتو 1 برای دانلود یا استفاده از طریق APIها در ارائه‌دهندگان ابری Fireworks AI و Together AI در دسترس است.

چشم‌انداز آینده

کُگیتو در پست وبلاگی خود نوشت: "در حال حاضر، ما هنوز در مراحل اولیه منحنی مقیاس‌پذیری خود هستیم و تنها از بخشی از محاسباتی که معمولاً برای آموزش مداوم مدل‌های زبان بزرگ سنتی اختصاص داده می‌شود، استفاده کرده‌ایم. در آینده، ما در حال بررسی رویکردهای مکمل پس از آموزش برای بهبود خود هستیم."

تأسیس دیپ کُگیتو

بر اساس پرونده‌های ثبت‌شده در ایالت کالیفرنیا، دیپ کُگیتو در ژوئن 2024 تأسیس شده است. صفحه لینکدین این شرکت دو هم‌بنیان‌گذار، دریشان آروآ و درهو مالهوتر را معرفی می‌کند. مالهوتر پیش‌تر مدیر محصول در آزمایشگاه هوش مصنوعی گوگل دیپ‌مایند بود و بر روی فناوری جستجوی تولیدی کار کرده است. آروآ نیز مهندس نرم‌افزار ارشد در گوگل بوده است.

هدف دیپ کُگیتو

دیپ کُگیتو که حامیان آن شامل South Park Commons هستند، به‌طور بلندپروازانه‌ای هدف دارد تا "هوش فوق‌العاده عمومی" بسازد. بنیان‌گذاران این شرکت این عبارت را به معنای هوش مصنوعی می‌دانند که می‌تواند کارها را بهتر از بیشتر انسان‌ها انجام دهد و "قابلیت‌های کاملاً جدیدی را کشف کند که هنوز تصور نکرده‌ایم."

Deep Cogito
Abstract technology background with polygonal grid analyze and data. Analytics algorithms data. Quantum computing concept. Big data. Banner for business, science and technology.
منبع:Techcrunch
در حال بارگذاری نظرات...
نظر شما:
0/800