همه در حوزه هوش مصنوعی درباره Manus صحبت می‌کنند. ما آن را آزمایش کردیم.

همه در حوزه هوش مصنوعی درباره Manus صحبت می‌کنند. ما آن را آزمایش کردیم.

تاریخ انتشار:

بررسی عملکرد Manus، عامل هوش مصنوعی جدید چین و مقایسه آن با دیگر ابزارها.

معرفی Manus

از زمان راه‌اندازی عامل هوش مصنوعی عمومی Manus در هفته گذشته، این ابزار به سرعت در اینترنت گسترش یافته است. نه تنها در چین، جایی که توسط استارتاپ Butterfly Effect مستقر در ووهان توسعه یافته، بلکه در سطح جهانی نیز مورد توجه قرار گرفته است. صداهای تأثیرگذار در حوزه فناوری، از جمله جک دورسی، هم‌بنیان‌گذار توییتر و ویکتور موستار، مدیر محصول Hugging Face، عملکرد آن را تحسین کرده‌اند. برخی حتی آن را "دومین DeepSeek" نامیده‌اند و آن را با مدل هوش مصنوعی قبلی که صنعت را با قابلیت‌های غیرمنتظره‌اش شگفت‌زده کرد، مقایسه کرده‌اند.

عملکرد Manus

Manus ادعا می‌کند که نخستین عامل هوش مصنوعی عمومی جهان است که از چندین مدل هوش مصنوعی (مانند Claude 3.5 Sonnet از Anthropic و نسخه‌های بهینه‌سازی‌شده Qwen منبع باز Alibaba) و عوامل مستقل مختلف برای انجام خودکار وظایف متنوع استفاده می‌کند. این ویژگی آن را از چت‌بات‌های هوش مصنوعی، از جمله DeepSeek که بر اساس یک خانواده مدل زبانی بزرگ طراحی شده‌اند و عمدتاً برای تعاملات گفتگویی طراحی شده‌اند، متمایز می‌کند.

با وجود تمام تبلیغات، تعداد کمی از افراد فرصتی برای استفاده از آن پیدا کرده‌اند. در حال حاضر، کمتر از ۱٪ از کاربران در لیست انتظار، کد دعوت دریافت کرده‌اند. (تعداد دقیق افرادی که در این لیست هستند مشخص نیست، اما برای درک میزان علاقه، کانال Discord Manus بیش از ۱۸۶,۰۰۰ عضو دارد.)

آزمایش Manus

مجله MIT Technology Review توانست به Manus دسترسی پیدا کند و زمانی که من آن را آزمایش کردم، متوجه شدم که استفاده از آن شبیه همکاری با یک کارآموز بسیار باهوش و کارآمد است: در حالی که گاهی اوقات از درک آنچه از او خواسته می‌شود ناتوان است، فرضیات نادرستی می‌سازد یا برای تسریع در کارها از روش‌های کوتاه‌مدت استفاده می‌کند، اما دلایل خود را به وضوح توضیح می‌دهد، به طرز شگفت‌انگیزی سازگار است و می‌تواند به طور قابل توجهی با ارائه دستورالعمل‌ها یا بازخوردهای دقیق بهبود یابد. در نهایت، این ابزار نویدبخش است اما کامل نیست.

مانند محصول قبلی شرکت مادرش، یک دستیار هوش مصنوعی به نام مونیکا که در سال ۲۰۲۳ منتشر شد، Manus برای مخاطبان جهانی طراحی شده است. زبان پیش‌فرض انگلیسی است و طراحی آن تمیز و مینیمالیستی است.

a chat bubble with two Manus logo hands intersects with a computer

برای ورود به سیستم، کاربر باید یک کد دعوت معتبر وارد کند. سپس سیستم کاربران را به صفحه فرود هدایت می‌کند که شباهت زیادی به صفحات ChatGPT یا DeepSeek دارد، با نمایش جلسات قبلی در یک ستون سمت چپ و یک جعبه ورودی چت در مرکز. صفحه فرود همچنین شامل وظایف نمونه‌ای است که توسط شرکت گردآوری شده است—از توسعه استراتژی کسب‌وکار تا یادگیری تعاملی و جلسات مدیتیشن صوتی سفارشی.

ویژگی‌های خاص Manus

مانند سایر ابزارهای هوش مصنوعی مبتنی بر استدلال، مانند ChatGPT DeepResearch، Manus قادر به تقسیم وظایف به مراحل و پیمایش خودکار وب برای به‌دست آوردن اطلاعات لازم برای تکمیل آن‌ها است. آنچه Manus را متمایز می‌کند، پنجره "کامپیوتر Manus" است که به کاربران این امکان را می‌دهد که نه تنها مشاهده کنند که عامل چه کاری انجام می‌دهد، بلکه در هر نقطه مداخله کنند.

وظایف آزمایشی

برای آزمایش آن، من به Manus سه وظیفه دادم: (۱) تهیه فهرستی از خبرنگاران برجسته‌ای که فناوری چین را پوشش می‌دهند، (۲) جستجوی فهرست‌های املاک دوخوابه در نیویورک، و (۳) نامزد کردن افراد بالقوه برای لیست نوآوران زیر ۳۵ سال، لیستی که هر سال توسط MIT Technology Review تهیه می‌شود.

وظیفه ۱: فهرست خبرنگاران

فهرست اولیه‌ای که Manus به من داد تنها شامل پنج نام بود، با پنج "ذکر افتخاری" در زیر آن‌ها. متوجه شدم که برخی از کارهای برجسته خبرنگاران را ذکر کرده اما برای دیگران این کار را نکرده است. از Manus پرسیدم چرا. دلیلی که ارائه داد به طرز خنده‌داری ساده بود: آن تنبل شده بود. "این به دلیل محدودیت‌های زمانی بود که سعی می‌کردم فرآیند تحقیق را تسریع کنم،" این عامل به من گفت. وقتی بر روی انسجام و دقت تأکید کردم، Manus با یک فهرست جامع از ۳۰ خبرنگار پاسخ داد و رسانه فعلی آن‌ها و کارهای برجسته‌شان را ذکر کرد. (خوشحالم که دیدم نام من نیز در این فهرست قرار دارد، به همراه بسیاری از همکاران مورد علاقه‌ام.)

Image 2

من تحت تأثیر قرار گرفتم که توانستم پیشنهادات سطح بالایی برای تغییرات ارائه دهم، درست مانند اینکه با یک کارآموز یا دستیار واقعی کار می‌کنم، و اینکه آن به طور مناسب پاسخ داد. و در حالی که در ابتدا تغییرات در وضعیت کارفرمای برخی خبرنگاران را نادیده گرفت، وقتی از آن خواستم تا برخی نتایج را دوباره بررسی کند، به سرعت آن‌ها را اصلاح کرد. ویژگی دیگری که جالب بود: خروجی به عنوان یک فایل Word یا Excel قابل دانلود بود که ویرایش یا به اشتراک‌گذاری آن را آسان می‌کرد.

وظیفه ۲: جستجوی آپارتمان

برای جستجوی آپارتمان، من مجموعه‌ای پیچیده از معیارها را به Manus دادم، از جمله بودجه و چندین پارامتر: یک آشپزخانه جادار، فضای بیرونی، دسترسی به مرکز منهتن و ایستگاه قطار اصلی در فاصله هفت دقیقه پیاده‌روی. در ابتدا، Manus الزامات مبهمی مانند "نوعی فضای بیرونی" را به طور خیلی دقیق تفسیر کرد و به طور کامل املاکی که بدون دسترسی به تراس خصوصی یا بالکن بودند را حذف کرد. با این حال، پس از ارائه راهنمایی و توضیحات بیشتر، توانست فهرست وسیع‌تری و مفیدتری تهیه کند و پیشنهادات را به صورت طبقه‌بندی‌شده و با نقاط گلوله‌ای مرتب ارائه دهد.

خروجی نهایی به وضوح از Wirecutter بود و شامل زیرعنوان‌هایی مانند "بهترین کلی"، "بهترین ارزش" و "گزینه لوکس" بود. این وظیفه (شامل رفت و برگشت) کمتر از نیم ساعت طول کشید—زمانی بسیار کمتر از تهیه فهرست خبرنگاران (که کمی بیش از یک ساعت طول کشید)، احتمالاً به این دلیل که فهرست‌های املاک به طور عمومی در دسترس و به خوبی ساختار یافته‌اند.

وظیفه ۳: نامزد کردن نوآوران زیر ۳۵ سال

این وظیفه بزرگ‌ترین در دامنه بود: از Manus خواستم ۵۰ نفر را برای لیست نوآوران زیر ۳۵ سال امسال نامزد کند. تهیه این فهرست یک کار بسیار بزرگ است و ما معمولاً هر سال صدها نامزدی دریافت می‌کنیم. بنابراین کنجکاو بودم که ببینم Manus چقدر خوب عمل می‌کند. این ابزار وظیفه را به مراحل تقسیم کرد، از جمله مرور فهرست‌های گذشته برای درک معیارهای انتخاب، ایجاد یک استراتژی جستجو برای شناسایی نامزدها، تهیه نام‌ها و اطمینان از انتخاب متنوع نامزدها از سرتاسر جهان.

توسعه یک استراتژی جستجو برای Manus زمان‌برترین بخش بود. در حالی که آن به طور صریح رویکرد خود را مشخص نکرد، پنجره کامپیوتر Manus نشان داد که این عامل به سرعت در حال پیمایش در وب‌سایت‌های دانشگاه‌های تحقیقاتی معتبر، اعلامیه‌های جوایز فناوری و مقالات خبری است. با این حال، دوباره با موانع مواجه شد وقتی که سعی کرد به مقالات علمی و محتوای رسانه‌ای که پشت دیوارهای پرداخت قرار داشت، دسترسی پیدا کند.

Image 3

پس از سه ساعت جستجو در اینترنت—که در طول آن Manus (به طور قابل درک) چندین بار از من خواست که آیا می‌توانم جستجو را محدود کنم—تنها توانست سه نامزد با پروفایل‌های کامل پس‌زمینه ارائه دهد. وقتی دوباره از آن خواستم که یک فهرست کامل از ۵۰ نام ارائه دهد، در نهایت یکی تولید کرد، اما برخی از مؤسسات و زمینه‌های علمی به شدت نمایندگی شده بودند، که نشان‌دهنده یک فرآیند تحقیق ناقص بود. پس از اینکه این مشکل را به آن گوشزد کردم و از آن خواستم که پنج نامزد از چین پیدا کند، توانست فهرست خوبی از پنج نام تهیه کند، هرچند نتایج به سمت محبوب‌های رسانه‌ای چین متمایل بود. در نهایت، من مجبور شدم تسلیم شوم بعد از اینکه سیستم هشدار داد که عملکرد Manus ممکن است اگر من همچنان متن زیادی وارد کنم، کاهش یابد.

جمع‌بندی

به طور کلی، من Manus را ابزاری بسیار شهودی یافتم که برای کاربران با یا بدون پیش‌زمینه کدنویسی مناسب است. در دو مورد از سه وظیفه، نتایج بهتری نسبت به ChatGPT DeepResearch ارائه داد، هرچند زمان بیشتری برای تکمیل آن‌ها صرف کرد. به نظر می‌رسد Manus بهترین ابزار برای وظایف تحلیلی است که نیاز به تحقیق گسترده در اینترنت باز دارند اما دامنه محدودی دارند. به عبارت دیگر، بهتر است به کارهایی بپردازد که یک کارآموز ماهر می‌تواند در یک روز کاری انجام دهد.

با این حال، همه چیز به خوبی پیش نمی‌رود. Manus می‌تواند از خرابی‌های مکرر و ناپایداری سیستم رنج ببرد و ممکن است در پردازش بخش‌های بزرگ متن دچار مشکل شود. پیام "به دلیل بار بالای خدمات فعلی، وظایف نمی‌توانند ایجاد شوند. لطفاً چند دقیقه دیگر تلاش کنید" چندین بار بر روی صفحه من ظاهر شد وقتی که سعی کردم درخواست‌های جدیدی را شروع کنم، و گاهی اوقات کامپیوتر Manus برای مدت طولانی بر روی یک صفحه خاص متوقف می‌شد.

این ابزار نرخ شکست بالاتری نسبت به ChatGPT DeepResearch دارد—مشکلی که تیم در حال رسیدگی به آن است، به گفته Peak Ji، دانشمند ارشد Manus. با این حال، رسانه چینی 36Kr گزارش می‌دهد که هزینه هر وظیفه Manus حدود ۲ دلار است، که تنها یک دهم هزینه DeepResearch است. اگر تیم Manus زیرساخت سرور خود را تقویت کند، می‌توانم ببینم که این ابزار به انتخاب مورد ترجیحی برای کاربران فردی، به ویژه حرفه‌ای‌های دفتری، توسعه‌دهندگان مستقل و تیم‌های کوچک تبدیل شود.

در نهایت، فکر می‌کنم واقعاً ارزشمند است که فرآیند کاری Manus احساس نسبتاً شفاف و تعاملی دارد. این ابزار به طور فعال در طول مسیر سوالاتی می‌پرسد و دستورالعمل‌های کلیدی را به عنوان "دانش" در حافظه خود برای استفاده‌های آینده حفظ می‌کند، که این امکان را برای یک تجربه سفارشی‌سازی شده آسان فراهم می‌کند. همچنین واقعاً خوب است که هر جلسه قابل پخش مجدد و به اشتراک‌گذاری است.

من انتظار دارم که به استفاده از Manus برای انواع وظایف در زندگی شخصی و حرفه‌ای‌ام ادامه دهم. در حالی که مطمئن نیستم که مقایسه‌ها با DeepSeek کاملاً درست باشد، این موضوع به عنوان شواهدی بیشتر نشان می‌دهد که شرکت‌های هوش مصنوعی چینی تنها در پی پیروی از همتایان غربی خود نیستند. آن‌ها به جای اینکه فقط بر روی مدل‌های پایه نوآوری کنند، به طور فعال در حال شکل‌دهی به پذیرش عوامل هوش مصنوعی خودکار به روش خود هستند.

در حال بارگذاری نظرات...
نظر شما:
0/800