
همه در حوزه هوش مصنوعی درباره Manus صحبت میکنند. ما آن را آزمایش کردیم.
تاریخ انتشار:
معرفی Manus
از زمان راهاندازی عامل هوش مصنوعی عمومی Manus در هفته گذشته، این ابزار به سرعت در اینترنت گسترش یافته است. نه تنها در چین، جایی که توسط استارتاپ Butterfly Effect مستقر در ووهان توسعه یافته، بلکه در سطح جهانی نیز مورد توجه قرار گرفته است. صداهای تأثیرگذار در حوزه فناوری، از جمله جک دورسی، همبنیانگذار توییتر و ویکتور موستار، مدیر محصول Hugging Face، عملکرد آن را تحسین کردهاند. برخی حتی آن را "دومین DeepSeek" نامیدهاند و آن را با مدل هوش مصنوعی قبلی که صنعت را با قابلیتهای غیرمنتظرهاش شگفتزده کرد، مقایسه کردهاند.
عملکرد Manus
Manus ادعا میکند که نخستین عامل هوش مصنوعی عمومی جهان است که از چندین مدل هوش مصنوعی (مانند Claude 3.5 Sonnet از Anthropic و نسخههای بهینهسازیشده Qwen منبع باز Alibaba) و عوامل مستقل مختلف برای انجام خودکار وظایف متنوع استفاده میکند. این ویژگی آن را از چتباتهای هوش مصنوعی، از جمله DeepSeek که بر اساس یک خانواده مدل زبانی بزرگ طراحی شدهاند و عمدتاً برای تعاملات گفتگویی طراحی شدهاند، متمایز میکند.
با وجود تمام تبلیغات، تعداد کمی از افراد فرصتی برای استفاده از آن پیدا کردهاند. در حال حاضر، کمتر از ۱٪ از کاربران در لیست انتظار، کد دعوت دریافت کردهاند. (تعداد دقیق افرادی که در این لیست هستند مشخص نیست، اما برای درک میزان علاقه، کانال Discord Manus بیش از ۱۸۶,۰۰۰ عضو دارد.)
آزمایش Manus
مجله MIT Technology Review توانست به Manus دسترسی پیدا کند و زمانی که من آن را آزمایش کردم، متوجه شدم که استفاده از آن شبیه همکاری با یک کارآموز بسیار باهوش و کارآمد است: در حالی که گاهی اوقات از درک آنچه از او خواسته میشود ناتوان است، فرضیات نادرستی میسازد یا برای تسریع در کارها از روشهای کوتاهمدت استفاده میکند، اما دلایل خود را به وضوح توضیح میدهد، به طرز شگفتانگیزی سازگار است و میتواند به طور قابل توجهی با ارائه دستورالعملها یا بازخوردهای دقیق بهبود یابد. در نهایت، این ابزار نویدبخش است اما کامل نیست.
مانند محصول قبلی شرکت مادرش، یک دستیار هوش مصنوعی به نام مونیکا که در سال ۲۰۲۳ منتشر شد، Manus برای مخاطبان جهانی طراحی شده است. زبان پیشفرض انگلیسی است و طراحی آن تمیز و مینیمالیستی است.

برای ورود به سیستم، کاربر باید یک کد دعوت معتبر وارد کند. سپس سیستم کاربران را به صفحه فرود هدایت میکند که شباهت زیادی به صفحات ChatGPT یا DeepSeek دارد، با نمایش جلسات قبلی در یک ستون سمت چپ و یک جعبه ورودی چت در مرکز. صفحه فرود همچنین شامل وظایف نمونهای است که توسط شرکت گردآوری شده است—از توسعه استراتژی کسبوکار تا یادگیری تعاملی و جلسات مدیتیشن صوتی سفارشی.
ویژگیهای خاص Manus
مانند سایر ابزارهای هوش مصنوعی مبتنی بر استدلال، مانند ChatGPT DeepResearch، Manus قادر به تقسیم وظایف به مراحل و پیمایش خودکار وب برای بهدست آوردن اطلاعات لازم برای تکمیل آنها است. آنچه Manus را متمایز میکند، پنجره "کامپیوتر Manus" است که به کاربران این امکان را میدهد که نه تنها مشاهده کنند که عامل چه کاری انجام میدهد، بلکه در هر نقطه مداخله کنند.
وظایف آزمایشی
برای آزمایش آن، من به Manus سه وظیفه دادم: (۱) تهیه فهرستی از خبرنگاران برجستهای که فناوری چین را پوشش میدهند، (۲) جستجوی فهرستهای املاک دوخوابه در نیویورک، و (۳) نامزد کردن افراد بالقوه برای لیست نوآوران زیر ۳۵ سال، لیستی که هر سال توسط MIT Technology Review تهیه میشود.
وظیفه ۱: فهرست خبرنگاران
فهرست اولیهای که Manus به من داد تنها شامل پنج نام بود، با پنج "ذکر افتخاری" در زیر آنها. متوجه شدم که برخی از کارهای برجسته خبرنگاران را ذکر کرده اما برای دیگران این کار را نکرده است. از Manus پرسیدم چرا. دلیلی که ارائه داد به طرز خندهداری ساده بود: آن تنبل شده بود. "این به دلیل محدودیتهای زمانی بود که سعی میکردم فرآیند تحقیق را تسریع کنم،" این عامل به من گفت. وقتی بر روی انسجام و دقت تأکید کردم، Manus با یک فهرست جامع از ۳۰ خبرنگار پاسخ داد و رسانه فعلی آنها و کارهای برجستهشان را ذکر کرد. (خوشحالم که دیدم نام من نیز در این فهرست قرار دارد، به همراه بسیاری از همکاران مورد علاقهام.)

من تحت تأثیر قرار گرفتم که توانستم پیشنهادات سطح بالایی برای تغییرات ارائه دهم، درست مانند اینکه با یک کارآموز یا دستیار واقعی کار میکنم، و اینکه آن به طور مناسب پاسخ داد. و در حالی که در ابتدا تغییرات در وضعیت کارفرمای برخی خبرنگاران را نادیده گرفت، وقتی از آن خواستم تا برخی نتایج را دوباره بررسی کند، به سرعت آنها را اصلاح کرد. ویژگی دیگری که جالب بود: خروجی به عنوان یک فایل Word یا Excel قابل دانلود بود که ویرایش یا به اشتراکگذاری آن را آسان میکرد.
وظیفه ۲: جستجوی آپارتمان
برای جستجوی آپارتمان، من مجموعهای پیچیده از معیارها را به Manus دادم، از جمله بودجه و چندین پارامتر: یک آشپزخانه جادار، فضای بیرونی، دسترسی به مرکز منهتن و ایستگاه قطار اصلی در فاصله هفت دقیقه پیادهروی. در ابتدا، Manus الزامات مبهمی مانند "نوعی فضای بیرونی" را به طور خیلی دقیق تفسیر کرد و به طور کامل املاکی که بدون دسترسی به تراس خصوصی یا بالکن بودند را حذف کرد. با این حال، پس از ارائه راهنمایی و توضیحات بیشتر، توانست فهرست وسیعتری و مفیدتری تهیه کند و پیشنهادات را به صورت طبقهبندیشده و با نقاط گلولهای مرتب ارائه دهد.
خروجی نهایی به وضوح از Wirecutter بود و شامل زیرعنوانهایی مانند "بهترین کلی"، "بهترین ارزش" و "گزینه لوکس" بود. این وظیفه (شامل رفت و برگشت) کمتر از نیم ساعت طول کشید—زمانی بسیار کمتر از تهیه فهرست خبرنگاران (که کمی بیش از یک ساعت طول کشید)، احتمالاً به این دلیل که فهرستهای املاک به طور عمومی در دسترس و به خوبی ساختار یافتهاند.
وظیفه ۳: نامزد کردن نوآوران زیر ۳۵ سال
این وظیفه بزرگترین در دامنه بود: از Manus خواستم ۵۰ نفر را برای لیست نوآوران زیر ۳۵ سال امسال نامزد کند. تهیه این فهرست یک کار بسیار بزرگ است و ما معمولاً هر سال صدها نامزدی دریافت میکنیم. بنابراین کنجکاو بودم که ببینم Manus چقدر خوب عمل میکند. این ابزار وظیفه را به مراحل تقسیم کرد، از جمله مرور فهرستهای گذشته برای درک معیارهای انتخاب، ایجاد یک استراتژی جستجو برای شناسایی نامزدها، تهیه نامها و اطمینان از انتخاب متنوع نامزدها از سرتاسر جهان.
توسعه یک استراتژی جستجو برای Manus زمانبرترین بخش بود. در حالی که آن به طور صریح رویکرد خود را مشخص نکرد، پنجره کامپیوتر Manus نشان داد که این عامل به سرعت در حال پیمایش در وبسایتهای دانشگاههای تحقیقاتی معتبر، اعلامیههای جوایز فناوری و مقالات خبری است. با این حال، دوباره با موانع مواجه شد وقتی که سعی کرد به مقالات علمی و محتوای رسانهای که پشت دیوارهای پرداخت قرار داشت، دسترسی پیدا کند.

پس از سه ساعت جستجو در اینترنت—که در طول آن Manus (به طور قابل درک) چندین بار از من خواست که آیا میتوانم جستجو را محدود کنم—تنها توانست سه نامزد با پروفایلهای کامل پسزمینه ارائه دهد. وقتی دوباره از آن خواستم که یک فهرست کامل از ۵۰ نام ارائه دهد، در نهایت یکی تولید کرد، اما برخی از مؤسسات و زمینههای علمی به شدت نمایندگی شده بودند، که نشاندهنده یک فرآیند تحقیق ناقص بود. پس از اینکه این مشکل را به آن گوشزد کردم و از آن خواستم که پنج نامزد از چین پیدا کند، توانست فهرست خوبی از پنج نام تهیه کند، هرچند نتایج به سمت محبوبهای رسانهای چین متمایل بود. در نهایت، من مجبور شدم تسلیم شوم بعد از اینکه سیستم هشدار داد که عملکرد Manus ممکن است اگر من همچنان متن زیادی وارد کنم، کاهش یابد.
جمعبندی
به طور کلی، من Manus را ابزاری بسیار شهودی یافتم که برای کاربران با یا بدون پیشزمینه کدنویسی مناسب است. در دو مورد از سه وظیفه، نتایج بهتری نسبت به ChatGPT DeepResearch ارائه داد، هرچند زمان بیشتری برای تکمیل آنها صرف کرد. به نظر میرسد Manus بهترین ابزار برای وظایف تحلیلی است که نیاز به تحقیق گسترده در اینترنت باز دارند اما دامنه محدودی دارند. به عبارت دیگر، بهتر است به کارهایی بپردازد که یک کارآموز ماهر میتواند در یک روز کاری انجام دهد.
با این حال، همه چیز به خوبی پیش نمیرود. Manus میتواند از خرابیهای مکرر و ناپایداری سیستم رنج ببرد و ممکن است در پردازش بخشهای بزرگ متن دچار مشکل شود. پیام "به دلیل بار بالای خدمات فعلی، وظایف نمیتوانند ایجاد شوند. لطفاً چند دقیقه دیگر تلاش کنید" چندین بار بر روی صفحه من ظاهر شد وقتی که سعی کردم درخواستهای جدیدی را شروع کنم، و گاهی اوقات کامپیوتر Manus برای مدت طولانی بر روی یک صفحه خاص متوقف میشد.
این ابزار نرخ شکست بالاتری نسبت به ChatGPT DeepResearch دارد—مشکلی که تیم در حال رسیدگی به آن است، به گفته Peak Ji، دانشمند ارشد Manus. با این حال، رسانه چینی 36Kr گزارش میدهد که هزینه هر وظیفه Manus حدود ۲ دلار است، که تنها یک دهم هزینه DeepResearch است. اگر تیم Manus زیرساخت سرور خود را تقویت کند، میتوانم ببینم که این ابزار به انتخاب مورد ترجیحی برای کاربران فردی، به ویژه حرفهایهای دفتری، توسعهدهندگان مستقل و تیمهای کوچک تبدیل شود.
در نهایت، فکر میکنم واقعاً ارزشمند است که فرآیند کاری Manus احساس نسبتاً شفاف و تعاملی دارد. این ابزار به طور فعال در طول مسیر سوالاتی میپرسد و دستورالعملهای کلیدی را به عنوان "دانش" در حافظه خود برای استفادههای آینده حفظ میکند، که این امکان را برای یک تجربه سفارشیسازی شده آسان فراهم میکند. همچنین واقعاً خوب است که هر جلسه قابل پخش مجدد و به اشتراکگذاری است.
من انتظار دارم که به استفاده از Manus برای انواع وظایف در زندگی شخصی و حرفهایام ادامه دهم. در حالی که مطمئن نیستم که مقایسهها با DeepSeek کاملاً درست باشد، این موضوع به عنوان شواهدی بیشتر نشان میدهد که شرکتهای هوش مصنوعی چینی تنها در پی پیروی از همتایان غربی خود نیستند. آنها به جای اینکه فقط بر روی مدلهای پایه نوآوری کنند، به طور فعال در حال شکلدهی به پذیرش عوامل هوش مصنوعی خودکار به روش خود هستند.