مدل جدید تولید تصویر Midjourney پس از بیش از یک سال معرفی شد

مدل جدید تولید تصویر Midjourney پس از بیش از یک سال معرفی شد

تاریخ انتشار:

مدل جدید تولید تصویر Midjourney پس از بیش از یک سال معرفی شد

معرفی مدل جدید V7

تولیدکننده تصویر هوش مصنوعی Midjourney امروز اولین مدل جدید خود را پس از مدت زمان طولانی معرفی کرد. این مدل که V7 نام دارد، یک بازنگری کامل از پایه است که هم‌اکنون در حالت آلفا برای کاربران در دسترس است.

بهبودهای V7

مدل V7 در دو زمینه بهبود یافته است: اول، تصاویر بهتر و دوم، ابزارها و روندهای جدید.

بهبود تصاویر

در زمینه بهبود تصاویر، V7 وعده می‌دهد که سازگاری و انسجام بسیار بالاتری برای دست‌ها، انگشتان، اعضای بدن و "اشیاء از همه نوع" ارائه دهد. همچنین بافت‌ها و مواد بسیار دقیق‌تر و واقع‌گرایانه‌تری مانند چین و چروک‌های پوست یا ظرافت‌های یک گلدان سرامیکی را ارائه می‌دهد.

این جزئیات معمولاً از واضح‌ترین نشانه‌های تولید تصویر با هوش مصنوعی هستند. برای روشن شدن، Midjourney ادعا نمی‌کند که پیشرفت‌هایی ایجاد کرده که تصاویر هوش مصنوعی را برای چشم‌های آموزش‌دیده غیرقابل شناسایی کرده است؛ بلکه فقط می‌گوید که برخی از بی‌نظمی‌هایی که به آن عادت کرده‌ایم به طور قابل توجهی تمیز شده است.

ویژگی‌های جدید

در زمینه ویژگی‌ها، ستاره این نمایش "حالت پیش‌نویس" جدید است. در کانال‌های ارتباطی مختلف خود با کاربران (یک وبلاگ، دیسکورد، X و غیره)، Midjourney می‌گوید که "حالت پیش‌نویس نیم هزینه و 10 برابر سریع‌تر تصاویر را رندر می‌کند." با این حال، تصاویر کیفیت کمتری نسبت به آنچه در حالت‌های دیگر دریافت می‌کنید، دارند، بنابراین این حالت برای تولید تصاویر نهایی در نظر گرفته نشده است. بلکه، این حالت به عنوان راهی برای تکرار و کاوش برای پیدا کردن نتیجه مطلوب قبل از تغییر حالت به منظور آماده‌سازی برای مصرف عمومی طراحی شده است.

حالت‌های V7

مدل V7 با دو حالت عرضه می‌شود: توربو و ریلکس. حالت توربو به سرعت تصاویر نهایی را تولید می‌کند اما هزینه آن دو برابر استفاده از اعتبار است، در حالی که حالت ریلکس زمان بیشتری می‌برد اما هزینه آن نصف است. به طرز عجیبی، در حال حاضر هیچ حالت استانداردی برای V7 وجود ندارد؛ Midjourney می‌گوید که این حالت بعداً ارائه خواهد شد، زیرا نیاز به زمان بیشتری برای بهبود دارد.

پارامترها و شخصی‌سازی

مدل V7 با اکثر پارامترهای نسخه‌های قبلی (--ar، --seed و غیره) کار می‌کند، از جمله کدهای --sref موجود کاربران از نسخه 6.1، همچنین ویژگی شخصی‌سازی که به تازگی معرفی شده است. در واقع، V7 اولین مدل Midjourney است که شخصی‌سازی به طور پیش‌فرض فعال است، به این معنی که کاربران باید با انتخاب حداقل 200 تصویر، پروفایل زیبایی‌شناسی خود را بسازند.

شخصی‌سازی به شما انتخاب بین دو تصویر را صدها بار ارائه می‌دهد تا بتواند آنچه را که "زیبا" می‌دانید، یاد بگیرد و تولیدات خود را به آن سلیقه‌ها متناسب کند. با این حال، می‌توانید شخصی‌سازی را در V7 غیرفعال کنید، درست مانند مدل‌های قبلی.

تاریخچه Midjourney

Midjourney یکی از اولین ابزارهای تولید تصویر هوش مصنوعی بود که به طور گسترده‌ای مورد استفاده قرار گرفت. در ابتدا، این ابزار در دیسکورد در دسترس بود و از طریق یک نحو نسبتاً پیچیده قابل استفاده بود، اما از آن زمان یک رابط وب مدرن‌تر راه‌اندازی کرده است.

بخش قابل توجهی از هنرهای هوش مصنوعی که در شبکه‌های اجتماعی به اشتراک گذاشته شده، با استفاده از دیسکورد ساخته شده است. این ابزار همچنین بخشی کلیدی از روند کار بسیاری از سازندگان ویدیوهای هوش مصنوعی است که معمولاً تصویر اولیه را در Midjourney ایجاد کرده و سپس از ویژگی تبدیل تصویر به ویدیو در برنامه‌هایی مانند Runway استفاده می‌کنند.

چالش‌های قانونی

با این حال، با وجود محبوبیتش، Midjourney موضوع چندین دعوی قضایی بوده و بخشی از بحث‌های جاری درباره این است که آیا آموزش مدل‌های هوش مصنوعی بر روی آثار دارای حق کپی که در وب یافت می‌شود، استفاده منصفانه محسوب می‌شود یا خیر. (هر کسی که از Midjourney استفاده کرده باشد، می‌داند که این ابزار بر روی آثار دارای حق کپی آموزش دیده است؛ حتی گاهی اوقات در خروجی‌های خود، واترمارک‌ها و امضای هنرمندان را تولید می‌کند.)

آینده Midjourney

به تازگی، این شرکت اعلام کرد که قصد دارد در آینده سخت‌افزار جدیدی را راه‌اندازی کند، اما هنوز مشخص نیست که این سخت‌افزار چه شکلی خواهد داشت.

V7 can reproduce materials and lighting situations that V6.1 usually couldn't.
An AI-generated image of a woman playing cards, with normal looking hands
منبع:Ars Technica
در حال بارگذاری نظرات...
نظر شما:
0/800