
مدل جدید تولید تصویر Midjourney پس از بیش از یک سال معرفی شد
تاریخ انتشار:
معرفی مدل جدید V7
تولیدکننده تصویر هوش مصنوعی Midjourney امروز اولین مدل جدید خود را پس از مدت زمان طولانی معرفی کرد. این مدل که V7 نام دارد، یک بازنگری کامل از پایه است که هماکنون در حالت آلفا برای کاربران در دسترس است.
بهبودهای V7
مدل V7 در دو زمینه بهبود یافته است: اول، تصاویر بهتر و دوم، ابزارها و روندهای جدید.
بهبود تصاویر
در زمینه بهبود تصاویر، V7 وعده میدهد که سازگاری و انسجام بسیار بالاتری برای دستها، انگشتان، اعضای بدن و "اشیاء از همه نوع" ارائه دهد. همچنین بافتها و مواد بسیار دقیقتر و واقعگرایانهتری مانند چین و چروکهای پوست یا ظرافتهای یک گلدان سرامیکی را ارائه میدهد.
این جزئیات معمولاً از واضحترین نشانههای تولید تصویر با هوش مصنوعی هستند. برای روشن شدن، Midjourney ادعا نمیکند که پیشرفتهایی ایجاد کرده که تصاویر هوش مصنوعی را برای چشمهای آموزشدیده غیرقابل شناسایی کرده است؛ بلکه فقط میگوید که برخی از بینظمیهایی که به آن عادت کردهایم به طور قابل توجهی تمیز شده است.
ویژگیهای جدید
در زمینه ویژگیها، ستاره این نمایش "حالت پیشنویس" جدید است. در کانالهای ارتباطی مختلف خود با کاربران (یک وبلاگ، دیسکورد، X و غیره)، Midjourney میگوید که "حالت پیشنویس نیم هزینه و 10 برابر سریعتر تصاویر را رندر میکند." با این حال، تصاویر کیفیت کمتری نسبت به آنچه در حالتهای دیگر دریافت میکنید، دارند، بنابراین این حالت برای تولید تصاویر نهایی در نظر گرفته نشده است. بلکه، این حالت به عنوان راهی برای تکرار و کاوش برای پیدا کردن نتیجه مطلوب قبل از تغییر حالت به منظور آمادهسازی برای مصرف عمومی طراحی شده است.
حالتهای V7
مدل V7 با دو حالت عرضه میشود: توربو و ریلکس. حالت توربو به سرعت تصاویر نهایی را تولید میکند اما هزینه آن دو برابر استفاده از اعتبار است، در حالی که حالت ریلکس زمان بیشتری میبرد اما هزینه آن نصف است. به طرز عجیبی، در حال حاضر هیچ حالت استانداردی برای V7 وجود ندارد؛ Midjourney میگوید که این حالت بعداً ارائه خواهد شد، زیرا نیاز به زمان بیشتری برای بهبود دارد.
پارامترها و شخصیسازی
مدل V7 با اکثر پارامترهای نسخههای قبلی (--ar، --seed و غیره) کار میکند، از جمله کدهای --sref موجود کاربران از نسخه 6.1، همچنین ویژگی شخصیسازی که به تازگی معرفی شده است. در واقع، V7 اولین مدل Midjourney است که شخصیسازی به طور پیشفرض فعال است، به این معنی که کاربران باید با انتخاب حداقل 200 تصویر، پروفایل زیباییشناسی خود را بسازند.
شخصیسازی به شما انتخاب بین دو تصویر را صدها بار ارائه میدهد تا بتواند آنچه را که "زیبا" میدانید، یاد بگیرد و تولیدات خود را به آن سلیقهها متناسب کند. با این حال، میتوانید شخصیسازی را در V7 غیرفعال کنید، درست مانند مدلهای قبلی.
تاریخچه Midjourney
Midjourney یکی از اولین ابزارهای تولید تصویر هوش مصنوعی بود که به طور گستردهای مورد استفاده قرار گرفت. در ابتدا، این ابزار در دیسکورد در دسترس بود و از طریق یک نحو نسبتاً پیچیده قابل استفاده بود، اما از آن زمان یک رابط وب مدرنتر راهاندازی کرده است.
بخش قابل توجهی از هنرهای هوش مصنوعی که در شبکههای اجتماعی به اشتراک گذاشته شده، با استفاده از دیسکورد ساخته شده است. این ابزار همچنین بخشی کلیدی از روند کار بسیاری از سازندگان ویدیوهای هوش مصنوعی است که معمولاً تصویر اولیه را در Midjourney ایجاد کرده و سپس از ویژگی تبدیل تصویر به ویدیو در برنامههایی مانند Runway استفاده میکنند.
چالشهای قانونی
با این حال، با وجود محبوبیتش، Midjourney موضوع چندین دعوی قضایی بوده و بخشی از بحثهای جاری درباره این است که آیا آموزش مدلهای هوش مصنوعی بر روی آثار دارای حق کپی که در وب یافت میشود، استفاده منصفانه محسوب میشود یا خیر. (هر کسی که از Midjourney استفاده کرده باشد، میداند که این ابزار بر روی آثار دارای حق کپی آموزش دیده است؛ حتی گاهی اوقات در خروجیهای خود، واترمارکها و امضای هنرمندان را تولید میکند.)
آینده Midjourney
به تازگی، این شرکت اعلام کرد که قصد دارد در آینده سختافزار جدیدی را راهاندازی کند، اما هنوز مشخص نیست که این سختافزار چه شکلی خواهد داشت.

