با ظهور تکنولوژی و بهخصوص هوش مصنوعی، دنیای هنر نیز تغییرات گستردهای کرده است. یکی از این هنرها، نقاشی است که در آن بهواسطهی هوش مصنوعی، تبدیل مستقیم خیال به تصاویر دیجیتال میسر شده است.به دنبال موفقیت عظیم هوش مصنوعی Dall-E 2 از OpenAI، برنامههای متنوعی برای خلق خودکار آثار هنری به وجود آمدند. مهمترین قدم را در این مسیر، هوش مصنوعی میدجرنی (Midjourney AI) برداشته است. این تکنولوژی درحقیقت توصیف آنچه قرار است کشیده شود را بهصورت متنی دریافت کرده و تبدیل به تصویر میکند.
یک تصویر میتواند به اندازهی هزاران کلمه معنی داشته باشد اما برای ساخت یک تصویر نیازی به هزاران کلمه ندارید. با هنر هوش مصنوعی تنها چند کلمه هم برای خلق آثار هنری کافی است. هوش مصنوعی این بار قابلیتهای خود را در زمینهی هنر ثابت کرده است. امروز، عصر هنر ایجادشده توسط هوش مصنوعی آغاز شده و اینترنت پر از کاربرانی است که سعی میکنند از این فناوری برای خلق آثار جذاب استفاده کنند.
میدجرنی چیست؟
میدجرنی یکی از پلتفرمهای جدید تولید تصویر هوش مصنوعی که آثار هنری رویایی و متنوعی را بر اساس درخواستها و دستورها خلق میکند. بر اساس تعریف تولیدکنندگان، «میدجرنی آزمایشگاه پژوهشی مستقلی است که در میان رسانههای جدید فکری کاوش کرده و قدرت تخیل انسان را گسترش میدهد». در واقع میدجرنی برای بسیاری از کاربرهای عادی، فرصتی برای خلق تصاویر حیرتانگیز هوش مصنوعی بر اساس تعریفها و توضیحات متنی فراهم میکند. این سرویس دستور شما را به ابرکامپیوترهای قدرتمند وصل میکند و میتواند برای علاقهمندان به رمانهای علمی تخیلی یا آثار هنری سورئال جذاب باشد.
آموزش کار با هوش مصنوعی Midjourney
هوش مصنوعی Midjourney بر بستر پلتفرم دیسکورد فعالیت دارد و نرمافزار یا وبسایت جداگانهای برای بهرهمندی از قابلیتهای آن در نظر گرفته نشده است. دلیل این امر تأکید سازندگان پروژه به اجتماعیمحور بودن آن است؛ بهطوری که کاربران میتوانند تصاویر ساختهشده توسط دیگر افراد را مشاهده کنند و از توضیحات آنها برای ساخت خروجیهای دیگر الهام بگیرند.
- برای شروع کار با مراجعه به وبسایت Discord.com یک حساب کاربری رایگان برای خود ایجاد کنید و وارد آن شوید. دیسکورد در قالب نسخه تحت وب و اپلیکیشن دسکتاپ یا موبایل در دسترس قرار دارد.
- وارد وبسایت Midjourney.com شوید و روی گزینه Join the beta کلیک کنید. با زدن گزینه گفتهشده، بهصورت خودکار یک دعوتنامه در دیسکورد برای شما ارسال میشود.
- درخواست دعوت دریافتی در دیسکورد را با زدن گزینه Accept Invite در اپلیکیشن یا نسخه تحت وب، قبول کنید و سپس گزینه Continue to Discord را انتخاب نمایید.
- بعد از بازشدن اپلیکیشن دیسکورد بهشکل خودکار، روی آیکن Midjourney (قایق سفید) از پنل سمت چپ کلیک نمایید.
- در داخل کانالهای Midjourney بهدنبال عنوان Newcommer Rooms بگردید و سپس یکی از آنها را (مثلاًnewbies 101) را انتخاب کنید.
- اکنون قادر خواهید بود از قابلیت تبدیل متن به عکس این ابزار استفاده کنید؛ اما همانطور که در قبل اشاره شد، توجه داشته باشید که تنها ۲۵ تصویر رایگان در اختیار شما قرار میگیرد.
- در داخل چت باکس اتاق انتخابشده، عبارت imagine/ را تایپ کنید. پس از واردکردن این دستور، قادر خواهید بود توضیحات موردنظر را که میخواهید به تصویر تبدیلشان کنید، وارد کنید. هرچه جزئیات بیشتری در اختیار هوش مصنوعی قرار دهید، نتیجه مطلوبتری هم دریافت خواهید کرد.
- پس از اتمام نوشتن توضیحات، کلید Enter را بزنید تا پیام ارسال شود.
- کمی صبر کنید تا فرایند ساخت تصاویر براساس توضیحات واردشده به اتمام برسد. پس از اتمام آن، چندین حالت مختلف از تصاویر ایجادشده توسط هوش مصنوعی برای شما در قسمت گفتوگو ارسال میشود.
- در پایین تصاویر چندین کلید با عناوین U و V بههمراه اعداد مشاهده میشوند. این کلیدها بهترتیب برای بزرگترکردن یک تصویر یا ساخت یک تصویر جدید براساس مورد انتخابشده، کاربرد دارند.
- برای مثال اگر کلید U2 را بزنید، تصویر دوم بزرگتر خواهد شد و اگر کلید V4 را بزنید، تصاویر جدیدی براساس تصویر چهارم ایجاد میشوند.
- همچنین یک کلید دیگر برای رفرشکردن نتیجه در پایین تصاویر بهچشم میخورد که با کلیک روی آن میتوانید نتایج جدیدی را دریافت کنید. توجه داشته باشید با هر بار استفاده از کلید رفرش یا V، یک واحد از اعتبار رایگان شما کم خواهد شد.
- اگر روی کلید U کلیک کنید، چندین گزینه متفاوت مشاهده خواهید کرد که هر کدام عملکرد متفاوتی خواهند داشت. برای مثال گزینه Upscale to Max موجب بزرگترشدن تصویر تا بیشترین حد ممکن (1664 در 1664 پیکسل) میشود و گزینه Light Upscale Redo هم تصویر را با جزئیات کمتری بزرگ میکند.
- پس از اتمام کار میتوانید تصویر خروجی را با زدن ایموجی پاکت نامه () برای خود ارسال کنید. سپس میتوانید آن را ذخیره یا دانلود نمایید. تصاویری که بزرگ شده باشند، در داخل گالری وبسایت Midjourney هم قابل مشاهده خواهند بود.
دستورات کاربردی در Midjourney
هنگام استفاده از هوش مصنوعی Midjourney میتوانید از دستورات و پارامترهایی برای بهبود خروجی، بهره بگیرید. در پایین به برخی از مهمترین دستورات و عملکرد آنها اشاره شده است.
- imagine/ مهمترین دستور در Midjourney است که پس از آن توضیحات مربوطه برای ساخت تصویر نوشته میشود.
- help/ برای نمایش اطلاعات و نکات کاربردی درباره بات Midjourney کاربرد دارد.
- info/ برای نمایش پروفایل، طرح کاربری، اعتبار باقیمانده و… استفاده میشود.
- subscribe/ یک لینک اختصاصی برای حساب کاربری دیسکورد فعلی شما ایجاد میکند و نیاز به ورود جداگانه از طریق وبسایت را از بین میبرد.
- relax/ اگر حساب کاربری پولی داشته باشید، با فعالکردن این حالت میتوانید بدون کمشدن از اعتبار، خروجی دریافت کنید؛ اما زمان موردنیاز برای ساختن تصاویر طولانیتر خواهد شد.
- private/ در این حالت شما تنها میتوانید خروجی تصاویر خود را مشاهده کنید؛ اما بهرهمندی از آن ماهانه ۲۰ دلار هزینه در پی خواهد داشت.
همانطور که قبلتر اشاره شد، توضیحات موردنظر پس از دستور /imagine وارد میشوند. همچنین با تعیینکردن پارامترهایی، میتوان نتیجه دقیقتری را دریافت نمود. در پایین تعدادی از پارامترهای مرتبط با دستور مذکور توضیح داده شدهاند.
- beta– پارامتری برای استفاده از یک الگوریتم آزمایشی جدید است. این الگوریتم به زمان بیشتری برای ارائه خروجی نیاز خواهد داشت و تنها ۲ تصویر ایجاد خواهد کرد. همچنین برخی دیگر از پارامترها بهصورت همزمان با آن قابلاستفاده نخواهند بود.
- hd– برای استفاده از یک الگوریتم متفاوت و قدیمیتر کاربرد است که گزینه بهتری برای تصاویر بزرگ با موضوعات انتزاعی یا منظره به شمار میرود. این الگوریتم بهصورت خودکار تصاویری با رزولوشن بالاتر بدون نیاز به Upscale ایجاد میکند.
- aspect– یا ar– برای ایجاد خروجی با نسبت تصویر مشخص بهکار میرود. برای مثال –ar 16:9 اقدام به ارائه تصویری با نسبت ۱۶ به ۹ میکند.
- w– و h– برای تعیین رزولوشن دقیق خروجی مورد استفاده قرار میگیرد. برای مثال –w 256 موجب میشود تا عرض تصویر برابر با ۲۵۶ پیکسل باشد. مقادیر واردشده هم باید در بازه ۲۵۶ الی ۲۰۳۴ پیکسل قرار بگیرند.
- stylize– یا s- برای تعیین مقدار هنری بودن خروجی کاربرد دارد. پس از آن باید مقدار عددی موردنظر که بین بازه ۶۲۵ الی ۶۰۰۰۰ است، ذکر شود. کمترین مقدار ممکن s– 625 است و هرچه مقدار واردشده کمتر باشد، خروجی نزدیکتری به توضیحات کاربر ارائه میکند.
- quality– یا q– برای تنظیم سرعت ساخت تصاویر استفاده میشود و مقدار آن بین 0.25 تا 5 است. بیشترین سرعت با –q 0.25 و کمترین سرعت با –q 5 تنظیم میشود.
دستورهای کاربردی میدجرنی
کاربرهای میدجرنی معمولا از دستورهای مستقیم و خام برای خلق تصاویر استفاده میکنند. به این مثال دقت کنید: a cowboy wearing a tuxedo on the moon (گاوچرانی که روی ماه تاکسیدو پوشیده است). خروجی تصویر ذیل خواهد بود.
اما گزینههای دیگری فراتر از یک دستور متنی ساده و خام برای ایجاد خروجیهای تصویری قابل پیشبینی و منطبق وجود دارند. در ادامه به فهرستی از این دستورهای پیشرفته و جزئیات آنها اشاره میکنیم:
- استفاده از کلمات کلیدی برای تعریف سبک
- دستور stylize
- دستور chaos
- تعریف resolution (تفکیکپذیری تصویر)
- aspect ratio (نسبت تصویر)
- فیلتر کردن کلمات
استفاده از کلمات کلیدی برای تعریف سبک
ارائهی مجموعهای از کلمات کلیدی دستوری مرتبط با سبکهای هنری میتواند به ایجاد خروجیهای متفاوتی بر اساس نوع سبک انتخابی منجر شود. در اینجا برخی کلمات کلیدی و انواع فرعی بر اساس فرم هنری، طرح، هنرمند و ژانر هنری نمایش داده شدهاند:
۱. استفاده از طرح-ژانر به عنوان سبک
با دادن نام سبکهای مختلف در دستورهای میدجورنی میتوانید تصویر با سبک دلخواه خود را خلق کنید.
۲. استفاده از نام هنرمند به عنوان سبک
میتوانید هنرمند دلخواه را برای خروجی سبک تعریف کنید. برخی نمونهها در زیل نشان داده شدهاند:
/imagine horse galloping at sunset painting Andy Warhol style
با آوردن نام هنرمندان معروف در دستور میتوان سبک هنری آنها را بازسازی کرد.
۳. استفاده از ویژگیهای نورپردازی و رندر برای تعریف سبک
تصاویر ایجادشده با میدجورنی بر اساس نورپردازیهای مختلف
دستور stylize
میتوانید تنظیمات stylize– یا s– را اضافه کنید. با این دستور میتوانید میزان ظاهر هنری تصویر را تعیین کنید. به گفتهی تیم میدجرنی این دستور میتواند کیفیت تصویر را افزایش دهد و از طرفی احتمال خطا را کم کند. اما چرا نباید مقدار حداکثر stylize را همیشه به کار ببرید. حداکثر این مقدار به معنی آزادی بیشتر میدجرنی برای انحراف از دستور است. به طور کلی میتوانید مقدار stylize را بین ۰ تا ۱۰۰۰ درنظر بگیرید. تصاویر ذیل با گزینههای سبکدهی بالا و پائین وارد شدهاند:
/imagine mushrooms –s 200
دستور chaos
دستور chaos– یا پارامتر c– بر تنوع تصویرهای خروجی تأثیر میگذارد. مقدار بالای chaos باعث ایجاد نتایج و ترکیببندیهای غیرمنتظره و غیررایج میشود. در حالی که مقدار کم آن تصویر را به نتایج تکراری و واقعگرا نزدیک میسازد. عددی از صفر تا ۱۰۰ را برای افزایش یا کاهش سطح انتزاع سوژه به کار ببرید.
/imagine Eiffel tower –chaos 60
تعریف resolution (تفکیکپذیری تصویر)
برای تعریف رزلوشن یا درجهی تفکیک خروجی میتوانید از برخی کلمات کلیدی رایج مثل 8K، 4K، photorealistic، ultra photoreal، ultra detailed، intricate details و بسیاری از موارد دیگر استفاده کنید. یا میتوانید تنظیمات استانداردی را برای خروجیهای قابل پیشبینی پیادهسازی کنید. مثال:
/imagine red rose flower –quality 5
Aspect ratio (نسبت تصویر)
معمولا خروجی پیشفرض، تصویری مربعی (با نسبت تصویر ۱:۱) است. اما اگر میخواهید به چشماندازی سینماییتر برسید یا میخواهید وال پیپری برای لپتاپ خود بسازید میتوانید نسبت تصویر را تغییر دهید:
/imagine jasmine in the wild flower –ar 4:3
تصویر ساختهشده با میدجرنی با دستور : jasmine in the wild
فیلتر کردن کلمات از تصویر
با کلمهی کلیدی –no میتوانید سوژههای ناخواسته را از تصویر خود حذف کنید:
/imagine KFC fried chicken –no sauce
کلمات کلیدی جذاب
در این بخش برخی کلمات کلیدی را برای رسیدن به نتایج جذابتر معرفی میکنیم:
- Sony Alpha α7, ISO1900, Leica M : برای تعریف نوع لنز یا نوع دوربین.
- Photorealistic, ultra photoreal , ultra detailed, intricate details : برای تعریف جزئیات احتمالی و ظاهری واقعگرا و کمتر هنری.
- Unreal : برای تعریف حسی غیرواقعی
- Volumetric light, cinematic light : برای تعریف شرایط نورپردازی.
میدجورنی و کپیرایت
به صورت پیشفرض تصاویری که با میدجرنی ایجاد میشوند عمومی هستند. همه میتوانند آثار شما را ببینند. همچنین میتوانید از دستورهای دیگران یاد بگیرید. برای استفاده از میدجرنی نباید با ماهیت عمومی آن مشکلی داشته باشید؛ اما اگر نمیتوانید در فضایی باز زندگی کنید باید برای یک حساب خصوصی هزینه پرداخت کنید.
در زمان فعلی هنوز تعریف دقیقی برای کپیرایت هنر ایجادشده با هوش مصنوعی وجود ندارد. شما دستوری را نوشتید؛ اما در واقع این بات است که آن را کامپایل میکند. هنری که با یک حساب کاربری آزمایشی و رایگان ایجاد میشود دارای مجوز بینالمللی CC BY-NC 4.0 است. درواقع میتوانید در صورتی از تصاویر استفاده کنید که به درآمدزایی منجر نشود و باید نام میدجرنی را هم ذکر کنید.
اگر حساب پولی تهیه کنید میتوانید از هنر خود به شکل دلخواه استفاده کنید و حتی آن را بفروشید؛ اما شرکت هم میتواند از تصاویرتان استفاده کند. ازآنجاکه تصویر در یک انجمن عمومی ساخته شده است نمیتوانید انتظار داشته باشید که از آن به شکل انحصاری استفاده کنید. قوانین کپیرایت حتی در بهترین حالت هم پیچیده هستند. حالا اگر هوش مصنوعی را درگیر این ماجرا کنید قضیه پیچیدهتر هم خواهد شد؛ اما باید دید مشکلات کپیرایت هوش مصنوعی چگونه حلوفصل میشوند.
جمعبندی
هوش مصنوعی این روزها در تمام حوزهها به ویژه هنر گسترش پیدا کرده است. ابزارهای تولید آثار خلاق مثل میدجرنی به کاربرها امکان میدهند تنها با چند دستور متنی آثار متنوع و خلاقانهای را خلق کنند و آنها را بر اساس نیاز خود تغییر دهند. از طرفی کار با میدجرنی نیازمند رعایت قوانینی مثل عدم استفاده از تصاویر خشونت آمیز یا تصاویر مبتذل جنسی است و همچنین قوانین کپیرایت ویژهای برای انتشار یا فروش تصاویر وجود دارند. در هر حال این ابزار و رقبای آن همواره با سرعت بالایی در حال تکامل هستند و امکانات و قوانین جدیدی احتمالا در آینده به آنها اضافه خواهد شد که کار را برای کاربران سادهتر کنند.