وارد شوید

نگاهی به هوش مصنوعی Midjourney و راهنمای استفاده از آن

  سه شنبه, 25 مرداد 1401
رای شما
(1 رای)

چند روزیست که در فضای لیندکین، اینستاگرام و توییتر شاهد عکس ها و تصاویر خارق العاده ای  هستیم  که با هشتگ #midjourney و #midjourneyart به اشتراک گذاشته می‌شود. اما این عکس ها از کجا آمده اند؟ در این مقاله با راز آن آشنا می‌شوید.

این روزها تولیدکنندگان تصویر مبتنی بر هوش مصنوعی مانند DALL-E 2 محبوبیت زیادی پیدا کرده اند.  Midjourney یکی از ابزارهای پیشرفته‌ برای این کار است،  که می‌تواند عکس‌هایی به سبک کاریکاتوریست‌ها، داگرئوتایپیست‌های قرن نوزدهم، انیماتورهای استاپ موشن و غیره فقط با تایپ کردن چند کلمه یا جمله ایجاد کند. 

Midjourney چیست؟
قبل از اینکه در مورد Midjourney صحبت کنیم، اجازه دهید با DALL-E 2 شروع کنیم، چیزی که ممکن است درباره آن شنیده باشید. DALL-E 2  ابزار تولید کننده تصویر مبتنی بر هوش مصنوعی است، که  می تواند تصاویر کاملاً جدید را از یک پیام متنی ساده ایجاد کند. شما «روباتی در حال خوردن تاکو» را تایپ می‌کنید و تصویری را ایجاد می‌کند که رباتی را در حال خوردن تاکو نشان می‌دهد.

در سطح ابتدایی تر هوش مصنوعی Craiyon قرار دارد که قبلا به عنوان "DALL-E mini" شناخته می شد. این یک ابزار وب رایگان است که همه می توانند از آن استفاده کنند، اما تقریباً به پیچیدگی DALL-E 2 نیست. نتایج اغلب عجیب و تا حدودی ترسناک هستند، اما بازی با آن هنوز هم بسیار سرگرم کننده است.

Midjourney جایی در وسط DALL-E 2 و Craiyon قرار دارد. همچنین از هوش مصنوعی و یادگیری ماشینی برای تولید تصاویر بر اساس پیام های متنی استفاده می کند. نتایج معمولاً بسیار خوب هستند، اما به اندازه DALL-E 2 خیره کننده نیستند. نکته مهم این است که هر کسی می تواند نسخه بتای Midjourney را در حال حاضر (از آگوست 2022،) برخلاف DALL-E 2 امتحان کند و نیازی به انتظار نیست.

Stable Diffusion نیز یک مدل هوش مصنوعی تبدیل متن به تصویر است که میلیاردها نفر را قادر می‌سازد تا در عرض چند ثانیه اثر هنری خیره‌کننده خلق کنند. که هنوز در مرحله تست قرار دارد و عمومی نشده است  Stable Diffusion قرار است یک پیشرفت در سرعت و کیفیت باشد به این معنی که می تواند  با کمتر از 10 گیگابایت VRAM روی پردازنده‌های گرافیکی مصرف‌کننده اجرا شود و تصاویری با وضوح 512x512 پیکسل در چند ثانیه تولید کند.می توانید برخی از خروجی های شگفت انگیزی که توسط این مدل بدون پردازش یا پس از پردازش ایجاد شده است را در این زیر می‌توانید مشاهده کنید.

تصاویر ایجاد شده با Stable Diffusion

نحوه استفاده از Midjourney Beta
تنها چیزی که برای استفاده از Midjourney Beta نیاز دارید یک حساب Discordاست. اینجاست که به ربات Midjourney دستورات متنی می دهید. می توانید برای ایجاد حساب کاربری رایگان در وب سایت Discord ثبت نام کنید. پس از آن، می توانید از Discord در یک مرورگر وب استفاده کنید یا برنامه آن را برای Windows، Mac، Linux، Android و iPhone دانلود کنید.هنگامی که Discord را راه‌اندازی کردید،به وب‌سایت Midjourney می‌روید و «Join the Beta» را انتخاب می‌کنید.2022 08 03 16 35 16

2022 08 03 16 42 20

حالا وارد اکانتان شدید . چند نکته درباره بتا وجود دارد. این یک نسخه آزمایشی رایگان است که شامل حدود 25 درخواست است. پس از اتمام آن، در صورت تمایل می توانید یک عضویت یک ماهه آن را با قیمت های 10 دلار الی 20 دلار خریداری کنید.

برای شروع، به یکی از کانال‌های «newcomer room» در نوار کناری بروید. ما از "#Newbies-42" استفاده خواهیم کرد، اما تعدادی دیگری هم  وجود دارد.

Enter one of the newbie channels.

 
در کادر متن /imagine را وارد کنید و سپس دستور خود را به انگلیسی تایپ کرده و اینتر کنید.
Enter "/imagine" and your prompt.
شما می توانید پیشرفت را با ایجاد چهار تصویر تماشا کنید.
Images being created.

هنگامی که تصاویر به پایان رسید، آنها در یک پیام جدید نمایش داده می شوند. اکنون چند گزینه اضافی دارید.

U = Upscale: یک نسخه بزرگتر از تصویر ایجاد می کند.
V = Variation: یک تصویر جدید بر اساس تصویری که انتخاب کرده اید ایجاد می کند.
Refresh: چهار تصویر جدید را از همان فرمان دریافت کنید.

Image options.

نتایج در یک پیام جدید مانند قبل تحویل داده می‌شوند و گزینه‌های جدیدی برای ایجاد تغییرات بیشتر یا ارتقاء آن به حداکثر خواهید داشت.
Options after upscale.

هر زمانی خواستید تصاویر را ذخیره کنید، به سادگی تصویر را انتخاب کنید و روی علامت دانلود یا  "Open Original" در سیستم  و موبایل خود ضربه بزنید تا تصویر در اندازه واقعی را ببینید. سپس نتایج را ذخیره کنید.

به خاطر داشته باشید که برخی کلمات مجاز نیستند و نگرانی محققان این است که در دسترس قرار دادن آزادانه، درها را به روی کاربران سودجو باز می‌کند که از آن در تولید محتوای نامناسب ذهنی، مانند پورنوگرافی و خشونت گرافیکی استفاده کنند. امیدواریم از این تجربه جدید لذت ببرید.

اطلاعات تکمیلی

کلیک: 2021 بار - بروزرسانی در سه شنبه, 19 ارديبهشت 1402
sahar niksirat

سلام من سحر هستم ادمین پیکسی پال ارشد ارتباط تصویری و از سال 91 در حوزه گرافیک مشغول به  کار هستم و تصمیم گرفتم این سایت رو برای راحتی کاربرها راه اندازی کنم.

X

خطای راست

کپی از مطالب سایت غیرمجاز میباشد