جعل یا واقعیت؟، عکس
به گزارش آسمان تو، هوش مصنوعی مولد تصویر Flux به عنوان رقیب جدیدی برای میدجرنی، تصاویر واقع گرایانه ای ایجاد می نماید که ممکن است زنگ خطر را برای همه به صدا دربیاورد.
به گزارش خبرگزاری خبرنگاران ، براساس گزارش زومیت، از دو سال گذشته که بازار هوش مصنوعی داغ تر از همیشه بوده و بین مردم توسعه یافته است، همه ما با هوش مصنوعی های مولدی مثل DALL-E، میدجرنی، ادوبی فایرفلای و Stable Diffusion آشنا شده ایم. با اینکه برترین فراورینمایندگان تصویر هوش مصنوعی همیشه در کوشش بوده اند که با به روزرسانی های تازه، گامی نو و پیشرفتی قابل تحسین به ارمغان بیاورند، می توان ادعا کرد که در تعدادی از زمینه ها مثل واقع گرایی، تغییرات شگرفی نکرده اند.
Flux مولد تصویر هوش مصنوعیِ منبع باز و نسبتاً تازهی محسوب می گردد که می تواند گوی سبقت را به خصوص در زمینه واقع گرایی از نامداران فراوری تصویر AI برباید. در آزمایش های اولیه پژوهشگران با اجرای این مدل روی دستگاه های خودشان و جفت کردن آن با ابزار Lora که XLabs آن را توسعه داده و یک اسکریپت بهینه سازی برای فوتورئالیسم است، جزئیات بیشتری به Flux افزوده اند. این امر با تنظیم و بهبود عملکرد مدل هوش مصنوعی، نتایجی فراوری می نماید که تقریباً با یک نگاه سریع از عکس های واقعی قابل تشخیص نیستند.
برای امتحان هوش مصنوعی تازه، زومیت از Flux خواست که مهندسی از شرکت مایکروسافت را به تصویر بکشد که در یونیفرم اداری با میکروفونی در دست و کارت پرسنلی مایکروسافت دور گردنش در حال ارائه در یکی از رویدادهای این شرکت است.
مولد تصویر Flux AI به وسیله استارتاپ Black Forest Labs ایجاد شده است. این شرکت مستقر در آلمان را افرادی مثل آندرس بلتمن، رابین رامبک و دومینیک لورنز که همگی از مهندسان سابق Stability AI هستند، همراه با دیگر چهره های پیشرو در این زمینه راهنمایی می نمایند.
Flux به علت منبع باز بودن، به عنوان وارث Stable Diffusion معرفی می گردد. این یعنی که کد آن به صورت رایگان در دسترس است و هر کسی می تواند آن را دستکاری کند، مدل را اصلاح کند و آن را در مولدهای خود بگنجاند.
تصویر فراوریشده با Flux روی لپ تاپ با RTX 4090
تصویر فراوریشده با Flux روی لپ تاپ با RTX 4090
اگر کاربران کامپیوتری داشته باشند که برای رسیدگی به احتیاجهای پردازش مدل هوش مصنوعی به میزان کافی خوب باشد، می توانند Flux را به صورت محلی و بدون احتیاج به تکیه بر سرورهای خارجی یا سرویس های ابری اجرا نمایند؛ بااین حال این برنامه در پلتفرم های چندمدلی مانند Poe و Nightcafe نیز موجود است. Poe و Nightcafe رابط هایی را برای کاربران فراهم می نمایند تا آن ها بتوانند با مدل های مختلف هوش مصنوعی برای ایجاد تصاویر بر اساس پیغام های متنی تعامل داشته باشند.
سه نسخه از Flux.01 وجود دارد: Flux.01 Pro که نسخه حرفه ای با مجوز تجاری محسوب می گردد، Flux.01 Dev که برای استفاده غیرتجاری به منظور آزمایش و بهبود در دسترس توسعه دهندگان و محققان قرار گرفته است و Flux.01 Schnell که از نظر سرعت بهینه شده و برای توسعه محلی و استفاده شخصی ایدئال است.
به نظر می رسد Flux اکنون بزرگ ترین رقیب میدجرنی در زمینه فوتورئالیسم باشد. این مدل نتایج بسیار واقع گرایانه ای ایجاد می نماید، اگرچه بافت پوست خیلی قانع نماینده نیست و ظاهری پلاستیکی دارد اما بعضی از کاربران از ترکیب Flux با Lora به نتایجی دست یافته اند که به شدت واقعی به نظر می رسند.
تصویر فراوریشده با Flux
نتیجه فراوریشده از ترکیب Flux با Lora
تصویر فراوریشده با Flux
نتیجه فراوریشده از ترکیب Flux با Lora
واقع گرایی خیره نماینده تصاویر بالا باعث شده است که آن ها با سرعت زیادی در اینترنت دست به دست شوند و مورد توجه قرار بگیرند. بسیاری از مردم نمی دانند که دسترسی به این سطح از واقع گرایی در فراوری تصاویر AI به جز ایجاد کمی تفریح برای علاقه مندان به یادگیری ماشین چه مزایای دیگری می تواند داشته باشد. در حال حاضر بسیاری از مشاغل و برندهای کوچک از تصاویر هوش مصنوعی برای ارائه در رسانه های اجتماعی استفاده می نمایند. توانایی ایجاد تصاویر واقعی از افراد غیرواقعی می تواند بازی را برای عکاسی و تبلیغات استوک تغییر دهد. با تصاویر واقع گرایانه ای که Flux اکنون فراوری می نماید و به زودی پیشرفت بیشتری نیز خواهد داشت، خطر استفاده از تصاویر هوش مصنوعی برای ارتکاب به کلاهبرداری یا ایجاد اخبار جعلی از همیشه جدی تر خواهد شد.
227227
منبع: خبرآنلاین