استارتاپ دستیار ایلان ماسک در تولید تصاویر
اگر اخیراً تصویری از المو، میکیماوس یا ترامپ دیدهاید که اسلحهای به دست دارند، احتمالاً این تصویر با استفاده از Grok، چتبات هوش مصنوعی xAI، شرکت ایلان ماسک ساخته شده و با کمک یک استارتاپ کوچک به نام Black Forest Labs ایجاد شده، تولید شده است.
این تصاویر از هفته گذشته در شبکه اجتماعی ماسک X به سرعت منتشر شدند و از تصاویر کاملاً طنزآمیز تا تصاویر واقعاً نگرانکننده را شامل میشدند. این موج پس از آن آغاز شد که xAI در یک پست وبلاگی اعلام کرد که در حال «آزمایش» با نرمافزار تولید تصویر به نام Flux است.
Flux.1 محصول شرکت Black Forest Labs است، یک استارتاپ تازهتأسیس در آلمان که سابقهی عمیقی در تولید تصاویر با هوش مصنوعی دارد. تیم مؤسس این شرکت شامل بسیاری از محققانی است که پشت اولین تولیدکننده تصویر با هوش مصنوعی یعنی Stable Diffusion بودند، که ابتدا توسط استارتاپ مشکلدار Stability AI محبوب شد. مانند سایر نرمافزارهای تولید تصویر با هوش مصنوعی، Flux.1 قادر است یک دستور متنی، مانند «تصویری نسبتا واقعی از یک خرگوش که بستنی میخورد بساز» را دریافت کرده و تصویری بر اساس آن تولید کند.
توانایی این نرمافزار در تولید تصاویر بسیار واقعگرایانه از افراد و شخصیتهای شناختهشده، به همراه دسترسی به آن از طریق یک شبکه اجتماعی بزرگ مانند X، توجه بسیاری از کاربران را به خود جلب کرده است. در عین حال، انتشار گسترده این تصاویر در X، که قبلاً با نام توییتر شناخته میشد، نگرانیهای جدیدی را در مورد مسائل مربوط به هوش مصنوعی و نقض حقوق کپیرایت، حریم خصوصی و اطلاعات نادرست برانگیخته است.
تیفانی لی، استاد حقوق در دانشگاه سان فرانسیسکو که در زمینه قوانین هوش مصنوعی و مالکیت فکری تخصص دارد، گفت: «مسائل حقوقی و همچنین مسائل اخلاقی و معنوی متعددی وجود دارند.»
دیزنی و نینتندو به درخواست اظهار نظر در مورد این تصاویر پاسخ ندادند. شرکت Black Forest Labs به طور رسمی اوایل این ماه فعالیت خود را آغاز کرد و اولین سه مدل تولید تصویر با هوش مصنوعی خود را معرفی کرد:
- 1 pro، که بالاترین کیفیت را ارائه میدهد
- 1 dev، که به عنوان یک مدل آزاد با وزنهای باز در دسترس است (به این معنا که توسعهدهندگان مشخص میکنند که مدل هوش مصنوعی چه چیزهایی را یاد گرفته و در طول فرآیند آموزش چگونه تنظیم شده است) اما برای استفاده تجاری طراحی نشده است.
- 1 schnell، که سریعترین مدل در تولید تصاویر است و میتواند توسط هر کسی برای اهداف شخصی، علمی یا تجاری مورد استفاده قرار گیرد.
این شرکت در یک پست وبلاگی اعلام کرد که هدفش «پیشبرد مرزهای خلاقیت، کارآیی و تنوع» است.
این شرکت افزود: «با در دسترس قرار دادن مدلهای خود برای یک مخاطب گسترده، میخواهیم فواید آن را برای همه فراهم کنیم، به آگاهی عمومی کمک کنیم و اعتماد را افزایش دهیم.»
نمایندگان X و Black Forest Labs به درخواستهای اظهار نظر پاسخ ندادند.
این استارتاپ نوپا در حوزه تولید تصویر، حمایت تعدادی از سرمایهگذاران بزرگ در اکوسیستم هوش مصنوعی را به دست آورده است. این شرکت اعلام کرد که در یک معامله به رهبری Andreessen Horowitz، 31 میلیون دلار سرمایه اولیه جذب کرده است. سایر سرمایهگذاران نیز شامل برندون ایریب، یکی از بنیانگذاران و رهبران سابق هدستهای واقعیت مجازی Oculus شرکت Meta Platforms Inc. و همچنین گری تن، مدیرعامل شتابدهنده استارتاپ Y Combinator هستند.
همکاری با شرکتهای ماسک، پروفایل این شرکت کوچک را ارتقاء خواهد داد. بر اساس گزارش بلومبرگ، استارتاپ هوش مصنوعی ماسک در حال مذاکره با سرمایهگذاران برای جذب بیش از 6 میلیارد دلار است که آن را به یکی از ارزشمندترین استارتاپها در صنعتی که از قبل سرشار از سرمایه است، تبدیل میکند. چتبات Grok برای مشترکین پریمیوم پلتفرم اجتماعی X در دسترس است.
کاربران Grok میتوانند با این نرمافزار انواع تصاویر را تولید کنند و در حال حاضر هم چنین تصاویری را تولید میکنند. این تصاویر شامل شبیهسازیهای واقعگرایانه از چهرههای عمومی شناختهشده مانند تصاویری از رئیسجمهور سابق دونالد ترامپ و معاون رئیسجمهور کامالا هریس است که در حال مصرف مواد مخدر با هم هستند. اما به نظر میرسد برخی چیزها همچنان خارج از محدوده این نرمافزار قرار دارند.
در حالی که Grok بدون مشکل تصاویری از تیلور سوئیفت، ستاره پاپ، در حال عشق بازی با ماریو از بازی Super Mario Bros تولید کرده است، اما در مقابل درخواستهای دیگر برای تولید تصاویر دارای محتوای نامناسب یا خشونتآمیز، مقاومت میکند. در چنین مواردی، پیامهایی مانند «من هیچ تصویر یا محتوای مستهجن تولید یا توصیف نخواهم کرد» و «من درخواست را درک میکنم، اما باید سیاستی را حفظ کنم که شامل تولید یا توصیف محتوایی که خشونت گرافیکی یا صحنههای خونین دارد، نمیشود.» نمایش میدهد.
لی در مورد تصاویری که شخصیتهای عمومی و کاراکترها را در موقعیتهای نامناسب قرار میدهد، احساسات متفاوتی دارد. او میگوید: «از یک سو، من فکر میکنم که انتشار اطلاعات نادرست به این گستردگی مشکلساز است. از سوی دیگر، توانایی ایجاد تصاویر طنز از رهبران عمومی یک حق عمومی در متمم اول قانون اساسی آمریکا است.»