اخبار هوش مصنوعی جهانیمعرفی محصولات

استارتاپ دستیار ایلان ماسک در تولید تصاویر

اگر اخیراً تصویری از المو، میکی‌ماوس یا ترامپ دیده‌اید که اسلحه‌ای به دست دارند، احتمالاً این تصویر با استفاده از Grok، چت‌بات هوش مصنوعی xAI، شرکت ایلان ماسک ساخته شده و با کمک یک استارتاپ کوچک به نام Black Forest Labs ایجاد شده، تولید شده است.

این تصاویر از هفته گذشته در شبکه اجتماعی ماسک X به سرعت منتشر شدند و از تصاویر کاملاً طنزآمیز تا تصاویر واقعاً نگران‌کننده را شامل می‌شدند. این موج پس از آن آغاز شد که xAI در یک پست وبلاگی اعلام کرد که در حال «آزمایش» با نرم‌افزار تولید تصویر به نام Flux است.

Flux.1 محصول شرکت Black Forest Labs است، یک استارتاپ تازه‌تأسیس در آلمان که سابقه‌ی عمیقی در تولید تصاویر با هوش مصنوعی دارد. تیم مؤسس این شرکت شامل بسیاری از محققانی است که پشت اولین تولیدکننده تصویر با هوش مصنوعی یعنی Stable Diffusion بودند، که ابتدا توسط استارتاپ مشکل‌دار Stability AI محبوب شد. مانند سایر نرم‌افزارهای تولید تصویر با هوش مصنوعی، Flux.1 قادر است یک دستور متنی، مانند «تصویری نسبتا واقعی از یک خرگوش که بستنی می‌خورد بساز» را دریافت کرده و تصویری بر اساس آن تولید کند.

توانایی این نرم‌افزار در تولید تصاویر بسیار واقع‌گرایانه از افراد و شخصیت‌های شناخته‌شده، به همراه دسترسی به آن از طریق یک شبکه اجتماعی بزرگ مانند X، توجه بسیاری از کاربران را به خود جلب کرده است. در عین حال، انتشار گسترده این تصاویر در X، که قبلاً با نام توییتر شناخته می‌شد، نگرانی‌های جدیدی را در مورد مسائل مربوط به هوش مصنوعی و نقض حقوق کپی‌رایت، حریم خصوصی و اطلاعات نادرست برانگیخته است.

تیفانی لی، استاد حقوق در دانشگاه سان فرانسیسکو که در زمینه قوانین هوش مصنوعی و مالکیت فکری تخصص دارد، گفت: «مسائل حقوقی و همچنین مسائل اخلاقی و معنوی متعددی وجود دارند.»

دیزنی و نینتندو به درخواست اظهار نظر در مورد این تصاویر پاسخ ندادند. شرکت Black Forest Labs به طور رسمی اوایل این ماه فعالیت خود را آغاز کرد و اولین سه مدل تولید تصویر با هوش مصنوعی خود را معرفی کرد:

  • 1 pro، که بالاترین کیفیت را ارائه می‌دهد
  • 1 dev، که به عنوان یک مدل آزاد با وزن‌های باز در دسترس است (به این معنا که توسعه‌دهندگان مشخص می‌کنند که مدل هوش مصنوعی چه چیزهایی را یاد گرفته و در طول فرآیند آموزش چگونه تنظیم شده است) اما برای استفاده تجاری طراحی نشده است.
  • 1 schnell، که سریع‌ترین مدل در تولید تصاویر است و می‌تواند توسط هر کسی برای اهداف شخصی، علمی یا تجاری مورد استفاده قرار گیرد.

این شرکت در یک پست وبلاگی اعلام کرد که هدفش «پیشبرد مرزهای خلاقیت، کارآیی و تنوع» است.

این شرکت افزود: «با در دسترس قرار دادن مدل‌های خود برای یک مخاطب گسترده، می‌خواهیم فواید آن را برای همه فراهم کنیم، به آگاهی عمومی کمک کنیم و اعتماد را افزایش دهیم.»

نمایندگان X و Black Forest Labs به درخواست‌های اظهار نظر پاسخ ندادند.

این استارتاپ نوپا در حوزه تولید تصویر، حمایت تعدادی از سرمایه‌گذاران بزرگ در اکوسیستم هوش مصنوعی را به دست آورده است. این شرکت اعلام کرد که در یک معامله به رهبری Andreessen Horowitz، 31 میلیون دلار سرمایه اولیه جذب کرده است. سایر سرمایه‌گذاران نیز شامل برندون ایریب، یکی از بنیان‌گذاران و رهبران سابق هدست‌های واقعیت مجازی Oculus شرکت Meta Platforms Inc. و همچنین گری تن، مدیرعامل شتاب‌دهنده استارتاپ Y Combinator هستند.

همکاری با شرکت‌های ماسک، پروفایل این شرکت کوچک را ارتقاء خواهد داد. بر اساس گزارش بلومبرگ، استارتاپ هوش مصنوعی ماسک در حال مذاکره با سرمایه‌گذاران برای جذب بیش از 6 میلیارد دلار است که آن را به یکی از ارزشمندترین استارتاپ‌ها در صنعتی که از قبل سرشار از سرمایه است، تبدیل می‌کند. چت‌بات Grok برای مشترکین پریمیوم پلتفرم اجتماعی X در دسترس است.

کاربران Grok می‌توانند با این نرم‌افزار انواع تصاویر را تولید کنند و در حال حاضر هم چنین تصاویری را تولید می‌کنند. این تصاویر شامل شبیه‌سازی‌های واقع‌گرایانه از چهره‌های عمومی شناخته‌شده مانند تصاویری از رئیس‌جمهور سابق دونالد ترامپ و معاون رئیس‌جمهور کامالا هریس است که در حال مصرف مواد مخدر با هم هستند. اما به نظر می‌رسد برخی چیزها همچنان خارج از محدوده این نرم‌افزار قرار دارند.

در حالی که Grok بدون مشکل تصاویری از تیلور سوئیفت، ستاره پاپ، در حال عشق بازی با ماریو از بازی Super Mario Bros تولید کرده است، اما در مقابل درخواست‌های دیگر برای تولید تصاویر دارای محتوای نامناسب یا خشونت‌آمیز، مقاومت می‌کند. در چنین مواردی، پیام‌هایی مانند «من هیچ تصویر یا محتوای مستهجن تولید یا توصیف نخواهم کرد» و «من درخواست را درک می‌کنم، اما باید سیاستی را حفظ کنم که شامل تولید یا توصیف محتوایی که خشونت گرافیکی یا صحنه‌های خونین دارد، نمی‌شود.» نمایش می‌دهد.

لی در مورد تصاویری که شخصیت‌های عمومی و کاراکترها را در موقعیت‌های نامناسب قرار می‌دهد، احساسات متفاوتی دارد. او می‌گوید: «از یک سو، من فکر می‌کنم که انتشار اطلاعات نادرست به این گستردگی مشکل‌ساز است. از سوی دیگر، توانایی ایجاد تصاویر طنز از رهبران عمومی یک حق عمومی در متمم اول قانون اساسی آمریکا است.»

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *