گوگل بهزودی قابلیت ساخت تصویر اشخاص را در ابزار هوش مصنوعی خود، Gemini، دوباره فعال میکند. این ویژگی پیشتر به دلیل تولید تصاویری با اشتباهات تاریخی غیرفعال شده بود.
در بیانیه اخیر گوگل، این شرکت اعلام کرده است که طی روزهای آینده نسخه آزمایشی این قابلیت برای کاربران نسخههای Gemini Advanced، Business و Enterprise به زبان انگلیسی ارائه میشود. این قابلیت توسط Imagen 3، نسخه جدید مدل هوش مصنوعی تبدیل متن به تصویر گوگل، پشتیبانی میشود. گوگل اوایل این ماه بدون هیچ اعلام قبلی Imagen 3 را از طریق AI Test Kitchen در دسترس کاربران قرار داد و حالا قصد دارد آن را به طور گستردهتری به Gemini اضافه کند. ابزار جدید گوگل قادر است تنها با توصیف چند کلمه، تصاویری از مناظر واقعگرایانه تا نقاشیهای هنری تولید کند.
در ماه فوریه، چندین کاربر گزارش دادند که مدل هوش مصنوعی گوگل، Gemini، تصاویری تولید میکرد که از نظر تاریخی دقیق نبودند. «دیو سیترون»، مدیر ارشد مدیریت محصول گوگل برای Gemini، در این بیانیه جدید توضیح داد که مدل ارتقاء یافته Imagen 3 دارای سیستمهای محافظتی داخلی است که آن را از دیگر مدلهای موجود متمایز میکند و دقت آن را افزایش میدهد.
لازم به ذکر است که Gemini همچنان اجازه تولید تصاویر واقعی از چهرههای شناختهشده را نمیدهد. همچنین، تولید محتوای مرتبط با کودکان، صحنههای خشونتآمیز، و محتوای جنسی نیز ممنوع است. سیترون در ادامه افزود: «البته، تمام تصاویری که با Gemini تولید میشوند، بینقص نخواهند بود. ما همچنان به بازخوردهای کاربران Gemini Advanced توجه داریم.»
گوگل به دنبال گسترش این قابلیت به زبانها و کاربران بیشتری در آیندهای نزدیک است.