پشتیبانی ChatGPT از دستورات صوتی و تصویری

    کد خبر :1023557

OpenAI اخیراً قابلیت‌های چندوجهی جدیدی را برای ChatGPT معرفی کرده که به کاربران امکان می‌دهد در مکالمات صوتی شرکت کنند و تصاویر را با مدل زبانی در زمان واقعی به اشتراک بگذارند.

بازتاب-این ویژگی‌ها در ابتدا برای مشترکین Plus و Enterprise و سپس برای کاربران رایگان در دسترس خواهند بود. ورودی صوتی، مشابه آنچه در دستیارهای صوتی موبایلی مانند سیری و دستیار گوگل می‌یابیم، به کاربران اجازه می‌دهد تا سوالات خود را بیان کنند.

سپس سیستم این گفتار را به متن ترجمه می‌کند، آن را پردازش کرده و به صورت صوتی پاسخ می‌دهد. این قابلیت هم در iOS و هم اندروید قابل دسترسی بوده و پتانسیل بالایی برای اپلیکیشن‌های مختلف دارد.

به طور مشابه، ویژگی ورودی تصویر، شبیه به لنز گوگل، کاربران را قادر می‌سازد تا سوالات خود را با استفاده از تصاویر منتقل کنند. ChatGPT تصاویر آپلود شده را تجزیه و تحلیل کرده و پاسخ مربوطه را ارائه می‌دهد. کاربران حتی می‌توانند از ابزارهای طراحی برای برجسته کردن بخش‌های خاصی از تصویر استفاده کنند یا سوالات خود را از طریق متن یا صدا روشن کنند.

هدف این ویژگی افزایش تجربه کاربر با فعال کردن مکالمات پویا است. این می‌تواند به ویژه برای کارهایی مانند تعمیر دوچرخه یا پخت و پز همانطور که توسط OpenAI نشان داده شده مفید باشد، جایی که کاربران می‌توانند تصاویر اشیاء یا کتابچه‌های دستورالعمل را آپلود کنند و توضیحات و راه حل‌ها را دریافت کنند.

 

ChatGPT

 

تصمیم OpenAI برای ادغام قابلیت‌های صوتی و تصویری در ChatGPT نه تنها دامنه تعاملات را گسترش می‌دهد، بلکه فرصت‌های خلاقانه هیجان‌انگیزی را نیز ایجاد می‌کند. با این حال، OpenAI از احتمال سوء استفاده آگاه بوده و اقداماتی را برای جلوگیری از کاربردهای غیراخلاقی این ویژگی‌های پیشرفته انجام داد.

برای شروع استفاده از صدا با ChatGPT، در برنامه تلفن همراه به تنظیمات بروید، به ویژگی‌های جدید دسترسی پیدا کنید، در مکالمات صوتی شرکت کنید، روی نماد هدفون در گوشه سمت راست بالای صفحه اصلی ضربه بزنید و صدای دلخواه خود را از پنج گزینه انتخاب کنید.

برای درخواست تصویر، روی دکمه پلاس ضربه بزنید و سپس تصویری را بگیرید یا انتخاب کنید و از ابزارهای طراحی برای راهنمایی دستیار استفاده کنید. OpenAI همچنین اخیراً DALL-E 3 را راه‌اندازی کرده، یک ابزار هنری ارتقا یافته هوش مصنوعی که دارای یکپارچگی با ChatGPT است و به کاربران امکان می‌دهد راحت‌تر درخواست‌های دقیق ایجاد کنند. DALL-E 3 به چالش تولید دست‌های واقعی انسان می‌پردازد و عملکرد خود را با دستورات پیچیده در مقایسه با نسخه قبلی یعنی DALL-E 2 بهبود می‌بخشد.

0
نظرات
نشانی ایمیل شما منتشر نخواهد شد نظرات حاوی الفاظ و ادبیات نامناسب، تهمت و افترا منتشر نخواهد شد

دیدگاهتان را بنویسید