ارائه قابلیت درک ویدیو در جمنای با مرزهای هوش مصنوعی گوگل

آخرین به روز رسانی: ۵ فروردین ۱۴۰۴

4 دقیقه مطالعه

گوگل به تازگی قابلیت درک ویدیو در جمنای را به سیستم هوش مصنوعی خود، افزوده است که این فناوری را به یک دستیار دیجیتال پیشرفته تبدیل کرده است. این ویژگی‌ها، که اکنون در حال عرضه به کاربران نسخه Gemini Advanced هستند، به دستیار هوشمند امکان می‌دهند تا نمایشگر گوشی کاربر را بخواند یا از طریق دوربین گوشی، تصاویر را به‌صورت زنده پردازش کند و به سؤالات پاسخ دهد.

فهرست محتوا

قابلیت‌های جدید Gemini: از خواندن صفحه نمایش تا تحلیل زنده ویدئو رقابت شدید در بازار دستیاران هوش مصنوعی

این ویژگی‌ها در قالب سرویس Google One AI Premium ارائه می‌شوند و بر اساس پروژه Astra توسعه یافته‌اند که گوگل سال گذشته آن را معرفی کرد. به‌این‌ترتیب، کاربران می‌توانند از جمنای درخواست کنند که محتوای روی صفحه گوشی را تحلیل کند یا از طریق دوربین گوشی، به‌صورت زنده به پرسش‌های آنان پاسخ دهد.

قابلیت درک ویدیو در جمنای

قابلیت‌های جدید Gemini: از خواندن صفحه نمایش تا تحلیل زنده ویدئو

۱. تحلیل محتوای نمایشگر گوشی: قابلیت جدید جمنای می‌تواند محتوای صفحه نمایش گوشی را بخواند و درباره آن توضیح دهد. برای مثال، اگر کاربر مشغول خواندن یک مقاله باشد، می‌تواند از جمنای بخواهد خلاصه‌ای از آن ارائه دهد. همچنین، می‌تواند به پیام‌های روی صفحه واکنش نشان دهد یا اطلاعات را دسته بندی کند.

۲. پشتیبانی از پردازش زنده ویدئو: یکی از پیشرفته‌ترین قابلیت‌های افزوده‌شده به جمنای، امکان تحلیل زنده تصاویر ویدئویی از طریق دوربین گوشی است. در یکی از نمونه‌های نمایش داده‌شده، کاربری از جمنای درخواست کرده تا در انتخاب رنگ مناسب برای یک قطعه سفالی که تازه لعاب داده شده، کمک کند. این قابلیت می‌تواند در حوزه‌هایی مانند آموزش، تعمیرات، تشخیص اشیا و حتی راهنمایی بصری در زندگی روزمره کاربردهای گسترده‌ای داشته باشد.

رقابت شدید در بازار دستیاران هوش مصنوعی

عرضه این قابلیت‌ها نشان دهنده‌ی پیشروی گوگل در رقابت با دیگر شرکت‌های فعال در حوزه هوش مصنوعی دستیاران دیجیتال است. در حالی که گوگل این ویژگی‌ها را برای کاربران اختصاصی خود فعال کرده، آمازون در حال آماده سازی نسخه‌ی ارتقا یافته‌ی الکسا پلاس است که توانایی‌هایی مشابه خواهد داشت. از سوی دیگر، اپل هنوز در توسعه نسخه‌ی پیشرفته‌ی سیری با تاخیر روبه رو است و مشخص نیست چه زمانی نسخه‌ی جدید آن عرضه می‌شود.

سامسونگ نیز همچنان دستیار Bixby را حفظ کرده، اما همکاری نزدیک این شرکت با گوگل باعث شده که در گوشی‌های جدید سری گلکسی، جمنای به‌عنوان دستیار پیش‌فرض انتخاب شود. این همکاری می‌تواند در آینده تاثیر زیادی بر استراتژی سامسونگ در بخش نرم افزارهای هوش مصنوعی داشته باشد.

قابلیت درک ویدیو در جمنای

جمع بندی

گوگل با عرضه این قابلیت‌های جدید، فاصله خود را با رقبا افزایش داده و هوش مصنوعی دستیار دیجیتال خود را یک گام به تعامل طبیعی‌تر و هوشمندانه تر با کاربران نزدیک‌ کرده است. اگر این فناوری بتواند به طور گسترده و بدون مشکل فنی در اختیار کاربران قرار گیرد، ممکن است آینده‌ی استفاده از دستیارهای هوش مصنوعی را متحول کند.

با این حال، پرسش‌های مهمی در مورد حریم خصوصی و امنیت داده‌ها مطرح می‌شود. قابلیت خواندن نمایشگر و پردازش زنده ویدئو، اگرچه امکانات جدید و جذابی ارائه می‌دهد، اما چالش‌هایی را نیز در زمینه‌ی مدیریت داده‌های کاربران و نحوه ذخیره سازی و پردازش اطلاعات شخصی ایجاد می‌کند. در نهایت، موفقیت یا شکست این فناوری به نحوه اجرای آن و میزان اعتماد کاربران به آن بستگی خواهد داشت.

__ تکنو دات مرجع اخبار تکنولوژی __