گوگل به تازگی قابلیت درک ویدیو در جمنای را به سیستم هوش مصنوعی خود، افزوده است که این فناوری را به یک دستیار دیجیتال پیشرفته تبدیل کرده است. این ویژگیها، که اکنون در حال عرضه به کاربران نسخه Gemini Advanced هستند، به دستیار هوشمند امکان میدهند تا نمایشگر گوشی کاربر را بخواند یا از طریق دوربین گوشی، تصاویر را بهصورت زنده پردازش کند و به سؤالات پاسخ دهد.
این ویژگیها در قالب سرویس Google One AI Premium ارائه میشوند و بر اساس پروژه Astra توسعه یافتهاند که گوگل سال گذشته آن را معرفی کرد. بهاینترتیب، کاربران میتوانند از جمنای درخواست کنند که محتوای روی صفحه گوشی را تحلیل کند یا از طریق دوربین گوشی، بهصورت زنده به پرسشهای آنان پاسخ دهد.
قابلیتهای جدید Gemini: از خواندن صفحه نمایش تا تحلیل زنده ویدئو
۱. تحلیل محتوای نمایشگر گوشی: قابلیت جدید جمنای میتواند محتوای صفحه نمایش گوشی را بخواند و درباره آن توضیح دهد. برای مثال، اگر کاربر مشغول خواندن یک مقاله باشد، میتواند از جمنای بخواهد خلاصهای از آن ارائه دهد. همچنین، میتواند به پیامهای روی صفحه واکنش نشان دهد یا اطلاعات را دسته بندی کند. ۲. پشتیبانی از پردازش زنده ویدئو: یکی از پیشرفتهترین قابلیتهای افزودهشده به جمنای، امکان تحلیل زنده تصاویر ویدئویی از طریق دوربین گوشی است. در یکی از نمونههای نمایش دادهشده، کاربری از جمنای درخواست کرده تا در انتخاب رنگ مناسب برای یک قطعه سفالی که تازه لعاب داده شده، کمک کند. این قابلیت میتواند در حوزههایی مانند آموزش، تعمیرات، تشخیص اشیا و حتی راهنمایی بصری در زندگی روزمره کاربردهای گستردهای داشته باشد.
رقابت شدید در بازار دستیاران هوش مصنوعی
عرضه این قابلیتها نشان دهندهی پیشروی گوگل در رقابت با دیگر شرکتهای فعال در حوزه هوش مصنوعی دستیاران دیجیتال است. در حالی که گوگل این ویژگیها را برای کاربران اختصاصی خود فعال کرده، آمازون در حال آماده سازی نسخهی ارتقا یافتهی الکسا پلاس است که تواناییهایی مشابه خواهد داشت. از سوی دیگر، اپل هنوز در توسعه نسخهی پیشرفتهی سیری با تاخیر روبه رو است و مشخص نیست چه زمانی نسخهی جدید آن عرضه میشود.
سامسونگ نیز همچنان دستیار Bixby را حفظ کرده، اما همکاری نزدیک این شرکت با گوگل باعث شده که در گوشیهای جدید سری گلکسی، جمنای بهعنوان دستیار پیشفرض انتخاب شود. این همکاری میتواند در آینده تاثیر زیادی بر استراتژی سامسونگ در بخش نرم افزارهای هوش مصنوعی داشته باشد.
جمع بندی
گوگل با عرضه این قابلیتهای جدید، فاصله خود را با رقبا افزایش داده و هوش مصنوعی دستیار دیجیتال خود را یک گام به تعامل طبیعیتر و هوشمندانه تر با کاربران نزدیک کرده است. اگر این فناوری بتواند به طور گسترده و بدون مشکل فنی در اختیار کاربران قرار گیرد، ممکن است آیندهی استفاده از دستیارهای هوش مصنوعی را متحول کند.
با این حال، پرسشهای مهمی در مورد حریم خصوصی و امنیت دادهها مطرح میشود. قابلیت خواندن نمایشگر و پردازش زنده ویدئو، اگرچه امکانات جدید و جذابی ارائه میدهد، اما چالشهایی را نیز در زمینهی مدیریت دادههای کاربران و نحوه ذخیره سازی و پردازش اطلاعات شخصی ایجاد میکند. در نهایت، موفقیت یا شکست این فناوری به نحوه اجرای آن و میزان اعتماد کاربران به آن بستگی خواهد داشت.
__ تکنو دات مرجع اخبار تکنولوژی __