این دمو دستیار صوتی هوشمندانه را که همراه با GPT-3 و سیری هک شده است، بررسی کنید

به گزارش سرویس اخبار فناوری پایگاه خبری عصر فناوری ،

یک توسعه‌دهنده یک نسخه نمایشی GPT-3 را جمع‌آوری کرده است که تلاش می‌کند دستیار صوتی سیری اپل را بهبود بخشد و دستورات صوتی مکالمه‌ای بسیار بیشتری را امکان‌پذیر کند. در ویدیویی که در Reddit ارسال شده است، Mate Marschalko توسعه‌دهنده دستیار را نشان می‌دهد که دستگاه‌های خانه هوشمند HomeKit خود را کنترل می‌کند و در پاسخ به درخواست‌های نسبتا مبهم که دستیارهای صوتی امروزی مانند Siri معمولاً برای درک آن مشکل دارند، به سؤالات پاسخ می‌دهد.

برای مثال، هوش مصنوعی نشان داده می‌شود که چراغ‌های مارشالکو را در پاسخ به پیام صوتی روشن می‌کند: «فقط متوجه شدم که دارم این ویدیو را در تاریکی در دفتر ضبط می‌کنم، آیا می‌توانید کاری در مورد آن انجام دهید؟» بعداً در ویدیو، مارشالکو از دستیار می‌خواهد تا اتاق خوابش را روی دمایی تنظیم کند که «به من کمک کند بهتر بخوابم» و با تنظیم ترموستات اتاق خوابش روی 19 درجه سانتی‌گراد پاسخ می‌دهد.

“تازه متوجه شدم که دارم این ویدئو را در تاریکی در دفتر ضبط می کنم، آیا می توانید کاری در مورد آن انجام دهید؟”

در یک پست وبلاگ همراه، Marschalko نحوه عملکرد نسخه ی نمایشی را توضیح می دهد. اساساً، او از برنامه Shortcuts اپل برای رابط بین Siri، GPT-3 و دستگاه‌های خانه هوشمند خود با قابلیت HomeKit استفاده می‌کند. یک فرمان صوتی به سیری باعث می‌شود که Shortcutها یک اعلان طولانی را به سرویس هوش مصنوعی بفرستند و درخواست پاسخ را در قالبی قابل خواندن توسط ماشین کنند. پس از دریافت پاسخ، Shortcuts آن را برای کنترل دستگاه های خانه هوشمند و/یا پاسخ از طریق سیری تجزیه می کند. برای توضیح کامل تر، پست وبلاگ ارزش خواندن را دارد.

این یک نسخه نمایشی جذاب است و نشان می دهد که دستیارهای صوتی با ادغام نسل جدید فناوری هوش مصنوعی چه توانایی هایی دارند، اما کامل نیست. برای شروع، Marschalko می گوید که هر دستور 0.014 دلار برای هر درخواست API ارسال شده به GPT-3 هزینه دارد. ویدیو همچنین ویرایش شده است، بنابراین مشخص نیست که آیا نسخه آزمایشی 100 درصد مواقع کار می کند یا پاسخ ها به صورت انتخابی نشان داده می شوند. اگر نرم‌افزار تشخیص صدا در وهله اول نتواند کلماتی را که کاربر می‌گوید درک کند، یک بک‌اند هوشمندتر نیز کمکی نمی‌کند.

نسخه ی نمایشی سؤالات بزرگ تری در مورد نحوه عملکرد دستیارهای صوتی ایجاد می کند. آیا واقعاً می خواهید با یک دستیار صوتی مکالمه داشته باشید یا فقط می خواهید بتوانید دستورات کوتاه و ساده را برای کنترل آن مانند یک ربات پارس کنید؟ خود مارشالکو همچنین خطر گفتن «چیزهای غیرمنتظره» دستیار را در نظر بعدی Reddit مطرح می کند:

با این وجود، نسخه ی نمایشی همچنان نکات جالبی را ارائه می دهد که اگر شرکت هایی مانند اپل، آمازون و گوگل این فناوری را در خدمات خود ادغام کنند، چه نوع تعاملات دستیار صوتی ممکن است به زودی امکان پذیر باشد. و قابل توجه است که این ابزارها به اندازه کافی باز و قابل دسترسی هستند که می توان یک نسخه نمایشی نسبتاً نرم مانند این را با استفاده از نرم افزارهای مصرف کننده گسترده هک کرد.

این محتوا از سایت های خبری خارجی بطور اتوماتیک دانلود شده است و عصر فناوری فقط نمایش دهنده است. اگر این خبر با قوانین و مقررات جمهوری اسلامی مناقات دارد لطفا به ما گزارش کنید.

منبع

درباره ی asrf_admin

مطلب پیشنهادی

مدیرعامل Sonos می‌گوید آمازون و گوگل هیچ کار جالبی در زمینه صوتی انجام نمی‌دهند

به گزارش سرویس اخبار فناوری پایگاه خبری عصر فناوری ، در جریان تماس سود سه …