به گزارش سرویس اخبار فناوری پایگاه خبری عصر فناوری ،
گوگل PalM 2 را معرفی کرده است: آخرین مدل زبان هوش مصنوعی خود و رقیب سیستمهای رقیب مانند GPT-4 OpenAI.
ساندار پیچای، مدیرعامل گوگل روی صحنه در کنفرانس I/O این شرکت گفت: «مدلهای PaLM 2 در منطق و استدلال قویتر هستند، به لطف آموزش گسترده در منطق و استدلال. همچنین بر روی متن چند زبانه که بیش از 100 زبان را در بر می گیرد، آموزش دیده است.
اسلاو پتروف، مدیر ارشد تحقیقاتی گوگل، قبل از معرفی مدل در کنفرانس I/O گوگل، از جمله استدلال، کدنویسی و ترجمه، در میزگردی به خبرنگاران گفت که PalM 2 در طیف وسیعی از وظایف مبتنی بر متن بسیار بهتر است. در مقایسه با PalM 1 به طور قابل توجهی بهبود یافته است [which was announced in April 2022]پتروف گفت.
به عنوان نمونه ای از قابلیت های چند زبانه خود، پتروف نشان داد که چگونه PaLM 2 می تواند اصطلاحات زبان های مختلف را بفهمد، با مثالی از عبارت آلمانی “Ich verstehe nur Bahnhof” که به معنای واقعی کلمه به “من فقط ایستگاه قطار را می فهمم” اما بهتر است را نشان داد. به عنوان “من نمی فهمم شما چه می گویید” یا، به عنوان یک اصطلاح انگلیسی، “برای من همه چیز یونانی است.”
در یک مقاله تحقیقاتی که قابلیتهای PaLM 2 را توصیف میکند، مهندسان گوگل ادعا کردند که مهارت زبانی این سیستم “برای آموزش آن زبان کافی است” و خاطرنشان کردند که این تا حدی به دلیل شیوع بیشتر متون غیر انگلیسی در دادههای آموزشی آن است.
مانند دیگر مدلهای زبان بزرگ، که زمان و منابع زیادی برای ایجاد آنها صرف میشود، PalM 2 کمتر یک محصول واحد است تا یک خانواده از محصولات – با نسخههای مختلف که در تنظیمات مصرفکننده و سازمانی مستقر خواهند شد. این سیستم در چهار اندازه به نامهای Gecko، Otter، Bison و Unicorn از کوچکترین تا بزرگترین موجود است و بر روی دادههای دامنه خاص برای انجام وظایف خاصی برای مشتریان سازمانی تنظیم شده است.
به این انطباقها فکر کنید، مانند استفاده از یک شاسی معمولی کامیون و اضافه کردن یک موتور یا سپر جلوی جدید برای انجام وظایف خاص یا عملکرد بهتر در زمینهای خاص. نسخهای از PALM وجود دارد که بر روی دادههای سلامتی آموزش دیده است (Med-PaLM 2)، که گوگل میگوید میتواند به سوالاتی شبیه به سوالات موجود در آزمون مجوز پزشکی ایالات متحده در سطح “متخصص” پاسخ دهد و نسخه دیگری آموزش دیده در مورد دادههای امنیت سایبری (Sec-PaLM 2) پتروف گفت که می تواند رفتار اسکریپت های مخرب احتمالی را توضیح دهد و به شناسایی تهدیدها در کد کمک کند. هر دوی این مدلها در ابتدا از طریق Google Cloud برای مشتریان منتخب در دسترس خواهند بود.
در دامنه خود گوگل، PalM 2 در حال حاضر برای تامین 25 ویژگی و محصول، از جمله Bard، ربات چت آزمایشی این شرکت، استفاده می شود. به روز رسانی های موجود از طریق Bard شامل قابلیت های کدنویسی بهبود یافته و پشتیبانی بیشتر از زبان است. همچنین برای تقویت ویژگیهای برنامههای Google Workspace مانند Docs، Slides و Sheets استفاده میشود.
نکته قابل توجه، گوگل میگوید سبکترین نسخه PalM 2، Gecko، به اندازهای کوچک است که روی تلفنهای همراه اجرا شود و 20 توکن در ثانیه پردازش میکند – تقریباً معادل حدود 16 یا 17 کلمه. گوگل نگفت که از چه سخت افزاری برای آزمایش این مدل استفاده شده است، فقط این که «بر روی جدیدترین گوشی ها» اجرا می شود. با این وجود، کوچک سازی چنین مدل های زبانی قابل توجه است. چنین سیستم هایی برای اجرا در فضای ابری گران هستند و امکان استفاده از آنها به صورت محلی مزایای دیگری مانند بهبود حریم خصوصی دارد. مشکل این است که نسخه های کوچکتر مدل های زبانی ناگزیر نسبت به برادران بزرگتر خود توانایی کمتری دارند.
با PalM 2، گوگل امیدوار است که «شکاف هوش مصنوعی» بین شرکت و رقبایی مانند مایکروسافت را که به شدت ابزارهای زبان هوش مصنوعی را به مجموعه نرمافزار آفیس خود وارد میکند، ببندد. مایکروسافت اکنون ویژگیهای هوش مصنوعی را ارائه میکند که به خلاصهسازی اسناد، نوشتن ایمیل، تولید اسلاید برای ارائهها و موارد دیگر کمک میکند. گوگل برای اجرای تحقیقات هوش مصنوعی خود باید برابری با شرکت را حفظ کند وگرنه ممکن است کند تلقی شود.
اگرچه PaLM 2 مطمئناً گامی رو به جلو برای کار گوگل بر روی مدلهای زبان هوش مصنوعی است، اما از مشکلات و چالشهای رایجتر در این فناوری رنج میبرد.
به عنوان مثال، برخی از کارشناسان شروع به زیر سوال بردن قانونی بودن داده های آموزشی مورد استفاده برای ایجاد مدل های زبانی کرده اند. این دادهها معمولاً از اینترنت حذف میشوند و اغلب شامل متنهای محافظت شده با حق چاپ و کتابهای الکترونیکی غیرقانونی میشوند. شرکتهای فناوری که این مدلها را ایجاد میکنند، عموماً با پاسخ دادن به سؤالاتی در مورد اینکه دادههای آموزشی خود را از کجا منبع میگیرند، پاسخ دادهاند. گوگل این سنت را در توصیف PalM 2 ادامه داده است و تنها به این نکته اشاره کرده است که مجموعه آموزشی سیستم از “مجموعه ای متنوع از منابع: اسناد وب، کتاب ها، کد، ریاضیات و داده های مکالمه” تشکیل شده است، بدون ارائه جزئیات بیشتر.
همچنین مشکلات ذاتی در خروجی مدلهای زبانی مانند «توهمات» یا تمایل این سیستمها به ساختن اطلاعات وجود دارد. صحبت کردن با آستانهزوبین قهرمانی معاون پژوهشی گوگل میگوید که در این راستا، PalM 2 پیشرفتی نسبت به مدلهای قبلی بود «به این معنا که ما تلاش زیادی برای بهبود مستمر معیارهای زمینهسازی و انتساب انجام میدهیم» اما خاطرنشان کرد که این زمینه به طور کلی «هنوز راههایی در پیش است» در مبارزه با اطلاعات نادرست تولید شده توسط هوش مصنوعی.
این محتوا از سایت های خبری خارجی بطور اتوماتیک دانلود شده است و عصر فناوری فقط نمایش دهنده است. اگر این خبر با قوانین و مقررات جمهوری اسلامی مناقات دارد لطفا به ما گزارش کنید.