مدل‌های زبانی بزرگ به کمک ربات‌ها می‌آیند

چهارشنبه / ۶ تیر / ۱۴۰۳ - 26 June, 2024

خبرگزاری ایسنا / ۱۴۰۳/۰۳/۲۷

یک روش جدید هدایت ربات‌ها، از ورودی‌های مبتنی بر زبان به جای داده‌های بصری پرهزینه استفاده می‌کند و این کار را در چند مرحله انجام می‌دهد.

در حال انتقال به متن خبر

مدل‌های زبانی بزرگ به کمک ربات‌ها می‌آیند

یک روش جدید هدایت ربات‌ها، از ورودی‌های مبتنی بر زبان به جای داده‌های بصری پرهزینه استفاده می‌کند و این کار را در چند مرحله انجام می‌دهد. به گزارش ایسنا، ممکن است روزی بخواهید ربات خانگی شما لباس‌های کثیف را به طبقه پایین خانه ببرد و آنها را در ماشین لباسشویی بگذارد. ربات باید دستورالعمل‌های شما را با مشاهدات بصری خود ترکیب کند تا مراحل تکمیل این کار را تشخیص دهد.

به نقل از ساینس دیلی، شاید یک روش جدید بتواند مسیری را برای ربات تنها با استفاده از ورودی‌های مبتنی بر زبان برنامه‌ریزی کند. اگرچه این روش نمی‌تواند بهتر از روش‌های مبتنی بر بینش رایانه‌ای عمل کند اما می‌تواند در تنظیماتی که فاقد داده‌های بصری برای آموزش دادن ربات هستند، سودمند باشد.

برای یک عامل هوش مصنوعی، حرف زدن درباره این کار آسان‌تر از انجام دادن آن است. روش‌های کنونی اغلب از چندین مدل یادگیری ماشینی برای برخورد با بخش‌های گوناگون کار استفاده می‌کنند که به تلاش و تخصص انسانی زیادی نیاز دارند. این روش‌ها که از بازنمایی‌های بصری به منظور تصمیم‌گیری مستقیم برای جهت‌یابی استفاده می‌کنند، حجم زیادی از داده‌های بصری را برای آموزش می‌خواهند که اغلب به سختی به دست می‌آیند.

پژوهشگران دانشگاه «ام‌آی‌تی»(MIT) و «آزمایشگاه هوش مصنوعی واتسون ام‌آی‌تی-آی‌بی‌ام»(MIT-IBM Watson AI Lab) برای غلبه بر این چالش‌ها، یک روش جهت‌یابی ابداع کردند که نمایش‌های بصری را به بخش‌های زبانی تبدیل می‌کند. سپس این بخش‌ها به یک مدل زبانی بزرگ وارد می‌شوند که همه بخش‌های وظیفه جهت‌یابی چندمرحله‌ای را انجام می‌دهد.

روش آنها به ‌جای رمزگذاری ویژگی‌های بصری، از تصاویر محیط اطراف ربات به‌عنوان نمایش‌های بصری استفاده می‌کنند که از نظر محاسباتی فشرده است و زیرنویس‌های متنی ارائه می‌دهد که نقطه‌نظر ربات را توصیف می‌کنند. یک مدل زبانی بزرگ از این توصیف‌ها، برای پیش‌بینی اقداماتی استفاده می‌کند که یک ربات باید برای انجام دادن دستورالعمل‌های مبتنی بر زبان کاربر انجام دهد.

از آنجا که روش این گروه پژوهشی از بازنمایی‌های صرفا مبتنی بر زبان استفاده می‌کند، آنها می‌توانند یک مدل زبانی بزرگ را برای تولید موثر حجم زیادی از داده‌های آموزش مصنوعی به کار بگیرند.

اگرچه این روش نسبت به روش‌هایی که از ویژگی‌های بصری استفاده می‌کنند، عملکرد بهتری ندارد اما در موقعیت‌هایی که فاقد داده‌های بصری کافی برای آموزش هستند، به خوبی عمل می‌کند. پژوهشگران دریافتند که ترکیب ورودی‌های مبتنی بر زبان با سیگنال‌های بصری، به عملکرد بهتر در جهت‌یابی کمک می‌کند.

«بوون پن»(Bowen Pan) پژوهشگر ارشد این پروژه گفت: روش ما با استفاده صرف از زبان به عنوان نمایش ادراکی، ساده‌تر عمل می‌کند. از آنجا که همه ورودی‌ها را می‌توان به صورت زبان رمزگذاری کرد، می‌توانیم یک مسیر قابل درک را برای انسان ایجاد کنیم.

انتهای پیام خبرنگار روجا تحریری نوری دبیر مسعود جعفرشعار لینک کوتاه برچسب‌ها: مدل زبانی بزرگ ربات جهت یابی دنیای هوش مصنوعی اخبار مرتبط هوش مصنوعی زبان بیماری‌ها را می‌فهمد! آینده هوش مصنوعی مولد از زبان خودش لینکستان خرید برنج ایرانی مستقیم از کشاورز با کف قیمت بازار آخرین قیمت انواع برنج ایرانی در سال 1403 دانلود آهنگ خرید بلیط هواپیما سانا‌پرس بوکینگ مبلمان اداری چوب ترمو دانلود آهنگ سویل موزیک جمینجا خرید سی پی ارزان آپ موزیک موزیکفا سایت تخصصی فیلم و سریال بلیط هواپیما فلای‌تو‌دی بلیط هواپیما تو‌ر دبی روغن هیدرولیک سرور مجازی ایران طراحی سایت پیوان قیمت ملیگرد امروز خرید هاست فروشگاه تخصصی تشک و تخت عطاری آنلاین لیفت صورت با نخ در زمینه انتشار نظرات مخاطبان رعایت چند مورد ضروری است:-لطفا نظرات خود را با حروف فارسی تایپ کنید.-«ایسنا» مجاز به ویرایش ادبی نظرات مخاطبان است.- ایسنا از انتشار نظراتی که حاوی مطالب کذب، توهین یا بی‌احترامی به اشخاص، قومیت‌ها، عقاید دیگران، موارد مغایر با قوانین کشور و آموزه‌های دین مبین اسلام باشد معذور است.- نظرات پس از تأیید مدیر بخش مربوطه منتشر می‌شود. نظرات شما در حال پاسخ به نظر « » هستید. × لغو پاسخ لطفا عدد مقابل را در جعبه متن وارد کنید ارسال