یک روش جدید هدایت رباتها، از ورودیهای مبتنی بر زبان به جای دادههای بصری پرهزینه استفاده میکند و این کار را در چند مرحله انجام میدهد.
در حال انتقال به متن خبر
مدلهای زبانی بزرگ به کمک رباتها میآیند
یک روش جدید هدایت رباتها، از ورودیهای مبتنی بر زبان به جای دادههای بصری پرهزینه استفاده میکند و این کار را در چند مرحله انجام میدهد. به گزارش ایسنا، ممکن است روزی بخواهید ربات خانگی شما لباسهای کثیف را به طبقه پایین خانه ببرد و آنها را در ماشین لباسشویی بگذارد. ربات باید دستورالعملهای شما را با مشاهدات بصری خود ترکیب کند تا مراحل تکمیل این کار را تشخیص دهد.
به نقل از ساینس دیلی، شاید یک روش جدید بتواند مسیری را برای ربات تنها با استفاده از ورودیهای مبتنی بر زبان برنامهریزی کند. اگرچه این روش نمیتواند بهتر از روشهای مبتنی بر بینش رایانهای عمل کند اما میتواند در تنظیماتی که فاقد دادههای بصری برای آموزش دادن ربات هستند، سودمند باشد.
برای یک عامل هوش مصنوعی، حرف زدن درباره این کار آسانتر از انجام دادن آن است. روشهای کنونی اغلب از چندین مدل یادگیری ماشینی برای برخورد با بخشهای گوناگون کار استفاده میکنند که به تلاش و تخصص انسانی زیادی نیاز دارند. این روشها که از بازنماییهای بصری به منظور تصمیمگیری مستقیم برای جهتیابی استفاده میکنند، حجم زیادی از دادههای بصری را برای آموزش میخواهند که اغلب به سختی به دست میآیند.
پژوهشگران دانشگاه «امآیتی»(MIT) و «آزمایشگاه هوش مصنوعی واتسون امآیتی-آیبیام»(MIT-IBM Watson AI Lab) برای غلبه بر این چالشها، یک روش جهتیابی ابداع کردند که نمایشهای بصری را به بخشهای زبانی تبدیل میکند. سپس این بخشها به یک مدل زبانی بزرگ وارد میشوند که همه بخشهای وظیفه جهتیابی چندمرحلهای را انجام میدهد.
روش آنها به جای رمزگذاری ویژگیهای بصری، از تصاویر محیط اطراف ربات بهعنوان نمایشهای بصری استفاده میکنند که از نظر محاسباتی فشرده است و زیرنویسهای متنی ارائه میدهد که نقطهنظر ربات را توصیف میکنند. یک مدل زبانی بزرگ از این توصیفها، برای پیشبینی اقداماتی استفاده میکند که یک ربات باید برای انجام دادن دستورالعملهای مبتنی بر زبان کاربر انجام دهد.
از آنجا که روش این گروه پژوهشی از بازنماییهای صرفا مبتنی بر زبان استفاده میکند، آنها میتوانند یک مدل زبانی بزرگ را برای تولید موثر حجم زیادی از دادههای آموزش مصنوعی به کار بگیرند.
اگرچه این روش نسبت به روشهایی که از ویژگیهای بصری استفاده میکنند، عملکرد بهتری ندارد اما در موقعیتهایی که فاقد دادههای بصری کافی برای آموزش هستند، به خوبی عمل میکند. پژوهشگران دریافتند که ترکیب ورودیهای مبتنی بر زبان با سیگنالهای بصری، به عملکرد بهتر در جهتیابی کمک میکند.
«بوون پن»(Bowen Pan) پژوهشگر ارشد این پروژه گفت: روش ما با استفاده صرف از زبان به عنوان نمایش ادراکی، سادهتر عمل میکند. از آنجا که همه ورودیها را میتوان به صورت زبان رمزگذاری کرد، میتوانیم یک مسیر قابل درک را برای انسان ایجاد کنیم.
انتهای پیام خبرنگار روجا تحریری نوری دبیر مسعود جعفرشعار لینک کوتاه برچسبها: مدل زبانی بزرگ ربات جهت یابی دنیای هوش مصنوعی اخبار مرتبط هوش مصنوعی زبان بیماریها را میفهمد! آینده هوش مصنوعی مولد از زبان خودش لینکستان خرید برنج ایرانی مستقیم از کشاورز با کف قیمت بازار آخرین قیمت انواع برنج ایرانی در سال 1403 دانلود آهنگ خرید بلیط هواپیما ساناپرس بوکینگ مبلمان اداری چوب ترمو دانلود آهنگ سویل موزیک جمینجا خرید سی پی ارزان آپ موزیک موزیکفا سایت تخصصی فیلم و سریال بلیط هواپیما فلایتودی بلیط هواپیما تور دبی روغن هیدرولیک سرور مجازی ایران طراحی سایت پیوان قیمت ملیگرد امروز خرید هاست فروشگاه تخصصی تشک و تخت عطاری آنلاین لیفت صورت با نخ در زمینه انتشار نظرات مخاطبان رعایت چند مورد ضروری است:-لطفا نظرات خود را با حروف فارسی تایپ کنید.-«ایسنا» مجاز به ویرایش ادبی نظرات مخاطبان است.- ایسنا از انتشار نظراتی که حاوی مطالب کذب، توهین یا بیاحترامی به اشخاص، قومیتها، عقاید دیگران، موارد مغایر با قوانین کشور و آموزههای دین مبین اسلام باشد معذور است.- نظرات پس از تأیید مدیر بخش مربوطه منتشر میشود. نظرات شما در حال پاسخ به نظر « » هستید. × لغو پاسخ لطفا عدد مقابل را در جعبه متن وارد کنید ارسال