هوش مصنوعی بر پایه استخراج دانش موجود در دادههاست
تندیس بیستمین اجلاس فناوری رسانه با عنوان نشست تخصصی برتر به دکتر راهیل مهدیان برای نشست هوش مصنوعی مولد و آینده آن اهدا شد.
به گزارش روابط عمومی دانشگاه صداوسیما، دکتر راهیل مهدیان که ریاست دانشکده فنی مهندسی رسانه دانشگاه صداوسیما را عهدهدار است و به عنوان عضو شورای هوش مصنوعی سازمان فعالیت میکند توانست با ارائه موضوع تخصصی خود یعنی هوش مصنوعی، تندیس برتر اجلاس فناوری رسانه را کسب کند.
مهدیان با تأکید بر اهمیت و ضرورت پرداختن رسانهها به ویژه رسانه ملی به فناوری هوش مصنوعی گفت: اجلاس بیستم فناوری رسانه فرصت مناسبی را فراهم کرد تا پژوهشگران و فعالان این حوزه گرد هم آیند و در این خصوص تبادل نظر کنند.
بخشی از محتوای این نشست تخصصی را در ادامه میخوانید.
هوش مصنوعی مولد به شاخهای از هوش مصنوعی اشاره دارد که تمرکز آن بر توسعه الگوریتمها و مدلهایی است که قادر به تولید دیتای جدید در قالبهای مختلف متن، تصویر، آودیو یا ویدئو باشد. این سیستمهای هوشمند الگوها و ساختارها و ارتباطات بین دادههای موجود در بانک دادهها را میآموزند و از طریق آنها دانش لازم برای ساخت محتوای جدید که بسیار شبیه به دادههای واقعی است را به دست میآورند.
آغاز هوش مصنوعی مولد در سال 2006 با سیستم مترجم گوگل بوده است. بعد از آن بدون اینکه عبارت مولد به این سیستمها اطلاق گردد سیستمهای مولد دیگری مانند Apple Siri در سال 2011، جستجوهای هوشمند که کلمات بعدی را پیشبینی میکردند و سایر سیستمهای مشابه دیگر متولد شدند.
ایده اصلی هوش مصنوعی مولد، با الهام گرفتن از سیستمهای دنباله به دنباله در شبکههای عصبی عمیق بازگشتی و با توجه به مدل یادگیری زبانی در آنها بوجود آمد. همانطور که یک سیستم شبکه عصبی عمیق بازگشتی میتوانست برای یادگیری کلمات متوالی یک جمله در یک زبان مبدأ و یا حتی برای ترجمه از یک زبان مبدأ به زبان مقصد آموزش ببیند، ایده یادگیری زبان از طریق یادگیری تولید کلمات معتبر بعدی برای تکمیل یک جمله که میتوانست مفهوم درستی را منتقل نماید پایهای شد برای اینکه شاید بتوان از این طریق هر دیتای دیگری را به روش مدل زبانی تولید کرد. مثلاً پیکسلهای یک تصویر را همانند توکنها (المانهای اصلی) یک جمله در نظر گرفته و باقی پیکسلها را از روی آنها تخمین درستی زد. این ایده با موفقیتهای چشمگیری در حوزههای مختلف تصویر و صدا مواجه شد. اولین سیستمهای شبکه عصبی عمیق که ساختاری بسیار مناسب برای این نوع یادگیری و نیز تبدیل انواع مدالیتیهای مختلف تصویر و متن و غیره را به هم میسر مینمود مبدل یا ترنسفورمر بود.
چیزی که باعث شد تا هوش مصنوعی مولد در صدر اخبار علمی جهان قرار بگیرد انتشار برنامه کاربردی ChatGPT بود که توسط شرکت OpenAI در ابتدای سال 2023 و به کمک همان ساختار ترنسفورمر بنا شده بود. این سیستم مانند یک مشاور دانا و باهوش میتوانست با درک درست مفاهیم به سؤالات بسیاری از کاربران پاسخ درست دهد و حتی در حوزههای مختلف کدنویسی، تولید جداول هوشمند و امثال آن فرامین کاربران را به درستی اطاعت کرده و به انواع زبانهای رایج دنیا پاسخ تولید میکرد. آزمایش این سیستم هوشمند در آزمون ورودی کالجهای آمریکا (آزمون SAT) و آزمونهای حقوق و پزشکی و موفقیت چشمگیر آن در مقایسه با انسان خیلی زود این نوع هوش مولد را در صدر اخبار جهان قرار داد به نحوی که در کمتر از 2 ماه بیش از 100 میلیون کاربر به استفاده کنندگان دائمی از این برنامه کاربردی پیوستند و در این مقایسه با سایر موارد مشابه بینظیر بود.
نکاتی در مورد این نوع مدل زبانی وجود داشت و از جمله این بود که تعداد پارامترهایی که این مدل زبانی باید بیاموزد بسیار فراتر از محدودههای بکار رفته تا آن موقع بود (درحد تریلیون پارامتر) و دادههای آموخته شده به این سیستم هوشمند نزدیک به تمام دادههایی بود که تا به حال انسان تولید کرده است و البته هزینههای گزافی هم بابت راهاندازی این سیستم و آموزش و بکارگیری آن پرداخته شده بود. بنابراین، استفاده و به کارگیری سیستمهای مشابه آن فقط از عهده شرکتهای بزرگ که قادر به پرداخت چنین هزینههای سخت افزاری و انرژی باشند میسر بود. بنابراین سیستمهای کوچک شدهای از این سیستمهای بزرگ زبانی برای استفادههای محلی نیز شروع به توسعه نمود. از طرفی روشهایی برای بکارگیری این سیستمهای بزرگ منتها بصورت محلی و مطابق با حوزه تخصصی کاربر و از طریق روشهای ابری فراهم شد. برای اینکه پاسخهای تولید شده مطابق و هم راستا با نظرات و خواست کاربران باشد مکانیزمهایی برای نظرسنجی آنلاین فراهم شد که کاربر به محض دریافت پاسخ از سیستم تعاملگر ChatGPT و امثال آن از طریق یک نظرسنجی سریع و ساده به کیفیت جواب ارائه شده رأی دهد و به این ترتیب سیستم مجدداً نسبت به درک مفهوم پرسش و درخواست مطرح شده توسط کاربر ادراک درستتری پیدا کند. این کار، حوزه جدید در آموزش مدلهای زبانی بزرگ Prompt engineering را توسعه داد که باعث کنترل دقیقتر روی تعاملات با کاربر میشود و هدف آن تولید پاسخهایی از طرف سیستم زبانی است که مفید و کمک کننده، صحیح و علمی و به دور از اهانت و قضاوتهای جانبدارانه باشد.
با همه این موارد اشکالات مهمی نیز در این حوزه مشاهده شد که از مهمترین آنها میتوان به پاسخ نادرستی اشاره کرد که سیستم Google Bard در پاسخ یک کودک 9 ساله در خصوص تلسکوپ جیمز وب داد و با اعتراض یک متخصص حوزه فیزیک نجوم منجر به خسارت سنگینی برای شرکت گوگل شد. از طرف دیگر کاربران با موارد متعدد دیگری از جمله برخوردهای متعصبانه سیستمهای هوشمند مولد زبانی با انواع سؤالات مواجه شدند و این موارد گزارش شده باعث شد که تحقیقات و بررسیهای بیشتری در حوزه این نوع سیستمها صورت گیرد و خطرات استفاده از آنها و یا قابلیتهای خطرآفرین آنها در صورت توسعه بدون کنترل آنها تحقیق شود. از جمله نتایج حاصله انرژی لازم برای کارکرد این سیستمها بود که بسیار بحث برانگیز شد و برای مثال نشان داده شد که یک جستجو در ChatGPT بیش از 100 برابر جستجو در جستجوی گوگل انرژی مصرف میکند. همچنین نشان داده شد که آموزش مدل زبانی بزرگ Llama2 (که متعلق به شرکت متاست) به اندازه ی 539 متریک تن گاز Co2 تولید مینماید که بسیار حجم قابل توجهی است. علاوه بر آن موارد تخلفات متعددی از استفاده ناصحیح از این سیستمها که باعث کلاهبرداریها شده بود نیز گزارش شد. این موارد باعث شد تا شورای تحقیق در استرالیا تحقیق دقیقتری را نسبت به این سیستمها به اجرا بگذارد. نتیجه این تحقیقات این بود که در تستهای طراحی شده تخریب کنندهای که سیستم ChatGPT برای آنها به خدمت گرفته شده بود تقریباً در هیچ کدام از موارد نتوانسته بود یک عملیات تخریبی را بطور کامل انجام دهد و این تا حدی قابلیتهای این سیستمهای مولد را از جنبههای نگران کننده خارج میکرد.
مورد مهم دیگر این بود که ساختاری که این سیستمهای مولد بر آن پایه کار میکردند صرفاً دسترسی به دادههای زیاد و ادراک از طریق دادهها بود در حالی که هدف اصلی هوش مصنوعی از ابتدای خلقت آن بر پایه استخراج دانش موجود در دادهها استوار بود. استخراج دانش موجود در دادهها جنبههای مختلف و متعددی دارد که همه آنها به صرف مشاهده دادهها بدست نمیآید. از جمله دانش شناختی صرفاً در نتیجه مواجهه با محیط و تجربه و تعامل با المانهای حاضر در محیط بدست میآید و دادههای حاصله بخشی از آن چیزی است که در محیط مشاهده شده و بخش مهم دیگری از شناخت به شکل داده کمی، قابل نمایش نیست.
بنابراین، هوش مصنوعی با توجه به اینکه خارج از این تعاملات محیطی آموزش میبیند لااقل در سیستمهای فعلی بنظر نمیرسد که از لحاظ شناختی بتواند مانند انسان دارای ادراک متعالی و درک شناختی معنوی و درستی بشود و انسان همواره یک گام از این حیث جلوتر است. البته به لحاظ محاسباتی و قدرت و سرعت دسترسی به اطلاعات همواره میتواند در کنار انسان سرعت انجام کارهای انسان و البته دقت آن را به شدت افزایش دهد. به علاوه، اینکه همواره هر مخلوق علمی ایجاد شده توسط انسان، مانند بمب اتمی، به محض اینکه خطرآفرین بودن آن برای انسان بر جامعه جهانی مسجل شود بلافاصله قوانین رگولاتوری محکمی در نحوه استفاده و به خدمت گرفتن آن وضع میشود که این میتواند در کنترل و به کارگیری صحیح آن نظارتهای محکمی را ایجاد کند.