An error occurred while updating the entries. See the inner exception for details. هوش مصنوعی بر پایه استخراج دانش موجود در داده‌هاست
۱۴۰۲/۱۱/۰۷- ۱۷:۵۶ - مشاهده: ۱۴۹

هوش مصنوعی بر پایه استخراج دانش موجود در داده‌هاست

تندیس بیستمین اجلاس فناوری رسانه با عنوان نشست تخصصی برتر به دکتر راهیل مهدیان برای نشست هوش مصنوعی مولد و آینده آن اهدا شد.
هوش مصنوعی بر پایه استخراج دانش موجود در داده‌هاست

به گزارش روابط عمومی دانشگاه صداوسیما، دکتر راهیل مهدیان که ریاست دانشکده فنی مهندسی رسانه دانشگاه صداوسیما را عهده‌دار است و به عنوان عضو شورای هوش مصنوعی سازمان فعالیت می‌کند توانست با ارائه موضوع تخصصی خود یعنی هوش مصنوعی، تندیس برتر اجلاس فناوری رسانه را کسب کند.
مهدیان با تأکید بر اهمیت و ضرورت پرداختن رسانه‌ها به‌ ویژه رسانه ملی به فناوری هوش مصنوعی گفت: اجلاس بیستم فناوری رسانه فرصت مناسبی را فراهم کرد تا پژوهشگران و فعالان این حوزه گرد هم آیند و در این خصوص تبادل نظر کنند.
بخشی از محتوای این نشست تخصصی را در ادامه می‌خوانید.
هوش مصنوعی مولد به شاخه‌ای از هوش مصنوعی اشاره دارد که تمرکز آن بر توسعه الگوریتم‌ها و مدل‌هایی است که قادر به تولید دیتای جدید در قالب‌های مختلف متن، تصویر، آودیو یا ویدئو باشد. این سیستم‌های هوشمند الگوها و ساختارها و ارتباطات بین داده‌های موجود در بانک داده‌ها را می‌آموزند و از طریق آن‌ها دانش لازم برای ساخت محتوای جدید که بسیار شبیه به داده‌های واقعی است را به دست می‌آورند.
آغاز هوش مصنوعی مولد در سال 2006 با سیستم مترجم گوگل بوده است. بعد از آن بدون اینکه عبارت مولد به این سیستم‌ها اطلاق گردد سیستم‌های مولد دیگری مانند Apple Siri در سال 2011، جستجوهای هوشمند که کلمات بعدی را پیش‌بینی می‌کردند و سایر سیستم‌های مشابه دیگر متولد شدند.
ایده اصلی هوش مصنوعی مولد، با الهام گرفتن از سیستم‌های دنباله به دنباله در شبکه‌های عصبی عمیق بازگشتی و با توجه به مدل یادگیری زبانی در آنها بوجود آمد. همانطور که یک سیستم شبکه عصبی عمیق بازگشتی می‌توانست برای یادگیری کلمات متوالی یک جمله در یک زبان مبدأ و یا حتی برای ترجمه از یک زبان مبدأ به زبان مقصد آموزش ببیند، ایده یادگیری زبان از طریق یادگیری تولید کلمات معتبر بعدی برای تکمیل یک جمله که می‌توانست مفهوم درستی را منتقل نماید پایه‌ای شد برای اینکه شاید بتوان از این طریق هر دیتای دیگری را به روش مدل زبانی تولید کرد. مثلاً پیکسل‌های یک تصویر را همانند توکن‌ها (المان‌های اصلی) یک جمله در نظر گرفته و باقی پیکسل‌ها را از روی آنها تخمین درستی زد. این ایده با موفقیت‌های چشمگیری در حوزه‌های مختلف تصویر و صدا مواجه شد. اولین سیستم‌های شبکه عصبی عمیق که ساختاری بسیار مناسب برای این نوع یادگیری و نیز تبدیل انواع مدالیتی‌های مختلف تصویر و متن و غیره را به هم میسر می‌نمود مبدل یا ترنسفورمر بود.
چیزی که باعث شد تا هوش مصنوعی مولد در صدر اخبار علمی جهان قرار بگیرد انتشار برنامه کاربردی ChatGPT بود که توسط شرکت OpenAI در ابتدای سال 2023 و به کمک همان ساختار ترنسفورمر بنا شده بود. این سیستم مانند یک مشاور دانا و باهوش می‌توانست با درک درست مفاهیم به سؤالات بسیاری از کاربران پاسخ درست دهد و حتی در حوزه‌های مختلف کدنویسی، تولید جداول هوشمند و امثال آن فرامین کاربران را به درستی اطاعت کرده و به انواع زبان‌های رایج دنیا پاسخ تولید می‌کرد. آزمایش این سیستم هوشمند در آزمون ورودی کالج‌های آمریکا (آزمون SAT) و آزمون‌های حقوق و پزشکی و موفقیت چشمگیر آن در مقایسه با انسان خیلی زود این نوع هوش مولد را در صدر اخبار جهان قرار داد به نحوی که در کمتر از 2 ماه بیش از 100 میلیون کاربر به استفاده کنندگان دائمی از این برنامه کاربردی پیوستند و در این مقایسه با سایر موارد مشابه بی‌نظیر بود.
نکاتی در مورد این نوع مدل زبانی وجود داشت و از جمله این بود که تعداد پارامترهایی که این مدل زبانی باید بیاموزد بسیار فراتر از محدوده‌های بکار رفته تا آن موقع بود (درحد تریلیون پارامتر) و داده‌های آموخته شده به این سیستم هوشمند نزدیک به تمام داده‌هایی بود که تا به حال انسان تولید کرده است و البته هزینه‌های گزافی هم بابت راه‌اندازی این سیستم و آموزش و بکارگیری آن پرداخته شده بود. بنابراین، استفاده و به کارگیری سیستم‌های مشابه آن فقط از عهده شرکت‌های بزرگ که قادر به پرداخت چنین هزینه‌های سخت افزاری و انرژی باشند میسر بود. بنابراین سیستم‌های کوچک شده‌ای از این سیستم‌های بزرگ زبانی برای استفاده‌های محلی نیز شروع به توسعه نمود. از طرفی روش‌هایی برای بکارگیری این سیستم‌های بزرگ منتها بصورت محلی و مطابق با حوزه تخصصی کاربر و از طریق روش‌های ابری فراهم شد. برای اینکه پاسخ‌های تولید شده مطابق و هم راستا با نظرات و خواست کاربران باشد مکانیزم‌هایی برای نظرسنجی آنلاین فراهم شد که کاربر به محض دریافت پاسخ از سیستم تعاملگر ChatGPT و امثال آن از طریق یک نظرسنجی سریع و ساده به کیفیت جواب ارائه شده رأی دهد و به این ترتیب سیستم مجدداً نسبت به درک مفهوم پرسش و درخواست مطرح شده توسط کاربر ادراک درست‌تری پیدا کند. این کار، حوزه جدید در آموزش مدل‌های زبانی بزرگ Prompt engineering را توسعه داد که باعث کنترل دقیق‌تر روی تعاملات با کاربر می‌شود و هدف آن تولید پاسخ‌هایی از طرف سیستم زبانی است که مفید و کمک کننده، صحیح و علمی و به دور از اهانت و قضاوت‌های جانبدارانه باشد.
با همه این موارد اشکالات مهمی نیز در این حوزه مشاهده شد که از مهمترین آنها می‌توان به پاسخ نادرستی اشاره کرد که سیستم Google Bard در پاسخ یک کودک 9 ساله در خصوص تلسکوپ جیمز وب داد و با اعتراض یک متخصص حوزه فیزیک نجوم منجر به خسارت سنگینی برای شرکت گوگل شد. از طرف دیگر کاربران با موارد متعدد دیگری از جمله برخوردهای متعصبانه سیستم‌های هوشمند مولد زبانی با انواع سؤالات مواجه شدند و این موارد گزارش شده باعث شد که تحقیقات و بررسی‌های بیشتری در حوزه این نوع سیستم‌ها صورت گیرد و خطرات استفاده از آنها و یا قابلیت‌های خطرآفرین آنها در صورت توسعه بدون کنترل آنها تحقیق شود. از جمله نتایج حاصله انرژی لازم برای کارکرد این سیستم‌ها بود که بسیار بحث برانگیز شد و برای مثال نشان داده شد که یک جستجو در ChatGPT بیش از 100 برابر جستجو در جستجوی گوگل انرژی مصرف می‌کند. همچنین نشان داده شد که آموزش مدل زبانی بزرگ Llama2 (که متعلق به شرکت متاست) به اندازه ی 539 متریک تن گاز Co2 تولید می‌نماید که بسیار حجم قابل توجهی است. علاوه بر آن موارد تخلفات متعددی از استفاده ناصحیح از این سیستم‌ها که باعث کلاهبرداری‌ها شده بود نیز گزارش شد. این موارد باعث شد تا شورای تحقیق در استرالیا تحقیق دقیق‌تری را نسبت به این سیستم‌ها به اجرا بگذارد. نتیجه این تحقیقات این بود که در تست‌های طراحی شده تخریب کننده‌ای که سیستم ChatGPT برای آنها به خدمت گرفته شده بود تقریباً در هیچ کدام از موارد نتوانسته بود یک عملیات تخریبی را بطور کامل انجام دهد و این تا حدی قابلیت‌های این سیستم‌های مولد را از جنبه‌های نگران کننده خارج می‌کرد.
مورد مهم دیگر این بود که ساختاری که این سیستم‌های مولد بر آن پایه کار می‌کردند صرفاً دسترسی به داده‌های زیاد و ادراک از طریق داده‌ها بود در حالی که هدف اصلی هوش مصنوعی از ابتدای خلقت آن بر پایه استخراج دانش موجود در داده‌ها استوار بود. استخراج دانش موجود در داده‌ها جنبه‌های مختلف و متعددی دارد که همه آنها به صرف مشاهده داده‌ها بدست نمی‌آید. از جمله دانش شناختی صرفاً در نتیجه مواجهه با محیط و تجربه و تعامل با المان‌های حاضر در محیط بدست می‌آید و داده‌های حاصله بخشی از آن چیزی است که در محیط مشاهده شده و بخش مهم دیگری از شناخت به شکل داده کمی، قابل نمایش نیست.
بنابراین، هوش مصنوعی با توجه به اینکه خارج از این تعاملات محیطی آموزش می‌بیند لااقل در سیستم‌های فعلی بنظر نمی‌رسد که از لحاظ شناختی بتواند مانند انسان دارای ادراک متعالی و درک شناختی معنوی و درستی بشود و انسان همواره یک گام از این حیث جلوتر است. البته به لحاظ محاسباتی و قدرت و سرعت دسترسی به اطلاعات همواره می‌تواند در کنار انسان سرعت انجام کارهای انسان و البته دقت آن را به شدت افزایش دهد. به علاوه، اینکه همواره هر مخلوق علمی ایجاد شده توسط انسان، مانند بمب اتمی، به محض اینکه خطرآفرین بودن آن برای انسان بر جامعه جهانی مسجل شود بلافاصله قوانین رگولاتوری محکمی در نحوه استفاده و به خدمت گرفتن آن وضع می‌شود که این می‌تواند در کنترل و به کارگیری صحیح آن نظارت‌های محکمی را ایجاد کند.

امتیاز شما