پلتفرم یادگیری ماشینی گوگل Google AutoML Cloud
پلتفرم یادگیری ماشینی گوگل Google AutoML Cloud
قبل از معرفی Google AutoML Cloud یه مروری به یادگیری ماشین کنیم
یادگیری ماشینی چیست؟
در واقع، اگر سیستمی بتواند به صورت خودکار از محیط پیرامونش درس گرفته و عملکرد خود را بهبود بخشد، میگوییم که Learning توسط آن سیستم صورت گرفته است.
امروزه در اغلب تکنولوژیها از یادگیری ماشینی استفاده میشود و تقریباً تمام کسانی که از این تکنولوژیها استفاده میکنند آگاهانه یا ناآگاهانه در حال بهرهبردن از یادگیری ماشینی هستند. برای مثال، میتوان به تکنولوژی تشخیص چهره، تکنولوژی تبدیل تصویر به متن و … اشاره نمود (حتی در آیندهٔ نزدیک اتومبیلهای بدون راننده که قادر هستند با استفاده از یادگیری ماشینی مسیریابی را انجام دهند نیز به بازار خواهند آمد).
انواع روشهای یادگیری ماشینی
در یادگیری ماشینی، تسکها بر مبنای روش یادگیری -و یا به عبارتی بر اساس نحوهٔ فیدبکدهی به سیستم در حین یادگیری- در چند گروه عمده تقسیمبندی میشوند. به طور کلی، ۳ روش اصلی در یادگیری ماشینی مورد استفاده قرار میگیرد که در ادامه به توضیح در مورد آنها خواهیم پرداخت.
Supervised Learning (یادگیری نظارتشده)
به منظور آموزش الگوریتم یادگیری در یادگیری نظارتشده، دیتایی به عنوان ورودی اولیه در اختیار کامپیوتر قرار میگیرد که قبلاً -توسط عامل انسانی- با خروجی مطلوب و مورد انتظار، به اصطلاح Labeled (برچسبزده) شده است.
بنابراین ورودیها و خروجیهای مطلوب متناظر با آنها به صورت جفتهای ورودی/خروجی در اختیار کامپیوتر قرار میگیرند.
هدف از ارائهٔ این جفتهای ورودی/خروجی این است که الگوریتم با مقایسهٔ پاسخ درست که از پیش تعیین شده است و پاسخی که خود پیشبینی کرده، خطاهای موجود را شناسایی کند و به این ترتیب برای ایجاد خروجیهای بعدی آموزش دیده و مدل مورد استفادهٔ خود را بر اساس این آموزشها اصلاح نماید.
فرایند آموزش تا زمانی که مدل پیشبینی الگوریتم به دقت کافی برسد و نتایج پیشبینی با نتیجهٔ از قبل تعیین شده یکسان باشند، ادامه خواهد یافت. بنابراین در یادگیری نظارتشده، کامپیوتر پس از آموزش دیدن و با استفاده از الگوهایی که در طی آموزش ایجاد نموده، قادر خواهد بود تا در مواجهه با دیتای به اصطلاح Unlabeled (بدون برچسب)، خروجی مناسب را پیشبینی و ارائه نماید.
به عنوان مثال، فرض کنید در این روش الگوریتم یادگیری با تصاویری از کوسه و تصاویری از اقیانوس که به ترتیب تحت عنوان Fish (ماهی) و Ocean (اقیانوس) برچسبدار شدهاند، مورد آموزش قرار گیرد.
این الگوریتم پس از آموزش دیدن با این تصاویر و برچسبها، قادر خواهد بود تا تصاویر بدون برچسب کوسه و اقیانوس را به ترتیب به عنوان Fish و Ocean مورد شناسایی قرار داده و این تصاویر را با برچسب تصاویری که با آنها آموزش دیده متناظر بداند.
یکی از کاربردهای رایج یادگیری نظارتشده زمانی است که با استفاده از اطلاعات قدیمی، قرار است اتفاقات آیندهٔ نزدیک مورد پیشبینی قرار گیرند. به عنوان مثال، با این روش میتوان اطلاعات چند ماه یا چند هفتهٔ اخیر بازار سهام را برای پیشبینی نواسانات بازار در هفتهها و ماههای آتی مورد استفاده قرار داد.
نمونهٔ دیگر استفاده از این الگوریتم نیز در تشخیص ایمیلهای اسپم (هرزنامه) از غیر اسپم است. از جمله الگوریتمهای یادگیری نظارتشده میتوان به Regression ،Decision Tree ،Random Forest ،KNN و Logistic Regression اشاره نمود.
Unsupervised Learning (یادگیری نظارتنشده)
در یادگیری نظارتنشده، دیتای ورودی فاقد هرگونه برچسبی است و از این رو الگوریتم یادگیری به دنبال مشابهتها و ویژگیهای مشترک دیتای ورودی میگردد. از آنجا که دادههای بدون برچسب معمولتر و فراگیرتر از دادههای برچسبدار هستند، این روش یادگیری از اهمیت ویژهای برخوردار است.
هدف یادگیری نظارتنشده شناسایی الگویهای پنهان موجود در مجموعهٔ دادههای فاقد برچسب است. در واقع، با استفاده از الگوریتمهای یادگیری نظارتنشده، کامپیوترها قادر خواهند بود تا ویژگیهای دادههای مختلف را شناسایی نموده و از این ویژگیها برای دستهبندی دادههای مد نظر استفاده نمایند.
این روش یادگیری عمدتاً در مورد دادههای تجاری مورد استفاده قرار میگیرد. به عنوان مثال، ممکن است مجموعهای از اطلاعات مشتریهای یک شرکت تجاری -شامل مشخصات فردی آنها و فهرست خریدهای صورت گرفته- در دسترس باشد. هرچند این اطلاعات ممکن است اطلاعات جامع و کاملی باشند، اما شناسایی الگوی موجود در این دادهها همیشه برای انسان امکانپذیر نیست. برای تشخیص الگوی پنهان موجود در چنین دادههایی، میتوان این دادهها را به یک الگوریتم یادگیری به اصطلاح Unsupervised وارد نمود.
در مثال فوق، با بهکارگیری الگوریتم یادگیری Unsupervised، ممکن است در نهایت مشخص شود که مثلاً خانمهایی که در یک بازهٔ سنی خاص قرار دارند و صابون بدونبو خریداری نمودهاند، احتمالاً باردار هستند.
بدین ترتیب با شناسایی این الگو -از آنجا که این مشتریان احتمالاً به محصولات مرتبط با دوران بارداری و پس از بارداری نیاز دارند- اگر پیشنهادات مرتبط با بارداری و مراقبت نوزاد نیز در اختیار این دسته از مشتریان قرار گیرد، احتمال خرید این محصولات بالاتر خواهد رفت. Apriori algorithm و K-means مثالهایی از الگوریتمهای یادگیری نظارتنشده هستند.
Reinforcement Learning (یادگیری تقویتشده)
در یادگیری تقویتشده، الگوریتم با وارد شدن به چرخهٔ آزمون و خطا میآموزد که تصمیمات مشخصی را اتخاذ نماید و به این ترتیب با توجه به تصمیمات قبلی، پیشبینیها و تصمیمات بعدی خود را اصلاح نموده و به طور پیوسته در حال آموختن است.
برای روشنتر شدن مطلب و به عنوان یک مثال کاربردی، میتوان یک روبات فوتبالیست را در نظر گرفت که با قرار گرفتن در موقعیتهای مختلف و اتخاذ تصمیمهای متناسب با این موقعیتها و رفع تدریجی خطاهای خود، سرانجام میآموزد که در هر موقعیتی درستترین تصمیم را بگیرد. از Markov Decision Process میتوان به عنوان یکی از الگوریتمهای یادگیری به اصطلاح Reinforcement اشاره کرد.
ارتباط Machine Learning (یادگیری ماشینی) و Statistics (آمار)
از آنجا که مقولهٔ یادگیری ماشینی ارتباط نزدیکی با آمار دارد، آشنایی با مفاهیم آماری در درک و به کارگیری الگوریتمهای یادگیری ماشینی نقش بهسزایی خواهد داشت. از این رو قبل از مطرح نمودن رایجترین الگوریتمهای یادگیری ماشینی، توضیح مختصری در مورد ۲ مفهوم آماری Correlation (همبستگی) و Regression (رگرسیون) ارائه خواهیم داد.
Correlation (همبستگی) عبارت است از میزان وابستگی دو متغییر نسبت به یکدیگر؛ همبستگی با ضریبی به نام ضریب همبستگی پیرسون نشان داده میشود که مقدار آن عددی مابین ۱ و ۱- است. ضریب همبستگی ۰ میان دو پارامتر به این معنا است که این پارامترها هیچگونه وابستگی نسبت به یکدیگر ندارند. هر چقدر ضریب همبستگی دو پارامتر از ۰ دورتر باشد، به معنای این است که تغییرات دو پارامتر، وابستگی بیشتری به یکدیگر دارند.
مثبت بودن ضریب همبستگی هم به این معنا است که اگر یکی از دو پارامتر افزایش یابد، دیگری نیز افزایش خواهد یافت و اگر یکی از آنها کاهش یابد، دیگری نیز کاهش خواهد یافت. منفی بودن ضریب همبستگی نیز به معنای وابستگی معکوس میان دو پارامتر است.
به عبارت دیگر، اگر یکی از آنها کاهش پیدا کند دیگری افزایش مییابد و اگر یکی افزایش پیدا کند دیگری کاهش خواهد یافت. به عنوان مثال همبستگی میان قد و وزن انسانها، معمولاً یک همبستگی مثبت است و هر چه قد افراد بلندتر باشد، وزن آنها نیز بیشتر است (البته همواره استثناءهایی وجود خواهد داشت).
Regression در لغت به معنای «بازگشت» است؛ هنگامی که دو متغیر با یکدیگر همبستگی بالایی داشته باشند، رگرسیون به عنوان یک پارامتر آماری، پیشبینی و بیان تغییرات یک متغیر بر اساس تغییرات متغیر دیگر را امکانپذیر میسازد
پلتفرم یادگیری ماشینی گوگل موسوم به AutoML عملکرد بهتر از سازندگانش داشته است! (Google AutoML Cloud)
AutoMl فقط متشکل از ماشینهایی هست که به طور اتوماتیک مدلهای یادگیری ماشینی ایجاد میکنن. امروز این سیستم به دست دانشمندان یادگیری ماشینی ساخته شده و به معنای واقعی در کل دنیا فقط چند هزار دانشمند وجود دارن که میتونن همچنین کاری رو به این خوبی و درستی انجام بدن. این کار، خیلی کار سختیه و ما میخوایم این قضیه رو به صورت همهگیر در بیاریم. در واقع، ما میخوایم که این امکان رو در اختیار افراد بیشتری قرار بدیم.
گفتنی است که به جای طراحی یک شبکهٔ عصبی از پایه، کارآمدتر است که بر روی یک سیستم هوش مصنوعی از پیش ایجاد شده کار کنیم و بر طبق تسکی که باید انجام دهد آن را اصلاح کنیم. انسانها از این به بعد بیشتر باید فقط نقش ناظر و کنترلکننده را برعهده داشته باشند چرا که با پیشرفت چنین سیستمهای هوشمندی، دیگر خیلی کاری نمیماند که بخواهد به دست انسانها انجام شود!
AutoML Cloud در نسخهٔ اولیهاش صرفاً محدود به تشخیص عکس میباشد. این سرویس جدید که AutoML Vision نام دارد، میتواند مدلهای تشخیص عکس سفارشی درست کند. همچنین رابط کاربری سادهٔ آن به شما اجازه میدهد که به آسانی تصاویر را آپلود کرده، آموزش داده و مدیریتشان کنید و در نهایت مدلها را بر روی Google Cloud دیپلوی کنید.
همچنین باید گفت که دقت AutoML افزایش یافته و سریعتر میتواند شما را به مدلسازی دلخواهتان برساند.
این پروژه توسط مشارکتی میان Google Brain و دیگر تیمهای هوش مصنوعی صورت گرفته است. دیگر غولهای تکنولوژی مانند آمازون و مایکروسافت هم بیکار ننشسته و در حال ارائهٔ ابزارهای هوش مصنوعی از پیش آموزش دیدهٔ خودشان میباشند.
حال باید دید که در این ورطه چه کسی موفقتر بوده و میتواند کاربران کلودی بیشتری را به سمت خودش جذب کند.
منابع: فسبایتس، دیجیتال اوشن