پلتفرم یادگیری ماشینی گوگل Google AutoML Cloud

آخرین ویرایش اکتبر 23, 2018 3,721 0

قبل از معرفی Google AutoML Cloud یه مروری به یادگیری ماشین کنیم

یادگیری ماشینی چیست؟

به طور کلی، Machine Learning (یادگیری ماشینی) یکی از زیرشاخه‌های Artificial Intelligence (هوش مصنوعی) است و این در حالی است که یکی از اهداف یادگیری ماشینی، درک ساختار دیتا و سپس قرار دادن دیتا در مدل‌هایی است که برای سیستم قابل‌فهم و استفاده باشد.
در واقع، اگر سیستمی بتواند به صورت خودکار از محیط پیرامونش درس گرفته و عملکرد خود را بهبود بخشد، می‌گوییم که Learning توسط آن سیستم صورت گرفته است.

هرچند یادگیری ماشینی یکی از رشته‌های علوم کامپیوتر است، اما با روش‌های محاسباتی مرسوم و رایج در این علم تفاوت‌هایی دارا است. در روش‌های محاسباتی رایج،‌ الگوریتم‌ها به صورت مجموعه‌ای از دستورات صریح و مشخص به منظور انجام محاسبات و یا حل مسئله و با هدف اجرا در کامپیوترها نوشته می‌شوند.

امروزه در اغلب تکنولوژی‌ها از یادگیری ماشینی استفاده می‌شود و تقریباً تمام کسانی که از این تکنولوژی‌ها استفاده می‌کنند آگاهانه یا ناآگاهانه در حال بهره‌بردن از یادگیری ماشینی هستند. برای مثال، می‌توان به تکنولوژی تشخیص چهره، تکنولوژی تبدیل تصویر به متن و … اشاره نمود (حتی در آیندهٔ‌ نزدیک اتومبیل‌های بدون راننده که قادر هستند با استفاده از یادگیری ماشینی مسیریابی را انجام دهند نیز به بازار خواهند آمد).

یادگیری ماشینی یک حوزهٔ همواره در حال گسترش است و آنچه در این مقاله مد نظر خواهیم داشت، نگاهی به روش‌های رایج در یادگیری ماشینی که در ۳ بخش یادگیری Supervised (نظارت‌شده)، Unsupervised (نظارت‌نشده) و Reinforcement (تقویت شده) تقسیم‌بندی می‌شوند خواهیم انداخت .

انواع روش‌های یادگیری ماشینی

در یادگیری ماشینی، تسک‌ها بر مبنای روش یادگیری -و یا به عبارتی بر اساس نحوهٔ‌ فیدبک‌دهی به سیستم در حین یادگیری- در چند گروه عمده تقسیم‌بندی می‌شوند. به طور کلی، ۳ روش اصلی در یادگیری ماشینی مورد استفاده قرار می‌گیرد که در ادامه به توضیح در مورد آنها خواهیم پرداخت.

Supervised Learning (یادگیری نظارت‌شده)

به منظور آموزش الگوریتم یادگیری در یادگیری نظارت‌شده، دیتایی به عنوان ورودی اولیه در اختیار کامپیوتر قرار می‌گیرد که قبلاً -توسط عامل انسانی- با خروجی مطلوب و مورد انتظار، به اصطلاح Labeled (برچسب‌زده) شده‌ است.

بنابراین ورودی‌ها و خروجی‌های مطلوب متناظر با آنها به صورت جفت‌های ورودی/خروجی در اختیار کامپیوتر قرار می‌گیرند.

هدف از ارائهٔ این جفت‌‌های ورودی/خروجی این است که الگوریتم با مقایسهٔ پاسخ درست که از پیش تعیین شده است و پاسخی که خود پیش‌بینی کرده، خطاهای موجود را شناسایی کند و به این ترتیب برای ایجاد خروجی‌های بعدی آموزش دیده و مدل مورد استفاده‌ٔ خود را بر اساس این آموزش‌ها اصلاح نماید.

فرایند آموزش تا زمانی که مدل پیش‌بینی الگوریتم به دقت کافی برسد و نتایج پیش‌بینی با نتیجهٔ از قبل تعیین شده یکسان باشند، ادامه خواهد یافت. بنابراین در یادگیری نظارت‌شده، کامپیوتر پس از آموزش دیدن و با استفاده از الگوهایی که در طی آموزش ایجاد نموده، قادر خواهد بود تا در مواجهه با دیتای به اصطلاح Unlabeled (بدون برچسب)، خروجی مناسب را پیش‌بینی و ارائه نماید.

به عنوان مثال، فرض کنید در این روش الگوریتم یادگیری با تصاویری از کوسه و تصاویری از اقیانوس که به ترتیب تحت عنوان Fish (ماهی) و Ocean (اقیانوس) برچسب‌دار شده‌اند، مورد آموزش قرار گیرد.

این الگوریتم پس از آموزش دیدن با این تصاویر و برچسب‌ها، قادر خواهد بود تا تصاویر بدون برچسب کوسه و اقیانوس را به ترتیب به عنوان Fish و Ocean مورد شناسایی قرار داده و این تصاویر را با برچسب تصاویری که با آن‌ها آموزش دیده متناظر بداند.

یکی از کاربردهای رایج یادگیری نظارت‌شده زمانی است که با استفاده از اطلاعات قدیمی، قرار است اتفاقات آیندهٔ نزدیک مورد پیش‌بینی قرار گیرند. به عنوان مثال، با این روش می‌توان اطلاعات چند ماه یا چند هفتهٔ اخیر بازار سهام را برای پیش‌بینی نواسانات بازار در هفته‌ها و ماه‌های آتی مورد استفاده قرار داد.

نمونهٔ دیگر استفاده از این الگوریتم نیز در تشخیص ایمیل‌های اسپم (هرزنامه) از غیر اسپم است. از جمله الگوریتم‌های یادگیری نظارت‌شده می‌توان به Regression ،Decision Tree ،Random Forest ،KNN و Logistic Regression اشاره نمود.

Unsupervised Learning (یادگیری نظارت‌نشده)

در یادگیری نظارت‌نشده، دیتای ورودی فاقد هرگونه برچسبی است و از این رو الگوریتم یادگیری به دنبال مشابهت‌ها و ویژگی‌های مشترک دیتای ورودی می‌گردد. از آنجا که داده‌های بدون برچسب معمول‌تر و فراگیرتر از داده‌های برچسب‌دار هستند، این روش یادگیری از اهمیت ویژه‌ای برخوردار است.

هدف یادگیری نظارت‌نشده شناسایی الگوی‌های پنهان موجود در مجموعهٔ داده‌های فاقد برچسب است. در واقع، با استفاده از الگوریتم‌های یادگیری نظارت‌نشده، کامپیوترها قادر خواهند بود تا ویژگی‌های داده‌های مختلف را شناسایی نموده و از این ویژگی‌ها برای دسته‌بندی داده‌های مد نظر استفاده نمایند.

این روش یادگیری عمدتاً در مورد داده‌های تجاری مورد استفاده قرار می‌گیرد. به عنوان مثال، ممکن است مجموعه‌ای از اطلاعات مشتری‌های یک شرکت تجاری -شامل مشخصات فردی آنها و فهرست خرید‌های صورت گرفته- در دسترس باشد. هرچند این اطلاعات ممکن است اطلاعات جامع و کاملی باشند، اما شناسایی الگوی موجود در این داده‌ها همیشه برای انسان امکان‌پذیر نیست. برای تشخیص الگوی پنهان موجود در چنین داده‌هایی، می‌توان این داده‌ها را به یک الگوریتم یادگیری به اصطلاح Unsupervised وارد نمود.

در مثال فوق، با به‌کارگیری الگوریتم یادگیری Unsupervised، ممکن است در نهایت مشخص شود که مثلاً خانم‌هایی که در یک بازهٔ سنی خاص قرار دارند و صابون بدون‌بو خریداری نموده‌اند،‌ احتمالاً باردار هستند.

بدین ترتیب با شناسایی این الگو -از آنجا که این مشتریان احتمالاً به محصولات مرتبط با دوران بارداری و پس از بارداری نیاز دارند- اگر پیشنهادات مرتبط با بارداری و مراقبت نوزاد نیز در اختیار این دسته از مشتریان قرار گیرد، احتمال خرید این محصولات بالاتر خواهد رفت. Apriori algorithm و K-means مثال‌هایی از الگوریتم‌های یادگیری نظارت‌نشده هستند.

Reinforcement Learning (یادگیری تقویت‌شده)

در یادگیری تقویت‌شده، الگوریتم با وارد شدن به چرخهٔ آزمون و خطا می‌آموزد که تصمیمات مشخصی را اتخاذ نماید و به این ترتیب با توجه به تصمیمات قبلی، پیش‌بینی‌ها و تصمیمات بعدی خود را اصلاح نموده و به طور پیوسته در حال آموختن است.

برای روشن‌تر شدن مطلب و به عنوان یک مثال کاربردی، می‌توان یک روبات فوتبالیست را در نظر گرفت که با قرار گرفتن در موقعیت‌های مختلف و اتخاذ تصمیم‌های متناسب با این موقعیت‌ها و رفع تدریجی خطاهای خود، سرانجام می‌آموزد که در هر موقعیتی درست‌ترین تصمیم را بگیرد. از Markov Decision Process می‌توان به عنوان یکی از الگوریتم‌های یادگیری به اصطلاح Reinforcement اشاره کرد.

ارتباط Machine Learning (یادگیری ماشینی) و Statistics (آمار)

از آنجا که مقولهٔ یادگیری ماشینی ارتباط نزدیکی با آمار دارد، آشنایی با مفاهیم آماری در درک و به کارگیری الگوریتم‌های یادگیری ماشینی نقش به‌سزایی خواهد داشت. از این رو قبل از مطرح نمودن رایج‌ترین الگوریتم‌های یادگیری ماشینی، توضیح مختصری در مورد ۲ مفهوم آماری Correlation (همبستگی) و Regression (رگرسیون) ارائه خواهیم داد.

Correlation (همبستگی) عبارت است از میزان وابستگی دو متغییر نسبت به یکدیگر؛ همبستگی با ضریبی به نام ضریب همبستگی پیرسون نشان داده می‌شود که مقدار آن عددی مابین ۱ و ۱- است. ضریب همبستگی ۰ میان دو پارامتر به این معنا است که این پارامترها هیچ‌گونه وابستگی نسبت به یکدیگر ندارند. هر چقدر ضریب همبستگی دو پارامتر از ۰ دورتر باشد، به معنای این است که تغییرات دو پارامتر، وابستگی بیشتری به یکدیگر دارند.

مثبت بودن ضریب همبستگی هم به این معنا است که اگر یکی از دو پارامتر افزایش یابد، دیگری نیز افزایش خواهد یافت و اگر یکی از آن‌ها کاهش یابد، دیگری نیز کاهش خواهد یافت. منفی بودن ضریب همبستگی نیز به معنای وابستگی معکوس میان دو پارامتر است.

به عبارت دیگر، اگر یکی از آن‌ها کاهش پیدا کند دیگری افزایش می‌یابد و اگر یکی افزایش پیدا کند دیگری کاهش خواهد یافت. به عنوان مثال همبستگی میان قد و وزن انسان‌ها، معمولاً یک همبستگی مثبت است و هر چه قد افراد بلندتر باشد، وزن آن‌ها نیز بیشتر است (البته همواره استثناءهایی وجود خواهد داشت).

Regression در لغت به معنای «بازگشت» است؛ هنگامی که دو متغیر با یکدیگر همبستگی بالایی داشته باشند، رگرسیون به عنوان یک پارامتر آماری، پیش‌بینی و بیان تغییرات یک متغیر بر اساس تغییرات متغیر دیگر را امکان‌پذیر می‌سازد

پلتفرم یادگیری ماشینی گوگل موسوم به AutoML عملکرد بهتر از سازندگانش داشته است! (Google AutoML Cloud)

سیستم AutoML گوگل که کمی پیش‌تر در ماه می ۲۰۱۷ معرفی شد، اخیراً با راندمان و کارایی بیشتری نسبت به محققینی که این سیستم را ساخته‌اند، کدهای یادگیری ماشینی تولید کرده‌ است! گوگل AutoML را توسعه داده تا به منزلهٔ مدلی ازهوش مصنوعی‌ باشد که به انسان‌ها کمک می‌کند تا دیگر سیستم‌هایی که خودشان کارهای مختلف را یاد گرفته و در واقعخودآموز هستند را ایجاد کنند.

AutoML اساساً به این دلیل توسعه یافته است چرا که در حال حاضر کارشناسان و متخصصین اندکی هستند که دانش و مهارت کافی‌ در زمینهٔ ساخت سیستم‌های به شدت پیچیدهٔ هوش مصنوعی دارند؛ برای برطرف کردن نیاز به متخصصین بیشتر، AutoML خلق شده تا بواسطهٔ خودآموزی، کدنویسی کرده و به نوعی خودش را کلون کند.

گوگل در وبلاگ رسمی خود اعلام کرده که می‌توان AutoML را برای یک سری وظایف خاص آموزش داده و از نحوهٔ انجام آنها فیدبک گرفت. AutoML همچنین می‌تواند هزاران شبیه‌سازی را به منظور ایجاد تغیرات مناسب، ایجاد معماری‌های جدید و دادن بازخوردهای تکراری انجام دهد.

نکتهٔ جالب این است که راندمان و کارایی AutoML در زمینهٔ تشخیص یک سری عکس بر اساس محتوای آنها، ۸۲٪ برآورد شده‌ است. به این سیستم همچنین وظیفهٔ شناسایی مکان یکسری شییٔ در تصویر داده شد که پس از آن کدی که AutoML نوشت در این زمینه میزان موفقیتی ۴۳ درصدی داشت در حالی که بهترین برنامه‌ای که دولوپرها برای این کار کدنویسی کرده‌اند، شاخص موفقیتی ۳۹ درصدی داشته است! مدیرعامل گوگل، Sundar Pichai، در این باره اظهار کرد:

AutoMl فقط متشکل از ماشین‌هایی هست که به طور اتوماتیک مدل‌های یادگیری ماشینی ایجاد می‌کنن. امروز این سیستم به دست دانشمندان یادگیری ماشینی ساخته شده و به معنای واقعی در کل دنیا فقط چند هزار دانشمند وجود دارن که می‌تونن همچنین کاری رو به این خوبی و درستی انجام بدن. این کار، خیلی کار سختیه و ما می‌خوایم این قضیه رو به صورت همه‌گیر در بیاریم. در واقع، ما می‌خوایم که این امکان رو در اختیار افراد بیشتری قرار بدیم.

گفتنی است که به جای طراحی یک شبکه‌ٔ عصبی از پایه، کارآمدتر است که بر روی یک سیستم هوش مصنوعی از پیش ایجاد شده کار کنیم و بر طبق تسکی که باید انجام دهد آن را اصلاح کنیم. انسان‌ها از این به بعد بیشتر باید فقط نقش ناظر و کنترل‌کننده را برعهده داشته باشند چرا که با پیشرفت چنین سیستم‌های هوشمندی، دیگر خیلی کاری نمی‌ماند که بخواهد به دست انسان‌ها انجام شود!

AutoML Cloud در نسخهٔ اولیه‌اش صرفاً محدود به تشخیص عکس می‌باشد. این سرویس جدید که AutoML Vision نام دارد، می‌تواند مدل‌های تشخیص عکس سفارشی درست کند. همچنین رابط کاربری سادهٔ آن به شما اجازه می‌دهد که به آسانی تصاویر را آپلود کرده، آموزش داده و مدیریت‌شان کنید و در نهایت مدل‌ها را بر روی Google Cloud دیپلوی کنید.

همچنین باید گفت که دقت AutoML افزایش یافته و سریع‌تر می‌تواند شما را به مدل‌سازی دلخواهتان برساند.

این پروژه توسط مشارکتی میان Google Brain و دیگر تیم‌های هوش مصنوعی صورت گرفته است. دیگر غول‌های تکنولوژی مانند آمازون و مایکروسافت هم بیکار ننشسته و در حال ارائهٔ ابزارهای هوش مصنوعی از پیش آموزش دیدهٔ خودشان می‌باشند.

حال باید دید که در این ورطه چه کسی موفق‌تر بوده و می‌تواند کاربران کلودی بیشتری را به سمت خودش جذب کند.

منابع: فسبایتس، دیجیتال اوشن