یادگیری ماشینی چیست؟
در این مقاله به این موضوع میپردازیم که یادگیر ماشینی چیست؟ و با کاربردهای یادگیری ماشینی آشنا میشویم.
یادگیری ماشینی چیست؟ یادگیری ماشین یک روش آنالیز داده ها است که مدلسازی تحلیلی را اتومات سازی می کند. یادگیری ماشینی شاخهای از هوش مصنوعی مبتنی بر این ایده است که سیستمها میتوانند از دادهها بیاموزند، الگوها را شناسایی نمایند و تصمیماتی با حداقل مداخله انسان اتخاذ نمایند. تکامل یادگیری ماشینی با ظهور تکنولوژیهای رایانشی جدید، یادگیری ماشینی امروز شبیه یادگیری ماشینی در گذشته نیست. این یادگیری از تشخیص الگو و این تئوری متولد شد که کامپیوترها بتوانند بدون برنامهریزی شدن برای اجرای وظایف مشخص خودشان یادگیری را انجام دهند؛ پژوهشگران علاقهمند به هوش مصنوعی می خواستند که ببینند آیا کامپیوترها می توانند از دادههای موجود، فرآیند یادگیری را انجام دهند یا نه. جنبه تکراری یادگیری ماشین به این خاطر مهم است که وقتی مدلها در معرض دادههای جدید قرار میگیرند، آنها قادرند خود را مستقلا تطابق دهند. آنها محاسبات قبلی را برای تولید تصمیمات و نتایج قابل اتکا و تکرارپذیر یاد می گیرند. این دانش جدیدی نیست، ولی در این اواخر بوده که انگیزش جدید یافته است. با اینکه مدتهای مدیدیست که الگوریتمهای یادگیری ماشینی بسیاری وجود داشتهاند، ولی قابلیت اعمال محاسبات ریاضی پیچیده بر روی دادههای بزرگ (به طور مکرر، و مداما سریعتر) یک تحول جدید است. اینها معدودی از نمونههای بسیار علنی شده کاربردهای یادگیری ماشینی هستند که ممکن است با آنها آشنایی داشته باشید: - خودروی خودران گوگل که خیلی سر و صدا کرده است. شالوده یادگیری ماشینی. - محصولات خدماتی آنلاینی همچون آمازون و نتفلیکس. کاربردهای یادگیری ماشینی برای زندگی همگان. - اطلاع یافتن از اینکه مشتریان در توئیتر درباره شما چه میگویند. یادگیری ماشینی در ترکیب با قاعده سازی زبانی. - تشخیص تقلب. یکی از استفادههای مهم و ضروری در دنیای امروز ما.
چرا یادگیری ماشینی مهم است؟ موج جدید ابراز علاقه به یادگیری ماشینی به علت همان عواملی است که داده کاوی را محبوبتر از همیشه کردهاند. چیزهایی مانند رشد حجم و تنوع داده های در دسترس، پردازش کامپیوتری که ارزانتر و قدرتمندتر است، و ذخیرهسازی دادهها به شکلی مقرون به صرفه. همه این چیزها بدان معنا هستند که امکان تولید سریع و اتوماتیک مدلهایی که میتوانند دادههای بزرگتر و پیچیده تر را آنالیز نموده و نتایج سریعتر و دقیقتری را ارائه نمایند (حتی در یک مقیاس بسیار بزرگ) وجود دارد. و با ایجاد مدلهای دقیق، یک سازمان شانس بیشتری برای شناسایی فرصتهای سودده (یا اجتناب از ریسکهای ناشناخته) خواهد داشت. چه چیزی برای ایجاد سیستمهای خوب یادگیری ماشینی لازم است؟ - قابلیتهای آماده سازی داده ها. - الگوریتمها: پایه و پیشرفته. - اتوماسیون و فرایندهای مکرر. - مقیاس پذیری. - مدل سازی گروهی. آیا می دانستید؟ در یادگیری ماشینی، یک هدف را یک برچسب می نامند. در علم آمار، یک هدف یک متغیر وابسته نامیده می شود. یک متغیر در آمار یک قابلیت در یادگیری ماشینی نامیده می شود. یک تغییر حالت در آمار، در یادگیری ماشینی یک ایجاد قابلیت نامیده می شود.
چه کسی از یادگیری ماشین استفاده می کند؟ بیشتر شرکتهایی که با حجم عظیمی از داده ها کار می کنند ارزش تکنولوژی یادگیری ماشینی را به رسمیت شناخته اند. با استخراج بینشها از این داده ها (اغلب به صورت آنی و بلادرنگ) سازمانها می توانند کارائی خود را افزایش داده و بر رقبا مزیت نسبی پیدا کنند. سرویس های مالی بانک ها و کسب و کارهای دیگر در صنعت مالی از تکنولوژی یادگیری ماشینی برای دو هدف کلیدی استفاده می کنند: شناسایی بینشهای مهم در داده ها، و پیشگیری از تقلب. این بینشها می توانند فرصتهای سرمایه گذاری را شناسایی نمایند، یا به سرمایه گذاران برای اطلاع یافتن درباره زمان مناسب برای داد و ستد کمک کنند. همچنین داده کاوی می تواند مشتریانی که پروفایلهای ریسک بالایی دارند را شناسایی کند، یا از نظارت سایبری برای اشاره به علائم هشدار تقلب استفاده نماید. مراقبت از سلامت یادگیری ماشینی روندی پرسرعت در صنعت سلامت دارد که به لطف ابداع سنسورها و دستگاههای پوشیدنی حاصل شده است که می توانند از داده ها برای ارزیابی بلادرنگ سلامت یک بیمار استفاده کنند. این تکنولوژی می تواند به کارشناسان پزشکی برای آنالیز داده ها برای شناسایی روندها و علائم هشداردهنده ای که ممکن است منتج به بهبود تشخیص و درمان شوند کمک نماید. نفت و گاز یافتن منابع جدید انرژی. آنالیز مواد معدنی موجود در زمین. پیش بینی خرابی سنسور پالایشگاه. تسهیل توزیع نفت برای افزایش بهره وری و مقرون به صرفگی آن. موارد استفاده متعددی برای یادگیری ماشینی در این صنعت وجود دارد - و همچنان در حال بسط است. دولت آژانسهای دولتی همچون ایمنی عمومی و شرکتهای خدمات زیرساختی نیاز ویژه ای به یادگیری ماشینی دارند زیرا منابع داده های متعددی دارند که برای کسب بینشها قابل کاوش هستند. آنالیز داده های سنسور، به عنوان مثال، راههای افزایش بهره وری و صرفه جویی در پول را مشخص می کند. یادگیری ماشینی همچنین می تواند به شناسایی تقلب و حداقلسازی سرقت هویت نیز کمک می کند. بازاریابی و فروش وب سایت هایی که آیتمهای احتمالیی که ممکن است بپسندید را بر مبنای خریدهای قبلیتان توصیه می کنند از یادگیری ماشین برای آنالیز سوابق خریدتان، و تبلیغ آیتمهای دیگری که ممکن است به آنها علاقه مند باشید، استفاده می کنند. این توانایی ثبت داده ها، آنالیز آن و استفاده از آن برای سفارشی سازی یک تجربه خرید (یا پیاده سازی یک کمپین بازاریابی) آینده خرده فروشی است. حمل و نقل آنالیز داده ها برای شناسایی الگوها و روندها نقشی کلیدی در صنعت حمل و نقل دارد، که بر کاراتر نمودن مسیرها و پیشبینی مسائل بالقوه برای افزایش قابلیت سوددهی می کند. آنالیز داده ها و مدلسازی جنبه های یادگیری ماشینی ابزارهای مهمی برای شرکتهای تحویل بار، حمل و نقل عمومی و دیگر سازمانهای ترابری هستند.
برخی از روش های رایج یادگیری ماشینی کدامند؟ یادگیری با نظارت و یادگیری بی نظارت دو تا از پرکاربردترین روشهای یادگیری ماشینی هستند - ولی روشهای دیگر یادگیری ماشینی نیز وجود دارند. ذیلا مروری اجمالی بر رایجترین انواع ارائه شده است. الگوریتمهای یادگیری با نظارت با استفاده از نمونه های برچسب خورده، همچون ورودی در جائی که خروجی مطلوب معلوم باشد، آموزش داده می شوند. به عنوان مثال، یک تجهیز می تواند نقاط داده هایی داشته باشد که با برچسب "F" (خراب) یا "R" (مشغول به کار) مشخص شده اند. این الگوریتم یادگیری مجموعه ای از ورودیها را در امتداد خروجی های صحیح متناظر دریافت می کند، و الگوریتم با مقایسه خروجی واقعی آن با خروجیهای درست یادگیری را انجام می دهد، و سپس مدل را بر اساس آن اصلاح می کند. از طریق روشهایی همچون طبقه بندی، رگسیون، پیشبینی و ارتقای گرادیان، یادگیری با نظارت از الگوهایی برای پیشبینی مقادیر برچسب بر روی دادههای بدون برچسب استفاده می کند. یادگیری نظارت شده عموما در کاربردهایی استفاده می شود که در آنها داده های تاریخی رویدادهای محتمل آتی را پیشبینی می کنند. به عنوان مثال، این می تواند زمانی که تراکنشهای کارت اعتباری ممکن است جعلی باشند یا اینکه کدام مشتری بیمه ممکن است اقامه دعوی کند را پیشبینی نماید. یادگیری بی نظارت در قبال داده هایی استفاده می شود که هیچ برچسب تاریخی ندارند. به این سیستم «پاسخ صحیح» آموزش داده نمی شود. این الگوریتم باید سر در بیاورد که چه چیزی در حال نمایش داده شدن است. هدف، کنکاش در داده ها و یافتن ساختار موجود در آن است.
یادگیری بی نظارت بر روی داده های تراکنشی خوب عمل می کند. به عنوان مثال، این روش می تواند مشتریانی که شاخصه های مشابهی دارند را شناسایی نماید تا بدین طریق از آن پس در کمپینهای بازاریابی رفتاری مشابه با آنها شود. و یا اینکه می تواند شاخصه های اصلیی را بیابد که مشتریان را دسته بندی کنند. تکنیکهای مشابه شامل نقشه های خودسازماندهی، نقشه برداری نزدیکترین همسایه، خوشه بندی k-means و تجزیه ارزش تکین می شوند. این الگوریتمها برای بخشبندی مباحث متنی، آیتمهای توصیه شده و شناسایی نقاط پرت داده ها نیز استفاده می شوند. یادگیری نیمهنظارتی برای همان کاربردهای یادگیری با نظارت استفاده می شود. ولی این روش از هر دو نوع داده های برچسب خورده و نخورده برای آموزش استفاده می کند - که نوعا حجم اندکی از داده های برچسب خورده با حجم بالایی از داده های برچسب نخورده را شامل می شود (چرا که داده های برچسب نخورده ارزانتر بوده و کسب انها نیاز به تلاش کمتری دارد). این نوع از یادگیری را می توان با روشهایی همچون طبقه بندی، رگرسیون و پیشبینی استفاده نمود. یادگیری نیمهنظارتی وقتی مفید است که هزینه مرتبط با یادگیری بالاتر از آن باشد که اجازه یک فرایند آموزش کاملا برچسب خورده را بدهد. مثالهای اولیه این عبارتند از شناسایی چهره یک فرد بر روی یک وبکم. یادگیری تقویتی اغلب برای رباتیک، گیمینگ و ناوبری استفاده می شود. با یادگیری تقویتی، این الگوریتم از طریق آزمون و خطا کشف می کند که چه اقداماتی بهترین نتایج را در پی دارند. این نوع از یادگیری سه جزء اولیه دارد: عامل (یادگیرنده یا تصمیمگیرنده)، محیط (هر چیزی که عامل با آن تعامل می کند) و اقدامات (اقداماتی که عامل می تواند انجام دهد). هدف آن است که عامل اقداماتی را انتخاب نماید که نتیجه مورد انتظار را در یک مدت مشخص حداکثرسازی نماید. عامل با دنبال کردن یک خط مشی خوب خیلی سریعتر به این هدف خواهد رسید. از اینرو هدف یادگیری تقویتی یادگیری بهترین خط مشی است. انسانها معمولا می توانند هفته ای یک یا دو مدل را ایجاد نمایند؛ یادگیری ماشین می تواند هزاران مدل را در یک هفته را خلق کند. گزیده ای از صحبتهای توماس اچ دیونپورت، راهبر تفکر تحلیلی، با وال استریت ژورنال
نحوه عملکرد یادگیری ماشینی برای دستیابی به بیشترین ارزش از یادگیری ماشین، شما باید نحوه تزویج بهترین الگوریتمها با ابزارها و فرایندهای مناسب را یاد بگیرید.
الگوریتمهای یادگیری ماشین شامل این موارد می شوند: شبکه های عصبی؛ درختهای تصمیم؛ جنگلهای [تصمیم] تصادفی؛ کشف ارتباطها و توالی؛ دسته بندی و افزایش شیب؛ ماشینهای بردار پشتبانی؛ نگاشت نزدیکترین همسایه؛ خوشهبندی کی-میانگین؛ نقشه های خودسازماندهی؛ تکنیکهای بهینه سازی جستجوی محلی (مثلا الگوریتمهای ژنتیک)؛ حداکثرسازی انتظار؛ اسپلاینهای رگرسیون تطبیقی چندگانه؛ شبکه های بیزی؛ برآورد چگالی شالوده؛ برآورد چگالی شالوده؛ آنالیز جزء اصلی؛ تجزیه مقدار تکین؛ مدلهای ترکیب گوسی؛ قاعده سازی پوشش پی در پی.
دیدگاه تان را بنویسید