
انتخاب ویژگی چیست؟
مساله انتخاب ویژگی، یکی از مسائلی است که در مبحث یادگیری ماشین و همچنین شناسائی آماری الگو مطرح است. ویژگیها تاثیر زیادی بر عملکرد، دقت و کارایی سیستم خواهند داشت. شاید مهمترین بخش برای عملیاتِ دادهکاویْ و مدسازی هوشمند عملیاتِ انتخابِ ویژگی است. چون، ویژگیهای نامرتبط یا تا حدودی مرتبط میتوانند تاثیر منفی بر عملکرد سیستم داشته باشند. پیادهسازی روش های انتخاب ویژگی اولین و مهمترین مرحله در طراحی سیستم های هوشمند یادگیری هستند. همچنین، وقتی که ابعاد فضای ویژگی دادهها بسیار زیاد است و با معضل بعد مواجه هستیم، استفاده از مجموعه ویژگیهای مناسب، «هزینههای محاسباتی» لازم برای آموزش بهینه سیستم را به شدت کاهش میدهد. از سوی دیگر، انتخاب ویژگی با حذف ویژگیهای غیر مرتبط و تکراری به کاهش ابعاد منجر میشود. انتخاب ویژگی در بسیاری از کاربردها اهمیت زیادی دارد، زیرا در این کاربردها تعداد زیادی ویژگی وجود دارد، که بسیاری از آنها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگیها مشکلی از لحاظ اطلاعاتی ایجاد نمیکند ولی بار محاسباتی را برای کاربرد مورد نظر بالا میبرد. و علاوه بر این باعث میشود که اطلاعات غیر مفید زیادی را به همراه دادههای مفید ذخیره کنیم. انتخاب ویژگی را میتوان به عنوان فرآیند شناسایی ویژگیهای مرتبط و حذف ویژگیهای غیر مرتبط و تکراری تعریف کرد. این کار مزایای زیادی دارد از جمله:
- افرایش دقت و کارایی روش های یادگیری ماشین
- ساده سازی و درک درست از داده
- کاهش هزینهها و محاسبات زمان و حافظه
- جلوگیری از بیش برازش
- سادگی و قابلیت اطمینان و افزایش سرعت پردازش
برای مساله انتخاب ویژگی، راه حلها و الگوریتمهای فراوانی ارائه شده است که بعضی از آنها قدمت سی یا چهل ساله دارند. مشکل بعضی از الگوریتمها در زمانی که ارائه شده بودند، بار محاسباتی زیاد آنها بود، اگر چه امروزه با ظهور کامپیوترهای سریع و منابع ذخیره سازی بزرگ این مشکل، به چشم نمیآید ولی از طرف دیگر، مجموعههای دادهای بسیار بزرگ برای مسائل جدید باعث شده است که همچنان پیدا کردن یک الگوریتم سریع برای این کار مهم باشد.
روش های انتخاب ویژگی کدامند؟
روش های Filter
- Mutual-Information
- Roc-auc Or Mse
- Correlation
روش های wrapper
- forward feature selection
- backward feature selection
- Exhaustive feature selection
چالش های انتخاب ویژگی؟
- تنوع داده ها
- ویژگی های مهم کدامند؟
- شباهت و همپوشانی داده ها
- زمان پردازش
- بیش برازش
- تغییر داده
- مشخص نبودن ویژگی های خوب
- کمبود داده
ویژگی های خوب کدامند؟
- از خود داده انتخاب شوند
- افزونه نباشند
- مرتبط با خروجی باشند
- تمایز بیشتر بین کلاس ها ایجاد کنند
- واریانس درون کلاسی کمینه و واریانس برون کلاسی بیشینه
- …
هدف از این دوره آموزشی:
در این دوره عملی برای انتخاب ویژگی های متناسب با تابع هدف مساله از روش های مبتنی بر یادگیری عمیق و یادگیری ماشین استفاده می شوند تا به صورت خودکار ویژگی هایی که مناسب هستند، برای کاربردهای مختلف انتخاب شوند. در این دوره به صورت کامل انتخاب ویژگی بحث می شود و نحوه انتخاب ویژگی به صورت عمیق توضیح داده می شود و پیاده سازی می شود. ابتدا تئوری انتخاب ویژگی و الگوریتم های مختلف بحث و بررسی می شوند. انتخاب ویژگی معرفی می شود و مزایا و کاربردهای آن کامل گفته می شود. بعد انواع روش های انتخاب ویژگی با یادگیری ماشین و یادگیری عمیق معرفی می شوند. روش های انتخاب ویژگی فیلتر و رپر به صورت کامل توضیخ داده می شوند و همچنین روش های یادگیری عمیق نیز کامل معرفی می شوند. نحوه آموزش عمیق ویژگی ها توضیح داده می شود. می توانید هر نوع داده ای را جایگزین کنید و عملیات انتخاب ویژگی را با این کدها روی هر دیتاستی به صورت آسان انجام دهید.کدهای پروژه به زبان پایتون نوشته شده است و نحوه اجرای الگوریتم ها مرحله به مرحله توضیح داده شده است. کدها قابلیت آموزش روی داده های دلخواه خودتان را دارد و می توانید عملیات انتخاب ويژگي مورد نظر خود را با آن انجام دهید. بدون شک یکی از بهترین دوره های عمیق برای انتخاب ويژگي می باشد که با زبان فارسی و ساده و روان توضیح داده شده است. امیدواریم که این آموزش از “بیگ لرن” هم مثل سایر آموزش ها مورد تایید و رضایت شما مخاطبان گرامی قرار گیرد.
نسترن
برای من خیلی مفید بود جزییات خوبی داره مطالب هم خوب و قابل فهم توضیح میدند.
قاسمی
از نحوه تدریس مدرس خیلی خوشم اومد. برای کار و دانشگاهم بدردم خورد.
من واقعا انقدر که از سایتتون راضی ام، به همه معرفیش می کنم.
تارا
عالی. مدرس به مطالب بسیار مسلط است و به خوبی مطالب رو بیان می کند. ممنونم