توضیح مفاهیم و موضوعات مختلف در حوزه های پردازش تصویر، بینایی رایانه ای ، یادگیری ماشین و …

توضیح مفاهیم و موضوعات مختلف در حوزه های پردازش تصویر، بینایی رایانه ای ، یادگیری ماشین و …

بسیاری از مفاهیم از جمله بینایی رایانه ای ، پردازش تصویر و یادگیری ماشین و دیگر مفاهیم مشابه اشتراکات بسیاری باهم دارند، بنابراین یک تعریف دقیق و سربسته ای برای این مفاهیم وجود ندارد و نمی توان آن را مقید به محدوده ای خاص کرد. اما در اینجا سعی دارم تا حدودی این مفاهیم را مرز بندی کرده و اعمالی که به این حوزه ها مرتبط است را به زبان ساده بیان کنم.

 

پردازش تصویر دیجیتال (Digital Image Processing)

در ابتدایی ترین حالت پردازش تصویر به اعمالی گفته می شود، که پس از انجام روی پیکسل یا پیکسل ها خروجی همچنان تصویر است. برای نمونه این مفاهیم پردازش تصویر محسوب می شود : تغییر شدت و روشنایی تصویر (Contrast & Brightness)، اعمال فیلتر روی تصویر(Filters)، اعمال مقدار آستانه روی تصویر(Threshold)، پیدا کردن مرز ها و لبه ها با استفاده از اعمال فیلتر( Edge Detection and Contour Tracing)، تیز کردن و یا محو کردن تصویر(Sharpening & Blurring)، حذف یا کاهش نویز(Noise Reduction)، عمل باز و بسته کردن روی تصویر(Opening & Closing) و … . در این نوع پردازش ها معمولا یک سری عملیات ریاضی به صورت نقطه ای یا مجموعه ای از چند پیکسل اعمال می شود و کل تصویر را در بر می گیرد.

بینایی رایانه ای (Computer Vision)  

به طور خلاصه هرکجا در حوزه تصویر حرف از تصمیم گیری باشد به معنی بینایی رایانه ای است. برای نمونه تشخیص اینکه یک تصویر متمایل به سبز است یا قرمز و در خروجی عبارت “قرمز” یا “سبز” را نشان دهیم، در حوزه بینایی رایانه ای قرار می گیرد. کافی است یک شرط قرار دهیم که ببینم تعداد پیکسل های قرمز بیشتر است یا سبز!. بنابراین قرار گرفتن یک سری تصمیم گیری ها در کنار پردازش تصویر ( که در مثال گفته شده می تواند تنظیم شدت روشنایی تصویر باشد)، بینایی رایانه ای گفته می شود. در واقع پردازش تصویر به خودی خود بدون تصمیم گیری، عمل هوشمندانه ای انجام نمی دهد و صرفا اعمال یک سری عملیات ریاضی روی تصویر است. یک مثال دیگر ناحیه بندی  تصویر (Image Segmentation) است. ناحیه بندی تصویر یعنی، جدا کردن بخش های مختلف تصویر براساس ویژگی های مختلف مثل رنگ، شکل یا بافت آن به صورتی که خروجی شامل مجموعه این ناحیه ها است که هرکدام به صورت جدا قابل دست یابی است. در بسیاری از موارد پس از عمل ناحیه بندی نیاز به تشخیص شی (Object Recognition) است. تشخیص شی در حالت ابتدایی در صورتی که نیاز به استفاده از الگوریتم های یادگیری ماشین نداشته باشد در حوزه بینایی رایانه ای قرار می گیرد. در بسیاری از موارد پس از ناحیه بندی و جدا کردن نواحی مختلف، برای شناسایی آبجکت نیاز به استخراج ویژگی هر ناحیه است (Feature Extraction)، که این هم تقریبا در حوزه بینایی رایانه ای قرار می گیرد.

بعضی از مباحث مربوط به حوزه بینایی رایانه ای به این صورت است: دنبال کردن در ویدیو(Video Tracking)، تخمین حرکت (Motion Estimation)، تشخیص شی (Object Recognition)، ترمیم تصویر (Image Restoration)، ناحیه بندی (Segmentation) و… .

 

بینایی ماشین (Machine Vision)

بینایی ماشین مفهوم پیچیده ای نیست. در واقع به کار بردن بینایی رایانه ای در حوزه صنعت و واقعیت فیزیکی است. برای نمونه تصمیم گیری یک ربات براساس رنگ یک جسم برای برداشتن یا برنداشتن آن بینایی ماشین گفته می شود. و یا در صنعت دست رباتیک براساس میزان مرزهای یک صفحه یا بدنه تشخیص می دهد ترک خورده یا نخورده است و در صورت ترک خورده بودن آن را از رده خارج می کند.

 

یادگیری ماشین (Machine Learning)

ابتدا لازم به ذکر است که بینایی ماشین و یادگیری ماشین دو مفهوم کاملا متفاوت هستند، که در بعضی جاها اشتباها به جای هم کار برده می شوند.

یادگیری ماشین را با یک مثال توضیح می دهم. فرض کنید یک تصویر از یک وسیله نقلیه داریم. می خواهیم به نحوی تشخیص دهیم که این تصویر ورودی متعلق به گروه موتورهاست، یا دوچرخه یا اتومبیل است. مسلما نمی توانیم صرفا با استفاده از پردازش تصویر و یک سری دستوارت شرطی گروه مورد نظر را تشخیص دهیم، چون تصویر یا ویژگی های استخراج شده الگوی پیچیده ای دارند و صرفا نمی توان با دستورات شرطی این تفکیک را انجام داد. برای اینکار حوزه ی یادگیری ماشین کاربرد ویژه ای دارد. همانطور که از نامگذاری آن مشخص است، یعنی به یک ماشین مصنوعی عمل یادگیری اطلاق شود. یعنی یک ربات پس دیدن هزاران اتومبیل بتواند فرق موتور با ماشین را یادبگیرد بدون اینکه نیاز باشد از دستوارت از پیش تعیین شده شرطی و منطقی استفاده کنیم. در این مثال الگوریتم های حوزه بینایی ماشین به ما کمک می کند، که پس از دادن صدها تصویر(یا ویژگی های استخراج شده) از یک وسیله نقیله خاص مثلا موتور، بتواند صد و یکمین تصویر را خودش در گروه موتورها قرار دهد بدون اینکه نیاز باشد از قبل شرط خاصی درنظر گرفته باشیم.

بینایی رایانه ای به بیانی با استفاده از دستورات شرطی قدرت تصمیم گیری را به ماشین می دهد، در صورتی که یادگیری ماشین قدرت یادگیری را به ماشین می دهد. نکته حائز اهمیت این است که یادگیری ماشین تنها محدود به تصویر نیست، و مرتبط به حوزه های دیگر از جمله مباحث مرتبط با تشخیص گفتار، سیگنال های بیولوژیکی ، پردازش داده ها و … هم می شود.

 

 

این مطلب در آینده کامل خواهد شد…

(سوالات را یا در بخش نظرات مطرح کنید و یا به ایمیل miladonlinemail@gmail.com سوالات خود را ارسال کنید تا اسرع وقت پاسخ آن ها داده شود.)

(لطفا مطالب با ذکر نام این سایت کپی برداری شود)

  1. سلام
    ممنون از مطالب مفیدی که در سایت قرار می دهید.
    اگر لطف کنید PDF مطالب را بصورت کامل حهت دانلود بگذارید ممنون میشم . مرسی

دیدگاه شما

( الزامي )

(الزامي)