پردازش تصویر چیست و چه کاربردی دارد؟

آیا تا به‌حال به نحوه جداسازی قطعات خراب از سالم به صورت کاملاً هوشمند در یک کارخانه تولید قطعات صنعتی توجه کرده‌اید؟ تا به‌حال به این مسئله فکر کرده‌اید که وجود یک قطعه خراب تا چه میزان می‌تواند بر میزان فروش یک کارخانه تاثیر منفی بگذارد؟ امروزه با استفاده از پردازش تصاویر می‌توانید تعداد زیادی از پروژه‌های صنعتی را پوشش دهید. هر تصویر داستان خاص خود را دارد و حاوی اطلاعات مفیدی است. این اطلاعات را می‌توان با کمک تکنیکی به نام پردازش تصویر (Image Processing) به دست آورد. پردازش تصویر به‌عنوان بخش اصلی فناوری بینایی کامپیوتر (Computer vision) به‌کار می‌رود. این فناوری در بسیاری از کاربردها در دنیای واقعی نقش ویژه‌ای دارد. موارد زیر از جمله کاربردهای پردازش تصویر در صنعت است:

  • اتوماسیون صنعتی
  • رباتیک
  • ماشین‌های خودران
  • تشخیص اشیاء

در فرآیند پردازش تصویر امکان تغییر و دست‌کاری هزاران تصویر در یک زمان و استخراج اطلاعات مفید در کسری از ثانیه وجود دارد. در این فرایند می‌توان از تکنیک‌های مختلفی در جهت رسیدن به هدف استفاده کرد. خروجی نهایی می‌تواند به‌صورت تصویر یا ویژگی (Feature) مربوط به آن باشد.

لازم است بدانید ویژگی، یک مشخصه بصری از تصویر است که می‌تواند از رنگ، بافت، شکل یا لبه‌های تصویر استخراج شود. در واقع، استخراج ویژگی، فرآیند تبدیل مقدارهای خام پیکسل‌های یک تصویر به اطلاعات مفید و معنادار است.

در این مقاله، ابتدا مفهوم اصلی تصویر خاکستری و رنگی را یاد می‌گیرید، سپس با الگوریتم‌های پردازش تصویر کلاسیک و مدرن آشنا می‌شوید و در پایان کاربردهای صنعتی پردازش تصویر را می‌آموزید. اگر می‌خواهید با پردازش تصویر، روش‌ها و کاربردهای آن بیشتر آشنا شوید، این مقاله را تا انتها دنبال کنید.

پردازش تصویر چیست؟

قبل از پرداختن به چیستی پردازش تصویر، باید با انواع و مفهوم یک تصویر در پردازش تصویر آشنا شوید. به طور کلی در تکنیک پردازش تصویر دو نوع تصویر وجود دارد: 

  • تصویر در مقیاس خاکستری (Grayscale): این تصاویر دارای سایه‌های سیاه و سفید هستند و تنها یک کانال دارند. تعریف تصویر در مقیاس خاکستری را در شکل ۱ می‌بینید.
  • تصویر رنگی (RGB): همان‌طور که در شکل ۲ و ۳ نشان داده شده است، تصویر رنگی شامل سه لایه تصویر دو بعدی است، که این لایه‌ها کانال‌های قرمز (R)، سبز (G) و آبی (B) هستند. 

یک تصویر خاکستری را می‌توان به عنوان یک تابع دو بعدی به‌صورت (F(x,y نشان داد که در آن x و y مختصات پیکسل‌ها هستند. به‌ طور کلی، یک تصویر، ماتریسی از پیکسل‌ها است که در ستون‌ها و ردیف‌ها مرتب شده‌اند. هر پیکسل‌ حاوی اطلاعاتی درباره شدت و رنگ هستند. دامنه F در یک مقدار خاص x و y به‌عنوان شدت تصویر در آن نقطه شناخته می‌شود. اگر x و y دارای مقادیر دامنه محدود باشد (مثلا تصاویر باینری که تنها از مقادیر صفر و یک تشکیل شده‌اند)، آن را تصویر دیجیتال می‌نامیم. یک تصویر می‌تواند به‌صورت سه بعدی (F(x,y,z نیز نمایش داده شود که در آن  y ،x و z به مختصات فضایی تبدیل می‌شوند. تصور کنید که پیکسل‌ها در قالب یک ماتریس سه‌‌بعدی مرتب شده‌اند، این ماتریس سه‌بعدی به‌عنوان یک تصویر رنگی یا همان RGB شناخته می‌شود که سه کانال سبز، زرد و قرمز دارد. در شکل‌های ۱، ۲ و ۳ حالت‌های تابع دو و سه بعدی یک تصویر را مشاهده می‌کنید.

در نتیجه، تصویر یک آرایه دو یا سه بعدی است که از اعدادی بین ۰ تا ۲۵۵ تشکیل شده است.

تعریف پیکسل تصویر در حالت دو بعدی

شکل ۱- تعریف پیکسل تصویر در حالت دو بعدی

 لایه‌های R ،G و B در تصویر رنگی

شکل ۲- لایه‌های R ،G و B در تصویر رنگی

تابع فضایی تصویر RGB و نحوه در نظر گرفتن پیکسل‌های تصویر رنگی

شکل ۳- تابع فضایی تصویر RGB و نحوه در نظر گرفتن پیکسل‌های تصویر رنگی

حالا نوبت آن است که چیستی پردازش تصویر را بدانید. به بیان ساده، پردازش تصویر به روش پردازشی گفته می‌شود، که به تصویر دیجیتال اعمال می‌کنید، تا کیفیت آن را بهبود داده و یا اطلاعات مهمی از آن استخراج کنید. پردازش تصویر نوعی پردازش سیگنال (Signal Processing) است. در پردازش تصویر، ورودی، یک تصویر دیجیتال است و خروجی آن یک تصویر و یا ویژگی‌های مرتبط با تصویرِ ورودی است. این فناوری به شما کمک می‌کند تا:

  •  کیفیت تصاویر را بهبود دهید.
  • نویز تصاویر را حذف کنید. 
  • اجزا و ویژگی‌های تصویر را تشخیص دهید و آن‌ها را استخراج کنید.
  • تصاویر را ویرایش کنید.
  • در فشرده‌سازی تصویر، از آن استفاده کنید.

بنابراین، به فرآیند تبدیل یک تصویر به فرم دیجیتال و اعمال عملیات‌هایی مشخص با هدف استخراج اطلاعات از آن، پردازش تصویر (Image Processing) می‌گویند. معمولاً فرآیند پردازش تصویر با تمام تصاویر به‌صورت سیگنال‌هایی دو بعدی رفتار می‌کند و عملیات مختلفی از پردازش سیگنال را بر روی آن‌ها اعمال می‌کند.

الگوریتم‌های کلاسیک پردازش تصویر

اکنون که با چیستی پردازش تصویر آشنا شدید، لازم است الگوریتم‌های کلاسیک تصویر را بشناسید. الگوریتم‌های کلاسیک پردازش تصویر به روش‌های پردازش تصویری گفته می‌شود، که از دهه ۱۹۷۰ میلادی تا امروز به‌عنوان پایه و اساس عملیات پردازش تصویر به کار می‌رود. به‌طور کلی، الگوریتم‌های پردازش تصویر به دو دسته الگوریتم‌های کلاسیک پردازش تصویر و الگوریتم‌های پردازش تصویر با هوش مصنوعی تقسیم می‌شوند.

اگر به مباحث هوش مصنوعی علاقمند هستید، مقاله «هوش مصنوعی چیست؟» را بخوانید. در ادامه معرفی انواع الگوریتم‌های کلاسیک پردازش تصویر را می‌آموزید. 

 پردازش تصویر مورفولوژیکی

پردازش تصویر مورفولوژیکی (Morphological image processing) سعی در حذف نواقص از تصاویر باینری دارد، زیرا مناطق باینری تولید شده توسط آستانه ساده (Simple Threshold) (مانند مرزهای اشیاء در تصویر)، می‌توانند به‌وسیله نویز، تخریب یا دست‌کاری شوند. همچنین این الگوریتم به صاف کردن تصویر با استفاده از عملیات باز و بسته کردن (opening and closing)، کمک می‌کند. این دو عملیات از مهم‌ترین فرآیندها روی تصاویر باینری هستند که از ترکیب مختلف دو تکنیک سایش (Erosion) و گسترش (Dilation) تصاویر به‌دست می‌آیند. عملیات مورفولوژیکی را می‌توان در تصاویر خاکستری که به مقادیر عددی پیکسل‌ها بستگی دارد، نیز به کار برد.

پردازش تصویر مورفولوژیکی، یک تصویر را با استفاده از یک الگوی کوچک به نام عنصرِ ساختاری (structuring element)، تجزیه و تحلیل می‌کند. یک عنصرِ ساختاری، ماتریسی کوچک با مقادیر ۰ یا ۱ است. این عنصرِ ساختاری، در مکان‌های مختلفی در تصویر قرار می‌گیرد و با پیکسل‌های همسایه‌اش مقایسه می‌شود. 

در تکنیک مورفولوژیکی، دو عملیات اساسی پردازش تصویر شامل گسترش و سایش انجام می‌شود. در عملیات گسترش، پیکسل‌هایی به مرزهای جسم در یک تصویر اضافه می‌شوند. در عملیات فرسایش، پیکسل‌هایی از مرزهای شی حذف می‌شوند. لازم به‌ ذکر است که تعداد پیکسل‌های حذف شده یا اضافه شده به تصویر اصلی به اندازه عنصر ساختاری بستگی دارد. این عنصر می‌تواند هر شکل و اندازه دلخواهی داشته باشد. ماتریسِ عنصر ساختاری می‌تواند در یک نقطه از تصویر قرار گیرد. سپس با پیکسل‌های مربوطه در همسایگی خود مقایسه شود. برای مثال، همان‌گونه که در شکل ۴ می‌بینید، فرض می‌شود نقاط آبی رنگ، شی مورد نظر در تصویر است. در این تصویر، عنصر ساختاری مربع A،  کاملاً در شیء قرار می‌گیرد. عنصر ساختاری B، شیء مورد نظر را قطع کرده و عنصر ساختاری C، خارج از شیء است. 

 نمونه‌ای از انتخاب عناصر ساختاری در پردازش تصویر مورفولوژیکی

شکل ۴- نمونه‌ای از انتخاب عناصر ساختاری در پردازش تصویر مورفولوژیکی.

لازم است بدانید، در صنایع دفاعی برای تشخیص صحیح اشیاء و مرزهای هر شیء در تصویر از تکنیک پردازش مورفولوژیکی استفاده می‌شود.

 پردازش تصویر گاوسی 

تکنیک محو شدگی گاوسی (Gaussian blur)، به هموارسازی گاوسی نیز معروف است. این تکنیک معمولاً برای کاهش نویز و کاهش جزئیات در تصویر کاربرد دارد. تکنیک گاوسی در کاربردهای صنعتی مانند سیستم‌های اطلاعات جغرافیایی (که نیاز به افزایش کیفیت تصویر یا ویدیو دارد)، برای بهبود تصویر در مقیاس‌های مختلف به کار برده می‌شود. کاهش کیفیت در اثر استفاده از تجهیزات قدیمی در کاربردهایی که از بینایی کامپیوتر (Computer Vision) استفاده می‌شود، رخ می‌دهد. این تکنیک به‌عنوان راه‌حلی برای تقویت و بهبود داده در یادگیری عمیق (Deep Learning) استفاده می‌شود. 

در شکل ۵ نمونه‌ای از تصویر محو شده با فیلتر گاوسی را می‌بینید. در تصویر سمت راست، نویز گاوسی موجود در تصویر سمت چپ حذف شده است.  

 تصویر اصلاح شده با استفاده از پردازش تصویر گاوسی

شکل ۵- تصویر اصلاح شده با استفاده از پردازش تصویر گاوسی

لازم است بدانید، از پردازش تصویر گاوسی در اپلیکیشن‌های مختلف برای تار کردن زمینه عکس و یا ویدیو در هنگام تماس تصویری، استفاده می‌شود.

  پردازش تصویر با استفاده از تبدیل فوریه

تبدیل فوریه، یک تبدیل ریاضی است که تابع یا سیگنال در حوزه زمان را به حوزه فرکانس انتقال می‌دهد. در پردازش تصویر، تبدیل فوریه یک تصویر را به اجزای سینوسی و کسینوسی تجزیه می‌کند. این تکنیک شامل چندین عملگر مانند بازسازی تصویر (Image Reconstruction)، فشرده‌سازی تصویر (Image Compression) یا فیلتر تصویر (Image Filtering) است. 

از آن‌جایی که در مورد استفاده از تبدیل فوریه در پردازش تصاویر صحبت می‌شود، نوع تبدیل مورد استفاده اهمیت ویژه‌ای دارد. در تجزیه و تحلیل تصاویر، معمولاً از تبدیل فوریه گسسته استفاده می‌شود.

یک موج سینوسی از سه جزء اندازه، فرکانس و فاز تشکیل شده است. پارامتر اندازه، به کنتراست (contrast)، فرکانس و روشنایی تصویر وابسته است. در حالی درحالی که پارامتر فاز، به اطلاعات رنگ تصویر مربوط است. تصویر در حوزه فرکانس به صورت شکل ۶ است. 

تصویر پردازش شده در حوزه فرکانس

شکل ۶- تصویر پردازش شده در حوزه فرکانس

لازم است بدانید، تکنیک پردازش تصویر با استفاده از تبدیل فوریه، در صنعت بازرسی خطوط انتقال نفت، با هدف افزایش وضوح و هموارسازی تصاویر، کاربرد ویژه‌ای دارد.

 پردازش تصویر با استفاده از شناسایی لبه

تشخیص لبه (Edge detection) یک تکنیک پردازش تصویر برای یافتن مرزهای اشیاء در تصاویر است. اساس عملکرد این الگوریتم تشخیص ناپیوستگی در میزان روشنایی پیکسل‌های تصویر است. این روش می‌تواند در زمینه استخراج اطلاعات مفید از تصویر بسیار موثر باشد، زیرا بیشتر اطلاعات تصویر در لبه‌های موجود در تصویر قرار گرفته است. معمولاً روش‌های کلاسیکِ تشخیص لبه با تشخیص ناپیوستگی در یک میزان روشنایی کار می‌کنند. لبه‌ها به‌عنوان ماکزیمم محلیِ گرادیان تعریف می‌شوند. برای مثال، زمانی که عملیات پردازش در پیکسلِ در مرز یک شیء (در تصویر) انجام می‌شود، مقدار عددی این پیکسل، مقدار بیشتری نسبت به پیکسل‌های همسایه آن (که مرز شیء نیستند) است. 

رایج‌ترین الگوریتم تشخیص لبه، الگوریتم تشخیص لبه سوبل (sobel edge detection algorithm) است. عملگرِ (operator) تشخیص سوبل از هسته‌های کانولوشنال ۳*۳ تشکیل شده‌ است. به زبان ساده‌تر، این عملگر، شامل یک هسته ساده Gx و یک هسته با ۹۰ درجه چرخشِ Gy است. اندازه‌گیری‌های جداگانه با اعمال هر دو هسته به‌صورت مجزا روی تصویر انجام می‌شود. شما در شکل ۷ نمونه‌ای از فیلتر استفاده شده در آشکارساز سوبل را می‌بینید. شکل ۸ نیز نمونه‌ای از تشخیص لبه با الگوریتم سوبل را نشان می‌دهد. 

نمونه‌ای از فیلتر استفاده شده در آشکارساز سوبل

شکل ۷- نمونه‌ای از فیلتر استفاده شده در آشکارساز سوبل

 آشکارسازی لبه تصویر با الگوریتم سوبل

شکل ۸- آشکارسازی لبه تصویر با الگوریتم سوبل

لازم است بدانید، در صنعت از پردازش تصویر با الگوریتم سوبل، که یک تکنیک پردازش تصویر با استفاده از شناسایی لبه است، برای بازرسی خراش‌ها و عیب‌ها، تشخیص کثیفی، اشیاء روی هم افتاده، بازرسی گوشه‌ها و لبه‌های شکسته و کالیبراسیون اتوماتیک استفاده می‌شود. 

 پردازش تصویر موجک (Wavelet) 

در روش پردازش تصویر با استفاده از تبدیل فوریه، یک تبدیل فوریه داریم که تنها به فرکانس محدود می‌شود. اما در الگوریتم پردازش تصویر موجک‌ها، نه تنها زمان بلکه فرکانس نیز تاثیرگذار است. این تبدیل برای سیگنال‌های غیر ثابت مناسب است. سیگنال غیر ثابت سیگنالی است که خواص آماری آن در طول زمان در حال تغییر است. همان‌گونه که گفته شد، لبه‌ها از بخش‌های مهم یک تصویر هستند. در حالی که می‌دانیم با اعمال فیلترهای سنتی، نویز حذف می‌شود اما تصویر هم تار خواهد شد. تکنیک تبدیل موجک به‌گونه‌ای طراحی شده است که وضوح فرکانس مناسبی برای اجزای فرکانس پایین تصویر بدست بیاید. در شکل ۹ نمونه‌ای از تبدیل موجک دو بعدی نمایش داده شده‌ است.

 تصویر پردازش شده با استفاده از تکنیک تبدیل موجک دو بعدی

شکل ۹- تصویر پردازش شده با استفاده از تکنیک تبدیل موجک دو بعدی

لازم است بدانید که در صنعت، از تکنیک پردازش تصویر موجک در پردازش تصاویر سونوگرافی استفاده می‌شود. 

الگوریتم‌های پردازش تصویر مدرن

امروزه علاوه‌ بر استفاده از الگوریتم‌های کلاسیک پردازش تصویر، الگوریتم‌های مبتنی بر یادگیری ماشین و شبکه‌های عصبی در کاربردهای آکادمیک و صنعتی کاربرد بسیاری پیدا کرده‌اند. شبکه‌های عصبی، شبکه‌های چند لایه‌ای هستند که از نورون‌ها (یا همان گره‌ها) تشکیل شده‌‌اند. در شکل ۱۰ شِمای یک شبکه عصبی ساده را می‌بینید، که در آن دایره‌های رنگی همان نورون‌ها هستند.

یک شبکه عصبی مصنوعی

شکل ۱۰- یک شبکه عصبی مصنوعی

این شبکه‌ها طوری طراحی شده‌اند که مانند مغز انسان عمل کنند. شبکه‌های عصبی مصنوعی داده‌های ورودی، که می‌تواند شامل تصاویر مختلفی باشند، را دریافت می‌کنند. سپس آموزش می‌بینند تا الگوهای موجود در داده‌های ورودی را تشخیص دهند و خروجی را پیش‌بینی کنند.

لازم است بدانید، امروزه از الگوریتم‌های پردازش تصویر مدرن با استفاده از الگوریتم‌های یادگیری ماشین، یادگیری عمیق و … در ربات‌های هوشمند صنعتی برای آموزش عملیات‌های حساس و دقیق مانند برش قطعات استفاده می‌شود. 

کاربردهای پردازش تصویر در صنعت 

حالا که با الگوریتم‌های مختلف پردازش تصویر آشنا شدید، دانستن کاربردهای مختلف این الگوریتم‌ها بسیار اهمیت دارد. از پردازش تصویر برای کشف الگوها و جنبه‌های مختلف در تصاویر استفاده می‌شود. به عنوان مثال، استفاده از پردازش تصویر در تشخیص الگو در تجزیه و تحلیل دست‌خط، تشخیص تصویر و تشخیص‌‌های پزشکی به کمک کامپیوتر استفاده می‌شود. در طول سال‌های اخیر، پردازش تصویر پیشرفت بسیاری داشته است. در ادامه، تعدادی از کاربردهای تجاری مدرن پردازش تصویر را می‌بینید: 

  •  تصحیح تصویر (Image Correction) در فناوری‌های پزشکی
  •  تیز کردن (Sharpening) یا شفاف‌سازی تصویر در بازرسی عیوب ورق‌های فلزی و پلیمری در صنایع انتقال نفت و گاز و پتروشیمی
  •  تصحیح وضوح (Resolution Correction) در فیلترهای موجود در برنامه‌های ویرایشگر و شبکه‌های اجتماعی
  •  بینایی ماشین/کامپیوتر (Computer/Machine Vision) در اتوماسیون صنعتی در صنایع تولیدی و اسکن سه‌بعدی 
  •  تشخیص الگو (Pattern recognition) در رابط‌های تبدیل گفتار به متن
  • پردازش ویدئو در بازرسی لیبل و خواندن بارکد 

اگر با اتوماسیون صنعتی آشنا نیستید و مزایای آن را نمی‌دانید، مقاله «اتوماسیون صنعتی چیست و چه مزایایی دارد؟» را بخوانید. 

استفاده از پردازش تصویر در فیلترهای استفاده شده در برنامه‌های ویرایشگر و شبکه‌های اجتماعی

از دیرباز انسان آرزو داشت که بتواند تصاویر قدیمی را بهبود بخشد. این امر امروزه با استفاده از تکنولوژی پردازش تصاویر امکان‌پذیر است. به‌عنوان مثال، زوم کردن، تیز کردن (sharp) تصویر، تشخیص لبه و ویرایش‌های محدوده دینامیکی تصویر، در این دسته قرار می‌گیرند. تمامی این مراحل به بهبود تصویر کمک می‌کنند. اکثر نرم‌افزارهای ویرایشگر و تصحیح کد تصویر می‌توانند این عملیات را به راحتی انجام دهند.

در شکل ۱۱، نمونه‌ای از تصویر اصلی و تصویر فیلتر شده را می‌بینید. استفاده از فیلترها باعث جذاب‌تر شدن تصاویر از نظر بصری (ظاهری) می‌شود. فیلترها معمولاً مجموعه‌ای از عملکردها هستند که رنگ‌ها و سایر جنبه‌های یک تصویر را تغییر می‌دهند. این امر باعث می‌شود که تصویر متفاوت به نظر برسد. فیلترها یکی از کاربردهای جذاب پردازش تصویر هستند.

تصویر اصلی و تصویر فیلتر شده در یک اپلیکیشن ویرایشگر تصویر

شکل ۱۱- تصویر اصلی و تصویر فیلتر شده در یک اپلیکیشن ویرایشگر تصویر

استفاده از پردازش تصویر در فناوری‌های پزشکی و مهندسی پزشکی 

در زمینه پزشکی، پردازش تصویر برای کاربردهای مختلفی مانند موارد زیر استفاده می‌شود:

  • اسکن PET (positron emission tomography scan)
  • تصویربرداری اشعه ایکس
  • CT پزشکی (medical CT)
  • تصویربرداری UV 
  • پردازش تصویر سلول‌های سرطانی

معرفی فناوری پردازش تصویر به حوزه فناوری پزشکی، فرآیند تشخیص را بسیار بهبود بخشیده است.

در شکل ۱۲ تصویر سمت چپ، تصویر اصلی و تصویر سمت راست، تصویر پردازش‌ شده است. می‌بینید که تصویر پردازش‌ شده به مراتب کیفیت بهتری دارد و می‌توان برای تشخیص بهتر از آن استفاده کرد.

تصویر رادیوگرافی اصلی و تصویر ارتقاء یافته آن با الگوریتم‌های پردازش تصویر

شکل ۱۲- تصویر رادیوگرافی اصلی و تصویر ارتقاء یافته آن با الگوریتم‌های پردازش تصویر

استفاده از پردازش تصویر در بینایی ماشین 

یکی از جالب‌ترین و کاربردی‌ترین کاربردهای پردازش تصویر در بینایی کامپیوتر (Computer Vision) است. در فناوری بینایی ماشین/کامپیوتر برای این که کامپیوتر ببیند، اشیاء را شناسایی کند و کل محیط را پردازش کند، از پردازش تصویر استفاده می‌شود. از کاربردهای مهم بینایی ماشین می‌توان به اتومبیل‌های خودران، هواپیماهای بدون سرنشین، رادارها و ربات‌های صنعتی اشاره کرد.

این فناوری به تشخیص موانع، تشخیص مسیر و درک محیط کمک می‌کند. بینایی ماشینِ معمولی روشی است که در کنترل‌کننده خودکار خودرو استفاده می‌شود. در این تکنولوژی، کامپیوتر فیلمی را به‌صورت زنده از محیط تصویر‌برداری کرده و سپس با استفاده از پردازش تصویرِ خودروهای دیگر، جاده و دیگر موانع را تجزیه و تحلیل می‌کند. از دیگر کاربردهای بینایی ماشین می‌توان به موارد زیر اشاره کرد: 

  • جداسازی قطعات معیوب 
  • بازرسی عیوب در خطوط انتقال 
  • دسته‌بندی و درجه‌بندی محصولات صنعتی یا تولیدات کشاورزی 
  • میکروسکوپ‌ و تلسکوپ‌های دیجیتال
  • هدایت ربات‌های زمینی، هوایی، دریایی و انسان‌نما 

 تشخیص اشیاء در تصویر با استفاده از الگوریتم پردازش تصویر.

شکل ۱۳- تشخیص اشیاء در تصویر با استفاده از الگوریتم پردازش تصویر

استفاده از پردازش تصویر در تشخیص الگو و پردازش ویدیو 

تشخیص الگو (Pattern recognition) بخشی از پردازش تصویر است. این تکنیک شامل ترکیب هوش مصنوعی و یادگیری ماشین است. پردازش تصویر برای کشف الگوها و جنبه‌های مختلف در تصاویر استفاده می‌شود. به‌عنوان مثال، از تشخیص الگو برای تجزیه و تحلیل دست‌خط، تشخیص و تصحیح تصویر و کمک به تشخیص پزشکی دقیق، استفاده می‌شود.

استفاده از شناسایی الگو در تشخیص دست‌خط با استفاده از پردازش تصویر

شکل ۱۴- استفاده از شناسایی الگو در تشخیص دست‌خط با استفاده از پردازش تصویر

تکنیک‌های مختلف پردازش تصویر در پردازش ویدیو نیز کاربرد دارند. اساس یک ویدیو، حرکت سریع تصاویر است. برخی از روش‌های پردازش ویدیو عبارتند از:

  • حذف نویز
  • تثبیت‌ تصویر
  • تبدیل نرخ فریم
  • بهبود جزئیات ویدیو  

در این روش‌ها از تکنیک‌های مختلف پردازش تصویر استفاده می‌شود. 

استفاده از پردازش تصویر در پردازش ویدئو

شکل ۱۵- استفاده از پردازش تصویر در پردازش ویدئو

جمع‌بندی

پردازش تصویر قابلیت‌های فراوان و استفاده بی‌شمار در صنایع مختلف دارد، از جمله:

  •   اتوماسیون‌ صنعتی در صنایع هوایی، غذایی، دارویی و نفتی
  •  کاربردهای زمین‌شناسی و هواشناسی
  •  سیستم‌های کنترل شهری 

این فناوری در سال‌های اخیر توانسته است توسعه و تغییر چشم‌گیری را در صنعت ایجاد کند. در این مقاله، با مفاهیم کلی پردازش تصویر و کاربردهای آن در صنایع مختلف آشنا شدید. با ترکیب علوم هوش مصنوعی و الگوریتم‌های کلاسیک، الگوریتم‌های پردازش تصویر به طرز شگفت‌انگیزی رشد یافته است. این امر لزوم یادگیری مباحث ویژه پردازش تصویر براساس نیاز صنعت را گوشزد می‌کند.

یکی از کاربردهای مهم پردازش تصویر، استفاده آن در اتوماسیون صنعتی است. همراهی پردازش تصویر و اتوماسیون می‌تواند بر بهبود کیفیت محصولات، افزایش بهره‌وری و کاهش هزینه‌ها موثر باشد. برای آشنایی بیشتر با ارکان اصلی اتوماسیون صنعتی و چگونگی تاثیر آن بر صنعت به دوره آموزش اتوماسیون صنعتی مراجعه کنید.

مراجع

https://www.researchgate.net/figure/A-digital-image-is-a-2D-array-of-pixels-Each-pixel-is-characterised-by-its-x-y_fig1_221918148

 https://www.geeksforgeeks.org/matlab-rgb-image-representation/

https://www.cs.auckland.ac.nz/courses/compsci773s1c/lectures/ImageProcessing-html/topic4.htm

آیا این مطلب را می پسندید؟
اشتراک گذاری:

نظرات

2 نظر در مورد پردازش تصویر چیست و چه کاربردی دارد؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  1. بی نظیر بود اینده اتوماسیون صنعتی در کنترل خواص فیزیکی حتما پردازش تصویر و بینایی ماشین است ممنون بابت مقاله عالیتون