فی بوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

فی بوو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

پروژه بازشناسی بصری کاراکترها (OCR). doc

اختصاصی از فی بوو پروژه بازشناسی بصری کاراکترها (OCR). doc دانلود با لینک مستقیم و پر سرعت .

پروژه بازشناسی بصری کاراکترها (OCR). doc


پروژه بازشناسی بصری کاراکترها (OCR). doc

 

 

 

 

نوع فایل: word

قابل ویرایش 115 صفحه

 

پیشگفتار:

نیاز به کاربرد تصاویر از همان ابتدای زندگی غار نشینی که اکنون نیز آثار نقاشی‌های آنان را شاهد هستیم، تا زمان حال که وجود تصاویر به یک اصل جدانشدنی در تمامی زندگی ما به خصوص آموزش تبدیل شده است، وجود داشته است. امروزه در همه عرصه‌های علوم و آموزش، به وفور شاهد توانایی و گویایی تصاویر نسبت به متن‌های طولانی و طاقت فرسا هستیم. چگونگی به کاربردن تصاویر در این زمینه‌ها به دانش و تخصص نیاز دارد تا بتوان تصاویری را خلق کرد که مقصود و نظر افراد را به خوبی در خود نمایان کند.

پردازش تصویر یکی از تکنیک‌هایی است که با پیشرفت آن شاهد تغییرات اساسی در همه علوم هستیم. یکی از زیر شاخه‌های این تکنیک، پردازش بصری کاراکترها (OCR) است. طبق OCR ما قادر خواهیم بود متن‌های موجود در تصاویر را شناسایی کرده و آنها را با سرعت ویرایش کنیم و این چنین در وقت و فضای ذخیره سازی داده‌ها صرفه جویی نماییم.

مزایای استفاده از پردازش تصویر و OCR تنها به این چند نکته ختم نمی‌شود بلکه می‌توان از آن برای حرکت به سوی جامعه مجازی که هم اکنون در ابتدای این راه قرار داریم، استفاده کرد. بنابراین آشنایی با پردازش تصویر و به خصوص OCR یک مزیت برای همه افراد در آینده تلقی می‌شود.

چکیده:

در این پایان نامه پردازش تصویر و یکی از زیر شاخه‌های مهم آن یعنی بازشناسی بصری کاراکترها توضیح داده شده است. انواع روش‌های سنتی و جدید در بازشناسی کاراکترها معرفی شده است و یک روش کاربردی با تلفیق روش‌های قدیمی و جدید برای جداسازی حروف و کلمات مورد بررسی و تحلیل قرار گرفته است. استفاده از این روش تا حدودی باعث بهبود در جداسازی درست حروف خصوصا در زبان فارسی و عربی شده است.

کلمات کلیدی

OCR، پردازش تصویر، خوشه بندی، طراحی فیلتر، شناسایی الگو، شبکه عصبی.

 

فهرست مطالب:

فصل اول (مقدمه)

1-1 مقدمه‌ای بر پردازش تصویر

1-2 کاربرد‌های پردازش تصویر

1-2-1 صنعت

1-2-2 هواشناسی

1-2-3 شهرسازی

1-2-4 کشاورزی

1-2-5 علوم نظامی

1-2-6 نجوم

1-2-7 پزشکی

1-2-8 فناوری‌های علمی

1-2-9 باستان شناسی

1-2-10 تبلیغات

1-2-11 سینما

1-2-12 اقتصاد

1-2-13 روانشناسی

1-2-14 زمین شناسی

1-3 بازشناسی بصری کاراکترها (OCR)

1-4 تاریخچه OCR

1-5 مزایای OCR

فصل دوم ( انواع OCR)

2-1 انواع OCR از لحاظ نوع الگوی ورودی

2-2 معرفی بخش‌های مختلف سیستم OCR

2-2-1 پیش پردازش

2-2-2 بازشناسی خط، زبان و فونت

2-2-3 قطعه بندی

2-2-4 بازنمایی

2-2-5 طبقه بندی و بازشناسی

2-2-6 به کار گیری اطلاعات جانبی

فصل سوم (روش های تشخیص الگو)

3-1 جمع آوری اطلاعات برای تشخیص

3-2 نوع متن

3-3 تشخیص متن

3-3-1 پیش پردازش

3-3-2 قطعه بندی

3-3-3 آموزش و تشخیص کاراکتر‌ها

3-3-4 پس پردازش

3-4 شبکه‌های عصبی LVQ

3-5 بهبود تصاویر

3-5-1 Adaptive Median Filter

3-5-2 Spatial Smoothing

3-5-3 Thresholding

3-5-4 Projection افقی و عمودی

3-5-5 حذف نقاط انتها

3-5-6 پیاده سازی و اجرا

3-5-7 آزمایش یک کاراکتر

3-5-8 آزمایش تصویر اسکن شده

3-6 تشخیص اعداد فارسی ( عربی ) با استفاده از ساختار ترکیبی SVM/HMM

3-6-1 مدل مخفی مارکف

3-6-2 ماشین بردار پشتیبان

3-6-3 مدل ترکیبی SVM/HMM

3-6-4 پایگاه داده ها

3-6-5 نتیجه گیری

فصل چهارم (قطعه بندی و جداسازی کاراکترها)

4-1 پیش زمینه

4-2 کسب تصویر و ملایم سازی آن

4-3 قطعه بندی کاراکترها

4-4 الگوریتم ارائه شده

4-5 پیاده سازی و نتایج آزمایشات

4-6 نتیجه گیری

4 -7 کارهای آینده

 

فهرست اشکال:

شکل 1-1: جایگاه کنونی ocr

شکل 2-1: تصویر اولیه

شکل 2-2: نویز gaussian

شکل 2-3: نویز فلفل نمکی

شکل 2-4: نویز پواسن

شکل 2-5: اعمال فیلتر میانه با یک ماسک 3×3

شکل 2-6: اعمال فیلتر میانه با یک ماسک 5×5

شکل 2-7: فیلتر میانگین 3×3

شکل 2-8: فیلتر میانگین 5×5

شکل 2-9: هیستوگرام

شکل 2-10: بهترین شرایط

شکل 2-11: هیستوگرام شکل 2-10

شکل 2-12: ناحیه‌ها

شکل 2-13: نمایی از صفحه پشت نمایش یک دوربین

شکل 2-14: عکس مربوط به هیستوگرام شکل 2-13

شکل 2-15: ناحیه تاریک

شکل 2-16: هیستوگرام مربوط به شکل 2-15

شکل 2-17 : ناحیه روشن

شکل 2-18: هیستوگرام ناحیه روشن

شکل 2-19 نقاط تاریک و روشن

شکل 2-20: هیستوگرام مسطح

شکل 2-21: های لایت‌ها و سایه‌های کم نور

شکل 2-22: حالت اتوماتیک دوربین

شکل 2-23: تباین بالا

شکل 2-24: تباین پایین

شکل 2-25: خوشه بندی

شکل 2-26 الف: طبقه بندی

شکل 2-26 ب : خوشه بندی

شکل 2-27 شباهت بین دو خوشه در روش Single-Link

شکل 2-28: دندوگرام مثال Single-Link

شکل 2-29: اعمال عملیات نازک سازی بر روی یک تصویر متنی نمونه

شکل2-30 قطعه بندی یک کلمه به حروف

شکل 3-1: شبکه lvq

شکل 3-2: projection افقی و عمودی

شکل 3-3 : نمونه‌ای از روش projection

شکل 3-4: تصاویر قطعه قطعه شده

شکل 3-5: تشخیص

شکل 3-6: قبل و بعد از عملیات بهبود

شکل 3-7

شکل 3-8

شکل 3-9

شکل3-10

شکل 3-11

شکل 3-12

شکل 3-13

شکل 3-14

شکل 3-15

شکل 3-16

شکل 3-17

شکل 4-1: علامت‌ها در زبان فارسی

شکل 4-2: پیش زمینه

شکل 4-3 : سطوح قطعه بندی

شکل 4-4

شکل 4-5: هیستوگرام افقی

شکل4-6: خط مبنا

شکل 4-7: ربع بالا

شکل 4-8: روش قدیمی

شکل 4-9: ستون بندی

شکل 4-10 رفع مشکل برآمدگی سطوح برخی حروف

شکل 4-11: رفع مشکل حروف دایره‌ای

شکل 4-12: بررسی و یافتن و ترکیب دندانه‌ها

شکل 4-13: نتایج میانگین صحت

شکل 4-14: میزان قطعه‌بندی نسبت به اندازه فونت

 

منابع و مأخذ:

[1] انشانیه محمد، استخراج الگوهای غالب در سناسایی تصویر، پایان نامة کارشناسی ارشد دانشگاه علم و صنعت، 1388.

[2] رمضان غلامرضا، پردازش تصویر به روش آنالیز مؤلفه های اصلی، مجموعه مقالات پنجمین کنفرانس بین المللی سالانه کامپیوتر ایران، 1378.

[3] شاه حسینی امیر، پردازش تصویر، پایان نامه دانشگاه صنعتی مالک اشتر، 1389.

[4] صفا بخش رضا، شناسایی چهرة انسان با استفاده از ضرایب خود همبستگی، مجموعه مقالات پنجمین کنفرانس بین المللی سالانه کامپیوتر ایران، 1378.

[5] کیانمجد کاوه، مقدمه‌ای بر پردازش تصویر، انجمن مهندسین الکترونیک ایران، 1388.

[6] یگانه امید، جداساز ی حروف تایپی مستقل از نوع فونت و اندازه، پایان نامه کارشناسی ارشد،. دانشکده مهندسی برق، دانشگاه صنعتی شریف، 1383.


دانلود با لینک مستقیم


پروژه بازشناسی بصری کاراکترها (OCR). doc

بازشناسی ارقام فارسی دستنویس

اختصاصی از فی بوو بازشناسی ارقام فارسی دستنویس دانلود با لینک مستقیم و پر سرعت .

بازشناسی ارقام فارسی دستنویس


بازشناسی ارقام فارسی دستنویس

 

 

این پروژه 6 فایل می باشد که دو تا از فایلها مربوط به تصاویر ارقام دستنویس می باشند وفایل TMU تصاویر اصلی ارقام که شامل 3398 نمونه از ارقام 0 تا 9 می باشند که این تعداد اعداد دستنویس به نوبه خود یک فایل بسیار کامل می باشد که برای تهیه آن زحمت بسیار زیادی کشیده شده است که این کار اولا از تعداد افراد زیادی برای نوشتن ارقام استفاده شده و هر فرد چند نمونه  نوشته است و هم این نمونه ها در برگه های A4 نوشته شده بعد اسکن شده است تا به این صورت درآمده است و فایل TMU_Resize ارقام نرمالیزه شده می باشد.

 

 

 

یک فایل pdf هم که در 7 صفحه می باشد توضیحات کامل پروژه می باشد .

 

و دو فایل برنامه matlab که یکی rec_digit متن اصلی برنامه است و دیگری فایل zoningg که وظیفه ناحیه بندی ارقام را برای تشخیص آنها به کار می رود. 

 

عنوان پروژه : بازشناسی ارقام فارسی

 

برروی فایل ارقام دست نویس فارسی کارهای زیر راانجام دهید.

الف ) تصویر هر رقم ورودی را به 32*32 نرمالیزه کنید .

ب ) ویژگی های ناحیه بندی را استخراج کنید به عبارتی دیگر نقاط سیاه موجود در پنجره های 4*4

را به عنوان ویژگی در نظر بگیرید .

ج ) از سه طبقه بند برای طبقه بندی استفاده نمائید .) classify,knnclassify(k=1),knnclassify(k=3)

د ) برای طبقه بندی نهائی از ترکیب طبقه بندها با استفاده از روش رای گیری اکثریت استفاده نمائید .

نصف داده ها را به عنوان آموزشی و نصف دیگر به عنوان آزمایشی در نظر بگیرید.

خروجی برنامه بدین صورت باشد که تصویر هر رقم نشان داده شود و زیر تصویر کلاس اصلی آن و سمت چپ

آن کلاسی که طبقه بند به آن اختصاص داده است را نشان دهد .

 

مرحله اول : خواندن تصویر وهنجارسازی تصویربه32*32 وذخیره آن:

در ابتدا تصاویر را بصورت تک تک از فایل TMU با دستور imread می خوانیم و از دستور num2str برای تبدیل عدد به رشته استفاده می‌کنیم تا بتوانیم 1699 تصویر را بخوانیم بعد با استفاده از دستور imresize سایز تصاویر را به 32*32 تبدیل می‌کنیم و در پوشه‌ی جدیدی بنام TMU_Resaize با دستور imwrite ذخیره میکنیم.

 

 

 

 

 

 

 

 


دانلود با لینک مستقیم


بازشناسی ارقام فارسی دستنویس