وبلاگ تخصصی آموزش کامپیوترودانلود نرم افزار (خداجون دوستت دارم)

آموزش و راه کارهای کامپیوتر -مقاله کامپیوتر-قالب -ویندوز XP- ویستا -رمز

وبلاگ تخصصی آموزش کامپیوترودانلود نرم افزار (خداجون دوستت دارم)

آموزش و راه کارهای کامپیوتر -مقاله کامپیوتر-قالب -ویندوز XP- ویستا -رمز

تبدیل اسناد اسکن شده به متون نوشتاری‌

اشاره : اگر تاکنون دقت کرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.  


اگر تاکنون دقت کرده باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Office Tools نیز نصب می‌‌شود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.

یکی از این ابزارها، قابلیت OCR یا Optical Character Recognition نام دارد که در قالب دو نرم‌افزار Microsoft Office Document Scanning و Microsoft Office Document Imaging در قسمت Office Tools قرار گرفته است. قابلیت OCR صفحه اسکن شده را تحلیل و سپس متون موجود در آن را استخراج می‌کند.

همان‌طور که می‌بینید روش کار واضح است. ابتدا باید اسناد مورد نظر خود را به فرمت TIFF یا Tagged Image File Format اسکن کنید و سپس به کمک قابلیت OCR، آن‌‌‌ها را به صورت Text درآورید. بدین ترتیب می‌توانید متون یک کتاب یا هر نوشته دیگری را در نرم‌افزار Word یا سایر نرم‌افزارهای آفیس وارد و آن‌ها را ویرایش کنید (این قابلیت تنها برای متون انگلیسی، فرانسه و اسپانیایی کاربرد دارد).
 
بدین منظور باید مراحل زیر را دنبال کنید:

íروی دکمه استارت کلیک کنید.
íعبارت All Programs را انتخاب کنید.
íعبارت Microsoft Office را انتخاب کنید.
íعبارت Microsoft Office Tools را انتخاب کنید.


íدر فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن کلیک کنید. اگر این عبارت وجود نداشت، باید آن را نصب کنید. بدین منظور سی‌دی نصب آفیس را در درایو سی‌دی قرار دهید. پس از نمایش صفحه Autorun، تیک عبارت Add or Remove Features را بزنید و روی دکمه Continue کلیک کنید. اکنون شما به صفحه سفارشی کردن نصب آفیس هدایت شده‌اید. روی علامت (+) کنار عبارت Office Tools کلیک کنید تا شاخه مربوطه باز شود.

در این قسمت، روی آیکون عبارت Microsoft Office Document Imaging کلیک کنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب کنید. با فشردن دکمه Continue، فرآیند نصب آغاز می‌شود. پس از پایان مراحل نصب، مراحل یک تا پنج را بار دیگر تکرار کنید تا کادر محاوره‌ای با عنوان Scan New Document نمایش داده شود.

íدر این پنجره می‌‌توانید یکی از تنظیمات پیش‌فرض را برای اسکن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پیش‌فرض و یا ایجاد تنظیمات پیش‌فرض جدید، می‌توانید روی دکمه Preset Options کلیک کنید و عملیات مورد نظر خود را (ساخت، ویرایش یا حذف تنظیمات پیش‌فرض) انتخاب کنید.

پیشنهاد می‌کنیم برای دستیابی به یک نتیجه مطلوب، تنظیمات پیش‌فرض اسکن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید. در عین حال اگر از چند اسکنر استفاده می‌کنید، می‌‌توانید با کلیک روی دکمه Scanner...، اسکنر مورد نظر خود را انتخاب کنید.

íپس از پایان تنظیمات اسکن، روی دکمه Scan کلیک کنید تا صفحه مورد نظر اسکن شود. اگر هنگام عملیات اسکن با پیغام خطایی مواجه شدید، به کادر Scan New Document بازگردید و در قسمت انتخاب اسکنر، تیک عبارت‌های Use Automatic Document Feeder و Show Scanner Driver Dialog Before Scanning را بزنید و برای تأیید تنظیمات روی دکمه Ok کلیک کنید.

íپس از پایان عملیات اسکن، روی دکمه Close کلیک کنید. اکنون صفحه اسکن شده در قالب فرمت تصویری TIFF و در نرم‌‌افزار Office Document Imaging Window نمایش داده شده است.

íاگر مایلید که تنها قسمت خاصی از این فایل را استخراج کنید، باید دکمه چپ ماوس را نگه دارید و آن را روی قسمت مورد نظر بکشید.

íدر بالای صفحه، منوی Tools را انتخاب کنید.
íزیرمنوی Send Text to Word را کلیک کنید تا پنجره مربوطه نمایش داده شود.

íبرای استخراج تمام متون فایل TIFF، تیک عبارت All Pages را بزنید. اما اگر می‌‌خواهید تنها متون انتخاب شده استخراج شوند، تیک عبارت Current Selection را بزنید.
اگر می‌خواهید خروجی عملیات تبدیل فایل TIFF به Text، فاقد تصاویر سند اسکن شده باشد، تیک عبارت Maintain Pictures in Output را بردارید.

íپس از اتمام تنظیمات مربوطه، روی دکمه Ok کلیک کنید. با این کار، نرم‌افزار Word باز شده و فایل TIFF در قالب سند نوشتاری (Text) نمایش داده می‌‌شود. در صورت نیاز می‌توانید آن‌ها را ویرایش کنید.

علاوه بر روشی که در بالا به آن پرداختیم، در نرم‌افزار Document Imaging می‌توانید فایل‌های TIFF را به Text تبدیل کنید. بدین منظور از منوی File عبارت ... Import را انتخاب کنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دکمه Import کلیک کنید. اکنون می‌توانید با طی کردن مراحل نه تا چهارده، متون فایل TIFF را استخراج نمایید.

باید به این نکته توجه داشته باشید که هنگام تحلیل یک صفحه توسط قابلیت OCR، احتمالاً با این پیغام خطا مواجه خواهید شد.

Unable to perform OCR in Farsi: این پیغام زمانی نمایش داده می‌شود که زبان انتخابی پیش‌فرض سیستم شما، فارسی باشد. برای رفع این مشکل از منوی Tools نرم‌افزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی کرکره‌ای OCR Language، زبان English را انتخاب کنید.

نظرات 3 + ارسال نظر
majid دوشنبه 25 آذر‌ماه سال 1387 ساعت 22:51 http://piconet.mihanblog.com

Salam Khaste Nabashin
Bebakhshin
Mikhastam Age Mishe Linke Manoo Gharar Bedin Chon Man Linketoon Roo Gharar Daram Va 20 Hezar Ham Bazdid Daram . Mamnon
جدیدترین عکس های روز دنیا
piconet.mihanblog.com

Lotfan Khabar Bedin Chon Man Link Ro Gozashtam

ابراهیم دوشنبه 2 دی‌ماه سال 1387 ساعت 08:48 http://ver67.blogfa.com

با سلام
وبلاگ بسیار جالب زیبا و پر محتوایی دارید
من ابراهیم میری مدیر وبلاگ "" نسل 1367 "" هستم در صورت تمایل وبلاگ من را در وبلاگ خود پیوند نمایید و به وبلاگ من مراجعه نموده و نظری مشابه نظر من درج نمایید من هم در اولین فرصت وبلاگ شما را در قسمت پیوندهای وبلاگ خود معرفی خواهم نمود
امیدوارم این پیوند باعث پیوندهای بعدی نیز بشود

با تشکر
ابراهیم میری
www.ver67.blogfa.com

علیرضا فیاض جمعه 27 دی‌ماه سال 1387 ساعت 12:37 http://IranSoal.com

برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد