படங்கள் மற்றும் சில PDF கோப்புகளிலிருந்து (எ.கா. ஸ்கேன் செய்யப்பட்ட ஆவணங்களிலிருந்து உருவாக்கப்பட்டவை) உரையை எளிதாக நகலெடுக்க இயலாமை என்பது என்னை அடிக்கடி விரக்தியடையச் செய்த ஒன்று. அதிர்ஷ்டவசமாக, காலப்போக்கில் இந்த சிக்கலை தீர்க்க மென்பொருள் தீர்வுகள் உருவாக்கப்பட்டுள்ளன, இது கணிசமான நேர சேமிப்பை அனுமதிக்கிறது, இல்லையெனில் உரையை கைமுறையாக நகலெடுத்து மீண்டும் தட்டச்சு செய்ய செலவிடப்படும். இன்றைய உதவிக்குறிப்பில், படம் மற்றும் PDF கோப்புகளிலிருந்து உரையைப் பிடிக்க உங்களை அனுமதிக்கும் ஆப்டிகல் கேரக்டர் ரெக்னிகிஷன் (OCR) வழிமுறையைப் பயன்படுத்தும் கேப்ட்சர் 2 டெக்ஸ்ட் என்ற இலவச மென்பொருள் கருவியைப் பற்றி பேசப் போகிறேன்.
நிறுவல் மற்றும் அமைப்பு
தொடங்க, திட்டத்தின் SourceForge பக்கத்திற்குச் சென்று, பிடிப்பு 2 உரையின் சமீபத்திய பதிப்பைப் பதிவிறக்கவும். மென்பொருள் ஒரு ஜிப் காப்பகமாக வருகிறது, அந்த நேரத்தில் ஒரு பிரத்யேக நிறுவி இல்லை. பதிவிறக்கம் செய்யப்பட்டதும், காப்பகத்தை அவிழ்த்து, Capture2Text.exe கோப்பைத் தொடங்கவும். இது மென்பொருளைத் துவக்கி கணினி தட்டில் ஒரு ஐகானை கீழே வைக்கும்:
முதலில், நீங்கள் செய்ய விரும்புவது மென்பொருளின் விருப்பங்களை அமைப்பதாகும், குறிப்பாக எந்த சூடான விசைகள் (அல்லது குறுக்குவழிகள்) கைப்பற்றலைத் தொடங்கவும் நிறுத்தவும் பயன்படுத்த வேண்டும்:
என் விஷயத்தில், பிடிப்பைத் தொடங்க “விண்டோஸ் + q” விசைகளையும், அதைத் தடுக்க “Enter” ஐயும் பயன்படுத்த நான் தேர்ந்தெடுத்துள்ளேன். இந்த விருப்பங்களை உங்களுக்கு சிறந்ததாக மாற்றலாம். “விண்டோஸ் + கள்” விசை பெரும்பாலும் திரை பிடிப்புக்கு ஏற்கனவே பயன்படுத்தப்படுகிறது என்பதை நினைவில் கொள்ளுங்கள் (எ.கா. மைக்ரோசாப்ட் ஒன் நோட் போன்ற நிரல்களால்).
அடுத்த தாவலில், உள்ளீட்டு மொழி (தற்போது ஏழு மொழிகள் ஆதரிக்கப்படுகின்றன) மற்றும் துல்லியத்தை மேம்படுத்த OCR முன் செயலாக்கத்தைப் பயன்படுத்தலாமா (OCR விருப்பங்களை உள்ளமைக்கலாம்) உள்ளிட்ட OCR விருப்பங்களை உள்ளமைக்க முடியும். இறுதியாக, வெளியீட்டு தாவலில், கைப்பற்றப்பட்ட உரையை கிளிப்போர்டில் சேமிக்க வேண்டுமா அல்லது தனி பாப்அப் சாளரத்தைத் தொடங்கலாமா என்பதை மற்ற விருப்பங்களுக்கிடையில் ஒருவர் தேர்வு செய்யலாம்.
மென்பொருளைப் பயன்படுத்துதல்
மென்பொருள் நிறுவப்பட்டு கட்டமைக்கப்பட்டதும், உங்கள் தொடக்க பிடிப்பு சூடான விசை சேர்க்கை வழியாக அதைப் பயன்படுத்தத் தொடங்கலாம். உங்கள் சுட்டியைப் பயன்படுத்தி, நீங்கள் பிடிக்க விரும்பும் உரையை உள்ளடக்கிய படத்தில் உள்ள பகுதியைத் தேர்ந்தெடுக்கவும். பிடிப்பதை நிறுத்த, பிடிப்பை நிறுத்த நீங்கள் தேர்ந்தெடுத்த சூடான விசையை அழுத்தவும். உரை பின்னர் கிளிப்போர்டு, வெளியீட்டு பாப்அப் சாளரம் அல்லது இரண்டிற்கும் நகலெடுக்கப்படும். ஒரு உதாரணத்தை கீழே காணலாம்.
படங்களுடன் கருவியின் விரைவான சோதனையிலிருந்து, அதன் துல்லியம் ஒழுக்கமானதாக இருப்பதைக் கண்டேன். வெளிப்படையாக, இது மற்றும் OCR போன்ற கருவிகளுக்கு வரம்புகள் உள்ளன. எடுத்துக்காட்டாக, பெரிதும் மாற்றியமைக்கப்பட்ட உரை (மிகவும் கர்சீவ், சாய்வு அல்லது நவீன) நன்றாக வேலை செய்யாமல் போகலாம், சில சமயங்களில் இல்லை. மேலும், சில சந்தர்ப்பங்களில் இது பிடிப்பு பெட்டியின் பரிமாணங்களை சிறிது சரிசெய்ய உதவும் அல்லது மிகவும் துல்லியமான முடிவைப் பெற படத்திலேயே பெரிதாக்குதலுடன் விளையாட உதவும்.
ஸ்கேன் செய்யப்பட்ட PDF ஆவணங்களிலிருந்து உரையைக் கைப்பற்றும் போது துல்லியம் சரி, கைப்பற்றப்பட்ட வெளியீட்டில் சில ஆரம்ப மாற்றங்கள் பொதுவாக தேவைப்படுகின்றன (ஆரம்ப ஸ்கேனின் தரத்தைப் பொறுத்து). மேலும், மென்பொருள் செயலாக்க சில வினாடிகள் ஆகக்கூடும் என்பதை நான் கவனித்தேன், குறிப்பாக பெரிய அளவிலான உரையை மாற்றும்படி கேட்கப்பட்டபோது.
எல்லாவற்றையும் சொல்லும்போது, ஒட்டுமொத்தமாக கருவி ஒரு நல்ல வேலையைச் செய்கிறது என்று நினைக்கிறேன், குறிப்பாக இது இலவசமாகக் கிடைப்பதால் - அதை முயற்சிக்க நான் உங்களை ஊக்குவிக்கிறேன்.
கூடுதல் 11/16/2015:
மற்றொரு விருப்பமாக, கூகிள் கணக்குகளைக் கொண்டவர்களுக்கு, உங்கள் Google இயக்ககத்தில் ஒரு கோப்பைப் பதிவேற்றுவதன் மூலம் கூகிளின் OCR திறன்களைப் பயன்படுத்தலாம் (மேலும் விவரங்களை இங்கே காணலாம்). மேலும், Google Chrome பயனர்களுக்கு Copyfish எனப்படும் OCR சொருகி கிடைக்கிறது, அதை நீங்கள் சரிபார்க்கவும் விரும்பலாம்.
