தகவற் பரிமாற்றத்திற்கான தமிழ் நியமக் குறியீட்டு முறை

தகவற் பரிமாற்றத்திற்கான தமிழ் நியமக் குறியீட்டு முறை என்பது கணினி சார் தேவைகளுக்கு தமிழ் எழுத்துக்களை பயன்படுத்துவதற்கென உருவாக்கப்பட்ட, எட்டு பிட் அடிப்படையில் அமைந்த ஆங்கிலம்-தமிழ் என இரு மொழிகளை கையாளத்தக்க ஒரு எழுத்து குறிமுறை நியமமாகும். இக்குறிமுறையின் பெயர் ஆங்கிலத்தில் சுருக்கமாக (திஸ்கீ) TSCII (Tamil Standard Code for Information Interchange) என்றவாறு குறிப்பிடப்படுகிறது. தமிழில் திசுகி எனவும் தகுதரம் (மிழ் குறியீட்டுத் தரம்) எனவும் வழங்கப்படும் இதுவே முதன்முதல் தமிழில் உலகம் தழுவிய திறந்த இணைய உரையாடல் மூலம் தரப்படுத்தப்பட்டு உருவாக்கப்பட்ட குறிமுறை நியமமாகும்.

ASCII குறிமுறையில் அமைந்த ஆங்கில எழுத்துக்களின் மேலாக, எழுத்துரு ஒன்றினை பயன்படுத்தி தமிழ் எழுத்துக்களை கணினியில் பயன்படுத்திவந்த காலத்தில், தமிழ் - ஆங்கிலம் என இரு மொழிகளையும் பயன்படுத்தி ஆவணமொன்றினை தொகுப்பது மிகக் கடினமான வேலையாக இருந்தது. தமிழ் எழுத்து குறிமுறை வரலாற்றில், இவ்வாறான சிக்கல்மிக்க ஒருமொழி ASCII குறிமுறையின் போதாமையை களைந்து உருவாகிய அடுத்தக்கட்ட படிமுறை வளர்ச்சியே தகுதரம். ASCII குறிமுறை அட்டவணையில் ஆங்கில எழுத்துக்கள், இன்றியமையாக் குறியீடுகள் தவிர்ந்த ஏனைய இட ஒருக்கீடுகளில் தமிழ் எழுத்துக்களை பிரதியீடு செய்தலே தகுதரம் குறிமுறையின் அடிப்படையாகும். தொடக்கத்தில் ஆங்கில எழுத்துக்களுக்கான ஒதுக்கீட்டிலேயே தமிழ் எழுத்துக்களை உள்ளீடு செய்த முறைமையைக் காட்டிலும் இது முன்னேற்றகரமானதாகவும், இருமொழி கையாட்சிக்கு எளிமையானதாகவும் இருந்தது.

இந்த இட ஒதுக்கீட்டினை கீழ்க்காணும் படம் தெளிவாக விளக்குகிறது.

பல்வேறு தொழிநுட்ப சிக்கல்களையும் களைந்து தற்போது இக்குறிமுறையின் நடப்பு வெளியீடான பதிப்பு 1.7 புழக்கத்திலிருக்கிறது. இக்குறிமுறையை பயன்படுத்தி தமிழை கணினியில் உள்ளிடுவதற்கு சிறப்பான உள்ளீட்டு முறைகளும் மென்பொருட்களும் தேவைப்படும்.

பின்வரும் உள்ளீட்டு மென்பொருட்கள் இதற்குப் புகழ்பெற்றவை:

GNU/Linux இயங்குதளத்துக்கானவை

Windows இயங்குதளத்துக்கானவை

இக்குறிமுறைக்கான பல்வேறு வடிவங்களில் அமைந்த எழுத்துருக்களும் தற்போது இணையத்தில் தரவிறக்க கிடைக்கின்றன. இவ்வகை எழுத்துருக்கள் TSC_ என்ற முன்னொட்டுடன் ஆரம்பிக்கும்.

பன்மொழி குறிமுறையான ஒருங்குறியின் வருகைக்குபிறகு இருமொழி குறிமுறையான தகுதரத்தின் பயன்பாடு அருகி வருகிறது. ஒருங்குறி முறையைக் கையாள முடியாத இயங்குதளங்கள், மென்பொருட்கள் போன்றவற்றில் தமிழை வினைத்திறனுடன் கையாள்வதற்கு இன்றும் தகுதரமே உதவி செய்து வருகிறது. தற்போது ஒருங்குறி முறைக்கும் சேர்த்து பயன்படுத்தக்கூடிய தகுதரம் எழுத்துருக்கள் கிடைப்பிலுள்ளன. இவ்வகை எழுத்துருக்கள் TSCu_ என்ற முன்னொட்டுடன் தொடங்கும்.

ஆவணங்களின் குறியீடை மாற்றுதல்

தொகு

கனூ iconv கருவி வழியாக TSCII ஆவணங்களின் குறியீடை மாற்றுதல் எப்படி என்பதை கீழே காணலாம்

$ iconv -f utf-8 -t tscii input_file.utf8 > output_file.tscii

எதிர் திசையில் குறியீடை மாற்ற -f <-> -t இடம் மாற்றவும்.

வெளி இணைப்புகள்

தொகு