ஒருங்குறி

(யூனிக்கோட் இலிருந்து வழிமாற்றப்பட்டது)

ஒருங்குறி அல்லது யுனிகோட் (Unicode) என்பது, எழுத்துகளையும் வரியுருகளையும் எண்முறை உபகரணங்களில் பயன்படுத்துவதற்கென உருவாக்கப்பட்ட ஒரு குறிமுறை நியமம் ஆகும்.[1][2][3]

ஒருங்குறி குறிமுறை என்பது சோ பெக்கர் (Joseph.D.Becker) லீ காலின்சு (Lee Collins) மார்க் இடேவிசு (Mark.E.Davis) ஆகிய மூவரும் உருவாக்கியதாகும்

இது கலிஃபோர்னியாவின் ஒருங்குறி கூட்டமைப்பால் (Unicode Consortium) நிர்வகிக்கப்படுகிறது

இன்று உலகில் பரவலாகப் பயன்படுத்தப்படும் பல்வேறு வரிவடிவங்கள் இந்நியமத்தில் அடங்கியுள்ளன. அவற்றுடன், சில அரிதாக பயன்படுத்தப்படும் வரிவடிவங்களும், கணிதம், மொழியியல் போன்ற துறைகளில் பயன்படும் சில வரியுருகளும் அடங்கியுள்ளன.

கணியுலகில் வெவ்வேறு வரிவடிவங்களுக்காக வெவ்வேறு குறிமுறைகள் இன்று பயன்பாட்டிலுள்ளன. மேலும், தமிழ் போன்ற சில மொழிகளில் ஒரே வரிவடிவத்திற்குப் பல்வேறு குறிமுறைகளும் காணப்படுகின்றன. பன்மொழிச் சூழல்களில் இத்தகைய வேறுபட்ட குறிமுறைகளைப் பயன்படுத்துவதால் உருவாகும் சிக்கல்கள் பல. ஒருங்குறி, இத்தகைய வேறுபட்ட குறிமுறைகளுக்கு மாற்றாக ஒரு நியம குறிமுறையை நிறுவுவதற்காக ஏற்படுத்தப்பட்ட திட்டமாகும். இன்று பல்வேறு எண்முறை, கணினியியல் நிறுவனங்களும் செயற்றிட்டங்களும் ஒருங்குறிக்கு ஆதரவு வழங்கி இக்குறியீட்டு நியமத்திற்கான ஆதரவையும் தமது தயாரிப்புக்களில் சேர்த்துக்கொண்டுள்ளன. புதிதாக தோன்றும் நியமங்களும் ஒருங்குறியை அடிப்படை கட்டமைப்பாகக் கொண்டு உருவாக்கப்படுகின்றன. (எ+கா) XML

குறிமுறை நியமங்களின் வரலாற்றுப் பின்னணி

தொகு

=== அமெரிக்க க்ஷ குறிமுறை நியமங்களின் வரலாறு ===

தமிழ் குறிமுறை நியமங்களின் வரலாறு

தொகு

அஸ்கி (ASCII)

தொகு

ஆரம்பகாலத்தில் தமிழ் தட்டச்சுக் கருவியைத் தழுவி பாமினி என்கின்ற எழுத்துரு அறிமுகம் ஆனது. இது ஆங்கிலச் சொற்களுக்குப் பதிலாக தமிழை உட்புகுத்தியது.

தகுதரம் (TSCII)

தொகு

இந்த ஏற்பாட்டில், இணையத்தின் வரவு புதிய நடைமுறைச் சிக்கல்களை உருவாக்கியது. இதே காலப் பகுதியில் வேறு பல நியமங்களும் உருவாகத் தொடங்கின. இதனால் கோப்புக்களைப் (File) பரிமாறுவதில் சிக்கல்கள் ஏற்பட்டன. தவிர்த்து, பல தரவுத் தளங்களில் (Database) ஒரு எழுத்துருவை மாத்திரமே ஏற்றுக் கொள்வதால் தமிழையும் ஆங்கிலத்தையும் ஒன்று சேர்க்க இயலாமல் போனது. எனவே இவற்றைக் கருத்திற் கொண்டு தகவற் பரிமாற்றத்திற்கான தமிழ் நியமக் குறியீட்டு முறை (அதாவது, Tamil Standard Code for Information Interchange [TSCII]) உருவாகியது. இதில் முதல் 0-127 எழுத்துகள் தகவல் பரிமாற்றத்திற்கான அமெரிக்க முறையை (American Standard Code for Information Interchange [ASCII]) ஒத்தது. மிகுதியான 128-155ல் தமிழ் எழுத்துகள் நிரப்பப்பட்டன. விண்டோஸ் 3.1, 95, 98, Me ஆகிய பதிப்புக்களில் TSCII அதிகம் பயன்படுத்தப்படுகிறது.

இஸ்கீ (ISCII)

தொகு

இஸ்கீ (Indian Script Code for Information Interchange, ISCII) என்பது இந்திய மொழிகளுக்கான ஒரு குறியீட்டு முறை, இது பெரும்பாலான மொழிகளையும், அதன் ஒலிபெயர்ப்பையும் குறிப்பிடத்தக்கது. பின்வரும் மொழிகளில் இஸ்கீ குறியீட்டு முறை: அஸ்ஸாமி, பெங்காலி (பங்களா) ஸ்கிரிப்ட், தேவநாகரி, குஜராத்தி, அச்சுப், கன்னடம், மலையாளம், ஒரியா, தமிழ், மற்றும் தெலுங்கு.

ஒருங்குறி (UNICODE)

தொகு

ஒருங்குறி ஒவ்வொரு மொழிக்கும் ஓரிடம் என்று உலகின் பிரதான மொழிகளை ஒன்றிணைத்து 16 பிற்றில் (TSCII 8 பிற்) அறிமுகமானது. விண்டோஸ் 2000/XP/2003/Vista, ஆப்பிள் மாக் 10.4, லினக்ஸ் ஆகிய அனைத்து இயங்கு தளங்களும் தமிழ் ஒருங்குறியை ஆதரிக்கின்றன. இன்று அநேகமாக உலகிலுள்ள தேடுபொறிகள் (Search Engines) கூகிள் மற்றும் யாகூ ஒருங்குறியில் தேடல்கள் செய்ய வல்லன. மேலும் மைக்ரோசொஃப்ட் நிறுவனம் ஒருங்குறியினூடாக தமிழ் விண்டோஸ் மொழி இடைமுகப் பதிப்பை ஆபிஸ் 2003 மற்றும் விண்டோஸ் XPல் அறிமுகம் செய்ததுடன் ஆபிஸ் 2003 பதிப்பில் ஆபிஸ் 2003 சரிபார்க்கும் கருவிகளை அறிமுகம் செய்து தமிழில் எழுத்துப் பிழைவசதிகளையும் ஒத்தசொல் வசதிகளையும் அறிமுகம் செய்தது.. உலகிலுள்ள பல மொழிகளையும் ஆதரிக்கும் இக்குறியீட்டு முறை இன்று மிகவும் பிரபலமடைந்து வருகின்றது.

எண்முறை சாதனங்களில் ஒருங்குறி

தொகு

கணினி

தொகு

கணினி இயங்குதளங்களும் (operating system) பயன்பாட்டு மென்பொருட்களும் படிப்படியாக ஒருங்குறிக்கான முழுமையான ஆதரவை வழங்கத்தொடங்கியுள்ளன.

கனூ/லினக்ஸ் இயங்குதளம்

தொகு

ஒருங்குறிப் பயன்பாட்டை ஆரம்பகாலங்களில் உள்வாங்கிக்கொண்ட இயங்குதளங்களுள் கனூ/லினக்ஸ் இயங்குதளமும் அடங்கும். utf-8 ஒழுங்கினைப்பின்பற்றி கனூ/லினக்ஸ் இயங்குதளங்களில் ஒருங்குறி கையாளப்படுகிறது. இந்த அடிப்படையே வின்டோஸ் போன்ற இயங்குதளங்கள் ஒருங்குறியைக் கையாளு முறைமையிலிருந்து கனூ/லினக்ஸ் இணை வேறுபடுத்துகிறது. பழைய மென்பொருள்களிலும் ஒருங்குறி பயன்படுத்தப்படக்கூடியதாய் இருக்கவேண்டும் என்கிற பழசோடும் ஒத்திசைதல் எனும் எண்ணக்கருவினை அடிப்படையாகக்கொண்டே ஆரம்பகாலங்களில் utf-8 ஒழுங்கு உள்வாங்கிக்கொள்ளப்பட்டது.

கனூ/லினக்ஸில் தமிழ் ஒருங்குறிப்பயன்பாடு ஏறத்தாழ முழுமையடைந்திருக்கிறது. உலகின் முதல் தமிழ் இடைமுகப்பை கொண்ட முழுமையான இயங்குதளமாக வெளிவந்த மான்ட்ரேக் லினக்ஸ் 10.0 ஒருங்குறி ஆதரவினைக் கொண்டிருந்தது. ஆரம்பகால கனூ/லினக்ஸ் இடைமுகப்பு தமிழாக்கத்தின்போது தமிழ்க் கணினி வல்லுநர்கள் ஒருங்குறி அல்லாத குறிமுறைகளையும் பயன்படுத்தியுள்ளனர். தமிழ் நொப்பிக்ஸ் இதற்கு நல்ல உதாரணமாகும்.

யுனிக்ஸ், சொலாரிஸ்

தொகு

வின்டோஸ்

தொகு

விண்டோஸ் இயங்குதளங்களில் விஸ்டாவில் தமிழ் மொழி உட்பட இந்திய மொழிகளுக்கான நேரடி ஆதரவுண்டு. புதிதாக ஒரிய மொழியானது ஒருங்குறியில் விண்டோஸ் ஆதரவளிக்கின்றது.தமிழை உத்தியோகப்பூர்வமாக ஆதரித்த முதலாவது விண்டோஸ் பதிப்பு விண்டோஸ் 2000 ஆகும். எ-கலப்பை மென்பொருள் தனித்தியங்கும் ஓர் ஒருங்குறி இயந்திரமொன்றைக் கொண்டுள்ளதால் கொள்கை ரீதியில் விண்டோஸ் 98 இயங்குவேண்டும்.

விண்டோஸ் 2000/XP

தொகு

விண்டோஸ் XP

தொகு

உங்களிடம் விண்டோஸ் XP சேவைப் பொதி 2 இருந்தால விண்டோஸ் மொழி இடைமுகப் பொதியை நிறுவிக் கொள்ளலாம்.

மாக்கின்டோஷ்

தொகு

செல்பேசி

தொகு

செல்பேசிகளில் ஜாவா தொழினுட்பம் ஒருங்குறிக்கான ஆதரவை வழங்குவதால், கணினி தவிர்ந்த சாதனங்களில் ஒருங்குறிப்பயன்பாடு சாத்தியமாகியுள்ளது. தற்போது டாட் நெட் நுண்ணியக்க சூழலும், கணினி தவிர்ந்த சாதனங்களில் ஒருங்குறிப்பயன்பாட்டை சாத்தியப்படுத்திவருகிறது. இலங்கையில் சண்ரெல் மடிமேற்கணினிகளில் பாவிக்கப் படும் PCMCIA CDMA தொலைபேசியும் ஒருங்குறியை ஆதரிக்கின்றது. இங்கே நேரடியா எ-கலப்பை மூலமாக தமிழில் குறுஞ்செய்திகளைத் தயாரிக்க முடியும்.

வெளி இணைப்புகள்

தொகு

மேற்கோள்கள்

தொகு
  1. "Unicode Technical Report #28: Unicode 3.2". Unicode Consortium. 27 March 2002. பார்க்கப்பட்ட நாள் 23 June 2022.
  2. Jenkins, John H. (26 August 2021). "Unicode Standard Annex #45: U-source Ideographs". Unicode Consortium. பார்க்கப்பட்ட நாள் 23 June 2022. 2.2 The Source Field
  3. "Unicode Character Count V15.1". Unicode. Archived from the original on Oct 9, 2023. பார்க்கப்பட்ட நாள் 12 September 2023.
"https://ta.wikipedia.org/w/index.php?title=ஒருங்குறி&oldid=3909203" இலிருந்து மீள்விக்கப்பட்டது