எக்ஸ்எம்எல்

எக்ஸ்.எம்.எல் (XML, "எக்ஸ்டென்ஸிபிள் மார்க்அப் லாங்குவேஜ்") என்பது ஆவணங்களை மின்னணுரீதியில் என்கோடிங் செய்வதற்கான விதிகளின் தொகுப்பாகும். இது டபிள்யு3சி ஆல் உருவாக்கப்பட்ட எக்ஸ்எம்எல் 1.0 ஸ்பெசிஃபிகேஷன் மற்றும் வேறு சில ஸ்பெசிஃபிகேஷன்களிலும் வரையறுக்கப்பட்டுள்ளது; இவை அனைத்தும் கட்டணமில்லாத ஓபன் ஸ்டேண்டர்ட்கள் ஆகும்.[1]

எக்ஸ்எம்எல்
XML.svg
கோப்பு நீட்சி.xml
அஞ்சல் நீட்சிapplication/xml, text/xml (deprecated)
சீர் சரவகைக் காட்டி(UTI)public.xml
உருவாக்குனர்World Wide Web Consortium
இயல்புMarkup language
வடிவ நீட்சிStandard Generalized Markup Language
வடிவ மாற்றம்XHTML, RSS, Atom
சீர்தரம்1.0 (Fifth Edition) நவம்பர் 26 2008 (2008-11-26); 4269 தினங்களுக்கு முன்னதாக
1.1 (Second Edition) ஆகத்து 16 2006 (2006-08-16); 5102 தினங்களுக்கு முன்னதாக
திறநிலை வடிவம்?Yes

எக்ஸ்எம்மல்லின் வடிவமைப்பு இலக்குகள் இணையத்தளத்தின் மீதான எளிமை, பொதுப்படைத்தன்மை மற்றும் பயன்பாட்டுத்திறனை வலியுறுத்துகின்றன.[2] உலக மொழிகளுக்கான யுனிகோட் வழியாக பெறும் வலுவான உதவியுடன் இது ஒரு உரையில் அமைந்த தரவு வடிவமாக இருக்கிறது. இருப்பினும் இது எக்ஸ்எம்எல்லின் வடிவமைப்பு ஆவணங்களின் மீது கவனம் செலுத்துகிறது என்றாலும் தடையற்ற தரவு கட்டமைப்புகளை பிரதிநிதித்துவம் செய்பனவாகவும் பரவலாக பயன்படுத்தப்படுகின்றன, உதாரணத்திற்கு வலைத்தள சேவைகள்.

எக்ஸ்எம்எல் தரவை அணுகுவதற்கு மென்பொருள் மேம்படுத்துநர்கள் பயன்படுத்தக்கூடிய பல வகையிலான நிரலாக்க இடைமுகங்கள் இருக்கின்றன என்பதோடு, சில ஸ்கீமா அமைப்புக்கள் எக்ஸ்எம்எல்-சார்ந்த மொழிகளின் வரையில் உதவுவதற்கென்று வரையறுக்கப்பட்டுள்ளன.

As of 2009ஆர்எஸ்எஸ், ஆடம், எஸ்ஓஏபி மற்றும் எக்ஸ்ஹெச்டிஎம்எல் உள்ளிட்ட நூற்றுக்கணக்கான எக்ஸ்எம்எல்-சார்ந்த மொழிகள் உருவாக்கப்பட்டிருக்கின்றன.[3] மைக்ரோசாப்ட் ஆபீஸ் (ஆபீஸ் ஓபன் எக்ஸ்எம்எல்), OpenOffice.org (ஓபன் டாகுமெண்ட்) மற்றும் ஆப்பிளின் ஐஒர்க்[4] உள்ளிட்ட பெரும்பாலான ஆபீஸ் உபயோகக் கருவிகளுக்கென்று எக்ஸ்எம்எல் அடிப்படையிலான வடிவங்களை இயல்பானதாக வைத்திருக்கின்றன.

முக்கிய சொற்களஞ்சியம்தொகு

இந்தப் பிரிவிலுள்ள மூலவிஷயம் எக்ஸ்எம்எல் ஸ்பெசிபிகேஷனின் அடிப்படையில் அமைந்துள்ளது. இது எக்ஸ்எம்எல்லில் தோன்றுகின்ற கட்டமைப்புகள் அனைத்தையும் உள்ளடக்கிய பட்டியல் அல்ல; தினசரிப் பயன்பாட்டில் மிகத் தொடர்ச்சியாக பெரும்பாலும் எதிர்கொள்ளப்படும் முக்கியமான கட்டமைப்புகளுக்கான அறிமுகத்தையும் இது வழங்குகிறது.

(யுனிகோட்) பண்புருதொகு

வரையறையின் அடிப்படையில் எக்ஸ்எம்எல் ஆவணம் பண்புருக்களின் சரடாக இருக்கிறது. கிட்டத்தட்ட விதிகளினடிப்படையில் அமைந்த யுனிக்கோட் பண்புரு ஒவ்வொரு பண்புருவும் எக்ஸ்எம்எல் ஆவணத்தில் தோன்றுகிறது.

பிராசஸரும் பயன்பாடும்தொகு

எக்ஸ்எம்எல் ஆவணத்தை நிகழ்முறையாக்கும் மென்பொருள். ஒரு பயன்பாட்டின் சேவையில் ஒரு பிராசஸர் செயல்படும் என்று எதிர்பார்க்கப்படுகிறது. ஒரு எக்ஸ்எம்எல் பிராசஸர் எதைச் செய்யவேண்டும், எதைச் செய்யக்கூடாது என்பதற்கு குறிப்பிட்ட மிகவும் திட்டவட்டமான தேவைகள் இருக்கின்றன. இந்த பிராசஸர் என்பது (ஸ்பெசிபிகேஷன் அழைப்பதன்படி) சொல்வழக்காக 'எக்ஸ்எம்எல் பார்ஸர் என்று குறிப்பிடப்படுகிறது.

மார்க்அப்பும் உள்ளடக்கமும்தொகு

எக்ஸ்எம்எல் ஆவணத்தை உருவாக்கும் பண்புருக்கள் மார்க்அப் மற்றும் உள்ளடக்கம் என்று பிரிக்கப்பட்டுள்ளன. மார்க்அப்பும் உள்ளடக்கமும் எளிய சின்டாக்டிக் விதிகளின் பயன்பாட்டின் மூலமாக வேறுபடுத்தப்படுவதாக இருக்கலாம். மார்க்அப்பை உருவாக்கும் எல்லாச் சரடுகளும் "<" என்ற பண்புருவுடன் தொடங்கி ">" என்ற பண்புருவுடன் முடிகின்றன, அல்லது "&" இல் தொடங்கி ";" இல் முடிவுறுகின்றன. மார்க்அப்பாக இல்லாத பண்புருக்களின் சரடு உள்ளடக்கமாகும்.

டேக்தொகு

ஒரு மார்க்அப் கட்டமைப்பு "<" உடன் தொடங்கி ">" உடன் முடிவுறுகிறது. டேக்குகள் மூன்று தனித்திறன்களுடன் வருகின்றன: தொடக்க-டேக்குகள், உதாரணத்திற்கு , மற்றும் வெற்று-அடிப்படைக்கூறு டேக்குகள், உதாரணத்திற்கு <line-break/>.

அடிப்படைக் கூறுதொகு

தொடக்க-டேக் உடன் தொடங்குகின்ற மற்றும் அதற்குப் பொருத்தமான முடிவு-டேக்குடன் முடிகின்றதாகவோ அல்லது வெற்று-அடிப்படைக்கூறு டேக்கை மட்டும் கொண்டிருக்கும் ஆவணத்தின் தர்க்கபூர்வ பாகம். தொடக்க மற்றும் முடிவு டேக்குகளுக்கு இடையில் உள்ள பண்புருக்கள் எதுவாயினும் அடிப்படைக் கூறுகளின் உள்ளடக்கம் என்பதுடன் சிறு அடிப்படைக்கூறுகள் எனப்படும் மற்ற அடிப்படைக்கூறுகள் உள்ளிட்ட மார்க்அப்பைக் கொண்டிருக்கலாம். அடிப்படைக்கூறின் உதாரணம் <Greeting>Hello, world.</Greeting>. மற்றொன்று <line-break/>.

தனியியல்புதொகு

ஒரு மார்க்அப் கட்டமைப்பு தொடக்க-டேக் அல்லது வெற்று-அடிப்படைக் கூறு டேக்கிற்குள்ளாக இருக்கும் பெயர்/மதிப்பு இணையை கொண்டிருப்பதாக இருக்கிறது. இந்த உதாரணத்தில், தனியியல்பின் பெயர் "number" மதிப்பு "3": <step number="3">Connect A to B.</step> இந்த அடிப்படைக்கூறு இரண்டு தனியியல்புகளைப் பெற்றிருக்கிறது, src மற்றும் alt : <img src="madonna.jpg" alt='by Raphael'/> ஒரு அடிப்படைக்கூறு ஒரே பெயரிக்குள்ளாக இரண்டு தனியியல்புகளைக் கொண்டிருப்பதாக இருக்கக்கூடாது.

எக்ஸ்எம்எல் பிரகடனம்தொகு

எக்ஸ்எம்எல் ஆவணங்கள் பின்வரும் உதாரணத்தில் இருப்பதுபோன்ற தங்களைக் குறித்த சில விவரங்களை பிரகடனம் செய்வதன் மூலம் தொடங்குகிறது

<?xml version="1.0" encoding="UTF-8" ?.>

எடுத்துக்காட்டுதொகு

இந்தக் கட்டமைப்புகள் மட்டும் கருத்தாக்கங்களைப் பயன்படுத்தும் சிறிய முழுமையான எக்ஸ்எம்எல் ஆவணம் இங்கே உள்ளது.

<?xml version="1.0" encoding='UTF-8'?>
<painting>
 <img src="madonna.jpg" alt='Foligno Madonna, by Raphael'/>
 <table><caption>This is Raphael's "Foligno" Madonna, painted in<td>
 <date>1511</date>-<date>1512</date>.</td></caption><td>
</painting>

இந்த உதாரண ஆவணத்தில் ஐந்து அடிப்படைக்கூறுகள் உள்ளன: painting, img, caption, இரண்டு dates. painting அடிப்படைக் கூறின் சிறு கூறாக உள்ள caption இன் சிறு கூறாக இந்த date கூறுகள் உள்ளன. img இரண்டு தனியியல்புகளைக் கொண்டிருக்கிறது, src மற்றும் alt.

பண்புருக்களும் நழுவுதலும்தொகு

எக்ஸ்எம்எல் ஆவணங்கள் முற்றிலும் யுனிகோட் தொகுதியிலிருந்து பெறும் பண்புருக்களையே சார்ந்திருக்கின்றன. குறிப்பிட்ட முறையில் சேர்த்துக்கொள்ளப்படாத கட்டுப்பாட்டு பண்புருக்கள் தவிர்த்து, யுனிகோடால் வரையறுக்கப்படும் எந்த பண்புருவும் ஒரு எக்ஸ்எம்எல் ஆவணத்தின் உள்ளடக்கத்திற்குள்ளாக தோன்றக்கூடியவையாகும். மார்க்அப்பிற்குள்ளாக தோன்றக்கூடிய பண்புருக்களின் தேர்வு ஒருவகையில் வரம்பிற்குட்பட்டும் பெரியதாகவும் இருக்கிறது.

ஆவணத்தை உருவாக்குகின்ற யுனிகோட் பண்புருக்களின் என்கோடிங்கை அடையாளம் காண்பதற்கான வசதிகளையும் எக்ஸ்எம்எல் பெற்றிருக்கிறது என்பதோடு, ஏதோ ஒரு காரணத்திற்காக பண்புருக்களை வெளிப்படுத்த நேரடியாகப் பயன்படுத்த இயலாது.

என்கோடிங் டிடெக்ஸன்தொகு

பல்வேறு வகையிலான முறைகளில் சேமிக்கப்படவோ மாற்றித்தரப்படவோ பைட்ஸ்களாக என்கோட் செய்யப்படக்கூடிய யுனிகோட் பண்புருக்கள் "என்கோடிங்" எனப்படுகிறது. யுனிகோடும்கூட முழு தொகுதியையும் உள்ளிடும் என்கோடிங்கை வரையறுக்கிறது; யுடிஎஃப்-8 மற்றும் யுடிஎஃப்-16 ஆகியவை நன்கறியப்பட்டவையாகும்.[5] 0}ஏஎஸ்சிஐஐ மற்றும் ஐஎஸ்ஓ/ஐஇசி 8859 போன்ற முன்காலத்தைச் சேர்ந்தவையாக பல என்கோடிங் உரைகளும் இருக்கின்றன; கிட்டத்தட்ட எல்லா நிகழ்விலுமான அவற்றின் பண்புரு தொகுதிகள் யுனிகோட் பண்புரு தொகுதியின் துணைத்தொகுதிகளாக இருக்கின்றன.

எக்ஸ்எம்எல் யுனிகோட்-வரையறுத்த எந்த ஒரு என்கோடிங்குகளையும், யுனிகோடில் தோன்றும் பண்புருக்களின் மற்ற எந்த என்கோடிங்குகளையும் பயன்படுத்த அனுமதிக்கிறது. எக்ஸ்எம்எல் பிராசஸர் நம்பகத்தன்மையோடு வேறு எந்த முன்னறிவும் இல்லாமல் எந்த என்கோடிங் பயன்படுத்தப்படுகிறவிடத்தில் எக்ஸ்எம்எல் ஒரு இயக்கவியலையும் வழங்குகிறது.[6] யுடிஎஃப்-8 மற்றும் யுடிஎஃப்-16 தவிர்த்த என்கோடிங்குகள் ஒவ்வொரு எக்ஸ்எம்எல் பர்சராலும் அவசியம் ஏற்றுக்கொள்ளக்கூடியவையாக இல்லை.

நழுவுதல்தொகு

எக்ஸ்எம்எல் ஆவணத்தில் சில பண்புருக்களை நேரடியாக சேர்ப்பது ஏன் சிக்கலானதாகவோ அல்லது சாத்தியமற்றதாகவோ இருக்கிறது என்பதற்கு சில காரணங்கள் இருக்கின்றன.

  • "<" மற்றும் "&" ஆகிய பண்புருக்கள் முக்கியமான வாக்கியக் குறிப்பான்கள் என்பதுடன் உள்ளடக்கத்தில் ஒருபோதும் தோன்றாமல் போகலாம்.[7]
  • சில பண்புரு என்கோடிங்குகள் யுனிகோடின் துணைத்தொகுதியை மட்டுமே ஏற்கின்றன: உதாரணத்திற்கு, ஏஎல்சிஐஐ இல் எக்ஸ்எம்எல் ஆவணத்தை என்கோட் செய்வது விதிகளுக்கு கட்டுப்பட்டதுதான், ஆனால் ஏஎஸ்சிஐஐ "é" போன்ற யுனிகோட் பண்புருக்களுக்கான கோட் பாய்ண்ட்கள் இல்லாதிருக்கிறது.
  • இது உடைமைதாரரின் மெஷினிலும் பண்புருவை தட்டச்சு செய்ய சாத்தியமற்றதாக்கலாம்.
  • சில பண்புருக்கள் மற்ற பண்புருக்களிலிருந்து காட்சிரீதியாக வேறுபடுத்திப் பார்க்க இயலாத கிளிஃப்களைக் கொண்டிருக்கின்றன: உடைக்கப்பட முடியாத வெற்றிடங்கள் (&#xa0;) மற்றும் சிரிலிக் கேப்பிடல் எழுத்தான A (&#x410;) இதற்கான உதாரணங்களாகும்.

இந்தக் காரணங்களுக்காக, பிரச்சினைகளுக்குரிய அல்லது கிடைத்தற்கரிய பண்புருக்களை பார்வைக் குறிப்பாக கொள்ள எக்ஸ்எம்எல் நழுவுதல் வசதிகளை வழங்குகிறது. ஐந்து முன்வரையறுக்கப்பட்ட தனியுறுப்புக்கள் இருக்கின்றன: &lt; "<"ஐ குறிக்கிறது, &gt; ">"ஐ குறிக்கிறது, &amp; "&"ஐ குறிக்கிறது, &apos; 'ஐ குறிக்கிறது, மற்றும் &quot; represents "ஐ குறிக்கிறது. அனுமதிக்கப்பட்ட யுனிகோட் பண்புருக்கள் அனைத்தும் எண்ணியலான பண்புரு குறிப்போடு குறிப்பிடப்படலாம். "中" என்ற சீன பண்புருவை எடுத்துக்கொள்வோம், யுனிகோடில் இதன் எண்ணியல் குறியீடு ஹெக்ஸாடெசிமல் 4E2D அல்லது டெசிமல் 20,013. இந்தப் பண்புருவை உள்ளிடுவதற்கு எந்த முறையையும் வழங்காத விசைப்பலகையை வைத்திருக்கும் பயனர் 0}&#20013; அல்லது &#x4e2d; ஐ கொண்டு எக்ஸ்எம்எல் ஆவணத்தில் என்கோட் செய்து உள்ளிடலாம். அதேபோன்று, "I <3 Jörg" என்ற சரடு "I &lt;3 J&#xF6;rg" ஆக எக்ஸ்எம்எல் ஆவணத்தில் உள்ளிடப்படுவதற்கான என்கோடாக இருக்கலாம்.

"&#0;" அனுமதிக்கப்படவில்லை, இருப்பினும் வெற்று பண்புருவாக எண்ணியல் பண்புரு பார்வைக்குறிப்பைப் பயன்படுத்தும்போதிலும் எக்ஸ்எம்எல்லில் இருந்து விலக்களிக்கப்பட்ட ஒரு கட்டுப்பாட்டு பண்புருக்களுள் ஒன்றாக இருக்கிறது.[8] Base64 போன்ற மாற்று என்கோடிங் இயக்கவியல் இதுபோன்ற பண்புருக்களைக் குறிக்க தேவைப்படலாம்.

கருத்துரைகள்தொகு

மார்க்அப்பிற்கு வெளியில் எங்குவேண்டுமானாலும் கருத்துரைகள் தோன்றலாம். எக்ஸ்எம்எல் பிராசஸர் பொருத்தப்பாட்டிற்காக எக்ஸ்எம்எல் பிரகடனத்திற்கும் மேல் முதல் வரிசையிலோ அல்லது வேறு எங்குமோ கருத்துரைகள் தோன்றக்கூடாது. " -- " (இரட்டை-இணைப்புக்கோடு) என்ற சரடு அனுமதிக்கப்படவில்லை என்பதோடு தனியுடைமைகள் கருத்துரைகளுக்குள்ளாக ஏற்கப்படக்கூடாது.

ஒரு செல்லுபடியாகும் கருத்துரையின் உதாரணம்: ""

நன்கு வடிவமைக்கப்பட்டிருத்தலும் பிழை கையாளுதலும்தொகு

எக்ஸ்எம்எல் ஆவணத்தை நன்கு வடிவமைக்கப்பட்ட உரையாக எக்ஸ்எம்எஸ் ஸ்பெசிபிகேஷன் வரையறுக்கிறது, அதாவது ஸ்பெசிபிகேஷனில் வழங்கப்பட்டுள்ள வாக்கிய அமைப்பு விதிகளின் பட்டியலை இது திருப்திப்படுத்துகிறது. இந்தப் பட்டியல் சற்றே நீளமானது; சில முக்கியமான கூற்றுக்களாவன:

  • இது முறையாக என்கோட் செய்யப்பட்ட விதிகளுக்குட்பட்ட யுனிகோட் பண்புருக்களை மட்டுமே கொண்டிருக்கிறது.
  • "<" மற்றும் "&" போன்ற சிறப்பு வாக்கிய அமைப்பு பண்புருக்கள் எதுவும் அவற்றின் மார்க்அப்-விரித்துரை பங்காற்றும் நேரம் தவிர்த்து தோன்றுகின்றன.
  • இந்த அடிப்படைக்கூறுகளை வரம்பற்றதாகச் செய்யும் தொடக்கம், முடிவு மற்றும் வெற்று-அடிப்படைக்கூறு ஆகியவை எதுவும் விடுபட்டுவிடாமலும், எதுவும் மேல்கவிந்துவிடாமலும் சரியாக அமைக்கப்பட்டிருக்கின்றன.
  • அடிப்படைக்கூறு டேக்குகள் வேற்றுமை-உணர்திறன் உள்ளவை; தொடக்கம் மற்றும் முடிவு டேக்குகள் துல்லியமாக பொருந்திப்போக வேண்டும்.
  • எல்லா அடிப்படைக் கூறுகளையும் கொண்டிருக்கும் ஒற்றை "அடிப்படை" கூறும் உள்ளது.

ஒரு எக்ஸ்எம்எல் ஆவண"த்தின் வரையறை நன்கு வடிவமைக்கப்பட்ட விதிகளின் மீறல்களைக் கொண்டிருக்கும் உரைகளை விலக்கிவிடுகிறது; அவை எக்ஸ்எம்எல் அல்ல. இதுபோன்ற விதிமீறல்களை எதிர்கொள்ளும் ஒரு எக்ஸ்எம்எல் பிராசஸர் இதுபோன்ற பிழைகளைத் தெரிவிக்க வேண்டும் என்பதுடன் வழக்கமான நிகழ்முறையாக்கத்தை நிறுத்திவைக்க வேண்டும். அவ்வப்போது டிரகோனியன் என்று குறிப்பிடப்படும் இந்தக் கொள்கை, கடுமையான மார்க்அப் பிழைகள் உள்ளபோதிலும் உரிய அளவிற்கான விஷயங்களைத் தயார்செய்துவிடக்கூடிய அளவிற்கு வடிவமைப்பட்டுள்ள ஹெச்டிஎம்எல்லை நிகழ்முறையாக்கும் புரோகிராம்களின் நடத்தையோடு குறிப்பிடத்தகுந்த அளவிற்கு முரண்படுகிறது. இந்தப் பகுதியிலான எக்ஸ்எம்எல்லின் கொள்கை பாஸ்டல் விதியின் மீறலாக விமர்சிக்கப்படுகிறது.[9]

ஸ்கீமாக்களும் மெய்ப்பிப்புகளும்தொகு

நன்கு வடிவமைக்கப்பட்டதாக இருப்பதற்கும் மேலாக, ஒரு எக்ஸ்எம்எல் ஆவணம் செல்லுபடியாகக்கூடியதாகவும் இருக்கலாம். இது டாகுமெண்ட் டைப் வரையறைக்கான பார்வைக்குறிப்பைக் கொண்டிருக்கிறது என்பதைக் குறிப்பதோடு, இதனுடைய ஆக்கக்கூறுகள் மற்றும் உள்ளீடுகள் ஆகியவை டீடிடீயில் தெரிவிக்கப்பட வேண்டும் என்பதுடன் டீடிடீக்கள் குறிப்பிட்டிருக்கும் இவற்றிற்கான இலக்கண விதிகளையும் பின்பற்ற வேண்டும்.

எக்ஸ்எம்எல் பிராசஸர்கள் அவை மெய்ப்பிப்பிற்காக எக்ஸ்எம்எல் ஆவணங்களைச் சரிபார்க்கின்றனவா இல்லையா என்பதைப் பொறுத்து மெய்ப்பிப்பு அல்லது மெய்ப்பிப்பு-அற்றது என்று வகைப்படுத்தப்படுகின்றன. மெய்பிப்புப் பிழைகளை கண்டுபிடிக்கும் ஒரு பிராசஸர் அதைத் தெரிவிக்கும் திறனுள்ளதாக இருக்க வேண்டும், ஆனால் வழக்கமான நிகழ்முறையாக்கத்தைத் தொடரலாம்.

ஒரு டீடிடீ என்பது ஒரு ஸ்கீமா அல்லது இலக்கணத்தின் உதாரணமாகும். எக்ஸ்எம்எல் 1.0 பதிப்பிக்கப்பட்டதிலிருந்து, எக்ஸ்எம்எல்லுக்கான ஸ்கீமா மொழிகள் பகுதியிலான குறிப்பிடத்தகுந்த ஆய்வுகள் செய்யப்பட்டிருக்கின்றன. இதுபோன்ற ஸ்கீமா மொழிகள் ஒரு ஆவணத்தில் பயன்படுத்தப்படக்கூடிய ஆக்கக்கூறுகள், அவற்றிற்குப் பயன்படுத்தப்படக்கூடிய உள்ளீடுகள், அவை தோன்றக்கூடிய ஒழுங்குமுறை மற்றும் அனுமதிக்கக்கூடிய பெற்றோர்/குழந்தை உறவுகள் ஆகியவற்றை வரம்பிற்குட்படுத்துகின்றன.

டீடிடீதொகு

எக்ஸ்எம்எல்லுக்கான பழமையான ஸ்கீமா மொழிகள் எஸ்ஜிஎம்எல்லில் இருந்து பெறப்பட்ட டாகுமெண்ட் டைப் வரையறையாக இருக்கிறது.

டீடிடீக்கள் பின்வரும் பலன்களைக் கொண்டிருக்கின்றன:

  • டீடிடீ எக்ஸ்எம்எல் 1.0 தரநிலையில் உள்ளிடப்பட்டிருப்பதன் காரணமாக ஒரேநேரத்தில் எங்கும் தோன்றக்கூடியதாக இருக்கிறது.
  • டீடிடீக்கள் ஆக்கக்கூறு அடிப்படையிலான ஸ்கீமா மொழிகளோடு ஒப்பிடுகையில் பொருட்செறிவு மிக்கவையாக இருக்கின்றன என்பதோடு அதன் விளைவாக ஒரே திரையில் அதிகத் தகவல்களை வழங்குகின்றன.
  • டீடிடீக்கள் பதிப்பிப்பு பண்புருக்களான தரநிலை பொது தனியுடைமைத் தொகுதிகளின் அறிவிப்பை அனுமதிக்கின்றன.
  • நேம்ஸ்பேஸால் பயன்படுத்தப்படும் டைப்களைக் காட்டிலும் டாகுமெண்ட் டைப்பை டீடிடீக்கள் குறிப்பிடுகின்றன, அத்துடன் ஒரு ஆவணத்திற்கான எல்லாத் தடைகளையும் ஒரே தொகுதியில் குழுப்படுத்துகின்றன.

டீடிடீக்கள் பின்வரும் வரம்புகளுக்கு உட்பட்டவையாக இருக்கின்றன:

  • அவை புதிய எக்ஸ்எம்எல் அம்சங்களுக்கான வெளிப்படை உதவியை, மிக முக்கியமாக நேம்ஸ்பேஸ்களுக்கு கொண்டிருப்பதில்லை.
  • அவை வெளிப்படைத்தன்மையின்றி இருக்கின்றன. எக்ஸ்எம்எல் டீடிடீக்கள் எஸ்ஜிஎம்எல் டீடிடீக்களைக் காட்டிலும் எளிதானவை என்பதோடு வழக்கமான இலக்கணங்களைக் கொண்டு வெளிப்படுத்த இயலாத குறிப்பிட்ட கட்டமைப்புகளும் இருக்கின்றன. டீடிடீக்கள் அடிப்படையான டேட்டாடைப்களை மட்டுமே ஏற்கின்றன.
  • அவை படிக்கப்படக்கூடிய திறனின்றி இருக்கின்றன. டீடிடீ வடிவமைப்பாளர்கள், சிக்கலான இலக்கணங்களை சுலபமானதாக வரையறுக்க பாராமீட்டர் தனியுடைகளை (உரைசார்ந்த மேக்ரோக்களாக அத்தியாவசியமான முறையில் செயல்படுபவை) பெருமளவிற்குப் பயன்படுத்துகின்றனர், ஆனால் தெளிவுபடுத்தலின் செலவினத்தோடு.
  • அவர்கள் வாக்கிய அமைப்பை, ஸ்கீமாவை விவரிப்பதற்கு எஸ்ஜிஎம்எல் இல் இருந்து பெறப்பட்ட வழக்கமான வெளிப்பாட்டு வாக்கிய அமைப்பின் அடிப்படையில் பயன்படுத்துகின்றனர். எஸ்ஏஎக்ஸ் போன்ற வழக்கமான எக்ஸ்எம்எல் ஏபிஐகள் வாக்கிய அமைப்பின் கட்டமைக்கப்பட்ட வெளிப்பாட்டு பயன்பாடுகளை வழங்க முயற்சிப்பதில்லை, இதனால் இது ஆக்கக்கூறு அடிப்படையிலான வாக்கிய அமைப்பால் செய்யப்படக்கூடியவற்றைக் காட்டிலும் புரோகிராமர்கள் குறைவான அளவிற்கே அணுக முடிகிறது.

எக்ஸ்எம்எல் ஆவணங்களுக்குள்ளாக டீடிடீஐ இணைப்பதற்கான வாக்கிய உதவி மற்றும் தனியுடைமைகளை வரையறுப்பதற்கான உதவி ஆகிய இரண்டும் மற்ற ஸ்கீமா வகைகளிலிருந்து டீடிடீயை வேறுபடுத்திக்காட்டுகின்ற திட்டவட்டமான அம்சங்களாகும், இவை பண்புரு நழுவல்கள் போன்ற எக்ஸ்எம்எல் ஆவணத்தில் பார்வைக்குறி்ப்பாக தோன்றுகின்றவிடத்தில் டீடிடீக்குள்ளாகவே எக்ஸஎம்எல் புராசஸர் சேர்க்கச்செய்யும் உரை மற்றும்/அல்லது மார்க்அப்பின் நடுவான்மை துண்டுகளாக இருக்கின்றன.

டீடிடீ தொழில்நுட்பம் அதனுடைய எங்கும் பரவியிருக்கும் தன்மை காரணமாக பல பயன்பாடுகளிலும் இப்போதும் பயன்படுத்தப்படுகின்றன.

எக்ஸ்எம்எல் ஸ்கீமாதொகு

டீடிடீ இன் அடுத்த வடிவமாக டபிள்யூ3சி ஆல் குறிப்பிடப்பட்டிருக்கும் ஒரு புதிய ஸ்கீமா மொழி எக்ஸ்எம்எல் ஸ்கீமா ஆகும், இது தொடர்ந்து இனிஷியலிஸத்தால் எக்ஸ்எம்எல் ஸ்கீமா நிகழ்வுகள், எக்ஸ்எஸ்டிக்கு (எக்ஸ்எம்எல் ஸ்கீமா வரையறை) குறிப்பிடப்படுகின்றன. எக்ஸ்எம்எல் மொழிகளை விவரிப்பதில் டீடிடீக்களைக் காட்டிலும் எக்ஸ்எஸ்டிக்கள் மிகவும் சக்திவாய்ந்தவை. அவை செறிவான டேட்டாடைப்பிங் அமைப்பைப் பயன்படுத்துகின்றன என்பதோடு எக்ஸ்எம்எல் ஆவணத்தின் தர்க்கபூர்வ கட்டமைப்பில் உள்ள மிக அதிக விவரமான தடைகளையும் அனுமதிக்கின்றன. எக்ஸ்எஸ்டிக்கள் எக்ஸ்எம்எல் அடிப்படையில் அமைந்த வடிவத்தையும் பயன்படுத்துகின்றன, இது அவற்றை நிகழ்முறையாக்குவதற்கு வழக்கமான எக்ஸ்எம்எல் கருவிகளின் பயன்பாட்டையும் சாத்தியமாக்குகிறது.

ரிலாக்ஸ் என்ஜிதொகு

ரிலாக்ஸ் என்ஜி தொடக்கநிலையில் ஓயாஸிஸால் பரிந்துரைக்கப்பட்டது என்பதுடன் இப்போது ஐஎஸ்ஓ சர்வதேச தரவரிசைப் பெற்றதாகவும் இருக்கிறது (டிஎஸ்டிஎல் இன் ஒரு பகுதியாக). ரிலாக்ஸ் என்ஜி ஸ்கீமாக்கள் எக்ஸ்எம்எல் அடிப்படையிலான வாக்கியத்திலோ அல்லது மிகவும் கச்சிதமான எக்ஸ்எம்எல்-சாராத வாக்கிய அமைப்பிலோ எழுதப்படலாம்; இந்த இரண்டு வாக்கிய அமைப்புக்களையும் ஐஸோமார்பிக் மற்றும் ஜேம்ஸ் கிளார்க்கின் டிராங் கன்வர்ஸன் டூல் இவற்றிற்கிடையிலான தகவலை தவறவிட்டுவிடாமல் மாற்றித்தரும். ரிலாக்ஸ் என்ஜி எக்ஸ்எம்எல் ஸ்கீமாவைக் காட்டிலும் எளிய வரையறை மற்றும் மெய்ப்பிப்பு கட்டமைப்பைக் கொண்டிருப்பது, இதைப் பயன்படுத்தவும் அமல்படுத்தவும் சுலபமானதாக்குகிறது. இது டேட்டாடைப் பிளக்-இன்களைப் பயன்படுத்தும் திறனையும் பெற்றிருக்கிறது; உதாரணத்திற்கு ஒரு ரிலாக்ஸ் என்ஜி ஸ்கீமா உருவாக்குநருக்கு எக்ஸ்எம்எல் ஸ்கீமா டேட்டாடைப்களோடு இணங்கிப்போவதற்கு எக்ஸ்எம்எல் ஆவணத்தில் உள்ள மதிப்புக்கள் தேவைப்படலாம்.

ஸ்கீமட்ரான்தொகு

ஸ்கீமட்ரான் என்பது ஒரு எக்ஸ்எம்எல் ஆவணத்தில் உருவரை இருப்பது அல்லது இல்லாதிருப்பது குறித்த வலியுறுத்தல்களை உருவாக்குவதற்கான மொழியாகும். இது வகைமாதிரியாக எக்ஸ்பாத் வெளிப்படுத்தல்களைப் பயன்படுத்துகிறது.

ஐஎஸ்ஓ டிஎஸ்டிஎல் மற்றும் பிற ஸ்கீமா மொழிகள்.தொகு

ஐஎஸ்ஓ டிஎஸ்டிஎல் (ஆவண ஸ்கீமா விவரணை மொழி) தரநிலை சிறிய ஸ்கீமா மொழிகளின் ஒருங்கிணைந்த தொகுதியை ஒன்றாக வழங்குகிறது, ஒவ்வொன்றும் குறிப்பிட்ட பிரச்சனையை இலக்காகக் கொண்டவை. ரிலாக்ஸ் என்ஜி முழு மற்றும் கச்சித வாக்கிய அமைப்பு, ஸ்கீமட்ரான் வலியுறுத்தல் மொழி, வரையறு தரவுத்தளங்களுக்கான மொழிகள், பண்புரு தொகுதி தடைகள், மறுபெயரிடுதல் மற்றும் தனியுடமை வலியுறுத்தல், மற்றும் வேவ்வேறு மதிப்பிடுநர்களுக்கான ஆவணத் துண்டுகளின் நேம்ஸ்பேஸ்-சார்ந்த ரவுட்டிங் ஆகியவற்றை உள்ளிட்டிருக்கிறது. டிஎஸ்டிஎல் ஸ்கீமா மொழிகள் எக்ஸ்எம்எல் ஸ்கீமாவின் வழங்குநர் உதவியை இப்போதும் கொண்டிருக்கவில்லை என்பதோடு, பதிப்பிப்பதற்கான எக்ஸ்எம்எல் ஸ்கீமாக்களின் பயன்பாட்டுத்திறனின்மைக்கான தொழில்துறை பதிப்பாளர்களுடைய பொதுமக்கள் எதிர்வினைக்கு சில அளவுகள் வரையிலும் கொண்டிருப்பதில்லை.

சில ஸ்கீமா மொழிகள் குறிப்பிட்ட எக்ஸ்எம்எல் வடிவத்தின் கட்டமைப்பை மட்டும் விவரிப்பதில்லை, அவை இந்த வடிவத்திற்கு இணங்கிப்போகக்கூடிய தனிப்பட்ட எக்ஸ்எம்எல் கோப்புகளின் நிகழ்முறையில் தாக்கமேற்படுத்துவதற்கு வரம்பிற்குட்பட்ட வசதிகளையும் வழங்குகின்றன. டீடிடீக்கள் மற்றும் எக்ஸ்எஸ்டிக்கள் ஆகிய இரண்டும் இந்தத் திறனைப் பெற்றிருக்கின்றன; அவை உதாரணத்திற்கு இன்ஃபோசெட் பெரிதாக்குதல் வசதி மற்றும் உள்ளீட்டு இயல்பாக்கங்களையும் வழங்குகின்றன. ரிலாக்ஸ் என்ஜியும் ஸ்கீமட்ரானும் உள்நோக்கத்துடனே இவற்றை வழங்குவதில்லை.

தொடர்புடைய விவரமளிப்புகள்தொகு

எக்ஸ்எம்எல்லிற்கு நெருக்கமான தொடர்புடைய விவரமளிப்புகளின் ஒரு தொகுதி உருவாக்கப்பட்டிருக்கிறது, இது எக்ஸ்எம்எல் 1.0 தொடக்கப் பதிப்பிற்கும் வெகுவிரைவிலேயே தொடங்கியுள்ளது. எக்ஸ்எம்எல் கருவின் பகுதியாகப் பார்க்கப்படும் இந்த மற்ற தொழில்நுட்பங்களின் ஒன்று அல்லது அதற்கு மேற்பட்டவற்றோடு இணைந்துள்ள எக்ஸ்எம்எல்லைக் குறிப்பதற்கு "எக்ஸ்எம்எல்" என்பதைப் பயன்படுத்துவது ஒரு விவகாரமாகவே தொடர்ந்து இருந்துவருகிறது.

  • எக்ஸ்எம்எல் நேம்ஸ்பேஸ்கள் எந்தவிதமான பெயர்க் குலைவுகளும் ஏற்பட்டுவிடாமல் எக்ஸ்எம்எல் ஆக்கக் கூறுகளை ஒரே ஆவணத்திலும் பல்வேறு சொற்களஞ்சியங்களிலிருந்து எடுக்கப்பட்ட உள்ளீடுகளிலும் கொண்டிருக்கச் செய்கின்றன. அடிப்படையில் எக்ஸ்எம்எல்லை ஏற்பதாக விளம்பரப்படுத்தப்படும் எல்லா மென்பொருள்களும் எக்ஸ்எம்எல் நேம்ஸ்பேஸ்களை ஏற்கின்றன.
  • எக்ஸ்எம்எல் பேஸ் xml:base ஐ வரையறை செய்கிறது, இது ஒற்றை எக்ஸ்எம்எல் ஆக்ககக்கூறின் எல்லைக்குள்ளாக தொடர்புடைய யுஆர்ஐ பார்வைக்குறிப்பின் பகுப்பிற்கான அடித்தளத்தை அமைக்க பயன்படுத்தப்படுகிறது.
  • எக்ஸ்எம்எல் தகவல் தொகுதி அல்லது எக்ஸ்எம்எல் இன்ஃபோசெட் தகவல் அம்சங்கள் என்ற வகையில் எக்ஸ்எம்எல் ஆவணங்களுக்கான அரூப தரவு மாதிரியை விளக்குகின்றன. இந்த இன்ஃபோசெட் மொழிகள் அனுமதிக்கும் எக்ஸ்எம்எல் கட்டமைப்புகளில் உள்ள தடைகளை விளக்குவதில் உள்ள வசதிக்காக எக்ஸ்எம்எல் மொழிகளின் விவரமளிப்புகளில் பொதுவாகப் பயன்படுத்தப்படுகிறது.
  • டீடிடீஇல் பயன்படுத்தப்படும் பொருளில் "ஐடி உள்ளீடாக" செயல்படும் xml:id என்று பெயரிடப்பட்ட ஒரு உள்ளீட்டைக் காட்டிலும் xml:id ஐ வலியுறுத்துகிறது.
  • ஒன்று அல்லது அதற்கு மேற்ப்ட்ட எக்ஸ்எம்எல் ஆவணத்தில் சேர்க்கப்பட்டுள்ள உட்புற பாகங்களை (ஆக்கக்கூறுகள், உள்ளீடுகள் இன்னபிற) அடையாளம் காண்கின்ற எக்ஸ்பாத் எக்ஸ்பிரசன்ஸ் என்று வரையறுக்கப்பட்டுள்ள எக்ஸ்பாத்தை வரையறுக்கிறது. எக்ஸ்பாத் மற்ற மைய எக்ஸ்எம்எல் ஸ்பெசிபிகேஷன்களிலும், எக்ஸ்எம்எல் என்கோட் செய்யப்பட்ட டேட்டாவிற்கான நிரலாக்க நூலகங்களிலும் பரவலாகப் பயன்படுத்தப்படுகிறது.
  • எக்ஸ்எஸ்எல்டி என்பது எக்ஸ்எம்எல் ஆவணங்களை பிற எக்ஸ்எம்எல் ஆவணங்கள், ஹெச்டிஎம்எல் அல்லது மற்ற எளிய உரை அல்லது RTF (ஆர்டிஎஃப்) போன்ற கட்டமைப்பில்லாத வடிவங்களுக்கு மாற்ற பயன்படுத்தப்படும் எக்ஸ்எம்எல் வாக்கிய அமைப்பிற்குள்ளாக இருக்கும் மொழியாகும்.
  • எக்ஸ்எஸ்எல் ஃபார்மேட்டிங் ஆப்ஜெக்ட்ஸ் அல்லது எக்ஸ்எஸ்எல்-எஃப்ஓ, என்பது பிடிஎஃப்களை உருவாக்க மிகத் தொடர்ச்சியாக பயன்படுத்தப்படும் எக்ஸ்எம்எல் ஆவண ஃபார்மேட்டிங்கிற்கான மார்க்அப் மொழியாகும்.
  • எக்ஸ்குவரி என்பது எக்ஸ்பாத் மற்றும் எக்ஸ்எம்எல் ஸ்கீமாவில் வலுவாக வேரூன்றியுள்ள எக்ஸ்எம்எல்-சார்ந்த குவரி மொழியாகும். இது அணுகல், கையாளுதல் மற்றும் எக்ஸ்எம்எல்லிற்கு திரும்புதல் ஆகியவற்றிற்கான முறைகளை வழங்குகிறது.
  • எக்ஸ்எம்எல் சிக்னேச்சர் எக்ஸ்எம்எல் உள்ளடக்கத்தில் டிஜிட்டல் சிக்னேச்சர்களை உருவாக்குவதற்கான வாக்கிய அமைப்பு மற்றும் நிகழ்முறையாக்க விதிகளை வரையறை செய்கிறது.
  • எக்ஸ்எம்எல் என்கிரிப்ஷன் எக்ஸ்எம்எல் உள்ளடக்கத்தை என்கிரிப்டிங் செய்வதற்கான வாக்கிய அமைப்பு மற்றும் நிகழ்முறையாக்க விதிகளை வரையறை செய்கிறது.

"எக்ஸ்எம்எல் மையக்கருவாக" கருதப்பட்ட வேறு சில கருத்தாக்கங்கள் எக்ஸ்இன்க்லூட், எக்ஸ்லின்க்ஸ், மற்றும் எக்ஸ்பாய்ண்டர் உள்ளிட்ட பரந்த தழுவலை கண்டுபிடிப்பதில் தவறிவிட்டன.

இணையத்தளத்தில் பயன்பாடுதொகு

இணையத்தளம் வழியாக தரவு உள்மாற்றத்தில் எக்ஸ்எம்எல் பயன்படுத்தப்படுவது பொதுவானதாகும். ஆர்எஃப்சி 3023 எக்ஸ்எம்எல்லை அனுப்பும்போது பயன்படுத்துவதற்கான இணையத்தள மீடியா டைப்களின் கட்டமைப்பிற்கான விதிகளை வழங்குகிறது. இது மேலும் தரவு எக்ஸ்எம்எல்லில் இருக்கிறது, அதனுடைய மொழியம்சங்கள் குறித்து எதுவுமில்லை என்று கூறும் "பயன்பாடு/எக்ஸ்எம்எல்" மற்றும் "உரை/எக்ஸ்எம்எல்" வகைகளையும் வரையறுக்கிறது. "உரை/எக்ஸ்எம்எல்" என்கோடிங் பிரச்சினைகளுக்கான வாய்ப்பு மூலாதாரமாக இருப்பதாக விமர்ச்சிக்கப்பட்டுள்ளது என்பதுடன் இதைத் தவிர்க்கச் செய்யும் நிகழ்முறையில் இப்போது இருக்கிறது.[10] ஆர்எஃப்சி 3023ம்கூட "பயன்பாடு/" என்பதில் தொடங்கி "+எக்ஸ்எம்எல்லில்" முடிவுறும் எக்ஸ்எம்எல்-சார்ந்த மொழிகள் மீடியா டைப்களுக்கு வழங்குவதைப் பரிந்துரைக்கிறது; உதாரணத்திற்கு எஸ்விஜிக்கான "பயன்பாடு/எஸ்விஜி+எக்ஸ்எம்எல்".

நெட்வொர்க் செய்யப்பட்ட பின்னணியில் எக்ஸ்எம்எல் பயன்பாட்டிற்கான மேற்கொண்டு செய்யப்படும் வழிகாட்டுதல்கள் ஐஇடிஎஃப் 70 என்றும் அறியப்படுகின்ற ஆர்எஃப்சி 3470 இல் காணப்படலாம்; இந்த ஆவணம் மிகவும் பரந்த அளவிற்கு இருக்கிறது என்பதுடன் எக்ஸ்எம்எல் சார்ந்த மொழிகளின் வடிவமைப்பு மற்றும் நிறுவுதலின் பல நோக்கங்களையும் உள்ளிட்டிருக்கிறது.

புரோகிராமிங் இடைமுகங்கள்தொகு

எக்ஸ்எம்எல்லின் வடிவமைப்பு இலக்குகள் "எக்ஸ்எம்எல் ஆவணங்களை நிகழ்முறைப்படுத்தும் புரோகிராம்களை எழுதுவதற்கு இது சுலபமானதாக இருக்கும்" என்பதை உள்ளிட்டிருக்கிறது.[2] இந்த உண்மை இருப்பினும், எக்ஸ்எம்எல் விவரமளிப்பு இதுபோன்ற நிகழ்முறையை புரோகிராமர்கள் எப்படிச் செய்வார்கள் என்பது குறித்து கிட்டத்தட்ட எந்த தகவலையும் கொண்டிருப்பதில்லை. எக்ஸ்எம்எல் ஆவணத்திற்குள்ளான கட்டமைப்புகளைக் குறிப்பதற்கான சொற்களஞ்சியத்தை எக்ஸ்எம்எல் இன்ஃபோசெட் வழங்குகிறது, ஆனால் மீண்டும் இந்தத் தகவலை அணுகுவதற்கான எந்த வழிகாட்டுதலையும் வழங்குவதில்லை. எக்ஸ்எம்எல்லை அணுகுவதற்கான பல்வேறுவிதமான ஏபிஐகள் உருவாக்கப்பட்டு பயன்படுத்தப்பட்டு வருகின்றன என்பதோடு இவற்றில் சில தரநிலையாக்கப்பட்டுள்ளன.

எக்ஸ்எம்எல் நிகழ்முறைக்கென்று இருந்துவரும் ஏபிஐகள் பின்வரும் பிரிவுகளுக்குள்ளாக வருகின்றன:

  • புரோகிராமிங் மொழியிலிருந்து அணுகக்கூடியவையாக இருக்கும் ஓட்டப்போக்கு-சார்ந்த ஏபிஐகள், உதாரணத்திற்கு எஸ்ஏஎக்ஸ் மற்றும் எஸ்டிஏஎக்ஸ்.
  • புரோகிராமிங் மொழியிலிருந்து அணுகக்கூடியவையாக இருக்கும் ட்ரீ-டிராவர்ஸல் ஏபிஐகள், உதாரணம் டிஓஎம்.
  • எக்ஸ்எம்எல் டேட்டா பைண்டிங், இது எக்ஸ்எம்எல் ஆவணம் மற்று புரோகிராமிங்-மொழி ஆப்ஜெக்ட்களிடையே தானியக்க மொழிபெயர்ப்பை வழங்குகிறது.
  • எக்ஸ்எஸ்எல்டி மற்றும் எக்ஸ்குவரி போன்ற அறிவிப்பு மாற்றுதல் மொழிகள்.

ஓட்டபோக்கு-சார்ந்த வசதிகளுக்கும் ஒரு எக்ஸ்எம்எல் ஆவணத்தின் குறுகல் குறுக்கீட்டின் அடிப்படையில் அமைந்துள்ள குறிப்பிட்ட வேலைகளுக்கும் குறைவான நினைவுத்திறனே தேவைப்படுகிறது என்பதுடன் மற்ற மாற்றுக்களைக் காட்டிலும் வேகமானதாகவும் எளிதானதாகவும் இருக்கிறது. ட்ரீ-டிராவர்ஸல்களுக்கும் டேட்டா பைண்டிங் ஏபிஐகளுக்கும் மிக அதிகமான நினைவுத்திறன் பயன்பாடு தேவைப்படுகிறது, ஆனால் அவை தொடர்ந்து புரோகிராமர்களால் பயன்படுத்தப்படுவதற்கு வசதியானவைகளாக இருப்பதாக தெரிகின்றன; இவற்றில் சில எக்ஸ்பாத் வெளிப்படுத்தல்கள் வழியாக ஆவண பாகங்களின் அறிவிப்பு மீட்பை உள்ளிட்டிருக்கின்றன.

எக்ஸ்எஸ்எல்டி, எக்ஸ்எம்எல் ஆவண மாற்றித்தருதல்களின் அறிவிப்பு விளக்கத்திற்காக வரையறுக்கப்பட்டுள்ளன என்பதோடு சர்வர் சார்ந்த பேக்கேஜ்கள் மற்றும் வலைத்தள உலாவிகள் ஆகிய இரண்டிலும் பரவலாக அமல்படுத்தக்கூடியவையாக இருக்கின்றன. எக்ஸ்குவரி எக்ஸ்எஸ்எஸ்டிஐ அதனுடைய செயல்பாட்டில் மேற்கவியச் செய்கிறது, ஆனால் இது பெரிய எக்ஸ்எம்எல் தரவுத்தளங்களுக்கான தேடுதல்களுக்கென்றே பெரிதும் வடிவமைக்கப்படுகின்றன.

எக்ஸ்எம்எல்லுக்கான எளிய ஏபிஐ (எஸ்ஏஎக்ஸ்)தொகு

எஸ்ஏஎக்ஸ் என்பது தொடர்வரிசைப்படி படிக்கப்படுகின்ற ஒரு ஆவணத்திலுள்ள நிகழ்வு-இயக்கம் மற்றும் அதனுடைய உள்ளடக்கங்கள் பயனர் வடிவமைப்பினுடைய ஹேண்ட்லர் ஆப்ஜெக்டில் உள்ள பல்வேறு முறைகளுக்கான கால்பேக்குகளாக தெரிவிக்கப்படும் அகராதி ஆகும். எஸ்ஏஎக்ஸ் அமல்படுத்துவதற்கு வேகமானதும் பயன்மிக்கதுமாகும், ஆனால் ஆவணத்தின் எந்தப் பகுதி நிகழ்முறையாக்கப்படுகிறது என்பதை கண்டுகொள்வதுடன் பதிப்பாசிரியருக்கு சுமையை ஏற்படுத்தும் நோக்கமுள்ளது என்பதால் எக்ஸ்எம்எல்லில் இருந்து தற்போக்காக தகவலைப் பிரித்துப்பெறுவதற்கு பயன்படுத்த சி்க்கலானவை. சில வகையிலான தகவல்கள், அவை ஆவணத்தில் எங்கு தோன்றுகின்றன என்ற பொருட்டின்றி ஒரேவிதமான முறையில் கையாளப்படுகின்ற குறிப்பிட்ட விதத்திலான சூழ்நிலைகளுக்கு இவை நன்றாகப் பொருந்திப்போகின்றன.

புல் பார்ஸிங்தொகு

இண்டராக்டர் வடிவமைப்பு முறையைப் பயன்படுத்தி தொடர்வரிசைகளில் படிக்கப்படக்கூடிய தொடர் அம்சங்களாக ஆவணத்தை புல் பார்ஸிங்[11] கருதுகிறது. எக்ஸ்எம்எல் இலக்கணப்படுத்தப்படுவதன் கட்டமைப்பை இலக்கணபபடுத்தும் மிரர்களை செயல்படுத்தும் கோடின் கட்டமைப்போடும் ரிகர்ஸிவ்-டிஸண்ட் பர்சர்களை எழுதுவதற்கு இது உதவுகிறது என்பதுடன் இடைப்பட்ட இலக்கணப்படுத்தல் முடிவுகள் இந்த இலக்கணப்படுத்தலை செய்யும் முறைகளுக்குள்ளான உட்புற மாறுபாடுகளைப் பயன்படுத்தி அணுகக்கூடியவற்றிற்கு காரணமாகிறது அல்லது தாழ்நிலை முறைகளுக்குள்ளாக இலக்கணப்படுத்தப்படுகிறது (முறை பாராமீட்டர்களாக) அல்லது உயர்நிலை முறைகளுக்கு திரும்புகிறது (முறை திரும்பல் மதிப்புகளாக). ஜாவா நிரலாக்க மொழியில் எஸ்டிஏஎக்ஸ், பிஹெச்பி மற்றும் சிஸ்டத்தில் சிம்பிள் எக்ஸ்எம்எல் ஆகிய புல் பர்சர்கள் உதாரணங்களாகும் எக்ஸ்எம்எல். நெட் கட்டமைப்பில் இருக்கும் எக்ஸ்எம்எல் ரீடர்.

ஒரு புல் பர்சர் பல்வேறு ஆக்கக்கூறுகள், உள்ளீடுகள் மற்றும் எக்ஸ்எம்எல் ஆவணத்தில் உள்ள தரவு ஆகியவற்றை வரிசைகிரமமாக பார்க்கின்ற இடரேட்டரை உருவாக்குகிறது. இந்த 'இடரேட்டரைப்' பயன்படுத்தும் கோட் தற்போதைய அம்சத்தை (உதாரணத்திற்கு இது தொடக்க அல்லது முடிவு ஆக்கக்கூறா அல்லது உரையா என) பரிசோதிக்கிறது, அதனுடைய உள்ளீடுகளை (லோக்கல் நேம், நேம்ஸ்பேஸ், எக்ஸ்எம்எல் உள்ளீடுகளின் மதிப்புகள், உரையின் மதிப்பு, இன்னபிற) ஆய்வு செய்கிறது என்பதுடன் இடரேட்டரை அடுத்த அம்சத்திற்கும் கொண்டுசெல்கிறது. ஆவணத்திலிருந்து குறுக்கீடாய் இருக்கும் தகவலை கோட் இவ்வாறு பிரித்தெடுக்கிறது. இந்த ரிகர்ஸிவ்-டிஸண்ட் அணுகுமுறை பார்ஸிங் செய்யும் கோடில் உள்ள டைப் செய்யப்பட்ட லோகல் வேரியபிள்களை தனக்குள்ளாக வைத்துக்கொள்ளும் நோக்கம் கொண்டதாக இருக்கிறது, அதேசமயம் உதாரணத்திற்கு எஸ்ஏஎக்ஸ் பார்ஸிங் செய்யப்படும் ஆக்கக்கூறின் மூல ஆக்கக்கூறாக உள்ள ஆக்கக்கூறுகளின் குவிப்பிற்குள்ளாக இடைப்பட்ட தரவைத் கைமுறையாக தக்கவைக்க கோருகிறது. புல்-பார்ஸிங் கோட் எஸ்ஏஎக்ஸ் பர்ஸிங் கோடை புரிந்துகொண்டு தக்கவைப்பதைக் காட்டிலும் மிகவும் முன்னோக்கியதாக இருக்கிறது.

ஆவண ஆப்ஜெக்ட் மாதிரி (டிஓஎம்)தொகு

டிஓஎம் (ஆவண ஆப்ஜெக்ட் மாதிரி) என்பது ஆவணத்தின் உள்ளடக்கங்களை குறிப்பிடுகின்ற "நோட்" ஆப்ஜெக்ட்களின் மரத்தை பிரதிநிதித்துவம் செய்கின்ற மொத்த ஆவணத்தின் நகர்விற்கான அனுமதியை வழங்கும் இண்டர்ஃபேஸ் சார்ந்த அப்ளிகேஷன் புரோகிராமிங் இண்டர்ஃபேஸாக இருக்கிறது. ஒரு டிஓஎம் ஆவணம் பர்சரால் உருவாக்கப்படலாம் அல்லது பயனர்களால் (வரம்புகளுடன்) கைமுறையாக உருவாக்கப்படலாம். டிஓம் நோடுகளில் உள்ள டேட்டா டைப்கள் அரூபமானவை; அமலாக்கங்கள் அவற்றின் சொந்த நிரலாக்க மொழி-குறிக்கும் பைண்டிங்குகளை வழங்குகின்றன. டிஓஎம் அமலாக்கங்கள் நினைவக அடர்த்தியுள்ளவையாக இருக்கும் நோக்கமுள்ளவை, அவற்றிற்கு பொதுவாக முழு ஆவணமும் நினைவகத்திற்குள்ளாக ஏற்றப்பட வேண்டும் என்பதோடு அனுமதி வழங்கப்படும் முன்னர் ஆப்ஜெட்களின் மரமாக கட்டமைக்கப்படுகின்றன.

டேட்டா பைண்டிங்தொகு

ஏபிஐ ஐ எக்ஸ்எம்எல் நிகழ்முறையாக்கும் மற்றொரு வடிவம் எக்ஸ்எம்எல் டேட்டா பைண்டிங் ஆகும், ஆவண ஆப்ஜெக்ட் மாதிரி பர்சரால் உருவாக்கப்படும் ஜெனரிக் ஆப்ஜெக்ட்களுக்கு முரணாக மரபான படிநிலை, வலுவாக டைப் செய்யப்பட்ட பிரிவுகளாக எக்ஸ்எம்எல் டேட்டா கிடைக்கப்பெறுமிடத்தில் இவ்வாறு செய்யப்படுகிறது. இந்த அணுகுமுறை குறியீடு உருவாக்கத்தை எளிதாக்குகிறது என்பதுடன் பல நிகழ்வுகளிலும் செயல்நேரத்தைக் காட்டிலும் தொகுப்பு நேரத்திலேயே பிரச்சினைகளை அடையாளம் காண அனுமதிக்கிறது. எக்ஸ்எம்எல் பைண்டிங்கிற்கான ஜாவா கட்டுமானம் (ஜேஏஎக்ஸ்பி), .NET இல்[12] எக்ஸ்எம்எல் சீரியலைஸேஷன் மற்றும் C++க்கான CodeSynthesis XSD ஆகியவற்றை டேட்டா பைண்டிங் அமைப்புகளுக்கான உதாரணமாகக் கூறலாம்.[13][14]

டேட்டா டைப்பாக எக்ஸ்எம்எல்தொகு

எக்ஸ்எம்எல் மற்ற மொழிகளில் முதல் தர டேட்டா டைப்பாக தோன்றத் தொடங்கின. இசிஎம்ஏஸ்கிரிப்ட்/ஜாவாஸ்கிரிப்ட் மொழிக்கான எக்ஸ்எம்எல்லிற்கான இசிஎம்ஏஸ்கிரிப்ட் (இ4எக்ஸ்) நீட்டிப்பு ஜாவாஸ்கிரிப்டிற்கான இரண்டு முக்கிய ஆப்ஜெக்ட்களை (எக்ஸ்எம்எல் மற்றும் எக்ஸ்எம்எல்லிஸ்ட்) வெளிப்படையாக குறிப்பிடுகிறது, இது எக்ஸ்எம்எல் ஆவண நோடுகள் மற்றும் எக்ஸ்எம்எல் ஆவணப் பட்டியல்களை வேறுபட்ட ஆப்ஜெக்ட்களாக ஏற்கிறது என்பதுடன் டாட்-நோட்டேஷன் குறிப்பிடும் பெற்றோர்-குழந்தை உறவுகளைப் பயன்படுத்துகிறது. இ4எக்ஸ் மொஸில்லா 2.5+ உலாவிகள் மற்றும் அடோப் ஆக்சன்ஸ்கிரிப்ட் ஆகியவற்றால் ஏற்கப்படுகிறது, ஆனால் பொதுப்படையானதாக ஏற்றுக்கொள்ளப்படவில்லை. மைக்ரோசாப்ட் .நெட் 3.5 மற்றும் அதற்கு மேற்பட்ட வடிவங்களுக்கான அமலாக்கங்களுக்கு மைக்ரோசாப்டின் எல்ஐஎன்க்யு இல் இதேபோன்ற நொட்டேஷன் பயன்படுத்தப்படுகிறது, அதேசமயம் 2005 ஆம் ஆண்டில் உருவாக்கப்பட்ட எக்ஸ்ஜே ஜாவாவிற்கான எக்ஸ்எம்எல் டேட்டா ஆப்ஜெக்டின் ஐபிஎம் அமலாக்கமாகும். எக்ஸ்எம்எல் கையாளுதற்கான சிறப்பு அம்சங்களுடன் உள்ள லினக்ஸ் போன்ற வரைச்சட்டகத்தை வழங்கும் ஓபன்-சோர்ஸான எக்ஸ்எம்எல்எஸ்ஹெச் பயன்பாடு இதேபோன்று எக்ஸ்எம்எல்லை <[ ]> நொட்டேஷனைப் பயன்படுத்தும் டேட்டா டைப்பாக நடத்துகிறது.[15]

வரலாறுதொகு

எக்ஸ்எம்எல் என்பது மிகப்பெரிய ஐஎஸ்ஓ தரநிலையான எஸ்ஜிஎம்எல் இன் சுயவிவரம் அல்லது மறுதிருத்தமாகும்.

திறன்மிக்க தகவல் காட்சிப்படுத்தலுக்கான எஸ்ஜிஎம்எல் இன் பலதிறன்கொண்ட செயல்பாடு இணையத்தளத்தின் வளர்ச்சிக்கு முந்தைய, 1980 ஆம் ஆண்டுகளின் முந்தைய டிஜிட்டல் மீடியா பப்ளிஷர்களால் புரிந்துகொள்ளப்பட்டிருந்தது.[16][17] 1990 ஆம் ஆண்டுகளின் மத்தியில் எஸ்ஜிஎம்எல் கையாளுநர்களுள் சிலர் அதன்பின்னர் புதியதாகிவிட்ட உலகளாவிய வலைத்தளத்துடனான அனுபவத்தைப் பெற்றனர் என்பதோடு வலைத்தளம் வளர்ச்சியடைகையில் அது எதிர்கொள்ளும் சில பிரச்சினைகளுக்கான தீர்வுகளையும் எஸ்ஜிஎம்எல் வழங்கும் என்றும் நம்பினர். டான் கான்னலி 1995 ஆம் ஆண்டில் டபிள்யு3சியில் சேர்ந்தபோது அதனுடைய நடவடிக்கைகளின் பட்டியலோடு எஸ்ஜிஎம்எல்லை சேர்த்தார்; மைக்ரோசிஸ்டம்ஸின் என்ஜினியரான ஜோன் போஸக் தனியுரிமை ஒன்றை உருவாக்கி உடனுழைப்பாளர்களை வேலைக்கமர்த்தியபோது இதற்கான பணிகள் 1996 ஆம் ஆண்டின் மத்தியப் பகுதியில் தொடங்கின. எஸ்ஜிஎம்எல் மற்றும் வலைத்தளம் ஆகிய இரண்டிலும் அனுபவம் பெற்ற சிறிய குழுவினருடன் போஸக் நல்லமுறையில் தொடர்புகொண்டிருந்தார்.[18]

எக்ஸ்எம்எல் ஏழு உறுப்பினர்கள்[19] கொண்ட வேலைக் குழுவால் தொகுக்கப்பட்டு ஆர்வமுள்ள 150 உறுப்பினர்களால் உதவியளிக்கப்பட்டது. ஆர்வம்கொண்ட குழுவினரின் அஞ்சல் பட்டியலில் தொழில்நுட்ப விவாதம் நடத்தப்பட்டது, பிரச்சனைகள் ஒருமனதான கருத்தின் மூலம் தீர்க்கப்பட்டன, அவை செயல்படாதபோது வேலைக் குழுவின் பெரும்பான்மை வாக்குகளின் அடிப்படையில் தீர்க்கப்பட்டன. வடிவமைப்பு முடிவுகளின் பதிவு மற்றும் அவற்றின் பகுப்புக்கள் 1997 ஆம் ஆண்டு டிசம்பர் 4 இல் மைக்கேல் ஸ்பெர்பர்க்-மெக்குயினால் தொகுக்கப்பட்டன.[20] ஜேம்ஸ் கிளார்க் வேலைக்குழுவின் தொழில்நுட்ப தலைவராக செயல்பட்டார், வெற்று-ஆக்கக்கூறான "<empty/>" வாக்கிய அமைப்பு மற்றும் "எக்ஸ்எம்எல்" என்ற பெயரிற்கு குறிப்பிடத்தகுந்த அளவிற்கு பங்களித்துள்ளார். பரிசீலனைக்கு உள்ளிடப்பட்ட மற்ற பெயர்கள் "எம்ஏஜிஎம்ஏ" (மினிமல் ஆர்க்கிடெக்சர் ஃபார் ஜெனரலைஸ்டு மார்க்அப் அப்ளிகேஷன்ஸ்), "எஸ்எல்ஐஎம்" (ஸ்ட்ரக்சர்டு லாங்குவேஜ் ஃபார் இண்டர்நெட் மார்க்அப்) மற்றும் "எம்ஜிஎம்எல்" (மினிமல் ஜெனரலைஸ்டு மார்க்அப் லாங்குவேஜ்) ஆகியவற்றை உள்ளிட்டிருந்தன. வரையறையின் இணை-ஆசிரியர்கள் உண்மையில் டிம் பிரே மற்றும் மைக்கேல் ஸ்பெர்பர்க்-மெக்குயின் ஆகியோராவர். இந்தத் திட்டப்பணி பாதியில் இருக்கும்போது மைக்ரோசாப்டின் பெரும் ஆர்ப்பாட்டத்தையும் தாண்டி நெட்ஸ்கேப் உடன் ஆலோசனையில் ஈடுபடுதற்கு பிரே ஒப்புதல் அளித்தார். பிரே தற்காலிகமாக எடிட்டோரியல்ஷிப்பிலிருந்து விலகிக்கொள்ள கேட்டுக்கொள்ளப்பட்டார். இது வேலைக் குழுவினரிடையே தீவிர விவாதத்திற்கு வழிவகுத்தது, மைக்ரோசாப்டின் ஜேன் பாவ்லி மூன்றாவது இணையாசிராக சேர்க்கப்பட்டதன் மூலம் ஏறத்தாழ இந்தப் பிரச்சனை தீர்க்கப்பட்டது.

எக்ஸ்எம்எல் வேலைக்குழு நேருக்கு நேராக சந்தித்துக்கொண்டதே இல்லை; இந்த வடிவமைப்பு மின்னஞ்சல் மற்றும் வாராந்திர தொலைபேசி கூட்டங்களைப் பயன்படுத்தி செய்துமுடிக்கப்பட்டது. முக்கியமான வடிவமைப்பு முடிவுகள் 1996 ஆம் ஆண்டில் ஜூலை மற்றும் நவம்பருக்கு இடையே செய்யப்பட்ட கடுமையான இருபது வார முடிவில், எக்ஸ்எம்எல் ஸ்பெசிபிகேஷனின் முதல் வேலை வரையறை பதிப்பிக்கப்பட்டபோது எட்டப்பட்டன.[21] மேற்கொண்டு வடிவமைப்பு வேலைகள் 1997 ஆம் ஆண்டு முழுவதும் செய்யப்பட்டன என்பதோடு, 1998 ஆம் ஆண்டு பிப்ரவரி 10 இல் எக்ஸ்எம்எல் 1.0 டபிள்யு3சியின் பரிந்துரையானது.

எக்ஸ்எம்எல் 1.0 இணையத்தள பயன்பாடு, பொது நோக்க பயன்பாடு, எஸ்ஜிஎம்எல் ஒத்திசைவு, நிகழ்முறையாக்க மென்பொருளின் சுலபமான உருவாக்கத்தின் வசதியேற்படுத்தல், தேர்வுநிலை அம்சங்களின் குறைவுபடுத்தல், தெளிவு, சம்பிரதாயம், ஒருமனதான போக்கு மற்றும் ஆசிரியத்துவத்தின் சுலபத்தன்மை ஆகியவற்றிற்கான வேலைக்குழுவின் இலக்குகளை எட்டியது.

இதனுடைய முன்னோடியான எஸ்ஜிஎம்எல்லைப் போன்று சில தேவைக்கு அதிகமான சின்டக்டிக் கட்டமைப்புகளை அனுமதிக்கிறது என்பதுடன் ஆக்கக்கூறு அடையாளம் காண்பவற்றின் மறுநிகழ்வையும் சேர்த்துக்கொண்டுள்ளது. இந்த முறைகளில், சுருக்கமாக தெளிவுபடக் கூறுதல் இதனுடைய கட்டமைப்பி்ல் அத்தியாவசியமானதாக கருதப்படுவதில்லை.

ஆதாரங்கள்தொகு

எக்ஸ்எம்எல் என்பது ஐஎஸ்ஓ தரநிலையுள்ள எஸ்ஜிஎம்எல் இன் சுருக்க ஆக்கமாகும், என்பதோடு பெரும்பாலான எக்ஸ்எம்எல்கள் மாற்றமடையாத எஸ்ஜிஎம்எல் இல் இருந்து வந்துள்ளன. எஸ்ஜிஎம்எல் இல் இருந்து தர்க்கரீதியான மற்றும் பௌதீக கட்டமைப்புகளின் பிரிவு (ஆக்கக்கூறுகள் மற்றும் தனியுடைமைகள்), இலக்கணம் அடிப்படையிலானவற்றின் இருப்பு (டீடிடீக்கள்), டேட்டா மற்றும் மெட்டாடேட்டாவின் பிரிவு (ஆக்கக்கூறுகளும் உள்ளீடுகளும்), கலப்பு உள்ளடக்கம், பிரதிநிதித்துவத்திலிருந்து நிகழ்முறையாக்கத்தின் பிரிப்பு (நிகழ்முறையாக்க அறிவுறுத்தல்கள்), மற்றும் இயல்பாக்க ஆங்கிள்-பிராக்கெட் வாக்கிய அமைப்பு ஆகியவை வருகின்றன. எஸ்ஜிஎம்எல் அறிவிப்பு நீக்கப்பட்டிருக்கிறது (எக்ஸ்எம்எல்) நிலையான டெலிமீட்டர் தொகுதியைக் கொண்டிருக்கிறது என்பதுடன் ஆவண பண்புரு தொகுதியாக யுனிகோடை ஏற்றுக்கொண்டுள்ளது).

எக்ஸ்எம்எல்லுக்கான மற்ற தொழில்நுட்ப மூலாதாரங்கள் 'மாற்றித்தருதல் வாக்கிய அமைப்பாக' பயன்படுத்துவதற்கான எஸ்ஜிஎம்எல்லின் சுயவிவரத்தை விளக்கும் டெக்ஸ்ட் என்கோடிங் இனிஷியேட்டிவ் (டிஇஐ); ஆக்கக்கூறுகள் தங்களுடைய மூலாதாரங்களுடன் ஒத்திசைவாக்கம் செய்துகொள்ளும் ஹெச்டிஎம்எல், ரிசோர்ஸ் என்கோடிங்கில் இருந்து ஆவண பண்புரு தொகுப்பின் பிரிப்பு, எக்ஸ்எம்எல்:லாங் பிரிப்பு, இணைப்பின் அறிவிப்பில் தேவைப்படுவதைக் காட்டிலும் மூலாதாரங்களை சேர்த்துக்கொள்ளும் மெட்டாடேட்டாவான ஹெச்டிடிபி கருத்தாக்கம். சீனா/ஜப்பான்/கொரியா ஆவண நிகழ்முறையாக்க நிபுணத்துவ குழுவோடு தொடர்புடைய ஐஎஸ்ஓ-சார்ந்த எஸ்பிஆர்இஏடி (ஸ்டாண்டர்டைசேஷன் புராஜக்ட் ரிகார்டிங் ஈஸ்ட் ஏசியன் டாகுமெண்ட்) திட்டப்பணியின் எக்ஸ்டண்டட் ரெஃப்ரண்ஸ் கான்க்ரீட் சின்டக்ஸ் (இஆர்சிஎஸ்) திட்டம் எக்ஸ்எம்எல் 1.0 இன் பெயரிடும் விதிகளின் அடிப்படையில் அமைந்துள்ளது; எஸ்பிஆர்இஏடி ஹெக்ஸாடெசிமல் எண்ணியல் பண்புரு குறிப்புகள் மற்றும் யுனிகோட் பண்புருக்கள் அனைத்தையும் கிடைக்கச்செய்வதற்கான பார்வைக்குறிப்பு கருத்தாக்கம் ஆகியவற்றையும் உருவாக்கியிருக்கிறது. இஆர்சிஎஸ், எக்ஸ்எம்எல் மற்றும் ஹெச்டிஎம்எல் ஆகியவற்றிற்கு நல்ல முறையில் உதவுவதற்காக, எஸ்ஜிஎம்எல் தரநிலையான ஐஎஸ் 8879 வெப்எஸ்ஜிஎம்எஸ் தழுவல்களுடன் 1996 மற்றும் 1998 ஆம் ஆண்டுகளில் திருத்தப்பட்டிருக்கின்றன. எக்ஸ்எம்எல்லின் ஹெடர் ஐஎஸ்ஓவின் ஹைடைமை பின்பற்றுகிறது.

விவாதங்களின்போது எக்ஸ்எம்எல்லில் உருவாக்கப்பட்ட நவீனத்துவமான கருத்தாக்கங்கள் என்கோடிங் டிடெக்சன் மற்றும் என்கோடிங் ஹெடருக்கான அல்கோரிதம், நிகழ்முறையாக்க அறிவுறுத்தல் இலக்கு, எக்ஸ்எம்எல்:ஸ்பேஸ் உள்ளீடு மற்றும் வெற்று-ஆக்கக்கூறு டேக்கிற்கான புதிய டெலிமீட்டர் ஆகியவற்றை உள்ளி்ட்டிருக்கிறது. மதிப்பிடுதலுக்கு (ஸ்கீமா இல்லாமல் பார்ஸிங்கை செயல்பட அனுமதிப்பது) எதிரான நன்கு-வடிவமைத்திருத்தல் என்ற கருத்தாக்கம் முதலில் எக்ஸ்எம்எல்லில்தான் உருவாக்கப்பட்டது, இருப்பினும் இது மின்னணு புத்தகத் தொழில்நுட்பமான "டைனாடெக்ஸ்டில்"[22] வெற்றிகரமாக அமலாக்கம் செய்யப்பட்டது; இந்த மென்பொருள் வாட்டர்லூ பல்கலைக்கழக நியூ ஆக்ஸ்போர்டு ஆங்கில அகராதி திட்டம்; டோக்கியோ, யுனிஸ்கோப்பில் உள்ள ஆர்ஐஎஸ்பி எல்ஐஎஸ்பி எஸ்ஜிஎம்எல் டெக்ஸ்ட் பிராசஸர்; அமெரிக்க ராணுவ ஆயுத கட்டளைமைய ஐஏடிஎஸ் ஹைபர்டெக்ஸ்ட் சிஸ்டம்; மென்டர் கிராபிக்ஸ் கான்டெக்ஸ்ட்; இண்டர்லீஃப் மற்றும் ஜெராக்ஸ் பப்ளிஷிங் சிஸ்டம் ஆகியவற்றிலிருந்து வந்திருக்கிறது.

பதிப்புகள்தொகு

தற்போது இரண்டு எக்ஸ்எம்எல் பதிப்புக்கள் உள்ளன. முதலாவது 1998 ஆம் ஆண்டில் தொடக்கநிலையில் வரையறுக்கப்பட்ட எக்ஸ்எம்எல் 1.0 . அதுமுதல் புதிய பதிப்பு எண் வழங்கப்படாமலேயே இது சிறிய திருத்தங்களுக்கு உட்பட்டு வந்திருக்கிறது என்பதுடன் 2008 ஆம் ஆண்டு நவம்பர் 26 இல் புதுபிக்கப்பட்டது, இது தற்போது ஐந்தாவது பதிப்பாக இருக்கிறது. இது பரவலாக அமல்படுத்தப்பட்டு பொதுப்பயன்பாட்டிற்காக இப்போதும் பரிந்துரைக்கப்படுகிறது.

எக்ஸ்எம்எல் 1.1 என்ற இரண்டாவது பதிப்பு, தொடக்கமாக 2004 ஆம் ஆண்டு பிப்ரவரி 4 இல் பதிப்பிக்கப்பட்டது, அதேநாளில் எக்ஸ்எம்எல்லின் மூன்றாவது பதிப்பும்[23] தற்போதும் அதனுடைய இரண்டாவது பதிப்பில் இருப்பதுமான எக்ஸ்எம்எல் 1.0 2006 ஆம் ஆண்டு ஆகஸ்ட் 16 இல் பதிப்பிக்கப்பட்டது. குறிப்பிட்ட நிலைகளில் எக்ஸ்எம்எல்லை சுலபமாகப் பயன்படுத்தும் நோக்கத்தோடு இது சிறப்பம்சங்களை உள்ளிட்டிருக்கிறது[24] - முக்கியமாக இபிசிடிஐசி பிளாட்ஃபார்ம்களில் பயன்படுத்துவதற்கான லைன்-கோடிங் பண்புருக்களை பயன்படுத்த முடிகிறது என்பதோடு யுனிகோட் 3.2 இல் இல்லாத பண்புருக்களின் எழுத்துவடிவங்களையும் பயன்படுத்தி்க்கொள்ள முடிகிறது. எக்ஸ்எம்எல் 1.1 மிகப்பரவலாக அமல்படுத்தப்படவில்லை என்பதோடு இதனுடைய பிரத்யேகமான அம்சங்கள் தேவைப்படுபவர்கள் மட்டும் பயன்படுத்துவதற்கென்று பரிந்துரைக்கப்படுகிறது.[25]

இதனுடைய ஐந்தாவது பதிப்பு வெளியீட்டிற்கு முன்னர், ஆக்கக்கூறுகள் மற்றும் உள்ளீட்டுப் பெயர்கள் மற்றும் பிரத்யேக அடையாளம் காண்பவைகள் ஆகியவற்றிற்கான பண்புருக்களை கிடைக்கச் செய்வதற்கான கடுமையான விதிகளோடு எக்ஸ்எம்எல் 1.1 இல் இருந்து எக்ஸ்எம்எல் 1.0 மாறுபடுகிறது: எக்ஸ்எம்எல் 1.0 இன் முதல் நான்கு பதிப்புக்களில் இந்தப் பண்புருக்கள் யுனிகோட் ஸ்டாண்டர்டின் (யுனிகோட் 2.0 முதல் யுனிகோட் 3.2 வரை) குறிப்பிட்ட வடிவத்தைப் பயன்படுத்தி நேரடியாக கணக்கிடப்பட்டிருக்கின்றன. முதல் பதிப்பு ஃயூச்சர்-புரூஃபாக இருக்கும் எக்ஸ்எம்எல் 1.1 இன் இயக்கவியலுக்கு மாற்றாக அமைந்தது ஆனால் தேவைக்கு அதிகமானவற்றைக் குறைத்தது. எக்ஸ்எம்எல் 1.0 ஐந்தாவது பதிப்பு மற்றும் எக்ஸ்எம்எல் 1.1 இன் எல்லாப் பதிப்புக்களிலும் பெயர்களில் கைவிடப்படும் குறிப்பிட்ட பண்புருக்கள் என்ற அணுகுமுறை மேற்கொள்ளப்பட்டது, அத்துடன் எதிர்கால யுனிகோட் பதிப்புக்களில் பொருத்தமான பெயர் பண்புருக்களின் பயன்பாட்டிற்கு வசதியேற்படுத்தித் தரும் விதத்தில் எல்லாமும் அனுமதிக்கப்பட்டன. ஐந்தாவது பதிப்பில் எக்ஸ்எம்எல் பெயர்கள் யுனிகோட் 3.2 இல் இருந்து யுனிகோடில் சேர்க்கப்பட்டுள்ள மற்றவற்றோடு பாலினெஸ், சாம் அல்லது ஃபொனீசியன் எழுத்து வடிவங்கள் உள்ளிடப்பட்டிருக்கின்றன.

கிட்டத்தட்ட எந்த யுனிகோட் விஷயத்தையும் பண்புருத் தரவு மற்றும் எக்ஸ்எம்எல் 1.0 அல்லது 1.1 ஆவணத்தின் உள்ளீட்டு மதிப்போடு பயன்படுத்த முடியும் என்பதோடு பண்புருவானது கோட் பாய்ண்டுடன் தொடர்புடையதாக இருந்தாலும்கூட அது தற்போதைய யுனிகோட் பதிப்பில் வரையறுக்கப்படவில்லை. பண்புருத் தரவு மற்றும் உள்ளீட்டு மதிப்புக்களில், எக்ஸ்எம்எல் 1.1 எக்ஸ்எம்எல் 1.0 ஐக் காட்டிலும் அதிக கட்டுப்பாட்டு பண்புருக்களை அனுமதிக்கிறது, ஆனால் "வலிமைத்திறனுக்கு" எக்ஸ்எம்எல் 1.1 இல் அறிமுகப்படுத்தப்பட்டுள்ள பெரும்பாலான கட்டுப்பாட்டு பண்புருக்கள், குறிப்பாக எண்ணியல் பண்புரு குறிப்பிடப்பட வேண்டும். எக்ஸ்எம்எல் 1.1 இல் உள்ள உதவியளிக்கும் கட்டுப்பாட்டு பண்புருக்களுக்கிடையே ஒயிட்ஸ்பேஸாக கருதப்பட வேண்டிய இரண்டு லைன் பிரேக் கோட்கள் இருக்கின்றன. ஒயிட்ஸ்பேஸ் பண்புருக்கள் மட்டுமே நேரடியாக எழுதப்படக்கூடிய ஒரே கட்டுப்பாட்டு குறியீடுகளாகும்.

எக்ஸ்எம்எல் 2.0 குறித்து விவாதங்கள் நடைபெற்று வருகின்றன, இருப்பினும் எந்த நிறுவனமும் இதுபோன்ற திட்டப்பணிக்கான திட்டங்களை வைத்திருப்பதாக அறிவிக்கவில்லை. எக்ஸ்எம்எல்-எஸ்டபிள்யு (எஸ்டபிள்யு-ஸ்கன்க் ஒர்க்ஸ்), எக்ஸ்எம்எல்லின் அசல் உருவாக்குநர்களுள் ஒருவரால் எழுதப்பட்ட இது எக்ஸ்எம்எல் 2.0 எவ்வாறு இருக்கும் என்பது குறித்த சில முன்மொழிவுகளை உள்ளிட்டிருக்கிறது: வாக்கிய அமைப்பிலிருந்து டீடிடீக்களின் நீக்கம், நேம்ஸ்பேஸ்களின் ஒருங்கிணைப்பு, பேஸ் ஸ்டாண்டர்டிற்குள்ளான எக்ஸ்எம்எல் பேஸ் மற்றும் எக்ஸ்எம்எல் இன்ஃபர்மேஷன் தொகுதி (இன்ஃபோசெட்).

உலகளாவிய வலைத்தள கூட்டமைப்பு, எக்ஸ்எம்எல் இன்ஃபோசெட்டின் பைனரி என்கோடிங்கிற்கான நிகழ்வுகள் மற்றும் உடைமைப்பொருள்களுக்குள்ளான தொடக்கநிலை ஆராய்ச்சிகளை மேற்கொண்டுவரும் எக்ஸ்எம்எல் பைனரி கேரக்டரைசேஷன் ஒர்க்கிங் குரூப்பையும் கொண்டிருக்கிறது. இந்த வேலைக்குழு அதிகாரப்பூர்வமான தரநிலைகள் எதையும் உருவாக்குவதற்கென்று அமைக்கப்படவில்லை. எக்ஸ்எம்எல் வரையறையின் அடிப்படையில் உரை அடிப்படையில் அமைந்திருப்பதால், ஐடியு-டி மற்றும் ஐஎஸ்ஓ ஆகியவை குழப்பத்தைத் தவிர்ப்பதற்கு தங்களுடைய சொந்த பைனரிக்கான ஃபாஸ்ட் இன்ஃபோசெட் பெயரைப் பயன்படுத்துகின்றன (பார்க்க ஐடியு-டி ஆர்இசி. எக்ஸ்.891 | ஐஎஸ்ஓ/ஐஇசி 24824-1).

பார்வைக் குறிப்புகள்தொகு

  1. "W3C® DOCUMENT LICENSE".
  2. 2.0 2.1 "XML 1.0 Origin and Goals". பார்த்த நாள் July 2009.
  3. "XML Applications and Initiatives".
  4. "Introduction to iWork Programming Guide. Mac OS X Reference Library". Apple.
  5. "Characters vs. Bytes".
  6. "Autodetection of Character Encodings".
  7. இது அனுமதிக்கப்பட்டிருக்கிறது, ஆனால் எக்ஸ்எம்எல் தனியுடைமை மதிப்புக்களில் "<" ஐப் பயன்படுத்துவதற்கு பரிந்துரைக்கப்படவில்லை: எக்ஸ்டென்சிபிள் மார்க்அப் லாங்குவேஜ் (எக்ஸ்எம்எல்) 1.0 (ஐந்தாவது பதிப்பு): தனியுடைமை மதிப்பு வரையறை
  8. "W3C I18N FAQ: HTML, XHTML, XML and Control Codes".
  9. "Articles tagged with “draconian”".
  10. "xml-dev — Fw: An I-D for text/xml, application/xml, etc". Lists.xml.org (2004-07-25). பார்த்த நாள் 2009-07-31.
  11. புஷ், புல், நெக்ஸ்ட்! XML.com இல் பாப் டுசார்ம்
  12. "XML Serialization in the .NET Framework". Msdn.microsoft.com. பார்த்த நாள் 2009-07-31.
  13. "An Introduction to XML Data Binding in C". Artima.com (2007-05-04). பார்த்த நாள் 2009-07-31.
  14. "CodeSynthesis XSD — XML Data Binding for C". Codesynthesis.com. பார்த்த நாள் 2009-07-31.
  15. http://www.xmlsh.org/CoreSyntax
  16. Bray, Tim (February 2005). "A conversation with Tim Bray: Searching for ways to tame the world’s vast stores of information". Association for Computing Machinery's "Queue site". பார்த்த நாள் April 16 2006.
  17. edited by Sueann Ambron and Kristina Hooper ; foreword by John Sculley. (1988). "Publishers, multimedia, and interactivity". Interactive multimedia. Cobb Group. பன்னாட்டுத் தரப்புத்தக எண்:1-55615-124-1. 
  18. Eliot Kimber (2006). "XML is 10".
  19. வேலைக்குழு உண்மையில் "எடிட்டோரியல் ரிவ்யூ போர்ட்" என்றே அழைக்கப்பட்டது. அசலான உறுப்பினர்கள் மற்றும் முதல் பதிப்பு நிறைவுபெறும் முன்னர் சேர்க்கப்பட்ட ஏழுபேர் ஆகியோர் at http://www.w3.org/TR/1998/REC-xml-19980210 இல், எக்ஸ்எம்எல்லின் முதல் பதிப்பு முடிவுறும் நேரத்தில் சேர்த்துக்கொள்ளப்பட்டனர்.
  20. "Reports From the W3C SGML ERB to the SGML WG And from the W3C XML ERB to the XML SIG". W3.org. பார்த்த நாள் 2009-07-31.
  21. "Extensible Markup Language (XML)". W3.org (1996-11-14). பார்த்த நாள் 2009-07-31.
  22. Jon Bosak, Sun Microsystems (2006-12-07). "Closing Keynote, XML 2006". 2006.xmlconference.org. பார்த்த நாள் 2009-07-31.
  23. எக்ஸ்டென்சிபிள் மார்க்அப் லாங்குவேஜ் (எக்ஸ்எம்எல்) 1.0 (மூன்றாவது பதிப்பு)
  24. "Extensible Markup Language (XML) 1.1 (Second Edition) – Rationale and list of changes for XML 1.1". W3C. பார்த்த நாள் 2006-12-21.
  25. Harold, Elliotte Rusty (2004). Effective XML. Addison-Wesley. பக். 10–19. பன்னாட்டுத் தரப்புத்தக எண்:0321150406. http://www.cafeconleche.org/books/effectivexml/. 

வெளி இணைப்புகள்தொகு

"https://ta.wikipedia.org/w/index.php?title=எக்ஸ்எம்எல்&oldid=3002529" இருந்து மீள்விக்கப்பட்டது