மொழித் தொகுப்பு: திருத்தங்களுக்கு இடையிலான வேறுபாடு

உள்ளடக்கம் நீக்கப்பட்டது உள்ளடக்கம் சேர்க்கப்பட்டது
விக்கி
வரிசை 3:
==வரலாறு==
 
ஆங்கில மொழிக்கான [[பிரௌன் தொகுப்பு]] என்னும் ஒரு மொழிவழக்குத் தொகுப்பை என்றி குச்சேராவும் நெல்சன் பிரான்சிசும் (Henry Kucera and Nelson Francis) ஆய்வு செய்து 1967 இல் ஓர் ஆய்வுக்கட்டுரை எழுதினார்கள். இதுவே மொழித்தொகுப்பு இயலின் துவக்கம். இந்த பிரௌன் தொகுப்பை அமெரிக்காவில் உள்ள ரோட்' ஐலண்டு என்னும் மாநிலத்தில் அமைந்துள்ள பிரௌன் பல்கலைக்கழத்தில் பணியாற்றிய என்றி குச்சேராவும் நெல்சன் பிரான்சிசும் உருவாக்கினார்கள். இவர்கள் 1961 இல் அமெரிக்காவில் அமெரிக்க ஆங்கிலத்தில் எழுதிய வெவ்வேறு படைப்புகள் 1000ஐத் தேர்ந்து அவற்றில் அவற்றில் இருந்து ஒரு மில்லியன் சொற்கள் (1,014,312 சொற்கள்) அடங்கிய ஆங்கில மொழி வழக்குத் தொகுப்பு ஒன்றை உருவாக்கினார்கள்.
 
இதனைத் தொடர்ந்து பிறபல ஆங்கிலமொழித் தொகுப்புகள் வரத்தொடங்கின. பிரித்தானிய காலின்சு பதிப்பகத்தார் பிரித்தானிய, அமெரிக்க ஆத்திரேலிய வழக்குகளையும் உள்ளடக்கிய COBUILD அல்லது
பாங்க் ஆவ் இங்கிலீசு (Bank of English) என்னும் தொக்குப்பை உருவாக்கி அதனடிப்படையில் ஆங்கிலத்தை வெளிநாட்டு மொழியாகப் பயிவோருக்கு ஏற்ற அகராதி ஒன்ரையும் படைத்தார்கள். சர்வே ஆவ் இங்கிலீசு யூசேச் (Survey of English Usage, இங்கிலீசு வழக்கு தொகுநோக்கு) என்னும் மொழித்தொகுப்பின் அடிப்படையில் ஆங்கில மொழியின் இலக்கணத்தை குவிர்க்கும் (Quirk) மற்றவர்களும் 1985 இல் வெளியிட்டதும் ஒரு மைல் கல் <ref>Quirk, R., Greenbaum, S., Leech, G. and Svartvik, J. ''A Comprehensive Grammar of the English Language'' London: Longman. 1985.</ref>.
பிரௌன் தொகுப்பைப் போலவே பிரித்தானிய ஆங்கிலத்துக்கு லங்க்காசுட்டர்-ஆசுலோஒ-பெர்கென் தொகுப்பு (Lancaster-Oslo-Bergen Corpus) எனப்படும் எல்-ஓ-பி தொகுப்பும் (LOB Corpus),
இந்திய ஆங்கிலத்துக்கு கோலாப்பூர் தொகுப்பும், நியூசிலாந்து ஆங்கிலத்துக்கு வெலிங்க்டன் தொகுப்பும், ஆத்திரேலிய ஆங்கிலத்துக்கு ஆத்திரேலியத் தொகுப்பும் என பல உருவாகின. பிரித்தானிய நாட்டகத்திய தொகுப்பு (British National Corpus) என்னும் தொகுப்பில் 100 மில்லியன் சொற்களுக்கும் கூடுதலாக இருப்பதுடன் பேச்சு வழக்கும் ஒலிப்பதிவாக உள்ளது. இதே போல அமெரிக்க ஆங்கிலத்துக்கு தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு (Corpus of Contemporary American English) 400 மில்லியன் சொற்களுக்கு கூடுதலாக உள்ள ஒன்று. இப்பொழுது ஒரு பில்லியனுக்கும் கூடுதலான சொற்கள் அடங்கிய தொகுப்புகள் உள்ளன.
 
==அடிக்குறிப்புகளும் மேற்கோள்களும் ==
"https://ta.wikipedia.org/wiki/மொழித்_தொகுப்பு" இலிருந்து மீள்விக்கப்பட்டது