மொழித் தொகுப்பு: திருத்தங்களுக்கு இடையிலான வேறுபாடு
உள்ளடக்கம் நீக்கப்பட்டது உள்ளடக்கம் சேர்க்கப்பட்டது
→வரலாறு: விரிவு |
|||
வரிசை 9:
பிரௌன் தொகுப்பைப் போலவே பிரித்தானிய ஆங்கிலத்துக்கு லங்க்காசுட்டர்-ஆசுலோஒ-பெர்கென் தொகுப்பு (Lancaster-Oslo-Bergen Corpus) எனப்படும் எல்-ஓ-பி தொகுப்பும் (LOB Corpus),
இந்திய ஆங்கிலத்துக்கு கோலாப்பூர் தொகுப்பும், நியூசிலாந்து ஆங்கிலத்துக்கு வெலிங்க்டன் தொகுப்பும், ஆத்திரேலிய ஆங்கிலத்துக்கு ஆத்திரேலியத் தொகுப்பும் என பல உருவாகின. [[பிரித்தானிய நாட்டகத்திய தொகுப்பு]]<ref>[http://www.natcorp.ox.ac.uk/ பிரித்தானிய நாட்டகத்திய தொகுப்பு (British National Corpus)]</ref>(British National Corpus) என்னும் தொகுப்பில் 100 மில்லியன் சொற்களுக்கும் கூடுதலாக இருப்பதுடன் பேச்சு வழக்கும் ஒலிப்பதிவாக உள்ளது. இதே போல அமெரிக்க ஆங்கிலத்துக்கு ''கோக்கா'' (COCA) என்று அழைக்கப்படும் [[தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு]]<ref>[http://www.americancorpus.org/ தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு (Corpus of Contemporary American English)]</ref>(Corpus of Contemporary American English) 400 மில்லியன் சொற்களுக்கு கூடுதலாக உள்ள ஒன்று. இப்பொழுது ஒரு பில்லியனுக்கும் கூடுதலான சொற்கள் அடங்கிய தொகுப்புகள் உள்ளன.
[[பிரான்சிய மொழி]]க்கு 1971 இல் துவக்கிய மான்ட்ட்ரியால் பிரான்சிய மொழித்திட்டம் (Montreal French Project)<ref>Sankoff, D. & Sankoff, G. Sample survey methods and computer-assisted analysis in the study of grammatical variation. In Darnell R. (ed.) ''Canadian Languages in their Social Context'' Edmonton: Linguistic Research Incorporated. 1973. 7-64.</ref>, என்னும் திட்டத்தின்கீழ் ஒரு மில்லியன் சொற்கள் அடங்கிய பிரான்சிய மொழித் தொகுப்பும், அதனைப் பின்தொடர்ந்து அதனினும் பெரிய [[கனடா|கனடிய]] பிரான்சிய பேச்சுமொழித் தொகுப்பொன்றை சானா பாலாக் (Shana Poplack) உருவாக்கினார்.<ref>Poplack, S. The care and handling of a mega-corpus. In Fasold, R. & Schiffrin D. (eds.) ''Language Change and Variation'', Amsterdam: Benjamins. 1989. 411-451.</ref>
|