மொழித் தொகுப்பு: திருத்தங்களுக்கு இடையிலான வேறுபாடு

உள்ளடக்கம் நீக்கப்பட்டது உள்ளடக்கம் சேர்க்கப்பட்டது
→‎வரலாறு: விரிவு
வரிசை 9:
பிரௌன் தொகுப்பைப் போலவே பிரித்தானிய ஆங்கிலத்துக்கு லங்க்காசுட்டர்-ஆசுலோஒ-பெர்கென் தொகுப்பு (Lancaster-Oslo-Bergen Corpus) எனப்படும் எல்-ஓ-பி தொகுப்பும் (LOB Corpus),
இந்திய ஆங்கிலத்துக்கு கோலாப்பூர் தொகுப்பும், நியூசிலாந்து ஆங்கிலத்துக்கு வெலிங்க்டன் தொகுப்பும், ஆத்திரேலிய ஆங்கிலத்துக்கு ஆத்திரேலியத் தொகுப்பும் என பல உருவாகின. [[பிரித்தானிய நாட்டகத்திய தொகுப்பு]]<ref>[http://www.natcorp.ox.ac.uk/ பிரித்தானிய நாட்டகத்திய தொகுப்பு (British National Corpus)]</ref>(British National Corpus) என்னும் தொகுப்பில் 100 மில்லியன் சொற்களுக்கும் கூடுதலாக இருப்பதுடன் பேச்சு வழக்கும் ஒலிப்பதிவாக உள்ளது. இதே போல அமெரிக்க ஆங்கிலத்துக்கு ''கோக்கா'' (COCA) என்று அழைக்கப்படும் [[தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு]]<ref>[http://www.americancorpus.org/ தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு (Corpus of Contemporary American English)]</ref>(Corpus of Contemporary American English) 400 மில்லியன் சொற்களுக்கு கூடுதலாக உள்ள ஒன்று. இப்பொழுது ஒரு பில்லியனுக்கும் கூடுதலான சொற்கள் அடங்கிய தொகுப்புகள் உள்ளன.
The first computerized corpus of transcribed spoken language was constructed in 1971 by the Montreal French Project,<ref>Sankoff, D. & Sankoff, G. Sample survey methods and computer-assisted analysis in the study of grammatical variation. In Darnell R. (ed.) ''Canadian Languages in their Social Context'' Edmonton: Linguistic Research Incorporated. 1973. 7-64.</ref> containing one million words, which inspired [[Shana Poplack]]'s much larger corpus of spoken French in the Ottawa-Hull area.<ref>Poplack, S. The care and handling of a mega-corpus. In Fasold, R. & Schiffrin D. (eds.) ''Language Change and Variation'', Amsterdam: Benjamins. 1989. 411-451.</ref>
 
[[பிரான்சிய மொழி]]க்கு 1971 இல் துவக்கிய மான்ட்ட்ரியால் பிரான்சிய மொழித்திட்டம் (Montreal French Project)<ref>Sankoff, D. & Sankoff, G. Sample survey methods and computer-assisted analysis in the study of grammatical variation. In Darnell R. (ed.) ''Canadian Languages in their Social Context'' Edmonton: Linguistic Research Incorporated. 1973. 7-64.</ref>, என்னும் திட்டத்தின்கீழ் ஒரு மில்லியன் சொற்கள் அடங்கிய பிரான்சிய மொழித் தொகுப்பும், அதனைப் பின்தொடர்ந்து அதனினும் பெரிய [[கனடா|கனடிய]] பிரான்சிய பேச்சுமொழித் தொகுப்பொன்றை சானா பாலாக் (Shana Poplack) உருவாக்கினார்.<ref>Poplack, S. The care and handling of a mega-corpus. In Fasold, R. & Schiffrin D. (eds.) ''Language Change and Variation'', Amsterdam: Benjamins. 1989. 411-451.</ref>
"https://ta.wikipedia.org/wiki/மொழித்_தொகுப்பு" இலிருந்து மீள்விக்கப்பட்டது