மொழித் தொகுப்பு: திருத்தங்களுக்கு இடையிலான வேறுபாடு

உள்ளடக்கம் நீக்கப்பட்டது உள்ளடக்கம் சேர்க்கப்பட்டது
→‎வரலாறு: பிற மொழித் தொகுப்புகள்
வரிசை 9:
பிரௌன் தொகுப்பைப் போலவே பிரித்தானிய ஆங்கிலத்துக்கு லங்க்காசுட்டர்-ஆசுலோஒ-பெர்கென் தொகுப்பு (Lancaster-Oslo-Bergen Corpus) எனப்படும் எல்-ஓ-பி தொகுப்பும் (LOB Corpus),
இந்திய ஆங்கிலத்துக்கு கோலாப்பூர் தொகுப்பும், நியூசிலாந்து ஆங்கிலத்துக்கு வெலிங்க்டன் தொகுப்பும், ஆத்திரேலிய ஆங்கிலத்துக்கு ஆத்திரேலியத் தொகுப்பும் என பல உருவாகின. [[பிரித்தானிய நாட்டகத்திய தொகுப்பு]]<ref>[http://www.natcorp.ox.ac.uk/ பிரித்தானிய நாட்டகத்திய தொகுப்பு (British National Corpus)]</ref>(British National Corpus) என்னும் தொகுப்பில் 100 மில்லியன் சொற்களுக்கும் கூடுதலாக இருப்பதுடன் பேச்சு வழக்கும் ஒலிப்பதிவாக உள்ளது. இதே போல அமெரிக்க ஆங்கிலத்துக்கு ''கோக்கா'' (COCA) என்று அழைக்கப்படும் [[தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு]]<ref>[http://www.americancorpus.org/ தற்கால அமெரிக்க ஆங்கில மொழித்தொகுப்பு (Corpus of Contemporary American English)]</ref>(Corpus of Contemporary American English) 400 மில்லியன் சொற்களுக்கு கூடுதலாக உள்ள ஒன்று. இப்பொழுது ஒரு பில்லியனுக்கும் கூடுதலான சொற்கள் அடங்கிய தொகுப்புகள் உள்ளன.
 
பிரான்சிய மொழிக்கும், எசுப்பானிய மொழிக்கும் (100 மில்லியன் எசுப்பானிய மொழிச் சொற்கள் கொண்டது <ref>[http://www.corpusdelespanol.org/ 100 மில்லியன் எசுப்பானிய மொழிச்சொற்கள் கொண்ட மொழித்தொகுப்பு]</ref>, போர்த்துகீசிய மொழிக்கும் (45 மில்லியன் சொற்கள் கொண்டது)<ref>[http://www.corpusdoportugues.org/ 45 மில்லியன் போர்த்துக்கீசிய மொழிச்சொற்கள் கொண்ட தொகுப்பு]</ref> இவ்வகையான மொழித்தொகுப்புகள் உள்ளன
 
==அடிக்குறிப்புகளும் மேற்கோள்களும் ==
"https://ta.wikipedia.org/wiki/மொழித்_தொகுப்பு" இலிருந்து மீள்விக்கப்பட்டது