Przejdź do zawartości

Calgary Corpus: Różnice pomiędzy wersjami

Z Wikipedii, wolnej encyklopedii
[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
m jęz.
m Int.
 
Linia 1: Linia 1:
'''Calgary Corpus''' (korpus calgary) - zestaw tekstu i plików binarnych używany do testowania [[algorytm]]ów [[kompresja (informatyka)|kompresji]].
'''Calgary Corpus''' (korpus calgary) zestaw tekstu i plików binarnych używany do testowania [[algorytm]]ów [[kompresja (informatyka)|kompresji]].


Stworzyli go Ian Witten i Tim Bell w latach 80. i był powszechnie używany w 90. XX wieku. W 1997 został zastąpiony przez [[Canterbury Corpus]], ale Calgary Corpus wciąż istnieje dla porównania i jest wciąż użyteczny. Jego główną zaletą jest łatwość porównania z algorytmami, dla których znane są wyniki dla tego korpusu.
Stworzyli go Ian Witten i Tim Bell w latach 80. i był powszechnie używany w 90. XX wieku. W 1997 został zastąpiony przez [[Canterbury Corpus]], ale Calgary Corpus wciąż istnieje dla porównania i jest wciąż użyteczny. Jego główną zaletą jest łatwość porównania z algorytmami, dla których znane są wyniki dla tego korpusu.

Aktualna wersja na dzień 21:54, 18 mar 2023

Calgary Corpus (korpus calgary) – zestaw tekstu i plików binarnych używany do testowania algorytmów kompresji.

Stworzyli go Ian Witten i Tim Bell w latach 80. i był powszechnie używany w 90. XX wieku. W 1997 został zastąpiony przez Canterbury Corpus, ale Calgary Corpus wciąż istnieje dla porównania i jest wciąż użyteczny. Jego główną zaletą jest łatwość porównania z algorytmami, dla których znane są wyniki dla tego korpusu.

Mimo dużej popularności jest to już korpus nieco przestarzały, jego pliki mają małe rozmiary i niektóre z nich są w formatach już niestosowanych.