Re: Сжатие текстового индекса
От: wildwind Россия  
Дата: 18.10.16 12:34
Оценка:
Здравствуйте, SL, Вы писали:

SL>Такой вопрос строковый индекс размеры строк от 0 до 256 символов, индекс реализован на B+ Tree, и строки упорядоченны через порядковое сравнение с использованием функции wcscmp, сейчас индекс сжимается по средством использования zlib, но возможно есть какие то схемы сжатия которые бы учитывали что строки упорядоченны и можно как то сжимать "положительную" "разницу"


Первое, что приходит в голову, это префиксное сжатие внутри страниц. Словарь префиксов фиксированной длины и ссылки на него в элементах.
Можно еще Хаффмана попробовать, но оверхед может оказаться неприемлемым.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.