Feb. 23rd, 2011
типа похвастаться
Feb. 23rd, 2011 04:07 pmЯ всё дурака валяю, утрамбовываю данные в программе. Типа было два гига в продакшене, я их всех в память пихал. Дошло, что надо выкинуть лишние колонки - обнаружил, что до хрена данных повторяется. Выкинул дубликаты и перехлёсты (когда одна запись кроет другую). Вместо миллиона оказалось 250 тысяч записей, из которых получал примерно 280 тыс записей в хашмапе. Ключи - строки. А сегодня дошло, что эти строки, префиксы телефонных номеров, да я их вполне могу в long утрамбовать. Вместо 36 байт (джава, ну) в среднем стало 8 байт на запись. Очень смешно. Теперь думаю, не перегнать ли всё на trie...