а потом как бы сделать петабайт-скейл базу для аналитики?
Нужно было создать что-то что будет переиндесироваться быстро
сейчас у гугла много продуктов у которых более 1 млрд пользователей
и все продукты типа хрома, гугл плея, поиска, ютуба и пр - использует один стек
потому что есть expiration time и есть version, который чаще всего timestamp
Colossus - FS размером с датацентр. распределенная
можно перераспределять быстро данные по нодам