Eldar Fattakhov |
04.04.2009 05:45 |
Цитата:
Сообщение от Nadir Zaitov
(Сообщение 200311)
Идея Data warehouse - складирование информации по полочкам, как в шкафах на "информационном складе"? Где синергетика от серверов по середине, за счет чего она появляется?
|
"Складирование по полочкам" - термин вряд ли соответствующий хранилищу данных. Я бы сказал, что это оптовый склад, где всё свалено в кучу и только один "человек" (кладовщик) знает где и что лежит. При этом на этой свалке лежит всё что угодно (всё что есть на этом самом предприятии, типа "Ипподром" или какая-нибудь оптушка в Китае). Хотя понятие "витрин" данных в данной технологии присутствует. :)
Вот чтобы вытаскивать из всего этого мусора нужные данные (бельё нужного размера) и требуется большое количество серверов.
Если уйти от образного изложения и попробовать описать решение для хранилища данных размером в 4 ТБ, то это может быть (пример, правда, базируется не на Integrity - для показательности "масштабов бедствия"):
1) шкаф высотой 42U;
2) четыре корзины c7000;
3) в каждой корзине по два сервера bl460c (Compute Nodes) - 2 процессора, 16 ГБ ОЗУ, 2 диска, 2 контроллера InfinBand (!), LINUX и ORACLE Database Enterprise Edition + Real Application Cluster;
4) в каждой корзине по семь серверов bl460c (Storage Nodes) - 1 процессор, 2 ГБ ОЗУ, по 6 дисков по 146 ГБ для данных, 2 контроллера InfinBand (!).
Хочу обратить внимание, что потребность в "сыром" дисковом пространстве может быть больше размера самого набора данных до 10 раз и больше. В вышеописанном случае - более, чем в 6 раз.
|