Объемы информации, которыми оперируют предприятия, достигли огромных размеров и продолжают неуклонно расти. Это порождает спрос на разработку баз данных. В английском даже появился термин «big data» (дословно «большие данные»), обозначающий столь крупную и запутанную совокупность данных, которую уже трудно обработать, применяя готовые тиражируемые инструменты СУБД. Для работы с big data необходимы самые последние аппаратные технологические достижения и специально созданное под задачу ПО.
Мы придерживаемся следующего: база данных — совокупность структурно-системных данных, которые располагаются в электронном виде на электронном носителе и подчинены некой схеме. В основе классифицирования баз данных лежат разные критерии. По критерию содержимого базы данных делятся на научные, мультимедийные, клиентские, географические, исторические и т.п.
Если критерием считать среду хранения, классификация следующая.
Традиционные — хранятся на внешней независимой энергетически памяти. | |||
Целиком находящиеся в ОЗУ. | |||
Базы на отсоединяемом аппаратном оборудовании массового хранения. |
По распределенности в пространстве выделяют центральные (функционирующие целиком на одном ПК) и распределенные базы данных, части могут быть расположены на удаленных хостах ЛВС. Помимо вышеописанных, существуют пространственно-временные, пространственные, временные и циклические БД.
От понятия «база данных» стоит отличать термин «система управления базами данных» (СУБД), который обозначает комплекс софтверных инструментов, наделяющий пользователей возможностями создания, поддержки и доступа к собственным базам.
По виду доступа СУБД классифицируются на:
- файл-серверные;
- клиент-серверные;
- встраиваемые (embedded).
Сотрудники EDISON неоднократно создавали базы данных:
- вмещающие десятки миллионов записей;
- с числом пользователей в несколько миллионов человек;
- содержащие изобретенные нами же форматы, переносимые лишь на RAID-массивах;
- настолько большие, что хранить их можно лишь только в облаке.