Лекция по теме Технологии хранения, поиска и сортировки данных

В представленной работе в виде конспекта лекции представлена информация, связанная с терминологией баз данных и систем управления базами данных, дана классификация баз данных, рассмотрены основные модели баз данных, выделены функции системы управления базами данных и основные этапы работы с базами данных.
Раздел Информатика
Класс 10 класс
Тип Конспекты
Автор
Дата
Формат docx
Изображения Есть
For-Teacher.ru - все для учителя
Поделитесь с коллегами:

Тема «Технологии хранения, поиска и сортировки данных»


Цель лекции: Раскрыть значение и возможности систем управления базами данных для организации и обработки больших массивов информации в автоматизированных информационных системах.

Задачи лекции:

  • познакомиться с терминологией баз данных;

  • классифицировать и охарактеризовать базы данных;

  • рассмотреть основные модели баз данных;

  • выделить основные функции системы управления базами данных;

  • дать характеристику основных объектов СУБД Access;

  • выделить основные этапы работы с базами данных.

Информационное обеспечение:

  1. Михеева Е.В. Информационные технологии в профессиональной деятельности. Технические специальности : учебник для студ. учреждений сред. проф. Образования / Е. В. Михеева, О.И. Титова. - М.: Издательский центр «Академия», 2014.- 416 с.

  2. fcior.edu.ru/ - Федеральный центр информационно-образовательных ресурсов

Содержание лекции:

  1. Терминология: информация, данные, знания.

  2. Классификация базы данных.

  3. Назначение и основные компоненты систем баз данных.

  4. Основные модели данных.

  5. Реляционная модель данных.

  6. Системы управления базами данных.

  7. Проектирование и формирование базы данных в среде Access.

Информационный материал.


  1. Терминология: информация, данные, знания

Информация - любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятие, передача, преобразование, хранение или использование.

Данные - это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ.

Подготовка информации - состоит в ее формализации, сборе и переносе на машинные носители.

Обработка данных - это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде.

Система обработки данных (СОД) - это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.

Управление данными - совокупность функций обеспечения требуемого представления данных, их накопления и хранения, обновления, удаления, поиска по заданному критерию и выдачи данных.

Предметная область - часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге автоматизации.

База данных (БД) - совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ. Эти данные относятся к определенной предметной области и организованы таким образом, что могут быть использованы для решения задач многими пользователями.

Введение базы данных - деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования.

Система управления базами данных (СУБД) - это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами.

Автоматизированная информационная система (АИС) представляет собой совокупность данных, экономико-математических методов и моделей, технических, программных средств и специалистов, предназначенную для обработки информации и принятия управленческих решений.

Банк данных (БнД) - это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.


  1. Классификация баз данных

Развитие средств вычислительной техники и информационных технологий обеспечило возможности для создания и широкого применения автоматизированных информационных систем (АИС) разнообразного назначения. Разрабатываются и внедряются информационные системы управления хозяйственными и техническими объектами, модельные комплексы для научных исследований, системы автоматизации проектирования и производства, всевозможные тренажеры и обучающие системы.

Технологии баз данных одна из наиболее востребованных технологий в практической разработке информационных систем, сформирована широкая сфера самых разнообразных приложений систем баз данных. Обычно БД создается для хранения и доступа к данным из некоторой предметной области.

Под автоматизированной информационной системой (АИС) понимают совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. АИС, основанная на базе данных, служит для сбора, накопления, хранения информации, а также ее эффективного использования для различных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ.

По сферам применения и правилам организации различают два основных класса АИС, основанных на базе данных: информационно-поисковые (ИПС) и системы обработки данных (СОД).

ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересует, в основном, сами извлекаемые из базы данных сведения, а не результаты их обработки. Примером ИПС является любая справочная служба: к ней обращаются с запросом и получают в результате те данные, которые удовлетворяют этому запросу.

Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД - банковские системы, осуществляющие открытие\закрытие счетов, пересчет вкладов в зависимости от процентов, прием\снятие сумм и т.п.

В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические. На практике используются также системы комбинированного типа.

Фактографические АИС хранят сведения об объектах предметной области, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции (нахождение суммы, минимума, максимума и т.п.). Фактографические АИС обычно принадлежат к классу систем обработки данных.

В документальной системе объект хранения - документ, который содержит информацию, относящуюся к определенной предметной области. Это могут быть графические изображения (например, географические карты): информация на естественном языке (монографии, тексты законодательных актов, научные отчеты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки данных не важно, какие сведения хранятся в документах. Обычно (но не всегда) документальные АИС реализуются в виде информационно-поисковых систем (ИПС).


  1. Назначение и основные компоненты систем баз данных

Система БД включает два основных компонента: собственно базу данных и систему управления базами данных - СУБД (рисунок 3.1.). Большинство СОД включают также программы обработки данных (прикладное программное обеспечение), которые обращаются к данным через СУБД.

Лекция по теме Технологии хранения, поиска и сортировки данных

Рисунок 3.1. Компоненты системы баз данных

Таким образом, обращение к базе данных возможно только через СУБД. База данных предназначена для хранения данных информационной системы. Пользователи обращаются к базе данных обычно не напрямую через средства СУБД, а с помощью внешнего интерфейса - приложения, входящего в состав АИС. Основной характеристикой баз данных является совместное использование данных многими пользователями.


  1. Основные модели данных

Модель данных - является фундаментом технологий баз данных; на ней базируется конкретная СУБД. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ими базы данных, если они основываются на этой модели. Создавая базу данных, необходимо упорядочить информацию по различным признакам для того, чтобы потом извлекать из нее необходимые данные в любом сочетании. Сделать это возможно, только если данные структурированы. Структура данных упорядочивает элементы информации и описывает их взаимосвязи.

Модель данных - это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения.

История создания и развития СУБД насчитывает около сорока лет. За этот период были разработаны многочисленные модели данных, прежде всего это сетевые, иерархические и реляционные модели данных. Сетевые и иерархические модели в настоящее время считаются устаревшими, но существует множество баз данных созданных на их основе и требующих поддержания их работы.

Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней. Сетевая модель позволяет организовывать БД, структура которых представляется графом общего вида. Сетевая база данных является обобщением иерархической, в которой каждый элемент вышестоящего уровня может быть связан одновременно с любым элементом следующего уровня. На связи между объектами в сетевых моделях не накладывается никаких ограничений. Пример сетевой базы данных приведён на рисунке 4.1.

Лекция по теме Технологии хранения, поиска и сортировки данных


Рисунок 4.1. Пример фрагмента сетевой базы данных

Сетевой базой данных фактически является «всемирная паутина» сети Интернет. Гиперссылки связывают собой сотни миллионов документов в единую сетевую базу данных.

Иерархическая модель позволяет строить БД с иерархической древовидной структурой. В основе иерархической модели лежит понятие дерева. Дерево - это связный неориентированный граф, который не содержит циклов. При работе с деревом выделяют какую-то конкретную вершину, определяют её как корень дерева и рассматривают особо - в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным, ориентация определяется от корня. Иерархическая база данных по своей структуре соответствует иерархической файловой системе.

В иерархических моделях данных используется ориентация древовидной структуры от корня к листьям. Поиск данных в таком случае может осуществляться последовательным «спуском» с одного уровня на другой Пример иерархической базы данных приведён на рисунке 4.2.

Лекция по теме Технологии хранения, поиска и сортировки данных

Рисунок 4.2. Пример фрагмента иерархической базы данных


  1. Реляционная модель данных

Реляционная модель данных была предложена в 1970 г. математиком Эдгаром Коддом. Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL.

Реляционная модель БД (от английского " relation" - отношение) представляет собой одну или несколько взаимосвязанных двумерных таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные. Столбцы таблицы называют полями. Каждое поле содержит значения определенного свойства и характеризуется своим именем и типом данных. Строки таблицы являются записями об объекте и содержат набор значений свойств, принадлежащих одному объекту. Записи разбиты на поля столбцами таблицы, поэтому каждая запись представляет набор значений, содержащихся в полях. Ключевое поле (первичный ключ) - это поле (совокупность полей), которое однозначно определяет каждую запись в таблице, т.е. не повторяется у разных записей (простой, составной). Пример реляционной базы данных приведен на рисунке 5.1.

Лекция по теме Технологии хранения, поиска и сортировки данных


Рисунок 5.1. Пример фрагмента реляционной базы данных


  1. Системы управления базой данных

Развитие информационных технологий привело к созданию компьютерных баз данных. Взаимодействие с базой данных происходит при помощи системы управления базами данных (СУБД), которая расшифровывает запросы пользователя и производит операции с информацией в базе данных. Система управления базами данных - это важнейший компонент АИС, основанный на базе данных. СУБД необходима для создания и поддержки базы данных информационной системы. Программные составляющие СУБД включают в себя ядро и сервисные средства (утилиты).

Ядро СУБД - это набор программных модулей, необходимый и достаточный для создания и поддержания БД, то есть универсальная часть, решающая стандартные задачи по информационному обслуживанию пользователей. Сервисные программы предоставляют пользователям ряд дополнительных возможностей и услуг, зависящих от описываемой предметной области и потребностей конкретного пользователя.

Системой управления базами данных называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержания её в актуальном состоянии и обеспечения эффективного доступа пользователей к содержащимся в ней данным в рамках предоставленных им полномочий.

СУБД описывает логическую структуру БД, её организацию в среде хранения и пользовательские представления данных (соответственно концептуальную схему БД, схему хранения и внешние схемы). Обрабатывая эти схемы, СУБД создаёт пустую БД требуемой структуры и предоставляет средства для наполнения её данными предметной области и дальнейшей эксплуатации.

Система управления базой данных (СУБД) - это языковые и программные средства для организации, пополнения, модификации и использования баз данных. В мире существует множество систем управления базами данных. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий.

Различают универсальные и специализированные СУБД. Универсальные СУБД являются системами широкого профиля и не имеют четко очерченных границ применения, а специализированные создаются для БД конкретного назначения: банковских, бухгалтерских и т. д. Специализированные СУБД в наибольшей степени учитывают специфику предметной области, что отражается в интерфейсе и процедурах обработки информации.

СУБД организует хранение информации таким образом, чтобы ее было удобно:

  • просматривать,

  • пополнять,

  • изменять,

  • искать нужные сведения,

  • делать любые выборки,

  • осуществлять сортировку в любом порядке.

В связи с распространением сетевых технологий, от современных СУБД требуется возможность работы с отдаленными и распределенными ресурсами, которые находятся на серверах Интернета.


  1. Проектирование и формирование базы данных в среде Access

Microsoft Access - высокопроизводительная система управления реляционными базами данных, которая входит в состав профессиональной версии интегрированного пакета Microsoft Office (Access в переводе с английского означает «доступ»). СУБД Access поддерживает реляционную модель представления данных и функционирует под управлением операционных систем Windows, используется для разработки настольных баз данных, обеспечивает обработку, сортировку и поиск данных.

Основными функциями СУБД Access являются:

  • создание пустой структуры базы данных;

  • наличие средств ее заполнения или импорта данных из таблиц другой базы;

  • возможность доступа к данным;

  • наличие средств поиска и фильтрации.

Основные типы данных: текстовый, числовой, дата/время, счетчик (вводится автоматически с вводом каждой записи), поле объекта OLE (содержит рисунки, звуковые файлы, таблицы Excel, документы Word и т.д.).

СУБД Access работает с объектами, к которым относятся таблицы, запросы, формы, отчеты, макросы и модули. Все связанные между собой объекты организованы в один файл, называемый базой данных. Основные разделы главного окна соответствуют типам объектов, которые может содержать база данных Access. Это Таблицы, Запросы, Формы, Отчеты, Макросы и Модули.

Таблица - это основной объект любой базы данных, предназначенный для хранения данных в виде записей (строк) и полей (столбцов). Обычно каждая таблица используется для хранения сведений по одному конкретному вопросу. Таблицы хранят структуру БД (поля, их типы и свойства) и все данные, имеющиеся в БД.

Форма - это объект, предназначенный для ввода данных, позволяющий отображать данные в удобном для восприятия виде. В форме можно разместить элементы управления, применяемые для ввода, изображения и произвести изменения данных в полях таблицы.

Запрос - это объект, позволяющий получить нужные данные по определенным условиям из одной или нескольких таблиц. С помощью запросов выполняют такие операции как отбор данных, их сортировку и фильтрацию.

Отчет - это объект базы данных, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления.

Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций.

Модули - служат для автоматизации работы с базой данных.

Интерфейс работы с объектами базы данных унифицирован. По каждому из них предусмотрены стандартные режимы работы:

  1. Создать - предназначен для создания структуры объектов.

  2. Конструктор - предназначен для изменения структуры объектов.

  3. Открыть - предназначен для работы с объектами базы данных.

Важным средством, облегчающим работу с MS Access для начинающих пользователей, являются мастера - специальные программные надстройки, предназначенные для создания объектов базы данных в режиме последовательного диалога. Для опытных пользователей существуют возможности более гибкого управления ресурсами и возможностями объектов СУБД в режиме конструктора. Специфической особенностью СУБД MS Access является то, что вся информация, относящаяся к одной базе данных, хранится в едином файле. Такой файл имеет расширение ".mdb".

Основные этапы работы с базами данных в среде MS Access:

1-й этап - проектирование БД. Процесс формирования базы данных в виде таблицы включает создание структуры, т.е. полей из которых будет состоять каждая запись. Определяются имя, тип (текстовый, числовой, логический, объект OLE и др.), размер полей. Кроме того СУБД формирует записи специального типа, содержащие уникальные номера - ключи, с помощью которых можно организовывать связь между таблицами.

2-й этап - наполнение БД содержимым. Осуществляется ввод и редактирование данных. СУБД дает возможность создать с помощью мастера экранную форму окна с кнопками, полями для ввода, т.е. создать удобный пользовательский интерфейс.

3-й этап - визуализация информации. Отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройства вывода или передачи по каналам связи. Пользователь получает удобное средство для обработки данных - запрос и использовать фильтрацию записей в базе данных. СУБД позволяет пользователю вывести на принтер необходимую информацию в виде отчета, в который можно включить: выборочную информацию из таблицы, новую информацию, информацию из других таблиц.

Терминологический словарь:

Автоматизированная информационная система (АИС) - совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. База данных (БД) - совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными.

Введение базы данных - деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования.

Данные - это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения,

Запрос - объект, предназначенный для извлечения данных из таблиц на основе заданных условий.

Иерархическая модель БД - данные представлены в виде древовидной структуры, состоящей из объектов различных уровней.

Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций.

Модель данных - это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения.

Отчет - объект, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления.

Реляционная модель БД (от английского " relation" - отношение) - модель, представленная в виде одной или нескольких взаимосвязанных двумерных таблиц.

Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней.

Система управления базами данных (СУБД) - это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами.

Фильтрация (выборка) данных - способ отображения данных в таблице, которые отвечает заданному условию или нескольким условиям.

Форма - объект, предназначенный для ввода данных, позволяющие отображать данные в удобном для восприятия виде.

Контрольные вопросы:


  1. Как можно классифицировать базы данных?

  2. В чем состоит разница между терминами «база данных» и «система управления базами данных»?

  3. Чем различаются между собой реляционные, иерархические и сетевые базы данных? Приведите примеры.

  4. Какова структура реляционных баз данных?

  5. Какие программные средства обеспечивают работу с базами данных?

  6. Что входит в функции современных СУБД?

  7. Какие этапы выделяют при работе с базами данных?

  8. Что понимается под проектированием базы данных?



© 2010-2022