Понятие файла
В основе любой операционной системы лежит принцип организации работы внешнего устройства хранения информации. Несмотря на то, что внешняя память может быть технически реализована на разных материальных носителях (например, в виде гибкого магнитного диска или магнитной ленты), их объединяет принятый в операционной системе принцип организации хранения логически связанных наборов информации в виде так называемых файлов.
Файл - логически связанная совокупность данных или программ, для размещения которой во внешней памяти выделяется именованная область.
Файл служит учетной единицей информации в операционной системе. Любые действия с информацией в операционной системе осуществляются над файлами: запись на диск, вывод на экран, ввод с клавиатуры, печать, считывание информации CD-ROM и пр.
На диске файл не требует для своего размещения непрерывного пространства, обычно он занимает свободные кластеры в разных частях диска. Кластер - минимальная единица пространства диска, которое может быть отведено файлу. Самый маленький файл занимает один кластер, большие файлы -- несколько десятков кластеров.
Справка. Сектор -- 512 байт. На гибком диске обычно 80 дорожек. На каждой дорожке: для 5" диска (5-дюймового) - 9 секторов; для 3,5" (3,5-дюймового) диска - 18 секторов. Кластер - группа смежных секторов. Кластер для гибкого диска - 1,2 сектора (512 байт, 1 Кбайт). Кластер для жесткого диска - 4, 8, 16 секторов (2...8 Кбайт).
В файлах могут храниться разнообразные виды и формы представления информации: тексты, рисунки, чертежи, числа, программы, таблицы и т.п. Особенности конкретных файлов определяются их форматом. Под форматом понимается элемент языка, в символическом виде описывающий представление информации в файле.
Текстовая информация хранится в файле в кодах ASCII, в так называемом текстовом формате. Содержимое текстовых файлов можно просмотреть на экране дисплея с помощью разных программных средств.
Для характеристики файла используются следующие параметры:
- · полное имя файла;
- · объем файла в байтах;
- · дата создания файла;
- · время создания файла;
- · тип файла;
- · специальные атрибуты файла: R (Read only) - только для чтения, Н (Hidden) - скрытый файл, S (System) - системный файл, A (Archive) - архивированный файл.
С понятием файла в операционной системе тесно связано понятие логического диска. Логический диск создается и управляется специальной программой (драйвером). Он имеет уникальное имя в виде одной латинской буквы, например С, D, E, F и т.д. Логический диск может реализовываться на жестком диске, на гибком диске, на CD-ROM, в оперативной памяти (электронный диск) и т.п. На одном физическом диске может быть создано несколько логических дисков.
Способы обращения к файлу. К файлу можно обращаться с помощью имени, полного имени, спецификации. Для того чтобы воспользоваться одним из этих вариантов, надо знать ряд правил и соглашений, позволяющих унифицировать в операционной системе процедуру обращения к файлу. Рассмотрим эти варианты.
Правило образования имени. Имя файла всегда уникально и служит для отличия одного файла от другого. Имя файла образуется из символов, цифр, знаков подчеркивания.
При образовании имени нельзя использовать символы. *?:;,<> =.
По имени к файлу обращаются редко, обычно только в тех прикладных программах, когда это специально предусмотрено, а также при вводе имени файла, где хранится команда операционной системы.
В качестве имени файла можно использовать символьное имя устройства.
Правило образования полного имени. Обычно к файлу обращаются с помощью полного имени, за исключением оговоренных выше случаев. Полное имя файла более подробно характеризует файл и образуется из имени файла и типа (расширения), разделенных точкой.
Тип файла служит для характеристики хранящейся в файле информации и образуется не более чем из трех символов, причем используются, как и при образовании имени, только буквы латинского алфавита.
Внимание! В полном имени недопустимы пробелы между именем и типом.
При образовании типа, как и при образовании имени, нельзя использовать русские буквы и символы .*?:;,<> = пробел.
При работе на персональном компьютере установлен ряд соглашений по заданию типа файла, некоторые из которых приведены в табл. 1.
Таблица 1. Соглашения по типу файлов
Тип |
Назначение |
.ARJ |
Архивный файл |
.ВАК |
Копия файла, создаваемая при перезаписи файла оригинала |
.BAS |
Программа на языке Бейсик |
.ВАТ |
Командный файл |
.СОВ |
Программа на языке Кобол |
.COD |
Версия файла типа .OBJ на языке ассемблера |
.СОМ |
Командный системный файл, исполняемый файл |
.DAT |
Файл данных |
.DOC |
Файл документов (текстовый) |
.EXE; |
Исполняемый файл |
.FOR |
Программа на языке Фортран |
.HEX |
Символьное шестнадцатеричное представление двоичных данных в коде ASCII |
.HLP |
Файл для справочной информации |
.LIB |
Библиотека программ |
.OBJ |
Скомпилированная объектная программа на машинном языке |
.OVL |
Оверлейный файл прикладной программы |
.OVR |
Оверлейный файл программы компилятора |
.PAS |
Программа на языке Паскаль |
.PIC |
Данные выводимого на экран изображения |
,PRN |
Листинг (распечатка программы) |
.SYS |
Файлы, расширяющие возможности операционной системы, например драйверы |
.SYM |
Таблица символов для компилятора |
TER |
Описание терминала (для асинхронной передачи) |
.IMP |
Временный файл |
.TXT |
Текстовый файл |
.$$$ |
Временный файл |
Внимание! Пользуйтесь всегда соглашениями по типу файла из табл. 10.1. При несоблюдении этих соглашений вы затрудните дальнейшую работу - и свою, и коллег.
При обращении к файлу типа ВАТ, СОМ, ЕХЕ достаточно задать только его имя, тип не указывается. При одинаковых именах приоритет - в порядке, указанном выше.
Практические рекомендации. Хотя операционная система разрешает в имени и типе файла наличие написанных в любой последовательности символов с учетом ограничений, рекомендуется использовать буквы латинского алфавита и цифры, а имя начинать с буквы.
При назначении имен файлов рекомендуется образовывать их так, чтобы они отражали смысловое содержание файла.
Как обращаться к группе файлов ?
Часто возникает ситуация, когда надо работать не с одним файлом, а с группой файлов.
Эти операции достаточно легко выполнить, пользуясь при формировании имен и типов файлов шаблоном.
Шаблон имени файла - специальная форма, в которой в полях имени и типа файла используются символы «*» или «?»
Символ «*» служит для замены любой последовательности символов. В шаблоне может быть использовано в поле имени и типа по одному символу * .
Символ «?» служит для замены одного символа. В шаблоне может быть использовано несколько таких символов.
Организация доступа к файлу. Структура каталога. Надеемся, что вы хорошо представляете себе организацию хранения книг в библиотеке и соответственно процедуру поиска нужной книги по ее шифру из каталога. Перенесите свое представление об этом на способ хранения файлов на диске и организацию к нему доступа.
Другим примером может служить папка с документами различного или одинакового типа. Понятие«каталог» и понятие «папка» используются в операционных системах в качестве объектов, предназначенных для хранения файлов и обеспечения доступа к ним. В дальнейшем будем для однозначности использовать термин «каталог».
Доступ - процедура установления связи с памятью и размещенным в ней файлом для записи и чтения данных.
Имя логического диска, стоящее перед именем файла в спецификации, указывает логический диск, на котором следует искать файл. На этом же диске организован каталог, где хранятся полные имена файлов, а также их характеристики: дата и время создания; объем (в байтах); специальные атрибуты. По аналогии с библиотечной системой организации каталогов полное имя файла, зарегистрированное в каталоге, будет служить шифром, по которому операционная система находит месторасположение файла на диске.
Каталог - справочник файлов с указанием месторасположения на диске. В операционной системе Windows понятию «каталог» соответствует понятие «папка». Различают два состояния каталога - текущее (активное) и пассивное. Текущий (активный) каталог - каталог, в котором работа пользователя производится в текущее машинное время. Пассивный каталог - каталог, с которым в данный момент времени нет связи.
В операционной системе принята иерархическая структура организации каталогов (рис. 5). На каждом диске всегда имеется единственный главный (корневой) каталог. Он находится на 0-м уровне иерархической структуры и обозначается символом . Корневой каталог создается при форматировании (инициализации, разметке) диска и имеет ограниченный размер. В главный каталог могут входить другие каталоги и файлы, которые создаются командами операционной системы и могут быть удалены соответствующими командами.
Родительский каталог - каталог, имеющий подкаталоги. Подкаталог - каталог, куда входит в другой каталог.
Таким образом, любой каталог, содержащий каталоги нижнего уровня, может быть, с одной стороны, родительским по отношению к ним, а с другой стороны, подчиненным по отношению к каталогу верхнего уровня. Как правило, если это не вызывает путаницы, употребляют термин «каталог», подразумевая или подкаталог, или родительский каталог в зависимости от контекста.

Рис. 5. Иерархическая структура организации каталогов
Примечание. В структуре каталогов могут находиться каталоги, не содержащие ни одного файла или подкаталога. Такие подкаталоги называются пустыми.
Правила наименования подкаталогов такие же, как и правила наименования файлов. Для формального отличия от файлов обычно подкаталогам присваивают только имена, хотя можно добавить и тип по тем же правилам, что и для файлов.
Доступ к содержимому файла организован из главного каталога, через цепочку соподчиненных каталогов (подкаталогов) n-го уровня. В каталоге любого уровня могут храниться записи как о файлах, так и о каталогах нижнего уровня.
Описанный выше принцип организации доступа к файлу через каталог является основой файловой системы.
Файловая система - часть операционной системы, управляющая размещением и доступом к файлам и каталогам на диске.
С понятием файловой системы тесно связано понятие файловой структуры диска, под которой понимают, порядок размещения на диске главного каталога, подкаталогов, файлов, операционной системы, а также выделение для них объемов секторов, кластеров, дорожек.
Структура записей в каталоге
Запись о файле в каталоге содержит имя и тип файла, объем файла (в байтах), дату создания, время создания и еще ряд параметров, необходимых операционной системе для организации доступа:
Количество файлов на диске Объем свободного пространства диска, байт
4 file(s) 359560 bytes free