Проектирование баз данных начинается с создания информационной модели приложения. Получение информационной модели называют инфологическим проектированием. Информационной моделью (ИМ) называют представление на некотором языке множества типов объектов, называемых сущностями, и отношений (связей) между ними. В качестве языка представления ИМ наибольшее распространение получил диаграммный язык, предлагаемый в методике информационного (инфологического) проектирования приложений IDEF1X, получившей международное признание.
Основными компонентами ИМ в методике IDEF1X являются сущности, отношения и атрибуты. Для этих компонентов в методике приняты специальные средства графического изображения.
Сущность определяют как множество объектов, обладающих общими свойствами. Конкретные элементы этого множества называют экземплярами сущности. Если сущность A может быть определена только с помощью ссылки на свойства некоторой другой сущности B, то A называют зависимой (дочерней) сущностью, а B выступает в роли родительской сущности. Сущности в IDEF1X-диаграммах изображают в виде прямоугольников, причем рекомендуется у зависимых сущностей углы прямоугольников изображать скругленными.
Отношения между сущностями в IDEF1X являются бинарными отношениями. Выделяют идентифицирующие отношения — связи типа родитель-потомок, в которых потомок (зависимая сущность) однозначно определяется своей связью с родителем, и неидентифицирующие отношения, означающие, что у связанного этим отношением экземпляра одной сущности может быть, а может и не быть соответствующего экземпляра второй сущности. Примером идентифицирующего отношения может служить связь сущностей "изготовитель" и "товар", а неидентифицирующего отношения — связь "книга — библиотека".
Идентифицирующее отношение изображают на IDEF1X-диаграмме сплошной линией между прямоугольниками связанных сущностей, неидентифицирующее отношение показывают пунктирной линией. На дочернем конце линии должно быть утолщение (жирная точка). На IDEF1X-диаграмме около утолщенного конца линии связи можно записать символ, характеризующий мощность связи, где — число экземпляров зависимой сущности, соответствующее одному экземпляру родительской сущности. При этом символ р означает , а символу z соответствует или . Отсутствие символа интерпретируется как .
Различают также специфические и неспецифические отношения. Специфические отношения — это связи "один ко многим", а неспецифические — связи типа "многие ко многим". Пример специфической связи — "студент — студенческая группа", неспецифической связи — "преподаватель — студенческая группа". Неспецифические отношения изображают сплошной линией с утолщениями на обоих концах.
В отношениях родитель-потомок возможно наличие у потомка единственного родителя (характеристическая связь) или нескольких родителей (ассоциативная связь). Выделяют также отношения категоризации (наследования), отражающие связи между некоторой общей сущностью и вариантами ее реализации (категориями). Например, общей сущностью может быть "учебное занятие", а категориями — "лекция", "семинар", "лабораторная работа", "консультация".
Свойства сущностей, отображаемые в ИМ, называют атрибутами.
Различают ключевые и неключевые атрибуты. Значение ключевого атрибута (ключа) однозначно идентифицирует экземпляр сущности. Ключевые атрибуты могут быть составными. Например, чтобы однозначно определить "учебное занятие" нужно указать индекс учебной группы (потока) и название дисциплины, т.е. эти два атрибута вместе являются составным ключом. Неключевыми атрибутами сущности "учебное занятие" в нашем примере могут быть время проведения занятия, аудитория, фамилия преподавателя.
Внешний ключ — это атрибут, входящий в ключ родителя и наследуемый потомком. На IDEF1X-диаграммах ключи записывают в верхней части прямоугольника сущности, причем внешние ключи помечают меткой FK (Foreign Key), неключевые атрибуты помещают в нижнюю часть прямоугольников. В идентифицирующих отношениях все ключи родителя входят и в ключи потомка, в неидентифицирующих ключи родителя относятся к неключевым атрибутам потомка.
Разработка ИМ в соответствии с методикой IDEF1X выполняется за несколько стадий. На начальной стадии производится сбор информации о приложении, выясняется цель создания ИМ. Затем выявляются сущности приложения, определяются основные отношения между ними. Результат представляют в виде диаграммы "сущность — связь" (транзитивные связи не указываются). Далее определяют свойства сущностей, начиная с ключевых атрибутов. При этом полезно выявить неспецифические отношения и заменить связи "многие ко многим" на связи "один к одному" или "один ко многим" с помощью введения некоторой сущности-посредника. Например, отношение "преподаватель — студенческая группа" может быть заменено на отношения сущностей "преподаватель" и "студенческая группа" с сущностью-посредником "расписание".
Основные элементы графического языка IDEF1X представлены на рис. 1.
Рис. 1.  Элементы языка IDEF1X
В качестве примера рассмотрим формирование ИМ приложения "Научно-исследовательская деятельность вуза".
Предположим, что вначале было решено, что главное назначение создаваемой подсистемы — предоставление информации о проводимых в вузе научно-исследовательских работах и их кадровом обеспечении.
Поэтому в первоначальный вариант ИМ были введены сущности "НТП" — научно-техническая программа, "ГРНТИ" — Государственный реестр научно-технической информации, "НИР" — научно-исследовательская работа, "Специалист", "Кал. план" — календарный план, "Этап", "Факультет (НИИ)", "Кафедра (Отдел)". Затем были определены связи. Отношение между сущностями "НИР" и "Специалист" оказалось неспецифическим, оно было сведено к специфическому введением сущности-посредника "Исполнитель". В атрибуты сущностей-потомков вошли ключевые атрибуты сущностей-родителей. После составления списков атрибутов получилась IDEF1X-диаграмма, представленная на рис. 2, на которой внешние ключи выделены курсивом.
После рецензирования первоначальный вариант ИМ был расширен, в него дополнительно введены такие сущности, как "Диссертация", "Диссертационный совет", "Специальность ВАК", "Аспирант", "Научно-техническая комиссия", "Партнеры" (в том числе зарубежные) и т.п. с соответствующими связями и атрибутами.
Рис. 2.  IDEF1X-диаграмма приложения "Научно-исследовательская деятельность вуза"