Модель памяти в языке Си

Материал из Seo Wiki - Поисковая Оптимизация и Программирование
Перейти к навигацииПерейти к поиску

Модели памяти в языке программирования Си - способ указать предположения, которые должен сделать компилятор при генерации кода для платформ с сегментной адресацией памяти или со страничной памятью.

Например, на 16-битной x86-совместимой платформеm существует шесть моделей памяти. Они определяют, какие предположения делаются относительно сегмента регистров и размера указателей по умолчанию.

Сегментация памяти

Четыре регистра используются для обозначения четырех сегментов на 16-битной x86-архитектуре сегментированной памяти. DS (data segment, сегмент данных), CS (code segment, сегмент кода), SS (stack segment, сегмент стека) и ES (extra segment, дополнительный сегмент). Логический адрес на такой платформе пишется как сегмент:смещение в шестнадцатеричной системе счисления. В реальном режиме для вычисления физического адреса байта памяти происходит сдвиг влево содержимого соответствующего регистра на 4 бита (или просто умножается на 16), а затем добавляется смещение.

Например, логический адрес 7522:F139 дает 20-битный физический адрес:

75220 + F139 = 84359

Необходимо отметить, что этот процесс приводит к алиасингу памяти, то есть любой данный физический адрес может иметь несколько логических представлений. Это усложняет сравнение указателей.

В защищённом режиме для этой же цели используются GDT и LDT.

Размеры указателя

Указатели могут быть типов near (ближний), far (дальний) или huge (большой). Ближний (near) указатель ссылается на текущий сегмент, поэтому ни DS ни CS не должны изменяться при разыменовании указателя. Указатели этого типа являются самыми быстрыми, но ограничены областью указывания в 64 килобайта памяти (т.е. текущим сегментом).

Far-указатели содержат новое значение DS или CS. Для их использования регистр должен быть изменен, память разыменована, а затем регистр должен быть восстановлен. Такие указатели могут ссылаться на 1 мегабайт памяти. Необходимо отметить, что арифметические действия с указателями (сложение и вычитание) не изменяют участок сегмента указателя, а затрагивают лишь его смещение. Операции, выходящие за границы нуля или 65535 (0xFFFF), подвергнутся операции взятия по модулю 64K, как и любая обычная 16-битная операция. Например, знаковое -1 превращается в беззнаковое 0xFFFF или 65535.

К примеру, нижеследующий код выйдет за рамки и перепишет сам себя:

char far* myfarptr = (char far*) 0x50000000L ; 
unsigned long counter ;
for(counter=0; counter<128*1024; counter++) // доступ к 128K памяти
  *(myfarptr+counter) = 7 ; // записать все семерки в нее

В какой-то момент счетчик counter станет равным (0x10000), а результирующий абсолютный адрес превысит 0x5000:0000.

Большие (huge) указатели по сути являются дальними указателями, но нормализуются каждый раз когда они меняются, так что у них есть наивысший сегмент, доступный им для адресации. Это весьма медленно, но зато позволяет указателю указывать на несколько сегментов, а также позволяет более точно сравнивать указатели, как если бы в качестве платформы использовалась бы плоская модель памяти: это запрещает алиасинг памяти как упоминалось выше, поэтому два больших указателя, ссылающиеся на один и тот же участок памяти, всегда будут равны.

Модели памяти

Модели памяти бывают:

Модель Данные Код
Tiny* near
Small near** near
Medium near far
Compact far near
Large far far
Huge huge huge

* В модели Tiny (крошечная) все четыре сегментных регистра указывают на один и тот же сегмент.

** Во всех моделях с ближними указателями на данные SS равно DS.

Другие платформы

В защищённом режиме сегмент не может быть перезаписан, считан и выполнен.[источник не указан 5365 дней] Поэтому, при реализации моделей памяти Small и Tiny регистр сегмента кода должен указывать на тот же физический адрес и иметь то же ограничение, что и регистр сегмента данных. Это нивелирует одну из особенностей процессора 80286, которая гарантирует, что сегменты данных никогда не будут исполняться, а сегмент кода никогда не будет перезаписываться (что означает полное запрещение самомодифицирующегося кода). Однако, на процессорах 80386 с его плоской моделью памяти можно защитить от записи отдельные страницы памяти.[источник не указан 5365 дней]

Модели памяти не ограничиваются 16-битными программами. Можно использовать сегментацию также и в 32-битном защищенном режиме (получая в результате 48-битные указатели), причем существуют компиляторы языка Си, поддерживающие это.[источник не указан 5365 дней] Тем не менее, сегментация в 32-битном режиме не позволяет получать доступ к большему адресному пространству, чем тот, который охватывает один сегмент, за исключением некоторых сегментов, которые не всегда представлены в памяти, а линейное адресное пространство просто используется как кэш за счет увеличенного сегментированного виртуального пространства.[источник не указан 5365 дней] По большей части это позволяет лучше защитить доступ к различным объектам (области объемом до 1 мегабайта могут получить преимущества за счет побайтового разбиения защиты доступа, в отличие от довольно "грубого" дробления по 4 KiB, предлагаемого при одиночной странице), и таким образом используется лишь в специальных приложениях, навроде телекоммуникационного ПО.[источник не указан 5365 дней] Технически, "плоское" 32-битное адресное пространство является моделью памяти типа "tiny" для сегментированного адресного пространства. Под влиянием обоих факторов, все четыре сегментных регистра содержат одно и то же значение.

На платформе x86-64 существует семь моделей памяти[1], причем большинство символьных ссылок являются лишь 32-битными, и если адрес известен во время линковки (в отличие от позиционно-независимого кода). Это не влияет на использование указателей, которые всегдя являются плоскими 64-битными указателями, но только с точки зрения доступа к значению через размещение символов.

Примечания

Литература

  • Turbo C++ Version 3.0 User's Guide. Borland International, 1992.

Ссылки

См. также

en:C memory model

Если вам нравится SbUP.com Сайт, вы можете поддержать его - BTC: bc1qppjcl3c2cyjazy6lepmrv3fh6ke9mxs7zpfky0 , TRC20 и ещё....