Правило пяти минут - Five-minute rule

В Информатика, то правило пяти минут это практическое правило для принятия решения о том, следует ли хранить элемент данных в объем памяти, или же хранится на диске и считывать обратно в память при необходимости. Впервые он был сформулирован Джим Грей и Джанфранко Путцолу в 1985 году,[1][2] а затем пересмотрена в 1997 г.[3] и 2007[4] для отражения изменений относительной стоимости и производительности памяти и постоянного хранилища.

Правило таково:

Правило 5-минутного случайного выбора: кэшировать случайно используемые дисковые страницы, которые повторно используются каждые 5 минут или реже.

Грей также издал аналогичное правило одной минуты для последовательный доступ:[5]

Правило 1 минуты: кешируйте последовательно используемые страницы диска, которые повторно используются каждые 1 минуту или реже.

Хотя правило 5 минут было изобретено в области баз данных, оно также применялось в других местах, например, в Сетевая файловая система планирование емкости кеша.[6]

Первоначальное правило 5 минут было получено из следующего расчета рентабельности:[4]

BreakEvenIntervalinSeconds = (PagesPerMBofRAM / AccessesPerSecondPerDisk) × (PricePerDiskDrive / PricePerMBofRAM)

Применение его к данным 2007 года дает примерно 90-минутный интервал для кэширования с магнитного диска в DRAM, 15 минут для SSD кэширование в DRAM и 214 часов для кэширования с диска на SSD. Таким образом, интервал между дисками и DRAM был немного меньше того, что Грей и Путцолу ожидали в 1987 году как «правило пяти часов» в 2007 году для RAM и дисков.[4]

По расчетам NetApp инженер Дэвид Дейл, как сообщается в Реестр, цифры по кэшированию диска в DRAM в 2008 году были следующими: «Безубыточность страницы 50 КБ составила пять минут, страница 4 КБ - один час, а страница 1 КБ - пять часов. Требовалось 50-кратное увеличение в размере страницы для кэширования на безубыточность через пять минут ". Что касается кэширования диска на твердотельный накопитель в 2010 году, тот же источник сообщил, что «разрыв страницы 250 КБ даже с SLC составил пять минут, но пять часов с размером страницы 4 КБ. Это было пять минут с размером страницы 625 КБ с флэш-памятью MLC и 13 часов с размером страницы MLC 4 КБ ".[7]

В 2000 году Грей и Шеной применили аналогичный расчет для кеширование веб-страниц и пришел к выводу, что браузер должен «кэшировать веб-страницы, если есть вероятность, что на них будут повторно ссылаться в течение их жизни».[8]

Рекомендации

  1. ^ Грей, Джим; Путцолу, Франко (май 1985 г.), Правило 5 минут для обмена памятью для доступа к диску и правило 5 байтов для обмена памяти на время процессора (PDF)
  2. ^ Грей, Джим; Путцолу, Джанфранко Р. (1987), «Правило 5 минут для обмена памятью для доступа к диску и правило 10 байт для обмена памяти на время процессора», Материалы конференции ACM SIGMOD, стр. 395–398, CiteSeerX  10.1.1.624.3312, Дои:10.1145/38713.38755, ISBN  978-0897912365
  3. ^ Грей, Джим; Грефе, Гетц (1997), «Правило пяти минут десятью годами позже и другие полезные правила хранения данных на компьютере», Запись ACM SIGMOD, 26 (4): 63–68, arXiv:cs / 9809005, Дои:10.1145/271074.271094
  4. ^ а б c Грефе, Гетц (2007), «Правило пяти минут двадцать лет спустя и как флэш-память меняет правила», DaMoN '07: Материалы 3-го международного семинара по управлению данными на новом оборудовании, стр. 1–9, Дои:10.1145/1363189.1363198, ISBN  9781595937728 Бесплатная версия в Очередь ACM, Сентябрь 2008 г..
  5. ^ Рене Дж. Шеванс (2004). Серверные архитектуры: мультипроцессоры, кластеры, параллельные системы, веб-серверы, решения для хранения данных. Цифровая пресса. п. 542. ISBN  978-0-08-049229-2.
  6. ^ Джан-Паоло Д. Мусумечи; Майк Лукидес (2002). Настройка производительности системы. O'Reilly Media, Inc. стр. 263. ISBN  978-0-596-55204-6.
  7. ^ https://www.theregister.co.uk/2010/05/19/flash_5_minute_rule/?page=2
  8. ^ Джим Грей, Прашант Шеной "Полезные советы в инженерии данных ", MS-TR-99-100