Исправление проблем - Troubleshooting - Wikipedia

Исправление проблем это форма решение проблем, часто применяется для ремонта неисправных продуктов или процессов на машине или системе. Это логический, систематический поиск источника проблемы с целью ее решения и восстановления работоспособности продукта или процесса. Устранение неполадок необходимо для выявления симптомов. Определение наиболее вероятной причины - это процесс устранения - устранение потенциальных причин проблемы. Наконец, для устранения неполадок требуется подтверждение того, что решение восстанавливает продукт или процесс до рабочего состояния.

В общем, устранение неполадок - это идентификация или диагноз о "проблемах" в потоке управления системой, вызванных каким-либо отказом. Первоначально проблема описывается как симптомы неисправности, а устранение неполадок - это процесс определения и устранения причин этих симптомов.

Система может быть описана в терминах ее ожидаемого, желаемого или предполагаемого поведения (обычно для искусственных систем - ее цели). Ожидается, что события или входы в систему приведут к определенным результатам или выходным данным. (Например, выбор опции «печать» в различных компьютерных приложениях должен привести к печатная копия возникающие из какого-то конкретного устройства). Любое неожиданное или нежелательное поведение - это симптом. Устранение неполадок - это процесс выявления конкретной причины или причин симптома. Часто симптомом является неспособность продукта или процесса дать какие-либо результаты. (Например, ничего не печаталось). Затем можно предпринять корректирующие действия для предотвращения подобных сбоев в будущем.

Методы судебная экспертиза полезны при отслеживании проблем в продуктах или процессах, и доступен широкий спектр аналитических методов для определения причины или причин конкретных неудачи. Затем можно предпринять корректирующие действия, чтобы предотвратить дальнейшие отказы подобного рода. Профилактическое действие возможно с помощью режим и последствия отказа (FMEA) и анализ дерева отказов (FTA) перед серийным производством, и эти методы также могут быть использованы для анализ отказов.

Аспекты

Обычно устранение неполадок применяется к чему-то, что внезапно перестало работать, поскольку его ранее работающее состояние формирует ожидания относительно его дальнейшего поведения. Таким образом, первоначальное внимание часто уделяется недавним изменениям в системе или среде, в которой она существует. (Например, принтер, который «работал, когда его воткнули в розетку»). Однако есть хорошо известный принцип, что корреляция не подразумевает причинность. (Например, отказ устройства вскоре после того, как оно было подключено к другой розетке, не обязательно означает, что события были связаны. Сбой мог быть вызван совпадение.) Следовательно, поиск неисправностей требует критическое мышление скорее, чем магическое мышление.

Полезно рассмотреть наш общий опыт использования лампочек. Лампочки «перегорают» более-менее случайно; в конечном итоге повторное нагревание и охлаждение его нить, а колебания мощности, подаваемой на него, вызывают растрескивание или испарение нити. Тот же принцип применяется к большинству других электронных устройств, и аналогичные принципы применимы к механическим устройствам. Некоторые отказы являются частью нормального износа компонентов системы.

Основной принцип устранения неполадок - начать с самого простого и вероятный возможные проблемы в первую очередь. Об этом свидетельствует старая поговорка: «Когда видишь следы копыт, ищи лошадей, а не зебр» или воспользуйся другим Максим, использовать Принцип KISS. Этот принцип приводит к распространенной жалобе на службы поддержки или руководства, которые они иногда сначала спрашивают: «Включен ли он в розетку и есть ли в этой розетке напряжение?», но это не следует воспринимать как оскорбление, скорее, это должно служить напоминанием или кондиционирование всегда проверять простые вещи перед тем, как обратиться за помощью.

Специалист по устранению неполадок может проверить каждый компонент в система один за другим, заменяя заведомо исправные компоненты на каждый потенциально подозрительный. Однако этот процесс «последовательной замены» можно считать дегенеративным, когда компоненты заменяются без учета гипотезы о том, как их отказ может привести к диагностированию симптомов.

Простые и промежуточные системы характеризуются списками или деревьями зависимостей между их компонентами или подсистемами. Более сложные системы содержат циклические зависимости или взаимодействия (петли обратной связи ). Такие системы менее поддаются методам устранения неполадок «пополам».

Это также помогает начать с заведомо исправного состояния, лучшим примером является компьютер. перезагрузка. А когнитивное пошаговое руководство тоже неплохо попробовать. Всесторонний документация произведено опытным технические писатели очень полезен, особенно если он обеспечивает Теория Операции для рассматриваемого устройства или системы.

Частая причина проблем - это плохо дизайн например плохо человеческие факторы конструкция, в которой устройство может быть вставлено задом наперед или вверх дном из-за отсутствия соответствующей функции принуждения (ограничение, формирующее поведение ) или отсутствие терпимый к ошибкам дизайн. Это особенно плохо, если в сопровождении привыкание, где пользователь просто не замечает неправильного использования, например, если две части имеют разные функции, но имеют общий случай, так что при случайном осмотре не видно, какая часть используется.

Устранение неисправностей также может принимать форму систематического контрольный список, порядок устранения неполадок, блок-схема или таблица, созданная до возникновения проблемы. Заблаговременная разработка процедур устранения неполадок позволяет достаточно хорошо продумать шаги, которые следует предпринять при устранении неполадок, и организовать поиск и устранение неполадок в наиболее эффективном процессе устранения неполадок. Таблицы устранения неполадок можно компьютеризировать, чтобы сделать их более эффективными для пользователей.

Некоторые компьютеризированные службы устранения неполадок (например, Primefax, позже переименованный в MaxServ) сразу показывают 10 лучших решений с наибольшей вероятностью устранения основной проблемы. Технический специалист может либо ответить на дополнительные вопросы, чтобы продвинуться по процедуре устранения неполадок, каждый шаг сужая список решений, либо немедленно внедрить решение, которое, по его мнению, устранит проблему. Эти услуги предоставляют скидку, если технический специалист предпримет дополнительный шаг после решения проблемы: отправит отчет о решении, которое фактически устранило проблему. Компьютер использует эти отчеты, чтобы обновить свои оценки того, какие решения имеют наибольшую вероятность устранения этого конкретного набора симптомов.[1][2]

Половина расщепления

Эффективное методическое устранение неисправностей начинается с четкого понимания ожидаемого поведения системы и наблюдаемых симптомов. На основании этого специалист по устранению неполадок формирует гипотезы о потенциальных причинах и разрабатывает (или, возможно, ссылается на стандартизированный контрольный список) тестов для устранения этих предполагаемых причин. Такой подход часто называют "разделяй и властвуй ".

Две распространенные стратегии, используемые специалистами по устранению неполадок, заключаются в том, чтобы сначала проверить часто встречающиеся или легко проверяемые условия (например, проверка, чтобы убедиться, что индикатор принтера горит и что его кабель надежно закреплен на обоих концах). Это часто называют «доением передней панели».[3]

Затем «разделите» систему пополам (например, в системе сетевой печати, проверяя, дошло ли задание до сервера, чтобы определить, существует ли проблема в подсистемах «в сторону» пользователя или «в сторону» устройства).

Этот последний метод может быть особенно эффективным в системах с длинными цепочками сериализованных зависимостей или взаимодействий между его компонентами. Это просто применение бинарный поиск во всем диапазоне зависимостей и часто называют «половинным разбиением».[4]

Воспроизведение симптомов

Один из основных принципов поиска и устранения неисправностей заключается в том, что воспроизводимые проблемы могут быть надежно изолированы и решены. Часто значительные усилия и упор при поиске и устранении неисправностей делается на воспроизводимость ... поиску процедуры, которая надежно вызовет появление симптома.

Прерывистые симптомы

Некоторые из наиболее сложных проблем по устранению неполадок связаны с симптомы, которые возникают периодически. В электронике это часто является результатом термочувствительных компонентов (поскольку сопротивление цепи зависит от температуры проводников в ней). Сжатый воздух можно использовать для охлаждения определенных участков на печатной плате, а тепловую пушку можно использовать для повышения температуры; таким образом, устранение неисправностей электронных систем часто влечет за собой применение этих инструментов для воспроизведения проблемы.

В компьютерном программировании условия гонки часто приводят к перемежающимся симптомам, которые чрезвычайно трудно воспроизвести; могут использоваться различные методы, чтобы заставить конкретную функцию или модуль вызываться быстрее, чем это было бы при нормальной работе (аналогично «нагреву» компонента в аппаратной схеме), в то время как другие методы могут использоваться для увеличения задержек, или принудительная синхронизация между другими модулями или взаимодействующими процессами.

Периодические проблемы могут быть определены таким образом:

Прерывистая проблема - это проблема, для которой не существует известной процедуры последовательного воспроизведения ее симптома.

— Стивен Литт, [5]

В частности, он утверждает, что существует различие между частотой возникновения и «известной процедурой последовательного воспроизведения» проблемы. Например, зная, что периодически возникает проблема. "в" час действия определенного стимула или события ... но то, что иногда это происходит за пять минут, а в других случаях занимает почти час ... не является «известной процедурой», даже если стимул действительно увеличивает частоту наблюдаемых проявлений симптом.

Тем не менее, иногда специалисты по устранению неполадок должны прибегать к статистическим методам ... и могут найти только процедуры, которые увеличивают возникновение симптома до точки, при которой возможна последовательная замена или какой-либо другой метод. В таких случаях, даже когда кажется, что симптом исчезает на значительно более длительные периоды времени, существует низкая уверенность в том, что основная причина был найден, и проблема действительно решена.

Кроме того, могут быть выполнены тесты для нагрузки определенных компонентов, чтобы определить, не вышли ли из строя эти компоненты.[6]

Множественные проблемы

Выявление отказов отдельных компонентов, вызывающих воспроизводимые симптомы, относительно несложно.

Однако многие проблемы возникают только в результате нескольких сбоев или ошибок. Это особенно верно в отношении отказоустойчивой системы или системы со встроенным резервированием. Функции, которые добавляют избыточность, обнаружение неисправностей и аварийное переключение в системе также может произойти сбой, и достаточно большое количество отказов различных компонентов в любой системе «выведут ее из строя».

Даже в простых системах специалист по устранению неполадок всегда должен учитывать возможность наличия нескольких неисправностей. (Замена каждого компонента с использованием последовательной замены, а затем замена каждого нового компонента обратно на старый, когда обнаруживается, что симптом сохраняется, может не решить такие случаи. Что еще более важно, замена любого компонента на неисправный может фактически увеличить количество проблем, а не их устранение).

Обратите внимание, что, хотя мы говорим о «замене компонентов», решение многих проблем включает корректировку или настройку, а не «замену». Например, периодические обрывы проводов - или «грязные или ослабленные контакты» могут просто нуждаться в очистке и / или подтяжке. Все обсуждения «замены» следует понимать как «замену, корректировку или другие модификации».

Смотрите также

Рекомендации

  1. ^ «Устранение неисправностей на кончиках ваших пальцев» Нильс Конрад Перссон. Журнал "Электроника и техника" 1982 Июнь.
  2. ^ «Проблемы диагностики неисправностей для динамических систем» Рона Дж. Паттона, Пола М. Франк, Роберта Н. Кларка.
  3. ^ "Трусы Hewlett Packard Bench" (PDF). Hewlett Packard. Получено 14 октября 2011.
  4. ^ Салливан, Майк (15 ноября 2000 г.). «Секреты супергика: используйте половинное разделение для решения сложных задач». TechRepublic. В архиве из оригинала 8 июля 2012 г.. Получено 22 октября 2010.
  5. ^ "Профессиональный журнал по устранению неполадок, декабрь 98: прерывания". www.troubleshooters.com. Получено 2020-10-14.
  6. ^ «Как решить проблему с компьютером - joyojc.com». www.ocf.berkeley.edu. Получено 9 апреля 2018.