start locating drive что это

Восстановление аппаратного RAID с помощью утилиты MegaCLI для LSI

Процесс замены вышедшего из строя физического диска на сервере с аппаратным RAID контроллером

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Прежде всего определим тип RAID-контроллера.
В данном примере будет рассмотрен вариант с LSI, для других типов будут отдельные статьи, когда под рукой окажется свободный котроллер другой модели.

После определения типа контроллера приступим к установке утилиты для работы с ним.
(ПО обновляется, поэтому актуальную версию проверяйте на официальном сайте LSI.)

Проверяем состояние RAID

Выводим информацию о состоянии дисков:

Как видно из лога, то проблема с одним из дисков:

Также можно вывести полную информацию по дискам подключенным к контроллеру:

Заменяем проблемный диск

Если диск в состоянии Online (в нашем случае Failed), то переводим в состояние Offline.

Отметим диск, как извлеченный

Получаем информацию об извлеченном(-ых) диске(-ах):

Подсвечиваем диск, который требуется заменить:

Если возникла проблема с подсветкой, то используем лампочку активности в качестве индикации:

Удаляем диск из RAID

После этого выполняем процедуру физической замены диска(-ов).

В случае с новым диском, если он содержит метаданные от старого RAID массива, эти данные необходимо затереть.

Проверяем их наличие:

Если таковые имеются, то удаляем следующей их командой:
(к счастью у меня такого добра не обнаружилось)

Выполняем замену (нам потребуются значения параметров Array и Row из предыдущего пункта)

И запускаем Rebuild нового диска:

Если получаем эту ошибку при выполнении команды, то Rebuild запустился автоматически.

Проверяем статус Rebuild и оставшееся время до окончания:

Ну и не забываем отключить индикацию диска:

Бонусы

Отключение звукового оповещения до перезагрузки

Включение и выключение звукового оповещения навсегда:

Проверка приоритета ребилда:

Изменяем приоритет ребилда в % соотношении:

Источник

Locating dying disks in LSI RAID using StorCLI

I often find myself in need of locating disks in an LSI RAID that are not quite dead yet, but in the process of dying. Google knows how to do that using MegaCli, but I totally hate that tool and want to do the same thing using storcli instead, which is a bit less insane. Here’s how.

For a quick glance on which disk might be causing trouble, try:

For disks that are okay, this count should be 0. So in that example, /c0/e8/s2 is broken. Notably though, it’s not yet broken enough to be actually thrown out of the array:

State is still online and the array is not yet degraded, it’s only throwing random IO errors.

Critical Disks

storcli seems to be able to also output this information:

Unfortunately I haven’t yet managed to find out the incarnation necessary to make it actually spit out that info, and the manual is less than helpful in that regard too. 🙁

Locating the disk

Update

A kind soul wrote me that there’s a setting to control this behavior:

It seems to be off by default though, and also this behavior only occurs on our old hardware. We bought new boxen in the meantime, those actually blink the failure LED as they should. So, in conclusion: meh.

Replacing it

After locating it, I just pulled the disk out, added a replacement in, and found the RAID controller had already started rebuilding on its own. Since the replacement disk had been in use before, I’d expected a foreign configuration to show up. But:

Источник

Замена диска в рейде с помощью megacli на контроллере PERC H700

Довелось понастраивать сервер DELL T610 с рейд контроллером PERC H700 на борту. Все как обычно, кроме одного нюанса. Решил проверить, как оперативно выполнить замену сбойного диска. На сервер была установлена стандартная утилита mеgacli для управления всеми контроллерами с драйвером MegaRAID, к коим относится и упомянутый выше. Такая тривиальная задача оказалась не совсем тривиальной и пришлось поковыряться с документацией.

Очень мне понравилось емкое описание процесса у одного админа: «Но замена дисков через такую утилиту — целый hardcore, только для настоящих Tru-админов )).» http://skeletor.org.ua/?p=4093. И я с ним полностью согласен. В принципе, весь процесс у него описан, но я все равно решил поделиться кое-какими дополнениями и своим опытом. Эта megacli такая неочевидная штука, с документацией страниц на 60, что я даже с готовыми примерами соображал некоторое время, какие же значения адаптера, массива, диска, какого-то row, который я никак не мог понять, что это такое, нужно подставить.

У меня был сервер на Debian 8 с 3 рейдами, raid1, raid1, raid10. Я вытаскивал диск из raid10 и заменял его новым.

Сначала проверим состояние наших массивов:

Чувствуете хардкор? Еще нет? Тогда поехали дальше. Обращаю внимание, что последний массив помечен как Degraded, из него вынут диск. Это raid10. К сожалению, я так и не понял, как через megacli посмотреть тип массива. Где тут указано, что в массиве raid10, я не понял. Теперь посмотрим на список дисков:

Нас интересует последний диск. В Firmware state указано Unconfigured(good). Это я уже воткнул новый пустой диск, вместо старого. Если с диском будут какие-то проблемы, то его состояние будет Failed. Дальше вам важно запомнить следующие значения этого диска:

Я немного забежал вперед и поторопился с заменой диска. Я вытащил диск, загрузил сервер, убедился, что он работает без диска и что массив понимает, что он находится в состоянии Degraded. После этого мне нужно было бы выполнить следующие команды.

Отключить сбойный диск:

Пометить его как отключенный:

Я это не сделал, а просто выключил сервер и установил новый диск. После включения убедился, что новый диск присутствует в списке дисков и его статус Unconfigured(good). После этого я указываю контроллеру, что диск заменен:

Над этой командой я долго ломал голову. Расскажу по порядку, что тут к чему.

Array3. Откуда взялась цифра 3? Вот описание:

Выполняем команду просмотра конфигурации:

Получается такая простыня, которую очень трудно читать и анализировать. Грепаю вывод, чтобы разобраться, что тут вообще выходит:

Вижу, что у меня 4 конфигурации, хотя массива только 3. Рассуждаю логически. Так как последний массив это RAID10, то наверно он отображается как 2 RAID1. Проверил внимательно вывод конфигурации, убедился, что так оно и есть. Первые 2 рейда обозначены как DISK GROUP: 0 и 1, а raid10 как SPANNED DISK GROUP: 0, в котором соответственно SPAN: 0 и 1. Один из SPAN имеет статус Degraded и параметр Span Reference: 0x03. Судя по документации, мне надо взять это число 0x03 и отбросить 0x0. Получается цифра 3 и параметр Array3 в команде.

Дальше следует параметр row. Я очень старался понять что это такое 🙂 Описание:

«The number N of the row parameter is the Physical Disk in that span or array starting with zero (it can be but is not always the physical disk’s slot!)».

Только сейчас, когда пишу статью, легко понимаю, откуда берется эта цифра. А когда тестировал сильно тупил и никак не мог сообразить. Сильно мешает очень объемный вывод команд. Я устал глазами бегать по простыням. В общем, это номер диска в сбойном SPAN. В моем случае это второй диск в SPAN, то есть цифра 1, так как отсчет идет с нуля. Таким образом получился параметр row1. Еще раз напоминаю команду замены сбойного диска:

Пока мы только указали, что заменили диск. Теперь нам надо запустить его ребил:

Статус ребилда смотрим командой:

После окончания ребилда снова смотрим вывод информации по массивам и дискам. Массив должен стать Optimal, а диск Online, Spun Up. На этом забываем про megacli как страшный сон и вспоминаем про приятный и удобный mdadm.

Я всегда тестирую выход из строя жесткого диска и его замену. Делаю на всех массивах, железных и софтовых. На железных, чтобы вот таких сюрпризов не было, а была рабочая инструкция. А в софтовых, в основном, чтобы убедиться, что загрузчик стоит на всех нужных дисках и система поднимется в случае чего. По надежности и замене дисков у меня к mdadm вопросов нет. Там все понятно и просто.

Источник

Start locating drive что это

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Всем привет сегодня после того как получилось подружить HP ProLiant DL380 G7 и LSI 9361 8i, хочется разобрать возможность управления RAID контроллером LSI в VMware ESXI 5.5 через командную строку, что на мой взгляд не так удобно как в случае с графическим интерфейсом, но имеет и свои плюсы, более быстрое в случае когда вы набили руку.

Напомню что графический способ подразумевал установку утилиты MSM, почитать это можно в статье как установить MegaRAID SMIS Providers на VMware ESXi 5.5. Для того чтобы вы могли воспользоваться функционалом StorCLI для lsi raid, вам нужно его поставить, ранее я рассказывал Как установить StorCLI в Vmware ESXI 5.5, советую ознакомится. И так приступимс.

storcli команды

Общие команды storcli show

Первым делом переходим в каталог расположения утилиты делается это командой

Посмотреть версию storcli

либо если не переходить в каталог с программой

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Получить справочную информацию по всем командам утилиты storcli

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Посмотреть подсоединенные контроллеры

Нашелся один RAID контроллер.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Для более детальной информации вводим следующую команду.

Как видите тут выводится модель raid контроллера, у меня это Avago MegaRAID SAS 9361-8i, количество портов.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Так как я выяснил, что мой контроллер идет под номером 0, то в дальнейшем он будет выступать под видом /c0.

Посмотрим теперь реально всю информацию о данном RAID контроллере, для этого воспользуемся командой storcli

В итоге получаем вот такую простыню, как можете заметить информации реально вагон, для примера версии всех прошивок, всех утилит, статусы компонентов и количество ошибок.

Generating detailed summary of the adapter, it may take a while to complete.

Cac=CacheCade|Rec=Recovery|OfLn=OffLine|Pdgd=Partially Degraded|dgrd=Degraded
Optl=Optimal|RO=Read Only|RW=Read Write|HD=Hidden|B=Blocked|Consist=Consistent|
R=Read Ahead Always|NR=No Read Ahead|WB=WriteBack|
AWB=Always WriteBack|WT=WriteThrough|C=Cached IO|D=Direct IO|sCC=Scheduled
Check Consistency

Physical Drives = 8

———————————————————————————
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
———————————————————————————
252:0 16 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 850 EVO 1TB U
252:1 17 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 850 EVO 1TB U
252:2 11 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 850 EVO 1TB U
252:3 12 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 840 EVO 1TB U
252:4 8 Onln 0 558.406 GB SAS HDD N N 512B EG0600FBDBU U
252:5 9 Onln 0 558.406 GB SAS HDD N N 512B EG0600FBDBU U
252:6 15 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 850 EVO 1TB U
252:7 10 Onln 1 931.0 GB SATA SSD N N 512B Samsung SSD 850 EVO 1TB U
———————————————————————————

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded

Из полезного еще, можно посмотреть число virtual drive и физических дисков.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Интервал сброса кэша, по умолчанию стоит 4 секунды

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Если происходит проверка консистентности и если находится ошибка, должен ли контроллер прекратить ее или нет.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Так и не понял для чего данная команда Use Disk Activity For Locate, типа использовать дисковую активность для локализации диска.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Посмотреть включены ли alarm

Узнать количество плохих секторов badblocks

Узнать статус включены ли предупреждения от BBU батарейки

Узнать приоритет фоновой инициализации, по умолчанию это значение 30 %, максимально 100, минимальное 0.

Задать поведение контроллера при ошибках во время загрузки

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Работа с Virtual Drive

Первым делом приведу команду которая покажет вам существующие virtual drive на вашем Raid контроллере.

У меня это виртуальный диск на RAID1, размером 558 гб.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Если добавите параметр all, то получите исчерпывающию информацию, из чего состоит данный Virtual Drive (EID дисков), размер stripe и многое еще.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Далее нужно понять какие диски у нас есть, делается это командой

Вы получите список дисков на вашем сервере, если опять добавите параметр all, то информации будет в разы больше. Тут из полезного EID диска, его статус.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Создаем Virtual Drive, сразу советую вам почитать про виды RAID и виды кэша контроллера LSI. Вводим команду

В результате ее выполнения вы получите виртуальный диск размером 1тб raid0, размером strip 128 с выключенным кэшем записи на диске и режимами кэша Read ahead, Direct I/O, Write back.

Возможные параметры virtual drive

Пример команды с диском горячей замены, где 252:3, диск в 3 слоте.

Проверим теперь список виртуальных дисков. Как видите наш vd успешно добавлен.

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Иницилизируем созданный virtual drive

Посмотреть процесс инициализации по всем сразу

Удалить virtual drive выполняется командой, где v1 номер vd.

Изменить настройки virtual drive

Очень важно уметь выполнять настройки на существующих виртуальных томах. И так у нас есть том 1 тб и режимами кэширования direct wb ra, размер stripe изменить уже не получиться, только удаление тома, а вот имя и режимами кэширования, да и расширение можно осуществить.

Изменим для начала имя текущего тома, напомню оно raid0, задаем команду и теперь оно будет new_raid0

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Возможные значения

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Работа с CacheCade

Создаем CacheCade командой

Источник

Как правильно заменить диск в RAID5 на контроллере Supermicro SMC2108?

Есть RAID5 из 8 винтов, контроллер Supermicro SMC2108.
Один из них написал:
Firmware state: Unconfigured(bad)
и вывалился из рэйда. Есть диск под замену.

Можно ли достать диск на горячую и вставить новый?
Пойдет ли автоматом ребилд или надо будет пнуть?

Оценить 2 комментария

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Hot-Plug он поддерживает. Можете на горячую.

А насчет autorebuild, все зависит от настроек ( hwraid.le-vert.net/wiki/LSIMegaRAIDSAS )

start locating drive что это. Смотреть фото start locating drive что это. Смотреть картинку start locating drive что это. Картинка про start locating drive что это. Фото start locating drive что это

Такая же проблема приключилась на AOC-SAS2LP-H8iR 2108, BTR-0018L-0000-LSI. Один из восьми дисков в RAID5 показал Media Error Count: 1. Проблема не назрела, но решили превентивно заменить.
Тоже заходили в MegaRAID BIOS Configuration Utility через нажатие CTRL+M и там НЕТУ «Prepare to removal», как нет и «Assign Global Hot Spare». Есть только «Make offline” и «Locate”, но по индикации диск как моргал, так и продолжил моргать.
Просто извлекли сбойный HDD и вставили на его место новый. Естественно, утилитка показала старый как PD Missing, а новый как Unconfigured. Когда зашли на новый SAS-диск, то RAID-контроллер сам сказал, что Array0_Disk3 missed и предложил сделать REPLACE by new? Y/N?
Согласились, контроллер сделал Rebuild и всё заработало.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *