6

Метод динамического программирования, анализ через ретроспективу и планирование?
0

Автор вопроса: Timber
11 месяцев 9 дней
         
         
Спрятать статью

Метод динамического программирования, анализ через ретроспективу и планирование.

Вектор цели этой публикации многослоен как луковица,
это и проверка предположений и желание указать на фактор среды…,
надеюсь добрые люди не оставят без внимания затронутые вопросы...


Скажите вы знаете, чтобы в практике кто-либо указывал на то, что применял метод динамического программирования из ДОТУ, вот у меня до этого момента было уверенность его в сложности.

Но как оказалось в той или иной мере каждый в своей жизни пользуется этим методом, только до этого эти (его) действия имели другое название или вообще названия (для него) не имели.

Попробую изложить свою точку зрения и для этого приведу две практические задачи:
- как ретроспективу с целью анализа и поиска аналогий, управление логистикой хозяйственного подразделения;
- планирование мероприятий для организации создания, производства и распространения детских настольных игр, о которых говорилось ранее.

Для синхронизации понятийного аппарата (в дальнейшем тексте «СПА») напомню ключевые параметры отнесения управления к динамическому программированию.

Метод динамического программирования работоспособен, если формальная интерпретация реальной задачи позволяет выполнить следующие условия

(в таблице приводится без пояснений, для просмотра пояснений можно обратится к ДОТУ стр. 104, 105 или к анализу ДОТУ):

таблица №1
Условия формальной интерпретации задачи
1 Рассматриваемая задача может быть представлена как N-шаговый процесс, описываемый соотношением: Xn + 1 = f(Xn, Un, n)
2 Структура задачи не должна изменяться при изменении расчетного количества шагов N
3 Размерность пространства параметров, которыми описывается состояние системы, не должна изменяться в зависимости от количества шагов N
4 Выбор управления на любом из шагов не должен отрицать выбора управления на предыдущих шагах.
5 Критерий оптимального выбора последовательности шаговых управлений Un и соответствующей траектории в пространстве формальных параметров имеет вид: V = V0(X0, U0) + V1(X1, U1) + + VN - 1(XN- 1, UN - 1) + VN(XN)


Кроме того есть еще условия для работоспособности метода динамического программирования.

таблица №2
Условия работоспособности метода динамического программирования
1 объективно закрывает возможности к использованию метода динамического программирования (поскольку начало и конец процесса должны быть определены в пространстве параметров, на которых построена математическая (или иная) модель метода, которая должна быть метрологически состоятельной, что является основой её соотнесения с реальностью):
- неспособность определить вектор целей управления (достижением которого должен завершиться оптимизируемый в методе процесс) и (или);
- неспособность выявить исходное состояние объекта управления;
- причём определённость завершения оптимизируемого процесса имеет управленчески большее значение, чем ошибки и некоторые неопределённости в идентификации (выявлении) начального состояния объекта управления.
2 алгоритму динамического программирования, даже если его можно запустить, сопутствует ещё одно внешнее обстоятельство, которое тоже очевидно, “само собой” разумеется, но в большинстве случаев игнорируется:
-завершающее частный оптимизируемый процесс состояние должно принадлежать объемлющему процессу, обладающему заведомо приемлемыми собственными характеристиками течения событий в нём.


Начну с ретроспективы, а именно управление логистикой хозяйственного подразделения/
Не стану утомлять всех описанием вектора цели и текущего состояния среды, чтобы подтвердить ключевые параметры возможности применения метода динамического программирования (проверьте они определены), а перейду к образам – графическому отображению процессов.

Графические материалы (визуализация процессов) приводятся для СПА, т.е. для однозначного понимания всеми транслирующихся задач, а в данной статье приводится чтобы показать: составленные пиктограммы вполне можно отнести к «методу динамического программирования» (в дальнейшем тексте «МДП»).

Только в рассматриваемой ретроспективе это называлось «визуализация процессов», «хронометраж», «технологическая карта процессов», «сетевое планирование и управление»  и т.п.

Возможны возражения, что понятие «МДП» шире чем, например понятие «хронометраж», согласен, но ведь МДП это обобщенное, объемлющее понятие из нового понятийного аппарата!

ZM.png
Схема описывающая процессы на складе

Для просмотра картинки в большем разрешении воспользуйтесь ссылкой (для открытия в новой вкладке в большем формате нажимайте на колесико мышки).
Как можно понять из схемы, она:
- охватывает только действия работников компании на складе а «исходящие потоки» приводятся в других схемах, касающихся этих «потоков»;
- отражает узловые моменты - самый оптимальный порядок действий персонала в рабочем процессе;
- является объемлющей для всех процессов рабочей смены, отражает общий алгоритм, и результат действий каждого работника в процессе участия (их индивидуальный алгоритм).
Вот как выглядит описание индивидуального алгоритма, вложенного в приведенную схему.

Но вернемся к теме статьи и проверим данную схему на предмет правильности отношения её к МДП.

таблица №3
Условия формальной интерпретации задачи Выполнимость условия Пояснения
1 Рассматриваемая задача может быть представлена как N-шаговый процесс, описываемый соотношением: Xn + 1 = f(Xn, Un, n) ? да Необходимо определить, что в данном частном случае есть «шаги N». Это определенные временные интервалы (на которые разбита рабочая смена) в которые должны быть сделаны определенные действия для того, чтобы был достигнут вектор цели.
2 Структура задачи не должна изменяться при изменении расчетного количества шагов N да При добавлении или уменьшении количества «шагов N» в зависимости от изменения среды меняется ли структура задачи? Нет! Процесс включает в себя всё, что необходимо сделать: сдвиг во времени или включение новой задачи не изменяет структуры задачи.
3 Размерность пространства параметров, которыми описывается состояние системы, не должна изменяться в зависимости от количества шагов N да Основной параметр описания состояния системы это время, возможность выполнить всё в указанное время. Как бы количество шагов не менялось, в следующей смене, процесс обязан повторится.
4 Выбор управления на любом из шагов не должен отрицать выбора управления на предыдущих шагах. да оптимальный выбор управления в любом из возможных состояний:
1. определяется параметрами рассматриваемого состояния, а не параметрами процесса, в ходе которого система пришла в рассматриваемое состояние, т.е. есть временные рамки и успешное управление это достижение определенного состояния в процессах.
2. одному состоянию соответствуют разные предыстории его возникновения, влияющие на последующий выбор оптимального управления, но все они вписываются в размерность шагов.
5 Критерий оптимального выбора последовательности шаговых управлений Un и соответствующей траектории в пространстве формальных параметров имеет вид:
V = V0(X0, U0) + V1(X1, U1) + + VN - 1(XN- 1, UN - 1) + VN(XN)
да Полный «выигрыш» это оптимизированный рабочий процесс и вовремя доставленная качественная продукция, он состоит из «шаговых выигрышей», т.е. успешных последовательных шагов – выполненных операций рабочей смены. Структура управления не запрещает при необходимости на каждом шаге употреблять критерий определения шагового выигрыша Vn, отличный от критериев, принятых на других шагах.  


Таким образом, описание (отображение) данного частного процесса соответствует МДП.

      Во втором рассматриваемом частном случае, а именно: планирование мероприятий для организации создания, производства и распространения детских настольных игр, так же существует необходимость применить МДП, так как формируется окончательный хозяйственный план.

Поэтому, (см. пункт 1 таблицы №2) уточняем вектор цели и вектор текущего состояния.
Опишу их как можно короче, почему сделаны именно такие выводы можно посмотреть по ссылке и в последующих и предыдущих (ссылке) сообщениях темы.

Вектором цели проекта является создание возможности для ребенка на примере настольной игры приобрести полезные навыки распознавания среды в части шести приоритетов обобщенных  средств управления, т.е. адаптация ДОТУ для самого юного для восприятия данной информации возраста.

Однако для того, чтобы ребенок мог воспользоваться таким способом получения информации о мироздании как игра, её необходимо ему донести – т.е. игра должна быть произведена и попасть в руки ребенка.

А для этого необходимы следующие циклические действия (алгоритмы, процессы), которые условно можно разбить на:
- разработка сценария, сюжета;
- перевод сюжета, сценария в образы доступные для понимания ребенком;
- создание компьютерного макета игры (модель);
- перенос образов на носитель - изготовление игр (печать, строительство, если это малые формы, и т.п.)
- распространение игр, и т.д.

Таким образом вектор цели «создание возможности для ребенка на примере настольной игры приобрести полезные навыки распознавания среды в части шести приоритетов обобщенных  средств управления» является вложенным алгоритмом, в более объемлющий процесс: «устойчивость алгоритма продуцирования тем для игр» а тот в свою очередь в алгоритм общего вектора цели, а именно: распространение игр обучающей, развивающей тематики на основе знаний полученных из материалов ВП СССР!

Вектор текущего состояния возможно вы все знаете, если нет то частично описан, я же постараюсь максимально коротко изложить его суть:
Условное понятие «воспитание детей» состоит из нескольких условных составных частей (возможны исключения):
- личный пример семьи (ядро воспитания);
- пример окружающей ребенка среды (ближний круг);
- пример всего социума получаемого из средств массовой информации (среда);
- пример ИНВОУ (Бог, Природа, Вселенная) (объемлющая оболочка).

Всё вместе это составляет условные 100% и в зависимости от того, какое из влияний превалирует, такой получается и «конечный продукт».

В связи с существующим разделением труда и невозможностью ребенка взрослеть, большую часть времени, непосредственно наблюдая за трудом и поведением родителей в обществе, влияние ядра практически замещается влиянием других условных «составных частей».

То общение в семье, которое в большинстве наблюдают дети это не управление в понятиях ДОТУ, это отказ от управления, я уже предлагал критикам посчитать, сколько времени в день, в неделю (в минутах) они проводят со своими детьми и сравнить это с продолжительностью другого влияния (общения), телевизор, интернет, и др.

Настольная игра, если сравнивать её по информационному наполнению со всей информацией в мире, это невидимая песчинка, практически «не заметная даже в микроскоп», но это попытка использовать сложившиеся механизмы «отделения детей от родителей и воспитания их культурой» в обществе и:
- донести (на «волне» существующих управляющих механизмов) и полезные навыки ребенку- т.е. предоставить выбор (которого раньше не было) и дать ту  информацию, которая до сих пор не давалась;
- частично восполнить «вакуум личного примера родителей», через положительные и отрицательные примеры из игр;
- и др. 

Для составления схемы по МДП воспользуемся предположениями о том, что общий алгоритм балансировочного режима проекта состоит из следующих алгоритмов:

таблица №4
Устойчивость управления проектом (самоуправления) для сохранения балансировочного режима
1 Устойчивость алгоритма продуцирования тем для игр
2 Устойчивость алгоритма перевода идей игр в образы понятные для ребенка
3 Устойчивость алгоритма создания игрового поля для игры по предложенной тематике
4 Устойчивость алгоритма перевода созданных игр на носитель (бумажный электронный, малая архитектурная форма и т.п.)
5 Устойчивость алгоритма распространения игр через предпринимательскую и благотворительную деятельность
6 Устойчивость финансовой деятельности проекта для самовоспроизведения всех алгоритмов


Понятно, что можно оптимизировать (изменить, заменить, сократить или дополнить) общий алгоритм, но данной статье ставится вопрос не как улучшить (это кстати вы тоже можете сделать, участвуя на соответствующих информационных площадках инициаторов виртуальной структуры) а в том, чтобы создать схему будущих процессов используя МДП, т.е. в практических навыках с большим числом участников и наблюдателей, что необходимо для адекватности проекта.

Поэтому, если допустить, что у нас имеются шесть ключевых параметров схемы из «матрицы возможных состояний проекта», уже составленных в определенной последовательности, которая кажется автору оптимальной, то можно составить схему.
Но для этого необходимо ещё определить (принять) некоторые параметры:

таблица №5
Условия формальной интерпретации задачи Необходимость определить (принять) параметр Предположения по параметру
1 Рассматриваемая задача может быть представлена как N-шаговый процесс, описываемый соотношением: Xn + 1 = f(Xn, Un, n) В каких единицах измерять «шаг «n»» Для всего процесса нельзя применять параметр «время» как единицу N-шагового процесса, время важно, но для данной модели важно завершение цикла каждого из алгоритмов, это и будет единица измерения «шага «n»»
5 Критерий оптимального выбора последовательности шаговых управлений Un и соответствующей траектории в пространстве формальных параметров имеет вид:
V = V0(X0, U0) + V1(X1, U1) + + VN - 1(XN- 1, UN - 1) + VN(XN)
Обязательные условия работоспособности  МДП Шесть приведенных выше алгоритмов, где существует необходимость управления каждым из процессов

Таким образом, схема матрицы возможных состояний проекта может выглядеть так:

MDP.jpg
Схема матрицы возможных состояний проекта


Возможно, приведенный график несколько разочарует:
- тех, кто считает, что изложенное в ДОТУ необходимо передавать друг -другу в неизменной форме «как один монолит» (т.е. догматически), без анализа и о-свое-ния;
- тех, кто ожидал, что само слово МДП есть магическая формула, позволяющая достичь успеха без работы, а приведенный график ни о чём (на первый взгляд) не говорит.

Можно конечно сказать, что на графике (матрица возможных состояний) приведенном в ДОТУ можно проследить критерии оптимального выигрыша на каждом из «n-шагов», а здесь нет.

Есть простые доказательства:
- попробуйте рассмотреть известную из ДОТУ схему, если на ней не будут указаны шаговые выигрыши. Какой путь тогда окажется оптимальным?!!!
- попробуйте рассматривать приведенную схему как объемлющую и допустите (гипотетически), что каждый «n-шаг» это цикл определенных действий, которые так же можно описывать через МДП, до тех пор, пока действия не станут понятны (и приняты) для всех.
Кроме того, сделать схему включающую все параметры не всегда оправдано, так как вследствие большого количества связей схема будет нелегка для восприятия, этому есть примеры: пример1, пример2.

Обращу внимание, что тема в части МДП для детских настольных игр не раскрыта и каждый, если ему будет интересно, сможет предложить своё видение как самой схемы так и «n-шагов» в процессах.
Сможет если будет интерес и если конечно будет что сказать по-существу темы.

P.S. Возможно, если тема статьи слишком проста для восприятия некоторых людей, может опять возникнуть вопрос: какова цель публикации, «зачем всё разбирать а потом собирать – ведь и так всё понятно», «вы не с того начинаете» и т.п., но всегда возникает к ним вопрос, если для вас всё очевидно и вы всё знаете, где ваши грандиозные изменения этого мира?! Или вас всё устраивает?! А может это «маниловщина»?

Ответ, который возможно частично предотвратит такие вопросы: вектор цели описан в начале статьи, но можно привести ещё несколько очевидных истин (на что возможно нужно обратить внимание), если касаться описанной выше темы;
- в методе динамического программирования нет ничего сложного;
- теперь вы любое свое (чужое) действие, что задумали (запрограммировали), если вам интересно, сможете осознано представить через МДП (согласно представленных таблиц);
- метод динамического программирования это возможность адекватно передавать тот эмпирический опыт управления, которым ранее нелегко было обмениваться как методом, вследствие отсутствия необходимого терминологического аппарата!

источник