Введение в анализ, синтез и моделирование систем



              

Е2Е-проекты по системному анализу и моделированию - часть 15


Для автоматического получения базы знаний используется алгоритм классификации заданного класса. Пусть имеется набор объектов, которые необходимо разделить на группы. Определяется функция f(x,y) принадлежности нечеткого отношения типа "сходство" на заданном множестве объектов (для каждой пары объектов x, y). По этой функции определяется обычное (не нечеткое) отношение на множестве объектов, по которому эти объекты разбиваются на классы эквивалентности (классы, в которые попадают только элементы, эквивалентные по данному отношению). Для создания базы знаний (какого типа?) и обучения можно использовать процедуру вида:

  1. определение начальной выборки объектов;
  2. получение частотной таблицы на основе знаний экспертов (первый анализ выборки);
  3. фиксирование начальных правил вывода по этой таблице, например, правил типа "Если ... то ... ", "Если ... и если ... то ... ", "Если ... или если ... то ... " и др.;
  4. итерация (проход) по выборке, с попыткой предсказать исход для каждого объекта по текущим правилам;
  5. если предсказание - неудовлетворительное, то модификация правила;
  6. если процент ошибок неудовлетворителен или стабилизировался, то переход к пункту 4; иначе - вывод заключения системы об обстановке. Фрагмент базы знаний (до обучения) для фактора (параметра) "Состояние почвы" приведен в таблице. 16.1.
Таблица 16.1. Фрагмент базы знанийПараметрЧастотная таблица
Контроль над эррозией5 5 5 6 8 10 12 14 16 15 16
Сооружения для отдыха30 30 30 30 30 30 30 30 30 30 30
Ирригация 5 5 5 6 8 10 12 14 15 16 15
Сжигание отходов5 5 5 6 8 10 12 14 16 15 16
Строительство дорог15 16 15 14 12 10 8 6 5 5 5
Строительство каналов 5 5 5 6 8 10 12 14 16 15 16
Плотины15 16 15 14 12 10 8 6 5 5 5
Туннели16 15 16 14 12 10 8 6 5 5 5
Буровые работы20 20 19 17 14 10 6 3 1 0 0
Открытые разработки20 20 19 17 14 10 6 3 1 0 0
Вырубка лесов15 16 15 14 12 10 8 6 5 5 5
Охота и рыболовство30 30 30 30 30 30 30 30 30 30 30
Растениеводство16 15 16 14 12 10 8 6 5 5 5
Скотоводство15 16 15 14 12 10 8 6 5 5 5
Химическое производство30 30 30 30 30 30 30 30 30 30 30
Лесопосадки5 5 5 6 8 10 12 14 16 15 16
Удобрения0 0 1 3 6 10 14 17 19 20 20
Регулирование животных5 5 5 6 8 10 12 14 15 16 15
Автомобильное движение16 15 16 14 12 10 8 6 5 5 5
Трубопроводы30 30 30 30 30 30 30 30 30 30 30
Хранение отходов15 16 15 14 12 10 8 6 5 5 5
Борьба с сорняками16 15 16 14 12 10 8 6 5 5 5
Течи и разливы30 30 30 30 30 30 30 30 30 30 30

Ниже приведен сценарий и протокол диалога с такой системой.

Протокол диалога (23.02.1998 - Понедельник, 11: 23: 37)

Входные данные:

  1. Контроль над эрозией: 0,6
  2. Сооружения для отдыха: 0,1
  3. Ирригация: 0,9
  4. Сжигание отходов: 1,0
  5. Строительство мостов и дорог: 0,6
  6. Искусственные каналы: 0,5
  7. Плотины: 0,3
  8. Туннели и подземные сооружения: 0,9
  9. Взрывные и буровые работы: 0,45667
  10. Открытая разработка: 0,567
  11. Вырубка лесов: 0,345
  12. Охота и рыболовство: 0,234
  13. Растениеводство: 0,678
  14. Скотоводство: 0,648
  15. Химическая промышленность: 0,2456
  16. Лесопосадки: 0,54846
  17. Удобрения: 0,6
  18. Регулирование диких животных: IGNORE (игнорируется фактор)
  19. Автомобильное движение: 0,6
  20. Трубопроводы: 0,0
  21. Хранилища отходов: 0,0
  22. Использование ядохимикатов: 0,2
  23. Течи и разливы: 0,0

Принятие решения о социо-экономико-экологической обстановке:

  1. Состояние почвы: 0,55177 (слабое положительное)
  2. Состояние поверхностных вод: 0,52969 (слабое положительное)
  3. Качественный состав вод: 0,62299 (некоторое положительное)
  4. Качественный состав воздуха: 0,61298 (некоторое положительное)
  5. Температура воздуха: 0,48449 (слабое отрицательное)
  6. Эрозия: 0,59051 (слабое положительное)
  7. Деревья и кустарники: 0,54160 (слабое положительное)
  8. Травы: 0,59051 (слабое положительное)
  9. Сельхозкультуры: 0,51698 (слабое положительное)
  10. Микрофлора: 0,48702 (слабое отрицательное)
  11. Животные суши: 0,59804 (слабое положительное)
  12. Рыбы и моллюски: 0,51525 (слабое положительное)
  13. Насекомые: 0,56000 (слабое положительное)
  14. Заболачивание территории: 0,50000 (слабое положительное)
  15. Курорты на суше: 0,52729 (слабое положительное)
  16. Парки и заповедники: 0,54668 (слабое положительное)
  17. Здоровье и безопасность: 0,62870 (некоторое положительное)
  18. Трудовая занятость людей: 0,51196 (слабое положительное)
  19. Плотность населения: 0,55539 (слабое положительное)
  20. Соленость воды: 0,48750 (слабое отрицательное)
  21. Солончаки: 0,57000 (слабое положительное)
  22. Заросли: 0,62935 (некоторое положительное)
  23. Оползни: 0,70588 (выраженное положительное)

9. Разработать экспертную систему для консультирования и экспертных суждений при решении задач: выработки (оптимизации) политики предоставления налоговых отчетов с целью уменьшения налоговых платежей законными методами (например, прогноза налоговых последствий операций с активами); легализации доходов и уменьшения сокрытия доходов. Ядро экспертной системы взаимодействует с приложениями типа "Мастер" для решения конкретных проблем. Данные вводятся из Книги доходов и расходов. Ядро экспертной системы взаимодействует (рис. 16.1) с приложениями типа "Мастер" для решения конкретных проблем: 1) Мастер Р (регистраций) решает задачу формулировки пользователем исходного состояния, заполнения отчетных документов; 2) Мастер Т (расходов и доходов) представляет необходимую информацию о доходах и расходах; Мастер О (оптимизации) решает задачу оптимальной легализации доходов, т.е. приведения в соответствие доходов и расходов; Мастер Д (отчетных документов) решает задачу своевременного и полного представления необходимых документов в налоговые органы; Мастер К (консультаций) решает задачи эксперта-консультанта при представлении данных.

Структура экспертной системы

Рис. 16.1.  Структура экспертной системы

10. Моделирование процесса обучения иностранному языку относится к классу плохо формализуемых и плохо структурируемых систем. Причина в том, что язык с его законами и правилами, которые имеют массу исключений, усложняющих процесс универсализации языковых явлений, плохо поддается формализации, а, следовательно, математическому описанию. Тем не менее, в последние годы уделяется большое внимание компьютерному и математическому моделированию процесса обучения иностранному языку. Известно, что лексический фонд любого языка достаточно велик и овладеть им полностью человек не в состоянии. Как правило, активный словарный запас взрослого равен приблизительно 10% всего запаса языка. Овладение языком зависит от наличия или отсутствия языковой среды. Практика показывает, например, что человек, изучающий иностранный язык вне языковой среды в течение 6 лет, должен овладеть 3000 слов. Это количество специально отобранных слов позволяет понять 95% любого текста. Специалисты в области преподавания языка (в частности, неродного) утверждают, что человек в течение одного двухчасового занятия может усвоить приблизительно 15 слов. Поэтому предполагается, что вначале можно усваивать 20-25 слов, а далее это количество уменьшить. Это мнение не распространяется на все системы обучения языку. Например, на протяжении ряда лет проводился обучающий эксперимент в Рижском педагогическом институте, который показал, что в состоянии релаксации (психического и физического расслабления, вызываемого внушением) за 20 минут студенты усваивали объем информации в виде фраз до 200 слов. Результаты и других экспериментов подтвердили, что в состоянии релаксации усваивается большой объем лексики. Она прочно запоминается и легко извлекается из памяти в процессе разговора. Существенную помощь в обучении языку может оказать компьютерное и математическое моделирование этого процесса, в частности, процесса обогащения (запоминания) словарного запаса учащихся. Выдвинем гипотезу: если человек обладает максимальной способностью запоминать слова, то словарный запас можно определять как xmax=const. Оставшийся до уровня насыщения xmax запас слов в момент времени t равен величине xmax-x(t)=y(t), где x(t) - количество слов, которые обучаемый запоминает в момент времени t (0<t

T). Если исходить из гипотезы, согласно которой скорость изменения словарного запаса (темп изучения) прямо пропорционален x(t), то получаем уравнение:

x'(t)=k(xmax-x(t)) , x(0)=x0 ,

где k - коэффициент пропорциональности, отражающий динамические характеристики темпа изучения. Решая это уравнение, можно получить закон изменения словарного запаса обучаемого:

x(t)=xmax(1-exp(-kt))+x0exp(-kt).

В гипотезе не учитывались некоторые характеристики обучаемого и факторы, тормозящие обучение. Построить и исследовать новую аналогичную модель при новой гипотезе: k зависит от x по простому закону k=ax, где a>0 - некоторый параметр. Построить банк функций k и обучить модель на них. Предположив, что k колеблется в течении всего времени занятий, например, по закону k=A(C+sint), где A - коэффициент, определяемый с помощью уровня памяти, C - число, зависящее от t, определяющее работоспособность, построить и исследовать соответствующую модель. Рассмотреть во всех случаях 3 режима моделирования: а) скорость запоминания слов известна; б) скорость запоминания слов неизвестна; в) максимальный запас слов неизвестен. Для определения уровня памяти использовать простейший тест: пользователю предлагаются буквы, которые надо запомнить, а затем воспроизвести; уровень памяти - число правильно воспроизведенных букв, деленное на число всех букв и затем умноженное на 0,06. Применить к проблеме оценки времени достижения некоторого задаваемого запаса слов, например, сдачи TOEFL. Усложнить (улучшить) и исследовать модель.




Содержание  Назад