интеллектуальные информационные системы и технологии что это
Информационные интеллектуальные сети и Семантический Веб
Информационные интеллектуальные сети, Семантический Веб, Веб 3.0, ИИ… Эти слова все чаще стали появляться в нашем обиходе.
Целая эпоха универсального Интернета заканчивается. Она начинает сменяться до того, как мы начинаем это ощущать. На смену едва оформившемуся термину Web 2.0 уже приходит другой, непонятный и загадочный на первый взгляд — Web 3.0, или же просто «Семантический Веб».
О том, что это такое и куда движется наш интернет, я хотел поговорить в этой статье.
Сейчас сеть становится персональной. «Интернет все больше знает о нас». Отчасти, мы сами способствуем этому, раздавая свою персональную информацию в социальных сетях, пользуясь поисковыми системами, будучи авторизованными.
Это означает, что скоро, вводя в строку поиска «Хочу постричься недорого», пользователь получит ответ в виде ближайшей парикмахерской к его местоположению в виде четкого ответа на четкий вопрос – нам не надо будет переходить по 10, 20, 50 ссылкам из поисковой выдачи разных поисковиков, расстраиваясь в очередной раз, что очередная открытая вкладка – это очередной дорогой салон, продвигаемый силами SEO специалистов.
Это касается различных сфер жизни и деятельности человека – начиная от бытовых и заканчивая более глобальными. Например, покупка автомобиля или квартиры, поиск работы и другие.
Более того, поисковая система сможет определить, какой именно автомобиль нужен пользователю на основе информации о том, какими тест-драйвами он больше всего интересуется и какие автомобильные сайты посещает, в каком районе и в каком ценовом диапазоне вы хотите найти квартиру, не голодны ли вы, какую еду предпочитаете и так далее.
С развитием семантического веба после сбора определенных данных о пользователе технологии позволят составить его социально-демографический портрет. Собранные пользовательские данные компьютеры будут понимать уже как портрет личности.
Во многом такой динамике способствует стремление упростить сервисы и сделать упрощенный доступ пользователей к контенту. Ставшая модной в последняя время, авторизация через социальные сети (Вконтакте, Facebook), специальные сервисы (OpenID, OAuth), комментирование через виджеты социальных сетей.
Наши сотовые сети завязывают на себя персональную информацию.
Информация – вот что будет играть решающую роль в будущем интернете!
Продвигаемая крупными игроками рынка технология NFC – предоставляющая возможность совершать покупки, используя мобильный телефон (в том числе, оплачивать проезд в метро, например), все больше связывает наши сим-карты, телефоны, банковские карты, стягивая нашу персональную информацию в единую точку.
Попробуем во всем разобраться, но пока начнем по порядку с малого. Для начала давай-те вместе с вами рассмотрим интеллектуальные информационные системы (ИИС).
Информационные интеллектуальные системы
ИИС (intelligent information system) – это информационная система, которая основана на концепции использования базы знаний для генерации алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей.
Особенности и признаки интеллектуальности ИС
Коммуникативные способности ИИС характеризуют способ взаимодействия (интерфейса) конечного пользователя с системой.
Интеллектуальными считаются задачи, связанные с разработкой алгоритмов решения ранее нерешенных задач определенного типа
Интеллект представляет собой универсальный алгоритм, способный разрабатывать алгоритмы решения конкретных задач.
Если в ходе эксплуатации ИС выяснится потребность в модификации одного из двух компонентов программы, то возникнет необходимость ее переписывания. Это объясняется тем, что полным знанием проблемной области обладает только разработчик ИС, а программа служит “недумающим исполнителем” знания разработчика. Этот недостаток устраняются в интеллектуальных информационных системах.
Недостатки ИС и их устранение в ИИС
Классификация ИИС
I класс: системы с интеллектуальным интерфейсом (коммуникативные способности):
II класс: экспертные системы (решение сложных задач):
III класс: самообучающиеся системы (способность к самообучению):
Интеллектуальные БД
Интеллектуальные БД – отличаются от обычных возможностью выборки по запросу информации, которая может явно не храниться, а выводиться из имеющейся БД (например, вывести список товаров, цена которых выше отраслевой).
Естественно-языковой интерфейс предполагает трансляцию естественно-языковых конструкций на машинный уровень представления знаний. При этом осуществляется распознавание и проверка написанных слов по словарям и синтаксическим правилам. Данный интерфейс облегчает обращение к интеллектуальным БД, а также голосовой ввод команд в системах управления.
Гипертекстовые системы предназначены для поиска текстовой информации по ключевым словам в базах.
Системы контекстной помощи – частный случай гипертекстовых и естественно-языковых систем.
Системы когнитивной графики позволяют осуществлять взаимодействие пользователя ИИС с помощью графических образов.
Семантический Веб
HTML-страница описывает как представить информацию визуально в Веб-браузере и трудно поддаётся смысловому анализу компьютерами. Для неё невозможно автоматизировать даже такие тривиальные задачи, как нахождение людей, проектов, программ в Интернете.
Технология Семантический Веб (Semantic Web) позволяет компьютеру интерпретировать информацию в Вебе наравне с людьми, для чего разработана графовая модель описания ресурсов RDF (Resource Description Framework), которая является спецификацией W3C.
С помощью RDF можно создавать любые утверждения о любых ресурсах.
Графовая модель RDF
Утверждения о ресурсах в модели RDF состоят из троек.
Ресурсы и свойства представляются в виде URI, а литералы в формате Unicode. URI позволяет уникальным образом идентифицировать ресурсы в Вебе, а Unicode решает проблему мультиязычности.
RDF схема – это не XML схема
RDF схема описана в утверждениях RDF.
В отличие от XML схемы определяет ресурсы (термины) предметной области, а не ограничивает структуру RDF.
За ресурсами RDF схемы в спецификации W3C закреплена семантика.
Пример RDF схемы, описанной с помощью RDF
Семантика данных – что это такое?
Под семантикой данных будем понимать возможность формального описания смысла передаваемых данных, делая их независимыми от приложений. Это особенно важно в контексте рассматриваемых нами перспектив развития Интернета – побеждает тот, у кого есть данные. Может быть очень много приложений, сайтов, сервисов, но сами по себе они будут очень мало чего значить. Будут выигрывать те, кто сможет предоставлять свой контент в любом, удобном пользователю контенте.
Какие данные можно использовать независимо от сервисов, в которых они используются сегодня: данные из баз данных, XML-документы, приложения в социальных сетях? Нет, потому что их семантика зашита в логике программы и/или неформально в спецификациях. Только данные снабжённые явной семантикой можно сделать действительно независимыми от приложений!
Зачем нужен RDF? Чем плох XML?
Вложенность тегов XML несет только синтаксис, но не несёт никакой семантики. Если мы рассмотрим различные возможные формы представления утверждения “Иван Петров преподает курс информатики” в формате XML:
Приложение, которое использует первый формат, не сможет понять два других формата и наоборот. Поэтому, XML хорош только как формат (синтаксис) для обмена данными, но не как модель описания семантики данных! Это же можно сказать и про другие популярные форматы (JSON, например).
Где в RDF семантика?
На уровне модели RDF семантика появляется благодаря использованию онтологий OWL (Ontology Web Language), благодаря которым компьютер может понимать, как известный ему ресурс или свойство связано с другим, неизвестным ему ресурсом или свойством соответственно и производить другие логические выводы над утверждениями RDF.
Онтологии основываются на математическом аппарате формальной логики (description logic, DL), малое подмножество которого охвачено RDF схемой. DL является вычислимым подмножеством логики первого порядка.
Пример использования семантики
Как проинтерпретирует следующие утверждения приложение, которое понимает только ресурсы словаря foaf?
Оно поймёт, что Pugofka: semantic #Lector является foaf:Person и выведет новое утверждение:
Семантические хранилища
Предполагается, что большие объёмы RDF данных будут храниться в семантических хранилищах и для доступа к ним использоваться язык запросов SPARQL – аналог SQL.
Пример запроса “вывести все проекты, созданные Pugofka” на SPARQL:
В качестве примеров развития направления можно привести создание новых проектов. Так, например, компания «Clark&Parsia» (http://clarkparsia.com/) уже имеет несколько серьезных проектов в сфере Семантического Веба, и на первые числа Апреля назначен старт бета-тестирования RDF-базы данных под названием StarDog.
Уровни Семантического Веба
Эволюционный подход
Семантический Веб это не замещение существующего интернета, а всего лишь его эволюционное развитие. RDF/XML либо внедряется внутрь HTML или доступен по URL.
По этому принципу уже широко используются в WWW RDF-данные с использованием словарей RSS, FOAF (Friend Of A Friend), DOAP (Description Of A Project).
Пример кода FOAF на странице пользователя LiveJournal
Семантический веб – цели, задачи, примеры
Семантический Веб создан не на пустом месте. В него заложены фундаментальные основы:
Технологии, которые задействованы в Семантическом Вебе
Примеры программной поддержки технологии
Направления исследования
Задачи и проблемы Семантического Веба:
Заключение
Семантический Веб – это динамичная, постоянно развивающаяся концепция, а не набор комплексных, работающих систем.
Веб 3.0 – очень многогранное и, на текущий момент, до сих пор не сформированное понятие. Его можно рассматривать с разных точек зрения.
Например, с точки зрения машинной обработки данных – Семантический веб – это идея хранить данные такие образом, чтобы они были определенными и связанны, а также существовала возможность их дальнейшей автоматизированной обработки, интеграции и многократного использования в различных сервисах, приложениях и т.п.
С точки зрения интеллектуальных агентов, то целью будет являться более «машиноориентированный» Веб,
с тем, чтобы можно было наиболее эффективно использовать поисковых пауков (агентов) для поиска и обработки информации.
С точки зрения распределенных баз данных, баз знаний, то концепция Семантического Веба заключается в описании, добавлении дополнительной мета информации, которая позволяет однозначно идентифицировать и сопоставить информацию.
Концепция Веб 3.0 подразумевает наличие целой инфраструктуры.
С точки зрения обслуживания пользователей (потребителей контента) – идея Веб 3.0 заключается в минимизации действий пользователю и выдаче в качестве ответа на его запрос непосредственного ответа на его запрос, который будет учитывать не только его запрос, но и всю его историю, особенности (социально–психологический портрет), вкусы, интересы и многие другие факторы.
С точки зрения качества поиска – реализация поиска не только по ключевым словам или контексту, но и по контенту. Выдача точного ответа на запрос пользователя. Во многом, использование поисковой системы, как экспертной системы.
С точки зрения веб-сервисов Семантический Веб обеспечивает доступ не только к существующим статическим сайтам, но и к динамическим, приложениям, сервисам и другим ресурсам, содержащим полезный контент.
Интеллектуальные информационные технологии (история и тенденции развития)
Сегодня в области автоматизации управления анализ информации доминирует на предварительной стадии подготовки решений — обработки первичной информации, декомпозиции проблемной ситуации. Все это позволяет познать лишь фрагменты и детали процессов, а не ситуацию в целом. Для преодоления этого недостатка надо научиться строить базы знаний, используя опыт лучших специалистов, а также генерировать недостающие знания.
Использование информационных технологий (ИТ) в различных сферах человеческой деятельности, экспоненциальный рост объемов информации и необходимость оперативно реагировать в любых ситуациях потребовали поиска адекватных путей решения возникающих проблем. Эффективнейшим из них является путь интеллектуализации информационных технологий.
Под интеллектуальными информационными технологиями обычно понимают такие информационные технологии, в которых предусмотрены следующие возможности:
На рис. 1 дано схематичное представление интеллектуальной системы.
Уникальная особенность интеллектуальных информационных технологий (ИИТ) — их «универсальность». Они практически не имеют ограничений по применению в таких областях, как управление, проектирование, машинный перевод, диагностика, распознавание образов, синтез речи и т. д.
|
Людмила Сергеевна Болотова, проф. МИРЭА, д. т. н., академик РАЕН, e-mail: Bolotova@mtu-NET.ru |
ИИТ также находят широкое применение для распределенного решения сложных задач, совместного проектирования изделий, построения виртуальных предприятий, моделирования больших производственных систем и электронной торговли, электронной разработки сложных компьютерных систем, управления системами знаний и информации и т. п. Еще одно эффективное применение — поиск информации в Internet и других глобальных сетях, ее структуризация и доставка заказчику.
Однако средства автоматизации управления и информатизации все еще не стали настоящими помощниками руководителей всех уровней. Более того, там, где эти средства могут принести наибольший эффект (поддержка принятия своевременных и обоснованных решений на высших уровнях управленческой иерархии), они практически не используются.
Проблемы принятия решений управленцем
Первая проблема. Современный руководитель принимает решения в весьма противоречивых условиях. С одной стороны, он должен учитывать в решениях все большее число факторов и данных, с другой — повышать качество принимаемых решений. При этом факторы различаются по значимости и влиянию на качество решения.
От руководителя требуется четкость и своевременность действий, обоснованность и понимание возможных последствий принимаемых решений. Он должен хорошо разбираться во всех аспектах деятельности вверенного ему объекта, предприятия или компании, а также их «окружения» (внешние организации, административные органы и т. д.). При этом ему нельзя ошибаться, поскольку ошибки руководителя высокого ранга, например отвечающего за развитие отрасли (региона), очень дорого обходятся. Проблема адекватного руководства не так проста, как кажется, и относится к разряду сложнейших. Ясно, что решить ее простым увеличением управленческого аппарата невозможно. Здесь все определяется не количеством, а качеством.
|
Сергей Михайлович Любкин, доцент ГАСИС, к. т. н., член правления СОВНЕТ, e-mail: S.Ljubkin@USA.NET |
Зачастую руководители вообще не хотят «связываться» с информационными технологиями, поскольку они отнимают много сил, средств и приходится без конца учиться. Некоторые очень опытные руководители действительно принимают достаточно разумные решения не пользуясь огромным штатом экспертов и специалистов по информатике. Это возможно, поскольку такой руководитель мысленно сформировал систематизированную картину своего огромного хозяйства, как хороший врач, долго наблюдающий и лечащий одного и того же пациента. Эта картина складывалась постепенно вместе с развитием его хозяйства и прочно отпечаталась в мозгу в виде системной модели знаний. Она-то и помогает ему вырабатывать верные решения. Такой руководитель строит свои выводы и решения принципиально иначе, чем те, кто такого опыта не имеют, хотя и пользуются информационными технологиями. Располагая информацией о текущем состоянии своего объекта управления и пользуясь своей огромной и хорошо структурированной базой знаний (то есть своей системной моделью), опытный управленец действует методом распознавания ситуаций и их классификации. Автоматически и практически мгновенно на модель накладывается текущая картина и выделяются все ее противоречия, достоинства и недостатки; она соотносится с принципиальными решениями, которые давали хорошие результаты. Если прототипа в его модели базы знаний не оказалось, то ему достаточно несложно сконструировать новое решение, мысленно накладывая его на свою модель, которую он хорошо «видит» и чувствует.
Именно наличием такой базы знаний отличается от всех хороший эксперт — профессионал в своей деятельности. Статистика говорит, что из 100 специалистов качественными экспертами могут быть только трое — пятеро. Только они в состоянии предложить хорошие (отличные и даже гениальные) решения без всяких технических чудес. Но где взять таких специалистов в наше время, когда все быстро устаревает, особенно в области технологий управления. Образцы десятилетней давности сегодня могут принести больше вреда, чем пользы. Подготовка же таких специалистов длится не один десяток лет.
|
Владимир Семенович Резер, Российская ассоциация управления проектами/ СОВНЕТ, к. т. н., e-mail: VSR@atom.ru |
Вторая проблема видится в том, что в сфере управления продолжает доминировать «старая культура» автоматизации, базирующаяся на естественнонаучных и техноцентрических подходах [1]. Она ориентирована на техническое обеспечение административно-командных методов управления. Мешает также старое представление, что любое подготавливаемое решение должно иметь ретроспективные аналоги и прецеденты — это большое ограничение. Необходимо уходить от ориентации на жесткие модели и нормативные процедуры принятия решений. Сегодня актуальна интеллектуальная поддержка управленческой деятельности. С этой точки зрения сейчас созданы условия для настоящего проявления гигантских возможностей искусственного интеллекта и ИИТ.
Третья проблема. Существующие средства автоматизации процесса принятия решений —это «перекос» в сторону анализа ситуаций и систем, а необходима новая «ориентация» — на синтез решений и новых знаний, что и требует применения ИИТ.
Перспективы развития ИИТ
Представляется, что в настоящее время ИИТ подошли к принципиально новому этапу своего развития. Так, за последние 10 лет существенно расширились возможности ИИТ за счет разработки новых типов логических моделей, появления новых теорий и представлений. «Узловыми» точками в развитии ИИТ считаются [1]:
Новой парадигмой создания перспективных ИИТ стали мультиагентные системы [2]. Здесь предполагается, что агент — это самостоятельная интеллектуальная система, имеющая свою систему целеполагания и мотивации, свою область действий и ответственности. Взаимодействие между агентами обеспечивается системой более высокого уровня — МЕТАИНТЕЛЛЕКТОМ. В мультиагентных системах (МАС) моделируется виртуальное сообщество интеллектуальных агентов — объектов, которые автономны, активны, вступают в различные «социальные» отношения — кооперации и сотрудничества (дружбы), конкуренции, соревнования, вражды и т. п. «Социальный» аспект решения современных задач и есть фундаментальная особенность концептуальной новизны передовых интеллектуальных технологий — виртуальных организаций, виртуального общества.
Тенденции развития ИИТ
Системы связи и коммуникаций
Глобальные информационные сети и ИИТ могут в корне поменять наши представления о компаниях и самом умственном труде. Присутствие сотрудников на рабочем месте станет практически не нужным. Люди могут работать дома и взаимодействовать друг с другом при необходимости через сети. Известен, например, успешный опыт создания новой модификации самолета «Боинг-747» распределенным коллективом специалистов, взаимодействующих по Internet. Местонахождение участников каких-либо разработок будет играть все меньшую роль, зато возрастает значение уровня квалификации участников.
Другая причина, определившая бурное развитие ИИТ, связана с усложнением систем коммуникации и решаемых на их основе задач. Потребовался качественно новый уровень «интеллектуализации» таких программных продуктов, как системы анализа разнородных и нестрогих данных, обеспечения информационной безопасности, выработки решений в распределенных системах и т. п.
Использование ИИТ в военной сфере
С использованием ИИТ в армии существенно изменились стратегии военных действий. Так, руководство вооруженных сил США предполагает за счет внедрения интеллектуальных АСУ поддержки принятия решений командирами и планирования боевых действий сократить временные циклы управления в три-четыре раза.
Образование
Уже сегодня дистанционное обучение начинает играть важную роль в образовании. А внедрение ИИТ позволит существенно индивидуализировать этот процесс сообразно с потребностями и способностями каждого обучаемого.
Информатизация быта уже началась, но с развитием ИИТ появятся принципиально новые возможности. Постепенно компьютеру будут передаваться все новые функции: контроль за состоянием здоровья пользователя, управление бытовыми приборами, такими как увлажнители, освежители воздуха, обогреватели, ионизаторы, музыкальные центры, средства медицинской диагностики и т. п. [3]. Другими словами, системы станут еще и диагностами состояния человека и его жилища. Будет обеспечено комфортное информационное пространство в помещениях, где информационная среда станет частью окружающей человека среды.
В итоге.
ИИТ непрерывно развиваются, и от того, насколько активно мы будем использовать их во всех сферах деятельности (будь то управление предприятием, поддержка принятия управленческих решений или образование), зависит качество нашей жизни.
МИНИГЛОССАРИЙ по ИИТ
Источники, по которым цитируются определения: [и1] — Юзвишин И. И. Энциклопедия информациологии / Под ред. акад. А. М. Прохорова. М.: Информациология, 2000.
[и2] — Уотермен Д. Руководство по экспертным системам. (Пер. с англ.). М.: Мир, 1989.
Актуализация — осуществление, переход из состояния возможности в состояние действительности. В сетевом планировании — отражение в сетевом графике выполненных работ. [и1]
База знаний — информационная база, отражающая опыт конкретных людей, групп, обществ, человечества в целом, в решении творческих задач в выделенных сферах деятельности, традиционно считавшихся прерогативой интеллекта человека. [и2]
Знание — проверенный практикой результат познания действительности, верное ее отражение в мышлении человека, обладание опытом и пониманием, которые являются правильными и в субъективном, и в объективном отношении, на основании которых можно построить суждения и выводы, кажущиеся достаточно надежными для того, чтобы рассматриваться как знание. [и1]
Инженер знаний — человек, который проектирует или создает экспертную систему. Обычно это специалист по информатике, имеющий опыт применения прикладных методов искусственного интеллекта. [и2]
Искусственный интеллект — раздел информатики, связанный с разработкой интеллектуальных программ для компьютеров. [и2]
Метазнания (Метаинтеллект) — знания экспертной системы о том, как эта система работает или рассуждает. В более широком смысле — это знания о знаниях. [и2]
Механизм объяснения (Порождение объяснений — модели аргументации и рассуждения) — часть экспертной системы, которая объясняет, каким образом были получены решения, и обосновывает действия, предпринятые для их получения. [и2]
Мышление — внутреннее активное стремление овладеть своими собственными представлениями, понятиями, побуждениями чувств и воли, воспоминаниями, ожиданиями и т. д. Мышление, которое по своей структуре может быть познающим или эмоциональным, состоит в постоянной перегруппировке всех возможных содержаний сознания и образовании или разрушении существующих между ними связей. [и1]
Мышления формы (Человеческий интеллект) — способы и виды формальной организации мыслительного процесса, абстрагированные от его содержательного компонента. [и1]
Нечеткая математика (Нечеткая логика — Недоопределенные данные) — раздел математики, связанный с нечеткими объектами, данными, алгоритмами. [и2]
Оптимизация — нахождение наибольшего или наименьшего значения какой-либо функции, выбор наилучшего (оптимального) варианта из множества возможных, например оптимизация управления. [и1]
Персептрон (Нейронные сети) — обучаемая система, моделирующая восприятие и распознавание образов. [и1]
Пользователь — человек, использующий экспертную систему, например конечный пользователь, эксперт, инженер знаний, разработчик инструмента или лаборант. [и2]
Представление знаний — процесс структурирования предметных знаний с целью облегчить поиск решения задачи. [и2]
Технология — 1) совокупность методов обработки, изготовления, изменения состояния, свойств, формы сырья, материалов или полуфабриката в процессе производства; 2) наука о способах воздействия на сырье, материалы или полуфабрикаты соответствующими орудиями производства. [и1]
Эвристика (Эвристическое программирование) — эмпирическое правило, упрощающее или ограничивающее поиск решений в предметной области, которая является сложной или недоступной всякому пониманию. [и2]
Эксперт — человек, который за годы обучения и практики научился чрезвычайно эффективно решать задачи, относящиеся к конкретной предметной области. [и2]
Экспертная система — компьютерная программа, использующая экспертные знания для обеспечения высокоэффективного решения задач в некоторой узкой предметной области. Такие программы, как правило, представляют знания символически, исследуют и объясняют свои процессы рассуждения и предназначены для тех предметных областей, в которых людям для достижения мастерства необходимы годы специального обучения и практики. [и2]
Литература
История интеллектуальных информационных технологий
Обратимся к истории развития ИИТ, которая ведет отсчет с 60-х годов прошлого века и вкючает несколько основных периодов.
Примеры разработанных к настоящему времени систем, использующих ИИТ.
Поделитесь материалом с коллегами и друзьями