Практический Семантик

Веб2 - это, конечно, сервисы прежде всего. Теория теорией, но главное - сайтики. Это всем понятно итак. А вот с семантическим вебом - непонятно пока что.. Мы с вами все теорией балуемся. Ну хотя объяснение довольно простое - как таковых семантических веб-приложений… ну мало, короче. Но они есть!

Ну я подумала, что было бы неплохо пролить свет на это таинственное явление - семантические сервисы. Но прежде советую прочитать вот этот пост. Не пеара ради, а дабы понять, каким образом вообще можно реализовывать семантические приложения. Хотя я вкратце, конечно, расскажу. Вообще нам, прежде чем говорить о семантических сервисах нужно понять, для чего они нужны. (Хотя нет, блин, вы всетки прочитайте сначала))

Семантика по жизни (ну то есть в лингвистике, а не применимо к программированию) - весьма интересная наука, занимающаяся изучением значения слов (ну и жизнью этих значений, как одно слово может менять свои значения в течение времени. очень занимательно, правда). Поэтому считаю вполне правомерны предположить, что семантические сервисы (в дальнейшем - SWA - semantic web apps) тем и занимаются, что определяют значение данных (ну текст, допустим) и связи (отношения между собой) этих данных. Вот в этом случае мы уже можем говорить о знаменитом Web as a platform. Плюс учитываем то, что есть два направления развития SWA (вы ведь прочитали, правда?))):
- снизу-вверх: когда весь веб-контент сам по себе является структурированным и, короче, семантическим - в нем уже есть все необходимые мета-данные.
- сверху-вниз: с контентом ничего не происходит, он такой же, а вот специальные программы уже анализируют его на свой семантический лад.
Ну поехали.

Поисковые системы (Ну было бы странно, если начала я не с них))

Powerset - продукт пока еще закрытый, но за этот год наделавший довольно шуму в новостях. Системка эта определяет семантические связи, на основе которых складывается семантическая база данных. Значения слов автоматически извлекаются из Powerset. Работа у них кипит, привлекают различных сторонних разработчиков в свою Powerlabs. Если хотите чуть подробнее о них - то здесь.

Hakia - еще один NLP (natural language processing) поисковик. Hakia выдает значимые результаты на поисковый запрос посредством анализа предложения (ну а Google и иже с ним, как мы знаем, анализируют ключевые слова). Hakia хотят изменить поисковый мир в лучшую сторону, то есть сделать поиск вашим товарищем и гидом в мире интернета. Интерактивным. Кстати, в Hakia не все автоматизировано, присутствует и человеческий фактор, например модерирование картинок. Еще о Hakia - здесь.

AskNet - российская разработка, которая не так давно сильно приукрасилась и вообще стала стартовой страницей. (а я только что это заметила кстати).Сильно пдробно о них сказать не могу, они не освещались настолько сильно, но предлагаю почитать интервью с Asknet, довольно интересное.

Да, еще существует в России такой сервис как Dialogus. Но я его не изучала, если честно. Но он семантический, да))

TrueKnowledge - нечто среднее между поиском и сервисом вопросов-ответов. Также в закрытой бете пока. TrueKnowledge использует анализ естественного языка, внутреннюю “базу знаний” и стороннюю, тут же предлагая вам ответы на заданные вопросы. Не просто, как поисковик, дает вам ссылки, где вы можете найти ответы, а развернутые ответы. Да и еще укажет, с чего это он взял, что ответ должен быть именно таким. Лозунг компании - прямые ответы на человеческие и машинные вопросы.

Взаимодействие пользователей

Freebase - база любых типов данных. Также имеет свой API. Freebase открыт для всех, любой может внести информацию, и вообще это открытая база данных. Freebase во многом похожа на Wikipedia.
freebase.jpg
Когда вы вводите новые данные, сервис делает предположения о контенте. Довольно организованный сервис, темы разбиты по типам, страницы можно линковать между собой, также данные обладают семантическими тэгами. Честно говоря, особой разницы с Википедией и нет, только семантика внедрена. Ну и покрасивше будет, чего уж))

Twine - качественно новая социальная сеть, основанная на концепции СемантикВеба. Она тоже в закрытой бете пока, поэтому трудно говорить о ней что-то конкретное, но действует она следующим образом. Twine изучает вас и ваши интересы по мере наполнения. Когда вы вводите новые данные, Twine приписывает им семантические тэги - например “имя человека”. Twine создает семантические данные, но это не 100% UGC. Twine многому учится сам. В итоге это должно вылиться в нечто подобное Freebase, то есть семантическую Википедию.
twine.jpg

Инструменты

Это, конечно, самая интересная группа.

TripIt - ваш помощник в путешествиях. На ящик plans@tripit.com вам нужно отправить какие-то данные о своей поездке - куда и когда. А сервис на основе этого составляет вам расписание вашего путешествия, то есть itinerary. Отсюда название технологии - itinerator, которая находится в стадии патентования. Сотрудничает с Википедией, чтобы брать информацию о местах ваших путешествий, использует микроформаты- iCal, который легко можно интегрировать в ГуглКалендарь или другие календари. Распечатываете себе пару страничек - и спокойно отправляетесь в путь. В планах - внедрение рекомендательной системы.

ClearForest - сервис, анализирующий веб-контент путем “сверху-вниз”, использующий NLP. Был приобретен в Апреле агентством Reuters. Это как веб-сервис, так и расширение для Firefox - Gnosis.
gnosis.jpg
Это расшрение позволяет идентифицировать людей, компании, местонахождения, продукты на странице, которую вы просматриваете. Просматривая страницу с помощью Gnosis, на ней появляются различные краткие аннотации, слова выделяются цветом, чтобы можно было понять, о чем идет речь. Тоже самое можно сделать и на сайте компании (правда, если честно, мне не очень понятно как.. неудобный сайтец какой-то).

AdaptiveBlue - компания, имеющая в своем арсенале два продукта - расширение для FireFox BlueOrganizer и SmartLinks. BlueOrganizer распознает то, о чем вы читаете. Ну допустим, вы находитесь на странице с книжкой какой-нибудь. BlueOrganizer это поймет, он преложит вам специальное меню (которое составляется из вашей истории серфинга), что с этой страницей можно сделать - добавить в вишлист на Амазоне, найти что-то схожее, предложить запостить куда-нить. Там же можно сохранять, и при этом плагин сам распознает, что в какую папочку надо сохранять. В общем функционал серьезный, но пока что сомнительна его актуальность для наших широт. Такой вот тулбарчик вышел:
blueorg.jpg

Smartlinks - скриптик, добавляющий новые возможности ссылкам (на вашем блоге допустим), дают дополнительную информацию по ним. Разрозненную информацию он структуризирует (ну сематнически, естественно))), типы контента распознает, придает ей дополнительную информацию, в общем молодца. И выглядит симпатишно, вот так (кстати это типа поп-апа):
smartlinks.jpg

Zotero - чем то схожий с BlueOrganizer плагин для ФФ, который позволяет хранить и организовывать различные типы контента (цитаты, текст, картинки, веб-страницы, PDF) и делиться ими различными способами. В общем, очередной органайзер такой.
zotero.jpg

Talis - компания, сотворившая одноименный продукт, платформу для SWA (платформа, это вам не.. википедия блин). Платформа Talis -нечто среднее между web2 и semantic web, позволяя создавать приложения, которые дают возможность шаринга и ремиксинга данных)). Платформа делает упор на важность контекста, поведение пользователя (и отслеживание его действий).
p.s. у них классный блог, кому интересен семантик - пройдитесь, почитайте.

По мотивам

If you enjoyed this post, please consider to leave a comment or subscribe to the feed and get future articles delivered to your feed reader.


Комментарии

Каждый твоей статье удивляюсь. Гениально написано, чесслово!

спасибо. мне очень приятно, правда..)

[…] Веб2 - это, конечно, сервисы прежде всего. Теория теорией, но главное - сайтики. Это всем понятно итак. А вот с семантическим вебом - непонятно пока что.. Мы с вами все теорией балуемся. Ну хотя объяснение довольно простое - как таковых семантических веб-приложений… ну мало, короче. Но они есть! Дальше […]

Обалдеть! За последние несколько месяцев лучше статьи не читал. Большое спасибо.
Особенно за наводку на API Freebase. Очень классно. Жаль, что у других сервисов, похоже, API нет, хотя было бы чудесно найти какой-то интерфейс для запросов на Clearforest.com. Хотя может быть я просто не разобрался пока. В общем, в избранное, однозначно! )

P.S. Для прикола спросил у Dialogus.ru “что такое тормоз”, и получил ответ: “Ручной тормоз - это эстонская кошечка!” ))

ну вот и хорошо, что помогло.
p.s. ну да, все поисковики смешными бывают

у TrueKnowledge есть API, говорят. У Clearforest их расширение для ФФ работает также через API.

Спасибо, поизучаю сейчас…

Вот нашел твою статейку блин молодец же Давай дальше подобное

Не, ну очень интересная позиция - вырезать без объяснений просьбу прокомментировать - как бы так, что ‘иноверных посетителей’ вашего блога не существует. Безусловно, ваше святое право, леди.
Тогда в Инете, коль так, однажды придется написать и о Вашем блоге и о лично вашей интерпретации Semantics, Уж сорри.

я одобрила ваши комментарии? да. я обязана в воскресенье вам отвечать если вам сильно не терпится? вроде нет. Можете написать хоть лично о плохой мне, если я вас так сильно задела. И кстати, вы не в тот пост коммент запостили.

Откомментировать

(Важно)

(Важно)