wydarzenia lokalnie

PRACA dla studentów

Hi-Tech

Komputery zaczynają same zdobywać wiedzę

Udostępnij

Internet semantyczny jedyną drogą dla wyszukiwania informacji w Internecie

Dzięki Internetowi Semantycznemu komputery, dla których ludzki język był niezrozumiały, zaczynają same zdobywać "wiedzę" i także samodzielnie wyciągać wnioski. W sieci pojawiają się już aplikacje wykorzystujące takie możliwości - opowiada informatyk z Uniwersytetu Łódzkiego.

"Obecnie w Internecie mamy do czynienia z ogromną ilością informacji, których nie jesteśmy w stanie przetworzyć. Jeśli do 2003 r. ludzkość wytworzyła 5 eksabajtów informacji (eksabajt to miliard GB), to teraz 5 eksabajtów informacji tworzonych jest co dwa dni. Google indeksuje ponad 40 mld stron internetowych. Pojawia się więc problem z docieraniem do informacji" - mówi dr Marcin Skulimowski z Wydziału Fizyki i Informatyki Stosowanej UŁ.

"Obecny Internet to system dokumentów połączonych ze sobą linkami. A w Internecie Semantycznym zrozumiałymi dla komputerów relacjami połączone będą konkretne zasoby o określonych typach. Zarówno o relacjach, jak i o zasobach komputery będą mogły wnioskować" - wyjaśnia dr Skulimowski. Dla człowieka oczywiste jest, że zdanie +Ala jest matką Tomka+ opisuje pewną relację między dwiema osobami. Okazuje się, że informację o tym, można zapisać w sposób zrozumiały dla komputerów wykorzystując język RDF (ang. Resource Description Framework). Dzięki temu z pomocą ontologii komputer będzie mógł wnioskować i odkrywać nową wiedzę np. że +Ala jest kobietą+ oraz, że +Tomek jest synem Ali+. Co więcej, komputer będzie wiedział, o której Ali mowa i że nie każda osoba w Internecie o imieniu Ala to ta sama Ala. „Dane zapisane w języku zrozumiałym dla komputerów otwierają przed nimi zupełnie nowe możliwości” - uważa informatyk.

Powstają już aplikacje, które korzystają z takich danych. Na wielu stronach Wikipedii po prawej stronie znajdują się tzw. infoboksy zawierające najważniejsze informacje związane z przeglądanym hasłem. W przypadku osób znajdziemy tam np. zdjęcie, datę i miejsce urodzenia, zawód, odznaczenia. Dane z infoboksów są już zapisywane w języku RDF. Powstaje w ten sposób tzw. DBpedia – „semantyczna” wersja Wikipedii. W DBpedii znajdują się już miliardy stwierdzeń w języku RDF, które komputery mogą łatwo analizować i przeszukiwać. Dzięki temu możemy np. wyszukać osoby urodzone w Warszawie w 1951 r. "Na razie pytania można zadawać tylko w specjalnym języku, ale jesteśmy coraz bliżej lepszych rozwiązań" - przyznaje dr Skulimowski.

Innym przykładem aplikacji, która zwraca konkretne odpowiedzi, a nie linki do stron jest testowana właśnie wyszukiwarka Facebook Graph Search. Dzięki niej na Facebooku można wśród swoich znajomych np. wyszukać osoby, które mieszkają w danym mieście i lubią chodzić po górach. Co ważne takie zapytanie zapisywane jest w języku naturalnym. "To jest namiastka tego, do czego dążymy w skali całego Internetu" - komentuje dr Skulimowski.

Aplikacją semantyczną staje się też wyszukiwarka Google. Dzięki ogromnej bazie wiedzy Google Knowledge Graph, oprócz tradycyjnych wyników wyszukiwania w postaci linków zwracane są też konkretne informacje. Na razie rozwiązania te są dostępne przede wszystkim w wersji angielskiej oraz w kilku innych językach. Ale kiedy w wyszukiwarkę wpiszemy np. "Uniwersytet Łódzki", po prawej stronie pojawiają się podstawowe dane o uniwersytecie m.in. logo, adres i lokalizacja na mapie.

"W Internecie jest teraz tak dużo informacji, że Internet Semantyczny to w zasadzie jedyna droga. Dążymy do stworzenia globalnej bazy danych na skalę całego Internetu, dzięki której będziemy mogli wyszukiwać konkretne informacje, a nie ciągi znaków. Być może prawdziwa rewolucja informacyjna jest dopiero przed nami…" - podsumowuje dr Skulimowski.

opublikowano: 2013-02-05