Notowania

Borsuk z Beatką wchodzą do sieci. Polska wyszukiwarka Nekst pokona Google?

W czerwcu poznamy owoc prac naukowców z Wrocławia i Warszawy, którzy za 15 milionów złotych chcą dokonać rewolucji w sieci.

Podziel się
Dodaj komentarz
(Politechnika Wroclawska/Bartosz Sadowski)
Maciej Piasecki, koordynator prac grupy Nekst.

W małym pokoiku w Zakładzie Sztucznej Inteligencji Politechniki Wrocławskiej ledwo mieszczą się pracownicy. Przestrzeni jest tak mało, że nie ma szans na porządne przewietrzenie. - W lecie przegrzane komputery same się wyłączają - opowiada doktor Maciej Piasecki, szef wrocławskiego zespołu pracującego nad nowatorskim systemem wyszukiwania informacji w internecie Nekst. A dokładniej nad częścią zwaną Borsukiem. To potężna skarbnica wiedzy, która będzie znała odpowiedź na każde pytanie, jakie człowiekowi przyjdzie do głowy.

Borsuka można zapytać na przykład o to, jakie zeznanie podatkowe powinien złożyć mąż i żona z dwójką dzieci. A on od razu wyświetli odpowiedni akapit tekstu ze strony Ministerstwa Finansów. Jest na tyle mądry, że rozróżni, czy w zadanym pytaniu wyraz _ piła _ oznacza miasto, przedmiot, a może czasownik. I co najważniejsze - zrozumie zadane pełnym zdaniem pytanie, a internauta nie będzie musiał główkować, która kombinacja niegramatycznie wpisanych słów-kluczy doprowadzi go do upragnionej odpowiedzi.

Borsuk to najbardziej efektowny owoc prac działającej na Politechnice Wrocławskiej Grupy Naukowej G4.19, ale nie jedyny. Naukowcy wymyślili też inteligentną wyszukiwarkę obrazów. Można pokazać jej zdjęcie, a ona odnajdzie w sieci podobne obrazy. Bez zadanego obrazka też sobie poradzi, bo wystarczy jej opis słowny.

[

Część Grupy Naukowej G4.19, która pracuje nad Borsukiem. Po prawej przy tablicy Maciej Piasecki fot. z archiwum grupy G4.19/Maciej Wrzalik ]( http://static1.menstream.pl/i/art/213/306133_big.jpg )

Do tego dochodzi sporo narzędzi, bez których te mechanizmy nie mogły by działać. Na przykład komputerowy algorytm, który niejako rozumie język, jest w stanie rozróżnić czasownik od rzeczownika i odmienione przez przypadki wyrazy sprowadzić do mianownika. Naukowcy zbudowali też największy dziś internetowy słownik języka polskiego o nazwie Słowosieć.

Borsuk z Wrocławia, Beatka z Warszawy

Druga część projektu Nekst powstaje w Warszawie. Naukowcy z Instytutu Podstaw Informatyki PAN właśnie nadają ostateczny kształt nowej wyszukiwarce internetowej, którą pieszczotliwie określali Beatką, a ostatecznie ochrzcili nazwą całego przedsięwzięcia.

Wyszukiwarka Nekst powstała specjalnie po to, by skanować tylko i wyłącznie polski internet. Dlatego ma doskonale rozpoznawać treści w naszym języku, uwzględniać polską gramatykę i składnię. I docierać do każdej strony w polskiej sieci, czego - wbrew pozorom - monopolista Google wcale nie robi. Według szacunków szefa całego projektu, profesora Jacka Koronackiego, amerykańska wyszukiwarka pomija nawet osiemdziesiąt procent stron w języku polskim!


W czerwcu system Nekst powinien być już dostępny w sieci
- zapowiada Maciej Piasecki
fot. Politechnika Wrocławska/Krzysztof MazurZa sprawą Neksta ma się to zmienić. - _ Najdalej w czerwcu nasza strona będzie już dostępna w sieci _ - zapowiada doktor Maciej Piasecki. Wszystko jest dopięte na niemal ostatni guzik. Logo dla Borsuka już jest i przedstawia oczywiście to sympatycznie kojarzące się zwierzę. Skąd wziął się pomysł na taką nazwę dla poważnego informatycznego systemu? - _ To wyszło któregoś razu od zespołu. Podejrzewam, że ma coś wspólnego z tym, że borsuki ryją, drążą, wiercą. A nasz program przewierca się przez pokłady informacji w zbiorach dokumentów _ - tłumaczy Piasecki.

Wszechwiedzący Borsuk, precyzyjna wyszukiwarka Nekst i wyszukiwarka obrazów będą złożone w jedną całość pod nazwą System Nekst i dostępne na jednej stronie internetowej. Obsługa strony będzie podobna do tej, którą znamy z Google. - _ Okno do wpisywania pytań będzie większe, bo dajemy internautom możliwość doprecyzowania tego, czego szukają _ - wyjaśnia Maciej Piasecki. Na razie jednak naukowcy nie pozwalają nam pokazać prototypowej wersji serwisu.

Językoznawca wart mniej niż informatyk

Całe przedsięwzięcie nie byłoby możliwe, gdyby nie pieniądze z Unii Europejskiej. Projekt dostał prawie 13 milionów złotych dofinansowania ze Wspólnoty, pozostałe dwa dołożył rząd. Żeby dostać te pieniądze, trzeba się było jednak trochę namęczyć. - _ Komisja konkursowa, która przydziela dotacje, musi mieć pewność, że pieniądze zostaną dobrze i sprawnie rozdysponowane. Nie wystarczy jednak dobry pomysł, ale też obietnica, że będzie się pracować szybko. Dlatego pracujemy bardzo intensywnie _- przyznaje Maciej Piasecki. Prace trwają od czterech lat, w tym czasie do projektu zaangażowanych było nawet po kilkadziesiąt osób na raz: studenci, doktoranci, pracownicy etatowi. Zarówno informatycy, jak i językoznawcy po filologii polskiej i angielskiej (wyszukiwarka będzie też obsługiwała ten język). Promotorem pracy doktorskiej pracującego dla Politechniki lingwisty Marka Maziarza był na przykład znany wrocławski polonista profesor Jan Miodek.

bez nich nie byłoby borsuka i neksta

Część z naukowców odpowiedzialnych za Nekst to etatowi pracownicy z Politechniki i PAN-u, którzy dzielą czas na prace nad projektem i codzienne, standardowe obowiązki. Inni zostali zatrudnieni specjalnie do projektu, głównie na umowę o pracę. Na najlepsze zarobki mogą liczyć programiści. Ci najniższego szczebla - od trzech tysięcy złotych na rękę, a ci stojący w hierarchii najwyżej - około sześć tysięcy. - _ Trzeba było zapłacić im tyle, żeby chcieli się u nas zatrudnić _ - tłumaczy Maciej Piasecki. Mniej dostają językoznawcy, o których rynek pracy się nie zabija - najlepsi zarabiają około czterech tysięcy złotych na rękę, ci szeregowi - około trzech. Nieco więcej zarabiają ci z Warszawy - wiadomo, stolica jest droższa.

- _ Praca nad takim projektem to nieustanne gaszenie pożaru _ - śmieje się Maciej Piasecki. - _ Mamy ustalony plan i gonimy z jego realizacją. Zatrudnianie się do projektów naukowych w ogóle jest specyficznym zajęciem, bo nigdy nie wiadomo, czy dostanie się dofinansowanie, czy nie. Czy coś z tego będzie, czy trzeba będzie odłożyć plany na półkę _ - przyznaje.

Z pracy do pracy

Dlatego tworzenie Neksta nie wygląda tak, jak na przykład początkowe fazy rozwoju Facebooka przedstawione w filmie _ The Social Network _? Reżyser David Fincher pokazuje w nim, jak młodzi programiści wynajmują w słonecznej Kalifornii domek z basenem i na równi z pracą nad doskonaleniem serwisu, zatracają się w niezobowiązującej zabawie. W przypadku Neksta, obie ekipy, ta PAN-u i ta z Politechniki Wrocławskiej, co pół roku odwiedzały się, by omówić postępy w pracach. Na co dzień pozostawały im maile, telefony i wideokonferencje.

Tak według Davida Finchera bawili się twórcy Facebooka:

Choć z Instytutu Informatyki Politechniki Wrocławskiej jest rzut beretem nad brzeg Odry, Maciej Piasecki nie wychodził z laptopem odprężyć się na słońcu i świeżym powietrzu. Jako szef całego zespołu po prostu nie miał na to czasu. - _ Do pracy przychodzę o ósmej, w pół do dziewiątej, a wychodzę po siedemnastej. A wieczorem w domu znowu siadam do komputera. W weekendy też mi się zdarza popracować. Ja to po prostu lubię _ - przyznaje.

Teraz, kiedy prace nad Nekstem dobiegają końca, raczej na więcej wolnego czasu też nie może liczyć. W ramach akademickiej grupy naukowej z Politechniki Wrocławskiej co rusz angażuje się - razem z kolegami - w nowe przedsięwzięcia. Nekst to nie pierwszy projekt tego typu, a raczej próba wykorzystania i rozwinięcia wcześniej stworzonych narzędzi i zebranych danych.

Stworzona razem z Polską Akademią Nauk wyszukiwarka ma szansę stać się czymś więcej, niż zwykłym projektem naukowym, o którym wie tylko wąska grupa specjalistów. Być może sukces badaczy uda się przekuć w złotówki. - _ Do IPI PAN-u zgłosiła się już firma zainteresowana _Nekstem - zdradza Maciej Piasecki. - _ My z kolei rozmawiamy z poważnym graczem, który przygląda się Borsukowi - dodaje. _ Ten ostatni będzie przydatny na przykład w systemach informatycznych firm i instytucji publicznych.

Na razie jednak jego użyteczność jest ograniczona. Docelowo Borsuk ma znać odpowiedź na każde zadane mu po polsku pytanie, jednak do tego potrzeba tytanicznej pracy komputerów, które przeanalizują każdy dostępny w sieci tekst pod względem językowych niuansów. Na razie więc naukowcy wgrali do systemu wszystkie teksty z polskiej Wikipedii i archiwalne wydania _ Rzeczpospolitej _.

Wady wieku dziecięcego

Dziś Borsuk, zainstalowany na jednym uczelnianym komputerze, jest jeszcze dzieckiem. I ma typowe dla tego okresu przypadłości. Przede wszystkim jest wolny - zajmuje mu około pół minuty, żeby zrozumieć pytanie i przeskanować bazę danych w poszukiwaniu najlepszej odpowiedzi. Ten czas się skróci, kiedy trafi na potężny serwer w Instytucie Podstaw Informatyki PAN. Maciej Piasecki nie wyklucza, że w przyszłości w zasobach Borsuka znajdą się wszystkie polskojęzyczne strony internetowe. Jest to wykonalne, choć pracochłonne.

W tej chwili w stu procentach kompletnym narzędziem jest wyszukiwarka Nekst. Jak przekonują naukowcy, ma działać szybko i niezawodnie, ale na zdetronizowanie Google nie liczą. - _ Nie o to w tym projekcie chodzi _- przyznaje Piasecki. Być może jednak spodoba nam się i nowa wyszukiwarka, i Borsuk. Z tego ostatniego bardzo zadowolony jest za to syn Macieja Piaseckiego. - _ Wpisuje tam pytania, kiedy potrzebuje czegoś do szkoły. A Borsuk mu bezbłędnie odpowiada _- cieszy się naukowiec.

Czytaj więcej w Money.pl

Tagi: polska wyszukiwarka nekst, wiadomości, wiadmomości, kraj, gospodarka, najważniejsze, lifestyle
Źródło:
money.pl
komentarze
+1
+1
ważne
smutne
ciekawe
irytujące
Napisz komentarz