http://blog.ladyuser.eu
Hantos Gyöngyi
Á propos Web 3.0 Váraljay Gabriel tette fel a kérdést a Twitteren,
de a „beszélgetésünk” túlnőtte a 140 karakteres keretet A Web 3.0 nem szoftververzió számostul, hanem az egyik, még eljövendő (vagy már itt is van) Internet korszak megnevezése. (Sokan még azt is vitatják, hogy ez a korszakolás helytálló.) Aki bővebben olvasna róla: Herendy Csilla – Web 3.0 – A szemnatikus web? Eszpee – Mi a Web 3.0? És mi nem az? Illetve akár a Google-ban keressen rá a Web 3.0 kifejezésre!
Az Egyetemes Bibliográfiai Számbavétel A dokumentumok nemzeti bibliográfiai számbavétele köznyelvesítve annyit tesz, hogy az emberi rögzített kultúrkincset azonosíthatóvá, visszakereshetővé és hozzáférhetővé
teszik.
(Egy
példányt
minden
feldolgozott
dokumentumból
archiválnak ugyanis, és kötelességük – lenne – mindent begyűjteni.) A számbavétel folyamán a dokumentumokat mind formai szempontból – mi látható-olvasható rajta, ami alapján azonosítható, ki adja ki, mekkora stb. – mind tartalmi szempontból feltárják. A tartalmi feltárást úgy képzeld el, mint amikor te a tartalommal releváns címkékkel látsz el egy blogbejegyzést, elősegítve ezzel, hogy aki egy téma iránt érdeklődik, rátaláljon a cikkedre. Ez a számbavétel egészen jól működött addig, amíg az információt csak hagyományos hordozókon (könyv, periodika, hanglemez stb.) továbbítottuk egymás közt. Még azzal is megbírkóztak a nemzeti könyvtárak, amikor a digitális 1
http://blog.ladyuser.eu
Hantos Gyöngyi
adattovábbítás korszaka köszöntött be, de még kézbe vehető adathordozókkal. Ott más jelentette a problémát. Az előállítás olyannyira egyszerűsödött, illetve olymértékben megváltozott a kiadvány kiadás/előállítás menete, a részt vevő szereplők, hogy betarthatatlanná vált pl. a Kötelespéldány törvény, amely lehetővé tette
a
nemzeti
bibliográfiai
központok
számára,
hogy
az
adat,
ill.
információhordozókhoz hozzáférjenek és feldolgozzák azokat. Az Egyetemes Számbavételre a nagy csapást azonban az mérte, hogy a Web egyre inkább elsődleges publikációs helyszínné vált. Komoly szakmai szövegek, tudományos munkák léteznek úgy a Weben, hogy nyomtatott megfelelőjük nincs is. Természetesen
különféle
próbálkozások,
nemzeti
és
nemzetközi
projektek
szerveződtek ezen kultúrkincs megőrzésére, de mind a Web, mint információs csatorna,
ill.
hordozó
természete,
mind
a
financiális
korlátok
akadályozták/akadályozzák a maradéktalan sikert. Dippold Péter 2005-ben írta erről doktori disszertációját, amelyből a téma iránt érdeklődő átfogóan tájékozódhat. A megőrzés kérdésköre messze túlmutat egy „á propos” bejegyzésen. Ugyanakkor az tagadhatatlan, hogy a Weben napra nap születnek olyan értékes tartalmak, amelyekhez a célzott hozzáférés nem megoldott. Problémát okoz az is, hogy a „látható” és robotok által kereshetővé tett webtartalom csak töredéke a teljes hálótartalomnak, hogy a robotok, bármily intelligensen/intelligensre programozottak is, egy szöveg jelentésrétegeivel, kontextusaival önmagukban nem tudnak mit kezdeni.
Szövegbányászat A bibliográfiák tartalmi feltáró funkciója a dokumentumok egészére vonatkozik, így relevanciája lényegesen alacsonyabb, mint az indexelt szöveg alapú visszakeresés, amelyet
az
elektronikus
összefüggések
formátumok
feltérképezéséhez
lehetővé
azonban
tesznek. többre
van
A
szemantikai szükség.
A
szövegbányászat célja a dokumentumokban rejtetten meglévő új információk feltárása, azonosítása és elemzése.
2
Hantos Gyöngyi
http://blog.ladyuser.eu
„A kereshetőségi, ha úgy tetszik a keresőmotorok láthatósági szintjének megfelelően, tehát megkülönböztetünk ún. felszíni (hagyományos keresőmotorokkal kereshető) és ún. mély- (hagyományos keresőmotorokkal nem kereshető) hálót.” – olvasható a Szövegbányászat című, Tikk Domonkos szerkesztette könyvben, amelyből választ kaphatsz, milyen módszerekkel igyekeznek kereshetővé tenni a mélyhálót, és mindeközben milyen problémákkal szembesülnek a fejlesztők. Külön fejezetet szentel a szövegbányászati szoftvereknek.
Jó, de hogy jön ide a Web 3.0? A bibliográfiák annak idején a kiadói jegyzékekből alakultak ki, mégpedig könyvkereskedői igény hatására. Szomorú ugyan, de nem lehet szépíteni: az, hogy feladatunk és kötelességünk a weben fellelhető közös kultúrkincset utódainkra hagyományoznunk, megelőzve ezzel, hogy hiány alakuljon ki a rögzített tudás egy részéről való önkéntes lemondással, még nem érte el az össztársadalmi problémaküszöböt. Ahogy a dolgok állását szemlélem, egyhamar nem is fogja. Ez vélhetően csak akkor fog megtörténni, ha üzleti érdekek is megkövetelik a webtartalom archiválását, visszakereshetővé tételét. Ezek az üzleti érdekek azonban már jelen vannak. A szövegbányászati módszereket is alkalmazzák már az ügyfélszolgálati tevékenység támogatására, a bűnmegelőzésnél és bűnüldözésnél,
3
http://blog.ladyuser.eu
Hantos Gyöngyi
döntés előkészítő gazdasági-, üzleti információgyűjtésnél, a gyógyszerkutatásban, az államigazgatási feladatok ellátásánál. Ugyanakkor irreális azt gondolni, hogy egyetlen szervezet képes lenne akár csak egy nemzeti netszegmens feldolgozására. (Az Internet esetében már az is aggályos, mit neveznénk nemzetinek.) Vagy a feldolgozás mellett a tartalom archiválására, amely a médium jellemzőiből fakadóan számos változat archiválását is jelentené. Ezt a feladatot
csak
egymással
szervezetszövetségek szabványos
által
összedolgozó,
látom
adatfeldolgozásban
részfeladatokat
megvalósíthatónak,
már
jártas
könyvtárak
amelyek
ellátó
munkáját
koordinálhatnák,
a így
biztosítva az egységes adatkezelést, ill. az adatcsere lehetőségét. Koordinációs, projektmenedzseri tevékenységük díjazása pedig kiegészíthetné a fenntartásukra fordítható egyre zsugorodó közpénzeket. A szervezetszövetségek tagjai bárkik lehetnének, gazdasági szereplők éppúgy, mint civil szervezetek, egyesületek. Így megtöbbszöröződne munkájuk eredményessége. Számomra ez a Web 3.0. A Twitteren így írtam: értéket közvetítő és szabványosan feltárt, webforrások közösségi hálózata. Most pontosítok: hozzáférés az értéket közvetítő és közösségi hálózatban mind formailag, mind tartalmilag szabványosan feltárt, visszakereshető, asszociatívan kombinálható webtartalmakhoz, illetve az azok alapján létrehozott szublimált tartalmakhoz.
Budapest, 2009. június 4.
4