Web scale discovery - Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên Internet
Bạn đang xem tài liệu "Web scale discovery - Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên Internet", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- web_scale_discovery_giai_phap_tim_kiem_va_khai_thac_thong_ti.pdf
Nội dung text: Web scale discovery - Giải pháp tìm kiếm và khai thác thông tin cho các thư viện trong kỷ nguyên Internet
- Nghiïn cûáu - Trao àöíi WEB SCALE DISCOVERY - GIAÃI PHAÁP TÒM KIÏËM VAÂ KHAI THAÁC THÖNG TIN CHO CAÁC THÛ VIÏÅN TRONG KYÃ NGUYÏN INTERNET ThS Àöî Vùn Huâng Trûúâng Àaåi hoåc KHXH&NV Haâ Nöåi Toám tùæt: Tòm kiïëm thöng tin têåp trung - Web scale discovery (WSD) àang laâ xu thïë hiïån nay cuãa caác thû viïån trong möi trûúâng trûåc tuyïën vaâ coá nhiïìu cú súã dûä liïåu phên taán. Baâi viïët lyá giaãi sûå xuêët hiïån hïå thöëng tòm kiïëm têåp trung WSD, àöìng thúâi àûa ra khaái niïåm vaâ cêëu truác cú baãn cuãa hïå thöëng. Trïn cú súã àoá, àûa ra möåt söë gúåi yá cho caác thû viïån (cuå thïí laâ thû viïån àaåi hoåc) Viïåt Nam trong viïåc phaát triïín vaâ aáp duång hïå thöëng naây. Tûâ khoáa: Tòm kiïëm thöng tin têåp trung; Web scale discovery; thû viïån; khai thaác thöng tin; giaãi phaáp tòm kiïëm thöng tin. Web scale discovery – information searching and exploring solution for libraries in the Internet era Summary: Web scale discovery (WSD) is the emerging activity of libraries operating in the online environment and consisting of different fragmented databases. The article explains the emergence of the Web scale discovery WSD, provides the basic definition and structure of the system as well as suggestions of how to develop and apply this system into Vietnamese libraries (especially university libraries). Keywords: Web scale discovery; library; information extraction; information searching solution. 1. Böëi caãnh vaâ yïu cêìu cêìn coá hïå thöëng thöng tin chuyïn nghiïåp, cuäng nhû cöë gùæng tòm kiïëm têåp trung khai thaác caác nguöìn thöng tin coá chêët lûúång Caác thû viïån àang chuyïín hoaåt àöång cuãa vaâ miïîn phñ trïn Internet. Muåc tiïu laâ àûa ra mònh sang möi trûúâng trûåc tuyïën. Àoá laâ möi nhiïìu lûåa choån, àa daång hoáa nguöìn cung cêëp trûúâng maâ thöng tin àang dêìn chuyïín sang thöng tin cho baån àoåc. Àïí giuáp baån àoåc khai àõnh daång söë, kïí caã taâi liïåu in êën cuäng àûúåc thaác thöng tin, caách laâm sú khai cuãa caác thû chó muåc trong cú súã dûä liïåu (CSDL) thû muåc, viïån laâ taåo liïn kïët àïën caác nguöìn thöng tin bïn caånh àoá laâ thoái quen khai thaác vaâ sûã duång naây trïn website cuãa thû viïån, baån àoåc phaãi taâi liïåu trûåc tuyïën cuãa baån àoåc. Àûa thöng tin vaâo tûâng liïn kïët àïí tòm kiïëm thöng tin. Ngay lïn Interrnet, tiïën gêìn vúái baån àoåc hún thöng caã àöëi vúái nguöìn thöng tin do chñnh thû viïån qua thïë giúái maång àang laâ caách tiïëp cêån cuãa taåo ra, baån àoåc cuäng phaãi tòm kiïëm nhiïìu lêìn caác thû viïån hiïån nay. Möåt trong nhûäng vêën úã caác CSDL khaác nhau nhû: CSDL thû muåc àïì àùåt ra cho caác thû viïån laâ laâm sao giuáp baån vaâ CSDL toaân vùn. Baån àoåc phaãi àùng nhêåp àoåc coá thïí tòm kiïëm vaâ khai thaác thöng tin maâ nhiïìu lêìn cho caác CSDL naây. Lyá do laâ möåt söë mònh cêìn möåt caách dïî daâng vaâ hiïåu quaã nhêët. thû viïån quaãn lyá dûä liïåu thû muåc úã phêìn mïìm Caác thû viïån hiïån nay coá nhiïìu CSDL khaác quaãn trõ thû viïån àiïån tûã tñch húåp. Trong khi nhau vaâ àûúåc töí chûác phên taán. Nguöìn thöng àoá taâi liïåu söë àûúåc lûu trûä úã caác phêìn mïìm tin trong thû viïån hiïån nay khöng coân laâ chó nhû: Dspace, Greenstone hay Content Pro. trong nöåi böå thû viïån nhû caác kho saách, caác Caác phêìn mïìm naây chûa coá sûå liïn kïët vúái CSDL trong maáy chuã cuãa thû viïån, maâ caác thû nhau. viïån àang hûúáng túái mua baãn quyïìn caác Duâ muöën hay khöng, viïåc töìn taåi caác CSDL toaân vùn trûåc tuyïën tûâ caác nhaâ cung cêëp CSDL phên taán laâ àiïìu khöng thïí traánh khoãi úã THÖNG TIN vaâ TÛ LIÏÅU - 3/2015 15
- Nghiïn cûáu - Trao àöíi caác thû viïån. Baâi toaán àùåt ra laâ, baån àoåc khöng nhùçm àaáp ûáng nhu cêìu naây. Mong muöën cuãa cêìn biïët thû viïån coá bao nhiïu CSDL vaâ tûâ baån àoåc laâ thû viïån coá möåt hïå thöëng tòm kiïëm nguöìn naâo, hoå chó cêìn vaâo möåt giao diïån web nhû Google: àún giaãn vaâ hiïåu quaã. Vúái möåt duy nhêët, vúái möåt cöng cuå tòm kiïëm duy nhêët thanh cöng cuå tòm kiïëm àún giaãn nhûng coá coá thïí tòm kiïëm vaâ khai thaác àûúåc têët caã caác khïí khaám phaá àûúåc nhiïìu nguöìn thöng tin CSDL maâ thû viïån àang coá, kïí caã caác CSDL khaác nhau vaâ kïët quaã traã vïì àûúåc trònh baây ngoaâi thû viïån. Àêy chñnh laâ nhu cêìu tòm kiïëm thên thiïån vaâ theo möåt àõnh daång thöëng nhêët. thöng tin têåp trung maâ caác thû viïån àang phaãi Àùåc trûng vïì giao diïån cuãa hïå thöëng WSD àoá àöëi mùåt trong quaá trònh xêy dûång khöng gian laâ töëi giaãn hoáa viïåc tòm kiïëm bùçng möåt ö tòm hoåc têåp trûåc tuyïën. Hïå thöëng tòm kiïëm têåp kiïëm duy nhêët (single search box) nhû chuáng trung - Web scale discovery - WSD ra àúâi ta thûúâng thêëy úã cöng cuå tòm kiïëm google. Hònh 1. Giao diïån tòm kiïëm cuãa thû viïån àaåi hoåc Harvard sûã duång hïå thöëng Primo cuãa Ex Libris 2. Hïå thöëng tòm kiïëm têåp trung WSD nhau. Àêy chñnh la â àiïmí ênë tûúngå cuaã hï å thöngë 2.1. Khaái niïåm WSD. Hï å thöngë nayâ cho banå àocå camã giacá Hï å thöngë tòm kiïmë têpå trung WSD ra àúiâ àang tòm kiïmë va â khai thacá thöng tin ú ã chñnh khoangã giûaä nhûngä nùm 2000 va â àa ä nhanh chongá trong thû viïnå cuaã mònh. Thûcå tï,ë co á thï í goiå àûúcå nhiïuì thû viïnå apá dung,å àùcå biïtå la â cacá thû WSD laâ hïå thöëng (Web-scale discovery viïnå àaiå hocå [10]. Triïtë ly á cuaã hï å thöngë nayâ la â lêyë systems) hoùcå la â dõch vu å (Web scale discovery ngûúiâ dungâ lamâ trung têm cuaã hï å thöng.ë Tûúng services), búiã WSD bao gömì ca ã cacá giaiã phapá tacá ngûúiâ dungâ àêuì cuöië “Front-End” cuaã WSD tòm kiïmë va â cacá dõch vu å liïn quan àïnë khai nhùmæ túiá viïcå cung cêpë thöngë nhêtë cachá trònh thacá thöng tin ài kem.â bayâ kïtë qua ã theo mötå àõnh dangå chung, trïn Hï å thöngë WSD danhâ cho cacá thû viïnå àûúcå mötå giao diïnå web duy nhêtë cho du â cacá nguönì àõnh nghôa la â mayá tòm kiïmë (search engines), dû ä liïuå la â khacá nhau hay cacá àõnh dangå khacá cho phepá ngûúiâ dungâ tòm kiïmë khöng chó àún 16 THÖNG TIN vaâ TÛ LIÏÅU - 3/2015
- Nghiïn cûáu - Trao àöíi thuênì la â nhan àï ì cuaã cuönë sach,á tapå chñ hay Yahoo hay Bing) vúiá hï å thöngë tòm kiïmë têpå video, ma â giupá ngûúiâ dungâ khai thacá thöng tin trung la â WSD àanhá chó muc,å tòm kiïmë va â cung trong tûngâ nöiå dung cuaã baiâ tapå chñ, tûngâ cêpë nhûngä nguönì thöng tin àa ä qua sangâ locå vaâ chûúng trong mötå cuönë sachá va â nhiïuì hún thïë thêmí àõnh (búiã thû viïn)å trong khi cacá mayá tòm nûaä [10]. Vï ì ly á thuyïtë thò cacá mayá tòm kiïmë kiïmë Internet àanhá chó mucå toanâ bö å nguönì nayâ mang àïnë mötå cöng cu å tòm kiïmë àêyì sûcá thöng tin ma â no á co á thï í vúiá túiá trïn Internet. manhå nhû Google cho têtë ca ã cacá nöiå dung taiâ Theo Hiïpå höiå Thû viïnå Hoa Ky â (American liïuå ma â thû viïnå àang nùmæ giû ä hoùcå co á mua Library Association) thò dõch vuå WSD laâ möåt banã quyïnì tû â bïn ngoaiâ [11]. Trong thûcå tï ë thò cöng cuå àêìy tiïìm nùng àïí biïën àöíi baãn chêët cacá mayá tòm kiïmë cuaã WSD àa ä lamâ kha á tötë cuãa hïå thöëng thû viïån. Caác dõch vuå naây coá khaã chûcá nùng nay.â Dô nhiïn khöng co á mötå dõch vuå nùng tòm kiïëm thöng tin nhanh choáng tûâ nhiïìu WSD hoanâ hao,ã no á phu å thuöcå rêtë nhiïuì vaoâ ngûúiâ sû ã dungå hï å thöngë ào á cungä nhû nguönì lûcå nguöìn khaác nhau (trong vaâ ngoaâi thû viïån, nöåi thöng tin ma â cacá thû viïnå co á thï í cung cêp.ë böå hay tûâ xa), taåo ra sûå liïìn maåch vaâ thöëng Nhûng ñt nhêt,ë mötå trong nhûngä àiïmí manhå nhêët trong viïåc cung cêëp thöng tin, thöng tin cuaã hï å thöngë WSD la â giaiã quyïtë àûúcå nhûngä àûúåc tòm kiïëm trïn möåt phaåm vi röång lúán, caác vênë àï ì kho á khùn trong tòm kiïmë cacá baiâ baoá kïët quaã tòm kiïëm àûúåc xïëp haång vaâ coá gúåi yá cuaã tapå chñ. Vúiá hangâ nganâ àêuì tapå chñ, hangâ caác taâi liïåu liïn quan, kïët quaã àûúåc trònh baây triïuå baiâ baoá àï ì cêpå àïnë têtë ca ã cacá lônh vûcå trong möåt giao diïån trûåc quan àuáng nhû mong khoa hoc,å viïcå tòm kiïm,ë sùpæ xïpë va â chuyïní taiã àúåi cuãa ngûúâi tòm kiïëm thöng tin. Möîi hïå àïnë ngûúiâ dungâ la â vênë àï ì khöng àún gian.ã thöëng seä bao göìm ba thaânh töë cú baãn: nöåi WSD lamâ cho cöng viïcå nayâ dï î dangâ hún. dung thöng tin, giao diïån trònh baây vaâ caác Àiïmí khacá biïtå giûaä cacá mayá tòm kiïmë trïn chûác nùng liïn quan àïën tòm kiïëm, thu thêåp vaâ Internet phö í biïnë hiïnå nay (vñ du å nhû: Google, phên phöëi thöng tin. Hònh 2. Giao àiïån kïët quaã tòm kiïëm cuãa Àaåi hoåc Victoria sûã duång hïå thöëng Summon cuãa ProQuest THÖNG TIN vaâ TÛ LIÏÅU - 3/2015 17
- Nghiïn cûáu - Trao àöíi Möåt trong nhûäng ûu àiïím cuãa giaãi phaáp taåi sao hïå thöëng WSD thûúâng coá giaá rêët àùæt tòm kiïëm têåp trung WSD laâ khöng chó cung vaâ phaãi mua baãn quyïìn theo khoaãng thúâi cêëp giaãi phaáp vïì cöng nghïå tòm kiïëm, maâ caác gian nhêët àõnh. nhaâ cung cêëp naây coân giuáp caác thû viïån àaâm 2.2. Cêëu truác cuãa WSD phaán vúái caác nhaâ cung cêëp dûä liïåu trûåc tuyïën Möåt hïå thöëng WSD bao göìm caác thaânh àïí baån àoåc cuãa caác thû viïån coá thïí tòm kiïëm phêìn sau: nguöìn thöng tin (nguöìn thöng tin vaâ khai thaác CSDL cuãa caác nhaâ cung cêëp dûä nöåi böå do thû viïån quaãn lyá vaâ nguöìn tûâ xa, liïåu, caác nhaâ xuêët baãn hay caác taåp chñ danh tiïëng. Tûác laâ tiïën túái nhûäng thoãa thuêån vïì hoåc liïåu múã vaâ nguöìn thöng tin thû viïån mua húåp taác vaâ chia seã dûä liïåu. Àêy chñnh laâ àiïìu tûâ caác nhaâ xuêët baãn hay nhaâ cung cêëp thöng taåo nïn sûå khaác biïåt cuãa tòm kiïëm têåp trung. tin chuyïn nghiïåp), hïå thöëng àaánh chó muåc Coá thïí noái, thoãa thuêån giûäa nhaâ cung cêëp têåp trung; lúáp khai thaác vaâ ngûúâi duâng/ngûúâi dõch vuå tòm kiïëm thöng tin vaâ caác nhaâ cung tòm kiïëm thöng tin. Caác thaânh phêìn vaâ möëi cêëp thöng tin àoáng vai troâ quan troång trong liïn hïå trong möåt hïå thöëng WSD àûúåc mö taã giaãi phaáp tòm kiïëm têåp trung. Chñnh vò vêåy, nhû Hònh 3. Trong àoá, xeát vïì mùåt cöng nghïå, tïn cuãa caác giaãi phaáp naây thûúâng coá thïm tûâ coá hai thaânh phêìn quan troång laâ lúáp khai thaác “services” - dõch vuå (Web Scale Discovery vaâ hïå thöëng àaánh chó muåc têåp trung. Hïå Services) àïí chó rùçng àêy khöng chó laâ giaãi thöëng chó muåc têåp trung àûúåc coi laâ nöåi phaáp vïì cöng nghïå maâ bao haâm cung cêëp caác dung, trong khi àoá lúáp khai thaác seä laâ giao dõch vuå keâm theo [3]. Àiïìu naây cuäng lyá giaãi diïån àïí ngûúâi duâng tûúng taác vúái nöåi dung. Hònh 3. Cêëu truác möåt hïå thöëng WSD [10] 18 THÖNG TIN vaâ TÛ LIÏÅU - 3/2015
- Nghiïn cûáu - Trao àöíi Lúáp khai thaác (Discovery layer - DL) - Liïn kïët trûåc tiïëp àïën caác nguöìn dûä liïåu Lúáp khai thaác àûúåc àõnh nghôa laâ giao söë - àêy laâ thïë maånh cuãa caác dõch vuå WSD. diïån ngûúâi duâng vaâ hïå thöëng tòm kiïëm àïí WSD khöng chó àûa ra caác thöng tin vïì taâi khai thaác, hiïín thõ kïët quaã vaâ tûúng taác vúái liïåu tòm àûúåc maâ coân höî trúå baån àoåc truy cêåp nöåi dung thöng tin vúái ngûúâi duâng. Lúáp khai àïën taâi liïåu toaân vùn ngoaâi thû viïån thöng qua thaác coá möëi liïn hïå chùåt cheä vúái hïå thöëng xaác thûåc àõnh danh laâ ngûúâi duâng cuãa thû viïån àaánh chó muåc têåp trung. Vïì phña ngûúâi duâng, maâ baån àoåc àang sûã duång dõch vuå. lúáp khai thaác chñnh laâ giao diïån töíng húåp maâ - Coá khaã nùng tuây biïën vaâ caá nhên hoáa cho úã àoá hoå àûúåc cung cêëp caác dõch vuå cuãa ngûúâi duâng àêìu cuöëi. Möîi ngûúâi duâng àïìu WSD. DL àûúåc cêëu truác nhû laâ möåt cöíng àûúåc cung cêëp möåt taâi khoaãn àïí xaác nhêån thöng tin - núi giao tiïëp giûäa baån àoåc vaâ thû quyïìn truy cêåp cuäng nhû tuây biïën caác kïët quaã viïån. Thöng qua cöíng thöng tin naây ngûúâi duâng coá thïí khaám phaá vaâ khai thaác caác tòm cuãa mònh. Dûåa trïn nïìn Web 2.0, ngûúâi nguöìn tin maâ thû viïån cung cêëp. Lúáp khai duâng coá thïí töí chûác thöng tin, lûu trûä vaâ kïët thaác coá nhûäng àùåc tñnh sau: xuêët kïët quaã tòm kiïëm, cuäng nhû àùåt theã (tag), - Chûác nùng tòm kiïëm duy nhêët (single xïëp haång hoùåc chia seã àïí giúái thiïåu taâi liïåu tòm search) dûåa trïn nïìn taãng hïå thöëng chó mucå àûúåc. Caác thû viïån cuäng coá thïí gùæn logo hoùåc têåp trung (central index). Vúái möåt ö tòm kiïëm caác thöng tin vïì thû viïån trïn giao diïån cuãa àún giaãn vaâ duy nhêët ngûúâi duâng coá thïí tòm dõch vuå WSD. kiïëm nhiïìu nguöìn taâi nguyïn thöng tin àiïån tûã Hïå thöëng chó muåc dûä liïåu têåp trung trong vaâ ngoaâi thû viïån. WSD coá cöng cuå tòm (Central index) kiïëm thöng minh vaâ maånh. Hïå thöëng höî trúå Hïå thöëng seä tiïën haânh àaánh chó muåc àöëi vúái ngûúâi duâng tòm kiïëm theo tûâ khoáa, taác giaã, toaân böå nöåi dung maâ thû viïån cung cêëp, àoá coá nhan àïì hay chuã àïì vúái caác toaán tûã höî trúå, hay thïí laâ tûâ nhaâ xuêët baãn göëc, nhaâ xuêët baãn cêëp tòm theo cêëu truác cuäng nhû kiïím tra chñnh taã hai hay nha â tñch húåp nöåi dung vaâ nhûäng thöng vaâ gúåi yá àöëi vúái tûâ hoùåc cuåm tûâ khöng chñnh tin nöåi sinh cuãa thû viïån. Coá thïí noái dõch vuå xaác àûúåc àûa vaâo tòm kiïëm. chó muåc dûä liïåu têåp trung chñnh laâ traái tim cuãa - Thúâi gian phaãn höìi kïët quaã tòm kiïëm hïå thöëng WSD. Noá taåo ra sûå kïët nöëi ngûúâi nhanh. Àêy laâ àiïìu kiïån tiïn quyïët àöëi vúái duâng vúái caác nguöìn taâi nguyïn thöng tin. Hïå nùng lûåc cuãa caác hïå thöëng WSD. Phaãn höìi kïët thöëng naây thûåc chêët laâ taåo ra möåt CSDL töí quaã tûác thò laâ yïu cêìu quan troång cuãa möåt maáy tòm kiïëm. húåp hay möåt muåc luåc trung têm chûáa caác biïíu ghi cuãa têët caã nguöìn taâi nguyïn maâ thû viïån - Xïpë hangå mûcá àö å liïn quan trong kïtë quaã quaãn lyá cuäng nhû nhûäng siïu liïn kïët àïën kho tòm. Àûa cacá kïtë qua ã co á nöiå dung gênì nhêtë àöië vúiá yïu cêuì tòm kiïmë thöng qua viïcå xïpë hangå taâi nguyïn söë trûåc tuyïën. Hònh 4 mö taã caác thöng minh cacá kïtë qua ã tòm cungä nhû gúiå y á cacá nguöìn thöng tin àûúåc àaánh chó muåc têåp trung taiâ liïuå liïn quan àïnë yïu cêuì cuaã ngûúiâ tòm. trong hïå thöëng WSD. - Coá caác cöng cuå àïí sùæp xïëp, thu heåp, loåc Caác nguöìn thöng tin bao göìm: nguöìn trong dûåa trïn kïët quaã àaä tòm kiïëm àûúåc. Ngûúâi thû viïån, nguöìn múã miïîn phñ trïn Internet, duâng coá thïí tinh chïë yïu cêuì tòm tin, thu heåp nguöìn cuãa chñnh caác nhaâ cung cêëp dõch vuå kïët quaã tòm kiïëm dûåa trïn caác tiïu chñ vïì thúâi WSD, nguöìn tûâ caác cung cêëp dûä liïåu chuyïn gian, loaåi hònh, chuã àïì cuãa taâi liïåu. nghiïåp vaâ nguöìn tûâ caác nhaâ xuêët baãn. THÖNG TIN vaâ TÛ LIÏÅU - 3/2015 19
- Nghiïn cûáu - Trao àöíi Hònh 4. Mö hònh àaánh chó muåc têåp trung cuãa WSD [6] Àöëi vúái möåt hïå thöëng àaánh chó muåc têåp Àùng nhêåp möåt lêìn - Single sign on trung thò àöå lúán cuãa CSDL àaánh chó muåc Dõch vuå àùng nhêåp möåt lêìn - single sign khöng quan troång bùçng caác yïëu töë nhû: phaåm on (SSO) laâ möåt tñnh nùng giuáp baån àoåc vi vaâ àöå sêu cuãa nöåi dung thöng tin, loaåi hònh thuêån tiïån hún khi sûã duång caác dõch vuå thû taâi liïåu, taâi liïåu göëc toaân vùn hay àöå phong viïån. Baån àoåc coá taâi khoaãn cuãa thû viïån chó phuá cuãa siïu dûä liïåu. Möåt hïå chó muåc hiïåu quaã cêìn àùng nhêåp möåt lêìn laâ coá thïí sûã duång laâ giuáp caác thû viïån cung cêëp thöng tin phuâ nhiïìu dõch vuå khaác nhau cuãa thû viïån. Thöng húåp vúái nhu cêìu baån àoåc dûåa trïn nhûäng nöåi thûúâng caác dõch vuå trong thû viïån àûúåc thûåc dung maâ thû viïån àang coá. Hïå thöëng phaãi hiïíu hiïån búãi nhiïìu ûáng duång tûâ nhiïìu nhaâ cung àûúåc baån àoåc cêìn gò vaâ àûa ra nhûäng gúåi yá cêëp giaãi phaáp khaác nhau. Khi baån àoåc truy phuâ húåp. Chñnh vò thïë maâ úã möåt khña caånh naâo cêåp àïën caác dõch vuå hay taâi nguyïn thöng tin àoá WSD àûúåc coi laâ trñ tuïå nhên taåo cuãa nùng do thû viïån cung cêëp thûúâng phaãi xaác thûåc lûåc thöng tin (information literacy). quyïìn truy cêåp vaâo hïå thöëng. Nïëu khöng coá Coá hai khaái niïåm trong chó muåc têåp trung sûå thöëng nhêët trong thiïët kïë hïå thöëng, baån àoåc àoá laâ àaánh chó muåc trûúác (pre- harvested phaãi àùng nhêåp nhiïìu lêìn khi sûã duång caác index) vaâ àöìng súã hûäu nöåi dung thöng tin dõch vuå khaác nhau trong thû viïån. Vñ duå, (mutually licensed content). Caác siïu dûä liïåu ngûúâi duâng phaãi àùng nhêåp àïí biïët thöng tin vaâ taâi liïåu toaân vùn àûúåc thu gom möåt caách hïå vïì mûúån traã hay gia haån mûúån taâi liïåu. Khi thöëng vaâ àõnh kyâ vaâ àûúåc xûã lyá trûúác àïí phuåc khai thaác CSDL söë trong thû viïån, ngûúâi vuå cho viïåc tòm kiïëm thöng tin sau naây. Dûä duâng laåi phaãi àùng nhêåp lêìn nûäa àïí xaác thûåc liïåu àûúåc thu thêåp tûâ nhiïìu nguöìn khaác nhau àõnh danh, viïåc naây cuäng seä diïîn ra tûúng tûå vaâ àûúåc àûa vaâo hïå thöëng chó muåc têåp trung nïëu ngûúâi duâng khai thaác nguöìn thöng tin àïí xûã lyá. Àöëi vúái nguöìn thöng tin coá baãn trûåc tuyïën maâ thû viïån mua baãn quyïìn truy quyïìn (cuãa thû viïån vaâ caác nhaâ cung cêëp cêåp. Àiïìu naây seä gêy phiïìn toaái cho baån àoåc. WSD) thò ngûúâi duâng phaãi xaác thûåc àõnh danh SSO giuáp baån àoåc xaác thûåc quyïìn cuãa mònh àïí truy cêåp àïën taâi liïåu toaân vùn. àöëi vúái toaân böå dõch vuå maâ thû viïån cung cêëp 20 THÖNG TIN vaâ TÛ LIÏÅU - 3/2015
- Nghiïn cûáu - Trao àöíi vúái möåt lêìn àùng nhêåp duy nhêët. Ngoaâi viïåc cûúâng tñnh baão mêåt cuãa hïå thöëng vaâ dïî daâng giuáp baån àoåc tiïån lúåi trong sûã duång dõch vuå trong viïåc quaãn trõ cuäng nhû giaãm chi phñ cuãa thû viïån, SSO coân giuáp caác thû viïån tùng trong quaãn lyá. Hònh 5. Sú àöì mö taã àùng nhêåp trûúác vaâ sau khi aáp duång SSO [2] SSO kïët húåp vúái WSD laâ möåt phaãi phaáp kïí àïën nhû: Summon (cuãa ProQuest), Primo töíng thïí trong quaãn trõ thû viïån trong thúâi àaåi (cuãa Ex Libris), EBSCO Discovery Service söë vaâ Internet. Muåc tiïu laâ mang àïën cho (cuãa EBSCO) vaâ WorldCat Discovery ngûúâi duâng sûå dïî daâng vaâ thuêån tiïån trong Services (cuãa OCLC). Coá thïí thêëy rùçng viïåc tiïëp cêån caác dõch vuå cuãa thû viïån. Bïn nhûäng tïn tuöíi naây àïìu laâ nhûäng nhaâ cung caånh àoá giaãi phaáp naây giuáp caác thû viïån quaãn cêëp thöng tin vaâ giaãi phaáp cöng nghïå chuyïn trõ hïå thöëng cuãa mònh dïî daâng hún vaâ nêng nghiïåp. Caác nhaâ cung cêëp naây coá sûå caånh cao nùng lûåc cung cêëp thöng tin cuãa thû viïån. tranh thõ phêìn vúái nhau, song trong möåt söë 2.3. Möåt söë nhaâ cung cêëp dõch vuå WSD trûúâng húåp hoå phaãi húåp taác vúái nhau vò coá trïn thïë giúái nhûäng thû viïån sûã duång nguöìn dûä liïåu tûâ WSD laâ dõch vuå múái so vúái lõch sûã ûáng nhiïìu nhaâ cung cêëp [7]. duång cöng nghïå thöng tin trong lônh vûåc thû Dõch vu å Summon cuaã ProQuest hiïnå co á hún viïån. Tuy nhiïn, dõch vuå naây àang àûúåc rêët 500 thû viïnå trïn thï ë giúiá sû ã dung,å khachá hangâ nhiïìu thû viïån quan têm. Hiïån nay, trïn thïë tiïu biïuí cuaã dõch vu å nayâ la â Àaiå hocå Harvard, giúái coá möåt söë dõch vuå WSD nöëi tiïëng coá thïí Hoa Ky â va â Àaiå hocå Victoria, New Zealand [9]. THÖNG TIN vaâ TÛ LIÏÅU - 3/2015 21
- Nghiïn cûáu - Trao àöíi ProQuest laâ möåt nhaâ cung cêëp CSDL toaân vùn xïëp kïtë quaã tòm kiïëm theo mûác àöå ûu tiïn vïì nhiïìu lônh vûåc khoa hoåc, ngoaâi ra coân cung (streamlined search) vaâ trònh baây trïn möåt cêëp caác giaãi phaáp, ûáng duång vaâ caác saãn phêím giao diïån thên thiïån vaâ àöìng nhêët. EBSCO cho thû viïån. Trong àoá Summon laâ möåt giaãi phöëi húåp vúái caác nhaâ cung cêëp thöng tin àïí phaáp tòm kiïëm têåp trung nöíi bêåt. Summon laâ tñch húåp vaâo dõch vuå EDS nhùçm muåc tiïu höî möåt giaãi phaáp cöng nghïå múái, dïî sûã duång vúái trúå ngûúâi duâng tòm kiïëm, truy cêåp nhûäng tiïu chñ chó cêìn möåt cöíng tòm kiïëm duy nhêët thöng tin coá chêët lûúång töët nhêët, phuåc vuå hiïåu coá thïí truy cêåp àïën têët caã caác CSDL phên taán quaã cho cöng viïåc cuãa mònh [4]. nhûäng nhû caác CSDL àún leã trûåc tuyïën khaác. OCLC (Trung têm thû viïån maáy tñnh trûåc Muåc tiïu cuãa Summon laâ giuáp caác thû viïån taåo tuyïën) cung cêëp dõch vuå WorldCat discovery lêåp möåt möi trûúâng hoåc thuêåt trong àoá höî trúå services vúái khaã nùng tòm kiïëm vaâ truy cêåp baån àoåc cuãa thû viïån tiïëp cêån túái caác nguöìn àïën 1,8 tyã taâi liïåu cuãa 74.000 thû viïån trïn thïë thöng tin maâ hoå cêìn thöng qua mötå cöíng giúái. Àêy coá thïí coi laâ möåt ûáng duång àiïån toaán thöng tin duy nhêët cuãa thû viïån [1]. àaám mêy (cloud-based application). Ngoaâi Ex Libris laâ nhaâ cung cêëp caác giaãi phaáp tûå khaã nùng cung cêëp truy cêåp àïën nguöìn taâi liïåu àöång hoáa cho thû viïån. Ex Libris têåp trung söë trûåc tuyïën, dõch vuå naây coân hö î trúå mûúån vaâo xêy dûång giaãi phaáp töíng thïí cho thû viïån liïn thû viïån àöëi vúái caác taâi liïåu in êën. Àuáng bao göìm: khai thaác, quaãn trõ vaâ phên phöëi caác nhû tïn goåi cuãa dõch vuå, WorldCat Local kïët nguöìn taâi liïåu trong thû viïån kïí caã taâi liïåu in nöëi ngûúâi duâng chùåt cheä vúái chñnh thû viïån êën vaâ taâi liïåu söë. Dõch vuå Primo cuãa Ex Libris cuãa hoå, taåo ra möåt kïnh chuyïín giao thöng tin àang àûúåc trïn hún 2.100 thû viïån sûã duång. dûåa trïn nhûäng dõch vuå maâ thû viïån cung cêëp, Àêy laâ möåt trong nhûäng dõch vuå WSD phöí àún giaãn hoáa dõch vuå mûúån taâi liïåu cuãa thû biïën nhêët hiïån nay. Primo giuáp ngûúâi duâng viïån. Cuäng nhû caác dõch vuå WSD khaác, ngûúâi khaám phaá tri thûác tûâ nhiïìu nguöìn khaác nhau duâng àûúåc traãi nghiïåm viïåc tòm kiïëm thöng vaâ chuyïín giao trûåc tiïëp àïën ngûúâi duâng. Dõch tin thöng qua möåt höåp tòm kiïëm duy nhêët vaâ vuå naây giuáp ngûúâi duâng caá nhên hoáa phûúng kïët quaã àûúåc phên loaåi, sùæp xïëp vaâ àöìng böå thûác tòm kiïëm, àaánh giaá vaâ sùæp xïëp kïët quaã hoáa theo nhu cêìu cuãa ngûúâi duâng [8]. tòm kiïëm vaâ chia seã lïn maång xaä höåi. Cuäng Möiî dõch vu å àïuì co á nhûngä thï ë manhå riïng nhû caác dõch vuå WSD khaác, àaánh chó muåc têåp cuaã mònh va â khöng co á dõch vu å naoâ la â töië ûu cho trung chñnh laâ àiïím maånh cuãa Primo trong tûngâ thû viïnå cu å thï.í Viïcå apá dungå cacá dõch vuå viïåc giuáp ngûúâi duâng tòm kiïëm thöng tin trong nayâ phu å thuöcå vaoâ quy mö, àöië tûúngå phucå vuå caác CSDL phên taán [5]. va â tiïmì lûcå taiâ chñnh cuaã möiî thû viïn.å EBSCO Discovery Service (EDS) laâ möåt Ngoaâi caác dõch vuå tòm kiïëm coá baãn quyïìn, dõch vuå WSD cuãa EBSCO - nhaâ cung cêëp dûä hiïån nay cuäng coá rêët nhiïìu caác giaãi phaáp maä liïåu vaâ giaãi phaáp tûå àöång hoáa cho thû viïån. nguöìn múã WSD daânh cho thû viïån. Coá thïí kïí Vúái triïët lyá hûúáng túái sûå tiïån lúåi vaâ àún giaãn àïën nhû: Blacklight, Fac-Back-OPAC, hoáa viïåc tòm kiïëm thöng tin cho ngûúâi duâng, LibraryFind, Rapi, Scriblio, SOPAC vaâ EDS cung cêëp cöng cuå tòm kiïëm àa nguöìn VuFind. Caác giaãi phaáp maä nguöìn múã cuäng (OPACs, taåp chñ àiïån tûã, saách àiïån tûã vaâ caác tiïëp cêån phûúng phaáp tòm kiïëm tûúng tûå nhû CSDL toaân vùn) trong möåt cûãa söí tòm WSD baãn thûúng maåi. Àiïím khaác nhau giûäa kiïëm duy nhêët, coá khaã nùng phên loaåi vaâ sùæp giaãi phaáp maä nguöìn vaâ WSD thûúng maåi laâ 22 THÖNG TIN vaâ TÛ LIÏÅU - 3/2015
- Nghiïn cûáu - Trao àöíi caác nhaâ cung cêëp giaãi phaáp thûúng maåi mong muöën? Giao diïån ngûúâi duâng coá thên thûúâng cung cêëp goái thöng tin ài keâm (coá sûå thiïån, dïî sûã duång vaâ àiïíu khiïín àûúåc khöng? thoãa thuêån àöëi vúái nhaâ cung cêëp thöng tin), Ngûúâi duâng coá khaã nùng nêng cao hiïåu quaã trong khi àoá, nïëu thû viïån quyïët àõnh sûã duång tòm kiïëm thöng qua caác tiïu chñ vaâ caác gúåi yá maä nguöìn múã, hoå phaãi tuây biïën maä nguöìn naây cuãa hïå thöëng? Nhûäng cêu hoãi nayâ cêìn àûúåc traã vaâ xêy dûång thoãa thuêån vúái caác nhaâ cung cêëp lúâi “coá” múái coá thïí xem xeát àêìu tû möåt hïå dõch vuå thöng tin. thöëng WSD. 3. Giaãi phaáp cho caác thû viïån Viïåt Nam 3.2. Tûå phaát triïín WSD trong nûúác 3.1. Mua cacá giaiã phapá WSD tû â nûúcá ngoaiâ Cêu hoãi àùåt ra laâ caác cöng ty cöng nghïå vaâ Giaãi phaáp nhanh nhêët cho caác thû viïån àaåi caác thû viïån Viïåt Nam coá thïí phaát triïín hïå hoåc Viïåt Nam àoá laâ mua dõch vuå WSD cuãa thöëng WSD àûúåc khöng? Cêu traã lúâi laâ “coá”. nûúác ngoaâi. Vúái kinh nghiïåm triïín khai lêu Vïì mùåt cöng nghïå, xêy dûång hïå thöëng tòm nùm, töëi ûu vïì mùåt cöng nghïå vaâ khaã nùng kïët kiïëm WSD laâ hoaân toaân khaã thi àöëi vúái nùng nöëi, coá möëi liïn hïå röång vúái caác nhaâ cung cêëp lûåc hiïån taåi cuãa caác cöng ty cöng nghïå. Möåt söë thöng tin chuyïn nghiïåp, caác giaãi phaáp nûúác cöng ty àaä bùæt tay vaâo phaát triïín hïå thöëng tòm ngoaâi hiïåu quaã hún vïì mùåt tòm kiïëm vaâ múã kiïëm têåp trung vaâ àang chaåy thûã nghiïåm vaâ röång truy cêåp àïën caác nguöìn tin chêët lûúång. cho kïët quaã bûúác àêìu. Ngoaâi viïåc tûå phaát triïín Àöëi vúái caác thû viïån coá tiïìm lûåc thò àêy laâ lûåa cöng nghïå naây, caác cöng ty hay thû viïån hoaân choån töëi ûu. toaân coá thïí sûã duång maä nguöìn múã àïí phaát Tuy nhiïn, kho á khùn cuaã phênì lúná cuaã cacá triïín thïm hoùåc tuây biïën theo nhu cêìu thûåc tïë. thû viïnå àaiå hocå Viïtå Nam la â kinh phñ hoatå àöngå Vêën àïì coân laåi laâ úã chñnh caác thû viïån. Àoá hangâ nùm hanå chï.ë Do vêy,å àêuì tû mötå hï å thöngë laâ sûå mong muöën aáp duång cuäng nhû thoãa WSD tû â nûúcá ngoaiâ la â thûcå sû å ngoaiâ têmì vúiá cuaã thuêån húåp taác trong viïåc chia seã nguöìn thöng cacá thû viïn.å Vúiá viïcå phaiã mua banã quyïnì theo tin. Àöëi vúái caác nguöìn tin phên taán trong nöåi nùm, cacá dõch vu å nayâ àoiâ hoiã cacá thû viïnå cênì coá böå möåt thû viïån (local resources), viïåc aáp tiïmì lûcå taiâ chñnh manhå àï í duy trò. duång WSD laâ dïî daâng vaâ khaã thi. Tuy nhiïn, Möåt söë chuá yá khi quyïët àõnh àêìu tû möåt hïå àöëi vúái nguöìn tin tûâ xa (remote resources) thò thöëng WSD àoá laâ cêìn xem xeát caác tñnh nùng viïåc tòm kiïëm vaâ khai thaác laâ möåt trúã ngaåi lúán. cuãa àaánh chó muåc têåp trung vaâ lúáp khai thaác. Àïí hïå thöëng tòm kiïëm têåp trung àaåt hiïåu quaã Cöng cuå àaánh chó muåc têåp trung coá giuáp àûa thò nhêët thiïët phaãi coá sûå húåp taác giûäa caác thû ra toaân böå nhûäng nguöìn thöng tin maâ thû viïån viïån. Ào á laâ sûå thoãa thuêån troång viïåc cho pheáp àang nùæm giûä khöng? Caác kïtë quaã tòm kiïëm coá caác maáy tòm kiïëm coá thïí truy cêåp vaâ tòm kiïëm àûúåc xïëp haång vaâ phuâ húåp vúái yïu cêìu ngûúâi trong caác CSDL. Cao hún nûäa àoá laâ thoãa duâng khöng? Hïå thöëng coá khaã nùng tòm kiïëm thuêån trong viïåc truy cêåp caác nguöìn taâi àûúåc caác CSDL cuãa caác nhaâ cung cêëp maâ thû nguyïn söë. Nïëu múái chó dûâng úã bûúác tòm viïån mua baãn quyïìn khöng? Hïå thöëng coá cung kiïëm, maâ chûa thïí lêëy àûúåc taâi liïåu vïì sûã duång cêëp khaã nùng tòm kiïëm toaân vùn cho caác baâi thò khöng phaãi laâ möåt hïå thöëng WSD hoaân baáo taåp chñ khöng? Hïå thöëng coá caác mûác tòm chónh. Àiïìu naây laåi phuå thuöåc vaâ sûå thoãa thuêån kiïëm cú baãn hoùåc nêng cao hay khöng, coá haån giûäa caác thû viïån vúái nhau. chïë ngûúâi duâng tòm kiïëm nöåi dung maâ hoå Möåt trúã ngaåi cuãa caác giaãi phaáp WSD phaát THÖNG TIN vaâ TÛ LIÏÅU - 3/2015 23
- Nghiïn cûáu - Trao àöíi triïín trong nûúác àoá laâ khaã nùng khai thaác caác thöng tin nhanh, dïî daâng vaâ hiïåu quaã trong nguöìn thöng tin coá baãn quyïìn tûâ caác nhaâ cung möåt khöëi lûúång thöng tin khöíng löì. Seä khöng cêëp thöng tin chuyïn nghiïåp trïn thïë giúái. coân coá caán böå thû viïån tuác trûåc höî trúå baån àoåc Thûúâng thò caác nhaâ cung cêëp dõch vuå WSD trong tòm kiïëm thöng tin nhû khi baån àoåc àïën àïìu caånh tranh nhau. Do vêåy, àïí húåp taác vúái trûåc tiïëp thû viïån, thay vaâo àoá baån àoåc phaãi tûå hoå laâ khoá vò hoå vûâa àoáng vai troâ laâ nhaâ cung khai thaác thöng tin. Àiïìu naây naãy sinh nhu cêìu cêëp thöng tin cuäng nhû giaãi phaáp WSD. Àöëi laâ cêìn coá möåt hïå thöëng tòm kiïëm àuã thöng vúái möåt söë thû viïån coá khaã nùng mua àûúåc caác minh àïí biïët baån àoåc cêìn gò vaâ tòm kiïëm thöng CSDL trûåc tuyïën, möåt trong nhûäng thoãa thuêån tin úã àêu. WSD ra àúâi vúái kyâ voång àaáp ûáng quan troång laâ cho pheáp WSD coá thïí tòm kiïëm àûúåc nhu cêìu naây. WSD laâ möåt dõch vuå àoâi àûúåc thöng tin trong CSDL maâ thû viïån mua hoãi cao vïì cöng nghïå, chi phñ vaâ nhên lûåc. Do baãn quyïìn. vêåy, caác thû viïån cêìn coá sûå chuêín bõ cho caác 4. Kïët luêån yïëu töë naây àïí sùén saâng xêy dûång vaâ triïín khai Vúái sûå gia tùng khöng ngûâng cuãa taâi dõch vuå WSD. Viïåc húåp taác giûäa caác thû viïån nguyïn söë vaâ xu thïë khai thaác thöng tin trûåc àïí xêy dûång dõch vuå WSD laâ möåt àiïìu kiïån tuyïën àaä vaâ àang àùåt ra cho caác thû viïån möåt tiïn quyïët töëi quan troång trong chiïën lûúåc phaát baâi toaán khoá, àoá laâ höî trúå ngûúâi duâng tòm kiïëm triïín chung cuãa hïå thöëng thû viïån àaåi hoåc. Taâi liïåu tham khaão 1. Burke, J. (2010). Discovery versus 6. Hoeppner, A. (2012). The ins and outs of Disintermediation: the new reality driven by evaluating web-scale discovery services. Com- today’s end-user. Retrieved from puters in Libraries, 3(32), pp. 6-11. 7. OCABD - Orbis Cascade Alliance Board of LA2010_57_Burke_Final.pdf. Directors (2014). Alliance Board letter to EBSCO 2. Codeproject (2013). Basics of Single Sign and Ex Libris. Retrieved from on (SSO). Retrieved from cascade.org/file_viewer.php?id=2205 ject.com/Articles/429166/Basics-of-Single-Sign- 8. Oclc (2014). WorldCat Local. Retrieved on-SSO. from 3. Diamond, T.; Price, S. and Chandrasekar, 9. ProQuest (2014). Discovery Services. R. (2013). Actions Speak Louder than Words: Retrieved from Analyzing large-scale query logs to improve the libraries/academic/discovery-services. research experience. Code4Lib Journal. 10. Thompson, J. (2014). Implementing web- Retrieved from scale discovery services: A practical guide for cles/8693. librarians. London: Rowman & Littlefield Pub- 4. Ebsco (2014). Ebsco discovery services. lishers Retrieved from 11. Vaughan, J. (2011). Investigations into 5. Exlibris (2014). Primo - Empowering library web scale discovery services. Information libraries to address user deeds. Retrieved from Technology and Libraries. Retrieved from moOverview. (Ngaây Toâa soaån nhêån àûúåc baâi: 08-11-2014; Ngaây phaãn biïån àaánh giaá: 14-02-2015; Ngaây chêëp nhêån àùng: 22-04-2015). 24 THÖNG TIN vaâ TÛ LIÏÅU - 3/2015