<input id="yq62h"><object id="yq62h"></object></input>
  • <label id="yq62h"><big id="yq62h"></big></label>
    <th id="yq62h"><kbd id="yq62h"><menu id="yq62h"></menu></kbd></th>

    1. <span id="yq62h"><blockquote id="yq62h"></blockquote></span>
      <legend id="yq62h"><output id="yq62h"></output></legend>
      1. <s id="yq62h"><dfn id="yq62h"><noframes id="yq62h"><strike id="yq62h"><input id="yq62h"></input></strike>

        數(shù)字博物館—博物館網(wǎng)絡(luò)信息采集系統(tǒng)

        斌鉞博物館網(wǎng)絡(luò)信息資源采集系統(tǒng)定位是一套功能強(qiáng)大的網(wǎng)絡(luò)信息資源開(kāi)發(fā)利用與整合系統(tǒng),可用于定制跟蹤和監(jiān)控互聯(lián)網(wǎng)實(shí)時(shí)信息,能夠快速及時(shí)地捕獲用戶所需的熱點(diǎn)新聞、市場(chǎng)情報(bào)、行業(yè)信息、政策法規(guī)、學(xué)術(shù)文獻(xiàn)等網(wǎng)絡(luò)信息內(nèi)容,建立可再利用的信息服務(wù)系統(tǒng)。系統(tǒng)能夠從各種網(wǎng)絡(luò)信息源采集用戶感興趣的特定信息,經(jīng)自動(dòng)分類(lèi)處理后,以多種形式提供給最終用戶使用。

        系統(tǒng)可以對(duì)國(guó)內(nèi)外不少于50個(gè)網(wǎng)站上公開(kāi)發(fā)布的指定內(nèi)容的信息進(jìn)行定向采集;實(shí)時(shí)動(dòng)態(tài)監(jiān)控特定目標(biāo);將標(biāo)題、全文等內(nèi)容轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù);支持部分附件全文等非結(jié)構(gòu)化內(nèi)容的采集,支持全文檢索。采集信息自動(dòng)建庫(kù)存儲(chǔ),內(nèi)容可進(jìn)行加工處理,直接存入數(shù)據(jù)庫(kù),可與本項(xiàng)目中其他館內(nèi)資源整合到一起進(jìn)行資源服務(wù)。

        (一)系統(tǒng)功能要求:

        (1)先進(jìn)的資源智能處理能力

        系統(tǒng)基于語(yǔ)義分析技術(shù),集成多種智能信息處理算法,支持采集信息的自動(dòng)分類(lèi);支持用戶自定義分類(lèi)體系。系統(tǒng)擁有自學(xué)習(xí)功能,可以根據(jù)用戶反饋信息,及時(shí)地自學(xué)習(xí)完善知識(shí)體系,提高自身的智能性。

        (2)強(qiáng)大的信息采集能力

        高效的信息采集技術(shù)完成網(wǎng)絡(luò)數(shù)據(jù)獲取,能快速、全面、準(zhǔn)確的從Internet上獲取數(shù)據(jù),并可對(duì)采集的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。可以多線程并行采集,靈活地定制采集策略。對(duì)于采集規(guī)模較大的應(yīng)用,可支持采用集群式網(wǎng)絡(luò)蜘蛛抓取,從而滿足抓取速度上的需求。

        (3)體系結(jié)構(gòu)靈活

        網(wǎng)絡(luò)蜘蛛群集,智能代理群集,應(yīng)用服務(wù)器智能調(diào)度,各子系統(tǒng)可以支持隨時(shí)斷開(kāi)以及隨時(shí)連接到系統(tǒng)中來(lái),不影響整個(gè)系統(tǒng)的運(yùn)行。

        (4)基于海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和全文檢索能力

        能夠與本項(xiàng)目購(gòu)買(mǎi)的全文檢索數(shù)據(jù)庫(kù)系統(tǒng)協(xié)同工作,支持海量非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)管理,支持全文檢索,支持智能相似檢索技術(shù),檢索速度可達(dá)百萬(wàn)級(jí)文獻(xiàn)量毫秒級(jí)響應(yīng)。

        (5)強(qiáng)大的發(fā)布系統(tǒng)

        系統(tǒng)支持多種發(fā)布風(fēng)格,包括:專題庫(kù)風(fēng)格、信息資源門(mén)戶風(fēng)格、搜索引擎風(fēng)格等。支持動(dòng)態(tài)摘要和敏感摘要,并提供標(biāo)紅、網(wǎng)頁(yè)快照、相關(guān)網(wǎng)頁(yè)自動(dòng)關(guān)聯(lián)等實(shí)用功能。

        (6)穩(wěn)定可靠的系統(tǒng)性能

        系統(tǒng)支持采用分布式的群集系統(tǒng)、高效的搜索算法以及靈活的體系結(jié)構(gòu),保證整個(gè)系統(tǒng)的高穩(wěn)定性和易用性。

        (7)滿足用戶的各種個(gè)性化檢索需求

        支持用戶自定義符合特殊需求的個(gè)性化分詞詞典,只需要輸入專業(yè)詞匯,系統(tǒng)便會(huì)按照用戶的定制精確檢索,大幅提高檢索效率和查全查準(zhǔn)率,充分滿足用戶的各種個(gè)性化檢索需求。

        (8)支持主流的中文編碼標(biāo)準(zhǔn)

        包括GBK(漢字內(nèi)碼擴(kuò)展規(guī)范)、GB2312(簡(jiǎn)體)、BIG5(繁體)、Unicode,并且能夠在不同的編碼之間轉(zhuǎn)換。

        (9)支持與博物館其他系統(tǒng)進(jìn)行深度整合

        系統(tǒng)采集信息支持與博物館信息資源建設(shè)與管理系統(tǒng)建設(shè)的信息進(jìn)行整合服務(wù),與信息資源建設(shè)與管理系統(tǒng)采用相同架構(gòu)的全文數(shù)據(jù)庫(kù)管理系統(tǒng)進(jìn)行數(shù)據(jù)管理。

        (二)系統(tǒng)性能要求:

        l信息采集器:采集快,實(shí)時(shí)響應(yīng)。

        l信息采集器監(jiān)控:實(shí)時(shí)響應(yīng)。

        l采集信息排重:實(shí)時(shí)響應(yīng)。

        l相似性分析時(shí)間:100萬(wàn)記錄/20毫秒。

        Hash:27efc0d85d42f5318909e5ed01e03406c6a12910

        聲明:此文由 錦霖文保 分享發(fā)布,并不意味本站贊同其觀點(diǎn),文章內(nèi)容僅供參考。此文如侵犯到您的合法權(quán)益,請(qǐng)聯(lián)系我們 kefu@qqx.com

        一级毛片**免费看试看20分钟,亚洲日本在线观看,欧美日本韩国一区二区,中文字幕在线观 泉州市| 吉林市| 当涂县| 武功县| 普陀区| 农安县| 泰州市| 云梦县| 黑水县| 灵台县| 北流市| 九江市| 玉门市| 玉田县| 苍溪县| 汤原县| 洱源县| 上饶市| 天水市| 中牟县| 报价| 苏州市| 吴川市| 威信县| 西贡区| 和林格尔县| 宜兰县| 尼木县| 安陆市| 达孜县| 南溪县| 比如县| 汨罗市| 兴仁县| 肥乡县| 晋城| 东乡县| 淳安县| 五大连池市| 无为县| 奇台县| http://444 http://444 http://444 http://444 http://444 http://444