cGPT S1000自然語言搜索一體機

cGPT S1000 natural language search all-in-one rack

產(chǎn)品介紹

cGPT S1000自然語言搜索一體機是云創(chuàng)大數(shù)據(jù)針對大規(guī)模自然語言處理應(yīng)用場景，自主研發(fā)的高速向量計算搜索一體機。該一體機采用并行計算架構(gòu)，融合高密度混合服務(wù)硬件，為用戶提供軟硬件一體化的高性能自然語言搜索解決方案。

cGPT S1000自然語言搜索一體機支持TXT、Word、PDF、CSV等多種格式的數(shù)據(jù)源，支持對采集的數(shù)據(jù)源進行文本提取和數(shù)據(jù)清洗，采用分布式集群架構(gòu)，智能化自動構(gòu)建搜索資料庫。用戶只需將海量的業(yè)務(wù)文件、圖書論文文獻、文本數(shù)據(jù)等導(dǎo)入該一體機，即可建立個性化的定制搜索引擎。

支持基于文本語義理解技術(shù)，具備更加準確的檢索能力，能夠?qū)⑤斎氩樵兊奈谋九c一體機中的文本進行快速比對，并將搜索到與輸入文本語義相近的多組結(jié)果根據(jù)相似度排序返回輸出。針對千萬級甚至上億量級的文本數(shù)據(jù)庫，該一體機依舊可以達到0.1秒級的返回結(jié)果速率。

總體架構(gòu)

cGPT S1000自然語言搜索一體機基于大數(shù)據(jù)分布式實時計算框架，結(jié)合定制化高密度計算硬件，實現(xiàn)大規(guī)模自然語言處理任務(wù)的分發(fā)與計算結(jié)果匯聚，保證計算任務(wù)執(zhí)行的高效和穩(wěn)定。基于特征向量計算算法以及分布式集群處理資源調(diào)度技術(shù)，該一體機實現(xiàn)了海量特征庫條件下1：N對比任務(wù)的高效分解與并行處理，可將單個任務(wù)響應(yīng)效率提升到0.1秒級。

技術(shù)優(yōu)勢

自然語言語義理解

自然語言搜索一體機通過理解文本語義，能夠識別不同表達方式的真實含義，進行語義相似度計算并排序，從而大幅度提高輸出結(jié)果的準確性。

0.1秒級響應(yīng)搜索

搜索方式基于語義理解而非傳統(tǒng)的關(guān)鍵詞匹配搜索，涵蓋詞、短語、整句等不同粒度，結(jié)果返回速率可達0.1秒級。

支持動態(tài)擴展

對于不同數(shù)據(jù)規(guī)模需求的用戶，自然語言搜索一體機提供了彈性的性能資源配置模式，可以有效地控制系統(tǒng)建設(shè)成本，靈活滿足千萬甚至上億量級業(yè)務(wù)規(guī)模的性能需求和使用場景。

支持私有化部署

提供API接口，搜索應(yīng)用可部署至本地服務(wù)器或者用戶私有云環(huán)境，與用戶業(yè)務(wù)打通融合的同時，實現(xiàn)內(nèi)外網(wǎng)的物理隔絕，保障數(shù)據(jù)的私密性。

技術(shù)規(guī)格

應(yīng)用場景

cGPT S1000自然語言搜索一體機基于語義理解技術(shù)，能夠快速查找需要的內(nèi)容，可廣泛應(yīng)用于資料查詢、專利搜索、電子病歷檢索、法律文獻檢索、學術(shù)文獻檢索、論文查重等多種場景。

資料查詢

用戶內(nèi)部積存大量的檔案、資料、文書等各種形式的文檔，檢索資料不僅繁瑣且重復(fù)性高，耗費大量時間和精力。通過自然語言處理技術(shù)，只需簡短的一句話或幾個關(guān)鍵詞，自然語言搜索一體機即可完成資料搜索，命中率和準確率都大幅提高。

專利搜索

通過關(guān)鍵詞匹配不一定能夠找出某一主題的所有相關(guān)專利，而借助自然語言搜索一體機，可以準確找到已經(jīng)成功申請的與該主題相關(guān)的所有專利信息，包括描述、編號等，從而在專利申請時避免重復(fù)申請等問題，大大節(jié)省時間和費用。

電子病歷檢索

基于自然語言搜索一體機，在自然語言處理技術(shù)的助力下，用戶可建設(shè)面向特定醫(yī)療領(lǐng)域的知識服務(wù)平臺，以此更好地提供電子病例檢索、處方查詢、醫(yī)療知識問答等醫(yī)療服務(wù)。

法律文獻搜索

基于自然語言搜索一體機，用戶可對案件信息進行查詢和梳理，比如針對某一案件，律師通過輸入描述，即可在資料庫中找出相似案例情況以及司法解釋，有助于案件分析、訴訟準備等，司法人員也可借助該一體機節(jié)省資料整理、分析的時間。

學術(shù)文獻檢索

查閱論文時，根據(jù)關(guān)鍵詞匹配，可以檢索出不少結(jié)果，但主要是包含關(guān)鍵詞的內(nèi)容，不一定是用戶真正需要查找的，而借助自然語言搜索一體機，在準確表達查找內(nèi)容的情況下，只需一句簡單描述，即可檢索到真正為用戶所需的論文。

論文查重