信息匹配技术网
当前位置:主页>技术资料>
全球首个藏文搜索引擎“云藏”持续升级满足多种需求
来源:infomash.org  阅读量:1713

中国新闻网青海海南8月19日电(祁增蓓)“大家正处在云藏互联网大数据语料库的设计阶段,关键有词性标注语料库和藏汉双语教学平行面语料库的开发设计,目地是提升信息检索系统的查全率和论文重复率,确保百度搜索的精确性。”十五日,青海海南州藏文信息技术性研究所自然语言理解解决研究室副局长航尖才让告知新闻记者。

云藏大数据中心有关工作员详细介绍,云藏检索是一个集新闻报道、网页页面、照片、视頻、歌曲、百度百科、百度文库、了解等检索于数据库查询紧密结合的大中型藏文综合性网上平台,是中国各种藏文网址的统一通道,及其互联网技术藏文信息的关键来源于和共享资源管理中心。

图为“云藏”大数据中心工作员已经撰写语料库。马铭言 摄

云藏检索选用时下最流行的优化算法,研发藏文全自动词性标注与語言数据分析系统,基本建设规模性训炼语料库,开发设计网页页面收集、全文检索、内容管理系统控制模块、网页搜索前台接待、爬虫技术等系统架构图基本建设,完成了搜索网页等好几个软件系统的基本建设工作中,全面实施了一个搜索引擎应具有的基本要素。

除此之外,云藏大数据中心协同专业人士相互科学研究,取得成功产品研发了藏文全自动词性标注与語言数据分析系统系统软件,完成了藏文近义词检索、藏文拉丁转写检索、藏文拼写检查系统软件、藏文词义查找、藏文不一样编号全自动变换等作用,攻破了藏文智能化信息解决的关键技术,并取得成功完成与搜索引擎系统软件的集成化,使云藏搜索引擎拥有文化整合或藏语化的人工智能技术特性。

图为“云藏”大数据中心工作员解读“云藏”操作方法。祁增蓓 摄

“下一步,云藏大数据中心将构建藏文互联网技术网络舆情监测数据分析系统,进行藏文信息的汇聚梳理和剖析,掌握在网上信息社会舆论趋势,全方位掌握社情民意,可以为合理处理藏文互联网舆情信息检测难、操控难、判断难的发展瓶颈出示靠谱的主要参数与根据。”航尖才让说,他觉得未来“区块链技术”技术性未来也会在这其中充分发挥非常大的功效。

据了解,云藏大数据中心已申请办理得到《中国著名品牌》《网络文化经营许可证》,及其《云藏百科》《云藏文库》《云藏知道》《云藏视频》等6项电子计算机软件著作,并向国家专利局申请了云藏搜索引擎系统软件、藏文词性标注系统软件和藏文分词算法三项专利发明且已根据评审,现如今处在最后实审环节。(完)

友情链接:
Copyright ©2007-2020 www.infomash.org. All Rights Reserved 信息匹配技术网 备案:沪ICP备090311416号-1 | 网站地图