当前位置: 伟德BETVLCTOR体育 >> 文献资料 >> 学术资源 >> 正文

数据学术 | 学术类搜索引擎、数据库汇总(四)

发布时间:2021-07-07文章来源:国家语委科研网 作者:   浏览次数:

一、汉字简繁文本智能转换系统

http://jf.xmu.edu.cn/

这款在线简繁文本智能转换系统,不仅支持转换文字,还可以输入网址将网页内容进行简繁转换。

二、云译(神经语言翻译系统)

http://nmt.xmu.edu.cn/

该在线翻译系统不仅支持在线输入词语,句子,还支持上传本地文件进行全文翻译,非常方便,点击上图底部中间的“I want to translate a document”就可以。

三、异体字字典

http://jf.xmu.edu.cn/variants.html

不同于传统异体字整理工作,我们藉助最新的自然语言处理技术,将古籍文本的统计信息和语义表示与现有的多种异体字字表相结合,辅之以人工编校,得到更适用于古文理解的异体字字典(词典)。目前仅限于UNICODE已收汉字。

以词明字。虽然古籍中单字词多,多字词也不少。而异体字的使用并非全无限制,有时仅局限于某些词。所以我们采用词典的形式,试图收录非完全同义异体字的典型使用情况。

收字全面。不但汇集权威字典(台湾异体字字典、中华大字典、中华字海)的异体字信息,也从古籍大数据中通过自然语言处理技术挖掘异体字信息。目前收字总数爲87861个,异体字总数超过7万个。异体字收录之全,超过目前所有字典。

机助人校。采用计算机自动编纂,辅以人工增补校勘。自创开放式词典编辑环境,开网络词典合作编辑风气之先。

旁征博引。收异体词超10万条,例句超20万句(此项数据仅供参考,会随时变化),全部来自权威词典和数字化古籍。这些例证可帮助使用者更好地理解古籍。

以上三款在线工具都由厦门大学自然语言处理实验室出品。

四、中国语言资源保护工程采录展示平台

https://zhongguoyuyan.cn/index.html?lang=cn

中国语言资源保护工程采录展示平台专家平台由中国语言资源保护研究中心(设于北京语言大学)开发管理,是专门用于保存、管理和分析方言和少数民族语言资源调查官方数据的学术型数据平台。 本平台利用地理信息系统和非结构化数据库等先进技术实现对语言资源调查多媒体数据的存储管理,高效查询以及专业化、学术化的数据分析。 随着中国语言资源保护工程的逐步推进,本平台将收录更多的优秀数据资源,并不断推出全新的数据分析服务。

该平台分专业和大众版,有文献检索、工具下载、绘图工具等功能,使用方便,旁边还有操作演示,非常适合应用语言学专业人员做调查使用,也可应用于普通大众对语言保护的关心。

五、汉字全息资源应用系统

https://qxk.bnu.edu.cn/#/

“汉字全息资源应用系统”由北京师范大学汉字研究与现代应用实验室开发,本平台是在新型汉字学理论的指导下,充分运用当前的数据库技术、 信息挖掘技术、可视化技术等现代化手段,从形、音、义、用、码五大维度,较为全面地呈现古今汉字的属性体系,构建一个科学、系统、实用的汉字全息资源应用平台。

六、数字化《说文解字》

http://szsw.bnu.edu.cn/

本平台由北京师范大学汉字研究与现代应用实验室开发。在主界面输入查询的汉字,就出现以下界面:

内容丰富, 不仅有改字的今读,还有从宋代开始对其读音进行研究的历代成果展示;下面有历代字形演变,还有具体的说解。

七、语言资源网(语汇网)

http://clr.ccnu.edu.cn/#/langresource

国家语委语言资源网 (简称语汇网)由国家语委委托设在华中师范大学的国家语言资源监测与研究网络媒体中心研制开发,2016年9月立项启动。截至2022年1月25日,语汇网已收集200多种语言资源及软件服务,以及来自其他高等院校与研究所、社会机构、个人等开放的各类语言资源及软件服务近400个、国内较有影响力的语言学著作和期刊资源350个、语言文字规范标准240个,介绍国内知名语言学专家660人。



关闭 打印责任编辑:戛夏