欢迎您访问365热点网|www.voa365.com!

365热点网|最全面的网络热点、科技资讯、手机信息、业界热文、数码信息

当前位置: 主页 > 业界 >

环球快资讯丨北大与字节合作推古籍数字化平台:3年完成万部古籍整理

时间:2022-10-12 00:51来源:新浪科技 作者:[db:作者] 点击:
北大与字节合作推古籍数字化平台:3年完成万部古籍整理:新浪科技讯10月11日下午消息,近日,由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试
  

  原文标题:北大与字节合作推古籍数字化平台:3年完成万部古籍整理;来源新浪科技发布时间为:2022年10月12日 00:34分,让我们跟随365热点网小编一起来看看相关新闻资讯。

  新浪科技讯10月11日下午消息,近日,由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。据介绍,该平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,即日起向公众免费开放。未来三年将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。

  据了解,上述实验室系今年3月北京大学与字节跳动合作成立,将人工智能技术应用于古籍资源的智能化整理。“识典古籍”平台上线是双方合作的最新进展。与其他古籍数字化平台相比,“识典古籍”页面简洁、浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,后续将上线手机移动版平台。

  当前,中国的古籍数字化还处于初级阶段,面临技术难度高、资金缺口大、人才紧张等难点。相关资料显示,现存的20多万种古籍中,只有8万种完成影像数字化扫描,近4万种完成文本数字化。据专家统计,从1949年到2019年,国内共修复整理出版古籍近3.8万种,要将现存古籍全部修复整理出来,可能需要300年时间;若利用人工智能技术辅助修复整理,大概二三十年就能完成。

  据“识典古籍”项目负责人介绍,该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。据悉,目前行业内OCR识别准确率平均为93%至94%,“识典古籍”的准确率为96%至97%。(文猛)

  有关于北大与字节合作推古籍数字化平台:3年完成万部古籍整理的文章就介绍到此结束。

(责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
推荐内容