KoCoNovel由首尔国立大学的研究团队创建,旨在为韩国文学作品中的字符共指解析提供丰富的数据支持。该数据集包含了50部小说中的178K个Token,是继NIKL语料库之后的第二大公共共指解析语料库,并且是第一个基于文学作品的共指数据集。KoCoNovel的独特之处在于,其24%的角色提及为单个普通名词,没有修饰语,这一特征深受韩国称谓文化的影响,该文化倾向于使用表示社会关系和亲属关系的术语而非个人姓名。数据集提供了四种不同版本,从全知视角和读者视角进行注释,以及将多个实体作为独立或重叠实体处理。KoCoNovel的发布,不仅填补了韩国文学作品共指数据集的空白,也为自然语言处理领域的研究者提供了宝贵的资源。
详情请参见五号雷达:
- 随机文章
- 热门文章
- 热评文章
- 网络文学名家谈写作 | 我想吃肉:女扮男装无CP——女频小说类型拓展实践
- 国产游戏出海,售后客服外包给服务商,商家还能赚到钱吗?
- 优酷联手番茄小说,超级IP大挖掘、网文影视化再加速!
- 2024起点十大都市小说,重启人生,一飞冲天
- 2024起点十大仙侠小说,红尘炼心,御剑长生
- 九种中华田园猫,第七最神秘,第四是猫中“泰迪”,第一没人敢养
- 聚焦解读“中国密码”,第四届七猫现实题材征文大赛颁出
- 原创微小说:霜花终未红(七)
还没有评论,来说两句吧...