我从来没觉得啃生肉开心过:用 Python 打造日语泛读利器

闪电演讲
15:55 - 16:05
分会场 D(108 教室)

摘要

和英语不同,日语不会用空格区分单词,再加上单词变形复杂,初学者在泛读时往往要花费大量时间判断单词原型。虽然形态素解析器(如Sudachi)能自动提取单词原形,但在处理字幕、漫画、Galgame 等口语化文本时,会出现比较明显的未登录词(Out-of-Vocabulary, OOV)问题,影响学习效率。本次分享除了介绍 Python 调用 Sudachi 的方法,还会重点介绍如何解决这个问题。

详情