PyCon China
2025
首页
合作与赞助
演讲
日程
组委会
活动
开源松
开源集市展
Vibe Coding 黑客松
简体中文
简体中文
English
PyCon China 2025
首页
合作与赞助
演讲
日程
组委会
活动
开源松
开源集市展
Vibe Coding 黑客松
语言
简体中文
English
我从来没觉得啃生肉开心过:用 Python 打造日语泛读利器
闪电演讲
15:55 - 16:05
分会场 D(108 教室)
生成海报
卿学童
野生软件工程师,业余计算语言学爱好者
摘要
和英语不同,日语不会用空格区分单词,再加上单词变形复杂,初学者在泛读时往往要花费大量时间判断单词原型。虽然形态素解析器(如Sudachi)能自动提取单词原形,但在处理字幕、漫画、Galgame 等口语化文本时,会出现比较明显的未登录词(Out-of-Vocabulary, OOV)问题,影响学习效率。本次分享除了介绍 Python 调用 Sudachi 的方法,还会重点介绍如何解决这个问题。
详情