演讲分会场 B

Robust & Ease to use: The Design and Evolution of Python-based Primitive Data Types

10/1613:45 - 14:30


王博

王博Jina AI AI Engineer

  • 本科毕业于兰州大学,硕士毕业于荷兰代尔夫特理工大学(2017),多媒体信息检索方向。
  • 曾在 IBM(阿姆斯特丹),Sensara(鹿特丹)供职 AI Engineer,目前在 Jina AI(柏林)担任 AI Engineer。
  • 曾在 ACM Multimedia 等学术期刊与 workshop 发表论文 3 篇,在 ECIR 等学术会议代表 Jina AI 演讲。
  • 兴趣为人工智能与信息检索的交叉(neural information retrieval)与开源。
  • 是 Jina(11,000 star)的主要维护者,也是基于深度学习和 Python 的信息检索库 MatchZoo (3500 star)的核心开发者。

每个 Python 使用者都知道 ndarray 是 Numpy 的基础数据结构,DataFrame 是 Pandas 的基础数据结构。作为开源,搜索与人工智能的融合,在 Jina 项目开发初期,我们想让用户能够在最短的时间内快速学习,使用并转化为 Jina 的用户,甚至贡献者。因此我们需要一套有强大表现力的数据结构来支撑这一目标。如今随着 Jina2.0 的发布,我们在 Github 上收获了 1 万 + 星星,这离不开简洁易用的 Jina Primitive Data Types。在这个演讲中,我想要讨论几个话题:

  1. 设计 Jina Primitive Data Types 的初衷(动机)
  2. 我们的设计准则
  3. 数据结构的演进
  4. 将来的发展方向

希望这个 30 分钟的演讲能够在某种程度上启发大家使用 Python 设计出强大的数据结构,避免可能遇到的弯路。