PyCon China 2017

MAY THE PYTHONIC BE WITH YOU

地址

上海市浦东新区博云路2号
浦软大厦会议厅 (地图)
地铁2号线金科路站
2017-10-22 8:50 ~ 17:20

上午

Getting Start MXNet with Python
9:00-9:45 费良宏
作者简介: AWS 首席云计算技术顾问,拥有超过 20 年在 IT 行业以及软件开发领域的工作经验。在此之前他曾经任职于 Microsoft、Apple 等知名企业,任职架构师、技术顾问等职务,参与过多个大型软件项目的设计、开发与项目管理。目前专注于云计算以及互联网等技术领域,致力于帮助中国的开发者构建基于云计算的新一代的互联网应用。
演讲简介: 深度学习技术的进步推动了计算机视觉、自然语言处理以及推荐系统等领域的快速发展。这一变化很重要的原因就是是充分利用了 GPU 加速计算并具备了高度灵活和开发人员友好的深度学习框架的出现以及发展。在本议题中将为您介绍 MXNet 框架的特点以及如何利用此框架进行深度学习应用的开发。Apache MXNet 是一个开源的、精简的、具有灵活和高度可扩展能力的深度学习框架,它支持深度学习模型中的最新技术,包括卷积神经网络(CNN)和长短期记忆网络(LSTM)等。 您还将学习如何快速开始使用 AWS 云中的 NVIDIA GPU,以及如何在几分钟内轻松扩展到数百个 GPU ,实现分布式的大规模集群上的模型训练。
TensorFlow 下的构建高性能神经网络模型的最佳实践
9:45-10:30 李嘉璇
作者简介: 《TensorFlow 技术解析与实战》(版权也已被台湾引进)作者,51CTO WOTI、Oreilly Strata、Boolan 等大会深度学习讲师。对深度学习框架的架构、源码分析及在不同领域的应用有浓厚兴趣。有处理图像、社交文本数据情感分析、数据挖掘等实战经验。曾任职百度研发工程师,目前研究构建高性能的神经网络模型及 TensorFlow 下的压缩工具链,包括模型量化、常数化、剪枝。
演讲简介: 神经网络算法在图像、语音等领域都大幅度超越传统算法,但在应用到实际项目中却面临两个问题:计算量巨大及模型体积过大,不利于移动端和嵌入式的场景;模型内存占用过大,导致功耗和电量消耗过高。因此,如何对神经网络模型进行优化,使尽可能不损失精度的情况下,能减少模型的体积,并且计算量也降低,就是我们将深度学习在更广泛地场景下应用时要解决的问题。本次讲解主要着眼于在安防、工业物联网、智能机器人等设备,需要解决图像、语音场景下深度学习的加速问题,减小模型大小及计算量,构建高性能神经网络模型。
茶歇
10:30-11:40
ChatBot 服务化的工程实践
10:40-11:25 侯凯
作者简介: 爱因互动科技发展(北京)有限公司高级开发工程师, 有 8 年 Python 相关开发经历。 现在主要负责聊天机器人服务化的相关开发
演讲简介: 该话题主要介绍了爱因互动基于 Python 技术栈, 开发和交付 ChatBot 的一些工程实践. 内容涉及 ChatBot 服务的基本结构和部署流程, 以及 ChatBot 使用的算法模型的训练和更新的服务化. 同时也会向大家介绍我们在上述流程中用到的一些 Python 工具库
富媒体弹性机器学习平台
11:25-12:10 姚唐仁
作者简介: 七牛云人工智能实验室首席架构师,负责机器学习平台的设计与研发。在分布式系统,分布式存储领域有丰富的设计与实现的经验。曾在 IBM 系统与科技实验室从事高端企业存储设计与研发工作,在华为担任云存储架构师。
演讲简介: 机器学习是 AI 领域最受关注的方向,从理论模型到产品化的过程中,如何提升模型训练的效率和精度,简化训练和验证数据集的处理,有效利用计算力资源来缩短产品化的周期,这些都是 AI 产品研发落地成功的关键因素。本次演讲从如何构建一款富媒体弹性机器学习平台出发,将分享七牛云在构建弹性机器学习平台中的经验以及该平台在行业场景中的应用。

中午

午餐
12:10-13:10

下午

The Pragmatic Guide of Sequence2Sequence based on Tensorflow
13:10-13:55 高民权
作者简介: 浙江大学计算机研究生(目前已签约阿里巴巴集团高级工程师),专注领域为机器学习(自然语言理解, 文本自动生成, ChatBot)。 Python 使用 6 年。 研究生期间曾作为联合创始人创建宁波乔克兄弟杭州互联网中心。
演讲简介: 计算机自动翻译,计算机自动文本生成, 自动文本摘要,音乐自动生成,以及 Image Caption 等问题的核心都是 Sequence2Sequence。 Seq2Seq 是一种解决面向序列化问题的解决方法, 具有广泛的应用场景和前景, 但是这种模型难实现, 难训练, 入门较难。 在本议题中, 将会解释 Seq2Seq 的原理以及其实现方法,并以目前主流的 tensorflow 为框架, 解释在 tensorflow 下如何实现 Seq2Seq,并结合实践经验, 讨论 Seq2Seq 的实际应用中需要注意的问题, 以及介绍目前国际最先进的 Seq2Seq 改进方法。
人工智能与即时物流:达达 - 京东到家的算法实践
13:55-14:40 廖瑞奇
作者简介: 达达 - 京东到家配送算法团队负责人,在机器学习、物流算法、计算广告等领域有着丰富的实践经验。2016 年初加入达达,从 0 到 1 建立起达达的算法团队。目前主要负责订单指派、动态定价、路径规划等相关工作,希望利用人工智能的力量改变同城配送的效率与成本,实现更为智能的即时物流。
演讲简介: 作为国内最大的众包物流平台,达达拥有数百万兼职配送员,每天为数百万订单提供即时配送服务。在即时物流算法这一全新的领域里,达达在订单智能指派、供需预测、动态定价、路径规划等多个方面进行了探索和实践。机器学习和人工智能技术的应用有效提升了平台的运行效率,实现了平台的高度自动化运行。本次分享将首次为大家介绍达达在相关领域的一些实践经验。
用 Python 开发 GoodERP
14:40-15:25 王剑峰
作者简介: 上海开阖软件有限公司 创始人兼 CEO,Python 开源企业信息化项目 GoodERP 发起者,9 年 Python 开发经验,12 年 SAP 二次开发经验,5 年会计从业经验,曾任 OpenERP 中文社区社区经理,曾担任 37 个 Odoo 实施项目经理。
演讲简介: 作为 Python 在企业信息化中的应用典范,简述 GoodERP 如何借助 Python 语言的简洁、优雅特性实现 ERP 开源项目的大规模协同开发。希望能够吸引更多专业或业余的 Python 开发者参与到这个项目中来。用更快实现、更易维护的技术来解决身边的问题,一起构建一个 “用户数最多的中国本土开源 ERP 项目”。
茶歇
15:25-15:40
探秘以太坊的Python实现
15:40-16:25 谢晗剑
作者简介: 秘猿科技首席执行官 & 联合创始人。区块链专业社区 EthFans 联合创始人。以太坊核心研发团队成员。DEVCON2 、DEVCON3 大会演讲嘉宾。开源数字资产交易所 Peatio 核心开发者。拥有超过 10 年的软件系统架构与开发经验。
演讲简介: Pyethereum 是全球第二大的区块链项目以太坊的 Python 实现,此项目属于以太坊基金会,是官方的重要实现之一。此项目由以太坊创始人 Vitalik Buterin 本人直接参与,是以太坊的各种最新设计与想法的试验田。秘猿科技的核心团队参与了本项目并负责重要的编码,架构和code review 工作。今天,秘猿科技的 CEO 兼联合创始人谢晗剑(Jan Xie)将从 pyethereum 的视角,为大家深入剖析以太坊与智能合约。
如何搭建支持千亿级别成交量的交易系统
16:25-17:10 葛志雄
作者简介: 资深开发工程师,曾在高频套利私募担任交易总监,峰值交易量市场占比超过 70%,年交易量高达千亿级别。现在在知名企业任职资深开发工程师,做智能金融方向的开发工作。国内知名开源项目 potato(原 pyalgotrade-cn)发起人,是首个整合了分布式计算框架的开源交易系统,可以支持上万个交易单元。对向量化计算在回测中的应用有丰富的经验,开发过 cta 和多因子类的向量化回测平台,相比于事件驱动平台速度提升 200 倍。
演讲简介: 近 5 年来,程序化交易在整个二级市场中的交易量占比不断上升,但是相比于国外,还有非常大的发展空间。程序化交易相比人工交易有很大优势,如报单速度,精确控制成本,全天候多市场监控。套利交易,是程序化交易的发源地。因为套利交易具有持续时间短,监控品种多的特点,对交易系统的稳定性和强健性有着极高的要求。2015 年牛市中,A 股市场交易量突破万亿,也是套利交易获利最丰厚的一年。此后,金融机构也对交易系统的研发越来越重视。对高频私募来说,交易系统的重要性甚至要超过交易策略。因此,对 IT 人员也是提供了极大的发展机会。
使用 docker 来创建可扩展的分布式爬虫
17:10-17:20 高金
作者简介: 现任博易智软爬虫工程师。知乎专栏 “爬虫从入门到精通” 作者。对爬虫有很深入的了解。
演讲简介: 对于爬虫来说,抓取速度一直是一个问题。本主题是利用了 docker 的特性 “一次 build,run anywhere” 与 scrapy-redis 相结合,来创建一个可扩展的分布式爬虫。整个流程如下:爬虫代码编写完成后,push 到仓库后,自动进行 docker 镜像 build,build 完成后自动创建应用,可自定义容器数量(随时可以更改),这样一个自动可扩展的分布式爬虫就完成了。
华为 Openstack CPython(Loong) 解释器分析
17:20-17:30 胡昊然
作者简介: 华为 CloudBU 性能与工具部 高级工程师,曾在 IBM 系统实验室工作近 4 年
演讲简介: CPython 编程语言原生的 tracing 能力比较薄弱。为了帮助华为公有云开发人员,测试人员和 DevOps 人员更好地调试复杂场景下的 OpenStack,我们对 CPython 解释器进行了一系列的改造(内部名:loong 解释器),主要工作有以下几个部分:CPython 解释器的修改(定时器,关键事件探针,关键内存数据统计),做出 CPython 解释器所使用的 toolkits 集合,以及处理相关数据的 toolkits。同时,我们建立了一个内部 Huawei Openstack 的数据监控分析平台,动态地监控和分析 OpenStack 的一些指标,帮助开发识别了 OpenStack 在特定流模型下的热点,协助定位了一些疑难问题,并根据线上真实故障在研发环境模拟,不断测试预案演练方案。