电话: 025-84699169 84699435
地址: 南京市中央路302号创意中央科技文化园9号楼3楼
邮箱: yinkunhr@163.com
地址:www.yinkunchina.com
【数据论道·第38期】人工智能应用&数据平台Meetup精彩回顾
2018年8月11日,由南京大数据产业协会联合天数智芯共同举办的第三十八期数据论道——“人工智能应用&数据平台Meetup”活动圆满结束。
随着人工智能时代的来临,结合了大数据的人工智能正广泛应用于各个领域,帮助人类创造价值。
本次数据论道活动邀请了四位技术大牛,从深度学习平台、基于AI的画像标签、Apache HAWQ、集成电路等内容出发,与在场来宾分享AI与大数据平台领域的技术干货。
现场分享
01
《深度学习平台简介》
首先,演讲嘉宾江骏为我们带来了《深度学习平台简介》的主题演讲。
在演讲之初,他结合实例简述了深度学习平台的两大派别,一派是继承Apache系列,在此之上做调度、研发,例如H2O;另一派是专注于TensorFlow、MXNet、pyTorch这些新的框架,与Cloud结合,提供配套的平台服务,例如Goole CloudML、AWS SageMaker。
在他看来,大数据平台≠深度学习平台。
其次,他通过从开发环境、版本管理及发布三方面入手,对通常代码和Deep Learning进行对比分析,结合Deep Learning刚刚起步的市场前景,向大家引入深度学习平台。
他提出,深度学习平台的发展目标不在于增加新的功能,而是需要有利于今后的改进、减少错误和提高可维护性。最后,他结合多个实例就超参数调优方面对深度学习平台进行了深入的分析。
主讲人简介:
江骏,机器学习 GDE (Google Developers Experts)。蚂蚁金服自动机器学习平台,技术专家。曾任职于饿了么,获 2016、2017 年连续两届饿了么黑客马拉松冠军。
02
《以HAWQ为首的大数据平台的分析与介绍》
嘉宾石恒则向大家介绍了Apache HAWQ、Oushu Database、Little Boy及FatMan等平台的优势。
首先,他从数据仓库的演进出发,分析传统数仓、MPP、新一代数仓的发展过程,进一步展开数据仓库引擎在非线性可扩展、线性可扩展、高性能及SQL兼容性、受限的性能及SQL兼容性四个维度的比较,向大家引入Apache HAWQ的弹性执行、多级资源队列、标准及第三方工具兼容等多项优势。
其次,他从数据库的四大核心着手,通过对Lava数据与AI平台、数据驱动系统设计、NewDW特性等比较,总结出Oushu Database的以下亮点:
新一代数仓,存储于计算分离
高扩展,可以到上千节点
高性能,充分利用新硬件
为新一代人工智能深度学习以及物联网等应用设计
支持多租户
高可兼容性
从某一层面上来说,Oushu Database是Apache HAWQ的增强版。
最后,石恒向大家现场演示了Little Boy及FatMan(个人信贷智能决策)的操作流程,充分展现了偶数个人信贷智能决策平台能够紧密围绕客户的业务和风控需求,为银行信贷、信用卡、现金贷、消费金融等各行各业的客户率先提供以优化经营策略和风控决策的产品优势。
主讲人简介:
石恒,偶数科技资深大数据平台/数据库架构师,专长领域:大数据平台。
03
《基于AI的画像标签在电商平台的应用》
嘉宾冯青锋带来了关于《基于AI的画像标签在电商平台的应用》的演讲。
首先,他以画像标签的范围、分类以及常见段预测标签作为切入点,简述了画像标签的管理与持续建设。
其次,他从货品画像出发,根据货品画像建设的两大作用:叶子类目下更细粒度的货品表现及追踪、细粒度分类生命周期构建,总结出AI技术在标签构建过程中的应用,多集中在货品准确分组及货品分析方面。
货品准确分组的3种方法:
1、规则分类
2、图像技术分类
3、LDA主题分类
在面对“如何提升货品分组准确性”的问题时,他提出以下5个观点:
1、基于中心突出的优秀分类、无效分类
2、基于多模型稳定性分类
3、基于图像神经网络最后一层的特征分类
4、多个弱模型构建强模型
5、专家经验
冯青峰表示,在进行货品分析时,多从代表商品、分组货品效果分析指标、历史数据挖掘、生命周期分析、热点发现、货品追踪等方面入手。
接着,他列举出人群画像的四项应用:
1、用户基础特征探查
2、任意人群的特征刻画
3、人群准确分组
4、人群变迁差一点分析
最后,综合以上内容,他为大家展开了关于人货关联的分析,提出借助计算能力可以给出结论性输出的观点。
主讲人简介:
冯青锋,大数据&机器学习平台技术专家,曾任职于蘑菇街数仓挖掘团队、苏宁大数据。
04
《集成电路发展历史及AI芯片介绍》
嘉宾陈超带来了《集成电路发展历史及AI芯片介绍》的主题演讲。
他的演讲内容主要包含三方面,集成电路、AI芯片及天数智芯。首先,他把器件作为切入点,详细讲解了从真空电子管到半导体晶体管的发展历史,以及BJT三极管、分立器件、放大器、模拟电路、CMOS FET互补金属氧化物场效应晶体管、数字电路、基本门单元等基础知识。
其次,他运用生动形象的例子对集成电路进行了整体的剖析,将包含拉单晶硅、切硅片、印刷术、印刷晶体管、印刷连接铜线、测试和切割、封装与测试、芯片大小与成品率等艰涩难懂的专业知识一一为大家进行分解。
接着,陈超为大家讲述了以下几种AI芯片的分类:
从功能上分:训练、推理
从应用场景分:云端、设备端
从技术架构分:通用芯片、基于FPGA的半定制化芯片、全定制化ASIC芯片、类脑计算芯片
最后,他从产品生态链、自主研发HPC芯片级硬件加速方案:GPGPU、硬件架构与特征、系统软件架构与特征、以芯片为核心的产品技术服务栈、深度视觉感知加速平台:SkyACE等方面,向大家简单介绍了天数智芯。
主讲人简介:
陈超,原AMD独立显卡SOC部芯片架构师,现任职于天数智芯系统技术部。
四位讲师的演讲精彩纷呈,参会人员听得聚精会神。在场来宾还在每段演讲之后频频与讲师进行提问互动,现场气氛非常热烈。
此次活动圆满结束,在场来宾对于如此专业的技术分享,纷纷予以赞美,希望可以参加更多类似的活动,拓宽自己视野的同时,深入学习技术性的研究。
学无止境,让我们期待下一期数据论道活动能带来更多的干货及交流分享的机会!
2018-08-12