IM体育APP下载

关注im体育平台登录微信

新闻中心

商汤科技:从实验室里一跃而出的全球 AI 独角兽

im体育平台登录微信公众号 | ID:idg_capital
2019.03.15

来源 | 硬核财经(ID:yinghecaijing) 作者 | 核叔

CB Insights 日前发布了2019 AI 100 报告,在这份最有前景的 100 家 AI 初创公司名单上,商汤科技位列“全球 AI 独角兽”第一名。光环背后,是汤晓鸥、徐立们熊熊燃烧的野心。

上世纪 90 年代,来自中国的年轻人汤晓鸥在美国第一次接触到了人脸识别。汤晓鸥 1990 年从中科大毕业后,选择到美国深造,并在一年后取得罗切斯特大学硕士学位,1992 年他又到了计算机视觉(CV)研究的最高殿堂——麻省理工学院(MIT)攻读博士,在那里一待就是5年。

汤晓鸥谈及第一次到 MIT 的情景,“我加入的实验室做的是海底机器人,相当于在水下用声呐和视觉相机来探索海底世界。在我去之前,那个实验室刚刚发现了泰坦尼克号,所以我当时觉得这个很酷。

商汤科技创始人&董事长 汤晓鸥教授

90 年代正处于人脸识别研究的高潮阶段,其标志性事件就是美国国防部下属的高级研究计划局 ARPA 成立了FERET(Face Recognition Technology)项目组,任务包括:资助若干项人脸识别研究、创建 FERET 人脸图像数据库、组织 FERET 人脸识别性能评测等。

该项目分别于 1994 年,1995 年和 1996 年组织了三次人脸识别评测,几种最知名的人脸识别算法都参加了测试,极大地促进了这些算法的改进和实用化。

从实验室到商汤

博士毕业后,汤晓鸥被邀请到香港中文大学信息工程系任教,继续从事计算机视觉相关领域的研究,培养出了一大批的 CV 人才。汤晓鸥教授于 2001 年 7 月建立香港中文大学多媒体实验室,从此港中文有了 CV 界黄埔军校的美誉。

2005 年起,汤晓鸥同时兼任微软亚洲研究院(MSRA)视觉计算组负责人。他在北京和香港两地工作,才两岁的儿子是他最深的牵挂。为了表达爱意并弥补无法时常陪伴孩子左右的不安,他开始频繁地给儿子拍摄照片,相册几乎涵盖了儿子成长的每个瞬间。

直到照片积攒到成千上万张时,他意识到分类成了难题,想在海量照片里找到某个时间段或某个有趣瞬间的照片非常困难。在 CV 技术还远没有今天成熟的时候,他决定一试,叫来几位学生开始研究名为 Photo Tagging 的课题,采用 CV 技术手段来给相册进行分类整理

这是汤晓鸥利用人脸识别技术走向实际应用的开端。“我可以用人脸识别、人脸检测,用这种人工智能技术,帮助大家来管理、整理相册。”

2009年,汤晓鸥婉拒绝了微软的一再挽留,选择依托深圳先进院搭建联合实验室。这一年的汤晓鸥正式迈入了他学术生涯的巅峰,获电机及电子工程师学会(IEEE)推选为院士。

同年,汤晓鸥教授及其博士研究生何恺明,联同微软亚洲研究院的孙剑博士,凭论文“基于暗原色的单一图像去雾技术”夺得顶尖国际会议 IEEE 计算机视觉与模式识别大会(CVPR)该年度的“最佳论文奖”。该会议创办25年后,首次有亚洲学者获授这项最高殊荣。

而在2010年,汤晓鸥遇到了今后最重要的合作伙伴,同时也是他的学生徐立。

徐立是上海人,从小就是家长口中“别人家的孩子”,小学、初中,高中十二年,他多次代表所在学校参加上海市中小学数学奥林匹克竞赛,并多次获得金牌。正是得益于此,2000 年 18 岁的徐立被保送至上海交大计算机系就读本科,四年后他又一次被保送研究生。

2007 年硕士毕业后,徐立先后在摩托罗拉、欧姆龙、微软研究院等机构工作,从事计算机视觉、模式识别、图像处理领域的研究和产品开发。但是,徐立并不满足,因为 2007 年后大数据、云计算、人工智能正高速发展。徐立清楚地知道,“深度学习是未来的方向,人脸识别大有可为。”

徐立心之所往的,正是被誉为 CV 界黄埔军校的香港中文大学多媒体实验室。于是,2010 年秋天,徐立毅然决然放弃一切工作,只身前往香港中文大学继续深造。从此,徐立将自己的命运紧紧地与人脸识别,与汤晓鸥教授连在了一起。

商汤科技联合创始人&CEO 徐立

在汤晓鸥等诸位老师的悉心指导下,徐立在图形识别方面的专业能力进步很快,其三个算法获得视觉开源平台 OpenCV 收录,L0Smoothing 为图形学期刊 TOG 五年论文引用之首(2011-2015)。

与此同时,港中大多媒体实验室也进入集中收获期,2011 年起实验室的几十位博士、教师开始研究深度学习。2011~2013 年间,实验室在计算机视觉领域两大顶级会议 ICCV 和 CVPR 上发表了 14 篇深度学习论文,占据这两个会议上深度学习论文总数(29篇)的近一半。

虽然这些研究成果还处在实验室阶段,但是当时的一个项目给了汤晓鸥团队信心,那是一个来自香港警方的项目,“一些高速行使的逃逸车辆,监控录像过于模糊,希望他们恢复出逃车辆的信息,警方愿意为服务埋单。”这种实践给予了团队巨大的成就感。

2014 年,人工智能被学界公认为将带来一场新的技术革命,国际科技巨头诸如微软、英特尔、谷歌、Facebook 纷纷加入战局。谷歌斥资 4 亿英镑收购只有 12 位员工的 DeepMind。要知道,这家公司没有具体产品,只从事深度学习的游戏研究。

2014 年初,Facebook 对外宣称,用 750 万人的数据对计算机进行训练后,其人脸识别准确率已接近人眼识别能力。而此时汤晓鸥团队用尽了几乎所有的资金和资源,才建立起 20 万人的数据库。

只能赢不能输,Facebook是开源的,如果没有能赢过他们,就不能说服别人放弃开源的平台而选择我们。” 汤晓鸥背水一战。“好,既然硬件和数据库都不如对手,那就拼计算能力!”在硬件和数据库都不如对手的情况下,汤晓鸥改进了自己的算法。

不到两个月之后, 2014 年 3 月,其团队发布 GaussianFace 人脸识别算法,在 LFW 数据库上准确率达 98.52 %,在全球首次突破人眼识别能力。2014 年 6 月起,开始发表的 DeepID 系列算法,逐步将人脸识别准确率提升至 99.55 %,开启了整个人脸识别行业技术落地的时代。

在当时,汤晓鸥实验室的三个人脸识别算法占据了 LFW 识别率的前三名,而 Facebook 的 DeepFace 排在第四。港中大多媒体实验室与麻省理工、斯坦福等著名大学一道,入选世界十大人工智能先锋实验室。

2014 年 9 月,汤晓鸥团队参加了“人工智能奥林匹克” ImageNet 大赛,与包括百度、谷歌、微软在内的 37 个世界顶级团队竞争,取得了全球第二的成绩,谷歌是第一。但是汤教授认为,“其实在竞赛中,我们做到了的数据高于谷歌发布的成绩,所以只能屈居第二。”

计算机的识别准确率首次超过人眼,让汤晓鸥团队名噪一时,im体育平台登录合伙人牛奎光也慕名而来。牛奎光认为这是一个重要信号——意味着计算机视觉技术有可能商业化落地。他立即飞到香港,拜访汤教授。

在港中大多媒体实验室里,他看到五六个计算机识别技术的 Demo,研究方向有意识地与实际应用结合。比如一个 Demo 是把图片变成印象派画风,即现在流行的美图功能之一。研究团队还反复强调原创,“我们是底层算法突破的源头”。

而真正让牛奎光下定决心投资的则是徐立的“猫脑”、“猴脑”理论。

徐立解释道,如果说当下人工智能技术水平处于“猫脑”阶段,大部分公司正在做的就是“如何运用猫脑更完美地抓老鼠”;而他们的团队则是打造平台,把“猫脑”训练成“猴脑”,从本质上提升“大脑”的能力。大脑升级后,机器可以更快学习掌握更复杂技能。

在这次拜访之后,im体育平台登录掷出数千万美元,助推研究团队走出实验室,2014 年 10 月,商汤科技正式成立。im体育平台登录当时承担了不小的风险,毕竟2014 年 AI 行业还是冷门,谁也说不准,技术能否顺利转化为商业价值。

当听说汤教授要成立公司时,立马从实验室涌过来 50 多个学生,全部是博士、博士后。曾与汤晓鸥在微软研究院共事的杨帆也选择加入创业团队,还带去了一大波自己的清华学生。

很快,以汤晓鸥教授为核心的联合创始人团队组建了起来。

徐立,香港中文大学博士,联合创始人&CEO;徐冰,香港中文大学博士,联合创始人&副总裁;杨帆,清华大学硕士,联合创始人&副总裁;徐持衡,清华大学,联合创始人&CTO,90后创业者;林达华,麻省理工学院博士,联合创始人&港中大-商汤联合实验室主任。

不止是人脸识别

商汤科技成立伊始,汤晓鸥对于他的人脸识别技术有着十足的把握,先后拿下小米、华为、美图秀秀以及 FaceU、Snow 等客户。由于商汤科技主要从事 To B 业务,多隐身于幕后,一直未为人所知,实际上,其服务人群量已达亿级规模。

比如,融360 在 2015 年 5 月联合商汤科技推出名为“天机”的风控系统,从用户身份认证、还款意愿和还款能力三个大维度进行信用评分,再根据分值向放贷机构提出放款建议。

2015 年 8 月小米推出的操作系统 MIUI7,其中发布的宝宝相册,正是联手商汤科技共同打造的新卖点。“宝宝相册中采用的人脸识别技术,主要在于三个核心算法:一是检测图库中的同一张脸,二是识别这张脸的特征,三是聚类相同的脸孔。” 汤晓鸥在多年前的夙愿得以达成。

中国移动也在 2015 年开始全面实行实名认证,主要通过身份证 OCR 识别以及人脸识别两大技术实现。在中国移动的两项公开招标中,商汤科技最终在数十家竞标公司中胜出。

值得一提的是,商汤科技的商务团队起初不过四五人,在公司忙于接待问询的客户,直到 2015 年底才开始有针对性地开发行业客户。

但商汤的目标不局限于一家人脸识别公司,而是致力于打造深度学习平台,要做“全能型”选手。徐立每次都会不厌其烦地解释,“我们是中国拥有原创技术的人工智能平台公司,不是一家人脸识别公司。”

2014-2016年,商汤科技主要投向两个地方:一是“人才垄断”,徐立找来这个领域所有能找到的顶尖科学家,垄断了 150 多位深度学习方向的博士;二是搭建硬件计算平台,从英伟达买入 6000 多块 GPU,自建超算中心。

深度学习有三个大核心要素:一是深度学习的算法设计;二是高性能的计算平台;三是大数据。其中,大数据对于服务人群达亿级以上的商汤来说,完全不是问题,商汤的原创算法也得到了国际上的认可,所以关键就在于计算平台。

汤晓鸥认为,由于谷歌、Facebook 等巨头的开源,使得人工智能、深度学习的门槛变得很低。很多技术人员利用谷歌、Facebook 的开源系统来训练模型,做应用。

但是,使用谷歌、Facebook 开源系统有许多的限制,还要受到开源系统的控制。这对有志于做大事的商汤来说是不行的。所以商汤科技自建超算中心,研发深度学习平台,砸钱自己搭建底层框架。就好比一家软件公司宣布,要在 Windows 之外单独开发一套操作系统。

商汤科技刚成立时,一开始没有 GPU 集群,往往要等一个月才能验证一个结果。在 2014 年 5 月,百度构建了当时世界最快的超算平台 MINWA,实现 144 个GPU连接。

仅仅一年后,商汤科技建设的深度学习超算平台 DeepLink,200 块 GPU 的连接为当时全国最大,以前耗时一个月的运算只需 5-6 个小时即可完成。2015 年 11 月,商汤科技深度学习框架 SenseParrots 也已成功搭建,并且做出了谷歌 Tensorflow 当时无法支持的功能。

2015 年,商汤在全球顶级计算机视觉学术会议 CVPR 入选论文 9 篇;在 ImageNet 国际计算机视觉挑战赛中获检测数量、检测准确率两项世界第一,成为首个夺冠的中国企业。

ImageNet 竞赛的夺魁,证明了商汤科技在两大领域的实力,“第一,我们脑子确实造得好;第二,超算平台能力强。” 徐立相当自豪。

到 2017 年,商汤深度学习超算中心拥有超过 6000 块 GPU。目前商汤的超算平台可承载超 14000 片 GPU,是亚洲规模最大的 AI 超算平台,依托深度学习训练框架 SenseParrots,支持千卡并行训练、千亿级参数模型、百亿训练样板、亿级类别分类任务。

依托于强大的深度学习平台和超算中心,商汤研发了一系列 AI 技术,包括人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等,已经在智慧城市、智能手机、互动娱乐及广告、汽车、金融、零售、教育、地产等多个行业得到应用。

在汤晓鸥看来,并不存在 AI 这个行业,只有 AI+这个行业。AI 需要与传统产业合作,这种关系是结合、赋能,而绝不是颠覆。商汤独创了“1(基础研究)+1(产品结合)+X(行业伙伴)”模式,以原创技术为基础,借助核心平台化能力多元赋能多个行业。

在基础研究方面,商汤先后与香港中文大学、清华大学、北京大学、上海交通大学和浙江大学建立联合实验室或开展科研合作。联手阿里巴巴及香港科技园联手成立 AI 实验室。2018年,商汤科技及联合实验室共有 44 篇论文入选 CVPR 会议,37 篇论文入选 ECCV 会议,累计入选计算机视觉顶会论文数量高达 81 篇。

2018 年 2 月,商汤科技与麻省理工学院宣布成立人工智能联盟,致力于共同促进人工智能的研究。商汤也是全球首家参与 MIT Intelligence Quest 计划的公司。

2018 年 4 月,商汤与华东师范大学等共同发布全球第一本人工智能高中教材,并与清华大学附中、上海交大附中等 40 所国内重点中学签约,开设人工智能基础课程,推动 AI 在教育行业的落地。

2018 年 9 月,商汤获中国科技部授予国家新一代人工智能“智能视觉”开放创新平台,其它四个国家 AI 平台分别为百度、阿里云、腾讯、科大讯飞。

做赚钱的独角兽

2016 年上半年,商汤科技开始引入职业经理人参与公司管理,包括商务、HR、法务、财务、市场、PR等,每一个核心岗位,都是从大公司来的高管。用更多现代化的管理手段去调整公司架构,把产研和销售渠道打通,建立起规模化的销售团队。

在行业落地方向上,商汤目前专注于安防监控、金融、手机、移动互联网和深度学习芯片五大垂直领域。商汤以 B2B2C 的商业模式,与各行业领军企业合作,共同推进人脸识别在各行业的应用和变现。

“在垂直领域方面,商汤的打法是先找头部公司,摸索 AI 技术落地,从项目到产品;然后再垂直打通某个行业生态,做平台化。以安防领域为例,当我们把前端摄像头、后端云平台甚至芯片整个链条都打通,那就能做到最大的行业技术平台。” 联合创始人杨帆解释道。

目前,商汤在 SenseParrots 平台、超算中心、以及其他 AI 产品基础上,结合智能手机、智慧城市、智能汽车、医疗、零售、教育、互动娱乐等 18 个行业应用场景,推出相应的行业解决方案,加速其技术和产品在场景里落地。

自2015年以来,商汤手机业务硕果累累,国内出货量前四的华为、小米、OPPO、vivo均是商汤的客户。商汤科技提供人脸解锁、智能美颜、智能滤镜、背景虚化、智能相册等影像技术。

例如,商汤科技利用人工智能手段,采用SensePhoto手机图像处理解决方案,为OPPO手机提供了人像拍照、双摄方案、人脸聚类相册等功能。

商汤也是目前国内最大的互联网视频及直播平台供应商,服务 90 %以上的直播和短视频分享平台。例如,商汤基于人脸关键点检测跟踪技术,为抖音、新浪微博、FaceU、B612 等实现脸部特效、美颜、手势识别、前背景分割等功能。

金融也是商汤最早涉足的领域之一,商汤科技以领先的证卡 OCR 识别、人证比对以及活体检测等技术,服务多家银行、互联网金融公司和移动运营商。目前,商汤科技为超过 4 亿人提供“刷脸”认证服务,业务量在 AI 创新企业中处于领先地位。

商汤还为零售商提供 SenseGo 智慧商业解决方案,与苏宁未来店合作,实现了用户从刷脸入店到结账付款仅需“刷脸”一个步骤,进店人脸识别不超过 0.5 秒。

在 2018 年 4 月举办的商汤科技人工智能峰会上,商汤以原创 AI 技术赋能百业,发布了多个最新产品:增强现实黑科技 SenseAR,智慧城市、平安城市解决方案 SenseFace 3.0 和 SenseFoundry,以及智能汽车产品驾驶员监控系统 SenseDrive DMS 等。

早在 2017 年 11 月,商汤科技与上海市政府签署战略合作框架协议,表示 五年内在沪投资不低于 60 亿元,形成人工智能产业聚集效应,并将全球研发总部落户上海,建立规模超过 1000 人的研发团队。此项协议达成后,商汤已经与上海仪电、上海临港等签署战略合作。

SenseDrive DMS 是商汤科技发布的首款智能汽车产品驾驶员监控系统,通过深度学习技术和嵌入式芯片优化技术结合,实现对驾驶员疲劳驾驶、驾驶分心、危险动作等驾驶员状态的实时智能检测与提醒,为驾乘安全保驾护航。

目前在上海各区的上百条“驿动班车”线路中,已有 38 条线路车辆完成了智能化改造,搭载商汤科技“智能车舱”后,即可实现驾驶员身份识别,疲劳、分心等状态实时监测与提醒。

而商汤科技的更大目标是自动驾驶。2017 年 12 月,商汤科技宣布与本田汽车签订长期合作协议,共同深耕自动驾驶技术,双方将基于本田的车辆控制技术系统,融合商汤科技的视觉算法和开发平台,共同打造适合乘用车场景的 L4 级自动驾驶方案。

商汤表示,2017 年公司已经实现全年整体盈利,收入来源主要有三大块:智能安防、金融、手机移动互联网。汤晓鸥认为,“学术的东西,如果不能落地也没有什么用,好在我们不是烧钱的公司,是能赚钱的公司,可以自负盈亏,我们的融资不是用来烧的,而是做伟大的事。”

商汤的投资人中除了有首轮投资人 im体育平台登录,还有鼎晖、晨兴、光际、淡马锡、Tiger、Star VC,以及阿里巴巴、苏宁、高通、万达集团等战略合作伙伴,最新一轮是软银的 10 亿美金。目前商汤仍是全球估值最高的人工智能公司。

不仅如此,商汤科技已经开始对外输血,进行投资布局。目前商汤对外公布的投资项目包括 51VR、禾连健康、苏宁体育、影谱科技等,计划投资领域还包括 AI芯片、医疗、物联网、手机和互联网、游戏等。

 

商汤科技对外投资版图

有了资本的助力,以及深度学习平台和超算中心的搭建,自 2018 年以来,商汤科技全面布局平台化的规划路线,依托商汤人工智能平台,不仅实现了从技术、数据到产业落地的有效闭环,为自身创造了持续盈利能力,更成功搭建起平台化的行业参与模式。

当平台化的产业能力逐渐形成,很多算法生产的环节能够标准化生产,今天商汤才有机会做长尾的事情。高通全球副总裁沈劲,去年在与商汤达成了全面战略合作后曾表示,“像商汤这样的巨头,它将会成为并正在成为一个人工智能平台级的公司,它是一座‘发电厂’。