转自订阅号:百度
本年6月,Robin在百度同盟峰会上提出了人工智能将是"互联网的下一幕"的见解。
在三个月后本日的2016百度天下大会上,Robin以“AIisthenewelectricity”为主题发演出讲,初次向外界全面展示了百度在人工智能范畴的结果——“百度大脑”,并公布对广大开辟者、创业者及传统企业开放其核心本领和底层技能。我们等待用开放的百度大脑,引领整个互联网行业进入下一幕。
百度大脑是什么?
百度打造的人工智能就是“百度大脑”。如今,“百度大脑”建成了一个超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特性练习,能模仿人脑的工作机制,学习练习极其复杂的模子。数十万台服务器构成了百度大脑的实体,中国最大的GPU集群包管百度大脑拥有超强的盘算本领。数据是人工智能火箭的燃料,百度拥有得天独厚的数据上风,包罗全网的网页数据、十多年来累积的搜刮数据,尚有百亿级的图像、视频、定位数据。
会上李彦宏就“百度大脑”语音、图像、天然语言处理惩罚和用户画像四个功能的前沿盼望做了具体叙述:
·语音·
百度大脑的语音本领包罗语音辨认、语音合成本领。
本年《MIT科技批评》杂志,将百度的DeepSpeech2评为“2016改变天下十大突破技能”,百度的语音辨认引擎第二代,重要利用深度学习的本领。
而百度语音合成本领可以让每个人都有本身的声音模子,你只要按照我们的要求说50句话,我就学会了你语言的方式。这些语音的本领会带来各种各样新的大概性。13年后合成一代巨星张国荣的声音,让人动容。
·图像·
百度大脑使人脸辨认正确率到达99.7%,除了人脸辨认之外,百度在其他场景中也常常会碰到图像辨认需求。
百度的图像智能辨认技能就资助百度舆图冲破传统数据收罗模式,实现了外业单人全景图像收罗,使生产服从大幅提拔。各人可以通过下面这个1分钟的视频相识我们是怎么做到的:
百度无人车要完成正常的行驶,必要主动探测路面上车、路标以及各种各样的停滞物。而每个物体有一个独特的编号,便于车对它举行辨认。这个车辆对外界事物的辨认也是通过百度大脑来完成的。
·天然语言处理惩罚·
提及天然语言处理惩罚,就免不了拿度秘来举例。它除了可以或许辨认语音和图像之外,更关键、更核心的技能,是可以或许用人的语言来与人举行交换,而且可以或许明白人的很多意思和意图,只管不是每一次都能明白。本年里约奥运会,度秘搭档闻名篮球讲授员杨毅一同讲授了一场奥运篮球赛。本日百度天下大会上,杨毅也来到了现场,杨毅说,度秘的发挥远超他想象,令他非常吃惊,完全可以胜任一个篮球讲授员的工作。
·用户画像·
拿新版手机百度App举例,新版的手百会根据用户的风俗和喜好,来保举相应的文章,基于用户画像,用户的App利用黏性大大进步。
在大会上,《魔兽》制作公司传奇影业首席分析师Matt通过视频表现,传奇影业把影片目标人群分了三类,一类是肯定会去看的,不必要做宣传了,一类是肯定不去看的,他宣传了也没有效。重要着力点是怎样把那些摇摆的、可被说服的人群转化为真正去影戏院看的人群。传奇影业运用百度的工具和数据举行人群筛选。终极,百度用户画像本领为《魔兽》带来了200%的票房提拔,让制作方惊喜不已。
百度在这几大范畴的技能已经深入到了一样平常生存当中。而在一样平常生存中,这些科技将来又将带来怎样的新大概呢?让我们一起看看科技因何而巨大:
在演讲的后半程,厂长卖了个关子后约请了闻名演员胡歌上台互动(小编在现场眼见着迷妹们一下就涌到了前排)。此中一段对话小编影象深刻:
胡歌:之前我听说过人脸付出,假如以后能在一大堆人举行人脸辨认举行付出就太便捷了。以后我和Robin一起用饭,到结账的时间,我肯定把头转已往,不给辨认,让你买单。
厂长:对对对没题目,我以后可以买单!
别的小编为了让没能到现场二位的迷妹们一睹为快,先剪了个现场视频以飨各位:
随后,英伟达公司连合首创人兼首席实行官黄仁勋在大会现场发表了主题演讲,并携手百度连合公布继承在无人驾驶汽车范畴深化相助,两边将汇聚百度云平台、舆图技能和nVIDIA汽车人工智能盘算平台,创建从云服务到汽车主动驾驶的平台。
末了,百度首席科学家吴恩达公布了百度人工智能的两大开放平台:百度深度学习平台(Paddlepaddle)与百度大脑开放平台(ai.baidu.com)。与其他第三方平台相比,百度深度学习平台以更少的数据预备及练习设置,实现易学易用、性能高效;而百度大脑开放平台则向相助搭档开放技能与培训资料,实现因智而能,促举行业发展。
以下为李彦宏在2016年百度天下大会上的演讲实录:
Robin:各位来宾各人早上好!欢迎来到2016百度天下。
各人知道,百度天下是我们每年举行一次的百度技能创新大会。本年的主题我们聚焦在人工智能,各人在之前收到的请柬上已经看到这个主题了。刚才开场视频是以人工智能为主题的,本日我的主题演讲也将围绕着人工智能来睁开。
本年6月份,我在百度同盟峰会上讲了一个概念,叫做互联网的下一幕。下一幕是什么意思呢?就是说,互联网的发展在此之前已经颠末了两个非常紧张的阶段,第一个阶段大概连续了十几年的时间,就是我们讲的PC互联网阶段。第二个阶段是在近来四五年,我们把它叫做移动互联网的阶段。对于中国市场来说,随着上网人数越来越多,上网生齿的渗出率越来越高,如今已经到达了七亿多,就是说已经高出了50%的渗出率,同时,每一个上网的人如今也根本都用上了智能手机。这意味着什么呢?这意味着,将来互联网的增长不能再靠生齿红利来驱动了,也就是说,移动互联网的期间着实正在离开我们。这大概是很多人以为难以担当的。我们国家如今进入了所谓的新常态,经济的增长必要靠“互联网+”举措筹划来推动,所谓“互联网+”就是盼望用互联网的头脑方式、互联网的服从来推动各个行业、财产的继承发展。但是,我们互联网的从业者着实又深深地感受到了这此中的危急,这个危急就是由于已往的粗放增长阶段已经竣事了。
移动互联网之后的下一幕是什么?着实如今已经很清楚了,就是我们所说的人工智能。人工智能对于百度来说是核心当中的核心,我们也很荣幸,在已往的五六年当中,百度花了很大很大的精力投入到人工智能的研发当中。人工智能对于百度来说意味着什么呢?我可以用简单的四个字来形貌,就是百度大脑。百度大脑的概念我们着实在约莫三年前就对外讲过。谁人时间我们讲,百度大脑已经具备了大概两三岁孩子的智力程度了。自此以后,不绝地有人来问我,尤其是本年人工智能忽然火起来了之后,很多人来问我说,你们这个百度大脑如今相称于多少岁人的智力程度了。
要答复这个题目着实还蛮难的,我也不知道它如今是多少岁了,由于毕竟人脑和电脑它还是有很大的区别,百度大脑固然是一个人工智能的大脑,但是它和人正常的发育的过程还是很不一样的。
百度大脑到底由什么构成的呢?它根本上是由三个大的部分构成的。第一个构成部分,就是人工智能的算法。我们有超大规模的神经网络,这是模仿人的神经元构成的网络,但着实我们也不知道真正人脑工作的原理是什么,只是想象当中应该是这个样子。我们还利用了万亿级的参数,人脑的神经元大概是千亿级的,我们也有千亿的样本和千亿的特性举行练习。整个这些东西构成了百度大脑当中算法的部分。
百度大脑的第二个构成部分是我们盘算本领。如今我们已经利用了数十万台的服务器来举行盘算,而这当中很多的服务器不是传统基于CPU的服务器,而是基于GPU。从前的时间,GPU重要在游戏等范畴利用得比力广泛,在人工智能、尤其是深度学习起来以后,我们发现,着实GPU特别得当人工智能的盘算,尤其是深度学习的盘算,一块GPU可以顶100个CPU的盘算本领。有关GPU的事变,我之后会请一位外部的高朋,就是NVIDIA的首创人和CEO黄仁勋老师,让他给各人先容更多有关GPU的,尤其是在人工智能范畴应用的环境。
百度大脑的第三部分是数据。数据也非常非常紧张,而且这个数据量也黑白常大的。比如说,我们已经网络了全网上万亿的互联网网页内容,这此中包罗了很多视频、音频、图像,这些数据也是数以百亿级的。我们尚有每天数十亿次网民的搜刮哀求,而且尚有每天数百亿次的网民定位哀求,就是说这个人在什么地方,如许的哀求也比各人想象得多,每天都有好几百亿次如许的定位哀求。
有了算法,有了盘算本领,有了数据,百度大脑就可以开始工作了。百度大脑又到底有什么样的功能?让我们来看一看。
我们本日想重点先容的四个功能:一个是语音的本领,一个是图像的本领,一个是天然语言明白的本领,尚有一个就是用户画像的本领。这几个本领固然都是属于人工智能中比力典范的应用,但是它的发展阶段也是很不一样的。比如说语音,如今就已经进入了相对比力成熟的阶段,在很多很多范畴中都开始进入实用阶段,辨认的正确率也已经很高了。图像近来几年也有了长足的盼望。这两者都属于人工智能当中认知的部分,以是深度学习的算法非常得当处理惩罚这些情势。
相对来说,天然语言的明白或处理惩罚本领就更加难一些,并处在一个更加早期的阶段,由于它除了认知方面的本领之外,还要求有推理、规划等等本领,才华够真正地明白天然语言。用户画像的本领,着实从传统意义上来讲并不是人工智能的范畴,但是由于比年来大数据的发展,尤其是大型互联网公司有本领搜集很多用户的数据之后,再用人工智能的方法、用呆板学习的方法,就可以把一个人的特性刻画得非常非常清楚。以是本日,用户画像也变成了人工智能、大概说变成了百度大脑的一个紧张功能。
下面我就分别来讲一下这几个功能,这几个百度大脑的功能。
我们先看一下语音,刚才也讲了应该说本日人工智能发展的最成熟的一部分本领,而语音又分成两个方向,一个是语音的合成,一个是语音的辨认。
我们先看看语音辨认。本年MITTechnologyReview(《MIT科技批评》)杂志,把百度的DeepSpeech2评为“2016改变天下十大突破技能”,这就是百度的语音辨认引擎,它已经到了第二代,重要就是利用了深度学习的本领。如许的一个技能已经可以把语音辨认的正确度做到多少呢?大概可以做到97%的正确率,如许的正确率已经到达、乃至偶然已经高出了人对语音的辨认本领。固然,我们讲这些本领不是为了简单地去夸耀这个数字有多好,我更感爱好的是,当你有了这些本领时,它可以在什么范畴应用,又可以在哪些方面资助到我们,这着实才是最最让我们以为高兴的地方。我个人的想象力很有限,整个百度几万人的想象力也是有限的,但是这些本领假如赋予到很多很多人,赋予给几亿人、几十亿人,这个大概性险些是无穷的。先用我们比力有限的想象力来给各人举一个例子。
这是一个贩卖、电话贩卖的例子,是一个2B(ToB)的应用。这个应用是什么意思呢?很多的公司着实都有电话贩卖如许的一个部分,都必要如许做。但是贩卖,尤其是电话贩卖这个行业,各人知道活动性是比力大的,很多贩卖都是新人,新人的话就会颠末肯定的时间培训才华够上岗,但纵然是颠末培训的话,也不肯定有那些有履历的贩卖那么出活儿、出单。着实有履历、最良好的贩卖和一样平常、较差的贩卖相比,在服从上有非常大的差别。我们怎么才华够让新手、让没有履历的贩卖,可以或许具备最良好贩卖的贩卖本领?已往的做法是,把良好的贩卖履历总结成册子让各人去学习,让这些贩卖去背,但是怎么活学活用还是必要一个过程的。而有了这么高精度的语音辨认本领之后,我们就可以彻底改变如许一个状态了,乃至可以让一个刚刚上岗一个月的贩卖就具备最良好贩卖的本领,也就是说,我们可以通过及时的语音辨认甄别出用户或客户在问什么题目,然后我们再及时地在屏幕上告诉新的贩卖,最良好的贩卖是怎么答复这个题目的。已往没有及时的语音辨认的时间,你必要线放学,学完了之后上去用、很轻易就忘了,但是有了这个体系之后,我们就可以办理如许的题目。
我们来看一下这个案例。
各人看到,在刚才的过程中,百度大脑不停在及时地辨认两边的对话,尤其是从电话内里传出来的声音,有的时间并不是那么清楚,对于人来说要完全听清楚每一个字着实都是有肯定难度的,但百度大脑的语音辨认本领已经可以做到非常精准,而且可以根据用户的题目、及时保举下一步的工作要怎样应对,这是一个语音辨认应用在企业一样平常运作中的一个例子,就像我刚才讲的,应该尚有很多很多应用场景,各人可以根据本身的配景去想象。
语音辨认是一方面,语音合成又是别的一个方面。语音合成是什么意思呢?就是呆板可以把笔墨转换成语音,把它念出来、读出来。本日的语音合成也有了和已往非常不一样的体验,最重要的就是,它可以用比力天然的人的声音读出来,而不是像已往呆板一样,每一个字之间的停顿都是一样长,是匀速的、没故意情的。如许的天然体验,固然对于用户的黏性来说也是有很大的作用。
如今,百度每天要相应2.5亿次的语音合成哀求,这些哀求用来干什么呢?比如说,已往人们看小说,本日可以在手机百度内里听小说。渐渐的人们听小说的时间也更长了,已往每个人均匀在小说频道会花大概四非常钟左右的时间,如今要花将近两个半小时,就是由于把盘算机合成出来的语音读出来给我们听,确实是一个很不错的体验,乃至是一种享受。那么这种读出来的小说,和我们平常听到的广播有什么本质上的不一样?着实非常不一样。广播是每一个人听到的东西是千篇一律的,而本日的语音合成,它可以做到每一个人听到的东西都是不一样的,完全根据你个人的需求举行定制,这就是为什么它的(用户)黏性会很高,它可以或许具备天然发声的本领。不但云云,着实我们可以想象一下,它假如可以或许模仿一个天然人的表达方式或发声本领,它就可以模仿任何一个你喜好的人的语言方式。
不知道有没有人留意到,百度舆图里导航功能就是用语音来举行的,此中有一个选项可以用我的声音举行导航。着实导航的那些话我并没有说过,呆板只是根据我平常语言的环境合成了一个李彦宏的声音。如许的声音不但在我身上可以做到,在很多其他人身上也可以做到。
我们如今来给各人展示一个合成的声音。我们合成了一下13年前已经去世的张国荣的声音,我们来放一段video。
为什么给各人展示这个呢?一方面我知道,很多人是张国荣的粉丝,另一方面,着实合成张国荣的声音比合成一样平常人的声音要更难。为什么呢?由于他的国语语料相对来说比力少,以是,我们可以或许合成他的声音,就肯定能合成很多很多人的声音。
对于百度来说,百度大脑的语音合成本领可以让每个人都有本身的声音模子,你只要按照我们的要求说50句话,我就学会了你语言的方式。当你拥有本身的合成声音之后,比如说家里的老人想常常听你说一说,你把这个声音合成出来让他听就好了。大概说你平常要加班,小孩睡觉之前想听个故事,你合成本身的声音给孩子讲一遍这个故事,听起来也会很密切。以是各人可以看到,这些语音的本领会带来各种各样新的大概性。
下面我给各人讲一下图像。用一个比力专业的术语来讲,我们叫做盘算机视觉。这也是如今广义的人工智能中非常紧张的范畴。说到图像的辨认,我想各人天然而然会反应出来一个什么应用呢?应该就是我们通常讲的人脸辨认的应用。人脸辨认的正确率本日已经到达了99.7%,已经非常非常正确了。现场的屏幕可以或许辨认出来我们一些高朋,根据他们的人脸,我们知道这个人是谁,这个正确率已经比力高了。刚才进来的时间,各人也可以看到一些人脸辨认的展台,我们是可以辨认很多很多人的面貌的。
那么,人脸辨认这个技能是怎么实现的?我们要对人脸的特性提取它的关键点,把这些点打出来之后要做一些处理惩罚,把它连成一个面部心情,据此来辨认如许一个人。这就使得当一个人的心情发生变革的时间,我们仍旧可以或许辨认出来这个特点是没有发生变革的,比如他在哭,他在笑,他在愤怒,他在迷茫,他的心情是不一样的,但是他的心情特性是稳固的,以是我们仍旧可以很正确地辨认出如许一个人。
除了面部辨认之外,图像辨认还在很多范畴也有应用。我们再看一个,这是上海的一个全景图,各人利用百度舆图偶然间必要看如许一个景,到一个陌生的地方之前,想看看到那看到的样子是什么。固然,这个图不是一个简单的图像的收罗,我们收罗了图像之后要对图像中各种各样的目标举行辨认,这个大楼是什么样的大楼,谁人路牌上面写的什么字,对写的这个字辨认的话,跟人脸辨认还不太一样,这内里有一个特别的图像辨认的技能就是OCR,这个是二十多年前我们的一个专利,到本日它的正确率已经非常高了,下面我们也是用一段视频给各人看一下百度舆图是怎样利用图像辨认的。
这是百度舆图利用图像辨认的环境,着实尚有一个很紧张的范畴也黑白常必要图像辨认的技能,这个范畴是什么呢?这就是我们已往一年来讲得比力多的无人驾驶汽车。无人驾驶汽车涉及到很多很多的技能,比如说我们必要盘算机视觉的技能,必要高精度舆图,必要对环境的感知,必要定位,乃至必要语音的通话。但应该说,盘算机视觉大概是图像辨认的技能是“末了一公里”,无人驾驶汽车真的要变成没有人,真的要可以或许办理99.999%、乃至100%的环境,终极还是要依靠盘算机视觉的本领,要辨认各种各样的极度的环境。
客岁年底开始,我们给各人展示过百度的无人车在五环上跑,在高速上跑的环境,已往一年左右的时间我们也花了不少精力去提拔我们在都会蹊径上运营的程度,下面我们也放一段视频给各人看一下。
各人看到左下角这是人可以或许看到的视野,这个视野着实是比力窄的,主屏幕是无人车可以或许看到的路面环境,各人可以感受到,它感知的范围着实比人要宽了很多,很多比力远的目标都可以感知到,每个目标都给出它唯一的编号举行辨认。对面有什么车过来了,碰到红绿灯,碰到停滞怎么办,行人怎么能辨认出来,大概是树木,周边的汽车等等,每一个目标我们都举行了辨认和编号,这就是实际的、一个百度无人驾驶汽车在都会蹊径中行驶的环境,上面的45是限速。
这是大抵的一个车看到的天下是什么样的。这内里涉及了很多盘算机视觉大概是图像辨认的技能,尤其是这两个技能:一个是我们叫做车辆的检测,你行驶过程中怎么可以或许知道旁边有车辆,这个车辆在哪?这个车辆的检测我们如今按照国际权势巨子的评测来看,车辆检测的本领,百度无人车已经排名第一了。尚有一个很紧张的本领是车辆跟踪的本领。这个不但是全主动的无人车,纵然是对半主动的、高度主动驾驶来说,也是一个很根本的本领。你怎样可以或许正确地跟着前面的车走,这个技能在包罗正确性、全面性、连续性等六项指标中,我们已经有四项拿到了第一。
这是无人车对于图像辨认依靠的环境。我们再给各人展示一个范畴,就是加强实际AR,AR着实也黑白常依靠(图像辨认)。拿动手机拍一下实际的环境,我们要可以或许辨认出来这是哪,这内里有什么,然后才华跟用户举行互动,才华产生真实天下和一些假造天下的美满的连合。那么这个东西有什么应用呢?我们也以为很高兴我们的周总、我们的广告主非常敏锐地把握到了这么一个机遇,他说OK,我可以把实际天下中我的产物和假造天下中我盼望用户感知的东西连合在一起,如许的一个做法也可以说是一种新型的广告情势,下面我们就来看一个具体的例子。这是我们跟欧莱雅中国相助的一个例子。我们放视频。
以是各人看到无论你专长机拍一张明信片,还是拍一个实物的洗发水,它都可以正确地辨认出来这个东西,和用户举行互动,这内里不但有图像辨认的技能,也很洪流平上取决于广告主的创意,假如创意和这个技能连合,对斲丧者的吸引力也非常大,以是我们也等待将来的时间和客户很好地相助,把这个创意,把最良好的想法和最良好的技能连合起来,给斲丧者带来实惠。
这是有关图像辨认方面的几个例子。下面我们再看天然语言处理惩罚。天然语言处理惩罚着实我刚才也讲了,它的成熟程度应该不如语音,乃至不如图像辨认,但是纵然在如今的状态下,它也可以或许给各人带来很多很多不一样的体验。最直接的例子应该是我们客岁在百度天下大会上讲的一个例子,就是度秘。度秘是一个个人智能的助理。这个个人智能助理本日我们可以在手机百度内里找到,度秘跟用户举行交互,如今已经有高出一半的交互是通过语音和图像来完成的,客岁我们也讲了,语音和图像将来会变成一个主流。
度秘除了它可以或许辨认语音和图像之外,着实它更关键、更核心的技能,是可以或许用人的语言来与人举行交换,而且可以或许明白人的很多意思和意图,只管不是每一次都能明白。
已往这段时间我们也利用度秘的天然语言的本领做了一个比力故意思的应用,用度秘来讲授奥运篮球,下面我们看一下视频。
这个不是度秘单独完成的一次讲授,是他和闻名篮球批评员杨毅老师一起相助做的一次奥运篮球比赛的讲授。本日我们也很高兴把杨毅老师请到了现场,如今请他上台。
杨毅:各人上午好,我是杨毅。
Robin:刚才我们看到很故意思。你跟度秘一起讲授了一场篮球的比赛,而且我也留意到你的风格和度秘的风格还是很不一样的,我想问你一下,作为一个篮球批评员,你以为一个好的讲授员应该具备什么样的本领?
杨毅:起首我以为很难说我有资格来讲一个好的批评员要具备什么样的本领,我信托很多行业都在不绝地进步和发展。而且对一个讲授员,纵然他讲授了一万场比赛,但他下面面对的一场比赛也是新的。但我想,总的来说,一个讲授要想很好地工作,起首你要对这个项目有非常深刻的相识,无论对它的项目特点还是汗青配景,第二个要有非常快速的现场反应本领,第三个我以为要有出众的语言表达本领,把你看到的、听到的,可以或许尽快地出现给观众大概是听众。
Robin:对,这些本领度秘都在不绝地学习过程中,尚有很多不美满的地方,我也盼望度秘可以或许从你的身上学到很多很多东西。刚才我们看到你和度秘相助的如许一次讲授,它跟你学习了一次之后,我们想让它单独做一次篮球比赛的讲授,如今我们看一下度秘讲授篮球奥运决赛的环境。
Robin:ok,这是度秘单独的讲授,也想请杨毅老师批评一下你的门生表现怎么样?
杨毅:显然度秘比之前和它一起说的时间完成得更好了。着实我跟它说的时间,它的表现就是出乎我的预料的,我也听说它学习过上百场乃至上千场的比赛,它对比赛的根本知识储备是没题目的,在这个行业内里,它大概比我知道得还多,由于几年前的比赛我大概已经忘了,但是仍旧装在它的电脑里。上知天文,下知地理,什么都明白,它的表达也是比力清楚的,在我跟它说的时间,我以为只有一个小小的题目,我以为它语言的速率确实是好慢。但是各人刚才看到,它说决赛的时间能显着感到语速加快了,更符合体育竞技的特点,更快速地将现场的感情转达给观众。
Robin:对,我着实非常同意。刚才听的时间我也有点发急,它说的语速是比力慢的。但是像你刚才讲的,度秘也有它的上风,比如它的影象本领是比人强的,它学习了几百场的奥运篮球比赛,每个活动员的个人资料它都记得非常清楚,碰到这些知识型的题目,它可以非常敏捷地、方便地答复。别的我们看讲授本身,用户是可以跟度秘举行互动的,你点一下“两边三分球的对比”,立刻就出来各种各样的数据了,这是度秘的上风。但是度秘的劣势就是它对人的语言的明白和人的语言的创造本领尚有很多必要学习的地方,我们也非常盼望杨毅老师可以或许多给我们度秘提一些发起和提拔的地方,也盼望我们下次再有机遇相助时,它语言至少快一点。
杨毅:我以为它下面的这些功能黑白常好的。你可以想象一下,假如它成为一个成熟的产物,在每个球迷收看比赛的时间在家里身边沙发上都能摆一个小呆板人,一边看着电视里的比赛,听着电视里的讲授,固然它大概在电视里讲授;同时他身边也有个度秘,可以不绝地就他所关心的题目问身边这个小呆板人,可以或许随时给他举行解答,就真正成为了球迷在收看比赛时间的好朋侪。
Robin:我信托这一天肯定会到来的!而且对于度秘来说,篮球和其他的比赛没有任何区别,都是学习知识,它重要的本领还是不绝地学习人的头脑方式和表达方式。
杨毅:我信托它肯定会越来越好。
Robin:谢谢杨毅。
Robin:这是有关天然语言明白的一些先容,下面再给各人展示一个天然语言明白的应用。这个应用的范畴着实也不是特别新,就是主动翻译。你要想把一种语言转换成别的一种语言,你必须得明白这种语言在说什么。它不是简单的把语音转成笔墨,更多的是必要你知道它是什么意思。本日的百度翻译已经可以支持27种语言、数百种差别方向的对译了。如今我们来看一下百度翻译有多洪流平上可以或许明白人的天然语言。
Robin:这着实不是一个演示,这是一个实际的例子。本日当各人打开百度翻译,它已经具备了如许的本领。以是我们看到对于天然语言的明白一旦可以或许到达肯定程度,它就又打开了很多新的大概性。
下面我们讲百度大脑的第四个本领,就是用户画像的本领。用户画像也是基于百度的大数据以及呆板学习的方式所得到的一个本领。如今我们已经有靠近10亿的用户画像,此中对于他们的辨认我们已经用到了千万级的细分标签。这些标签重要在两个维度上表现,一个是通用的维度,它的生齿学特性、短期的意图、位置属性;也有一些垂直行业的特性,他在金融范畴是什么样的环境,它在保险、医疗、旅游、康健等范畴都有什么样的爱好、风俗,这些东西都共同构成了我们的用户画像。
用户画像有什么用途?起首给各人举一个百度的例子。
近来几个月各人大概留意到了手机百度,除了上面的搜刮框之外,下面增长了各种各样的文章。这些文章偶然间是消息,偶然间不见得是消息,但是确实是你感爱好的东西。之以是它可以或许把你感爱好的东西保举出来,就是由于我们利用了百度的用户画像。我知道你是一个什么人,你喜好看什么样的东西。有了如许的个性化保举,已往两个月手机百度保举的文章的阅读量增长了10倍,这种本领就是靠百度给用户打了60多万个标签,而每个用户都是这此中某些标签组合后刻画出来的,以是它可以做到千人千面,正确地讲,不是千人千面,而是万人万面,亿人亿面,每个人对于百度来说都是不一样的个体。以是,每个人看到的信息和文章都是不一样的。
这是一个百度内部利用的例子,我们也以为用户画像可以在很多其他范畴利用。我们再给各人展示一个外部的例子。这是6月份上映的影戏《魔兽》,它的出品人是传奇影业,他们就是利用了百度大脑的用户画像功能来提拔它的票房。那么它是怎么做到的呢?我们也来看一个视频。
这个做法很聪明,它把人群分成三类,一类人是不管怎么样都要看的,别的一类是不管怎么样都不会看的,这两种人他们都不太关心。它关心的是它可以影响的人群,再通过用户画像把这些人从摇摆的转换成真正去影戏院看的。(原来)他以为假如有5%的票房提拔就很满意了,末了实际上提拔高出了200%。固然这不是简单的说百度你给我用户画像,它一用就实现了提拔,他们也下了很大的功夫去计划团体的推广过程。原版的video是比这个长很多的,各人有爱好可以接洽我们的工作职员,看它完备的做法是什么样的。
讲到这里,我根本上把百度大脑几个重要的大功能都已经出现出来了。下面我想请一位各人都很认识的明星,和我一起回顾一下百度大脑的这几个功能。这个明星就在我们这张照片中。我们起首用百度大脑的图像辨认功能把这位明星找出来。各人知道他是谁吗?对,他就是闻名演员胡歌。
胡歌:你好,Robin,各位恭敬的来宾各人好。我是胡歌。本日非常荣幸可以参加百度天下大会。刚才我在侧台也听了非常出色的演讲,感受到了很多新的科技。之前我有听说过人脸付出,以后假如可以像刚才那样在一大群人中先举行人脸辨认,再完成付出,这个真是太便捷、太智能了。
Robin:你是想抢着买单吗?
胡歌:假如以后有机遇我和Robin要一块用饭,到买单的时间,我肯定把脸转已往,不跟你抢买单。
Robin:没题目,我买单。刚才我们已经看到了百度大脑对你的面部的辨认。我还可以给你展示一些其他的本领,比如语音合成的本领。这个本领是如许的,当你念一首词,你念它的上半部分,百度大脑念它的下半部分,但是它念出来应该跟你是一样的,它学的是你的声音。
胡歌:这么锋利。
Robin:这首词,是百度名字的泉源。你可以来念一下上阙。
胡歌:东风夜放花千树,更吹落、星如雨。宝马雕车香满路。凤箫声动,玉壶光转,一夜鱼龙舞。
胡歌:太神奇了,起首让我震撼的是,它能把我的声音模仿得这么像。第二,它连百度钱包的代言词都给我改了,真的挺智能的。
Robin:这是语音辨认的本领,着实用户画像的本领对你着实也有效,为什么有效呢?你的粉丝都是什么样的人。
Robin:这是根据你的粉丝的爱好偏好“画”出来的东西。我还是有一点惊奇的,原来以为关心影视、音乐应该是最大的群体,但是我们看到旅游出行、网络购物是你这些粉丝群体特别特别喜好的东西。
胡歌:我看到旅游出行和餐饮美食大概是他们最感爱好的,那么能不能在这儿根据这个爱好数据也为我的粉丝谋取一些专属的福利呢?
Robin:好啊。那我们下来通过糯米或是其他的平台给胡歌粉丝提供专享的优惠。百度大脑的这些本领都是本日已经实现的。刚才我也讲到这个大脑一天一天都在学习和发展,它的本领也在不绝的进步。以是我完全可以想象有一天当你决定要接一部戏的时间,你只要在这个条约上签一下字,剩下的事变就都交给百度大脑来干,它可以合成你的声音、可以合成你的图像、可以做你的动作,以后演戏你只要说Yes,剩下的事我们就都给你办了。
胡歌:科技在不绝发展,但是演戏对我来说还是我毕生艺术上的寻求,我以为百度大脑可以为我的生存带来很多便利,但演戏这个事我还是本身来干吧!我信托它可以做好,但是我更乐意本身来做!
Robin:好的好的,以后百度大脑具有新的本领的时间,我及时关照你。这有大概是好消息,也有大概是坏消息。
胡歌:谢谢!感谢本日让我感受到了这么先辈的科技,我也盼望百度大脑可以或许越来越强大,越来越智能。谢谢Robin!
Robin:谢谢胡歌!本日我们全面展示了百度大脑各种各样的本领,我以为,而在我本身和百度同砚的想象范围内,这些本领能做的事变已经很多了,但是更让我高兴的是假如这些本领赋予到全社会的每个人,它可以或许变更出来无穷无尽的大概性。以是,百度大脑会把语音、图像、天然语言明白和用户画像等本领完全开放出来,而且在大多数环境下这些本领会是免费提供的。有了如许的本领,有了开放共享,将给各行各业的人群带来已往各人做不到的、不敢想的本领。我在这里也约请每个人重新想象你地点的行业,重新想象中国经济,重新想象天下的将来。
谢谢各人!
保举阅读:
气候太热,品牌也开始在刷存在感!
靠玩飞机15岁少年狂赚164万,无人机界的F1赛事来了
美国资深风投人对VR说:别再给我展示恐龙了
Netflix霸屏美剧市场,压迫观众总像挤牙膏
我要评论