奇幻城国际官网

官方微信:   
百度首席科学家吴恩达演讲实录:深度学习现在
时间:2017-12-21 20:01  编辑:admin
 

  百度首席科学家吴南达演讲实录:深度学习现在开始起火,影像和影音将成为未来搜索引擎的新方向

  百度演讲首席科学家吴南达实录:深度学习现在火起来了,影像和影音将成为未来搜索引擎的新方向发表时间:2015年1月1日发表评论(1)每周【编者按】1月20日下午消息,未来论坛创始会在北京举行。本次发布会的主题是“指数 - 科技力量明天新的一个明天”。百度首席科学家吴南达在论坛上做了主题演讲,主题是“机器学习与人工智能”。他认为,通过移动互联网的兴起,通信逐渐从文本转向图像和视频,所以我们看到随着越来越多的人们搜索图像和语言,人工智能可以更好地理解这些文本和图像,以及交互语言之间。吴先生还表示,有时候可能让小孩和老人打字比较困难,如果能让他们使用语音搜索,他们可以使用便捷的信息产品服务。对于我们老百姓来说,使用语言识别和语言搜索越来越方便,百度在语音识别方面投入了很多。以下是吴恩达的演讲记录:吴倩倩:过去几年来,人工智能与深度学习不断为技术转型,为公司创造巨大的经济价值,也是改善人与技术的方式但人们对AI AI有很多猜测,今天我要做的就是和大家沟通两条信息,一个我希望我能告诉你AI人工智能领域发生了什么,希望三十年后,我们可以说出什么是实事求是,什么是炒作。其次,如果你是组织的领导者,我希望在30分钟内你能够战略性地思考和思考最近的历史和在人工智能的不远的将来,您可以更好地领导团队做出更好的人工智能和技术决策,因为人工智能和互联网正在改变我们的生活和经济结构,在过去的15年中, a人工智能是t他认为,一个积极的周期概念,我们认为它可以带来一个好的产品,很多用户,与许多用户将能够收集大量的数据,用户数据,服务数据,大量的数据将使我们能够使用AI继续改进我们的产品。但是这个图片的问题是,直到最近,AI这一步实际上并没有做好,传统上,即使你增加了投资,但是它的表现也不会提高。现在我们对AI和深度学习的理解,只要你现在测量AI技术等等,他的AI性能会越来越高,这样在大数据时代可以降低成本,提高性能,这些深度学习算法总比不上传统的AI算法,因为他可以逐渐提高AI的性能。因此,有史以来第一次,我们可以在该图中完成人工智能,获取数据,获得良好的产品,并接触到大量的用户。大多数互联网信息是基于文本的。随着移动互联网的兴起,我们认为这种沟通方式正在慢慢向文字图像和视频方向发展。所以在百度,我们看到越来越多的人在搜索图片和语言,我认为通过人工智能我们将能够更好地理解这些文本和图片,以及语言之间的交互。现在我想介绍一些例子来向大家解释AI如何使用今天的互联网,像百度这样的公司在文本上做了很多工作,让我们从图像开始。七年前,我问斯坦福大学的研究,让他们写一个算法来找到图像中的杯子。最好的算法是七年前用最好的算法,这是最终的结果,到处找杯子是一个错误,对于你我来说,作为人类,很难理解为什么计算机可以不认识这个杯子,为什么电脑看不到我们能看到的东西?电脑很难做到这一点,让我们仔细看看。我们眼中看到的杯子,但是电脑看到很多像素,所以电脑的作用是看这些数字,测试你所代表的东西。代表这个杯子的嘴,似乎这是一个电脑问题,如果六七年前机器解决这些问题是非常困难的。五年前,发生了变化,神经网络的深入学习出现了。当时我们受到了人脑的启发,并开始创建软件来模拟这些神经元的工作方式。深度学习是什么意思?我们建立这些神经网络来深入地模拟我们大脑中神经源信息的传统方式和方式。人工智能有很多猜测,这些猜测的原因之一,很多人说这句话,深入学习推动科学技术的发展,这句话很简单,这个口号全都炒作在AI上。午餐时我跟饶毅谈过。他是北大的生命科学家。当时我们都感叹,今天我们真的不明白人脑是如何工作的。所以我们实在无法准确的模拟人脑。我们的深度学习软件模仿人类的大脑,但它只是大脑模仿大脑如何特别表面的方式工作,我们真的不明白大脑是如何工作的,我们用不准确的模拟来激发新技术的发展,我们用计算机视觉,并且给了他很多关于杯子的信息,我们在过去的五年中发现了这些算法,从数据中学习,学习长杯子的样子,所以我们取得了很长的进展,今天的计算很容易辨认杯子。这只是在图像中找到被子,这是一个非常简单的任务。我们的视觉系统可以做的不仅仅是这些,而且我希望能够向您展示这些图像,并向大家询问您在这些图像中看到的内容。如果我想要求你为这些图表写一个解释,你可以在路上写一辆黄色的汽车,然后是树林。你可以写的是一个客厅,白色的沙发,蓝色的地毯,下午的阳光照进房间。你可以写这些说明的原因,你明白这些图像的意思,所以你可以写指令。你所能做的就是详细讲解这些图像的信息,另一方面电脑只能识别杯子,两者之间有巨大的差异。这些说明和字幕不是任何人写的。我们现在已经通过软件在过去的几年里通过软件开发来说明这些字幕。这种技术为我们提供了一个新的机会,使我们的软件深入发展。学习分析数据为我们提供了更多的数据,使得计算机视觉在五年前不可能做到,在可预见的将来,这样的软件将使我们能够更好地理解医学图像。计算,自觉识别可能是困难的,未来是我们的目标之一,百度眼科产品是我们未来的愿景而已。为什么深度学习现在开始变得越来越好,我现在解释一下深入学习的功能,以及他能为我们解释深度学习是如何工作的,以及为什么它会变得更好?我现在想做一个比喻,如果你想象我们建造一个火箭,火箭有两部分,第一部分是火箭发射器,是一个大的发动机。第二是燃料。如果发动机很小,很多燃料是不可能的。如果发动机很小,燃料很低,燃料就会燃烧下来,所以火箭必须有一个大的发动机和大量的燃料。深度学习与此类似。现在神经网络是我们的引擎,它正在推动AI的发展。燃料是我们使用的数据。到目前为止,我们有这么多的数据,我们已经提供了大量的数据输入到我们使用它作为我们的引擎的燃料。在AI近期发展的主要动力,因为我们可以建立一个伟大的精神网络。另一方面,百度等公司可以为这些心理网络收集大量的数据并输入数据。我们有一个非常庞大的技术网络,同时也有很多数据,所以当然深度学习可以越来越好。我今天提到的一件事情是,到2010年,我们现在能够建立一个大型的神经网络,这个网络在五年前已经被学术界使用的最大的神经网络连接了1000万个连接,从而模拟了神经来源之间的联系。四年前,2011年,当我们在Google开始一个项目时,我们使用1000台Google服务器构建了一个庞大的心理网络,当时我们的团队建立了大约十倍的神经网络。后来我们发现,在其他大学使用其他技术的情况下,我们的技术并不是那么大,而且您只有三台服务器就可以获得100亿次连接。百度上,我们正在使用现在可以构建的新GPU技术非常大的心理网络。在人工智能和深度网络方面已经做了很多工作,因为我们能够建立庞大的机器,模拟心理网络,吸收这么多的数据,并做出预测。让我举个例子,用声音来解释我刚刚做的核燃料的比喻。我现在给你看一个语音识别的例子。百度我们在语音识别方面投入了很多,很多人使用语音搜索,对于小孩和老年人来说,打字有时会比较困难,如果能让他们使用语音搜索,就可以使用方便的信息产品和服务。对于我们普通人来说,使用语言识别和语言搜索的方法越来越方便了,直到最近,基本上所有的语音识别都是一个非常简单的软件实现,在一个盒子里,这是一个复杂的系统,最近我们决定让我们看一看生成语音识别的软件,把它扔掉,换成神经网络,所以这就是我们的引擎,因为百度在GPU早期投入很多,所以我们可以搭建一个大型的火箭发动机,什么是燃料?在语音识别方面,大部分的学术人员使用这些数据,其中一些有300个小时,最大的是2000个小时,一开始我们用了几个小时的语音数据,后来有上千个语音数据,后来又建立了一个合成的语音数据。后来,我们达到了总共10万个语音数据,按照标准的语音识别,实际上这是一个难以想象的数据量。我们在百度拥有非常强大的工具,我们可以使用火箭燃料核火箭引擎将它们放在一起,以便我们有更好的语音识别性能和一个非常开放的OPI发现。我们不到一个月前就有了不错的成绩,我认为人工智能将改变用户技术的方式就是声音。我们有语音,因为我认为有越来越多的互联网通信进入语音通信。现在就像百度公司有这么多的配音产品,我们可以使用这个声音,我认为整个互联网经济和互联网生态系统才刚刚起步,整个世界都在走向移动设备,没有人还没有设计出非常好的手机,正因为如此,现在我们在小键盘上花了很多时间打字,如果能使语音识别工作得很好,在安静的环境下工作得非常好。现在您正在开车,您的手机在您旁边的座位上,没有人会使用语音环境,因为如果我们可以在嘈杂的环境中进行设计和操作,则语音识别功能在嘈杂的环境中无法使用。良好的语音技术当然,我们愿意使用语音技术。如果我正在开车,手机在旁边,我可以和我的手机通话。我可以给我的妻子发短信。我想如果有这样一种语言技术,它将改变我们的整个世界,并且将改变我们与移动设备交互的方式,我想重新设计每个人的手机,并围绕语音识别界面进行重新设计。移动设备,我认为语音正在改变着物联网,包括许多家用电器,可穿戴设备等等,有些人知道现在物联网中有这么多的设备,如果我们可以和我们的设备进行通信,对于我们的语音识别来说是非常好的,如果五年前我们说过电视机的遥控器可以让你收看电视频道,那么人们就会觉得你疯了,我希望在这个生活中可能会有这样一种新技术。我的子孙,也许有一天我的孙子,或者将来你孙子的孙子会告诉你他们可以直接和电视沟通,也许有一天你可以和你的微波炉沟通,微波炉会不理你,它不和你沟通真的很粗鲁,这是无礼的。我们发现,语音正在改变着移动的世界,改变着物联网,而且互联网上的交流太多了。我们与技术互动太多。我们的互动都是关于文字,有很多的图像和声音。人工智能现在有了深入的学习,语音技术已经成为帮助我们理解和识别这些数据的最强大的技术。我认为人工智能有很大的潜力可以改变我们与包括百度和无人驾驶汽车在内的技术互动方式,他有很大的潜力改变我们与技术的互动。基于此,我对这项技术感到非常兴奋,并在此基础上做了大量的工作。当然,这方面有很多猜测。我觉得人工智能的飞速发展现在已经引起了一些猜测,这是不幸的。也许人们会认为有一天电脑会成为一个好的机器人,会控制整个世界,我们会创造一个很好的世界,也许他们不会是邪恶的机器人,现在我们手机上有很多的代码,我个人并不认为这会在炒作中发生,我们可以用这些技术来做出不断变化的预测和技术,我们的生活是关于技术,但是你知道的神经网络是很好的标识符和预测工具,你输入数据,但是我们这些在AI领域工作的人,我们参加了会议,发表了论文,而且我们和其他胡思乱想的人有了截然不同的看法,我们不同意。可以摆脱猜测,人工智能开发是比较健康的,人工智能挑战不会造成机器将控制世界,他很可能会帮助我们取代劳动力,我们的领导人必须认真考虑技术,人工智能技术来帮助我们回报王牌那些复杂的工作。谢谢,这是我的介绍。陈:非常感谢安德鲁,非常感谢你为我们描绘了一个非常光明的未来。与人工智能驱动的世界相比,我们生活的这个世界真的很粗鲁,不那么客气。我们将在未来工作智能驱动的世界将是非常有礼貌的,我们一次只允许一个问题。问题:非常感谢您介绍AI。我是ICE的王涛。 ICE是中国最大的媒体分享公司。在您的演讲中,您介绍了Google和百度的大脑,他们可以从网络中学习,文字和图片变得聪明。我们的ICE研究了一些视频大脑。我们的目标是让机器了解视频的内容,让人们播放视频,制作视频,并向大家推荐有趣的视频。我们认为视频非常复杂,在数据方面非常复杂,数据库的大小也非常大。我的问题是,在什么情况下,视频大脑这些材料将被用在我们的生活中?我们在行业中能做些什么来加速公司的发展?谢谢!Andrew Ng:你知道我住在美国,当我和我妻子去看中国电影的时候,我们也用ICE,我们创造了非常大的处理数据的机器,但视频的挑战是数据量太大,正因为如此,深度学习在图像和视频方面取得了长足的进步,这里也有一个非常有趣的说法,比如作为知道如何利用时间数据和视频数据来了解人们在做什么和在做什么的人,我认为这是一个非常有希望的前景,我希望今后这样的发展在技术领域也是可能的。陈欢:我们的时间非常有限,我们再次感谢安德鲁,谢谢![编辑/李环] IT时代网络(关注微信公众号ITtime2000,定期推送,互动带福利惊喜)全部原创文章版权所有创世纪100 Ventu成立于2015年资本基金领导硅谷,专注于TMT的早期项目投资。 LP来自政府,互联网IT,知名媒体公司和个人。创科100多家IT,通讯,互联网,知识产权等创投基金拥有自己独特的视角和丰富的资源。快速的决策,快速的投资是100个基金制造商最显着的特点。翡翠村有一个年轻的花咀,人们只是设定了一个目标,谁说呢一定要做啊。支持董小姐来自:董明珠:卖5000万块格力手机是目标,不一定要实现 - IT管理员不要告诉我李彦宏是百度老板,老板和公司是不一样的伊琦伊是罗宾莉自己的投资呢。 。 。来自:iQIYI将于2018年上半年召开IPO百度继续持股之后 - 锐利 - IT网络青春村翠花翠每天的信息已经暴露在这个智能时代,没有真正的隐私来自:有没有最安全的产品WIFI WPA2协议漏洞 - 清晰度 - IT时代有没有必要争取年轻的村翠翠什么全屏的战斗,一个手机是她最重要的配置,不要把马车从前:为了全屏和配置成千上万的机器真的需要抢购这个行程时髦吗?锐利 - IT网络