大海环农业网
日期归档
当前位置:主页>国际新闻>
张宏江博士:AI的本质与机遇是什么?投资决策靠的是什么?
来源:365fd.com.cn  阅读量:653

源资本(Source Capital)在2017年大会上宣布,前金山CEO张洪江博士加入源资本成为投资伙伴。张宏江博士在2017年大会上分享了轰动一时的观点“人工智能的本质和机遇”。

张洪江博士曾任微软亚太研发集团首席技术官、微软亚洲工程学院院长、金山软件首席执行官。他是多媒体研究领域的世界级科学家,也是计算机视频检索研究的“创始人”。他获得了美国电气与电子工程研究所(IEEE)和美国计算机协会(ACM)的重大奖项,是第一位也是唯一一位同时获得这一荣誉的中国科学家。

张红江博士在2017年会议上的讲话全文:

今天,让我们从阿尔法围棋开始。我们的主题包括人工智能趋势的原因、大数据的发展、机器学习的驱动力、深入学习的基本原则以及人工智能技术的发展对我们日常生活、创造力和工作的影响。最后,我将讨论更多投资人工智能的机会和陷阱,尤其是陷阱。

从阿尔法开始谈论人工智能趋势:

算法计算能力很强

典型的深度学习算法是深度神经网络。

阿尔法狗在比赛中消耗的能量是人类的300倍;

在过去十年里,数据爆炸改变了我们的生活。

这股人工智能热潮实际上始于去年阿尔法围棋和围棋大师李世石的较量。虽然我从不玩围棋,但我打赌阿尔法围棋会赢。

我为什么要下注?我们读过关于阿尔法狗的文章。事实上,这是一个典型的深度学习系统。它使用深度神经网络、强化学习、半监督学习和蒙特卡罗搜索。

一般来说,它是经典技术和新机器学习算法的结合,可以提高算法的性能,使其更有学习能力。通过增加深层学习网络中隐藏神经元的数量,建立了良好的学习能力和吸收知识的能力。这是算法。

事实上,这背后有两件非常重要的事情,这是过去几十年计算机发展的结果。

首先,互联网在过去20年的发展带来了大数据,而且是高质量的大数据。以AlphaGo为例。在对阵李世石之前,它已经在第六至第九阶段与人类选手交手超过次。在比赛中,他获得了3000多万个布局点,这对提高其能力非常重要。在与自己下棋的过程中,获得了3000多万个布局点,形成了自己的决策网络。这就是我今天演讲的重点,即高质量的大数据。

第二,高性能计算资源。如果我们看看李世石最终的阿尔法围棋游戏系统,使用了1920个处理器和280多个处理器。这是什么意思?我们知道围棋大师的标准是一到九段,更好的水平是ELO数。

有了1920个中央处理器和280个图形处理器,阿尔法围棋的容量和ELO数从一开始就从2000多台增加到3000多台。我们看到李世石的数字是3500,这实际上相当接近。正是因为高质量的大数据、高性能的计算资源和新的学习方法,AlphaGo才能够轻松击败围棋大师。此外,我们说在李世石努力赢得第四盘后,阿尔法围棋(AlphaGo)那天晚上和自己玩了一百万次。

为什么这次人工智能浪潮与前两次不同?我们今天讨论的人工智能实际上是一种大数据和小数据的新算法。多年来,计算资源得到了发展。在摩尔定律的指导下,计算性能的提高呈指数级增长。同时,计算成本也随着指数下降。计算资源变得越来越强大和便宜,所以我们可以廉价地使用大量的计算资源。

过去十年的另一个根本性变化是,如果你不想自己购买计算设备,你可以使用云计算。让我们看看云。大数据的处理能力已经以云计算平台上的标准云服务的形式提供给了每个人,这种服务使用起来简单、成本低廉。这是计算领域的又一进步,它从根本上改变了机器学习只由大公司完成的状态。如今,小公司可以通过云计算做到这一点。

回到数据,这是我最喜欢的话题。在阿尔法围棋之前,我已经告诉过你大数据。当然,我的心是推广金山云。但是在过去的十年里,大数据改变了我们的工作,改变了我们的生活,改变了我们的思维。

IDC有报告称,2013年人类生成的数据为4.4 zbs,到2020年将增至44 zbs,增长10倍,年增长率为40%。如今,Vuormaa的用户每4小时产生超过2.5兆的数据,推特每天产生5亿条推文。今天的标题用户请求超过60亿次,每天的标题处理数据超过6.3PB,这是人们每天生成的数据。如果这些数据被很好地跟踪和标记,这些数据可以驱动人工智能及其算法。

大数据:机器学习的动力

人脸数据库的进步大大提高了计算精度;

吉姆格雷的四种科学研究范式:从观察、实验到计算模型,再到数据驱动模型;

大数据正在成为企业人工智能的标准。

给我讲一个人脸识别的例子。

今天,每个人都认为人脸识别已经过去了。一系列公司在人脸识别方面做得比其他公司好。这个功能在手机上也做得很好。以前,一个人拍了很多照片,发现找这些照片很麻烦,但是现在你想找一个人,你可能需要记得照片是什么时候拍的。然而,记住和谁一起拍的照片更方便。通过识别人脸很容易找到照片。这种功能是我们20多年前的梦想,今天可以在手机上实现。

这是我手机上的屏幕。我自己的照片,我妻子的照片和孩子们的照片都在这里。我前老板雷军的照片也在上面。我有点累了,雷军的所有照片都出来了。我想看一张具体的照片。这是雷军和戴尔电脑创始人迈克尔戴尔以及戴尔团队其他成员的照片。我们看到手机会自动标记这些人的名字,这个人是谁,那个人是谁,然后当他们进来的时候,他所有的照片都能被识别出来。这项功能在今天的品牌手机上可用。

20年前,我在惠普实验室申请了美国专利。这个专利的内容正是我刚才提到的整个过程:在拍了新照片后,比较它的数据库照片以确定这个人是谁。二十年前,我们非常清楚移动设备的计算能力有限。我们认为这种处理能力应该是分布式计算。今天我们称之为云。二十年过去了,现在正是20年前发生的事情变成了现实。这可以说是算法的进步或计算资源的进步。

我其实想告诉你人脸数据库的进展。

20年前,当我们还是人脸时,我们手里拿着数百张标准照片。今天我们得到了数亿张照片。在20世纪90年代早期,你只有几百个人和几百张照片的数据库。在20世纪90年代末,在2000年,你看到了成千上万张照片,因此你可以看到识别率的提高。在工业时代,即5年或6年前,谷歌和脸谱分别使用深度学习方法进行人脸识别,与以前相比,训练数据大幅增加,从而提高了识别精度。

当用户数据大幅增加时,同一算法的识别精度也迅速提高。当我使用大量的计算和中央处理器时。性能也迅速提高。所以这再次证明了数据本身可能比算法更重要这一点。或者,如果没有这么多数据,就不可能想象一个深层的神经网络。

最难做的事情是在中国人手中提高。世界上没有一个地方的中国有如此多的相机、头像和身份证照片构成了中国的优势。今天不是2亿张照片,而是数十亿张照片和数亿贴有标签的人。只有当你有了大量的数据之后,你才能使用深层神经网络来提取这些内容和信息。

今天的人脸识别公司已经远远超过了人眼识别率,是世界领先的公司之一。当您将照片与数据库进行比较,并查看此人是否是您时,精确度达到了10,000倍的误差。基本上,有了相机和算法,在中国最好不要做任何坏事,即使你在汽车加油站的错误位置拍了一张手的照片,照片很快就会展开,识别精度也会非常准确。

一年多前,微软亚洲研究院的孙健带领团队使用152层神经网络来制作一种超过人类图像识别精度的算法。我想再次向您证实,当我们模型的复杂性刚刚开始增加时,从8层增加到152层,我们看到计算量的增加和训练数据的持续增加。在2012年建立8层神经网络时,有65万多个相应的神经元和6亿多个连接。由于新算法,152层网络中的神经元数量达到了2200万,但参数调整更精确,因为它的连接可以看到113亿个,我们大脑中神经元的突触连接应该是1000亿个。

人工智能的进步在很大程度上是从传统的建模和规则制定到今天对数据机器学习的依赖的根本改变。这种变化正是因为我们今天有了数据,覆盖面越来越好,准确性也越来越高,所以我们对模型的依赖性越来越小,甚至更复杂的模型都有足够的数据训练。

过去传统人工智能算法或神经网络不能达到今天精度的原因很大程度上是因为我们没有很好的数据,因此依赖于一些模型和一些算法。今天,当我们在很大程度上覆盖了整个模板空间时,我们的数据是如此之大,以至于我们今天很好地解决了原来非常困难的问题。

不同算法的性能将随着数据量的变化而变化。当数据量增加时,其准确性也在迅速提高。但是你可能会问一个问题,是不是因为我们现在有足够的数据让我们的人工智能可以覆盖所有的场景?特斯拉第一次伤人事件发生在去年,这表明尽管特斯拉每天有数十万辆汽车在路上行驶,但数据仍然不够,仍然有一些致命事故的案例。

如果从事数据库工作的人不认识吉姆格雷,他基本上不应该告诉别人他从事数据库工作。十多年前,吉姆格雷提出了四种不同的人类研究范式。过去最早的模型纯粹是基于观察和实验,一百年前的理论模型,几十年前开始的计算模型,以及今天由数据驱动的模型。在过去十年里,大数据发展非常迅速。大数据已经开始在企业中大规模使用。

一家美国咨询公司调查了300家拥有3000多名员工的公司,基本上60%的信息技术公司都在使用大数据,只是说使用程度不同。最早的方法是计算发生了什么,然后分析发生了什么,并预测今天将如何发生。在未来,大数据将为什么样的决策是一个好的商业决策提供洞察力,进一步的理解将付诸实践,即自学的能力。

像英特尔这样的老牌公司今天疯狂地收购人工智能或数据创建公司。例如,两个月前,它以天价收购了以色列公司美孚国际。原因很简单。英特尔认为汽车实际上是能够在人类生活中产生大量数据的设备。这些数据可以帮助数据用户描绘人物和判断一些商业应用。所有这些生产和加工过程都由英特尔控制,这意味着它控制着另一个新平台。这就是英特尔在这方面投入如此多资金的原因。

完成了计算和大数据。回到开始提到的算法的进展。

深度学习的基本原理

大数据驱动的深度学习方法是机器独立学习;

第三波深度学习的特点:大数据强计算的新算法。

人工智能已经工作了60年,终于迎来了第三次浪潮,这似乎比前两次浪潮更加暴力,解决了比以前更多的问题。我们使用的深度学习方法与传统的专家系统方法有很大的不同,这一点非常重要。专家系统的方法是人们总结规则,然后把规则交给机器,机器开始使用规则来面对使用场景。在深度学习中,大数据推动机器学习。优点是机器本身具有学习能力,因此可以很容易地从一个应用程序扩展到另一个应用程序。

过去十年正是深入学习快速发展的十年。韩丁在2006年的《自然》杂志上发表了一篇文章,标志着“深度学习”这个词的诞生。随着2010年大数据的爆发,深度学习的热潮开始兴起。2012年,韩丁的团队凭借有线电视新闻网(CNN model)以10个百分点的优势获得年度竞赛冠军,超过第二名。在2016年的AlphaGo,人们对深度学习的能力毫不怀疑。深度学习将改变人类。这是一个新时代的到来。

深度学习,到底是什么?神经网络的问题实际上始于第二次浪潮(20世纪80-90年代),已经被每个人所使用。在20世纪80-90年代初,神经网络的扩散是一片混乱。当时没有足够的数据,即输入层、输入层和隐藏层。另一个根本性的变化是今天的设备和速度如此强大。

为什么深度学习的方法不同?首先,最初的原理是神经网络,它类似于大脑的思维原理。人脑有大约1000亿个神经元,这些神经元之间有超过100万亿个连接。神经元数和连接数是人类智力的非常重要的标志。一个特定的神经元有一个细胞核和一个突触链。我们根据这个原理模拟神经元。并将它连接到其他神经元。在一个非线性函数之后,它被转换成一个输出。输出信号是您需要的结果。当有更多的神经元或更多的层时,显然需要更多的训练数据。

为什么大数据实际上是深度学习的驱动力?在过去,通过使用物理模拟机器制造如此复杂的神经元,不可能制造1亿个神经元和1000亿个连接。但是今天我们可以用电脑来做。深度学习是什么意思?非常简单,深度学习是一个多层的神经网络。每次训练,你都会输出一系列数据。当实际输出和目标函数之间存在一定的差距时,该差距被反馈给训练。这是整个周期。“人工智能”的发展和影响:“人工智能”的应用和未来:帮助人,替代人,超越人;

机器将在未来社会创造90%的闲人,但机器不能取代资本家、艺术家和工匠;

机器的感知能力超过人类,但认知能力还需要5-10年。

经过深入研究,我们可以想象当神经网络增加到152层时,它的复杂性将会如何增加。这种增长使得今天的人工智能,今天的机器学习,不仅可以帮助人,而且将在很大程度上取代人,并在未来很大程度上超越我们。也许这是我们今天不愿意接受的。

人工智能将在未来超越我们。它究竟超过了多少?事实上,让我们想象人工智能可以做许多人类今天可以做的事情。原因是什么?人类能像阿尔法狗一样每晚玩一百万个游戏吗?你能像收集数百辆汽车的测试员一样收集数据并同时学习吗?这是做不到的。同样,今天人类不可能同时处理来自全国各地火车站和机场的数据,也就是说,你无法与规模相匹配。

人工智能取代和超越人类只是时间问题。不仅如此,机器学习在某些场景中比人做得更好,因为人们可以通过观察和思考来判断事物,人工智能通过学习可以比你做得更快。阿尔法围棋(AlphaGo)充分证明了围棋中人们已经被人工智能打败了。

投资决策、政策、规划和战争沙盘演绎主要基于经验。从AlphaGo今天开始,人工智能将在这些场景中超越人类,因为机器本身的自学习能力已经非常强大。驾驶、滑雪、绘画和拉小提琴等不能通过阅读手册来学习的东西,人工智能也已经超越了人类。事实上,人工智能

在前一段中,阿尔法围棋(AlphaGo)以未公开的名字与人类下棋。输了之后,世界头号选手柯杰哀叹人类3000年的围棋文化只触及了围棋的皮毛。我们过去常玩围棋。人类的思维实际上只看到了局部最优解。不可能翻过山去看它,但是阿尔法狗可以看到山的那边有山。它学这个是因为它的数据处理能力比我们强。人类再也不会赢得阿尔法围棋了。这是残酷的现实。

举一个微软研究院的例子。在本例中,当机器看到停车标志时,它将描述它在城市边缘有这样一个标志,带有红色、柱状、交通相关和其他标签。该系统希望阅读图片和讲故事,而不是阅读图片和阅读,而是阅读图片和讲故事。

这是另一个例子:这张照片显示一个女人在厨房准备食物。第一个描述是一个女人在厨房准备食物。第二个描述显示一名妇女正在厨房水槽准备午餐或早餐。第一个是机器科学,机器已经超越了人类。你可以说这个人不会讲故事,但至少机器能讲比他更好的故事。当然,这仍是一个探索阶段。

据说考古学家在人工智能浪潮下是最安全的。然而,这个社会的考古学家不需要太多,他们的薪水也不会太高。男人害怕进入错误的行业,而女人害怕嫁给错误的丈夫。有了这些变化,未来哪些工作将被人工智能取代,社会将会是什么样?

全球化是找到世界上最便宜的方式来完成某项制造的过程。因此,全球化导致了两个层次的分化,即跨国企业效率的不断提高和包括美国在内的发达国家蓝领工人的失业。人工智能会加剧这一趋势吗?

未来可能有两种人,一种叫做上帝,另一种叫做闲人。问题是90%以上的人都是闲散的人。我该怎么办?事实上,一位来自瑞士的议员去年提议,不管一个人是否工作,他都应该先付3000法郎,然后再付另一个人工作的钱。瑞士人仍然相对平静,公投没有通过。在未来,只有三种人能够对抗人工智能。资本家不会有问题。未来仍需要资本运营。此外,艺术家和工匠暂时无法学习这些技能。当然,大多数人很难做到这三种人。

人工智能的局限性是什么?强人工智能(g AI)还有很长的路要走。机器在感知方面已经超越了人类,但是认知可能还有5-10年甚至更长的时间。

深入学习的方式有什么问题吗?事实上,有一个大问题。事实上,这是一个由人们自己制造的问题。人工智能或机器智能是通过观察经验来学习的机器。机器本身可以自己编程。程序员不再需要编写命令来解决问题,而是程序根据样本数据和预期输出生成自己的算法。

今天,我们已经在许多领域朝着这些目标前进。第一种情况,如Nvidia无人驾驶汽车,不依赖程序员的指令。它完全取决于观察人们的行为和观察人们的驾驶行为来决定他们的驾驶方法。在第二个案例中,纽约的一家医院开发了一个名为深度病人的系统。医院只给了它70万个病例。然后系统从70万例病例中学习,通过数据发现规则,总结出非常强的疾病预测能力,特别是对精神分裂症的预测能力,远远超过医生的预测能力。在第三种情况下,美国军方在机器学习、瞄准车辆和飞机导航以及从大量数据中挖掘出一些恐怖信息方面投入了大量资金,这远远超出了人们最初的预期。深入研究已经有了这样的能力,但是深入研究仍然不能解释它自己的行为。还是黑盒?

人类历史上从未创造过这样的机器。甚至人类也不能完全理解它的行为和判断。今天,我们创造了一个深度学习机器,它不能判断和解释自己的行为,这就是为什么我们今天感到不舒服。相反,人们会问自己,我们自己做了很多判断。我们能解释我们为什么这么做吗?然而,人类可以容忍自己的这种情况,但不能容忍这种情况

当然,未来必然意味着人们需要不断与机器合作。我们看到了从动物到人类的进化。事实上,智能进化的本质特征是进化成一个连造物主都无法解释的系统。今天,我不能保证上帝理解我们今天做的这么多事情。出于这种恐惧,研究人员已经开始进行一些分析,试图理解或跟踪决策过程。

最终目标,机器和人有什么区别?

它来得比你快,比你大,有些能力比你强。它和人类有什么不同?

生存本能,对死亡的恐惧,是机器所没有的,定义了人和机器之间的根本区别。人类和动物的进化速度,一系列的生存本能,会被撞击和奔跑,避免痛苦,会吃颜色,会有归属感。人类做坏事是因为他们害怕死亡和渴望。到目前为止,机器本身没有感觉,因为它不怕死。难道不能说它是没有感情的智慧吗?这是一个宗教问题,不是科学问题。

完成机器学习后,让我们就此打住。我的时间到了,让我们来谈谈人工智能投资判断。

5

人工智能投资机会和陷阱

在判断人工智能投资时,产业链包括:基础、技术和应用;

基金会由巨人控制,一些公司能否在技术层面上脱颖而出仍是个疑问。

应用层正在寻找能够产生大量数据的行业。

过去的经验也告诉我们,在每一波技术浪潮中都会有一些平台公司。当我们谈论人工智能投资时,我们到底投资什么?正如我们谈到个人电脑投资和互联网投资一样,我们也谈到了生态链。

在判断人工智能投资时,产业链包括基础、技术和应用。地基已经被巨人控制了。基础层有两大块:基本计算能力和数据。谷歌和微软,包括中国的百度,已经提供了作为SaaS服务的基本计算能力。技术能成为没有数据的平台吗?在SaaS,它不是一个普通的SaaS。也许有些公司可以在SaaS上市申请?这也是一个非常大的问号。

在应用层,人工智能实际上是人工智能的场景。这是一个提高生产力的工具,将使所有以前的应用程序更加有效。当然,你需要找到更容易突破的东西。显然,这个拥有大量资金和数据的行业是发挥其作用的第一站。因此,我们需要弄清楚这个行业是否产生了大量的数据,这些数据是否能够不断扩展和创造价值,从而使我们能够改变这个行业的原始生态。

如果最后一波是互联网,这一波就是人工智能。每个人都应该注意人工智能和互联网的区别。简而言之,可以说在人工智能发展了一年多之后,我们发现它实际上是智能。人工智能技术从垂直方向开始推动。因为技术本身发展得太快,而互联网是一种商业模式创新和全新的应用,赢家通吃可能在人工智能中不起作用。

根据这个观察,我们可以看看今天人工智能的投资情况。人工智能今天显然有很多泡沫。我认为最大的泡沫出现在估值公司。当你去和一个公司谈话时,每个公司都说我是人工智能公司。这真的取决于公司是否是人工智能公司,更重要的是,它需要数据。持续拥有数据是我们的核心,它可以持续获取数据。

今天的头条显示,这家公司能够站稳脚跟并在过去五年突然出现的根本原因之一是对信息的巨大需求。当人工智能开始被使用时,今天的头条很快占据了高地。这是第一个通过搜索进行新闻推荐的网站。因此,该系统本身就是一个大的学习网络,它使得今天的推荐能力能够不断发展和增强,从而在此基础上突破了核心能力。我们完全可以预测,今天的头条是未来的超级智能系统。同样,我们可以看到它的数据量如此之大,以至于远远超过了今天的图像、论坛和现场直播的初始文本。它实际上拥有的是越来越多的数据。

最后,人工智能的投资。如果你记得我刚才说的话,有三个投资点。第一是“智力”,这是所有公司都应该具备的能力,而这种能力是其核心竞争力。第二,

人才和数据是核心,投票算法本身就是投票。我之前提到过,深度学习的训练需要人们理解和掌握这种算法的训练技巧,对于理解算法也理解应用的人来说是非常有价值的。此外,数据实际上是人工智能的最后一道护城河。

最后,我想告诉你,人工智能领域有很多中国人才。高盛(Goldman Sachs)的一份人工智能报告指出,在过去的五年里,与神经网络和机器学习相关的文章中,中国作者的数量已经超过美国,并且还在继续增长。在引用的文章中,中国作者的数量也超过了美国,并且还在继续增长。所以至少我们在这个地方有很多中国人,当人数增加时,自然会有强壮的人。中国人才不错。

此外,中国的数据非常庞大。换句话说,中国有人才和数据。因此,人工智能必须成为中国创新和投资的新希望。谢谢大家。

友情链接:
大海环农业网 版权所有© www.365fd.com.cn 技术支持:大海环农业网 | 网站地图