趋势网(微博)讯:
不得不说,在创新科技方面,百度还是真舍得花钱的。
自从表明要在人工智能方向发力之后,百度一直动作不断,最近更是投入重金在硅谷建立实验室,并从google挖走了行业顶尖的人工智能专家吴恩达。
人工智能这个领域,一直以来就是争论和话题不断。没有人能否认,人工智能将会在未来为人类社会做出巨大的贡献。然而想要在这个领域有所建树,除了美好的愿望之外,想要做出成果,有三个元素必不可少:人才,资金,和数据链。
对于百度来说,钱自然不是问题。
为了获得行业最顶尖的人才,李厂长找到了吴恩达。(以下为虚拟对话,必不可当真)
“小吴啊?最近工作咋样?”
吴恩达笑笑:“挺好啊,google伙食不错。”
厂长摆摆手,“别提什么伙食了,来我厂吧!大口喝酒,大碗吃肉!”
吴恩达面露难色,“我做的这领域很难啊,需要做很多基础研究工作,花费太高了。。。。。。”
厂长:“哥有钱!”
吴恩达:“我一个人也做不了啊。。。。。”
厂长:“哥有钱!”
吴恩达:“我不想离开美国啊。。。。。。”
厂长:“哥有钱!”
吴恩达:“妥妥的!”
作为计算机深度学习领域的领先学者,离开Google选择百度,吴恩达想必是经过了深思熟虑的。百度通过挖角吴恩达,向整个互联网行业表明了两个态度。
第一,我大百度厂要进军人工智能和计算机深度研究方面不是说着玩玩的。
毋庸置疑,人工智能和计算机深度学习方面,人类目前的水平还处于非常初级的程度。想要实现可以投入实际应用的人工智能,还有很长很长的路要走。在黑灯瞎火的道路上狂奔,是需要巨大的勇气的。尽管未来很光明,目标很美好,然而你却不知道这条路上究竟会遇到什么。在这种情况下,百度就敢拿出巨资在美国成立实验室,厂长的魄力还是很值得人敬佩的。
在目前这个中国概念股普遍低迷的情况下,对投资人说“哥有钱”的意义远远比不上对他们说“哥敢花钱”。百度用硅谷研究院和挖角吴恩达向在这个圈里混的所有围观群众宣布:“哥要花钱了,众位瞧好吧”。
第二,我大百度厂要网罗最牛逼的人才!
毋庸置疑,想要研究人工智能一类的高大上的领域,就必须要有一批高大上的专业人士。除了要投入大笔的资金用于基础建设和实验条件,更重要的是,需要投入大量的人力资源。在如人工智能一类的尖端领域里,谁抢占了最顶尖的人才资源,谁就能在这场马拉松中跑的更远。
厂长无疑是清楚的明白这一点的。为了吸引全世界最顶尖的人才资源,百度把自己的深度学习研究院设在了硅谷,并且计划在2015年年底前达到200人的规模。
作为外行,我无从估计这200人的人力成本大约是多少。但是看到百度5年之内要在这个项目上投入3亿美元的态度上估计,这200人的团队成本无疑已经超过了国内绝大多数互联网公司的研发成本。
挖角吴恩达,我想这仅仅是一个开始。对于有野心,有方向,并且有钱的我大百度厂而言,对于人才的追求和渴望要远远高于对于短期利润的追求。这种不管三七二十一先往牛逼人头上砸钱的精神确实值得国内的互联网公司学习和参考。
钱和人都有了。“百度大脑”的深度学习计划就能够实现了么?
当然还不够,百度还需要另外一个隐含的要素,那就是数据链。
一个普通人,从他降生到这个世界的那一刻开始,他就在通过自身的感觉器官收集着信息,然后通过大脑或其他神经组织做出反应,并留下持续稳定的印象。这一过程就是“学习”。
而对于由计算机组成的数据处理分析平台而言,如何获取到持续,稳定和真实的数据链为“百度大脑”提供学习素材,将会决定“百度大脑”是否可以真正成长为可以被实际应用的人工智能产品。
由此可以推断,百度对于数据链的需求将比现在更大。
持续稳定并且真实的数据链从何处获得呢?
首先自然是依靠百度自身的搜索引擎所带来的海量数据请求。这些数据请求代表了百度用户在宏观层面上的真实信息,通过将特定信息分类并整理,百度大脑将获得一条较为宏观的稳定数据链。比如曾经在电视上出现的“春运地图”就是这种数据链的代表。
当然,单纯依靠互联网搜索所带来的数据链是不足以支撑百度大脑的数据需求的。来自搜索的数据链虽然内容丰富,但是精准不足。对于需要更贴近“人性”的百度大脑深度学习计划而言,对于个体的数据链来源对于百度大脑将会更有意义。因此,对于来自地图的用户数据对于百度大脑来说,也是一条相当稳定的重要的数据链。比如它可以通过对个体的分析,学习到在堵车情况下,人是如何在现实中选择路径的。
第三条数据链将会来自移动端。作为人类个体的物理标记物,来自移动端的数据链将会成为百度大脑最好的行为模式分析样本。通过大数据归类,人们在手机上的各种行为都可成为百度大脑的参考对象,接下来百度大脑也许可以学习到,为什么在我电话联系不到一个人的时候,什么情况下我会发短信,什么时候我会发微信,什么时候我用手机QQ。这条来自于移动端的数据链规模大小将完全取决于百度在移动端的影响力。
还有一条数据链将来自于百度智能家居。通过电视盒子,空气盒子或是其他一些家电产品获得的用户动作数据将会为百度大脑提供“个人人类在小规模社交环境中的行为思维模式”参照以及“小规模群体行为思维模式”参照。借助于此学会诸如“三口之家在看电视问题上谁做主,为什么?”一类的高端思维方式。这条数据链的规模将会取决于百度在智能家居方面的发展速度和深入能力。如果联系到百度不久之前所发布的“baidu inside”计划,其提前为数据链打造渠道的目的就非常明显了。
成功从Google挖到世界顶尖的人工智能专家,我厂的百度大脑之梦可以算是解决了理论基础的问题,走出了关键性的第一步。想要百度大脑最后实现和人类一样的思维,还需要大量的数据链为百度大脑提供学习的素材。尽管百度已经开始在进行图片语音识别一类的基础研究,但是对于更为精确的,以个体或自然小团体为参考样本的数据链将会更加受到重视。百度大脑能否成功,也许成败的关键就在这些看起来毫无意义的行为数据上。