“中国有多少数学家投入到人工智能的基础算法研究中?”中国工程院院士徐匡迪对当下中国人工智能发出了直击核心的提问。不但表明了当下中国AI发展的短板,同时也揭去了披在当下所谓“人工智能”算法外表华丽的面纱。
人工智能是计算机技术发展到高级阶段,融合了数学、统计学、概率、逻辑、伦理等多学科于一身的复杂系统。是当下所有信息技术所不能达到的高级应用。其最为核心的技术便是人工智能算法。如何让计算机能像人类一样进行思考,如同人一样利用现有的知识进行学习并实现合乎逻辑的推理,是人工智能算法试图实现的目标。
其技术绝不是一般公司能够轻轻松松实现的。当下被国际社会公认的人工智能研发顶尖公司,可能就要数GOOGLE和IBM公司。其投入了海量资源,动用了顶尖的数学科学家、计算机专家,能实现了计算机程序的一定程度智能化,距离真正的AI还相差很远。
想不到进入了2018年,中国的人工智能产业真是“忽如一夜春风来,千树万树梨花开”,一下子出现了无数人工智能研发公司,并都号称到得了显著的技术进步。比如基于人工智能的医学图像识别系统,对于某个疾病的识别率高达95%以上,远远高于人工判读。
虚假的繁荣直到徐匡迪之问,被无情的撕破。
有幸了解过国内某大型互联网企业制作的人工智能应用。其定位于利用AI程序判读CT图像,利用算法实现对病灶的判读,提高医生的效率并降低负担。
当我们问到其核心的人工智能算法的时候,企业倒也是直言不讳,其核心技术是使用了国际上开源的人工智能算法。在被引入后进行针对特定目的进行了二次开发,并最后整体打包成为一套完整的人工智能应用 。正是因为使用了开源的人工智能算法,才出现了许多应用明显能力不足的情况。
比如其无法提供一套大一统的应用。公司一共向我们展了大约六种疾病的诊断应用。不同的疾病需要使用对应的AI程序才可以得出相对准确的结果。如果将A疾病的算法使用到B疾病上,完全无法正常工作。就我浅薄的理解,真正人工智能的算法并不应当如些。它应当是一套通用的算法,既可以用于A疾病的诊断,同样也可以用于B疾病。我们需要做的是提供大量疾病案例供AI学习训练,随着训练样本数量的增加,会使人工智能模型被训练的越来越准确。但是这种一个疾病一个AI的方式还是头一次听说。好比一个医生只能看男性长胡子的感冒患者,如果是个不没长胡子的男患者,只能去隔壁就医了。
浙江大学应用数学研究所所长孔德兴教授清清楚楚说明白了这个问题。因为公司使用的都是开源算法。开源人工智能算法能力是不足的,根本无法实现预期的能力。人工智能算法堪称信息行业的核武器。如此威力庞大的算法怎么样可会在网上被开源出来?可以认为开源的人工智能算法相当于玩具水平的东西。想借助这种低水平的算法,来实现真正的人工智能应用怎么可能实现呢?
开源算法唯一好处在于人人都可获得,门槛非常低。所以大量公司从网上下载了开源算法,然后以其为核心研发出一套AI应用,再披上华丽的面纱,唬的普通用户奉若神明。这也在突然间中国出现了如此多的人工智能公司的原因之一吧。
总之等待真正人工智能的到来,还需要很长时间。它的实现也绝不是借助网上共享了的代码就能够实现的,必须要脚踏实地,一步一个脚印地开发出来,不付出努力想投机取巧是万万不能的。
来源:IT工蚁