AI创新平台它与BAT齐名

来源:bob体肓官网入口
发布时间:2023-12-18 23:08:20

...

  BAT ,中国互联网公司三巨头,在中国互联网发展的20多年的时代下,不断壮大,引领了中国信息产业,走到了世界的前列。

  如今,人工智能正以前所未有的速度掀起新一轮科技的浪潮,继7月份国务院印发《新一代AI发展规划》,将AI发展上升为国家战略,11月15日,《新一代AI发展规划》暨重大科技项目在京启动,会上公布了首批共四家国家人工智能开放创新平台名单,有一家公司和BAT比肩齐名,名列其中,它就是科大讯飞。

  为了抓住历史机遇, 抢占人工智能的制高点,实现第四次工业革命的弯道超车,战斗即将正式打响了。而在这场战斗中,BAT+科大讯飞将是开路先锋!

  1、颠覆来临,无人汽车线日,一年一度的百度世界大会正式召开!不同以往的是,这次不再是预想概念,而是直接上货!

  今年4月19日,百度就正式发布了“Apollo(阿波罗)计划”!该计划全面开放,向汽车行业以及自动驾驶领域的合作伙伴提供一个完整、安全的平台,帮助他们结合车辆和硬件系统,快速打造出一套属于自己的完整的自动驾驶系统。截止目前,有6000多个开发者在投票支持Apollo项目;有1700多家合作伙伴使用了Apollo的开源代码;还有100多个合作伙伴申请开放数据。

  阿里云ET城市大脑是目前全球最大规模的人工智能公共系统,可以对整个城市进行全局实时分析。目前ET城市大脑已经在杭州、苏州等地落地。

  杭州城市大脑接管了杭州128个信号灯路口,试点区域通行时间减少15.3%,高架道路出行时间节省4.6分钟。在主城区,城市大脑日均事件报警500次以上,准确率达92%;在萧山,120救护车到达现场时间缩短一半。

  通过AI技术,癌症的早期筛查变得更加精准!8月初,腾讯发布了一款AI医学影像产品——腾讯觅影。

  腾讯觅影是首款AI食管癌筛查系统,准确率超过90%;在肺结节方面,觅影可以检测出3毫米及以上的微小结节,检测准确率超过95%。未来腾讯觅影将与医学院和医疗结构合作助力更多病种检测。可以有效辅助医生发现癌变征兆,将病魔遏制在摇篮里。

  承担着建设智能语音开放平台的科大讯飞,又有何能耐可以比肩BAT,担负起国家AI发展战略的重任呢?

  上世纪90年代, 国内语音分为“南北二王”,“南”指的是中国科技大学的王仁华教授;“北”则是清华大学的王作英教授。刘庆峰正是在这一段时期被选中加入了王仁华教授的人机语音通信实验室,并牵头做一个语音合成系统,该系统不但保证了音质,还具备了优良的语音自然度,合成的语句近乎“人声”,成为1998年国家“863计划”成果比赛中最为轰动的科研成果。同年,IBM发布了语音系统,首次靠说话就能让电脑完成指令,被评为当年科技界十件大事之一。

  创业之初,刘庆峰对于科大讯飞的定位是开发面向大众消费市场的产品。很快,一款名叫“畅言2000”的电脑软件问世,这是一款针对 PC 的软件,通过语音既可以有指令的操作,又可以有文本输入,第一次把手写输入的随意性和语音输入的快速性无缝整合在一起。

  在总结畅言2000失败的时侯,科大讯飞悟出几点:一是盗版猖獗,科大讯飞正版软件刚一面世,盗版已经铺天盖地;二是因为大部分用户是老年人,操作电脑的能力很差,时常因为电脑本身的硬件问题呼叫售后服务,这推高了科大讯飞的经营成本;三是因为团队都是技术出身,缺乏建渠道做市场推广的营销经验;四是PC 已经比较好地解决了人机交互的问题,对语音的需求没那么迫切。

  与华为的合作模式的成功令科大讯飞在市场得到认可,中兴和联想在内的50多个企业也很快成为其合作伙伴,也吸引联想投资和英特尔在内的三家有名的公司相继入股。投资方在资金、资源和经验上的助推,将科大讯飞推向了产业化的快车道。终于,在经过5年的亏损后,科大讯飞在2004年首次扭亏为盈,次年语音产品实现出售的收益1.5亿元,利税2500万元,带动相关产业10亿元以上,推动语音产业进入全方面爆发阶段。

  人工智能是以以深度神经网络为基础,加上大数据、云计算后台的运算平台,和移动互联网源源不断地把各种训练数据收到后台。科大讯飞是中国第一个把深度神经网络用到语音识别领域的公司,并且在 2011年, 在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。在2012 年,在图像识别领域,深度神经网络开始异军突起,接着 2014 年机器翻译取得突破。

  今年,在全球的语音合成大赛暴风雪竞赛中,科大讯飞再次获得全球第一名。今年的国际比赛比的是英语合成,而且是英语的故事级合成,也就是要求系统更加深情并茂,难度更大。但是,在今年一堆的国际的顶尖研究机构和产业界全部参加的前提下(因为 IBM 在今年年初就认为人际交互接口会是 2016 年十大技术突破的前 3 名,所以语音合成也是受到了前所未有的关注),科大讯飞再次在英文领域获得全球第一名,而且不仅是全球第一,更是全世界唯一把英语合成做到了超过普通人说话水平的技术!

  在国际比赛中,5 分是播音员的水平,4 分是普通人的说线 分。也就是说,全世界,让计算机念小说风格、故事风格的语音合成,只有中国人做的超过了普通人的水平。而且,这已经不是第一年,科大讯飞已经连续 11 年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印度的印地语,照样是全球第一,是 3.9 分。 今年的中文,科大讯飞已经做到了 4.5 分。 当前的中文、英文、印地语的第一名都是科大讯飞所代表的中国做出来的,这在某种程度上预示着我们中国用户享受了全球语音合成最高的成果。

  在语音合成的进展上,我们再看一下语音识别。 在去年 12 月 21 号发布会上,科大讯飞是全球第一次,敢于在几千人的演讲现场同步把语音自动转成文字,而且现场机器跟人的对比根据结果得出,机器在转写准确率上大大超过了专业速记人员。

  伴随着语音转写,讯飞又发布了万物互联时代最重要的人机交互的几个关键的特征:可以在 3 到 5 米,5 到 8 米之外,用于语音跟机器人跟智能家居交流,可以多轮对话上下文可以随时随地打断。通过这一些特征,讯飞定义了万物互联时代的语音交互标准,并且推出了 AIUI 人工智能的人机交互平台。该平台当时以叮咚音响为代表,不光可以听音乐,还能控制所有家居。

  国际上有一个非常著名的语音识别竞赛 Chime,就是在噪音口音和多人情况下进行比赛。这个比赛今年是在谷歌举行的,科大讯飞在所有 3 项指标中都是全球第一名。而且,我们大家可以看到这个数据指标网站,6 麦克风,这最难的这个麦克风场合下,准确率已经可以做到 97% 以上。 这不是中文,而是英文的在谷歌做的国际比赛结果:在噪音环境下科大讯飞的错误率只有 2.24%。

  在机器翻译领域,2014 年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展。在 2014 年国际口语翻译大赛( IWSLT)中, 获得了全球第一,这是具有历史意义的。因为以前国际翻译大赛,汉英翻译项目都是日本研究机构全球第一,英汉翻译项目都是美国机构全球第一,2014 年 11 月的这次比赛,终结了这个历史:科大讯飞英汉和汉英都是全球第一名。

  在这基础上,2015 年 2 月,美国国家标准技术研究院组织的机器翻译大赛中讯飞继续是全球第一。今年,科大讯飞又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译。 这一切,我觉得都是真正的在践行科大讯飞创业之初的理念:我们要实现人类乃至人机信息沟通无障碍。在未来,我们要把世界所有主要语种全部放进去。

  人工智能有 3 个层次:计算智能(机器人能计算和存储)、感知智能(机器的视觉、听觉可以超过人工)和认知智能(未来的核心)。而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是皇冠上的明珠的认知计算领域,又取得了令全球瞩目成果,我们在今年参加国际非常知名的 Winogard 的认知智能的测试,这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关,这就是看机器真正的认知结果。

  在这些创新的基础上,讯飞在跟教育部考试中心合作,在事关国家教育未来的考试阅卷中(保证主观题的评分要达到公平公正性),机器已经在今年上海的四六级考试,在江苏、湖南等地的高考和研究生考试中对学生的语文和英语作文判分。机器学习了 500 份专家判分的卷子,就可以对其它几十万份卷子进行判分,其综合效能已经超过人工水平。

  科大讯飞在去年发布会上把平台开放给所有创业者以来,我们能够正常的看到一些令人鼓舞的数据进展。

  既然被称为A股人工智能第一股,并且在很多细致划分领域与国际巨头比肩,科大讯飞在智能语音领域的技术实力18年的技术积累,应该非一朝一夕能被超越的。多个方面数据显示,目前科大讯飞已经占到了语音识别市场60%以上的市场占有率,语音识别技术在多项比赛中多次蝉联第一,对标的企业是国际上的谷歌、微软、亚马逊这些巨头,技术上或许压根没把BAT放在眼里。

  就在百度DuerOS在全国范围内向开发者投出橄榄枝后,今年10月24日,科大讯飞又举办了有史以来顶级规模的首次开发者大会,拿出了10.24亿元基金扶持开发者。某一些程度上,这是科大讯飞维护自身智能语音生态吸引力的“防护”举措。既是实质性动作,又表明了一个态度——不会任由BAT切割走开发者的市场和人群。

  智能语音技术确实存在准入门槛。虽说当前科大讯飞的技术领先性依然存在,但互联网多年来的竞争事实表明,技术的差异性和差距已经越来越小了。更何况,BAT根本不缺钱,完全能请得起大牛的专家,也有足够多的资金可以砸向市场,甚至还能买成熟的技术或公司。

  一是,BAT每一家手里都有强势的产品,每一个产品和入口都是智能语音的关键应用场景,比如百度的搜索和携程的订票订酒店,腾讯的QQ、微信两大入口及延伸出来的开放服务平台,还有当二股东后所能控制的滴滴、摩拜、美团点评、京东等外围援手,阿里的淘宝、天猫、支付宝、优酷、虾米音乐等产品矩阵。这些都是BAT碗里的,也是科大讯飞动不了的奶酪。

  二是,虽然科大讯飞在智能语音技术上要比BAT更成熟,使用者真实的体验更好,但这要看是个什么玩法,一旦到了开放平台和生态的场子里,无论是拼钱、拼资源、拼开发者的号召力和控制力,科大讯飞恐怕都占不到便宜。因为BAT这么多年,最大的势能就在流量生态和资源整合上。过去可能是站长联盟、APP联盟,如今到了智能语音的赛道上,其实玩法大同小异,只需要迁移一下就过来了。

  那么问题来了,既然麻烦很大,后果很严重,面对BAT扔过来的降维攻击,科大讯飞究竟怎么样应对呢?到底该怎么破呢?

  在上述这些领域,科大讯飞有先入为主的优势。科大讯飞发布的2017年上半年财报多个方面数据显示,其营收中有29.65%来自于教育类行业产品,公司中有三分之一的技术投入到了教育产品研制领域,教育相关联的费用同比增长了21.27%。此外司法、医疗、车载等几个关键领域,也是科大讯飞智能语音技术应用的重要赛道。科大讯飞只要守好“大门”,将护城河越挖越深,BAT的战火就殃及不到这里,让科大讯飞可以守好产粮区。

  刘庆峰在朋友圈说了一段意味深长的话,“人工智能+时代,不仅是属于科大讯飞的时代,更是属于AI领域万千开发者和科学家的新时代。这里空间广阔,完全容纳得下千帆竞发的产业生态。”