两年前的10月24日,科大讯飞在安徽合肥举办了第一届开发者节。那天是刚刚退去夏日余热的南边稀有的天高气爽的日子,或许也是程序员在一年之中仅有得到特别关怀的日子。可是讯飞的程序员没的歇息,由于那天有他们一年之中最重要的一场大会,在这场大会上讯飞初次推出了“1024计划”。
不只那个“程序员日”没的歇息,今后的两年也是相同。2019年10月24日,这场大会第三次到来,“1024计划”也更新到了3.0版别。
2017年的“1024计划”成为了后来两年讯飞开展的一个首要方向:将AI与教引、生态、公益相结合,意图在于教导、赋能开发者。2019年的3.0版别思路相同,只不过服务的方针更多了,才能也变强了。
科大讯飞轮值总裁胡郁介绍,教引、生态、公益这三个方向没变,但要“做大做强”,比方建立讯飞AI大学、AI开发者大赛;打造才能星云、iFLYOS & AIoT、解决计划三大生态产品矩阵;推行AI公益的方言维护计划、为助残使用供给免费AI技能服务等等。
关于“做大”,现在现已有了一些成果:AI大学已具有超越31万学员,讯飞敞开渠道已供给267项AI才能及计划;方言维护计划已招引700万人参加,联合超越100家协作伙伴,掩盖10大方言区。
关于“做强”,则要杂乱得多。
从硬件上来说,本年5月,科大讯飞一口气发布了五款硬件产品,包含翻译机、智能录音笔、转写机、
讯飞智能工作本 图片来历:讯飞官网
和学习机,能满意录音、转写、笔记、翻译等各种要求,语音通用辨认率到达98%以上,中英混合情况下英文辨认率到达90%以上。
从软件上来说,则是能够为教育、医疗、司法、车载等使用场景供给更多服务了,并且AloT操作体系iFLYOS也得到了晋级,让AI才能接入更快捷。
别的,值得一提的是,本月被美国列入交易控制黑名单的科大讯飞也开端做芯片了。本年的1024开发者节上,它宣告联合穹天科技一起推出家电专用语音芯片CSK400X系列。
“尽管咱们科大讯飞不是做芯片身世的,但咱们会将咱们的中心技能与当时最干流的芯片进行协作。”胡郁说,“信任咱们立刻就能够领略到科大讯飞芯片+人工智能愈加强壮的威力。”
一些新的技能
一个男人走上台来,向观众问候,音响里却传出了女主持人的声响。这样一个小小的惊喜暂时地将许多睡意昏眩的人从满是专业术语的午后会场解救了出来。
带来这个惊喜的人是科大讯飞AI研究院常务副院长刘聪。他戴着一个“变声领夹”,能够用来仿照某个特定的人说话的音色,就像柯南的蝴蝶领带相同。这背面是讯飞的语音组成技能。
为了进一步展现这一技能,他展现了一段疑似罗振宇的语音,请观众猜想是机器组成仍是真人录音——实际上是前半机器,后半真人。以36氪作者现场观摩的体会来看,的确难辨真假,并且听不出联接痕迹。
其实高德地图的林志玲语音、郭德纲语音也都建立在这个技能之上,但刘聪此次所展现的“实时模仿特定人声功用”明显要精进得多。别的一个或许让你坐不住的“新闻”是,央视纪录片的专用配音员李易现已在六年前逝世,但讯飞运用这一技能重现了他的声响,并用在了本年新一期的《立异我国》纪录片里。
好像人工智能吓到人类的其他几个时刻,这个技能的展现进程让人难忘。更让人难忘的是,刘聪宣告这一技能将会被敞开给第三方开发者。
Google、微柔和百度更早前现已纷繁推出了会模仿人声打电话的机器人,它们曾招来一起的疑问:这种技能会不会被用于欺诈或恶作剧?比较长辈,讯飞的新技能看起来好像更风险。
刘聪解说说,讯飞会慎重敞开这一功用。“咱们会挑选牢靠的to B的协作伙伴进行敞开,以防止技能经过某些不合适的方法被使用。它必需要满意阳光健康、行善积德的价值。”
当然,也有一些不那么“吓人”的技能,比方讯飞机器阅览理解才能的前进。据刘聪介绍,体现在教育使用上,讯飞现已能够从本来的单科常识引荐,开展到数理化英的常识引荐,并且用户满意度到达90%。体现在医疗使用上,则是从辅佐确诊常见病,开展到了稀有病、危重病,可掩盖900多个医种,并且在难度添加的情况下,准确率还能到达60%以上。
以及,讯飞不是那么中心的图画辨认技能也有了前进。在本次大会的入口处,摆放了讯飞自研的“X光安检机”。据刘聪介绍,科大讯飞为X光安检图画的方针检测专门研制了一套新式检测技能,体系辨认率可达90%,能够辨认各类可疑液体、易燃易爆物品、各类刀具、枪支等29种、50多类违禁品。
两个新的渠道
尽管程序员日程序员也要上班,但开发者节真的需要给开发者一些优点。本年开发者节上的好消息是,第三方开发者们能够在讯飞敞开渠道上接触到这些新技能了,现在才能星云上现已有200多种技能。
除此之外,科大讯飞对敞开渠道做了“人性化调整”,给开发者留了更多自由空间。“我知道有些开发者有技能情结,期望用自己的双手做出适用于自己场景的声响。所以咱们现在也能够独自敞开咱们的音库并支撑高精度的标示。”刘聪说,开发者能够根据标示的音库去用自己的算法,乃至找其他家的服务去完成自己的体系。
别的,科大讯飞推出了“归云渠道”,让开发者能够“用简洁的方法进行各种才能的组合”。
这是什么意思?刘聪解说说,咱们都觉得翻译机的翻译速度比翻译软件好,是由于它在本地总共调用了三次才能:语音辨认+机器人翻译+语音组成。而假如你在软件客户端上进行了这三次调用,时刻本钱就会大大提高。
未来在归云渠道上,能够把三次调用所需的才能组合在一起,一次用一个一致接口就能够解决问题,也不必关怀才能之间协议数据兼容的问题。
“换句话说,根据这样一个才能,只需你满意牛,你也是十分有期望能做出类似于语音翻译机这样的网红产品的。”刘聪说。
当然这里边也有一个问题——讯飞自家就在做To C的硬件产品,这关于与讯飞有竞赛联系的开发者来说又是个心理障碍。
关于这种疑问,胡郁在答记者问时解说说,首要,科大讯飞的硬件产品有很大一部分是与海尔、华为等企业协作推出的,并不是直接面向顾客的;其次,顾客的需求时多样的,一个产品不能满意一切的用户需求,“讯飞就算是做笔直品类,也不或许把一切的笔直品类都做掉”。
“讯飞有自己的玩具,但咱们也向其他的玩具开发者供给咱们的中心技能,咱们现在在寻求中心的穿插局势。”胡郁说。
最终,程序员的诉求很杂乱,除了归云渠道,还有飞云渠道。
“咱们针对一些有AI研制才能,或许有根底情结的开发者供给了别的一种需求。”刘聪说,有的开发者针对某个问题现已有自己的计划,但不具有隐形化和服务化的才能,飞云渠道能够让这些开发者把他的才能“上传到咱们的云里边,让咱们的云核算渠道去进行服务,保管分布式调度他们的才能,他只用重视自己的这样一些作用功率就能够了。”
归云和飞云渠道都将在近期上线。
大会完毕后不久,科大讯飞发布了新一期财报。布告显现,公司2019年1-9月完成经营收入65.73亿元,同比增加24.41%;归母净利润为3.74亿元,同比增加70.51%;归母扣非净利润为6981.43万元,同比增加183.49%;根本每股收益为0.18元,同比增加63.64%。
这个增速在头部人工智能企业中位居前列。布告称,公司前三季度成绩大幅增加,首要原因系人工智能工业持续开展。2019年前三季度,科大讯飞敞开渠道事务以及涉及到民生开销的教育、医疗等职业坚持了较快增加。
题图/科大讯飞