英国闻名AI公司Emotech 联合华为,在HUAWEI ConNECT 2019全球大会上首发国际第一款多模态AI英语白话教评处理计划,引进多模态AI2.0及深度学习的算法,创始更迫临真人白话教育及真人测评的一同,打破教育规范化壁垒,下降重复性教育本钱,大幅进步白话测评精准度,然后助力教育工业良性开展,缓解教育焦虑、促进教育公正、推进工业可持续性开展。
多模辨认:精准发掘问题实质
经过视频与音频抓取,精确辨认不规范发音并确定原因,使用深度学习掌握发音问题,并实时记载剖析学习发展。
多模反应:规范化与低本钱双赢
下降教育本钱,辅佐教育,AI助教供给规范英音美音发音演示,核算机视觉不时追寻要点强化口型改动,加快口音改善。
多模评测:推翻测评精准度上限
抗噪才能强,不易受环境搅扰,在给定噪音环境下,与单模态产品比较,精确率进步30%以上。
多模纠错:强化学习回忆
个性化一对一纠正发音,沉溺式学习强化回忆,视觉、口型结合用户语音回放,比对正确演示发音及口型,供给更易被人脑回忆的学习进程, 比单一模态有用性进步60%以上。
强抗搅扰才能,多场景适用
传统单一音频途径的输入,对声学噪声灵敏。多模态视音频混合计划针对这一问题,有用进步抗搅扰才能,可以有用进步发音评测体系(PA)、语音辨认( ASR)精确率,将机器评测与辨认才能使用于更多杂乱场景。
视音频混合反应,迫临真人教育
现有技能纯语音和文字的反应,了解误差、功率不高。多模技能供给音视频混合的过错点回放和正确发音示例,如真人教师一对一教育,进步学习功率。
Emotech全球首款多模态AI英语白话测评技能为白话教育及测评供给了推翻性的赋能处理计划。用户读出语句,经过多模态数据捕捉及算法剖析,得到每句话、每个单词、乃至每个音素的发音评分成果。并使用深度学习,在体系库里一对一记载并剖析用户学习进程与改动,供给实时AI测评陈述。核算机视觉的捕捉和比对,为用户供给回放自读视频、观看外教演示视频以及比对,然后了解单薄发音与过错原因,为后续个性化针对教育供给根底与动态参阅。完成AI一对一英语学习。一同,纯语音技能关于安静环境的苛刻要求、杂音形成的了解误差、音轨比对功率低一级杰出问题也被完全推翻。多模态的强抗噪才能,让学习英语更精确与随时。 也能直接助力校园、教师、训练组织处理人力、教师发音水平的现有应战,为更多教育组织供给智能化教育晋级的软、硬件归纳处理计划。
多模态技能
Emotech于2015年在英国伦敦创建,是全球首家致力于多模态与自动交互的AI公司。多模态是传统单一模态(语音、视觉)的晋级性底层技能,整合语音、文字、空间等多重数据与剖析,并结合深度学习,供给更复原人类天然交互的算法与使用。
团队
Emotech调集了全球30余名顶尖人工智能范畴的科学家、工程师和设计师。成员包含来自牛津大学、剑桥大学、伦敦大学学院、帝国理工等尖端院校的优异博士生和博士后。联合国人工智能主席、伦敦大学学院核算机计算学和机器学习中心的总负责人、欧洲最负盛名的核算机学教授John Shawe-Taylor以及被誉为脑神经范畴爱因斯坦的Karl Friston 也受邀成为团队的参谋。
荣誉
Emotech被国际最佳科技媒体 Techcrunch 选为欧洲最佳创业团队,被英国开展署列为伦敦最佳 AI 公司 。旗舰型产品 OLLY 获 4 项 CES 大奖并打破 51 年以来的历史记载。 Emotech在2019年因为抢先的技能、全球软件授权的灵敏商业方法荣获由伦敦市长亲授的首届 London Business Award。创始人庄宏斌当选 2018 英国最佳亚洲科技之星,同年被颁发伦敦最佳华人企业家 。
华为云与Emotech - 共用多模态技能,结合华为云,向全球客户进行 AI 晋级
Emotech创始人庄宏斌与将与英国文化教育协会考试部商场总监荣欣于9月18日下午
1:30-1:45在华为HUAWEI CONNECT全球大会联合共享多模态AI为英语教育带来的改动
袁晶博士
华为云通用AI服务总经理、语音语义立异Lab主任、首席科学家
Emotech在语音和多模态AI方面有先进的技能,华为云具有全栈的AI渠道,并在天然语言处理范畴有深沉的堆集和实践,两边联合研制并取得必定打破,这是个十分好的开始。一同,Emotech对技能的追求和对客户的负责任的情绪跟华为是共同的,Emotech对我国和全球商场都有着深化的研讨和堆集。十分等待咱们的产品可以协助数以千万计的英文学习者,也期望咱们可以一同开辟更宽广的国际商场。在白话评测这个场景做深做厚实后,咱们接下来也会在一些职业中进行多感官归纳使用的探究和测验,一同打造有竞争力的处理计划,为客户发明价值。
John Shawe-Taylor
联合国教科文组织AI主席,伦敦大学学院核算计算与机器学习中心主任
多模态是一种可以接纳来自多种感官体系的信息流后进行处理剖析的技能,然后让人工智能对周围的国际取得更深化,更实在,也更精确的了解。事实上,调用多个感官来构建对国际的认知,添加对事物的了解,是让人类在出世后可以极端快速学习新事物和技能的要害。Emotech奇妙地使用了这个原理,在对话剖析中引进了声响和视觉等多个感官维度,有用地分离了噪音等其他环境搅扰要素,然后大幅进步了语音的质量。我以为这是十分重要的一项技能,也恭喜Emotech可以给教育使用带来这样有用的机器学习方法。