0

    “ALL IN AI”后,百度更新输入法,语音识别技术创新高

    2023.07.22 | admin | 165次围观

    2017年到2018年间,百度放弃了外卖体系的扩张,放弃了团购的横向发展,开始把公司的核心业务归纳到了人工智能,收缩产线后的百度,称得上是一家纯粹的互联网科技公司。百度没有横向扩展影视、也没有涉足游戏。发布的百度地图、百度知道、百度百科、百度输入法等等都是围绕着我们生活,和我们息息相关的产品。在享受着百度提供的科技便利中,百度再次给我们带来了一份惊喜:全新百度输入法业界首发,定义为一款全场景覆盖,全年龄段覆盖的输入法。

    其实现在输入法已经有了不小的进步,像语音输入、语音转文字、甚至斗图,词语联想等等都已经是普遍功能。那么如何在这种普遍创新中,做出突破呢?这就要依靠AI技术来自动识别用户场景了。

    百度输入法有哪些不一样的场景?

    第一,离线语音,说实话语音转文字,困难点有二:①普通话是否标准。②汉语的上下文语义和语境的差异,也会导致相同发音也有不同的汉字。如何解决这两个问题呢?百度对于第一种场景给出的解决方案不是把普通话的识别度提高,而是支持28+种的方言和外国语种。对于第②种,除了把语音转文字的功底做扎实之外,还把语音输入法后端直接接入了百度大脑。我们都知道,百度AI大脑是目前人工领域的识别NO.1,百度在AI学习上,有着搜索引擎这个智能体系,使得新词汇、高频词汇以及冷僻词的识别,有一定的优势。

    基于百度AI输入法解决了以上两种场景,百度又把语音输入搬到了线下。以上的语音识别准确率的提升,就需要借助于百度AI大脑这个大型服务器。一旦局限于网络环境,或者手机的网速,普通输入法的语音识别将大打折扣甚至只能识别一些简单的指令。而百度输入法则通过大数据的算法,把百度的语音识别库缩小存放到本地,要知道,普通的语音库存到本地可能需要上百兆甚至上G的空间,显然是不适合手机软件的,百度则只需要几秒钟就能在4G网络环境下离线好离线语音包。

    第二、升级版的SMLTA模型

    这里我们来从数据上来说一下百度输入法的准确率,在上面介绍的离线语音准确率,高于同行15%的准确率。那么根据识别算法,想要识别准确率高,就需要大量的算法堆叠。但是算法一旦上去,就意味着识别速度变慢,特别离线识别算法,需要依赖的不是百度大脑而是手机的芯片计算能力。百度AI输入法,则通过在前端加入了SMTLA的算法模型关闭百度输入法英文联想,这种模型相当于把语音识别截断为多层注意力,为业界首发。这种算法是前端算法,速度会快,经过实际测评,准确率在98%,只是略低于线上线下结合的模式。

    第三、不同手机软件使用环境的智能预测

    输入法都在提智能预测的概念,市面上目前的输入法能做到的就是,在输入前半段话的时候智能地预测到后半段,这样固然会方便一些。但是只能说这种智能只是“半智能”,真正的智能是像百度输入法一样的,在购物场景和聊天场景中,相同的前半段话,能够预测出来不同的后半段,这才是“真智能”。

    第四、多人语音速记场景

    语音输入法识别声音简单,但是识别声纹就不简单了,同样一个人说方言和普通都是这个人的口音,语音输入法在特定场景中,还存在着纪录不同的人发音的场景。多人会议,往往需要速记,而笔记速度不够,录音又要后期转化为文字耗时较长。百度输入法可以识别不同的人的发音,然后归列出来不同人的对话,以达到速记的目的。另外在办公室使用场景中还有一种轻声识别的场景覆盖,轻声细语就可以被识别成对应的文字。

    第五、炫酷场景覆盖

    手机键盘也能像PC键盘那样做成机械手感,这是很多使用者都“不敢想象”的使用方式。百度就做出来了几个模仿机械键盘样式和手感的皮肤。其中如果你的手机支持线性马达,那么百度也能够在模拟机械键盘上,模拟出线性马达是手感。当然少不了关闭百度输入法英文联想,各种青轴、茶轴等手感体验。

    第六、凌空输入

    VR来了,不知道有没有朋友想过这样的场景,假设未来的某天,我们都戴着VR眼镜或者头盔在玩游戏,如果需要文字输入要怎么操作?百度输入法提前为我们找到了解决方案:凌空输入。百度通过摄像头对手势动作的捕捉,来识别出用户“凌空输入”的文字。这点还是比较新奇的玩法,实现了全感官输入法。

    综合以上来说,全感官输入的百度输入法其实在适合年轻人、办公族之外。还更适合老年人和小孩子,小孩子比较习惯使用语音输入,而老年人不适应小键盘和字母。基于以上创新百度,百度输入法的月活跃度和AI语音使用频次,占据国内输入法的NO.1,值得一提的是,语音输入法的语音识别体验中,百度语音的好评度最高。百度确实用技术做到了,让沟通无障碍。

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    发表评论