最专业的手游代练平台源码!

资讯热点
Google Now背后的技术有多黑暗?

发布时间:2023-5-6 分类: 电商动态

不久前,谷歌宣布重组,前Android业务主管,谷歌高级副总裁桑德尔· Pichal成为谷歌新任首席执行官。这一变化似乎引起了对Google Now开发团队的一些不满,引发了所有员工的离职(也称为关键成员的离职),Google Now现已合并到Large Search小组中。 Google Now是针对Apple Siri和Microsoft Cortana的Android平台的语音助手。那么,Google Now是什么?谷歌的黑色技术包含哪些内容?

  Google Now 是什么

虽然本文中的广义Google Now是一套完整的语音搜索应用程序,但Google Now的更精确定义是在手机上打开Goog​​le即时应用后第一个屏幕上显示的智能推荐卡,合适的时间。向您推送正确的信息,例如天气,新闻。 Google即时会“智能”将您需要的信息推送给您,以响应人们在Google搜索输入框中主动输入他们想要的内容。

因此,Google Now通常被称为Google的智能推送技术。

例如,当我在国外时,我可以享受Google Now的便利。例如,酒店由Booking.com(类似于携程)或kayak.com(类似于去哪里)设置机票,确认电子邮件将被发送到作者的Gmail邮箱。谷歌将“聪明地”分析(偷看)这些行程,并在航班即将起飞前几个小时提醒您航班详情和航站楼甚至登机口信息。当您抵达新城市时,您将自动弹出即将到来的酒店的导航路线和联系电话。出国旅游时,Google Now会自动弹出当地货币汇率和祖国时间。它还会仔细记住您家和公司的位置,并及时提醒您家中的交通情况,虽然知道您今晚必须加班是不是很聪明!

  这里再说说Google Now 的诞生

Google Now也是具有传奇色彩的Google 20%Project的产品。谷歌工程师Baris Gultekin 2010年,由于他的个人兴趣,他想用手机上的丰富传感器做一些有趣的事情。这个想法恰逢当时Google Map的负责人Andrew Kirmse。两人在业余时间设置了一个原型,并将其展示给仍在谷歌的Marissa Mayer。

在梅杰的支持下,该团队变得更加强大,并且还为用户通勤和Google日历活动的整合添加了时间预测。事实上,在2012年初,拉里佩奇刚刚要求Android和搜索团队建立类似的东西。因此在Android老板Andy Rubin的支持下,两人加入了Android团队,获得了大量的设计资源,并于2012年首次发布了Google Now。

它已经存在了很多年,现在Google Now已经集成到Google搜索应用中。

最近,一家外国科技网站也传言称Google Now团队已经解散,称所有成员都离开了公司,并且还联系了最近谷歌架构的变化,颇有阴谋论。确实有一些关键成员离开了,但这发生在几个月前,非常正常的人事变动。

作为一款优质产品,Google即将从Android群迁移到搜索群。从技术角度来看,从Big Search小组获取更多技术资源是有益的,这对于早期完成Smart Google的伟大目标非常有利。这是个好消息!

别看这个app界面很简单,只需一个搜索框和一排卡片,里面的技术并不简单。

介绍一下狭窄的Google Now推荐卡,让我们来看看Google Now小应用程序,其中包含许多Google的黑色技术:Google Now卡,热词唤醒(OK Google),语音识别和语义分析。

  首先说下智能推荐

建议的原则是“恰当的时间恰到好处的信息”,这意味着在正确的时间推荐正确的信息。那么如何知道用户真正想要的是什么信息,而不是机器自己提出要求,这个程度需要被压缩。尽管近年来统计机器学习方面已经大规模应用于工业行业,但是如果没有仪表,女性很难成为炊。在无法知道用户信息的前提下,机器学习算法是先进的,无法完成。它太聪明了,所以普通公司将采用规则+机器学习的组合。

从现有产品的角度来看,Google Now推荐的内容也相当保守。

Google可以根据您在某个地点停留的频率猜测您的家庭和工作单位的位置,并在每天的指定时间自动提醒您家中的交通情况。

如前所述,旅行信用卡,酒店预订卡,海外旅行汇率和祖国时间卡。难点不在于推荐算法有多高,而是因为Google可以尝试收集用户生活信息的点点滴滴,并尽可能地向您推荐,而不需要仔细考虑经过深思熟虑的规则。在国外,由于邮件的高人气,谷歌正坐在Gmail上(顺便说一句,Gmail就像Google Now一样诞生,它也诞生于传说中的20%项目),现在谷歌,谷歌利用了时间和地点。 。

  热词唤醒

在Google即时软件的主界面中,向手机大喊“Oh Google”会自动触发语音识别以接受用户语音查询。

热词唤醒是启动语音识别的关键,以便以尽可能低的功耗接受用户的唤醒。

由于麦克风需要连续开启,因此输入音频被计算出来,使CPU无法进入休眠状态,这将严重影响已经非常紧张的手机的电池寿命。

因此,手机上的热词应保持在较高水平。需要考虑的关键点是准确率(当用户呼叫你时,他们可以立即响应,用户在打电话给你时不会听错),并且有能量消耗。热词唤醒不需要像普遍的语音识别那样识别不断变化的自然语言。它只需要识别固定的单词“OK Google”,因此没有必要在算法中采用复杂的传统语音识别,并放弃高层的各种HMM。 ,语言模型,使用简单直接的分类方法,在用户输入语音流中找到“OK Google”字样,简单易用。

当然,有一个例外。几年前,Moto X刚刚问世,即主要的24小时语音唤醒处于待机状态,但人们有两个低功耗芯片,等待用户随时输入语音命令。

  语音识别就不用说了,Google的强项

几年前,基于深度学习的研究论文应用于微软研究院的语音识别,定义了该算法的准确性超越了传统的基于HMM-GMM的语音识别。但谷歌率先将其工业化并将其应用于今年的语音搜索产品。 DNN直接对最原始的音频数据进行语音识别,并且需要大量的训练数据来训练大量的神经网络参数,因此硬件要求也非常高,这正是Google的强项。

经过几年的积累,谷歌的语音识别已经初具规模。值得注意的是,作为Google Now的竞争对手Siri,Siri的语音识别始终采用细微差别技术(细微差别是世界上最大的语音识别提供商,可以理解为迅飞在中国的地位),尽管以前段时间也传播了苹果正在建立自己的语音识别团队的消息。

  语义识别

使用Google即时的应用搜索框,您可以提出一些非常酷的问题。

一些日常生活信息查询,例如从纽约到旧金山的航班,例如未来三天北京的天气,现在是东京时间。这个问答系统涉及自然语言处理的所有方面,并且非常困难。

虽然在学术上,NLP(自然语言处理)在各个领域已经达到了90%以上的准确率,例如语法分析和实体识别。然而,在实际产品情况下,用户的口语表达更加多样化,这将导致模糊性,学术界经常用来评估系统的语言测试集是非常不同的。

此外,问答系统是一系列串联连接的子NLP系统的产物。例如,词性分析的输出可以用作用于解析的输入,并且解析的输出可以用作用于实体识别的输入。在这样的管道系统中,早期错误被传播到管道之后的步骤并被放大。

因此,单个子系统上的小错误最终会被放大,严重影响对用户查询的最终理解。

一般的问答系统将针对当前领域进行专门优化,研究用户最常问的问题,并尽可能依赖规则(甚至正则表达式),并加强用户指导,以减少用户自然的模糊性语言。

谷歌即时语音搜索还支持一些百科全书式的问题,例如谁是现任美国总统,喜马拉雅山的高度是什么,或者中国人口是什么。

毕竟,谷歌是一个搜索起源,坐在互联网上,数千页已经包含“奥巴马是美国的总统”,“中国的人口是13亿”;这样的声明,对于谷歌来说,问题将简化为如何将用户的问题与数千个网页中的句子相匹配,而不仅仅是为了给几十个匹配的网页,这是针对小型手机上的用户体验甚至是手表。影响至关重要。

学术界的一般做法是首先确定用户提出的问题类型(什么?何时?哪个?哪里?等),然后使用信息检索策略首先筛选出一些最相关的问题。用户的问题。然后根据问题类型从候选网页中选择候选网页,直接提取直接回答用户问题的句子。赢得危险! (可以理解为像旧的快乐字典一样的知识测验程序)人类冠军的IBM Watson系统也采用了类似的设计理念。这种方法可以确保以自动化而非人力方式改进问题覆盖,而不是必须招募大量问题编辑来处理越来越多热心人士对Siri的无情保证。

近年来,Google在语义分析和知识映射方面投入了大量资金,我们逐渐将这些技术集成到Google即时和一般搜索中。

因此,Google Now已集成到Big Search组中,获得更多技术支持绝对是一件大事!

« 王思聪收购了域名Pandatv.com,Panda Live的未来是什么? | “独角兽”的新定义:让用户忍受您的产品,直到他们的行为发生变化 »