Google搜索是用户量最大的搜索平台之一,它是如何获得全球81.5%的市场份额的呢?本文作者对这一问题展开思考,提出了一些自己的想法,希望对你有帮助。
您是否认为垃圾邮件应该自动发送到“垃圾邮件”文件夹?或者,当您回复邮件时,您的Gmail如何建议回复?Google搜索系统如何建议查询选项?Google搜索算法如何工作?
从搜索引擎到机器学习第一公司,Google已经走了很长一段路。搜索体验,语言翻译,图像和视频搜索,可预测的单词和短语建议等不断改进,使Google搜索在遥遥领先于竞争对手。
根据ReliableSoft.net的研究,与Bing,Baidu,Yahoo!,Yandex,Ask和DuckDuckGo等其他搜索引擎相比,Google搜索获得了81.5%的市场份额。
这是其搜索算法不断更新,以及对人工智能和机器学习模型进行不断优化的结果。
Google搜索算法融合逻辑、人工智能和机器学习,让每天的搜索体验更好。Google的搜索算法实际上是各种算法的组合,这些算法可以满足不同的目的,并且可以提高整体搜索体验。
受欢迎的Google搜索算法
Google每秒处理40,000多个查询,这意味着每天的搜索量超过35亿!
——互联网实时统计
Google每年都会提供大量更新,在这里,我们将关注一些著名的算法。
熊猫算法:
Google Panda最受欢迎的搜索算法之一,发布于2011年2月11日。本来目的是解决垃圾邮件问题。在Panda发布之前,许多生产低质量内容的公司在搜索结果排名都很高,这些公司被称为“内容农场”。他们的目标是每天生产大量低质量的内容,并在社交平台上进行营销,通过广告系列赚钱。
Panda是一种算法更新,它通过对每个站点进行质量分类来解决此问题。这是一种支持AI的算法,可将劣质内容与高质量内容分离开来,从而使具有高质量和有见识的内容的网站排名更高,从而提供更好,更有用的搜索结果。
企鹅算法:
Google对低劣内容进行处理,也处理黑帽链接构建技术。这是一种在内容中添加了许多低质量的链接的策略,为的是在Google搜索中获得更高的排名。
推出企鹅是为了给具有高质量内容和高质量内链的网页更高的排名,企鹅经过几次调整和刷新,优化了将近3%的搜索结果。自2016年以来,Penguin成为Google核心搜索算法的一部分,并实时运行。
模式检测是一种流行的机器学习技术,它在企鹅算法中扮演着重要角色,因为它允许算法根据低质量属性分离内容。反过来,这又使那些内容应有的排名更高。
蜂鸟算法:
Panda和Penguin是Google搜索算法的次要更新,Hummingbird通过深化人工智能技术将Google搜索提升到一个全新的水平。
蜂鸟具有语义搜索和自然语言处理的功能,可让Google理解搜索查询的意图。
例如,如果您输入“ Michael Shoemaker”,则Google将获取以下结果:
“Shoemaker”显然是错误的拼写,但是,蜂鸟意识到了意图并取得了预期的结果。显然,这意味着语义搜索使Google搜索能够解析意图而不是确切的关键字,语义搜索尝试将SERP与搜索者的语言进行匹配。蜂鸟出现的动机是改善语音搜索或会话搜索。
RankBrain算法:
RankBrain算法是另一个受欢迎的更新,是Google的Hummingbird算法的一部分。RankBrain是一种人工智能算法,可为Google未知的查询获取最佳结果。
假设您在Google搜索中输入“橙色”,现在,关键字“ Orange”可能意味着水果,或者法国电信公司将其命名为“ Orange”。在这种情况下,您将获得混合输出的结果。
RankBrain算法建立在反向传播技术的基础上,该技术是训练人工神经网络的标准方法,它根据从先前迭代获得的错误率来微调神经网络的权重。
对于RankBrain算法,当搜索未知查询时,该算法将为用户获取最佳拟合结果。之后,它会比较用户的满意度,如果满意度很高,则将短语或关键字添加到数据库中。
Google BERT算法:
BERT被认为是十年来Google搜索算法的最大更新,它是一种基于开源神经网络的自然语言处理预训练技术,BERT是变压器双向编码器表示的首字母缩写。这是一种深度学习搜索算法,它执行诸如标记语音部分,识别实体,回答问题等任务,从而帮助Google理解自然语言。
BERT处理诸如实体识别,语音标记的一部分,以及其他自然语言处理过程中的问题解答之类的任务。它可以帮助Google理解网络上的自然语言文本,并提高对自然语言查询或会话查询的语言理解。
BERT处理查询中与单词中所有单词相关的每个单词,而不是一个个处理它们。它对每个单词进行分析,同时保留前后的单词,即,它考虑了句子的整个上下文。这就是将该算法称为双向算法的原因。BERT的最好之处在于它可以从一种语言中学习一些东西,并将其应用于其他算法。
Google搜索算法中的人工智能和机器学习技术
Google已经采用了人工智能和机器学习算法。无论是Gmail,Google地图,Google Ads,YouTube还是Google Play,AI和ML都在其所有服务中占据了相当大的空间。
这两项技术已经大大提升了Google搜索算法以前的工作方式,让我们看看AI和ML帮助Google搜索算法的各种应用。
新特征识别:RangeBrain等Google的智能算法不仅可以帮助最佳拟合结果,还可以识别可用于改善搜索结果的新特征。将来,更多的Google搜索特征将基于机器学习。
模式检测:Google主要使用特模式检测来识别垃圾邮件并对其进行标记。它根据诸如关键字过多,使用不相关的出站链接,过多的广告等属性来识别低质内容。这些属性实际上有助于Google搜索获取更多相关结果并提高用户满意度。
图像搜索:随着越来越多地重视视觉刺激,图像,GIF,视频和信息图表的使用呈指数增长。因此,从搜索的角度来看,对图像进行分类和分析的需求变得至关重要。机器学习和AI在映射图像模式与其他图像之间起着至关重要的作用。反过来,这可以帮助人们通过图像而不是文本搜索内容。这也有助于网站管理员调整其SERP。
定位广告:Google搜索允许公司匹配与某些关键字相关的特定受众的广告。哪个广告将显示在哪个级别上,很大程度上取决于机器学习,它会根据每个关键字,其点击率,着陆页体验以及更多因素来获取目标广告。
同义词识别:Google还会尝试查找特定关键字的同义词。基于同义词,Google还会在搜索页面底部反映相关的搜索。您可能已经注意到,当您搜索特定查询时,Google会提取一个代码段。当Google知道特定单词的同义词时,就会发生这种情况。
小结:
在过去的几年中,人工智能和机器学习推动了很多技术更新,使每次更新都变得更加智能。尤其是当所有技术公司都转型为软件公司时,必须使用智能创新来增强整体体验。从像Siri和Alexa这样的虚拟机器人到无人驾驶汽车,AI和ML软件已从所有可能的方面渗透到我们的日常生活中。
语音搜索是过去几年Google搜索的一项重大进步。Gmail,Google地图等搜索栏右上角的小麦克风实际上有助于使用更新的关键字、语义、情感等来微调数据库,它在起步阶段就已经广受欢迎。
更多这样的算法更新,改善最终的搜索体验,并以其结果革新互联网,这简直令人着迷。虽然它撼动了许多人的排名,但它也为许多其他应有的人提供了巨大的空间。这些人会凭借高质量的内容和更好的搜索相关性获得更高排名。
作者:Shravani C
链接:https://medium.com/@shravani_38239/how-is-google-search-implementing-artificial-intelligence-65f450891d3b
编译:产品经理熊不知(微信公众号:xiongbuzhia)