发布时间:2014-06-26 发布者:本地
技术层面来讲是有影响但是没那么严重。
搜索引擎还没有进化到可以自学习的地步,现阶段的搜索引擎主要还是依靠工程师不断地调整搜索策略、或者是依靠海量数据集进行监督学习,搜索引擎从用户的使用中能够得到的反馈大致包括一个Query出现的频次、满足一个用户的搜索需求的Session信息、对于某个Query我们的排序是否恰当,这些信息可以指导工程师优化搜索引擎,但是不能让搜索引擎自己学习和进化,因为这涉及到一个事实就是,现阶段的搜索引擎并不真正的理解Web上的信息,搜索引擎可以从用户的反馈知道某个网页对Query是好的,但是搜索引擎不知道为什么这个网页是好的,这是需要人工来为搜索引擎指明的。
因此,如果Google持续被墙,Google直接缺乏的是来自用户的真实的对搜索质量的反馈,这直接的结果是由于工程师的认知盲区导致的优化跑偏。
对于用户互动依赖最高的其实是如小黄鸡、微博机器人、清华小图、微软小冰这类的带有所谓调教功能的智能问答机器人,这类机器人的原始数据只依赖一个基本的语料库,微博好点儿,因为微博有全微博作为语料库,微软的小冰也强点儿,因为背靠的是具有检索全网能力和自备知识图谱的搜索引擎。这些机器人的非知识型和功能性问答(纯娱乐性的交互)是无法从语料库直接获取的,严重依赖与用户互动中的积累。如果一款机器人被墙,那它就离死期不远了。
商业层面来讲,影响比较大
如果一家搜索引擎在某个地区持续被墙,意味着这个地区没有流量导入,也就导致该地区的变现能力下降很大,Google的商业模式严重依赖流量变现,一旦某个地区的变现能力下降,Google在该地区的营收将直接受到毁灭性的打击。对于一家商业公司而言,很可能会因为成本原因而撤销在该地区的大部分研发团队,最后导致一个对本地区服务的更新停滞。