|
以搜索引擎起家的百度公司,近来产品线不断延伸,除了已有的网页搜索、新闻搜索、图片搜索、贴吧等服务之外,还推出了百科、硬盘搜索、国学、手机搜索、地图等产品。但是,就在传统媒体聚焦于这些产品的时候,却忽视了一个对自身影响深远的事件———百度不久前公布了《互联网新闻开放协议》,并号召大家一起遵守该协议,以便于搜索引擎抓取。
百度牵头标准化
网络信息的自动处理,一直是个“老大难”问题。单就网络新闻而言,各网站的格式就不统一。例如标题、作者、发布时间、出版单位、类别这些关键信息,各家有各家的标准,这样非常不利于搜索引擎或者其他自动化工具的处理。简单地说,大多数网页是给人看的,而不是给机器看的,想要自动化处理是很难的。为了改变这一现状,业界尝试了很多方案,例如推出了XML、语义网等概念,但是这些应用的发展均不理想,各种搜索引擎在检索信息并对其进行自动化加工方面还存在障碍。
就此,百度技术总监刘建国介绍,“许多主流平面媒体的网站,由于网页设计不太符合搜索引擎的抓取规律,因此不能在第一时间被搜索引擎抓取,其结果是,在中国互联网新闻中,基本上是以‘二手货’(即转载)新闻为主,百度开放协议希望可以改变这一现状。”
百度公司的做法是值得赞赏的。熟悉通信行业的人应该知道,通信行业里面标准的影响力是巨大的。标准分为全球标准、国家标准、地区标准、行业标准、企业标准等多种类型,而这些标准是互为依托且互为参考的。互联网内容服务领域,是可以参照通信行业的标准体系来完善自身标准体系的。
在网络新闻标准化方面,我国还没有在国家层面出台相关标准,而在这一领域耕耘的百度公司应该是最早、最深刻体会到由于标准缺乏而造成危害的企业之一,因此他们率先提出并公开了自身的企业标准,这样一来,其他搜索引擎或者信息自动处理工具也可借助这一标准的力量来完善自己。
百度公司的动作对于全行业的标准化有推动意义。根据百度提供的资料,在该协议上线的数天内,百度已接到近百家新闻网站的电话与邮件,询问或直接联系实行开放协议的事宜。百度公司的副总裁梁冬说,“从目前情况看来,通过实行这一协议,确实可以大大提高搜索引擎对原创新闻的抓取速度与抓取量”。
传统媒体的机会
从长远看,百度的动作将对互联网新闻生态圈产生巨大影响,尤其是部分依赖新闻的门户网站和传统新闻媒体自身的网站。
虽然谷歌(Google)、百度等搜索引擎早在2004年就已经推出新闻搜索,但是当时很多对门户网站惊呼“狼来了”的评论者而言,新闻搜索引擎的“攻击力”让他们失望了。时至今日,谷歌、百度们的新闻搜索还主要局限于对特定新闻的搜索上。因此,大多数传统媒体还得“依仗”少数几个门户网站,来提高自身新闻的浏览率。某些媒体在试图提高文章版权费受挫而中断文章供应之后,发现自身影响力也随之下降,不得不重新就范于提供文章的门户网站,门户网站影响力之大可见一斑。
门户网站转载传统媒体的新闻,传统媒体会提高知名度,但是流量以及由此带来的广告收入却归门户网站所有,众多传统媒体只能依赖其影响力从门户网站分一杯羹,或多、或少。
这样一来,造成传统媒体的压力很大,即使是较早与互联网进行整合的赛迪传媒都感到了网络媒体的压力———严重依赖传统媒体广告业务的赛迪传媒于1月20日发布公告:由于IT厂商广告投放方式发生了变化,公司净利润将同比下降幅度在50%以上。
传统媒体显然不甘心于此,他们希望网络新闻能够摆脱巨头的控制,希望读者能够直接到自己的网站浏览。而新闻搜索的出现,则为其提供了机会,百度出台互联网新闻开放协议更是推动了网络新闻的“去中心化”。
考虑到这一因素,我们就不难理解南方日报社总编杨庆峰近日的言论了———“百度‘开放协议’对中国新闻界来说,意义重大,它不仅可以提升互联网新闻的整体质量,同时也给正在加强网络新闻建设的主流平面媒体提供了最好的机遇”。同样,国内某知名门户网站的副总在其博客上大骂百度,想必也是因为自己的奶酪被百度动了。
百度们仍需努力
百度们的新闻搜索,虽然迎合了传统媒体的需要,但是机器自动处理的新闻首页毕竟还不够完善,不能完全作为网络新闻的入口,其主要原因是在准确性上机器编辑比不过人工编辑,偶尔还会发生新闻分类张冠李戴的现象,例如将文化新闻编入科技新闻,或者过分依靠转载量将新闻价值不大的文章推荐在首页。
不仅如此,新闻搜索的排名机制还有待进一步完善,例如今年4月21日下午百度新闻搜索首页上有篇题为《Google开放流量监测 百度盈利模式受到威胁》的文章。百度的新闻搜索倒是客观,并没有删除这篇不利于自身的新闻报道,但是其虽然发现了这一新闻在网络上至少有20篇(最早的是在2005年11月14日发布的),程序还是将广东某网站刚刚转载的“旧”闻推荐到首页,而这种“炒冷饭”的行为,人工编辑绝对会避免。
因此,携手传统媒体,营造新型的网络新闻生态圈,百度们仍需努力。
|