资讯: ·《色·戒》带热上海“小资街”武康路(图) ·中断十余年 中国作协再吸纳港名家 ·娱乐至死:分析控制人类的电视(图) ·85岁金庸加入中国作协引发广大网友热议(图) ·郭沫若被埋没的一部杰作 长篇小说《骑士》(图) ·国内首份网络报纸创刊  [推荐] [收藏] [打印] [ ] [关闭]
首页 字号:
第十一章 第一节 互联网上的数据之争
中国网 china.com.cn  时间: 2009-06-03  发表评论>>

第十一章 互联网上的数据保卫战

“我很担心通过搜集在线数据描绘网络用户特征和详细了解用户的习惯。避免这种窥探行为是非常重要的。”

——互联网之父、英国南安普敦大学的计算机科学教授伯纳斯•李

互联网发展到今天,数据显得越来越重要。首先是广告商的需求。透明真实的数据是准确选择广告投放的依据,是凸显广告效果的前提。广告是互联网的主要收入来源。互联网和传统媒体不同,传统媒体缺少有效的监测手段,很难统计出客观真实数据,比如报纸,总是宣称发行量,实际上外界很难摸清真实情况。电视领域稍好些,有相应的监测机构,但监测和统计方法并不科学,例如在北京,监测机构以300户为调查样本,而北京现有人口1700万,按一家5口计算,平均也有300多万户,那300多户只是万分之一,很难代表总人口数情况。但由于有互联网技术支持,使其能提供较精准的监测数据,所以广告商对互联网数据要求很高,他们通过网站的流量高低,判定广告的投放处。

对于任何一类媒体来说,都需要用数据来反映其发展现状。报纸、杂志需要发行量,电视节目需要收视率,广播需要收听率,当互联网已经正在作为新兴媒体时,数据成为能够反映其价值大小的最有利证据。网站自身发展也渴求行业数据,他们需了解同行特别是竞争对手的发展情况,而数据是了解网站自身发展状况,掌握用户行为特征,制定战略部署、调整经营的基础;对于业界,数据有利于了解整个行业发展状况、预测行业走向,了解自己在行业中的位置,了解竞争对手的发展情况,寻找自己的竞争优势;对于投资者,更是需要通过数据确定资金的投入方向。对于政府行业管理部门以及各类相关组织、研究机构,真实掌握互联网行业发展情况、动向至关重要。第三方数据有助于更为准确地把握网络受众行为特点和社会影响。对于管理部门,需要依据数据来制定相应的发展政策、管理法规;对于专家学者,需要通过数据研究互联网发展的规律。

第一节 互联网上的数据之争

互联网发展离不开数据,互联网需要用数据说话。如今,用数据说话、用数据证明,用数据吸引广告和投资,已经成为互联网业界的共识。因为掌握了互联网数据,就可以掌握受众行为。

数据蕴藏巨大力量

互联网我们到底了解多少?人们每天在上边留下的足迹,就是最大宝藏。当我们已经习惯用互联网上的目录来取代黄页,用搜索引擎取代传统研究,用新闻网站取代报纸时,这就意味着一些事情正在从根本上发生转变。一切都在告诉我们,聪明人已经极端地依靠互联网来达到各种目的,其中最重要的就是,发现我们,研究我们,最终控制我们。

数据的力量是可怕的,一些表面上顺理成章的事情,在数据下常常是另一种形态。一个很简单的例子就能证明出这种“不一样”是多么普遍。比如,经常浏览打折商品网站的人并不一定就是中下阶层,美国富裕阶层的身影在里面比比皆是。每天数以亿万计的人们都会在线,在那庞大互联网数据库幕后,可以呈现出人们在日常生活中是如何使用网络、浏览网站、收集信息,那些在网络上所透露出的生活、兴趣、想法、梦想,甚至恐惧,以及数据背后所隐藏的千奇百怪的人性。

谷歌流感趋势图

2008年11月,Google发布了一个新网站www.google.org/flutrends,用来追踪流感趋势。“流感趋势”是一项免费网络服务,可以帮助人们了解自己所在地区(限美国境内)的流感病例爆发情况,从而提前采取预防措施,避免感染。谷歌“流感趋势”预测的速度,甚至要比美国疾病控制和预防中心还要快7~10天。例如,2008年2月,美国疾病控制和预防中心就曾表示,美国大西洋沿岸中部地区爆发了流感疫情,而谷歌的检索结果早在两周前就已经显示出了这种趋势。

为什么谷歌能够预报流感趋势?是通过对谷歌关键词的监测来实现的。每年流感爆发时,像“流感症状”的搜索项都会非常普遍,而且类似搜索项的数量和实际感染流感的人数的相关性非常高。谷歌每天都会对发自特定地区的与流感相关的搜索项进行统计,了解该地区有多少人表现出类似于流感症状。谷歌认为,人们输入的搜索关键词代表了他们的即时需要,反映出用户情况。为便于建立关联,设计人员编入“一连串”流感关键词,包括温度计、流感症状、肌肉疼痛、胸闷等。只要用户输入这些关键词,系统就会展开跟踪分析,记下搜索的时间和地理位置,创建地区流感图表和流感地图,显示流感在何处传播。相应的关键词密度越高、越频繁,该地区爆发流感的可能性就越大。它还可以用来追踪传染性疾病,如AIDS、禽流感、非洲杀人蜂。根据历年美国流感数据表,可以看出明显趋势,3周后,美国人迎来流感的高峰期并持续到2009年1月。美国疾控中心表示,谷歌“流感趋势”可以对其现有的疾控监测起到很好的补充作用。

网络行为数据

还有另一个有意思的例子。在网络营销界中,PPC代表的是Pay per click(按点击付费)。但在这里,PPC有着完全不同含义,它代表色情(Porn)、药物(Pills)和赌场(Casinos)。这些关于人类恶习的网络数据无疑揭示出竞争情报数据的强大作用,网站访问量的上升与下降,网站访问的细分群体,以及用户群的访问意图等等,都将带来有趣又有意义的结果。每天都是谁在网上逛,在找什么,去哪些网站,都可以在数据中找寻。

搜索引擎搜集数据也非常有力,因为人们输入的关键词或短语表明了他们最急迫的想法。正在计划旅游的人们可能会搜索“考艾岛旅馆”(位于美国夏威夷州),而抵押贷款出问题的人们可能会搜索“丧失抵押品赎回权”。这些提问显示了世界上共有的欲望和需要,计划与喜好。比如,雅虎中国搜索显示,对特定术语搜索数的增加有助于预见何种技术产品将会受到欢迎。雅虎开始将搜索流纳入什么东西可以在网页上占据显著位置的决策。

“数据”可以掌握一切

“SMG拥有几乎所有的新媒体平台,其在中国的实践和探索,有助于更为准确地把握新媒体受众的行为特点和社会影响。”

——尼尔森全球董事长兼CEO戴维•卡尔霍恩

每台计算机、每个网站都可以安装工具条,监测每个网站、每个网民、每个新闻页面的浏览活动情况。互联网数据监测数据在一定程度上反映了用户浏览网站的行为,比如页面浏览数、访问量最大的页面、相关网站链接等,从这些有关用户浏览行为的信息中,不仅可以对自己的网站进行分析,同时也可以对竞争者网站的状况,或者对某个行业、某个领域进行分析。

了解用户的最好工具

互联网数据是了解用户阅读习惯的好工具。假定浏览者有每天上网固定浏览新闻的习惯,那么如果一个网站中的新闻中符合其阅读需求的越多,那么就越容易培养其固定的阅读习惯。网络浏览者一旦接触并喜欢一个网站,比较容易形成固定的阅读习惯。从浏览页数来看,一个网站浏览者浏览的页数越多,总的浏览量就越大,网站的排名就越靠前。从网民的浏览习惯来看,一般都是有选择性地阅读,最好的网站也就是平均浏览10页左右,相当于看10条新闻。这样一来,网站的主页设计非常重要,有些类似于报纸的头版。很多新闻网站就通过减少主页新闻标题字数、增加新闻条数来提高读者的访问量。一般来说,如果主页上有5条新闻达到浏览者的阅读喜好,那么网站的排名就会有比较稳定的保证。如果达到8至10条,那么即使是发布条数不增加,网站流量排名也会大幅上升。

国外第三方监测机构

中国互联网发展多年,但对行业发展生命攸关的数据还主要依靠国外第三方监测机构。主要是用Alexa和AC尼尔森的监测数据,并逐渐成为评判中国互联网站价值的风向标。外国数据监测机构监控方式,是在网页上安装代码,网民点击网站的某个网页并将该网页完全打开后,该点击被视为一次有效点击并反馈到监测平台上,那么网站数据就被其服务器记录下来。

ACnielson(AC尼尔森),是美国著名传媒市场调查机构,主要进行网络商业模式调查,帮助商业机构决定在哪家网络刊登广告最有效率。2008年4月8日,AC尼尔森北京分公司宣布与中国互联网协会指导的CHINA RANK公司合资,主要从事互联网的流量监测、网站排名等业务。近年来,尼尔森凭借强大技术优势,在软件和硬件上都对新媒体受众研究进行了大量投入。像尼尔森这样的第三方监测机构,有着专业的方法和工具用于受众研究,并且能将互联网数据与其多年积累的消费者习惯等信息进行比对研究,得出的研究结果对网络媒体的社会影响以及受众行为特点具有重要参考价值。

Alexa是目前较大的全球网站排名机构之一,1996年4月在美国创立,当时是分类导航网站。1997年,发布用于监测用户上网行为的软件Alexa Toolbar(Alexa工具条),供用户下载插入安装在浏览器中。Alexa可以对每一个安装有该软件用户上网行为进行实时监测。用户访问页面时,会向Alexa的服务器发回一串代码,这串代码包含着用户上网位置、上网时间、访问的内容页面等信息。在服务器端,按网站对访问数据进行分类,统计出各网站的用户链接数和页面浏览数,并基于该数据进行全球网站大排行。用户还可以查询Alexa所收录网站的综合排名、用户链接数占安装有AlexaToobar软件用户总数的比例,及平均页面浏览量等数据。1999年,Alexa被亚马逊公司收购,成为全球知名流量排名服务网站。经过多年积累,Alexa的网址库已存储400亿网址信息,超过了Google等搜索引擎,成为最全的网址信息数据库。现在,Alexa工具条全球“装机量”早已上千万,对全球网民浏览习惯进行监测,并开发和销售各种相关产品。其中,有最长达10万个网址的全球网站排行榜,有针对某些特定行业网站的排行分析,有针对个别网站定制的网站流量监测报告。Alexa还提供了很多免费信息,比如“全球网站500强”“简体中文网站100强”,网民可以查看关于某个网站的排名历史变化图。

Alexa每天在互联网汪洋大海中,收集三种信息:一是安装有Alexa Toobar的用户信息;二是这些用户访问哪些网站;三是这些用户的网上购物行为。根据前两者的信息,理出每一个网站的用户规模和访问量,得出网站排行。第三种信息则提供给从事网上购物服务的亚马逊公司。Alexa每天都会按照用户到达率和页面浏览数等主要指标,对全球网站进行一次综合排名,并在网站上公布最近三个月数据评估得出的“综合排名”。

在Alexa网站上,人们可以针对某个特定网址查询所属网站的访问人数,Alexa提供“每百万用户访问人次”数据表示访问人数,也即每百万个Alexa工具条用户中每天访问某一网站的平均人数。比如,2004年11月3日,谷歌的访问值为178500,就是说,这一天每百万Alexa工具条用户中就有近18万人访问过谷歌。Alexa还提供另一个数据来反映到访的网民对特定网站的使用率,这就是“每用户浏览页面数”(简称PV)。某网站的PV值是每天所有访问该网站的Alexa工具条用户在该网站上浏览的总页面数的平均值,同一人对相同页面的重复浏览在每天只计作一次。还以2004年11月3日谷歌的访问数据为例,这一天的PV值是4.0,也就是说,来访的网民们平均在谷歌上浏览4个页面。每时每刻,全球每个安装Alexa工具条的计算机都会向Alexa汇报该计算机在互联网上的访问情况。根据这些信息,Alexa每天都会对全球网站的排名做重新计算,每日更新排名。

摘自《网络战争》

文章来源: 中国网 责任编辑: 雨悦
[我要纠错] [推荐] [收藏] [打印] [ ] [关闭]
网友留言 进入论坛>>
昵 称 匿名
留言须知 版权与免责声明