收藏文章 楼主
第19次中国互联网络发展报告:CNNIC调查方法
网友【老编】 2007-03-22 09:32:32 分享在【时代发展的印记】版块    1    1
中国互联网络信息中心(CNNIC)2007年1月23日发布第19次中国互联网络发展状况统计报告。本次调查显示,中国内地网民总人数已达1.37亿人。以下为中国互联网络信息中心(CNNIC)调查方法。依据统计学理论和国际惯例,在前18次调查工作基础之上,本次调查采用了计算机网上自动搜寻、网上联机、网下抽样、相关单位上报数据等调查方法。

(一)域名数、网站数、IP地址数调查、网页数、网页字节数调查

1.中国的通用顶级域名数及对应网站数:

通过各通用顶级域名注册单位协助提供。这些数据包括:所有通用顶级域名(gTLD)和有网站(即有WWW服务)的通用顶级域名(gTLD)总数、所有通用顶级域名(gTLD)和有网站的通用顶级域名(gTLD)按.COM、.NET、.ORG分类的数目、所有通用顶级域名(gTLD)和有网站的通用顶级域名(gTLD)按注册单位所在省份分类的数目。

2.中国的CN域名数及对应网站数:

采用计算机网上自动搜索可得到如下数据:CN下的域名数及地域分布情况;CN下网站数及其地域分布情况。

3.中国域名总数、网站总数:

将以上1、2两部分的相关数据分别相加,即可得到中国的域名总数、网站总数、域名和网站的地域分布、网站分类数等数据。

4.IP地址总数:

IP地址分省统计的数据来自APNIC,中国互联网络信息中心(CNNIC)IP地址数据库,数据统计方法是将两个数据库中已经注册且可以判明地址所属省份的数据,按省分别相加得到,由于地址分配使用是动态过程,所统计数据仅供参考。

5.中国网页总数、网页字节总数:

采用计算机网上自动搜索,对抽取的网站从其首页(WWW+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页的特征及其文本内容。将由网页搜索所获得的所有中国网站的网页数和网页字节数分别相加得到中国网页总数及网页字节总数。该总数不含内容相同的重复网页。

(二)网上联机调查

网上联机调查重在了解网民使用互联网的行为习惯、对互联网的态度以及对热点问题的看法和倾向。具体方法是将问卷放置在CNNIC的网站上,同时在全国各省的信息港与较大ICP/ISP上设置问卷链接,由网民主动参与填写问卷的方式来获取信息。

CNNIC在2006年12月9日~12月31日进行了网上联机调查。调查得到了国内众多知名网站、媒体的大力支持,国内许多知名网站均在主页为本次联机调查问卷放置了链接。本次网上联机调查共收到调查问卷20,295份,经过有效性检查处理得到有效答卷20,183份。

(三)电话抽样调查

电话抽样调查侧重于了解中国网民的总量、相关的特征及行为特点等。

1.调查总体

结合调查目的,网下调查的目标总体定义为:全国6周岁以上的居民。从访问实施的角度,把目标总体细分为:1.全国有住宅固定电话的6周岁以上的人群(子总体A),采用电话调查的方式;2.全国所有高等院校中的住校学生(子总体B),采用电话调查的方式,本次调查根据第17次调查结果进行推断;3.没有住宅固定电话、但有小灵通的6周岁以上的人群(子总体C1),采用电话调查的方式。在对全国结果进行推断时,将三个子总体的统计量应用加权公式进行汇总。

2.总体A+C1抽样方法

按照科学性和可操作性相结合的原则,对总体A+C1按省进行分层。

◇抽样指标的确定

从全国的情况来看,各省的城市住宅电话与乡村住宅电话的比例差异很大,由于城市与农村家庭的平均人口数差异很大,所以在用各省数据推断全国时,考虑的指标是“拥有住宅电话的人数(或称住宅电话覆盖的人数)”;在确定各省中地市(此处的地市包括地级市和地区行署,每个地市下都包括城镇和乡村,以下简称地市州)的样本量时,采用地市州的“人口和经济指标”建立回归预测模型估计该地市州的住宅电话数目,并将该地市州的住宅电话数目作为抽样指标。

◇样本量

综合考虑到调查的精度和费用、时间的要求,在保证网民人数最少的省的样本量能满足推断本省网民总数的基本要求下,置信度为95%,设计效应为1.5时,最大绝对误差为1.6%。由于各省的网民人数和占本省人口数的比例差异很大,考虑各方面的因素,根据第17次中国互联网络信息中心(CNNIC)的调查结果,以各省网民人数为依据,算得每个省的样本量。本次调查全国的样本量为32,325个。

◇省内各地市的抽样方法

第一步:从精度上考虑,为使样本更接近自加权样本,在每个省中抽取全部的地市州。省内各地市州的样本量,按各地市州住宅电话数目比例进行分配。

第二步:获得各地市州的所有电话局号,根据该地市州的局号生成电话号码库。电话号码中除局号外的后四位,由随机数生成。

第三步:确定调查对象,在电话(包括没有住宅固定电话的小灵通)拨通后,把接听电话的人作为被访对象,询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。

3.全国加权方法

对全国的推断采用对各省的调查结果进行事后加权处理的方法。

4.抽样调查成功率

按美国舆论研究协会(AAPOR)的成功率公式三计算,本次抽样调查的成功率为39.1%。

5.数据预处理

在数据处理之前,对数据中变量的取值、变量之间的逻辑关系等进行检查,对其中的不合格样本进行了核对、删除和补充,并对部分变量进行了事后编码。

在统计报告中有一些平均数(比如每周上网小时数等),在计算这些平均数前,首先采用以大于或小于平均数的三个标准差和检查观测量的各变量之间的逻辑关系等方法对数据中的异常值进行排除。
meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

1   2007-03-22 09:32:32  回复

回复/评论:第19次中国互联网络发展报告:CNNIC调查方法

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 川普政府终于听说了日本新首相【高市早苗】因为台海表态引发外交危机的事儿了?
  2. 强制注销户口?传闻中国在加强双重国籍监管
  3. 美宝家庭关切:双国籍审查和户口注销真相
  4. 美企的2026招聘计划“谨慎”了,AI影响显现!
  5. 马斯克指控“美国慈善家”做空特斯拉,涉案逾百亿美元!
  6. 感恩节餐桌的费用回落,零售商推出了低价套餐!
  7. 顶级文凭可早获绿卡!H1B签证“全新加权”抽签制度生效
  8. 特朗普总统宣布“平安夜”和“节礼日”也放假
  9. 美国移民局(ICE)新提案打算限制福利使用,有记录者可能影响绿卡申请!
  10. 美国在AI竞争中失利了?阿里千问模型在全球领先
  11. 中美经贸磋商“展现战略对称”新态势
  12. 在特朗普访华之前,白宫向中国“递三份礼物”
  13. 川普总统正式签属涉台法案,解放军示警!
  14. 中美两国元首在釜山会晤:就关税、大豆和稀土已经达成共识
  15. 中美AI竞争的新格局已定?
  16. 恢复或加入?重获中国国籍的路径比较
  17. 英伟达H200芯片的对华销售仍然在受美国的两重限制
  18. 多名移民法官在同时期被解雇,引发司法危机
  19. ICE启动了在社交媒体的全天候监控项目
  20. 联邦政府启动“红色日落行动” 审查比特币矿机的供应链
  21. 德州少女在圣诞前夜失踪,全力搜寻中!
  22. 美国政府批准了对台3.3亿美元的军售
  23. 中国已经全额缴纳了联合国会费,联合国的财政危机缓解!
  24. 人类史上“最贵CEO”诞生!马斯克的“万亿薪酬”背后
  25. 学习英语12年后,终于实现了“美国梦”!
  26. 2026年版的“公共负担”新规复活,华人家庭遭遇精准打击!
  27. 美国仍然依赖纸质信件的真相剖析
  28. 五角大楼的机密报告:中国导弹可以击沉美军航母
  29. 川普政府再次出奇招!拒绝所有胖子的移民申请?
  30. 美国华人揭示的五大高收入职业
  31. 外国人的入境中国手续简化,可以提前在网上填报入境卡了!
  32. 在海外漂泊12年后的真实感受
  33. 一美分硬币“Penny”铸造历史正式终结
  34. 黄仁勋警示川普政府,再不开放“对华AI芯片出口”就来不及啦!
  35. SpaceX在加速IPO计划,目标估值1.5万亿美元!
  36. 中美高层通话后… 川普总统计划明年访华,芯片管制也松口了!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(1) 分享
分享
取消