当前位置:首页 > 科普 > 正文

北京社会关系的数据分析(社会数据)

一、从谷歌流感趋势谈大数据分析的光荣与陷阱

从谷歌流感趋势谈大数据分析的光荣与陷阱

本文从谷歌流感趋势2009年前后表现差异谈起 ,讨论了大数据分析容易面临的大数据自大 、算法演化、看不见的动机导致数据生成机制变化等陷阱,以及对我国大数据产业发展的借鉴。本文认为,为健康发展大数据产业 ,我国需要防范大数据自大风险、推动大数据产业和小数据产业齐头并进 ,并强化提高大数据透明度 、审慎评估大数据质量等方面的努力 。?

一 、谷歌流感趋势:未卜先知?

“谷歌流感趋势 ”(Google Flu Trends,GFT)未卜先知的故事,常被看做大数据分析优势的明证。2008年11月谷歌公司启动的GFT项目 ,目标是预测美国疾控中心(CDC)报告的流感发病率。甫一登场,GFT就亮出十分惊艳的成绩单 。2009年,GFT团队在《自然》发文报告 ,只需分析数十亿搜索中45个与流感相关的关键词,GFT就能比CDC提前两周预报2007-2008季流感的发病率 。

也就是说,人们不需要等CDC公布根据就诊人数计算出的发病率 ,就可以提前两周知道未来医院因流感就诊的人数了。有了这两周,人们就可以有充足的时间提前预备,避免中招。多少人可以因为大数据避免不必要的痛苦、麻烦和经济损失啊 。

此一时 ,彼一时。2014年, Lazer等学者在《科学》发文报告了GFT近年的表现。2009年,GFT没有能预测到非季节性流感A-H1N1;从2011年8月到2013年8月的108周里,GFT有100周高估了CDC报告的流感发病率 。高估有多高呢?在2011-2012季 ,GFT预测的发病率是CDC报告值的1.5倍多;而到了2012-2013季 ,GFT流感发病率已经是CDC报告值的双倍多了。这样看来,GFT不就成了那个喊“狼来了”的熊孩子了么。那么不用大数据会如何?作者报告,只用两周前CDC的历史数据来预测发病率 ,其表现也要比GFT好很多 。

2013年,谷歌调整了GFT的算法,并回应称出现偏差的罪魁祸首是媒体对GFT的大幅报道导致人们的搜索行为发生了变化。Lazer等学者穷追不舍。他们的估算表明 ,GFT预测的2013-2014季的流感发病率,仍然高达CDC报告值的1.3倍 。并且,前面发现的系统性误差仍然存在 ,也就是过去犯的错误如今仍然在犯。因为遗漏了某些重要因素,GFT还是病得不轻。

为什么传说中充满荣光的大数据分析会出现如此大的系统性误差呢?从大数据的收集特征和估计 *** 的核心,我们可以探究一二 。

北京社会关系的数据分析(社会数据)

(图片来源于 *** 侵删)

二、新瓶装旧酒:过度拟合

大数据时代的来临 ,为数据收集带来了深刻变革 。海量数据 、实时数据、丰富多样的非结构数据,以前所未有的广度进入了人们的生活。但是不变的是,在统计分析 *** 上 ,数据挖掘(Data mining)仍然是统计分析的主要技术。而数据挖掘中最引人注目的过度拟合(overfitting)问题 ,由于下文提到的各类陷阱的存在,远远没有解决 。

我们先用一个故事来解释何为过度拟合。假设有一所叫做象牙塔的警官学校致力于培养抓小偷的警察。该校宣称,在他们学校可以见到所有类型的普通人、也能见到所有类型的小偷;到他们学校来学习就能成为世界上最厉害的警察 。但是这所学校有个古怪 ,就是从不教授犯罪心理学。

象牙塔的教学方式是这样的:将人群随机分为十组,每组都是既有普通人又有小偷。学员可以观察到前九组所有人,也知道谁是普通人谁是小偷 。学员要做的是 ,根据自己从前九组中了解到的小偷特征,从第十组中找出小偷。比如学员从前九组观察到小偷更喜欢在给孩子买尿布的时候也买啤酒,那么在第十组观察到有人在买尿布时也买啤酒 ,就作为一个嫌疑条件。完成这个过程之后,学校再将人群打散重新分成十组,如此循环往复 ,之后学校进行测试 。测试方式就是再次将人群随机分为十组,看谁能最快最准根据前九组的信息找出第十组的小偷。冠军即象牙塔最棒警察,可以派到社会上抓小偷了。

一段时间后 ,问题来了:象牙塔最棒警察在象牙塔校内总能迅速找到小偷 ,可一旦出了象牙塔,该警察就老犯错抓 、该抓不抓的错误 。他抓小偷的表现,甚至比从来没有来象牙塔学习的人还要差 。

在这个故事里 ,象牙塔最棒警察就相当于根据大数据的数据挖掘 *** 、机器学习之后挑选出来的更优模型。小偷相当于特定问题需要甄选出的对象,比如得流感的人、不干预就会自杀的人 、赖账的人。前九组的人就相当于用于训练模型的训练数据;第十组人则相当于检验训练结果的检验数据 。不教授犯罪心理学就意味着抓小偷并不需要理解小偷为什么会成为小偷,类似于在数据分析中只关心相关关系而不关注因果关系。训练更佳警察的过程 ,就类似于运用机器学习技术,采用训练数据来训练模型,然后采用检验数据来选择模型 ,并将预测更好的模型作为更佳模型,用于未来的各类应用中。

最后,警察在象牙塔内能快速抓小偷而校外不能 ,就是过度拟合问题 。由于在学校通过多次重复练习,学员小偷的特征已经烂熟于心,因此无论怎么随机分 ,都能快速找到小偷并且不出错;这就相当于训练模型时 ,由于已经知道要甄选人群的特征,模型能够对样本内观测值作出很好的拟合。由于象牙塔学校判断小偷的标准主要看外部特征而不去理解内在原因,比如小偷常戴鸭舌帽 ,那么当社会人群里的小偷特征与象牙塔人群有很大差别时,比如社会上的小偷更常戴礼帽,在象牙塔内一抓一个准的鸭舌帽标准 ,到社会就变成一抓一个错了。也就是说,在样本内预测很好的模型,到样本外预测很差 。这 ,就是过度拟合的问题。

从过度拟合角度,可以帮助我们理解为什么GFT在2009年表现好而之后表现差。在2009年,GFT已经可以观察到2007-2008年间的全部CDC数据 ,也就是说GFT可以清楚知道CDC报告的哪里发病率高而哪里发病率低 。这样,采用上述训练数据和检验数据寻找更佳模型的 *** 时标准就很清晰,就是不惜代价高度拟合已经观察到的发病率。 Lazer等人发现 ,GFT在预测2007-2008年流感流行率时 ,存在丢掉一些看似古怪的搜索词,而用另外的5000万搜索词去拟合1152个数据点的情况。

2009年之后,该模型面对的数据就真正是未知的 ,这时如果后来的数据特征与2007-2008年的数据高度相似,那么GFT也该可以高度拟合CDC估计值 。但现实是无情的,系统性误差的存在 ,表明GFT在一些环节出了较大偏差而不得不面对过度拟合问题 。

从上面的故事可以看到,产生过度拟合有三个关键环节。之一,象牙塔学校认定本校知道所有普通人与所有小偷的特征 ,也就等于知道了社会人群特征。第二,象牙塔学校训练警察,不关心小偷的形成原因 ,而关注细致掌握已知小偷的特征 。第三,象牙塔学校认为,不论时间如何变化 ,本校永远能保证掌握的普通人和小偷的行为特征不会发生大规模变动、特别是不会因为本校的训练而发生改变。

在大数据这个新瓶里 ,如果不避开下面的三个陷阱,就仍然可能装着数据挖掘带来的过度拟合旧酒:大数据自大、算法演化 、看不见的动机导致的数据生成机制变化。

三、大数据分析的挑战

(一)陷阱一:“大数据自大”

Lazer等学者提醒大家关注“大数据自大(big data hubris) ”的倾向,即认为自己拥有的数据是总体 ,因此在分析定位上,大数据将代替科学抽样基础上形成的传统数据(后文称为“小数据 ”)、而不是作为小数据的补充 。

如今,大数据确实使企业或者机构获取每一个客户的信息 、构成客户群的总体数据成为可能 ,那么说企业有这样的数据就不需要关心抽样会有问题吗?

这里的关键是,企业或者机构拥有的这个称为总体的数据,和研究问题关心的总体是否相同。《数据之巅》一书记载了下面这个例子:上世纪三十年代 ,美国的《文学文摘》有约240万读者。如果《文学文摘》要了解这个读者群的性别结构与年龄结构,那么只要财力人力允许,不抽样 、直接分析所有这240万左右的数据是可行的 。但是 ,如果要预测何人当选1936年总统,那么认定“自己的读者群”这个总体和“美国选民”这个总体根本特征完全相同,就会差之毫厘谬以千里了。事实上 ,《文学杂志》的订户数量虽多 ,却集中在中上层,并不能代表全体选民。与此相应,盖洛普根据选民的人口特点来确定各类人群在样本中的份额 ,建立一个5000人的样本 。在预测下届总统这个问题上,采用这个小数据比采用《文学文摘》的大数据,更准确地把握了民意。

在GFT案例中 ,“GFT采集的搜索信息 ”这个总体,和“某流感疫情涉及的人群”这个总体,恐怕不是一个总体。除非这两个总体的生成机制相同 ,否则用此总体去估计彼总体难免出现偏差 。

进一步说,由于某个大数据是否是总体跟研究问题密不可分,在实证分析中 ,往往需要人们对科学抽样下能够代表总体的小数据有充分认识,才能判断认定单独使用大数据进行研究会不会犯“大数据自大”的错误 。

(二)陷阱二:算法演化

相比于“大数据自大 ”问题,算法演化问题(algorithm dynamics)就更为复杂、对大数据在实证运用中产生的影响也更为深远。我们还是借一个假想的故事来理解这一点。假定一个研究团队希望通过和尚在朋友圈发布的信息来判断他们对风险的态度 ,其中和尚遇到老虎的次数是甄别他们是否喜欢冒险的重要指标 。观察一段时间后该团队发现 ,小和尚智空原来遇到老虎的频率大概是一个月一次,但是从半年前开始,智空在朋友圈提及自己遇到老虎的次数大幅增加、甚至每天都会遇到很多只。由于大数据分析不关心因果 ,研究团队也就不花心思去追究智空为什么忽然遇到那么多老虎,而根据历史数据认定小智空比过去更愿意冒险了。但是研究团队不知道的情况是:过去智空与老和尚同住,半年前智空奉命下山化斋;临行前老和尚交代智空 ,山下的女人是老虎 、遇到了快躲开 。在这个故事里,由于老和尚的叮嘱,智空眼里老虎的标准变了。换句话说 ,同样是老虎数据,半年前老虎观测数量的生成机制,和半年后该数据的生成机制是不同的。要命的是 ,研究团队对此并不知情 。

现实中大数据的采集也会遇到类似问题,因为大数据往往是公司或者企业进行主要经营活动之后被动出现的产物。以谷歌公司为例,其商业模式的主要目标是更快速地为使用者提供准确信息。为了实现这一目标 ,数据科学家与工程师不断更新谷歌搜索的算法、让使用者可以通过后续谷歌推荐的相关词快捷地获得有用信息 。这一模式在商业上非常必要 ,但是在数据生成机制方面,却会出现使用者搜索的关键词并非出于使用者本意的现象。

这就产生了两个问题:之一,由于算法规则在不断变化而研究人员对此不知情 ,今天的数据和明天的数据容易不具备可比性,就像上例中半年前的老虎数据和半年后的老虎数据不可比一样。第二,数据收集过程的性质发生了变化 。大数据不再只是被动记录使用者的决策 ,而是通过算法演化,积极参与到使用者的行为决策中 。

在GFT案例中,2009年以后 ,算法演化导致搜索数据前后不可比,特别是“搜索者键入的关键词完全都是自发决定”这一假定在后期不再成立。这样,用2009年建立的模型去预测未来 ,就无法避免因过度拟合问题而表现较差了。

(三)、陷阱三:看不见的动机

算法演化问题中,数据生成者的行为变化是无意识的,他们只是被页面引导 ,点出一个个链接 。如果在数据分析中不关心因果关系 ,那么也就无法处理人们有意识的行为变化影响数据根本特征的问题。这一点,对于数据使用者和对数据收集机构,都一样不可忽略。

除掉人们的行为自发产生系统不知道的变化之外 ,大数据的评估标准对人们行为的影响尤为值得关注 。再以智空为例。假定上文中的小和尚智空发现自己的西瓜信用分远远低于自己好友智能的西瓜信用分。智空很不服气,经过仔细观察,他认为朋友圈言论可能是形成差异的主因 。于是他细细研究了智能的朋友圈。他发现 ,智能从不在朋友圈提及遇到老虎的事,而是常常宣传不杀生 、保护环境、贴心灵鸡汤,并定期分享自己化斋时遇到慷慨施主的事。虽然在现实中 ,他知道智能喜好酒肉穿肠过、也从未见老和尚称赞智能的化斋成果 。智空茅塞顿开,从此朋友圈言论风格大变,而不久后他也满意地看到自己的西瓜信用分大幅提高了。

如今 ,大数据常常倚重的一个优势,是社交媒体的数据大大丰富了各界对于个体的认知。这一看法常常建立在一个隐含假定之上,就是人们在社交媒体分享的信息都是真实的 、自发的、不受评级机构和各类评估机构标准影响的 。但是 ,在互联网时代 ,人们通过互联网学习的能力大大提高 。如果人们通过学习评级机构的标准而相应改变社交媒体的信息,就意味着大数据分析的评估标准已经内生于人们生产的数据中,这时 ,不通过仔细为人们的行为建模,是难以准确抓住的数据生成机制这类的质变的。

从数据生成机构来看,他们对待数据的态度也可能发生微妙的变化。例如 ,过去社交媒体企业记录保存客户信息的动机仅仅是本公司发展业务需要,算法演化也是单纯为了更好地服务消费者 。但随着大数据时代的推进,“数据为王”的特征越来越明显 ,公司逐渐意识到,自己拥有的数据逐渐成为重要的资产。除了可以在一定程度上给使用者植入广告增加收入之外,还可以在社会上产生更为重要的影响力。这时就不能排除数据生成机构存在为了自身的利益 ,在一定程度上操纵数据的生成与报告的可能性 。比如,在Facebook等社交媒体上的民意调查,就有可能对一个国家的政治走向产生影响。而民意调查语言的表述、调查的方式可以影响调查结果 ,企业在一定程度上就可以根据自身利益来操纵民意了。

简而言之 ,天真地认为数据使用者和数据生成机构都是无意识生产大数据 、忽略了人们行为背后趋利避害的动机的大数据统计分析,可能对于数据特征的快速变化迷惑不解,即便看到模型预测表现差 ,也难以找到行之有效的克服 ***  。

四、前车之鉴

目前,我国高度重视大数据发展。2015年8月31日,国务院印发《促进大数据发展行动纲要》 ,系统部署大数据发展工作。《纲要》认为,大数据成为推动经济转型发展的新动力(310328,基金吧)、重塑国家竞争优势的新机遇,和提升 *** 治理能力的新途径 。《纲要》指出 ,2018年底前,要建成国家 *** 数据统一开放平台,率先在信用 、交通 、医疗等重要领域实现公共数据资源合理适度向社会开放。与此相应 ,近年来多地成立了大数据管理局、业界学界对于大数据的分析利用也予以热烈回应。因此,了解大数据分析的优势与陷阱,对我国的经济发展和实证研究具有极其重要的意义;而GFT项目折射出的大数据使用中可能存在的机会与问题 ,都值得关注 。

(一)防范“大数据自大 ”带来的风险

GFT案例表明 ,如果认为大数据可以代替小数据,那么过度拟合问题可以带来巨大的估计误差 。这一点在“大众创业、万众创新”的今天尤其需要关注。这是因为大数据作为目前“创新”最闪亮的新元素被高度推崇的,而我国经济处于转型时期的特征 ,使企业或者机构面对的微观数据不断发生动态变化。如果在数据挖掘中忽略这些变化,往往要面临过度拟合带来的损失 。

例如,我国P2P网贷行业采用的数据体量虽然大多达不到大数据要求的海量数据 ,但是不少企业热衷采用爬虫等技术从社交媒体挖掘信息用于甄别客户。这些平台健康状况,就可能与过度拟合的严重程度密不可分。根据中国P2P网贷行业2014年度运营简报和2015年上半年的运营简报,在图一我们可以推算2006年到2004年间和2015年1-5月间月均新增问题平台数 ,并与2015年6月新增问题平台数作比较 。[1]

新增问题平台的大幅增加原因虽然有多方面,但是从数据分析的角度看,由于还没有合法的数据共享机制 ,P2P平台在甄别客户质量时,往往只依靠自身渠道和从社交媒体等挖掘的数据,并采用数据挖掘 *** 建立相应建立模型。在数据分析中 ,不少P2P平台往往疏于查考自身样本的代表性 、也忽略宏观经济数据和其他微观数据所包含的信息。由于互联网金融公司出现时间短、又主要成长于经济繁荣期 ,如果单单依赖有限的数据渠道,数据挖掘与机器学习过程对新常态下个体行为没有足够的认识,在经济下行时仍然根据历史数据而低估逾期率 ,导致高估平台健康状况,最终不得不面对问题平台不断增加的局面 。

(二)大数据和小数据齐头并进大势所趋

大数据和小数据各有优劣。简而言之,小数据通常不会假定该数据就是总体 ,因此收集数据前往往需要确定收集数据的目标、根据该目标设计的问卷或者收集 ***  、确定抽样框。在数据采集后,不同学者往往可以通过将新收集数据与不同数据的交叉验证,来评估数据的可信度 。小数据在收集上有变量定义清晰、数据生成机制基本可控、检验评估成本相对较低等优点 ,但是缺点是数据收集成本高,时间间隔长 、颗粒度较粗。

大数据的优势就包括数据体量大、收集时间短、数据类型丰富,颗粒度很细。但是 ,由于大数据往往是一些企业和机构经营活动的附带产品,因此并不是通过精心论证的测度工具生成 。另外,由于大数据的体量很大 ,交叉验证数据的可信度 、不同学者采用相同数据独立研究以检验数据的前后一致性等工作难度较大 。这些特点意味着大数据本身未必有科学研究要求的那样准确、可靠 ,在数据分析中就需要对大数据适合研究的问题有较清晰的认识。

在与小数据互为补充推动研究与认知方面,大数据大有可为。将大数据与小数据相结合,可以大大提高数据的颗粒度和预测精度 。比如对CDC流感发病率的预测研究发现 ,将GFT采用的大数据和CDC的历史数据相结合的模型,其预测能力比单独运用大数据或者小数据要好很多。

大数据往往可以实时生成,对于观察特定社区的动态具有小数据无可替代的优势。比如 ,美国在“九一一 ”之后,出于快速准确估计在某个特定小社区活动的人口的需要而启动了“工作单位和家庭住址纵向动态(LEHD)”项目,该项目将人口普查数据、全国公司数据 、个人申请失业保险 、补贴、纳税等记录联通,可以对社区在短时间内的“新陈代谢”作出较为全面的刻画 。

这类的数据结合研究 ,对于了解我国社会经济状况的动态变化会十分重要。一个可能的应用是,将城市人口、工作状态 、性别、年龄、收入等小数据采集的信息,和实时产生的交通状况相结合 ,来预测人们的出行特征,来解决城市交通拥堵 、治理雾霾等问题。另一个可能的应用是,推动人民银行征信中心个人征信系统数据和民间征信系统大数据的结合 ,建立高质量的中国个人征信体系 。

另外 ,我国经济处于转型时期,有不少政策亟需快速评估政策果效。以小数据为基础,利用大数据数据量丰富的优势 ,可以通过互联网做一些随机实验,来评估一些政策的效果,也是可能的发展方向。

在过去的十多年中 ,我国在通过非官方渠道采集小数据、特别是微观实证数据方面取得了长足进展 。在多方努力下,更多经过严格科学论证而产生的数据可被公众免费获得并用于研究。例如,北京大学的“中国健康与养老追踪调查 ”、“中国家庭追踪调查 ” ,都由经济 、教育、健康、社会学等多领域的专家协同参与问卷的设计和数据采集的质控。在这些努力下,小数据的生成机制更为透明,交叉验证调查数据的可信度等实证研究的必要步骤也更为可行 。

但是 ,目前在小数据的收集和使用 、 *** 和有关机构的小数据开放运用方面,我国还有很大推进空间 。只有在对涉及我国基本国情的小数据进行充分学习研究之后,我国学界和业界才能对经济政治社会文化等领域的基本状况有较清晰的把握。而这类的把握 ,是评估大数据质量、大数据可研究问题的关键 ,对推进大数据产业健康发展有举足轻重的作用。

因此在政策导向上,为要实现大数据、小数据相得益彰推动经济发展的目标,在促进发展大数据的同时也要大力发展小数据相关产业 ,推动小数据相关研究与合作,使大数据与小数据齐头并进 、互为补充 。

(三)提高大数据使用的透明度,加强对大数据质量的评估

大数据面临的透明度问题远比小数据严重。在GFT案例中 ,Lazer等人指出,谷歌公司从未明确用于搜索的45个关键词是哪些;虽然谷歌工程师在2013年调整了数据算法,但是谷歌并没有公开相应数据 、也没有解释这类数据是如何搜集的。我国大数据相关企业的数据 ,也鲜有学者可以获得并用于做研究的例子 。

与透明度相关的就是大数据分析结果的可复制性问题。由于谷歌以外的研究人员难以获得GFT使用的数据,因此就难以复制、评估采用该数据分析结果的可靠性。因此利用大数据的研究难以形成合力,只能处于案例、个例的状态 。

另外还要注意到 ,如果数据生成机制不清晰,研究结论难以复制,而算法演化也表明 ,最终数据往往成为使用者和设计者共同作用的结果。这种数据生成的“黑箱”特征 ,容易成为企业或者机构操纵数据生成过程和研究报告结果的温床。唯有通过推动大数据的透明化 、公开化,我们才能在大数据产业发展之初,建立健康的数据文化 。

因此 ,在大数据时代,为了更好利用大数据,需要采取相关措施 ,增加在大数据生成过程的透明度方面的努力。例如,采取措施推进数据生成企业在妥善处理隐私信息后,定期公布大数据随机抽样数据、要求数据生成企业及时公布数据算法的变更 ,鼓励采用大数据的研究实现可复制性、便于交叉验证等。

五 、结语

目前有些流行观点认为,在大数据时代,技术容许人们拥有了总体因此抽样不再重要、另外由于数据挖掘术的进展 ,只需关心相关关系而不必再关心因果关系 。而GFT的实例表明,即便谷歌公司用于GFT计算的是数十亿的观测值,也不能认为谷歌公司拥有了流感人群的总体 。误认为数据体量大就拥有了总体 ,就无法谦卑结合其他渠道的小数据 ,得到更为稳健的分析结论。而GFT估计的偏误原因,从来都离不开人们的主动的行为--无论是谷歌公司自己认为的GFT的流行导致更多人使用该搜索、还是Lazer等人认为的算法变化 、丢弃异常值。因此,不明白数据生成机理变化的原因而只看相关关系的后果 ,于谷歌是GFT的计算偏误丢了脸,而对热情地投身于采用大数据到创新、创业中的中国民众和相关机构来说,则可能是不得不面对事先没有预备的重大经济损失 。

以上是小编为大家分享的关于从谷歌流感趋势谈大数据分析的光荣与陷阱的相关内容 ,更多信息可以关注环球青藤分享更多干货

二、产品经理9种数据分析 ***

大家好,我是天王寺一哥,目前在北京做产品经理。

产品经理日常工作中 ,分析数据已经必不可少。利用分析结果来做产品的决策,复盘,成为了产品经理必备技能 。

最近我系统性的学习了产品经理数据分析课程 ,觉得其中“9种数据分析 *** ”非常实用,现总结下来,并结合自己的理解做一个汇总。

这“9种数据分析 *** ”为:

下面按照“比什么” 、“和谁比”来说明:

日常看到的数据数值通常有两种类型:

1)绝对值:数据本身具备参考价值 ,例如电商销售金额、文章阅读数

2)比例值:需要看比例值才能获得相关价值的数据 ,例如留存率、活跃占比等数据

所以对比分析主要是分析比例值。往往我们有两种比较方式:

1)同比:指当前时间范围某个位置的数值与上一个时间范围的相同位置的数据对比,英文是:Same period last year/month/day 。例如5月之一周同比4月之一周。

2)环比:指当前时间范围的数值对比相邻的上一个时间范围,例如5月销售总额环比上涨20% ,指5月销售总比对比4月销售总额上涨了20%

1)和自己比

日常工作中,大部分对比分析都是当前数据与往期数据对比。可以从不同的角度进行对比,例如时间维度 、渠道维度 、业务线维度等 。

2)和行业比

在做数据分析时 ,需要全盘考虑行业整体趋势。例如公司为在线教育行业,今年用户增长较快,团队认为是运营的作用。可如果对比一下行业数据 ,增长可能低于行业平均,增长是因为疫情原因导致的自然增长,这时候就需要调整运营策略了 。

我们在分析数据的时候 ,会力求从有限的数据中挖掘出更大的价值,获取到更多的隐藏信息 。这时候就需要从多个维度去拆解问题。

以一个实际的案例来说明:

小明公司产品为一个象棋平台,平台内有象棋资讯、象棋视频、提升课程 ,问答社区等。平台内金币为虚拟流通货币 。凭此金币可以查看付费资讯 、付费视频、打赏等。现老板要求获知金币的消耗量这一个数据指标。

小明接到任务后 ,将金币的消耗量按照实际的业务场景,进行多维度拆解,梳理了以下维度:

a.时间 。6月初平台进行了重大更新 ,玩儿更多样,所以此次数据分析只统计6月份以后的,并以周为单位进行统计。

b.金币消耗基本数据:消耗总量、总消费人数 、消费次数、充值次数等

c.金币的消费场景:将所有消费场景进行分析 ,期望将消费场景按照金币量进行排序,并将具体消费内容罗列,挖掘信息。

d.金币的消费人群:搞清楚是消费者的画像 ,分析消费人群特征

通过将一个单一指标,多维度的进行分析,是比较常见的分析 ***

此分析 *** 适合于“用户达成某个目标有清晰的使用路径 ” 。例如分析某个课程的购买率。用户是否购买往往与之前的步骤紧密相关 ,如登录——首页点击广告——试看——提交订单——支付成功。

此案例单独看购买率高或低没有意义,必须对整个流程进行多维度拆解,找到里面的关键时刻予以改善 。

漏斗 ,适合于观察有明确使用流程的数据。漏斗是一连串前面影响后面的用户行为 ,层层相扣。

例如某象棋APP的课程购买,最终支付是最后一层漏斗,则其漏斗路径为:

用户注册——查看推荐内容——点击课程——试看——提交订单——支付 。其中用户是否注册登录决定了是否能正常查看推荐内容 ,用户查看推荐内容的数据影响了点击课程链接的数据等等 。

我们日常使用漏斗观察,需注意漏斗的三个误区:

漏斗上一个流程对下一个流程起作用,所以漏斗的流程需要确定合理的时间。例如上面象棋APP的支付漏斗 ,用户的决策时间通常为当天,但如买房决策周期可能持续数月。

漏斗如:A—B—C—D—E 。在观察时候,不能直接A—C—E。这样观察每一层的转化率得出的相应结论是不准确的。

有时候如果发现最终调查的数据有错误 ,则需要确定,是否在统计一个目标的数据时,遗漏了其他漏斗路径

一个事件不仅仅只有累计数据这个指标 ,还可以从该事件在不同维度上的分布情况具体分析 。

例如分析用户总量,可以研究用户总量分布在不同性别,不同年龄和省份的情况。又例如分析某个页面的用户浏览数据 ,可以将总浏览量分布在不同时间、不同流量次数上进行研究。

如图:

在进行留存分析之前 ,需要搞明白留存的定义,不同的公司对留存有不同的计算 ***  。

1)留存算法1=(第七天/之一天)*100%

2)留存算法2=(第二天至第七天所有用户相加去重)/之一天*100%

具体应该采用哪种计算 *** ,需要看我们计算留存的目的。例如:

1)对比不同渠道来的用户的质量采用算法1。因为所有渠道都采用之一日和第七日的数据 ,忽略的信息都是一致的,故可以公平比较

2)若分析一款教人做菜的APP,此APP用户主要在周末打开 。则宜采用算法2。这样更能真实的反映留存情况。

还需要注意的是 ,有些有些公司会将之一天称为第0天 。这样做的好处是,在计算7日留存的时候可以比较对比的是同一个“星期几” 。

根据具体业务场景,分析留存需要选择不同的时间跨度 ,如:

1)了解某一个渠道的质量宜采用日留存(如7日留存)。

2)观察整个大盘的数据宜采用周留存和月留存,较为宏观的观察用户在平台上的粘性

我们长说的用户画像分成两种:

1)用户的详细标签。如身份 、年龄、婚姻、身高体重等 。通过对用户各类特征进行标识,给用户贴上各类标签 ,通过标签将用户进行组合分类,以便对不同的群体进行精细的产品/运营动作。

2)根据用户访谈等手段建立的极具代表性的虚拟用户,在产品规划时 ,使用虚拟用户 ,能快速让团队达成共识。

用户标签种类繁多,大致可以分成四大类:

1)基础属性:年龄 、性别、生日、星座 、教育 、身高、收入、职业等

2)社会属性:婚姻关系 、有无小孩、性取向等

3)行为特征:注册时间、注册渠道 、是否买过某个商品、是否关注过某个问题等

4)业务相关:如健身APP关心用户睡眠质量、体脂率 、高矮胖瘦等

面对如此繁多的标签,该如何获取呢 ,通常有两种方式可以获得:

1)直接获取

我们常见的某些产品,注册时必须要完善填写相关信息

2)通过用户行为推导分析得到

如通过用户的手机机型推导其消费能力,通过购买的产品推导其性别、通过其关注的话题推导其兴趣等 。

在实际工作中 ,一些明确的业务目标往往要进行归因,找到目标达成的关键因素,将有限的资源投入到关键因素中。

按照不同的业务场景 ,大致有三种归因 *** :

1)末次归因

此 *** 适用于转化路径短,且事件之间关联性强的场景。此类场景需要重点关注达到目标前一步 。

如下直播打赏案例,关注目标为充值:

对案例分析得知 ,私信主播后进行充值的路径占比较大,故应尽快提升私信体验。

2)递减归因

此 *** 适用于转化路径长,转化链条上各个事件差异不大 ,没有完全占据主导的事件。

3)首次归因

此 *** 适用于强流量依赖的业务场景 ,用户进入环节比后续所有事都重要 。例如借贷产品。

在漏斗分析中,往往整个流程已经十分清晰。但是在实际业务场景中,我们不太清除用户的使用流程或者流程较为复杂、随机 ,没有很强的顺序 。这时候就比较适合于应用路径挖掘 。

具体 *** 为找到所有流程里面的事件,设置流程的流入与流出页面,将所有的事件放在这个流里 ,用数据工具进行分析。

在进行分析之前,要搞清楚分析的目的,一般适用于以下两种场景:

1)有明确的起始场景。希望分析数据 ,观察这个场景之后到底发生了什么

1)有明确的结果目标 。希望分析数据观察来的用户是怎样一步一步达到目标的

通过路径挖掘,可以找到我们关注的关键路径。只有找出关键路径上面的关键行为,才能打造良好体验。

路径挖掘是挖掘大量用户的行为路径 ,但有时候我们比较关注个体行为,希望了解此个体在使用产品时的完整事件时间线 。如下图:

挖掘单个用户的行为序列通常适用于以下两个场景:

1)寻找被数据统计掩盖掉的信息,还原用户具体的使用场景

2)找到个体的行为特征 ,找到产品价值提升的机会点

案例:

象棋在线平台推出新功能 ,邀请象棋高手入驻,在线教课。功能推出3天,共1万名用户使用体验了该功能。现需要给2名销售分配任务 , *** 联系有意向的老师 。

现使用个体行为序列分析,寻找到反复使用某个功能且停留事件较长的用户,筛选后将1000名用户分配给销售 ,大大提交了合作转化率。

以上就是产品在日常数据分析中,常用的9种分析方式。我是天王寺一哥,一个产品界的小学生 ,期待与大家多沟通,多交流 。

三 、谁能给我奥运常识和北京奥运的一些数据跟常识

持人王惠:各位新闻界的朋友们上午好,非常高兴在北京奥运会主新闻中心例行新闻发布会上和大家见面。大家知道北京的空气质量一直是媒体长期关注的问题 ,当然也是北京市 *** 和北京奥组委长期以来非常重视的一项工作,因此我们也采取了非常多的有效措施,大家也知道近期围绕着环境保护采取了很特别的措施 ,今天新闻发布会就是围绕这个主题向大家介绍近期北京的空气质量问题。向各位介绍一下出席今天新闻发布会的有关领导 ,他们是:北京市环保局副局长、新闻发言人杜少中先生,也是大家非常熟悉的一位发言人 。北京市气象局气象台台长郭虎先生 。另外还有一位比较特别的嘉宾是美国环保协会中国项目的负责人张建宇先生。现在先请杜先生给大家介绍一下最近的北京环保的有关情况。

主持人王惠吕凤泉摄

杜少中:朋友们大家上午好!今天我向大家介绍7月份以来北京市空气质量的变化情况 。7月1日到25日我市空气质量达标天数为22天,占本月已监测天数的88% ,比去年同期多了两天。同时,今年以来,累计达标天数为145天 ,占已监测天数的70%,比去年同期多了15天。从大气环境污染物浓度的变化情况来看,各项主要污染物特别是与交通排放相关的一氧化碳、二氧化碳 、可吸入颗粒物的浓度分别比去年同期下降了20%左右 。还有一个特别需要说明的问题是在已经过去的20多天里 ,API(空气污染指数)平均比去年同期减少20百分点,也就是同属于二级达标天的情况下,去年达标天的水平在API指数是90左右 ,今年在70左右。通俗地说,我们今年的达标天数当中的含金量提高了。这样的情况,相对应的气象条件是本月上中旬气象条件比较有利于污染物的扩散 ,冷空气活动比较频繁 ,高空气温偏低,有利于大气污染物的垂直扩散,并且多次明显地降雨 ,有利于对空气当中污染物的清除 。但是进入下旬以后,不利于污染物扩散的气象条件出现,高温高湿风力很小 ,据监测表明,很多情况下都是在风力不足1米或者1米左右的情况,这样的气象条件 ,大气当中的污染物的积累速度明显地减缓。说明我们的减排措施已经开始出现比较明显的效果。

杜少中发言张宇摄

为什么会出现空气中污染物浓度下降,积累明显放缓的情况呢?7月1日开始采取了机动车临时限行措施,7月20日开始采取了对重污染施工工序停工 ,对重污染企业要在达标排放的基础上,继续减少30%的排放措施,这些措施以及我们以前采取的综合治理措施 ,综合的发挥作用 ,将有利地保障奥运会期间的空气质量良好 。我向大家介绍的情况就到这里。

我很高兴回答大家提出的问题。

主持人王惠:谢谢杜局长 。对于杜少中先生的发言,张建宇先生有什么补充 。

张建宇发言张宇摄

张建宇:谢谢,各位媒体朋友大家早上好 ,我叫张建宇,在美国环保协会工作,它是一个总部设在纽约的美国非 *** 组织。从1998年开始收到中国 *** 的邀请 ,在中国开展了一系列环境保护方面的工作,有政策研究 、开展试点、培训、公众宣传 、教育和参与等活动。很荣幸北京迎来2008年奥运,在这样千载难逢的机会 ,在这样大的氛围下,通过我们的努力,为北京奥运会 ,为北京环境保护做出贡献 。从2006年开始,我们就和其他中国民间环保组织、媒体、社会单位一起开展了一系列“少开一天车” 、“绿色出行 ”等活动。我们很高兴看到在三年过程中,随着奥运会离我们越来越近 ,人民群众对奥运的热情也越发高涨 ,自己做出一些实际行动,为北京的蓝天做出贡献的参与热情也越来越高。最近随着北京市 *** 采取的限行措施,在20日之前有了新行动 ,和北京车友会和其他民间组织支持 *** 采取的限行措施 。另外一方面希望大家能够以单双号限行为契机,改变自己的出行方式。为此特别做了网上计算器,所有的人如果参与这样的行动 ,通过在网上标注出发点和起始点,计算器可以帮助你计算出在采取不同的出行方式的时候,可以少排放多少污染物 ,同时可以帮助你计算出为北京做出多少贡献。随着这个行动开展得广泛,人民群众越来越知道,响应的人越来越多 ,现在网上计算器到昨天网上统计,浏览人有几十万,注册人有五万人左右 ,很期待随着单双号行动开始 ,从7月20日到9月20日期间,所有参与绿色出行的人为北京所做的贡献,通过网上计算器能记录出来 ,最终成为个人对奥运的献礼 。工作介绍就到这里,欢迎媒体提出各样的问题,很愿意回答大家的问题。

主持人王惠:下面请记者提问。

王惠邀请记者提问张宇摄

澳大利亚记者:昨天的评估指数是104 ,请你告诉我们,这些评估数字从何得来?第二点,澳大利亚有运动员反映出现过一些呼吸方面的问题 ,怎么样能够保证奥运会期间的空气质量?

澳大利亚记者提问张宇摄

杜少中:不知道你说的104数字是怎么评估出来的,但是我可以告诉你,昨天北京的空气质量自动监测系统的监测结果表明 ,空气污染指数是110 。第二个问题,怎么样保证奥运会期间的空气质量良好,这个问题确实很大 ,但是可以做简要的介绍 ,我们的奥运承诺有三项,之一每天对四项主要污染物,二氧化硫、一氧化碳、二氧化碳和可吸入颗粒物进行监测;第二致力于全年空气质量改善;第三保持奥运会期间的空气质量良好。关于这三项承诺 ,之一项已全面兑现,北京已经建成比较完备的空气质量监测系统,27个自动监测子站分布在城乡各个部位 ,同时每天对4项污染物进行监测,并且向社会公布,应该说超额兑现承诺。第二 ,致力于全年空气质量的改善,从1998年以来,北京进行大规模的空气污染治理 ,98年达标天气只有100天,到2007年达标天数是246天,占67.4% ,9年期间 ,增长了40个百分点 。各项污染物按照前面说的顺序,分别下降60.8% 、39.4%、10.8%、17.8%,申奥成功后 ,四项污染物分别下降为34% 、26%、7%、9% 。同时我可以清楚地告诉你,四项污染物前三项已经在全年稳定达到国家标准,颗粒物虽然没有达标 ,但也有一定程度的下降。第二项承诺应该说也兑现了。

关于第三项承诺的具体内容就是要保证奥运会期间空气质量良好,这个问题的明确答案要等到奥运会结束以后,我们才能够做出 。但是可以根据已经取得的成果和采取的措施和正在采取的措施 ,对奥运会期间的空气质量做出科学的合乎逻辑的推断,刚才介绍了已经取得的进展,同时还要向大家介绍 ,今年以来空气质量改善的情况。大家都知道针对前面讲到的全年颗粒物没有达标这个主要问题,针对一年当中70%的空气质量是达标的,30%的空气质量还不达标 ,这样一个基本矛盾。我们用了两年的时间 ,组织北京的科研院所 、大专院校,众多学科的专家参与研究论证,周边六省市参加 ,在国家环保部和北京市人民 *** 牵头下,制定了奥运空气质量保障方案,这个方案已于去年10月份经国务院批准实施 ,主要内容包括奥运前的综合治理措施和奥运期间的临时减排措施 。关于奥运前的综合治理措施集中反映在北京市人民 *** 今年年初发布的第14阶段大气污染治理措施的通告当中,主要内容包括机动车污染治理,燃煤污染治理 ,施工扬尘控制以及工业污染治理四个方面。在21项措施中机动车实行国四标准,同时实行国四燃油标准。新改扩建燃煤设施,全部执行和燃气设施一样的排放标准 。燃煤设施排放标准也接近了燃煤燃油的排放标准 ,这些标准都是世界上最严格的标准,发挥了非常重要的作用。所以今年上半年,各项主要污染物分别比去年同期下降了20%左右(颗粒物除外 ,下降7%) ,空气质量明显比去年同期有了进一步的改善。

第三部分是奥运期间临时减排措施,可以把北京空气质量改善和奥运期间空气质量保证形象地比喻为三级跳,之一级是前面介绍的九年时间 ,空气质量改善 、空气污染物下降的情况 。第二级是今年以来综合治理措施所达到的空气质量改善的目标。第三级是进入七月份以后,采取的临时减排措施。这个临时减排措施已初步显示出了空气质量改善的成果 。通过这样一些分析,可以非常有信心地告诉大家 ,我们将保证奥运会期间的空气质量良好,使北京的大气环境质量进一步改善 。谢谢大家!

CBS记者:我能不能把您的答案做一个精炼,每个人口众多的城市都有很多机动车 ,雅典、洛杉矶都有这样的问题。每个城市都希望能够更好地表现自己在空气质量治理方面取得的成就,我也对您取得的成就,降低污染程度表示祝贺。但是不管过去几个月当中做了什么 ,这能不能向运动员们保证,空气是能否适合竞赛的需求?

CBS记者提问张宇摄

杜少中:这个问题已经有了非常明确的答案,我刚才已经详细地介绍了 ,结论是可以保证奥运会期间空气质量良好 ,为运动员提供良好的大气环境 。更权威的是国际奥委会和相关的医学委员会已经做出了结论,认为是完全可以保证的。谢谢!

洛杉矶时报记者:昨天空气是灰色的,这如何解释?在街上走几分钟 ,我的肺就不舒服了。

洛杉矶时报记者提问张宇摄

杜少中:我不知道今天BBC来没来,本来想在这里和他探讨两个常识性的问题 。其中有一个问题,不知道大家注意到没有 ,今年的7月8日BBC在相关网站上发了两张照片,在同一个建筑物上一张照片是很透亮的,一张照片是颜色比较灰暗 ,用以说明北京的空气质量还有问题。我们的态度非常明确,北京的空气质量确实存在着需要进一步改善的问题,因为一年当中有70%的空气质量是达标的 ,有30%的空气质量不达标的,这是非常现实的问题。但是用照片去评价空气质量,这种办法是不科学的 ,因为照片作为视觉的作品产物 ,它不能反映空气质量的本质特征,需要用监测数据来显示,而不能用肉眼感觉 。

一年当中有70%的空气质量合格 ,30%的空气质量不达标,怎么能够保证奥运期间的空气质量达标呢?这是非常简单的问题。对于有专业知识的人或者对北京的空气质量进行过考证的人是不难回答的。就全年而言30%的空气质量不达标,这是就颗粒物主要污染物而言 。同时它也告诉我们 ,这个30%在全年当中的分配是不平均的,就是说在那些不利于污染物扩散的季节里有可能会出现颗粒物超标的。比如春季容易出现沙尘,不达标的天数就多 ,在污染物容易扩散,有利于扩散和有利于清除的季节里,空气质量就相对好 ,空气质量保证的难度就相对小。因此我们针对这种情况,针对全年颗粒物还不达标的情况,制定了奥运空气质量保障方案 ,这个保障方案的作用就是要使城市污染物整体污染水平下降 。今年7月份的达标天气虽然比去年同期仅仅多了两天 ,但是每个达标数据显示比去年同期平均要下降20个百分点 。说明污染物排放总体水平在下降,我们才能够保证在这期间不出现或少出现不达标的天数,这就是我们为奥运会空气质量提供良好保证非常重要的基础 ,请大家注意研究这个事实。谢谢!

北京青年报记者:我的问题想提给北京气象局的台长先生。不知道气象局现在对奥运会开幕式那天天气判断会是如何?据您所知有没有具体的措施,如果那天下雨的可能性比较大的话,会有什么样的措施能够减少下雨?谢谢!

北京青年报记者提问张宇摄

郭虎:这个问题是有关气象与环境关系的 ,在座各位记者朋友都很关心开幕式的天气,新闻发布中心近期安排了一场关于奥运开幕式的天气和奥运会期间(8月8日到8月24日)天气情况的发布会,将在那次发布会上向记者朋友做一个介绍 。

郭虎回答记者提问张宇摄

澳大利亚九频道:我们在几十米外就看不见场馆了 ,除了运动员在体育馆里能看见之外,空气的清晰度能够让我们在多远之内看到漂亮的场馆呢?

澳大利亚第九频道记者提问张宇摄

杜少中:其实这个问题应该由我和郭虎台长共同回答。我们有很多人在一年当中很多时间里都能清楚地看到鸟巢,拍出来很漂亮的照片 ,给人以赏心悦目的感觉。但是确实在有些情况下,是看不太清楚的,比如说雾天、雨天 、黑天都看不清鸟巢 ,这是很自然的现象 。就像在浴室里洗澡也可能看不见对面的人 ,但是那里面没有污染。当然不是说我们的空气质量没有问题,确实还需要进一步改善。所以我想说一个常识性的问题,经常有人问我怎么判断蓝天?回答非常简单 ,一个通俗的说法,蓝天和空气质量有关,但又不能绝对划等号 ,达标天或者说判断环保意义上的蓝天就是要看空气质量监测的指数,要用科学数据说话 。谢谢!

郭虎:今年以来北京降水量多,降水日也很多。刚刚过去的6月份 ,北京出现的降水日是14天,比常年多出4天,在6月下旬到7月1日北京连续十天出现降水天气 ,而且都是雷阵雨天气,这种降水天气有利于空气污染物的扩散。所以到了6月下旬,北京基本都是好于二级以上的好天气 。这个时候老百姓对蓝天感觉可能有一些差异 ,觉得怎么阴天还是达标天 ,达标天和蓝天?还是一个概念的问题。另外由于降水的日数多,北京从今年到现在降水比常年偏多将近三成,低层的湿度非常大 ,这段时间,本市低层相对湿度达到了70%到80%。晚上达到80%到90% 。从气象角度来说,6月份下旬开始 ,北京多是轻雾天气,由于低层水气大量凝聚影响到了能见度,影响太阳照射 ,所以能见度不是特别好,造成了看建筑物稍微有些模糊的情况 。

*** 记者:海外华人不但关心奥运会,更关心奥运会结束以后北京的空气质量 ,现在实行的单双日限行是暂时性的,我们现在很关心在奥运结束后,这些措施能否持续下去 ,比如现在执行的关闭工厂 ,单双号行驶等,在以后是怎样的政策,请您给解释一下。

*** 记者提问张宇摄

杜少中:这个问题答案是肯定的 ,过去所有采取的措施大部分是长效的,即使奥运会期间的临时减排措施,包括机动车限行、重污染施工工序和重污染企业减排 ,在奥运会以后,虽然在形式上不能原封不动地继续执行,但是其中很重要的内容 ,都会作为非常有益的经验,在奥运会后实施。奥运会作为重要的契机,使北京的环境质量得到进一步的改善 ,奥运会以后在新的台阶上继续改善环境质量,建设宜居城市,让北京人民满意 ,让中国人民满意 ,让海内外华人华侨满意 。

华尔街日报:上周我们实施了最严厉的措施来治理空气污染,但是根据你们的统计,有两天的污染物的水平非常高 ,已经达到了老年人的三级警告,不能到户外活动,这些严厉措施发挥作用了吗?有证据表明这些严厉措施在过去这段时间确实有帮助 ,改变空气质量?

华尔街日报记者提问张宇摄

杜少中:这个现象说明了三个问题。之一个问题,说明控制减排措施已经初步显现了成效,已经向社会发布从20日以后 ,空气污染指数分别是55、65 、67、89、113 、110,四天达标,两天三级。这些指标是和去年同期以及同类气象条件相比 ,有了明显的下降,同时这些指标是在污染物不易扩散的气象条件下达到的 。如果我们不采取这些措施,这些指标还会比现在高得多 ,所以说已经初步显现成果。

说明的第二个问题 ,这些措施还是有必要继续执行,让它进一步显现成果,通过一周严格措施和近一个月的机动车限行措施 ,虽然初步显示了成果,但是也提出了问题,我们有必要使这些措施坚持下去 ,让这些措施的效果进一步发挥出来。

第三个问题,实际上是一个意外的收获 。公布的这些数据说明了我们科学认真地对待空气质量问题,同时也说明我们认真地兑现承诺 ,使诸如“空气质量是否改善了”“是否弄虚作假”这样一些不实之词不攻自破。就像有的媒体说的,在过去的监测报告当中,没有100到130的数据 ,过去一周的事实雄辩地说明113、110是在这之间的。

*** 记者:你是不是采取了人为的 *** 改变气候?

*** 记者提问张宇摄

杜少中:用人为的 *** 来减少污染物的排放、改善空气质量是完全有可能的,我们也做出了努力取得了成效,这是不争的事实 。但是要用人的力量去改变气候 ,我们还没做过这种尝试。

*** 记者:就像你刚才说的人工降雨或者是一些化学物质放到大气中。这是很多人这么说 ,我不知道这是否科学,是否使用过人工降雨的方式?

郭虎:杜局长已经谈到了为了保证北京的空气质量,已经采取了很多的措施 ,包括汽车单双号限行问题 。空气质量问题是中国 *** 作出的承诺,现在采取的措施完全能够保证承诺的兑现 。

北京广播电台记者:刚才局长已经讲了这些年中国采取的措施,而且用一些数据也说明了这些年来空气质量的改善。但是从国外媒体上和其他媒体上看到 ,有些运动员依然担心北京空气质量,犹豫来不来北京,还有些人说戴着口罩来北京 ,对这些运动员来说,您对他们有什么样的建议呢?

北京广播电台记者提问张宇摄

杜少中:我对媒体朋友们有一个建议,希望你们把我们对北京空气质量改善取得的成果和已经采取的措施以及向国际社会 、运动员们的承诺做广泛的宣传 ,让他们打消顾虑,放心地到北京参加奥运会的比赛,参加奥运会的各种活动。谢谢!

中国国际广播电台记者:为了保证奥运会期间的空气质量 ,作为监管部门或者 *** 部门对广大的市民有什么样的意见和建议?

中国国际广播电台记者提问张宇摄

张建宇:北京市 *** 专门发了一封信 ,号召全体市民在奥运期间进行绿色奥运,绿色出行 。为了改善城市环境质量, *** 要采取措施 ,企业要响应,还有很重要一方面就是人民群众的直接参与。前一段我看到零点公司做过的调查,发现中国的老百姓很多人很关心环境 ,但是其中有一方面就是他们缺乏相关的知识,同时缺乏相关具体的指导或者具体的行动。如何能让人人都参与到保护环境过程中,如果回顾一下过去三年在北京发生的人民群众参与环境保护的事例 ,本身是逐步演进的过程,奥运会恰恰提供非常好的契机,人要改变环境保护的行为需要两方面的因素 。之一方面需要之一推动力 ,人已经习惯了以前的行为方式,需要一个契机,使得他能够实践另外一种行为方式 ,使他知道另外一种行为方式之后 ,会带来什么好处。另外一个因素,如果人知道那样好的行为方式之后,要有什么样的机制使他好的行为持续保持下去。北京在三年以来 ,一直开展的“少开一天车,绿色出行 ”这样的活动,包括最近7月20日到9月20日单双号这样的契机 ,大家都能看到,实施单双号交通多么好,逐步看到蓝天 。通过奥运会期间的行动 ,给大家提供了契机,让大家把好习惯保持下去。

新华网记者:我有两个问题,之一个问题问杜局长 ,刚才谈到了单双号行驶和重工业企业停产两项措施改善了空气质量,有没有具体的数据说明一下在这两项措施实施的前后的差别。第二个问题,请问一下郭台长 ,北京这两天的天气非常闷热 ,能见度低 。刚才解释能见度低与肉眼感觉和空气质量关系不大,天气闷热究竟怎么回事,好像跟降水量没有关系。

新华网记者提问张宇摄

杜少中:之一个问题不能够用这周和上周相比 ,因为气象条件不一样进行比较是不科学的,所以经常用今年和去年同期气象条件大体相当下进行比较。至于具体的数字,我已经向大家介绍了 ,在上周六天分别的监测数据是55、65、67 、89 、113、110 。谢谢!

郭虎:回答你第二个问题 。从20日以后,北京基本没有出现降水天气,温度比较高 ,更高气温33到34度,白天相对湿度60%到70%,夜间的相对湿度80%到90% ,虽然这几天没有降水,由于前期的降水比较多,地面含水量比较大 ,低层水气比较大 ,温度较高,湿度较大,所以人们感觉有闷热天气。再者低层有逆温 ,北京这几天风力比较小,人的体感跟温度和风力有关,温度比较大 ,湿度比较大,就感觉比较闷热。

荷兰媒体:刚才讲到过去几天不太晴朗,您说不是污染 ,我们在统计上没有那么多达标天数,如果不是污染的话,到底我们所看到的是什么?第二个问题 ,逐渐关闭钢铁厂和重污染的企业,是否还有什么具体的细节,到底关闭这些工厂对于改善气候有多大的贡献?

荷兰电视台记者提问张宇摄

杜少中:刚才从不同角度做过介绍 ,看天的颜色和气象条件有关 ,也和是否污染、空气当中污染物排放的浓度有关 。第二个问题,所有的措施都对空气质量改善发挥了非常重要的作用。谢谢!

主持人:谢谢大家今天来光临新闻发布会,发布会到此结束 ,也谢谢各位工作人员和同传工作人员。谢谢!

相关链接

·[BIMC]北京城市运行情况新闻发布会(交通保障与环境保护)

·[BIMC]绿色奥运发布会(城市绿化和水环境治理)

·[奥组委]“奥运村即将开村”新闻发布会

·[BIMC]中国奥林匹克标志及商标专用权保护工作新闻发布会

·“平安奥运之北京奥运会安保工作”新闻发布

|合作伙伴|关于我们|联系我们|

最新文章