《美联社格式指南》的 Twitter 晚上发了一条 推文,提起「over」和「more than」的用法辩论。虽然这本格式指南面向记者,但自 1953 年公开出版以来,其对语法、标点等格式的规范也对大众产生巨大影响。
在英语用法中,曾一度普遍认为在表述数额「超过」或「少于」时,「more than / less than」要比「over / under」更为妥帖。而《美联社格式指南》的两位编辑在 2014 年的美国编辑学会(ACES)年会上 宣布 修改此前对这一用法的规范,即不再强调何者更为适当,改为两者都可接受,随即引发 热议。举个不恰当的例子,就好像新华社突然宣布,以后的通告无需再循《新华社新闻报道中的禁用词》 了,或者人民日报不再用「毛式中文」写评论了,大家都会十分在意(新华社十余年来禁用「亲自」报道领导人活动,不过最近反倒是滥用起来)。
就像推文中也提到的,「over」在新闻标题中更节约字数,其实这么多年以来许多报章标题也如此做,因此作出此修改也是基于语言的动态变化。去年底的 Grammar Girl 播客的 一期节目 也谈了这个议题。
这也让我想到了 The Devil's Dictionary 中的对词典编纂者的戏谑(见图)。重视语法可以提高沟通效率,但也应小心变成「语法沙威」。
在英语用法中,曾一度普遍认为在表述数额「超过」或「少于」时,「more than / less than」要比「over / under」更为妥帖。而《美联社格式指南》的两位编辑在 2014 年的美国编辑学会(ACES)年会上 宣布 修改此前对这一用法的规范,即不再强调何者更为适当,改为两者都可接受,随即引发 热议。举个不恰当的例子,就好像新华社突然宣布,以后的通告无需再循《新华社新闻报道中的禁用词》 了,或者人民日报不再用「毛式中文」写评论了,大家都会十分在意(新华社十余年来禁用「亲自」报道领导人活动,不过最近反倒是滥用起来)。
就像推文中也提到的,「over」在新闻标题中更节约字数,其实这么多年以来许多报章标题也如此做,因此作出此修改也是基于语言的动态变化。去年底的 Grammar Girl 播客的 一期节目 也谈了这个议题。
这也让我想到了 The Devil's Dictionary 中的对词典编纂者的戏谑(见图)。重视语法可以提高沟通效率,但也应小心变成「语法沙威」。
欧洲许多国家有着子女与父母同住的居住习惯,波恩大学两位经济学教授尝试分析意大利、西班牙等国家的这种代际关系与病死率之间的关联,并通过数据比对宣称这一假设具有合理性,呼吁在社交疏离中关注老龄人口(Bayer & Kuhn, 2020)。虽然结果仅表示了代际互动同病死率之间的相关性,不过也有很强的因果关系暗示,对此意大利的多位研究者也对此作出 回应,质疑这一跨国比较研究背后方法的缺陷。但回到实际人际互动,撇开数字游戏和文化偏见,抵抗力薄弱者同易感染者但密切接触确实会增加潜在传播风险。
2019 公益纪录片《矿民、马夫、尘肺病》 "Miners, the Horsekeeper and Pneumoconiosis", a documentary by Jiang Nengjie
蒋能杰的纪录片《矿民、马夫、尘肺病》拍摄近十年,但因审查制度与市场生态等原因,独立纪录片难以生存。蒋通过在 豆瓣 留下微信,一个个私信发给想看的观众。百度网盘微博曾在月初发出这部「遭遇某种困境」的纪录片的链接,现该条微博已消失。主流媒体中,除了 澎湃新闻 无一论及。而澎湃新闻属于中共上海市委宣传部主管的上海报业集团,2014 年成立,通过报道腐败事件获得较大影响力。去年初因报道袁木死讯被冻结一个月,此后对时政社会新闻报道趋于「收敛」,在此次新型冠状病毒的报道中也有部分报道或被审查或自主删除。
我想,看到这篇文字的读者或许没有从事类似高危职业,也非处于贫穷阶层,因为你能访问「网络」,甚至是「互联网」。掌握拍摄纪录片技能的人,某种程度上也是有「特权」的人。而「失明」、「失聪」、「失语」的,才是这个国家里最多的人。
蒋能杰的纪录片《矿民、马夫、尘肺病》拍摄近十年,但因审查制度与市场生态等原因,独立纪录片难以生存。蒋通过在 豆瓣 留下微信,一个个私信发给想看的观众。百度网盘微博曾在月初发出这部「遭遇某种困境」的纪录片的链接,现该条微博已消失。主流媒体中,除了 澎湃新闻 无一论及。而澎湃新闻属于中共上海市委宣传部主管的上海报业集团,2014 年成立,通过报道腐败事件获得较大影响力。去年初因报道袁木死讯被冻结一个月,此后对时政社会新闻报道趋于「收敛」,在此次新型冠状病毒的报道中也有部分报道或被审查或自主删除。
我想,看到这篇文字的读者或许没有从事类似高危职业,也非处于贫穷阶层,因为你能访问「网络」,甚至是「互联网」。掌握拍摄纪录片技能的人,某种程度上也是有「特权」的人。而「失明」、「失聪」、「失语」的,才是这个国家里最多的人。
日本设计公司 Balloon 的一档音频节目 讨论 了中国一家研究文字、设计和社会的组织 The Type 出版的《中文文字设计研究选集》,在 Twitter 上看到 Ballon 的 CEO 兼设计师志水良同 The Type 互动,也发现这个节目宣称「デザインと社会学」,从设计与社会学的视角讨论话题,于是听了一下。另一位主持人土肥纱绫有体育社会学和应用社会学的教育背景。节目里大致介绍了一下这三本小册子,不过主要聊了其中《上海活字:管窥现代中文字体设计史》一本。而志水良是用 Google Translate 实时翻译辅助阅读的,所以并未能展开太多,也没有太多社会学的探讨。
不过我看到这个频道刚刚发布的一期 新节目 反而更有趣,讨论了前几日,各家电视台对安倍晋三宣布进入紧急事态的直播画面的版面设计,并做了 对比。比如 NHK 的信息量太密集,二维码左下和右上各有一个,观众难以集中注意;TBS 虽然和 NHK 一样也是蓝色调,但以红字突出要点;朝日增加了补充信息,但强调色过多易令人目眩;东京电视台最为简洁明了,但小窗口的池上彰有点「抢风头」;富士在同一画面中有两处速报;读卖的各元素外框与背景有待改善。除了 Balloon 的设计分析,也有关于 观众收视 与 电视台放送与经营 等方面的讨论。各国国内与不同国家的电视台的各式差异,也是一个有趣的问题。
不过我看到这个频道刚刚发布的一期 新节目 反而更有趣,讨论了前几日,各家电视台对安倍晋三宣布进入紧急事态的直播画面的版面设计,并做了 对比。比如 NHK 的信息量太密集,二维码左下和右上各有一个,观众难以集中注意;TBS 虽然和 NHK 一样也是蓝色调,但以红字突出要点;朝日增加了补充信息,但强调色过多易令人目眩;东京电视台最为简洁明了,但小窗口的池上彰有点「抢风头」;富士在同一画面中有两处速报;读卖的各元素外框与背景有待改善。除了 Balloon 的设计分析,也有关于 观众收视 与 电视台放送与经营 等方面的讨论。各国国内与不同国家的电视台的各式差异,也是一个有趣的问题。
gfwlist 这个仓库创建已逾十一载,列出被中国政府和运营商屏蔽的网站,许多人在绕过防火长城时也依此规则。简单统计了一下十几年的文本行数(解码后)及文件大小的变化。一度出现波动和下降,并非审查力度减弱,反而是对原先仅屏蔽个别页面的网站采取了更严厉的措施,规则也不必写那么多了。不过这个列表已有五个月未更新了。
斯坦福大学卫生研究与政策副教授 Kristin Sainani 的一节线上研讨 How to Be a Statistical Detective(如何成为一名统计侦探:用简单方法侦测统计错误),面对医学领域的 再现性危机 介绍了几个避免统计错误的工具。节省时间的话,也可以直接阅读她去年底发的一篇题目相同的 文章,不过研讨中结合了更多案例,并结合每个案例介绍工具。
第一个案例是 2006 年的一篇发在 Nature Medicine 上的 研究,其声称可以识别基因特征,以预测特定癌症药物敏感性,从而为病患匹配最有效的药物。该篇文章最终因一系列问题被撤下。 其中在使用 2003 年 Lancet 上一篇对多西他赛的 研究 相同数据时,犯下指定 0 和 1 时弄反了两种数据这一简单错误。
- 常识
- 简单计算
第二个案例为一项健身运动后的食物摄取补偿机制的 研究,即进行相同的身体活动,作为运动的感知要比娱乐更容易产生享乐心理,摄入更多食物。对实验数据的统计结果中,出现简单的四则运算错误。而为了令 p 值小于 0.5,仅采单尾 p 值,即恶劣的「p 值操纵」(p-hacking)。
- Statcheck,自动抽取文中统计信息、自由度、p 值,检查其一致性。
- GRIM,对小于 100 样本量的数据检测其平均值的合理性。
第三个 案例 并不存在学术不端问题,不过其中相关系数或受强影响点作用,需进一步解释。
- WebPlotDigitizer,抽取图表数据,或自行绘制,以重新分析数据。
最后也对论文作者、评议者、一般读者给建议。研究过程中,最重要的是分析数据之前,对数据进行整理与理解,许多失误往往忽略此步。对于论著中的研究设计、统计数据,许多时候以常识也可以分辨错误。不过这一点对于专业「挑刺」的她显得容易,就像伯恩斯坦在年轻人音乐会上的 音乐测验 一样,毫无乐理知识的人甚至分辨不出这些简单的问题。
第一个案例是 2006 年的一篇发在 Nature Medicine 上的 研究,其声称可以识别基因特征,以预测特定癌症药物敏感性,从而为病患匹配最有效的药物。该篇文章最终因一系列问题被撤下。 其中在使用 2003 年 Lancet 上一篇对多西他赛的 研究 相同数据时,犯下指定 0 和 1 时弄反了两种数据这一简单错误。
- 常识
- 简单计算
第二个案例为一项健身运动后的食物摄取补偿机制的 研究,即进行相同的身体活动,作为运动的感知要比娱乐更容易产生享乐心理,摄入更多食物。对实验数据的统计结果中,出现简单的四则运算错误。而为了令 p 值小于 0.5,仅采单尾 p 值,即恶劣的「p 值操纵」(p-hacking)。
- Statcheck,自动抽取文中统计信息、自由度、p 值,检查其一致性。
- GRIM,对小于 100 样本量的数据检测其平均值的合理性。
第三个 案例 并不存在学术不端问题,不过其中相关系数或受强影响点作用,需进一步解释。
- WebPlotDigitizer,抽取图表数据,或自行绘制,以重新分析数据。
最后也对论文作者、评议者、一般读者给建议。研究过程中,最重要的是分析数据之前,对数据进行整理与理解,许多失误往往忽略此步。对于论著中的研究设计、统计数据,许多时候以常识也可以分辨错误。不过这一点对于专业「挑刺」的她显得容易,就像伯恩斯坦在年轻人音乐会上的 音乐测验 一样,毫无乐理知识的人甚至分辨不出这些简单的问题。
YouTube
Stanford Webinar: How to Be a Statistical Detective
Statistical errors are all too common in medical literature, and contribute to the reproducibility crisis currently plaguing science. Fortunately, you don’t need a degree in statistics to catch these errors. While some errors are impossible to spot without…
The Sociologist
法国经济学家 Thomas Piketty 的去年的新书 Capital et Idéologie (资本论与意识形态) * 最近出了英文版**,延续他此前一本畅销书《二十一世纪资本论》对于欧美新自由主义的收入不平等问题的阐述,而且是从更长时段下统计学观测,批评精英阶层对不平等的维持。 数据到底能不能用来准确反应社会变化,即使今天数据的精确和开放远胜以往,也依然 难以 准确记录和避免误读。The Economist 也批评了这一点,并认为 Piketty 为社会主义辩护。The Guardian 则指,…
Thomas Piketty 接受哈佛大学出版社 采访,谈了 Capital and Ideology 的研究与写作的心得与想法。此前他的 Capital in the Twenty-First Century 一书饱受批评的一点在于其西方中心视角,而 Piketty 在其出版后的交流中拓宽视野,拓展论述了不同国家及时期的社会制度中的不平等。
对于各式意识形态,Piketty 认为它们其实很脆弱,对作为政治结构的不平等不断被冠以各种看似合理的叙事。人们对「不平等」的认知充满宗教性,认为当今的不平等是功绩制的、动态的、开放的,而过往则是威权与不公平带来的必然结果。
长时段的视角也有助于理解看似今天坚固的体系并非不可撼动。Piketty 以瑞典为例,人们以为其社会民主社会模式来自维京文化,实际上瑞典曾长期极度不平等,改变 并没有多久。
对于为何八十年代后的不平等不断加剧之下的左翼政党毫无作为,Piketty 也作出解释。二战之后的各种左翼政党多由教育程度低、社会阶层低的成员组成,而当今的各国民主党、工党、社会民主党可以被称为「左翼婆罗门」,普遍受过高等教育且处于富裕阶层,社会弱势群体也因此不再投票支持(e.g. Jeremy Corbyn)。
对于各式意识形态,Piketty 认为它们其实很脆弱,对作为政治结构的不平等不断被冠以各种看似合理的叙事。人们对「不平等」的认知充满宗教性,认为当今的不平等是功绩制的、动态的、开放的,而过往则是威权与不公平带来的必然结果。
长时段的视角也有助于理解看似今天坚固的体系并非不可撼动。Piketty 以瑞典为例,人们以为其社会民主社会模式来自维京文化,实际上瑞典曾长期极度不平等,改变 并没有多久。
对于为何八十年代后的不平等不断加剧之下的左翼政党毫无作为,Piketty 也作出解释。二战之后的各种左翼政党多由教育程度低、社会阶层低的成员组成,而当今的各国民主党、工党、社会民主党可以被称为「左翼婆罗门」,普遍受过高等教育且处于富裕阶层,社会弱势群体也因此不再投票支持(e.g. Jeremy Corbyn)。
刚刚 Apple Inc. 在其官网宣布将发售 iPhone SE。与此前提及美联社 格式变更、英语中一词缀的 地域差异 等一样,语言与社会密不可分。在 iPhone SE 一例中,中国大陆、香港、台湾 三地都使用中文,而除了一眼就能分辨出来的繁简差异,字体、字形、排印也存在细微差别,用词的不同也在历年频频被提及(Mivansaka 在其博客也做了 整理,中港台外也包含日文,不过对我来说除了文本性,其物质性的差异也不可忽视,故对比中保留呈现于网页中的状态)。社会语言学的视角来看,作为跨国公司的 Apple,在地广告宣传中可见其文字的差异,口语化如「咱们」、「波鞋」、「沒在怕」,受宗教影响如「願光、影、輪廓,全歸世人」等,本地语言与商业活动之间持续互动变化(Bellak 2014, Tietze et al 2016, Gao 2017)。
用数据可视化的方式讲述观点、描述事件愈加普遍,我在年初整理了新型冠状病毒爆发之初的学术机构与新闻媒体的可视化项目,北京大学可视化与可视分析研究小组做了一系列图表,GIJN 收集了中文媒体和全球媒体的数据报道,澎湃对中国各类媒体对数据报道也做了汇总。
以视觉方式呈现信息随着近年技术进步和数字设备普及而井喷,给人以产生时间不长之感,实际上自史前时代开始早有萌芽。
Google 交互设计高级主管 Manuel Lima 前两天在 Crowdcast 上直播一场对话,A conversation on historical data visualization,对谈者有 Michael Friendly 和 Sandra Rendgen,这两位最近都有相关新书上架。Friendly 是约克大学心理学教授,七十年代开始应用量化与计算机方法,九十年代开始研究可视化统计,因此闻名。Rendgen 有艺术史与文化研究的学术背景,现为 Infographics Group 的设计主管。 Lima 之后在 Twitter 上给出了直播提及的一些材料。
Friendly 在去年的芝加哥人文节(Chicago Humanities Festival)上讲了类似的主题,更为详细,也在 Handbook of Data Visualization 的一个章节论述过(Friendly 2008)。
稍稍调查收集一下一两百年前的图表,就会令人惊讶,其实许多今天看起来很花哨的图表早就出现了,甚至在系统性、严谨性上还不如过去。中世纪的耶西之树、拉蒙·柳利的 L'arbre de ciència(科学树)、达尔文的生命树深刻影响后世的谱系关系视觉表达。
Lima 引述了美国作家鲍德温的一句话,「History is not the past. It is the present. We carry our history with us. We are our history.」对于许多事物的理解缺乏历史脉络的认识,也缺少跨学科、跨领域的研究。
以视觉方式呈现信息随着近年技术进步和数字设备普及而井喷,给人以产生时间不长之感,实际上自史前时代开始早有萌芽。
Google 交互设计高级主管 Manuel Lima 前两天在 Crowdcast 上直播一场对话,A conversation on historical data visualization,对谈者有 Michael Friendly 和 Sandra Rendgen,这两位最近都有相关新书上架。Friendly 是约克大学心理学教授,七十年代开始应用量化与计算机方法,九十年代开始研究可视化统计,因此闻名。Rendgen 有艺术史与文化研究的学术背景,现为 Infographics Group 的设计主管。 Lima 之后在 Twitter 上给出了直播提及的一些材料。
Friendly 在去年的芝加哥人文节(Chicago Humanities Festival)上讲了类似的主题,更为详细,也在 Handbook of Data Visualization 的一个章节论述过(Friendly 2008)。
稍稍调查收集一下一两百年前的图表,就会令人惊讶,其实许多今天看起来很花哨的图表早就出现了,甚至在系统性、严谨性上还不如过去。中世纪的耶西之树、拉蒙·柳利的 L'arbre de ciència(科学树)、达尔文的生命树深刻影响后世的谱系关系视觉表达。
Lima 引述了美国作家鲍德温的一句话,「History is not the past. It is the present. We carry our history with us. We are our history.」对于许多事物的理解缺乏历史脉络的认识,也缺少跨学科、跨领域的研究。
Reuters Institute 前两天发布了一篇报告,通过 YouGov 的线上问卷,对来自🇦🇷🇩🇪🇰🇷🇪🇸🇬🇧🇺🇸六个国家的共八千余人,调查了其在新型冠状病毒的全球流行早期(3 月 31 日至 4 月 7 日)获取新闻资讯、评价来源可信度、遭遇错误资讯、对病毒的认知反应,即「信息流行病」(infodemic)。
数据分析可见,新闻依然是这些国家大多数人获取新型冠状病毒资讯的来源,对新闻机构的信任程度也较高。但受教育程度低的人往往不太相信新闻报道和新闻机构。特别是在🇺🇸,不同政治立场和信仰的人对新闻和政府的信任存在明显差异。统计截止至 4 月 7 日,政治立场偏共和党的人群对专家和科研人员的信任已经很低,而在这之后特朗普持续抨击国内专家和世界卫生组织,这一人群对专业知识来源的信任度或持续下降。🇺🇸🇰🇷🇪🇸许多受访者也认为个别政治人物制造了大量自上而下的错误咨询,🇪🇸🇦🇷的社交媒体和即时通讯上的错误与误导资讯比例较高。
新闻机构确实发挥了关键作用,即使在🇨🇳,许多人在疫情爆发初期也通过财新之类的「半独立媒体」获得了许多重要资讯。
数据分析可见,新闻依然是这些国家大多数人获取新型冠状病毒资讯的来源,对新闻机构的信任程度也较高。但受教育程度低的人往往不太相信新闻报道和新闻机构。特别是在🇺🇸,不同政治立场和信仰的人对新闻和政府的信任存在明显差异。统计截止至 4 月 7 日,政治立场偏共和党的人群对专家和科研人员的信任已经很低,而在这之后特朗普持续抨击国内专家和世界卫生组织,这一人群对专业知识来源的信任度或持续下降。🇺🇸🇰🇷🇪🇸许多受访者也认为个别政治人物制造了大量自上而下的错误咨询,🇪🇸🇦🇷的社交媒体和即时通讯上的错误与误导资讯比例较高。
新闻机构确实发挥了关键作用,即使在🇨🇳,许多人在疫情爆发初期也通过财新之类的「半独立媒体」获得了许多重要资讯。
Reuters Institute for the Study of Journalism
Navigating the ‘infodemic’: how people in six countries access and rate news and information about coronavirus
A report on news consumption and trust in news during the pandemic
对上一条中提及的美国存在党派分歧,不仅存在于对资讯来源的偏好、信任和认知层面,已经产生实际的应对流行病风险的行动上的差异。来自微软研究实验室、纽约大学、斯坦福和哈佛的几位经济学家通过 SafeGraph 提供的智能手机 GPS 定位数据,分析社交疏离行动、政党分歧的地理差异之间的关系,得出政治信仰的党派差异与应对疫情之间存在关联显著(Allcott 2020)。
皮尤研究中心前日发布新型冠状病毒期间🇺🇸美国人对🇨🇳中国态度调查报告(Pew 2020),去年底发布的一次🌍全球态度调查已经显示全球多国对中持负面态度。而此前美国总统特朗普发起的贸易摩擦及与此相关的言论影响,加之疫病当下两国口水战愈演愈烈,美国人对中国及中国领导人习近平的评价跌至历史最低。其调查数据中有几点值得关注:
- 对中态度依然存在党派分歧,但长期以来相对持正面观感的民主党也发生变化。
- 以往三十岁以下年轻人对中国持积极态度,近期倾向负面。
- 中国早期处理疫情相较美国更有成效,但起到并未改变对中负面态度作用。
- 九成美国人视中国实力增长为威胁,其中六成视作主要威胁。
- 去年香港逃犯条例事件带来中港关系紧张,但美国人鲜少关心。虽然对人权问题的关注有所增长,但并非主要担忧,生态环境与网络攻击才是最关心的议题。
- 虽然近期美国金融市场急剧动荡,反而美国人视本国为全球最大经济体的看法显著增强。不同年龄、经济阶层、政治立场的人存在对中美国际地位的认知矛盾。
还有一点挺有趣,昨天中国外交部例行记者会上,法新社记者提到了这一数据,耿爽以无意义套话回应。
- 对中态度依然存在党派分歧,但长期以来相对持正面观感的民主党也发生变化。
- 以往三十岁以下年轻人对中国持积极态度,近期倾向负面。
- 中国早期处理疫情相较美国更有成效,但起到并未改变对中负面态度作用。
- 九成美国人视中国实力增长为威胁,其中六成视作主要威胁。
- 去年香港逃犯条例事件带来中港关系紧张,但美国人鲜少关心。虽然对人权问题的关注有所增长,但并非主要担忧,生态环境与网络攻击才是最关心的议题。
- 虽然近期美国金融市场急剧动荡,反而美国人视本国为全球最大经济体的看法显著增强。不同年龄、经济阶层、政治立场的人存在对中美国际地位的认知矛盾。
还有一点挺有趣,昨天中国外交部例行记者会上,法新社记者提到了这一数据,耿爽以无意义套话回应。