Plltxe.
418 subscribers
1.26K photos
32 videos
8 files
4.36K links
plltxe (v.) say.

Tweets, toots, and jibber-jabbers of Eana Hufwe.
Mostly in variants of en, ja, zh and 08n.

Follow me on Mastodon/ActivityPub Fediverse:
https://s.1a23.studio/@eana

Channels I contribute to regularly: @translationgrass etc.
Download Telegram
Programmer Humor
Why? https://redd.it/ggy8hz by @programmer_humor
LaTeX 编译里面这种事情很常见啊,好多地方都是要编译两次才能补完引用的。
Hey UNO! You don’t write Arabic like that. https://t.co/Yxp81kQu4a

🐦
Plltxe.
❤️🐦
The Missing Semester of Your CS Education

https://missing.csail.mit.edu/
📊 Polls Channel
在书写/键入横排简体中文时,你会使用哪种引号? by Eana Hufwe
#PollEditorial

直角引号和弯引号。
个人偏好而已。我比较喜欢在中文里用直角引号,因为看起来不错。顺带着,直角引号在渲染的时候基本能保证和句号一样宽。

另:横排文字时,大陆规范是弯引号、港澳台和日文是直角引号。


法文等欧洲语言是用这套尖引号的。« 看起来像书名号,但确实不是。 » 而且引号两边都要空格。

日文在新闻媒体上面还有用一种叫 Double Prime 的引号。〝看起来有点像西文的弯引号,但又不像〟。

西文的弯引号、尖引号变种也有不少,像„德语“、„波兰语”、»丹麦语«之类的,在这里就不赘述了,有兴趣的可以翻一翻维基百科的相关介绍
Forwarded from 📊 Polls Channel (📊)
在足够复杂的排版工具中混排中西文,并且两方面都使用弯引号的情况下,你会注意使用正确的引号宽度吗? by Eana Hufwe
Anonymous Poll
62%
15%
分情况
9%
不会
14%
不满足前提条件
📊 Polls Channel
在足够复杂的排版工具中混排中西文,并且两方面都使用弯引号的情况下,你会注意使用正确的引号宽度吗? by Eana Hufwe
#PollEditorial

同上一篇 Editorial,这里不争论我们是否「应该」在中文里面用弯引号。如果没有硬性规定,按个人偏好就好。

Unicode 里面常用的中文标点:
“” 弯引号,在部分西文排版里面同样适用。中文里各占一个汉字宽。
• 间隔号,同上。
… 省略号,同上。中文里占一个汉字宽,且居中。
—— 破折号,表现为两个 em dash。西文排版中常使用一个 em dash,置于 x-height 中央。中文里面破折号居中,连打两个中间不应断开。或是直接使用更长的 2-em dash(⸺,U+2E3A)

关于破折号码位的历史遗留问题及混乱的现状,可以参见 The Type 的这篇文章

这些标点在 Unicode 上面都是使用的同样的码卫。Unicode(大致)的编码标准是「只编码字符(character)、不编码字形(glyph),除非有其他编码区分了两个字符。」*

* 当然例外是数不胜数的。

至于我们看到的应该是中文的版本还是西文的版本,简单来说就是:看字体和渲染引擎。

理想状态下,在多语言混排中显示正确的标点字形需要内容提供者,渲染引擎和字体(有时候不需要)一起合作达成。

内容提供者需要给文字标注正确的语言来提醒渲染引擎使用正确的语言渲染设定。对于简单的文字处理环境,像纯文本编辑器、或者 Telegram 的输入框,在源头上面已经就是不可能的了。其他较为复杂的排版工具,例如 MS Word、一众 Adobe 软件,甚至 HTML 5 搭配现代浏览器都可以对文字标注语言提示。

渲染引擎层面上对于多语言字形处理大致分为两类:①忠实的实现 OpenType locl 功能支持,并按照字体指定的字形来渲染。②在上述基础上实现一套自有的微调排版规则。

①在现代排版引擎中是比较常见的做法,而②则常见于 InDesign 等专业的排版软件中。有些足够复杂的排版引擎可以通过各种微调来直接使字形展现出需要的形态而无需字体的支持,因此字体方面在这些情况下并不是必要的。

字体方面,各方面考虑完善的一个中文字体会通过 OpenType 的 locl 功能来为中文和西文分配适当的字形,例如思源字体系列就有这样的做法。locl 功能允许一款字体根据显示内容的语言和区域习惯来为同样的字符展示不同的字形。这一功能除用于中文标点之外,还可以用于保加利亚语、塞尔维亚语中一些西里尔字符的规范写法。

上面的截图是使用思源黑体,通过 Chrome 渲染的带有语言标签的 HTML 内容。可以看出,适当做出语言标记的文字是可以被正确渲染的。

可惜的是,这样的高质量中文字体确实少之又少。许多时候用户只能手动为中西文指定不同的字体,甚至就放任错误的标点在纸面/画面上。这种缺少对现代 OpenType 功能的支持——甚至有些字体连标点符号的位置还都摆放不对——也从一个侧面映射出中文数字排版整个生态还有很长的一段路要走。

(不知不觉俺竟然写了这么长,是不是再添点什么又可以凑一篇博文了 😁😁
This media is not supported in your browser
VIEW IN TELEGRAM