三自排版运动(六):与时俱进西洋风

释题

前一篇《古色古香东洋风》上传之后,与时俱进童年才俊们纷纷表示情绪稳定并嗤之以鼻,继续坚持「童年富则兲朝富,童年强则兲朝强」的激进路线抢班夺权。

所以,超过34岁好多年并且被贫穷限制了想像力的精神病仆街写手不入流码农数学渣,决定以身作则示范一下什么叫作「与时俱进」,什么叫作「拿来主义」,什么叫作「境外先进革命理论与本地革命实践相结合」。

有这想法已经很早了,最晚最晚,在《〈范版数学恶补记〉流水账〔卅四〕》当中就提到了:

总之,虽然译本瑕不掩瑜,但是若能修订之后再版就更好了,再版最好出双语对照版,就用英文最新版本做底本,在齐民友译本基础上修订。顺便,作为经典著作,篇幅又很大,双语篇幅更翻了一倍,那么成本肯定低不了,索性仔细修订之后出双色(甚至四色)套印精装本,还就给愿意为知识付出代价的学生们当「讲义」用了。但是不能凭空涨价捞钱,在鸡鸣狗盗之徒把持学术界的现状之下,我对此感到很悲观。

这说的是《可视化复分析》(«Visual Complex Analysis»)一书,手头有汉译实体版和下载的英文扫描版,本来准备当作素材。但是呢,之前旧机正在备份「教材」目录的时候被钦定红客远程入侵刺杀,光荣牺牲。等新机装好之后再找,发现这书的电子版没来及拷过来。仔细审视幸存的内容,双语俱在的只有卢丁的两本:被业界昵称「Baby Rudin」的《数学分析原理》(«Principles of Mathematical Analysis»),以及尊称「Daddy Rudin」的《实分析与复分析》(«Real and Complex Analysis»)。

至于为什么素材选择「英汉」双语对照横排本而不是「日韩蒙满」四语对照竖排本,从而导致一批忠君爱国的青年才俊尤其是手眼通天能指使新闻联播视频编辑夹私货向人民群众灌输歪理邪说力挺塞外侵略者的出版界精英莫名惊诧,那还是因为环境限制。偌大一个兲朝摆不下一张安静的书桌,鞠躬尽瘁的旧机尸骨未寒,当前手头就这点东西。虽然我只懂汉语,但是各种西洋字母总认识,只要有素材,原文和译文扫描识别复制粘贴乃至运用十个手指头敲击键盘都可以。

也就是说,本篇(以及前一篇)的目的是提供一个「模板」,将来兲朝「出版界」再惦记着「没有困难,制造困难也要诈骗预算,顺便粗制滥造」的时候,借口会少一些。估计那时候兲朝出版界大鳄内部的日常是这样的:

「打字你会不会?」

「不会」,忠君爱国的与时俱进的童年才俊紧盯手机头也不抬的回答,「我只有一个手指头」。

缘起

本节预定内容好像在释题当中说过了,那么说点反其道而行之的话题吧。用于「对照」的「双语」通常指代「异族语」和「本族语」,并没有对作者和读者的国籍、民族、宗教、文化背景作出任何限定。

所以,哪怕是拥有了先进革命理论的境外,同样会面对翻译引进的需求,语种不限。比方说前些年(印象里是巴西世界杯德国夺冠之前)曾有兲朝出版界部分人士表示,德国出版界每年翻译引进的书籍数量乃世界第一,作为发达国家仍然睁眼看世界如此虚心,于是正在崛起的兲朝应该如何如何。

与此同时,还有兲朝宗教界部分人士表示,一小撮附教外道打着啥旗反啥旗,倚仗垄断话语权的武德倒打一耙贼喊捉贼造谣污蔑栽赃陷害,官方抨击的「原教旨主义者」偏偏看不到「原教旨主义内容」,只有兲朝钦定汉译本。并且,用于举例的还不是众所周知的绿皮书,而是本朝立国之初从被夹私货的俄语版转译并继续夹私货的的德语红皮书《圣卡尔圣腓特烈全集》。

然后,境外部分宗教界人士表示,兲朝使用的宗教典籍「不完整不准确」,版本也「不权威」。比方说希伯来语《旧约》和希腊语《新约》,经常被各级教会无视,成天捧着一本「南不列颠及北爱尔兰联合王国」出品的「King James 1611」钦定英文版引经据典。那时候美帝灯塔国男子篮球职业联赛当中,在虎扑昵称「六步郎奸母狮」的著名运动员正如日中天。

再然后,境内部分学术界人士表示,希伯来语原版经典除了被挪用为「旧约」的《塔纳赫》之外,还有作为民法通则的《塔木德》,境内还没有翻译引进,这个研究方向属于一片空白。据称山东大学开展了这个项目,好像第一卷已经翻译完成送审了,不知后事如何。

那时候我还在之江临安「原创文学论坛」与网友扯淡,在一个关乎「兲命气数」的话题当中,有人询问如何把兲朝特色的「道」推销给西洋字母佬。有人应景回答就按照《约翰福音》「太初有道」翻译成「(Microsoft™©®Word」即可,说这是「原文」,并贴了一堆没有附加任何标音记号的拉丁字母。

接下来有人拆台,说「原文」明明是「λόγος」,虽然本意是「话语」,但是在长期生产生活实践斗争当中已经转义了,还用古汉语「言」字类比,说在当代各种语中用古色古香的词汇,通常都附加了感情色彩和修辞技巧。

于是一批业余神棍出场,各个引经据典。当时我手头刚买了两套国际化大都市华东师范大学出版社炮制的「古典语文」教程:

古希腊语新约教程
古希腊语新约教程
希伯来文“圣经”语法教程
希伯来文“圣经”语法教程

买完了还在群里问时任华东师范大学档案管理员的あさくま,说贵校出版社有没有推出「阿拉伯语绿皮书教程」的计划吖,答曰「没有」。

这两套都是依托宗教典籍的教程,有私货那是肯定的。除了国际化大都市之外还有其它都市的学术界人士出面,比方说四川大学出版的「溪水系列」《古希伯来语教程》,也是以讲解《塔纳赫》为教育主线,前言里面提到全四册,可是只出版了三册(不贴图了),然后就下面没有的干活了也。

所以,为了掺和扯淡盛况,除了购买实体书之外,还特意下了一堆电子版的「解经资料」,大部分均为上世纪末制作,不支持Unicode,需要特殊「字体」扶持,导致复制粘贴出来均为乱码。

其中有个希伯来文字版的PDF,就是从右往左排版的,选中其中一段、一行甚至一个词都复制不出来,只有一个一个字母的贴才行。最晚在那时候,在当时针对主流浏览器的老迈年高论坛程序不支持的情况下,就考虑到与非主流文字混排问题了。

顺便,当时扯淡中我关心的不是宗教问题,而是抄写错误。有人提到了「南不列颠及北爱尔兰联合王国」著名学者兼官僚牛顿爵士,曾经指出「道成肉身」观点乃郢书燕说,说把带有书法装饰线的希腊字母「Ο」抄成「Θ」,于是从此基督教的发展走向就与耶少爷路线南辕北辙。

这就是开始关注「设计」行业当中「小人物改变历史走向」之类话题的最近起源。而对于其它神学、哲学、政治、历史等相关领域的好奇心,从此获得了进一步增强。

所以,前一篇用的素材,展现了兲朝特色出版事业的真实情况。哪怕是「中华书局」这种「老字号」在它的「老本行」当中,都如此粗制滥造。就比方说《胡宏集》,1987年出版,而年初党和国家领导人胡某某刚靠边站,真应景吖。

其中简体字「于」是手写的么?还是「草书」,还被识大体顾大局懂政治讲规矩守纪律的校对人员认定为「子」,以衬托「百善の新时代」意见领袖的一片孝心。还听说当代圣上的皇考给谁家孝子主办的指路明灯《炎黄春秋》题字了。

……还批量炮制疑似塞外侵略者后裔的钦定主角龙傲天,动辄「垄断出版渠道」以「政治敏感」借口「亦当删去」,并渗透至党国高音喇叭内部夹私货……真乃河清海晏歌舞升平の盛世哉。

构思

开场白扯远了,但没跑题。

当时接触的「双语对照版」,不是那种面向儿童教育的通俗读物以页面为单位,多是微言大义蕴涵政治和意识形态内容的经典文本,所以通常以包含完整内容的「自然段」为单位,还都有编号。就比方说希伯来语英语对照的电子书,因为文字方向不同,版面是左右两列「背靠背」的形式。

所以,初步决定也要采用同样的方式。具体到「数学」领域,由于「公式」通常占地甚广需要单独出现,并且公式内部通常不包括限定语种的内容,所以用不着「对照」了,只提供一份就够了。

并且,由于语言特征不同,译文和原文的顺序也不同,导致被公式切割的短语无法匹配,出现在不同位置的「段」当中。在后面成果截图当中各位会看到,比如公式⦅5⦆前后。于是还不能严格要求壹壹对应,长短参差不齐甚至一边完全是空白都有可能。

除此之外,有「节译」「选译」「不译」乃至「私货」,双语内容完全对照不上的情况也有。

比方说《盐铁论》,到现在境外都没有全译本,之前「国进民退」「国退民进」大讨论当中,一批钦定文豪野生国师意见领袖指路明灯们纷纷建言献策,其中就提到了这部兲朝特色政治经济学经典著作。一方面吹捧「留洋的贼秃会念经」,一方面则坚持「我中华兲朝上国自有国情在此」。

总之,即便兲朝出版界精英各个人缘好情商高莫谈国事只谈风月,面对这种情况也需要在「技术」上进行考虑。

因此,初步决定,纵向以「段」(Paragraph)为单位,但不是HTML当中「<p>」标签所标注的「自然段」,而是任意长度的连续文本。对于需要对照的内容,在「段」内划分左右两栏;对于不需要对照的内容,不分栏直接提供。

还要考虑到HTML的特性,其中「插图」(<figure>)块中除了「图题」之外,不见得一定是图片,还有可能是代码块或其它内容。于是根据情况有可能需要翻译,比如地图上的地名;也有可能不需要,比如常见地名都认识。所以应该灵活处理。

总之,用十个手指头敲击键盘,写出极简主义代码并渲染,炮制的「想定布局」图如下:

想定布局
想定布局

其中分栏内容,使用「CSS3」当中的新特性「Grid」布局,两栏就够:

div.paragraph {
    display: grid;
    width: 100%;
    grid-template-columns: 1fr 1fr;
    grid-gap: 1px;
    grid-auto-rows: minmax(1rem, auto);
    clear: both;
}
div.paragraph > div {
    padding: 0 0.5rem;
}
div.original {
    grid-column: 1;
    border-right: 1px dotted black;
}
div.translation {
    grid-column: 2;
    border-left: 1px dotted black;
}

解释一下,没用HTML5提供的「<section>」标签,是因为没有语义特征,通常每个「section」都是包含标题(h1h6)的。而左右两栏的右左边框,会形成中间的「分割线」效果,这都是常见的障眼法伎俩。

而「公式」块当中包括居中的「数学」内容和靠右的「编号」,需要浮动布局:

div.fomula {
    margin: 1px 0;
    padding: 0.5rem 0;
    color: blue;
    clear: both;
}
div.serial {
    width: 5%;
    float: right;
}
div.math {
    width: 80%;
    margin: 0 10%;
    text-align: center;
}

别的就没啥好说的了,都是业界常识,或之前三自运动当中说过的内容。

因陋就简大干快上

素材就选了「引言」部分,实体书上大约四页不到。主要工作都在VS Code当中完成,整个静态HTML页面是纯手工打造的,篇幅「56KB」。其中文字内容,通过「Microsoft™©® OneNote™©®」识别,但是准确率甚低,许多混杂符号的段内字符都是乱码,最终校订消耗的时间和从零开始手打不相上下。

其中行间公式是通过在线的「LaTeXMathML」工具完成的,生成的MathML内容经过手工修改过之后直接嵌入在网页内部。由于篇幅太大,曾经找过外链方案,如果要保持静态特征,就不能用脚本加载,那么似乎除了「<iframe>」之外就做不到了,决定暂时不考虑。

而行内的数学公式和符号,不是MathML而是一个个「<span class="math">」块,其中使用HTML内置的上下标「<sup>」「<sub>」,所以看上去「字体」似乎与行间公式不一样,并且也不符合「共识」(如变量用斜体而函数名用衬线体)。

有两方面原因。一个是本来「原文」就这样,正文中的分式用斜线表示,也只能保持原样,而我在两个场合找了「½」「」两个Unicode字符替代。而之前提到了对于在正文内使用术语的场合,不需要「完整」的公式支持,这里当然要说到做到。

还有一个原因,因为ePub3才开始支持MathML,所以对Kindle之类市面上贩卖的电纸书产品来说,还得用SVG图片替代,因此行内公式尤其是只有一个字符的那种,当然要尽量直接写出来。

不过呢,「ePub 3.0」标准是2011年出台的,而「ePub 3.1」标准去年才出来。所以2010年买的「iPod Touch 4」上肯定看不了,而Kindle就更甭提了。既然「测试环境」已经不存在了,那么还惦记着「向后兼容」提供图片版内容,就显得更没有必要。这不是「eInk」等硬件的原因,而是操作系统和软件的原因。

再顺便,Chrome仍不支持MathML都知道了,所以只针对FireFox进行测试。

结果

页面链接:卢丁《实分析和复分析》引言(使用MathML渲染公式,请使用FireFox查看)

开头一张图:

分栏双语对照
分栏双语对照

剩下全靠编:

这图长了点,用的是「HyperSnap」的「滚动页面」截图功能,挺好用是吧。

几点说明:

首先,原文标题使用「小型大写字母」风格,比全大写的样式看上去柔和一些,但又不失严肃。

但是这种特性需要「字体」支持,连「小型大写」都有两种,小号和超小号。

font-variant-caps: small-caps;
font-variant-caps: petite-caps;

在目前浏览器使用的默认字体当中没发现区别,我没改「font-family」就是为了测试在默认情况下适合所有普通用户的表现形式,更何况各种便携电纸书当中字体并不充沛。

其次,公式「编号」使用了不常见的括弧形式「⦅⦆」,这是为了与正文当中那些「exp(1)」之类字眼中出现的同样形式的内容相区别。虽然说读者根据上下文情况不难分辨,但是能尽量避免无效劳动总没有坏处。

再次,在「定理」部分的列表编号没有遵守原文(小写字母加括弧),这是客观条件限制。前一篇说过了,列表编号风格可以指定很多种,有小写字母,但没有加括弧的。

这可不是说咱强调实际困难就放弃了。

再三提醒不要把咱这种「言必信行必果硁硁然」的小人,与那帮「人缘好情商高」「识大体顾大局懂政治讲规矩守纪律」的党国栋梁与时俱进童年才俊,相提并论。它们指使充沛的活跃色目帐号到处造谣污蔑栽赃陷害「缩卵怂货窝囊废精神崩溃」恰恰体现了其恼羞成怒气急败坏并且惊慌失措的窘境。

解决方案当然有,只不过「当前」做不到而已。看代码:

ol.theorem {
    list-style: lower-latin;
    line-height: 1.75rem;
}
/*
ol li::marker::before{
    content: "⦅";
}
ol li::marker::after{
    content: "⦆";
}
*/

其中注释掉的部分,使用了「::marker」伪元素,再结合前面讲过的「::before」「::after」伪元素(旧版CSS中是单冒号的「伪类」),就可以实现。

只不过,当前情况下「::marker」还没有被实现,可以参考官方声明:«This spec is not yet ready for implementation. It exists in this repository to record the ideas and promote discussion.»

最后,不能用篇幅判断公式的重要性,其实也不能用编号存在与否判断。

文中那些没有编号的行间公式,有些在原文中是行内公式,译文当中(或许是排版原因)变为行间,而有些纯属太长而不能嵌入正文只能单独提出来。

比方说编号⦅8⦆的「π = 2t0」,看着短,实际上是重要常数「圆周率」的『定义』,不可小觑。而夹在⦅2⦆⦅3⦆之间的那两个,看着长,但不过是钦定学霸所谓「闭嘴无脑手算っぽい」的演算过程,一眼带过即可。

在引言最后的公式也没有编号,那是在定理证明完毕之后的补充材料,并不是不重要。这个函数是在复数域视角下以二维为基本立场出发思考的典型样本,其奇点「±i」不在实轴上,但几何性质与以「±1」为奇点的那个孪生兄弟没区别。

所以,对于没有编号的公式,在排版上为了统一起见,也提供了「⟦void⟧」这种临时编号的位置(页面上不可见)。将来或许可以自动处理,或许在其它地方需要「引用」的时候可以直接提供超链接,而不是实体书常见的那样「参考某页某行」方式。

后记

素材只选了「引言」部分,按照这个模板,可以把学霸们赞不绝口屡次推荐的整部教材都做成「双语对照文字版」电子书,其它经典教材以此类推。将来的学生在与时俱进支持「ePub 3.0」的硬件配合下,看上去比实体方便点吧。

至于是否划算,那要看「版权」相关法律纠纷。与「古籍」不一样,目前这些教材版权仍然有效。就看漂洋过海的学霸们的现身说法,美帝灯塔国、南不列颠及北爱尔兰联合王国,乃至其它发达国家,学术出版界被「Elsevier」等寡头垄断,教材价格昂贵,每年改版只修改例题和习题,而「配套教师」重点讲解与时俱进内容,于是旧教材无法使用。

其中并未配套并且有职业道德的教师,通常会问学生「谁还没有最新的PDF」(据某学霸亲自在繁荣的中文互联网上传授美帝灯塔国高等院校内幕),这时候「版权」问题就比不上培养西洋资本主义接班人革命螺丝钉重要了。

所以,我不会主动侵犯版权,作为素材的引言部分所占比例并未超过兲朝法律规定的「学术」目的使用范围。至于关乎切身利益的其他人,那就与我无关了。既然「授人以鱼不如授人以渔」,若是还有人「三天打鱼两天晒网」,因为出版界精英「人缘好情商高」就纳头便拜,从此助纣为虐为虎作伥,那才是「膝盖生根头顶绿得发黑贱到骨子里去了」的奴才吖。

但是,本篇所提供的模板,仍然会在将来的三自运动中发挥作用。在伟大光荣正确照耀不到的境外,有个「古登堡计划」,开始于1971年,是文化领域赛博朋克英特纳雄耐尔主义者的活跃阵地,细节请各位自行搜索。

在《知乎问答〔№033〕30年后的世界,容得下你吗?》当中说过了,「惦记着用Sage改写一版《托马斯微积分》课件」,以及引进「拉汉对照」原版。

因为部分学霸(尤其是旅居「南不列颠及北爱尔兰联合王国」的)所敬爱的大成至圣先师牛顿爵士,其奠定历史地位的名著《自然哲学的数学原理》(«Philosophiæ Naturalis Principia Mathematica»)就是首发拉丁文版,修订两次之后才有「英译本」。

甭管拉丁文原版还是英译本,现在版权早过期了吧?也是属于古登堡计划所能覆盖的范围。所以,哪怕不考虑兲朝特色,制作「拉英对照」双语版的任务说不定早就有人在义务劳动了。这个题材和内容之下,正文中「数学公式」可少不了吧?

同理可证,在那风起云涌的思想解放运动过程中,与岛夷天才相抗衡的莱布尼茨等欧陆群英,其著作的「原版」同样是拉丁文,而「本族语译本」反而滞后很多。

不说理工科,哪怕是文科,「南不列颠及北爱尔兰联合王国」杰出的政治学奠基人霍布斯的名著《利维坦》(«Leviathan»),也是先有拉丁文版后有英文版。这里不说「英译本」,是因为两个版本都是作者本人亲笔所写,并且「内容还不一致」呢。

于是,双语对照模板用途大了。我在本篇当中给出的例子,不过是抛砖引玉而已。在那赛博朋克英特纳雄耐尔主义者当中,有得是杰出的软件工程师和设计工作者。

共勉。

2018-06-30