虽然还是没能弄明白什么是 5G 极化码,但是至少有样东西是可以学习的【月诚故事】

标题: 《虽然还是没能弄明白什么是 5G 极化码,但是至少有样东西是可以学习的【月诚故事】

今天没有大事发生。知乎热榜当前排名第一的话题《成都警方称共计 8.2 万人存在「时空伴随」风险,「时空伴随」是什么意思?防疫期间需要注意些什么? - 知乎》暂时只有不到 300 人参与回答。从营销的角度来说,这个话题引入了一个大多数人第一次听说的新名词「时空伴随」,或许能引发一部分人的好奇心。从社会意义的角度来说,当前这一波全国疫情的防控形势还是很严峻的,除了密接人群之外,引导与确诊患者有时空交集的人群做好核酸检测及自我健康检测,会更有助于这波疫情的有效防控。

至于「时空伴随」是什么意思,答主“小五125”言简意赅地给出了回答,“上月(10 月)25 号就有了官方解释,并不是成都方面首次使用,还有一种说法时空交集。首次使用有可能是北京方面。 时空交集与另一种说法时空伴随是相同概念,指 14 天内,与确诊患者在同时间和空间网格内(通常以 800 米*800 米为检测范围),共同停留过 10 分钟 。”

至此,一句话可以解释清楚的问题,实在没有更多进一步的讨论空间。在此也希望这波疫情能够早点结束,让所有人的生活都能早日回到正常轨迹。

相比之下,B 站上有个确实很牛的榜首作品《5G,华为,土耳其——我花了两个月,搞懂了5G背后的秘密》。这个作品已经霸榜 B 站全站排行榜最高第 1 名几天时间,获得了近 400 万的播放量。更准确地说,这个作品的难度不在于视频剪辑的流畅度方面。而在于想要搞明白 5G 背后的秘密「极化码」到底是个什么东西,确实非常不容易。作品创作者“老奇好好奇”为此前前后后花了差不多三个月的时间,工作量不亚于撰写一篇科研论文。

那么「极化码」到底是个什么东西呢?说实话,由于自己才疏学浅,直到看完了整个视频也还是没能弄明白这个「极化码」。不过视频作品中提到了「极化码之父」土耳其教授埃尔达尔·阿里坎(Erdal Arikan)的老师的老师正是大名鼎鼎的——香农。

香农被称作是「信息论之父」,人们通常认为在 1948 年 10 月香农 32 岁时发表的一篇划时代的传奇论文《A Mathematical Theory of Communication》(通信的数学理论)是整个现代信息论的开端,香农因此被认为是数字计算机理论和数字电路设计理论的创始人。

在这篇论文中,香农提出了香农第一定理。根据知乎话题《如何理解「香农定理」,包含哪些内容,它的发现有什么意义? - 桔了个仔的回答 - 知乎》答主回答,“我们都学过文言文,我们都有这种感觉:文言文很精简,但不好读懂。而白话文很啰嗦(信息冗余),但好懂。一个语言如果带有较多的冗余信息,会好理解。其他信息也是如此,那我们如果想对信息进行压缩,去掉冗余信息,是否存在一个压缩得不能再压缩的极限值?香农第一定理就回答了这个问题。香农第一定理给出了 在无损情况下,数据压缩的临界值 。香农第一定理指出:一段信息的信息量是固定的,这称为这段信息的信息熵(H)无论怎么压缩,信息熵是无失真信源编码的极限值若编码的平均码长小于信息熵值,必然发生差错(也就是有损)信息熵的这个极限值,就像光速至于物理学一样,无法逾越。……”

「熵」这个概念原本是在化工热力学里才会学到的东西。然而香农却敏锐地发现了信息学中同样存在着「信息熵」。

那么这个信息熵和我们的生活又有什么关系呢?关系可大了。1952 年,Huffman 根据香农的这篇论文,设计出了大名鼎鼎的霍夫曼编码(Huffman Code)。这个编码相对容易理解许多,原理并不复杂,在随后的生活当中经常可以用得着。

譬如说,电脑上全拼打字的重码很多,有时候还需要翻页选词。那么有没有办法减少中文输入法的重码,不翻页选词呢?于是 1983 年 8 月王永民发明了王码五笔输入法。使用五笔打字,重码确实少了许多,但还是存在重码。那么有没有一种完全没有重码的中文输入法呢?别说,还真有。区位码输入法用四个数字对应一个汉字,完全没有重码,但是打字的难度要比摩斯码还难。摩斯码对应的是字母,而区位码对应的则是汉字。字母只有二十多个,汉字那可就多了。

以上这些都是对信息进行编码,那么各种编码之间孰优孰劣呢?

关键还是看用途。譬如香港电影《无间道》当中曾经使用了摩斯码作为暗码传递信息,美剧《疑犯追踪》(POI,第二季)第二集的结尾,Harold 用 Tap Code 作为暗码传递信息。说起 Tap Code 还挺有意思,单词 tap 带有敲击的意思。据说以前有人在监狱里想要越狱,于是每天都会有犯人敲击牢房里的水管,敲击的节奏也很有规律。原来,敲击水管也能传递信息。26 个字母差不多刚好可以填入一张 5x5 的方格矩阵当中,因为字母 C 和 K 的发音很多时候相同,于是第一行就挤入了 6 个字母“A、B、C/K、D、E”,以此类推。想要敲出一个字母,只要在方格矩阵当中找出这个字母位于第几行第几列,就分别敲几次,停顿一下再敲几次。这样就能就信息通过 Tap Code 编码传出。效果和摩斯码类似,最后都能还原成英文内容。

由此可见,各种无损编码其实在各种生活场景当中拥有着非常广泛的用途。

回到中文输入法。虽然 1983 年发明了王码五笔,大大提高了计算机的汉字输入速度。但是总有人相信,可以存在一种更优解的汉字编码,可以更高效的输入汉字。于是后来有一段时间在市面上出现了许多不同的汉字输入法,比如“四笔输入法”、“二笔输入法”、“顶功输入法”。

碰巧了,“顶功输入法”的编码方式竟然和霍夫曼编码相关。先来看了解一下什么是“顶功输入法”。根据百度贴吧“输入法吧”一位网友“执笔南山”的描述,“一种编码方案。将键盘上的按键人为一分为二,变成大码元和小码元,然后利用编码空间的不同,大顶小、小顶大,通过节省按空格键的方式,来达到降低码长的目的。具体你可以去顶功吧看看,化外大有详细的介绍。”

用更通俗的话来描述,大部分的输入法是通过空格键或者标点符号将汉字“顶”上屏的,而顶功输入法只要大码元一出现,汉字就会被“顶”上屏。这样就减少了大量空格键的使用。

根据顶功输入法的编码原理不难看出,顶功输入法更接近于香农第一定理所给出的 在无损情况下,数据压缩的临界值 。顶功输入法可以通过更短的编码完成汉字输入,而且还可以做到完全没有重码。

那么为什么重码很少甚至可以做到完全没有重码的顶功输入法,反而最后没能普及呢?其实用开源的 rime 输入法自己设计一个编码就能发现,完全没有重码就意味着需要记忆上万个不同的汉字编码。相比之下,全拼或者双拼输入法只需要记忆少量的声母和韵母,明显更加容易记忆。五笔打字需要记忆的编码稍多一些,但也算还有规律可循,可以通过汉字笔画进行联想记忆。到了顶功输入法,不规则的编码就会突然猛增许多,想要记忆所有汉字的全部编码可就不那么容易了。

事实上,从造纸术的发明到文言文语言,从现代信息论的开创到计算机汉字输入。人类信息总是在以各种不同的形式进行编码解码、存储和传递。香农厉害的地方在于,他很早就预判了在无损情况下,数据压缩存在一个临界值。后来的科学家们虽然设计出了各种编码,各种非常接近于香农极限的编码,但终归只是接近于。而通过 B 站作者的这期科普视频作品,才猛然发现,原来 5G 时代的「极化码」竟然已经达到了香农极限。

「极化码之父」是如何做到的呢?

为此,Up 主专门发邮件请教了「极化码之父」阿里坎教授,并意外地获得了阿里坎教授的回复。

Up 主:我很好奇您是怎样想到如此绝妙的点子的?
阿里坎教授:答案是“坚持”。

Up 主:能分享一下您的灵光一刻吗?
阿里坎教授:绝妙的点子往往只是海市蜃楼。有了诸多类似的经历之后,我对灵光乍现非常谨慎。所以我并没有尖叫着跑出去,而是在接下来的两三年保持沉默,去验证这个想法是可靠的。

Up 主:在研究中,您是否担心过自己 20 多年的努力有付之东流的风险呢?
阿里坎教授:伟大发现总是罕见的,一生中有一次就很幸运了。所以,我在研究基础问题时,并不期待有大的发现。为了平衡这一点,我还研究一些保证有结果的小问题。

Up 主:土耳其人民是如何看待您的工作的?
阿里坎教授:他们很开心。我也受到了很多关注和认可。

Up 主说,这些话平常平淡,没有太多戏剧性。甚至有些俗套。一开始我没有太多触动。但在某一天回看颁奖典礼上 Arikan 教授略显木讷的形象,我突然有了一种理解,就像 Arikan 的主业是教书,业余时间琢磨那个困扰他十几年的问题,华为的那场豪赌,也是一家公司迫不得已的战斗。我们所称赞的故事,只是别人的平淡生活,但伟大往往也诞生于那些平淡之中。

虽然看完了 Up 主的视频作品之后又研究了半天,依然还是没能弄明白什么是 5G 极化码。但是从「极化码之父」阿里坎教授的故事可以发现,成功的人身上往往都具备一个特质——专注。

在极化码的论文发表之前,世上已经有了那么多接近于香农极限的编码。阿里坎教授则几乎一直处于默默无闻状态,然而阿里坎教授却始终相信能够有一种编码可以达到香农极限。说实话,阿里坎教授自己当时也没有意识到「极化码」能够用来做什么,结果华为在 5G 研发过程中碰巧发现阿里坎教授的「极化码」,并再次基础上研发出了新一代的 5G 通信技术。

科技的发展如同滚滚长江东逝水,每个人都如同江中的一朵浪花。正如 Up 主提问的那个问题“在研究中,您是否担心过自己 20 多年的努力有付之东流的风险呢?”,阿里坎教授回答说,“伟大发现总是罕见的,一生中有一次就很幸运了。”

阿里坎教授无疑是幸运的。一生中有一次就很幸运了。而这份幸运的背后,其实是从香农到阿里坎,师徒三代人几十年的持久专注。


微博头条文章作者:<strong>【月诚故事】</strong>

微信公众号:<strong>【月诚故事】</strong>自媒体运营小白的成长日记

联系邮箱:messages (à) intorich (.) com

<img src="/img/wechat.png" alt="【月诚故事】自媒体运营小白的成长日记" />